Hasty Briefsbeta

双语

My Participation in the METR AI Productivity Study

10 months ago

#Developer Experience
#Open Source
#AI Productivity

METR研究发现使用AI的开发人员完成任务所需时间延长了19%（样本量=246个任务，95%置信区间[-40%, -2%]）
该研究采用随机对照试验，让开发者在有AI辅助和无AI辅助两种条件下完成任务
作者本人参与了这项研究，其工作对象是代码量超过100万行的jsdom项目
任务类型包括漏洞修复、功能实现和测试覆盖率提升，其中9个任务允许使用AI，10个任务禁用AI
使用的AI工具包括Cursor的代理模式、Claude Code和Gemini，但在代码库一致性和规范实现方面遇到挑战
AI模型在适应现有代码库风格、重复性任务以及准确实现Web规范方面表现欠佳
尽管AI辅助任务过程更具参与感，但由于频繁出错和需要持续监督，实际效率并未提升
作者建议未来可采用并行代理模式作为更有前景的AI辅助生产力方案
与新建项目相比，大型成熟代码库对AI工具提出了独特挑战