研究

更强的 AI 模型推动更具雄心的工作

Luke Melas-Kyriazi2 分钟阅读

我们希望了解,AI 模型的改进会如何改变开发者的工作方式。具体来说,开发者在多大程度上只是在做更多原本就在做的任务?又在多大程度上,性能更强的模型让他们能够开展此前还做不到的工作?

为了回答这个问题,我们与芝加哥大学布斯商学院的 Suproteem Sarkar 教授合作,研究了 500 家使用 Cursor 的公司中开发者的工作方式,时间范围为 2025 年 7 月至 2026 年 3 月。这八个月内,恰逢 Opus 4.5 和 GPT-5.2 发布,这两款模型在 AI 编程能力上带来了跨越式提升。

我们的论文发现,更好的 AI 会带来更高的 AI 需求。这与杰文斯效应类似:效率提升不会降低总使用量,反而会提高它。以每位用户每周平均消息数定义的 AI 用量,在研究期间增长了 44%。

研究期间每位用户每周平均消息数,显示增长了 44%研究期间每位用户每周平均消息数,显示增长了 44%

这种增长并非立刻出现,也并不均衡。我们观察到,开发者起初先用更好的模型完成更多复杂度相近的工作,之后才开始着手更复杂的任务。此外,这种转变尤其集中在金融、媒体和广告等行业;在这些领域,竞争压力和全新机会,可能推动了 AI 的应用。

媒体、软件和金融行业领跑

我们研究的所有行业用量都有所增长,但有些行业的增幅明显更大。尤其是媒体和广告行业增幅最高,每位用户的消息数增长了 54%;其次是软件和开发者工具 (+47%) ,以及金融和金融科技 (+45%) 。

我们推测,在金融行业,更强的 AI 可能会催生一种“军备竞赛”效应:一旦有公司使用 AI 获得交易优势,其他公司就会迫于竞争压力跟进。而在媒体和广告行业,驱动因素可能有所不同,更强大的模型拓展了企业可以加以利用的全新机会。

按行业划分的每位用户消息数,重点突出媒体和广告、软件和开发者工具,以及金融和金融科技按行业划分的每位用户消息数,重点突出媒体和广告、软件和开发者工具,以及金融和金融科技

复杂度向高端迁移

起初,开发者只是借助改进后的 AI 模型更多地完成原本就在做的工作,但在滞后 4–6 周后,我们观察到,他们开始用模型处理更复杂的任务。总体而言,在整个研究期间,“低复杂度”消息数量增长了 22%,而“高复杂度”消息数量增长了 68%,其中大部分增长发生在最后六周。

在论文中,我们假设,这种延迟既反映了开发者发现更好的模型能做什么所需的时间,也反映了企业围绕新功能重新调整工作流的需要。

低复杂度和高复杂度消息量随时间变化,在经历一段滞后后,高复杂度消息增长更强劲低复杂度和高复杂度消息量随时间变化,在经历一段滞后后,高复杂度消息增长更强劲

不断变化的任务分布

随着 AI 在程式碼產生方面不断进步,开发者的工作正逐渐转向管理这些输出。这一变化在我们的数据中表现得非常明显:我们可以看到,不同任务类别的用量是如何随之演变的。增长幅度最大的是文档 (+62%) 、架构 (+52%) 、代码审查 (+51%) 和学习 (+50%) ,而像 UI/样式这类相对更独立的任务,增长则小得多 (+15%) 。

这表明,随着 AI 生成的代码不断扩大代码库规模,对这些代码进行记录、理解和审查的需求也会相应增加。规模更大、迭代更快的代码库,也会增加统筹各部分如何协同工作的复杂度,这或许可以解释为什么架构和部署这类跨系统任务会显著增长。能力更强的模型,也可能让开发者更愿意使用智能体来处理这些跨系统任务。

任务类别显示,文档、架构、代码审查和学习的增长高于 UI 和样式任务类别显示,文档、架构、代码审查和学习的增长高于 UI 和样式

经济活动的扩张

围绕 AI 应用普及的一个核心问题是,它究竟只是促进现有工作的开展,还是也会开辟新的生产机会。我们的研究表明,这两者都会发生,但从长远来看,这种扩张最终可能会成为更重要的一面。

读取完整论文.

分类: 研究

作者: Luke Melas-Kyriazi