研究

更好的 AI(人工智慧)模型讓更高難度的工作成為可能

Luke Melas-Kyriazi閱讀時間 2 分鐘

我們想了解,AI (人工智慧) 模型的進步會如何改變開發者的工作方式。具體來說,開發者究竟只是在原本就已經進行的任務上做得更多,還是更好的模型讓過去做不到的工作成為可能?

為了回答這個問題,我們與芝加哥大學布斯商學院的 Suproteem Sarkar 教授合作,研究 500 家使用 Cursor 的公司中開發者的工作習慣,時間涵蓋 2025 年 7 月至 2026 年 3 月。這八個月期間包含 Opus 4.5 和 GPT-5.2 的發布,這兩個模型在 AI 程式設計能力上帶來了跨越式的提升。

我們的論文發現,更好的 AI 會帶來更高的 AI 需求。這與類似 Jevons 效應的現象一致,也就是效率提升不但沒有降低總消耗,反而推高了總消耗。以每位使用者平均每週訊息數定義的 AI 用量,在研究期間增加了 44%。

研究期間每位使用者平均每週訊息數,顯示增加了 44%研究期間每位使用者平均每週訊息數,顯示增加了 44%

這樣的成長並非立刻發生,也不是平均出現在各個領域。我們觀察到,開發者起初會先用更好的模型完成更多複雜度相近的工作,之後才開始承接更複雜的任務。此外,這種轉變特別集中在金融、媒體和廣告等產業,這些領域中的競爭壓力與全新機會,可能進一步推動了採用。

媒體、軟體與金融表現最為突出

我們研究的每個產業,用量都有所增加,但有些產業的增幅明顯高於其他產業。尤其是媒體與廣告業增幅最大,每位使用者的訊息數增加了 54%;其次是軟體與開發者工具 (+47%) ,以及金融與金融科技 (+45%) 。

我們推測,在金融業中,更強的 AI 可能會帶來一種類似軍備競賽的局面:一旦有公司利用 AI 取得交易優勢,其他公司就會面臨競爭壓力而不得不跟進。在媒體與廣告業,背後的機制可能不同,能力更強的模型擴大了全新機會的空間,而企業也會加以把握。

各產業每位使用者的訊息數,其中媒體與廣告、軟體與開發者工具,以及金融與金融科技特別標示各產業每位使用者的訊息數,其中媒體與廣告、軟體與開發者工具,以及金融與金融科技特別標示

複雜度分布右移

起初,開發者主要只是用改進後的 AI (人工智慧) 模型,把原本做的事做得更多;但在落後 4–6 週後,我們觀察到,他們開始用模型處理更複雜的任務。整體而言,在研究期間,「低複雜度」訊息數增加了 22%,而「高複雜度」訊息數成長了 68%,且大部分增幅都出現在最後六週。

在論文中,我們推測,這種延遲一方面反映了開發者需要時間摸索更好的模型能做到什麼,另一方面也反映了企業需要時間依據新能力調整工作流程。

低複雜度與高複雜度訊息量隨時間變化,顯示經過一段落後期後,高複雜度的成長更明顯低複雜度與高複雜度訊息量隨時間變化,顯示經過一段落後期後,高複雜度的成長更明顯

變化中的任務分布

隨著 AI 在程式碼產生方面持續進步,開發者的工作也逐漸轉向管理這些產出。這種變化在我們的資料中表現得相當明顯:我們可以觀察各類任務的用量如何演變。增幅最大的類別是文件撰寫 (+62%) 、架構設計 (+52%) 、程式碼審查 (+51%) 和學習 (+50%) ;而像 UI/樣式這類較為獨立的任務,成長幅度則小得多 (+15%) 。

這表示,隨著 AI 產生的程式碼擴大程式碼庫規模,為這些程式碼撰寫文件、加以了解與進行審查的需求,也會隨之增加。規模更大、變動更快的程式碼庫,也提高了管理各部分如何整合在一起的複雜度,這或許能解釋為何像架構設計與部署這類跨系統任務會大幅成長。能力更強的模型,也可能讓開發者更願意使用代理來處理這些跨系統任務。

任務類別顯示,文件撰寫、架構設計、程式碼審查和學習的成長幅度高於 UI 與樣式設計任務類別顯示,文件撰寫、架構設計、程式碼審查和學習的成長幅度高於 UI 與樣式設計

擴大經濟活動

AI (人工智慧) 採用的一個核心問題是,它究竟只是讓現有工作更有效率,還是也開拓了新的生產機會。我們的研究顯示,兩者皆有,但這種擴張最終可能會成為更重要的趨勢。

讀取完整論文.

分類於: 研究

作者: Luke Melas-Kyriazi