Forschung

Bessere KI-Modelle ermöglichen ambitioniertere Arbeit

Luke Melas-Kyriazi5 Min. Lesezeit

Wir wollen besser verstehen, wie Verbesserungen bei KI-Modellen die Arbeitsweise von Entwicklern verändern. Konkret geht es darum, in welchem Ausmaß Entwickler mehr von den Aufgaben erledigen, die sie ohnehin schon bearbeitet haben, und in welchem Ausmaß bessere Modelle Arbeit ermöglichen, die zuvor außer Reichweite lag.

Um diese Frage zu beantworten, haben wir gemeinsam mit Professor Suproteem Sarkar von der University of Chicago Booth School of Business die Arbeitsgewohnheiten von Entwicklern in 500 Unternehmen untersucht, die von Juli 2025 bis März 2026 Cursor nutzten. In diesen acht Monaten wurden auch Opus 4.5 und GPT-5.2 veröffentlicht — zwei Modelle, die sprunghafte Fortschritte bei den KI-Fähigkeiten fürs Programmieren brachten.

Unser Paper zeigt, dass bessere KI zu einer höheren Nachfrage nach KI führt. Das steht im Einklang mit einem Jevons-ähnlichen Effekt, bei dem Effizienzgewinne den Gesamtverbrauch erhöhen, statt ihn zu verringern. Die KI-Nutzung, definiert als durchschnittliche Anzahl wöchentlicher Nachrichten pro Benutzer, stieg im Untersuchungszeitraum um 44 %.

Durchschnittliche Anzahl wöchentlicher Nachrichten pro Benutzer im Untersuchungszeitraum, mit einem Anstieg von 44 %Durchschnittliche Anzahl wöchentlicher Nachrichten pro Benutzer im Untersuchungszeitraum, mit einem Anstieg von 44 %

Der Anstieg war weder unmittelbar noch gleichmäßig. Wir beobachteten, dass Entwickler bessere Modelle zunächst dafür nutzten, mehr Arbeit mit ähnlicher Komplexität zu erledigen, und erst später komplexere Aufgaben übernahmen. Außerdem war diese Verschiebung besonders stark in Branchen wie Finanzwesen, Medien und Werbung ausgeprägt, in denen Wettbewerbsdruck und Greenfield-Möglichkeiten die Einführung beschleunigt haben könnten.

Medien, Software und Finanzdienstleistungen liegen vorn

Die Nutzung stieg in jedem Sektor, den wir untersucht haben, aber in einigen Branchen fiel der Zuwachs größer aus als in anderen. Besonders deutlich war der Sprung in Medien und Werbung: Die Zahl der Nachrichten pro Benutzer stieg dort um 54 %, gefolgt von Software und Entwickler-Tools (+47 %) sowie Finanzdienstleistungen und Fintech (+45 %).

Wir vermuten, dass bessere KI im Finanzwesen eine Art Wettrüstungsdynamik auslösen kann: Sobald ein Unternehmen KI nutzt, um sich einen Handelsvorteil zu verschaffen, geraten andere unter Wettbewerbsdruck, nachzuziehen. In Medien und Werbung könnte der Mechanismus anders sein: Leistungsfähigere Modelle eröffnen neue Greenfield-Möglichkeiten, die Unternehmen dann für sich nutzen.

Nachrichten pro Benutzer nach Sektor, wobei Medien und Werbung, Software und Entwickler-Tools sowie Finanzdienstleistungen und Fintech hervorgehoben sindNachrichten pro Benutzer nach Sektor, wobei Medien und Werbung, Software und Entwickler-Tools sowie Finanzdienstleistungen und Fintech hervorgehoben sind

Eine Verschiebung hin zu höherer Komplexität

Anfangs erledigten Entwickler mit den verbesserten KI-Modellen vor allem mehr vom Gleichen. Doch nach einer Verzögerung von 4–6 Wochen beobachteten wir, dass sie Modelle auch für komplexere Aufgaben einsetzten. Insgesamt stieg die Zahl der Nachrichten mit „niedriger Komplexität“ im Untersuchungszeitraum um 22 %, während die Zahl der Nachrichten mit „hoher Komplexität“ um 68 % zunahm. Der Großteil dieses Wachstums entfiel auf die letzten sechs Wochen.

In dem Paper stellen wir die Hypothese auf, dass diese Verzögerung sowohl die Zeit widerspiegelt, die Entwickler brauchen, um herauszufinden, was ein besseres Modell leisten kann, als auch die Notwendigkeit für Unternehmen, ihre Workflows auf neue Fähigkeiten auszurichten.

Volumen von Nachrichten mit niedriger und hoher Komplexität im Zeitverlauf; nach einer Verzögerung zeigt sich ein stärkeres Wachstum bei hoher KomplexitätVolumen von Nachrichten mit niedriger und hoher Komplexität im Zeitverlauf; nach einer Verzögerung zeigt sich ein stärkeres Wachstum bei hoher Komplexität

Ein Wandel in der Aufgabenverteilung

Je besser KI bei der Codegenerierung wird, desto stärker verlagert sich die Aufgabe von Entwicklern auf das Steuern dieser Ergebnisse. Diese Veränderung zeigt sich deutlich in unseren Daten, in denen wir messen können, wie sich die Nutzung zwischen verschiedenen Aufgabenkategorien verschiebt. Die größten Zuwächse gab es bei Dokumentation (+62 %), Architektur (+52 %), Code-Review (+51 %) und Lernen (+50 %), während klarer abgegrenzte Aufgaben wie UI/Styling deutlich weniger zunahmen (+15 %).

Das deutet darauf hin, dass mit der Zunahme von KI-generiertem Code auch der Bedarf steigt, diesen Code zu dokumentieren, zu verstehen und zu überprüfen. Größere und dynamischere Codebasen erhöhen außerdem die Komplexität, den Überblick darüber zu behalten, wie alles zusammenpasst, was den starken Anstieg systemübergreifender Aufgaben wie Architektur und Deployment erklären könnte. Leistungsfähigere Modelle könnten Entwickler außerdem eher dazu bewegen, Agenten für diese systemübergreifenden Aufgaben zu nutzen.

Aufgabenkategorien mit stärkerem Wachstum bei Dokumentation, Architektur, Code-Review und Lernen als bei UI und StylingAufgabenkategorien mit stärkerem Wachstum bei Dokumentation, Architektur, Code-Review und Lernen als bei UI und Styling

Ausweitung der wirtschaftlichen Aktivität

Eine zentrale Frage bei der Einführung von KI ist, ob sie lediglich bestehende Arbeit erleichtert oder auch neue produktive Möglichkeiten eröffnet. Unsere Studie zeigt, dass beides der Fall ist — langfristig könnte sich die Ausweitung jedoch als der wichtigere Effekt erweisen.

Lesen Sie das vollständige Paper.

Abgelegt unter: Forschung

Autor: Luke Melas-Kyriazi