Die dritte Ära der KI-Softwareentwicklung

Als wir vor ein paar Jahren mit der Entwicklung von Cursor begonnen haben, wurde der meiste Code noch Tastendruck für Tastendruck geschrieben. Tab-Autovervollständigung hat das verändert und die erste Ära des KI-gestützten Programmierens eingeleitet.
Dann kamen Agents, und Entwickler sind dazu übergegangen, Agents über synchrone Prompt-und-Antwort-Schleifen zu steuern. Das war die zweite Ära. Jetzt bricht eine dritte Ära an. Sie ist geprägt von Agents, die größere Aufgaben eigenständig über längere Zeiträume mit weniger menschlicher Anleitung bewältigen können.
Dadurch dreht sich bei Cursor nicht mehr primär alles um das Schreiben von Code. Es geht darum, Entwicklern zu helfen, die Fabrik zu bauen, die ihre Software hervorbringt. Diese Fabrik besteht aus ganzen Flotten von Agents, mit denen sie wie mit Teamkollegen interagieren: indem sie ihnen eine erste grobe Richtung vorgeben, sie mit den Werkzeugen ausstatten, um selbstständig zu arbeiten, und ihre Arbeit überprüfen.
Viele von uns bei Cursor arbeiten bereits auf diese Weise. Mehr als ein Drittel der PRs, die wir mergen, werden inzwischen von Agents erstellt, die eigenständig in der Cloud auf ihren eigenen Instanzen laufen. In einem Jahr, so glauben wir, wird die große Mehrheit der Entwicklungsarbeit von dieser Art von Agents erledigt werden.
Von Tab zu Agents
Tab war hervorragend darin, Bereiche zu erkennen, in denen wenig kreative, sich wiederholende Arbeiten automatisiert werden konnten. Fast zwei Jahre lang bot es einen erheblichen Hebel.
Dann wurden die Modelle besser. Agents konnten mehr Kontext behalten, mehr Tools nutzen und längere Aktionssequenzen ausführen. Die Gewohnheiten von Entwickler:innen begannen sich zu verändern – zunächst langsam über den Sommer und dann rasch in den letzten Monaten mit den Releases von Opus 4.6, Codex 5.3 und Composer 1.5.
Der Wandel ist so umfassend, dass heute die meisten Cursor-Nutzer:innen die Tab-Taste kaum noch berühren. Im März 2025 hatten wir ungefähr 2,5-mal so viele Tab-Nutzer:innen wie Agent-Nutzer:innen. Jetzt ist das umgekehrt: Wir haben nun doppelt so viele Agent-Nutzer:innen wie Tab-Nutzer:innen.


Doch schon jetzt bahnt dieser Wandel etwas noch Größerem den Weg. Die Tab-Ära dauerte fast zwei Jahre. Die zweite Ära, in der die meiste Arbeit mit synchronen Agents erledigt wird, könnte nicht einmal ein Jahr dauern.
Cloud-Agents und Artefakte
Im Vergleich zu Tab arbeiten synchrone Agents weiter oben im Stack. Sie übernehmen Aufgaben, die Kontext und Urteilsvermögen erfordern, binden die Entwickler aber bei jedem Schritt ein. Doch diese Form der Echtzeitinteraktion, kombiniert mit der Tatsache, dass synchrone Agents um Ressourcen auf der lokalen Maschine konkurrieren, bedeutet, dass es nur sinnvoll ist, mit wenigen gleichzeitig zu arbeiten.
Cloud-Agents beseitigen beide Einschränkungen. Jeder läuft auf einer eigenen virtuellen Maschine, sodass Entwickler eine Aufgabe übergeben und zu etwas anderem übergehen können. Der Agent arbeitet sich über Stunden hinweg durch die Aufgabe, iteriert und testet, bis er von der Qualität des Ergebnisses überzeugt ist, und kommt mit etwas zurück, das sich schnell prüfen lässt: Protokolle (Logs), Videoaufzeichnungen und Live-Vorschauen statt Diffs.
Das macht das parallele Ausführen von Agents praktikabel, weil Artefakte und Vorschauen genug Kontext liefern, um Ergebnisse zu bewerten, ohne jede Sitzung von Grund auf rekonstruieren zu müssen. Die menschliche Rolle verlagert sich davon, jede einzelne Codezeile anzuleiten, hin zur Definition des Problems und dem Festlegen von Review-Kriterien.
Die Umstellung ist bei Cursor in vollem Gange
Fünfunddreißig Prozent der PRs, die wir intern bei Cursor mergen, werden inzwischen von Agents erstellt, die autonom in Cloud-VMs laufen. Wir sehen, dass Entwickler:innen diese neue Arbeitsweise annehmen, die sich durch drei Merkmale auszeichnet:
- Agents schreiben fast 100 % ihres Codes.
- Sie verbringen ihre Zeit damit, Probleme zu zerlegen, Artefakte zu prüfen und Feedback zu geben.
- Sie starten mehrere Agents gleichzeitig, anstatt einen einzelnen bis zur Fertigstellung an die Hand zu nehmen.
Es bleibt noch viel zu tun, bevor dieser Ansatz zum Standard in der Softwareentwicklung wird. Im industriellen Maßstab wird ein instabiler Test oder eine defekte Umgebung, mit der eine einzelne Entwicklerperson noch umgehen kann, zu einem Fehler, der jede Agent-Ausführung unterbricht. Grundsätzlich müssen wir außerdem sicherstellen, dass Agents so effektiv wie möglich arbeiten können – mit vollem Zugriff auf die Tools und den Kontext, die sie benötigen.
Wir glauben, dass der gestern erfolgte Launch der Cursor Cloud-Agents ein erster, aber wichtiger Schritt in diese Richtung ist.