Les agents Cursor peuvent désormais contrôler leurs propres ordinateurs
Les agents ne sont pas plus efficaces que l’environnement dans lequel ils s’exécutent. S’ils ne peuvent pas utiliser les logiciels qu’ils créent, ils atteignent vite leurs limites.
Au cours des derniers mois, nous avons résolu ce problème en interne en donnant aux agents leurs propres machines virtuelles avec des environnements de développement complets, ainsi que la capacité de tester leurs modifications et de produire des artefacts (vidéos, captures d’écran et journaux) pour que vous puissiez valider rapidement leur travail.
À partir d’aujourd’hui, nous mettons à disposition une nouvelle version des agents cloud Cursor, accessible où que vous travailliez : sur le web, sur mobile, dans l’application de bureau, sur Slack et sur GitHub. Les agents cloud s’intègrent eux‑mêmes à votre base de code et produisent des PR prêtes à être fusionnées, accompagnées d’artefacts pour présenter leurs changements. Vous pouvez aussi prendre le contrôle du bureau distant de l’agent pour utiliser le logiciel modifié et effectuer vous‑même des modifications, sans avoir à récupérer la branche en local.
Il s’agit du plus grand changement dans notre façon de développer des logiciels depuis le passage de l’autocomplétion Tab au travail synchronisé avec des agents. Plus de 30 % des PR que nous fusionnons chez Cursor sont désormais créées par des agents qui opèrent de manière autonome dans des sandbox cloud.


Le niveau supérieur d'autonomie
Les agents locaux facilitent la génération de code, mais ils se heurtent rapidement à des conflits et se retrouvent en concurrence les uns avec les autres (et avec vous) pour les ressources de votre ordinateur. Les agents dans le cloud lèvent cette contrainte en donnant à chaque agent une VM (machine virtuelle) isolée, ce qui vous permet d'en exécuter plusieurs en parallèle.
Les agents dans le cloud peuvent aussi créer et manipuler des logiciels directement dans leur propre sandbox, ce qui leur permet d'itérer jusqu'à validation de leur résultat plutôt que de s'arrêter à la première tentative. La vidéo ci-dessous montre une preuve de concept tirée de nos premières recherches sur l'amélioration de l'utilisation de l'ordinateur.
Vous pouvez voir l'agent parcourir des pages web dans le navigateur, manipuler des outils comme des feuilles de calcul, interpréter des données et prendre des décisions, et résoudre des problèmes dans des environnements d'interface utilisateur complexes.
Utiliser des agents cloud dans Cursor
Depuis un mois, nous utilisons des agents cloud en interne, et cela a changé notre façon de développer des logiciels. Au lieu de découper les tâches en petits morceaux et de micro‑gérer les agents, nous leur déléguons des tâches plus ambitieuses et les laissons s’exécuter de manière autonome.
Voici quelques manières dont nous utilisons les agents cloud :
Créer de nouvelles fonctionnalités
Nous avons utilisé des agents cloud pour nous aider à créer des plugins, que nous avons récemment lancés sur le Cursor Marketplace. Voici l’un de nos prompts :
For each component displayed in a given plugin's page, we'd like to include a link to the source code. For skills, commands, rules, and subagents - that's the .md file. For hooks, it's the hooks.json. For mcps, it's the .mcp.json or the manifest where it's defined. As we index all the components of a plugin, keep track of the source file and construct links to that file by way of the underlying github url. Surface this to the frontend and have our frontend link out to github using this icon. Test w/
https://github.com/prisma/cursor-pluginlocally
L’agent a implémenté la fonctionnalité, puis s’est enregistré en train de naviguer vers le plugin Prisma importé et de cliquer sur chaque composant pour vérifier les liens GitHub.
Pour les tests en local, l’agent a temporairement contourné le feature flag qui contrôlait l’accès à la page marketplace, puis l’a rétabli avant de pousser. Il a rebasé sur main, résolu les conflits de fusion et tout regroupé dans un seul commit.
Reproduire des vulnérabilités
Nous avons lancé un agent cloud depuis Slack avec le prompt : « Please triage and explain this vulnerability to me in great detail », suivi d’une description d’une vulnérabilité d’exfiltration du presse‑papiers. Quand l’agent a terminé son exécution, il a répondu dans le fil Slack avec un résumé de ce qu’il avait accompli.
L’agent a construit une page HTML qui exploite la vulnérabilité via une API exposée. Il a démarré un serveur backend pour héberger la page de démonstration en local et a chargé la page dans le navigateur intégré de Cursor.
L’enregistrement vidéo montre la chaîne d’attaque complète : l’agent a copié un UUID de test vers le presse‑papiers système, chargé la page de démo dans le navigateur de Cursor, puis cliqué sur un bouton pour exfiltrer et afficher l’UUID. Il a également pris une capture d’écran montrant le vol réussi du contenu du presse‑papiers et a ajouté le fichier HTML de démo au dépôt.
Gérer des correctifs rapides
Nous avons demandé à un agent cloud de remplacer le libellé statique « Read lints » par un libellé dynamique piloté par les résultats du lint. Il a implémenté « No linter errors » pour zéro diagnostic et « Found N errors » pour N diagnostics, avec un style correspondant au CSS existant.
L’agent a testé deux cas dans l’application de bureau Cursor : un fichier avec plusieurs erreurs de type et un fichier propre sans erreurs. L’enregistrement vidéo montre l’agent en train de vérifier que le fichier propre possède un groupe développé qui affiche « No linter errors ».
Tester l’UI
Nous avons lancé un agent cloud pour vérifier que tout fonctionne correctement sur cursor.com/docs. Il a passé 45 minutes à faire un tour complet de notre site de documentation. L’agent a fourni un résumé de toutes les fonctionnalités qu’il a testées, dont la barre latérale, la navigation supérieure, la recherche, le bouton de copie de page, la boîte de dialogue de retour d’expérience, la table des matières et le changement de thème.
Maintenant que les agents peuvent gérer la majeure partie de l’implémentation, nous constatons que le rôle d’un développeur consiste davantage à définir la direction et à décider ce qui part en production.
Et ensuite
Nous construisons un futur de bases de code autonomes, où des agents fusionnent des PR, gèrent les déploiements progressifs et surveillent la production. Nous passerons d’un monde où les développeurs utilisent des agents pour créer des diffs à un monde où des agents livrent des fonctionnalités testées de bout en bout.
Pour concrétiser pleinement ce changement, il faudra améliorer les outils, les modèles et les modes d’interaction. À court terme, nous nous concentrons sur la coordination du travail de nombreux agents et sur la création de modèles qui apprennent de leurs exécutions passées et gagnent en efficacité à mesure qu’ils accumulent de l’expérience.
Rendez-vous sur cursor.com/onboard pour voir l’agent se configurer lui-même et enregistrer une démo. Ou découvrez-en plus dans la documentation.