Los agentes de Cursor ahora pueden controlar sus propias computadoras
Los agentes solo son tan capaces como el entorno en el que se ejecutan. Sin la capacidad de usar el software que están creando, los agentes se topan con un límite.
En los últimos meses, abordamos esto internamente dándoles a los agentes sus propias máquinas virtuales con entornos de desarrollo completos y la capacidad de probar sus cambios y producir artefactos (videos, capturas de pantalla y logs) para que puedas validar rápidamente su trabajo.
Hoy estamos lanzando una nueva versión de los agentes en la nube de Cursor, disponible desde cualquier lugar donde trabajes, incluyendo la web, el móvil, la app de escritorio, Slack y GitHub. Los agentes en la nube se integran automáticamente con tu codebase y producen PR listos para hacer merge, con artefactos para demostrar sus cambios. También puedes controlar el escritorio remoto del agente para usar el software modificado y hacer ediciones tú mismo, sin tener que hacer checkout de la rama localmente.
Este ha sido el mayor cambio en cómo desarrollamos software desde la transición del autocompletado de Tab a trabajar de forma síncrona con agentes. Más del 30% de los PR que hacemos merge en Cursor ahora son creados por agentes que operan de forma autónoma en sandboxes en la nube.


El siguiente nivel de autonomía
Los agentes locales facilitan iniciar la generación de código, pero rápidamente se topan con conflictos y compiten entre sí (y contigo) por los recursos de tu computadora. Los agentes en la nube eliminan esta limitación al otorgar a cada agente una VM aislada, de modo que puedas ejecutar muchos en paralelo.
Los agentes en la nube también pueden crear e interactuar con software directamente en su propio entorno aislado (sandbox), lo que les permite iterar hasta validar sus resultados en lugar de entregar el primer intento. El video a continuación muestra una prueba de concepto de nuestra investigación anterior sobre el uso avanzado de computadoras.
Puedes ver al agente navegar por páginas web en el navegador, manipular herramientas como hojas de cálculo, interpretar datos y tomar decisiones, y resolver problemas en entornos de interfaz de usuario complejos.
Uso de agentes en la nube en Cursor
Durante el último mes hemos estado usando agentes en la nube internamente, y ha cambiado la forma en que desarrollamos software. En lugar de dividir las tareas en partes pequeñas y microgestionar a los agentes, delegamos tareas más ambiciosas y dejamos que se ejecuten por sí solos.
Estas son algunas de las formas en que estamos usando agentes en la nube:
Crear nuevas funcionalidades
Usamos agentes en la nube para ayudarnos a crear plugins, que lanzamos recientemente en el Cursor Marketplace. Este es uno de nuestros prompts:
For each component displayed in a given plugin's page, we'd like to include a link to the source code. For skills, commands, rules, and subagents - that's the .md file. For hooks, it's the hooks.json. For mcps, it's the .mcp.json or the manifest where it's defined. As we index all the components of a plugin, keep track of the source file and construct links to that file by way of the underlying github url. Surface this to the frontend and have our frontend link out to github using this icon. Test w/
https://github.com/prisma/cursor-pluginlocally
El agente implementó la funcionalidad y luego se grabó a sí mismo navegando al plugin de Prisma importado y haciendo clic en cada componente para verificar los enlaces a GitHub.
Para las pruebas locales, el agente evitó temporalmente el feature flag que protegía la página del marketplace y luego lo revirtió antes de hacer push. Hizo un rebase sobre main, resolvió conflictos de merge y aplanó todo en un solo commit.
Reproducir vulnerabilidades
Lanzamos un agente en la nube desde Slack con el prompt: "Please triage and explain this vulnerability to me in great detail", seguido de una descripción de una vulnerabilidad de exfiltración del portapapeles. Cuando el agente terminó de ejecutarse, respondió en el hilo de Slack con un resumen de lo que hizo.
El agente creó una página HTML que explota la vulnerabilidad a través de una API expuesta. Inició un servidor backend para alojar la página de demostración localmente y cargó la página en el navegador integrado de Cursor.
El artefacto de vídeo muestra todo el flujo del ataque: el agente copió un UUID de prueba al portapapeles del sistema, cargó la página de demostración en el navegador de Cursor y hizo clic en un botón para exfiltrar y mostrar el UUID. También tomó una captura de pantalla que muestra el robo exitoso del portapapeles y agregó el archivo HTML de la demo al repositorio en un commit.
Gestionar correcciones rápidas
Le pedimos a un agente en la nube que reemplazara la etiqueta estática "Read lints" por una dinámica impulsada por los resultados del linter. Implementó "No linter errors" para cero diagnósticos y "Found N errors" para N diagnósticos, con estilos que coinciden con el CSS existente.
El agente probó dos casos en la app de escritorio de Cursor: un archivo con múltiples errores de tipo y un archivo limpio sin errores. El artefacto de vídeo muestra al agente verificando que el archivo limpio tiene un grupo expandido que muestra “No linter errors”.
Probar la UI
Pusimos en marcha un agente en la nube para comprobar que todo funcionara correctamente en cursor.com/docs. Pasó 45 minutos haciendo un recorrido completo por nuestro sitio de documentación. El agente proporcionó un resumen de todas las funcionalidades que probó, incluyendo la barra lateral, la navegación superior, la búsqueda, el botón de copiar página, el cuadro de diálogo para compartir feedback, la tabla de contenidos y el cambio de tema.
Ahora que los agentes pueden encargarse de la mayor parte de la implementación, hemos visto que el rol de una persona desarrolladora tiene más que ver con marcar la dirección y decidir qué se envía a producción.
Qué sigue
Estamos construyendo hacia un futuro de bases de código autónomas, donde los agentes fusionan PR, gestionan despliegues y supervisan producción. Pasaremos de un mundo en el que los desarrolladores usan agentes para crear diffs a otro en el que los agentes lanzan funcionalidades probadas de extremo a extremo.
Para materializar por completo ese cambio hará falta mejorar las herramientas, los modelos y los patrones de interacción. A corto plazo, nos centraremos en coordinar el trabajo entre muchos agentes y en crear modelos que aprendan de ejecuciones pasadas y se vuelvan más efectivos a medida que acumulan experiencia.
Empieza en cursor.com/onboard para ver cómo el agente se configura automáticamente y registra una demo. O bien, obtén más información en la documentación.