Interaja com visualizações criadas por agentes em canvases
O Cursor agora pode responder criando canvases para representar informações visualmente. Isso permite que você explore e interaja com interfaces personalizadas, em vez de ler blocos longos de texto em chats ou arquivos markdown, que podem ser difíceis de absorver.
Com canvases, agentes podem criar painéis para dados do mundo real, além de interfaces personalizadas com lógica e interatividade adaptadas à sua solicitação. Agentes podem usá-los para ajudar você a revisar PRs, aprender novas bibliotecas ou até gerenciar outros agentes no Cursor. Na Janela de agentes, canvases são artefatos persistentes que ficam ao lado de outras ferramentas, como o terminal, o navegador e o controle de versão.
Componentes como blocos de construção
O Cursor renderiza canvases usando uma biblioteca de interface baseada em React, com componentes nativos como tabelas, caixas, diagramas e gráficos. Demos aos agentes acesso a componentes já existentes no Cursor, como diffs e listas de tarefas, e também os instruímos a seguir boas práticas de visualização de dados.
Você pode criar habilidades para ensinar os agentes a criar diferentes tipos de canvases. Por exemplo, a habilidade Docs Canvas permite que o Cursor gere um diagrama interativo da arquitetura do seu repositório.
Como usamos canvases no Cursor
Descobrimos que os canvases são especialmente úteis para tarefas com muitos dados. Eles permitem que os agentes organizem informações de uma forma não linear e mais fácil de assimilar do que texto simples.
Painel de resposta a incidentes
Os MCPs Datadog, Databricks e Sentry no Cursor nos permitiram explorar dados de observabilidade com agentes, que muitas vezes encontram insights que não perceberíamos sozinhos. Antes dos canvases, o agente apresentava dados de séries temporais em uma tabela markdown, o que era difícil de interpretar e exigia etapas adicionais para visualização.
Agora, o agente pode criar visualizações em um canvas que reúnem dados de várias fontes, inclusive arquivos locais de debug, em um único gráfico.
Interface de revisão de PR
Estamos revisando diffs mais extensos do que nunca. As ferramentas tradicionais apresentam todas as alterações da mesma forma, exigindo que identifiquemos quais partes do diff são mais importantes.
Com canvases, o Cursor pode agrupar alterações de forma lógica, priorizar o que é mais importante para você revisar e apresentar uma interface rica para você explorar o conjunto de alterações. Ele pode até escrever representações em pseudocódigo para algoritmos complexos.
Análise de eval
Na Cursor, passamos muito tempo investigando resultados de eval à medida que fazemos alterações no nosso harness e lançamos novos modelos no produto. Antes, os engenheiros precisavam inspecionar IDs de requisição uma por vez para identificar padrões. Consideramos desenvolver e implementar um app web para automatizar esse processo, mas, em vez disso, operacionalizamos isso diretamente com uma habilidade no Cursor.
A habilidade permite que agentes leiam todos os rollouts em uma eval, agrupem falhas e criem um canvas para investigar falhas de eval e agrupar modos de falha. Isso nos permite identificar bugs no harness que antes passavam despercebidos e, recentemente, nos ajudou a lançar dois novos modelos no Cursor com muito menos esforço.
Experimento de autoresearch
Estamos adaptando as ideias de autoresearch para permitir que agentes enfrentem desafios complexos de otimização relacionados à performance dos nossos clientes. Com canvases, o agente pode visualizar o andamento da pesquisa enquanto executa experimentos, permitindo que o usuário acompanhe o progresso e veja a hipótese que o agente está testando no momento.
Aumentando a largura de banda das informações
Melhorias recentes, como o Modo de design e a entrada de voz aprimorada, fazem parte do nosso esforço para aumentar a largura de banda das informações. Queremos reduzir o atrito na colaboração entre humanos e agentes e facilitar a expressão da sua intenção para além do texto puro.
Experimente os canvases no Cursor 3.1 ou saiba mais na nossa documentação.