Apresentando o Composer 2

por Cursor Equipe em Pesquisa

O Composer 2 agora está disponível no Cursor.

Ele oferece desempenho de ponta em programação e custa 2.50/M tokens de saída, tornando-se uma nova combinação ideal de inteligência e custo.

Eficiência e qualidade do Composer 2 no CursorBenchEficiência e qualidade do Composer 2 no CursorBench

Inteligência de programação de ponta

Estamos melhorando rapidamente a qualidade do nosso modelo. O Composer 2 oferece grandes melhorias em todos os benchmarks que medimos, incluindo o Terminal-Bench 2.01 e o SWE-bench Multilingual:

Resultados do Composer 2 no Terminal-Bench 2.0Resultados do Composer 2 no Terminal-Bench 2.0
ModeloCursorBenchTerminal-Bench 2.0SWE-bench Multilingual
Composer 261.361.773.7
Composer 1.544.247.965.9
Composer 138.040.056.9

Essas melhorias de qualidade vêm da nossa primeira execução de pré-treinamento contínuo, que fornece uma base muito mais forte para expandir nosso aprendizado por reforço.

A partir dessa base, treinamos em tarefas de programação de horizonte longo por meio de aprendizado por reforço. O Composer 2 é capaz de resolver tarefas desafiadoras que exigem centenas de ações.

Experimente o Composer 2

Composer 2 custa 2.50/M de tokens de saída.

Também há uma variante mais rápida com a mesma inteligência por 7.50/M de tokens de saída, que tem um custo menor do que outros modelos rápidos2. Estamos tornando a variante rápida a opção padrão. Veja nossa documentação do modelo para todos os detalhes.

Velocidade e custo da variante rápida do Composer 2 em comparação com outros modelosVelocidade e custo da variante rápida do Composer 2 em comparação com outros modelos

Nos planos individuais, o uso do Composer faz parte de um pool de uso separado, com uma franquia generosa incluída. Experimente o Composer 2 hoje no Cursor.


  1. O Terminal-Bench 2.0 é um benchmark de avaliação de agentes para uso em terminal, mantido pelo Laude Institute. As pontuações dos modelos da Anthropic usam o harness Claude Code, e as pontuações dos modelos da OpenAI usam o harness Simple Codex. Nossa pontuação do Cursor foi calculada usando o framework de avaliação Harbor oficial (o harness designado para o Terminal-Bench 2.0), com as configurações padrão do benchmark. Executamos 5 iterações por par modelo-agente e reportamos a média. Mais detalhes sobre o benchmark podem ser encontrados no site oficial do Terminal Bench. Para outros modelos além do Composer 2, consideramos a maior pontuação entre a do leaderboard oficial e a registrada em nossa infraestrutura.
  2. Os tokens por segundo (TPS) de todos os modelos vêm de um snapshot do tráfego do Cursor em 18 de março de 2026. O tamanho dos tokens do Composer e dos modelos GPT é semelhante. Os tokens da Anthropic são cerca de 15% menores, e o número de TPS é normalizado para refletir isso. Da mesma forma, o preço do token de saída para modelos que não são da Anthropic foi ajustado para corresponder à mesma alteração de cerca de 15%. A velocidade pode variar dependendo da capacidade do provider e de melhorias ao longo do tempo.
Apresentando o Composer 2 · Cursor