推出 Composer 2

作者 Cursor Team研究

Composer 2 現已在 Cursor 中可使用。

它在程式設計方面達到前沿水準,價格為每百萬個 Input token 2.50,使其成為智慧與成本之間全新且最佳的組合。

Composer 2 在 CursorBench 上的效率與品質Composer 2 在 CursorBench 上的效率與品質

前沿水準的程式開發智慧

我們正在迅速提升模型品質。Composer 2 在我們衡量的所有基準測試上都有大幅提升,包括 Terminal-Bench 2.01 和 SWE-bench Multilingual:

Composer 2 Terminal-Bench 2.0 測試結果Composer 2 Terminal-Bench 2.0 測試結果
模型CursorBenchTerminal-Bench 2.0SWE-bench Multilingual
Composer 261.361.773.7
Composer 1.544.247.965.9
Composer 138.040.056.9

這些品質提升來自我們首次進行的持續預訓練流程,為擴展強化學習提供了更強大的基礎。

以此為基礎,我們透過強化學習訓練模型處理長時程程式開發任務。Composer 2 能夠解決需要數百個動作的具挑戰性任務。

試用 Composer 2

Composer 2 的定價為每百萬輸入 token 2.50。

另外還有一個 具備相同智慧、但速度更快的版本,定價為每百萬輸入 token 7.50,而且成本低於其他快速模型2。我們會將 fast 設為預設選項。完整資訊請參閱我們的模型文件

Composer 2 快速版本的速度與成本,相較於其他模型的比較Composer 2 快速版本的速度與成本,相較於其他模型的比較

在個人方案中,Composer 用量屬於獨立的用量池,並包含充足的使用額度。立即在 Cursor 試用 Composer 2。


  1. Terminal-Bench 2.0 是由 Laude Institute 維護、用於終端機使用情境的代理評估基準。Anthropic 模型分數使用 Claude Code harness,OpenAI 模型分數使用 Simple Codex harness。我們的 Cursor 分數是使用官方的 Harbor evaluation framework(Terminal-Bench 2.0 指定的 harness),並採用預設基準設定計算得出。我們針對每個模型-代理組合執行了 5 次迭代,並回報平均值。更多基準資訊可在官方的 Terminal Bench 網站 找到。對於 Composer 2 以外的其他模型,我們取 官方排行榜 分數與在我們基礎架構中執行時記錄的分數兩者中的較高值。
  2. 所有模型的每秒 token 數(TPS)皆來自 2026 年 3 月 18 日 Cursor 流量的快照。Composer 與 GPT 模型的 token 大小相近。Anthropic 的 token 約小 15%,TPS 數值已標準化以反映此差異。同樣地,非 Anthropic 模型的輸出 token 價格也已按比例調整,以符合這相同約 15% 的變化。速度可能會依供應商容量及隨時間推進的改進而有所變化。

分類: 研究

作者: Cursor Team

推出 Composer 2 · Cursor