全新的 Tab 模型
今天,我们正式推出 Fusion,我们的下一代 Cursor Tab 模型。
Cursor Tab 不仅会预测你在光标附近要进行的编辑,还会给出接下来该移动到哪里的建议(“跳转”)。Fusion 模型几乎可以即时给出质量更高的跳转建议,同时也提升了编辑质量。我们为 Tab 设定的近期目标是消除代码编辑中的繁琐操作,而 Fusion 是朝这个方向迈出的重要一步,进一步推动我们迈向最终目标——在编码流中的下一步动作预测。
最实用的智能编程助手
从 2024 年 3 月开始,Tab 就由一个自定义的稀疏语言模型驱动,该模型在数十亿个 token 的编辑预测任务上进行了训练。自那以后,我们几乎改进了 Tab 的每一个方面,通过几十次模型更新和基础设施优化,让它变得更快、更智能、也更实用。
随着我们持续打磨,Tab 对我们的帮助越来越大,而更让我们欣喜的是,对用户来说它也变得越来越有用。Tab 的规模已经大幅提升;它现在每天会生成超过十亿个经过编辑的字符,请求速率自最初模型发布以来也增长了约 100 倍。到目前为止,我们的 Tab 模型每天生成的代码量已经超过了世界上几乎所有的 LLM。
我们很早就意识到,插入文本只是编辑代码的一小部分。其他智能编程助手通常只会在你的光标位置插入文本,而 Cursor Tab 不仅会在你的光标附近给出完整的编辑建议,还会帮你跳转到下一个你最可能需要去的位置。
通过快速给出准确的编辑和跳转建议,Tab 比其他智能编程助手实用得多。当然,Tab 也非常擅长典型的助手任务——它能够以很低的延迟写出小函数,并很好地遵循内联指令。
自 3 月以来的改进
我们的第一个 Tab 模型在 2024 年 3 月完成训练并发布。与这一最初的模型版本相比,Fusion 在对每行复杂编辑的预测准确率上提升了 25% 以上,同时还能给出长达此前 10 倍长度的连续修改建议。Fusion 在多个方面也优于我们的原始模型:
| 模型版本 | 服务器延迟(p50) | Cursor 跳转 | 上下文长度(tokens) |
|---|---|---|---|
| 原始版本 | 475ms | 无 | 5500 |
| Fusion | 260ms | 即时且精确 | 13000 |
Fusion 在建议准确率上远超 3 月的模型,同时提供几乎即时且质量更高的 Cursor 跳转、更长的上下文,以及更低的延迟。
模型质量的提升主要得益于:
-
更干净、更高质量且规模更大的数据
-
更长的上下文窗口,在 prompt 中包含更多编辑器状态和文件内容
-
针对大规模编辑进行精细训练,从而得到 Bigger Edits 模型
-
用于指令跟随能力的合成数据
-
训练流程和基础模型的改进
延迟的优化得益于推理层面的改进、性能工程以及更好的基础模型。
展望未来
Fusion 将随着我们新的客户端版本更新(0.45.0)向所有用户逐步推出。
我们下一轮的 Tab 改进将带来更好的代码库上下文、更顺畅的多次 Tab 补全体验,并进一步将 Supermaven 技术集成进 Tab。
如果你对从代码编辑中消除所有繁琐工作、打造用于编写代码的最有用模型之一,或者对程序员的操作路径进行建模感兴趣,欢迎发送邮件至 hiring@cursor.com 与我们联系。