跳转到内容

全新的 Tab 模型

Phillip Kravtsov产品

今天,我们正式推出 Fusion,我们的下一代 Cursor Tab 模型。

Cursor Tab 不仅会预测你在光标附近要进行的编辑,还会给出接下来该移动到哪里的建议(“跳转”)。Fusion 模型几乎可以即时给出质量更高的跳转建议,同时也提升了编辑质量。我们为 Tab 设定的近期目标是消除代码编辑中的繁琐操作,而 Fusion 是朝这个方向迈出的重要一步,进一步推动我们迈向最终目标——在编码流中的下一步动作预测

最实用的智能编程助手

从 2024 年 3 月开始,Tab 就由一个自定义的稀疏语言模型驱动,该模型在数十亿个 token 的编辑预测任务上进行了训练。自那以后,我们几乎改进了 Tab 的每一个方面,通过几十次模型更新和基础设施优化,让它变得更快、更智能、也更实用。

随着我们持续打磨,Tab 对我们的帮助越来越大,而更让我们欣喜的是,对用户来说它也变得越来越有用。Tab 的规模已经大幅提升;它现在每天会生成超过十亿个经过编辑的字符,请求速率自最初模型发布以来也增长了约 100 倍。到目前为止,我们的 Tab 模型每天生成的代码量已经超过了世界上几乎所有的 LLM。

我们很早就意识到,插入文本只是编辑代码的一小部分。其他智能编程助手通常只会在你的光标位置插入文本,而 Cursor Tab 不仅会在你的光标附近给出完整的编辑建议,还会帮你跳转到下一个你最可能需要去的位置。

通过快速给出准确的编辑和跳转建议,Tab 比其他智能编程助手实用得多。当然,Tab 也非常擅长典型的助手任务——它能够以很低的延迟写出小函数,并很好地遵循内联指令。

自 3 月以来的改进

我们的第一个 Tab 模型在 2024 年 3 月完成训练并发布。与这一最初的模型版本相比,Fusion 在对每行复杂编辑的预测准确率上提升了 25% 以上,同时还能给出长达此前 10 倍长度的连续修改建议。Fusion 在多个方面也优于我们的原始模型:

模型版本服务器延迟(p50)Cursor 跳转上下文长度(tokens)
原始版本475ms5500
Fusion260ms即时且精确13000

Fusion 在建议准确率上远超 3 月的模型,同时提供几乎即时且质量更高的 Cursor 跳转、更长的上下文,以及更低的延迟。

模型质量的提升主要得益于:

  • 更干净、更高质量且规模更大的数据

  • 更长的上下文窗口,在 prompt 中包含更多编辑器状态和文件内容

  • 针对大规模编辑进行精细训练,从而得到 Bigger Edits 模型

  • 用于指令跟随能力的合成数据

  • 训练流程和基础模型的改进

延迟的优化得益于推理层面的改进、性能工程以及更好的基础模型。

展望未来

Fusion 将随着我们新的客户端版本更新(0.45.0)向所有用户逐步推出。

我们下一轮的 Tab 改进将带来更好的代码库上下文、更顺畅的多次 Tab 补全体验,并进一步将 Supermaven 技术集成进 Tab。

如果你对从代码编辑中消除所有繁琐工作、打造用于编写代码的最有用模型之一,或者对程序员的操作路径进行建模感兴趣,欢迎发送邮件至 hiring@cursor.com 与我们联系。

归档于: 产品

作者: Phillip Kravtsov

全新的 Tab 模型 · Cursor