跳至内容

全新的 Tab 模型

作者: Phillip Kravtsov归入产品

今天,我们发布了Fusion,这是我们新一代的 Cursor Tab 模型。

Cursor Tab 会预测你在插入符附近的编辑,以及下一步应移动到哪里的建议(“跳转”)。Fusion 模型几乎可即时生成、且质量更高的跳转建议,同时也提升了编辑质量。我们对 Tab 的近期目标是从代码编辑中消除繁琐工作,而 Fusion 在这方面带来了重大改进,进一步推动我们迈向最终目标——在流内完成的Next Action Prediction

最有用的 Copilot

自 2024 年 3 月起,Tab 由一款定制的稀疏语言模型驱动,该模型通过在数十亿个 token 上训练来预测编辑。从那时起,我们几乎改进了 Tab 的每个方面,在数十次模型更新和基础设施升级中,使其更快、更智能、也更实用。

随着我们不断改进 Tab,其实用性显著提升,而令我们欣喜的是用户的感受也相同。Tab 的规模如今大得多:它每天生成超过十亿个编辑后的字符,自我们最初发布模型以来,请求速率已增长约 100 倍。如今,我们的 Tab 模型生成的代码数量已超过世界上几乎任何 LLM。

我们早已认识到,插入文本只是编辑代码的一小部分。其他助手只会在你的插入点处填入文本,而 Cursor Tab 不仅会围绕你的插入点提出完整修改,还会带你跳转到你接下来想去的位置。

通过快速给出准确的修改建议与跳转,Tab 比其他 copilot 更加实用。当然,Tab 也能很好地完成典型的 copilot 任务——它擅长编写小型函数,并能以极低延迟遵循行内指令。

自三月以来的改进

我们的首个 Tab 模型于 2024 年 3 月完成训练并发布。与该初始版本相比,Fusion 在逐行预测更高难度编辑方面的准确率提升超过 25%,同时还能提出长达 10 倍以上的连续改动建议。Fusion 还在以下多个方面优于我们的原始模型:

模型版本服务器延迟(p50)插入符跳转次数上下文长度(tokens)

原始

475毫秒

5500

Fusion

260毫秒

即时、准确

13000

Fusion 在建议准确性方面远超三月版本模型,同时提供几乎即时且更高质量的插入点跳转、更长的上下文,以及更低的延迟。

模型质量的提升来自:

  • 更干净、更高质量、且数量更充足的数据
  • 更长的上下文窗口,在提示中包含更多编辑器状态和文件内容
  • 针对更大规模编辑进行精心训练,从而推出Bigger Edits 模型
  • 用于指令跟随的合成数据
  • 训练配方与基础模型改进

延迟方面的收益来自推理改进、性能工程以及更优秀的基础模型。

展望未来

Fusion 正在随我们新的客户端版本(0.45.0)向所有用户逐步推出。

我们下一轮的 Tab 改进将带来更出色的代码库上下文、更顺畅的连续 Tab 触发体验,以及将Supermaven技术更深入地集成到 Tab 中。

如果你希望从代码编辑中消除一切繁琐、参与打造最实用的代码编写模型之一,或对程序员的操作轨迹进行建模,请发送邮件至hiring@anysphere.co与我们联系。

归类于: 产品

作者: Phillip Kravtsov