全新的 Tab 模型
今天,我们发布了Fusion
,这是我们新一代的 Cursor Tab 模型。
Cursor Tab 会预测你在插入符附近的编辑,以及下一步应移动到哪里的建议(“跳转”)。Fusion
模型几乎可即时生成、且质量更高的跳转建议,同时也提升了编辑质量。我们对 Tab 的近期目标是从代码编辑中消除繁琐工作,而 Fusion
在这方面带来了重大改进,进一步推动我们迈向最终目标——在流内完成的Next Action Prediction。
最有用的 Copilot
自 2024 年 3 月起,Tab 由一款定制的稀疏语言模型驱动,该模型通过在数十亿个 token 上训练来预测编辑。从那时起,我们几乎改进了 Tab 的每个方面,在数十次模型更新和基础设施升级中,使其更快、更智能、也更实用。
随着我们不断改进 Tab,其实用性显著提升,而令我们欣喜的是用户的感受也相同。Tab 的规模如今大得多:它每天生成超过十亿个编辑后的字符,自我们最初发布模型以来,请求速率已增长约 100 倍。如今,我们的 Tab 模型生成的代码数量已超过世界上几乎任何 LLM。
我们早已认识到,插入文本只是编辑代码的一小部分。其他助手只会在你的插入点处填入文本,而 Cursor Tab 不仅会围绕你的插入点提出完整修改,还会带你跳转到你接下来想去的位置。
通过快速给出准确的修改建议与跳转,Tab 比其他 copilot 更加实用。当然,Tab 也能很好地完成典型的 copilot 任务——它擅长编写小型函数,并能以极低延迟遵循行内指令。
自三月以来的改进
我们的首个 Tab 模型于 2024 年 3 月完成训练并发布。与该初始版本相比,Fusion 在逐行预测更高难度编辑方面的准确率提升超过 25%,同时还能提出长达 10 倍以上的连续改动建议。Fusion 还在以下多个方面优于我们的原始模型:
模型版本 | 服务器延迟(p50) | 插入符跳转次数 | 上下文长度(tokens) |
---|---|---|---|
原始 | 475毫秒 | 无 | 5500 |
Fusion | 260毫秒 | 即时、准确 | 13000 |
Fusion
在建议准确性方面远超三月版本模型,同时提供几乎即时且更高质量的插入点跳转、更长的上下文,以及更低的延迟。
模型质量的提升来自:
- 更干净、更高质量、且数量更充足的数据
- 更长的上下文窗口,在提示中包含更多编辑器状态和文件内容
- 针对更大规模编辑进行精心训练,从而推出Bigger Edits 模型
- 用于指令跟随的合成数据
- 训练配方与基础模型改进
延迟方面的收益来自推理改进、性能工程以及更优秀的基础模型。
展望未来
Fusion
正在随我们新的客户端版本(0.45.0)向所有用户逐步推出。
我们下一轮的 Tab 改进将带来更出色的代码库上下文、更顺畅的连续 Tab 触发体验,以及将Supermaven技术更深入地集成到 Tab 中。
如果你希望从代码编辑中消除一切繁琐、参与打造最实用的代码编写模型之一,或对程序员的操作轨迹进行建模,请发送邮件至hiring@anysphere.co与我们联系。