全新 Tab 模型
今天,我們要宣布 Fusion,這是我們新一代的 Cursor Tab 模型。
Cursor Tab 會預測游標附近應該進行的編輯,以及下一步該移動到哪裡的建議(「跳轉」)。Fusion 模型幾乎可以即時產生品質更高的游標跳轉建議,並同時提升編輯品質。我們對 Tab 的近期目標,是從程式碼編輯中消除瑣碎乏味的工作,而 Fusion 在這個方向上帶來了顯著的提升,讓我們在邁向最終目標——在開發流程中即時進行 Next Action Prediction——的路上更進一步。
最實用的 copilot
從 2024 年 3 月開始,Tab 就由一個客製化的稀疏語言模型驅動,這個模型在數十億個 token 上訓練,用來預測程式碼編輯。自那之後,我們幾乎改善了 Tab 的每一個面向,在數十次模型更新與基礎設施升級的過程中,讓 Tab 變得更快、更聰明,也在實務上更好用。
我們發現,隨著我們持續開發,Tab 的實用性明顯提升,而且我們很高興使用者也有同樣的感受。Tab 的規模變得更大;現在它每天會產生超過十億個已編輯字元,請求量自從我們首次發佈模型以來也成長了約 100 倍。到了現在,我們的 Tab 模型產生的程式碼量已經超過世界上幾乎所有的 LLM。
我們很早就意識到,插入文字只是編輯程式碼的一小部分。其他 copilot 通常只會在你的游標位置插入文字,而 Cursor Tab 不僅會在游標附近建議完整的編輯,還會幫你跳轉到下一個你想前往的位置。
透過快速提供精準的編輯建議與跳轉,Tab 比其他 copilot 實用得多。當然,Tab 也同樣擅長一般 copilot 的典型工作——它很擅長撰寫小型函式,並在低延遲的情況下遵循內嵌指示。
自 3 月以來的改進
我們的第一個 Tab 模型於 2024 年 3 月訓練完成並發布。與這個原始模型版本相比,Fusion 在每一行能更準確地預測超過 25% 的困難編輯,並且能建議長度多出 10 倍以上的連續修改區段。Fusion 也在其他多個面向上改進了我們最初的模型:
| 模型版本 | 伺服器延遲(p50) | 游標跳轉 | 上下文長度(tokens) |
|---|---|---|---|
| 原始版本 | 475ms | 無 | 5500 |
| Fusion | 260ms | 即時且精準 | 13000 |
Fusion 在建議準確度上遠勝 3 月版本的模型,同時提供幾乎即時且品質更高的游標跳轉、更長的上下文,以及更低的延遲。
模型品質的提升主要得益於:
-
更乾淨、品質更高且數量更大的資料
-
更長的上下文視窗,在提示中加入更多編輯器狀態與檔案內容
-
針對較大幅度編輯進行精細訓練,產生了 Bigger Edits 模型
-
用於指令跟隨的合成資料
-
訓練流程與基礎模型的改進
延遲的改善則來自推論階段的優化、效能工程,以及更強的基礎模型。
展望未來
Fusion 正隨著我們最新的用戶端版本(0.45.0)向所有使用者逐步推出。
我們即將推出的下一波 Tab 改進,將帶來更好的程式碼庫上下文理解、更順暢的連按 Tab(tab-tab-tab)補全體驗,並進一步把 Supermaven 技術整合進 Tab 中。
如果你有興趣徹底消除程式碼編輯中的繁瑣工作、打造最實用的撰寫程式碼模型之一,或建模程式開發者的操作軌跡,請透過 hiring@cursor.com 與我們聯絡。