Bugbot 现在可通过学习规则自我改进
当我们在 2025 年 7 月将 Bugbot 结束 Beta 测试并正式发布时,它识别出的缺陷中有 52% 在相关 PR 合并前就已被解决,这意味着其余部分属于误报。
如今,解决率已接近 80%,比第二名 AI 代码审查产品高出 15 个百分点。
| AI 代码审查产品 | 解决率 | 已分析的 PR |
|---|---|---|
| Cursor Bugbot | 78.13% | 50,310 |
| Greptile | 63.49% | 11,419 |
| CodeRabbit | 48.96% | 33,487 |
| GitHub Copilot | 46.69% | 24,336 |
| Codex | 45.07% | 19,384 |
| Gemini Code Assist | 30.93% | 21,031 |
我们仅分析了公开代码仓库。对于 AI 代码审查产品生成的每条评论, 我们都使用 LLM 裁决者检查其在合并时是否已被处理。
到目前为止,这些改进完全来自离线实验:我们调整 Bugbot,测试这一变更是否能提升解决率,如果能,就将其发布。


但纯离线的方法会让大量训练潜力白白流失。Bugbot 每天会审查数十万个 PR,而每一次审查都是一次自然实验:Bugbot 可以根据开发者是否对其报告采取行动来自我改进。
为了利用这些实时信号,我们现已让 Bugbot 能够从过往运行中学习,将实时代码审查流程中的反馈转化为学习规则。规则可作为额外指令,进一步提升 Bugbot 运行的可定制性,帮助 Bugbot 聚焦于特定问题、业务背景等内容。
自 学习规则 以 Beta 形式推出以来,已有超过 110,000 个仓库启用了学习,生成了超过 44,000 条学习规则。
学习规则如何工作
每个已合并的 PR 都包含一系列可供 Bugbot 用来自我改进并沉淀为规则的信号。其中三个重要信号是:
- 对 Bugbot 评论的反馈:点踩表示 Bugbot 的这条发现并不实用。
- 对 Bugbot 评论的回复:开发者会在回复中说明问题出在哪里,或者建议原本可以如何做得更好。
- 人工审查者的评论:用于指出 Bugbot 漏掉的问题。


Bugbot 会将这些信号处理成候选规则,并持续在新进入的 PR 上评估它们。随着信号不断积累,Bugbot 可以将候选规则提升为活跃状态,从而开始影响后续的代码审查。同样,如果某条活跃规则开始持续产生稳定的负面信号,Bugbot 也可以将其禁用。您也可以直接在 UI 中编辑或删除规则。
开始使用
我们希望 Bugbot 能发现每一个真实的缺陷,而这需要它深入理解你的代码库、其中的模式,以及团队的优先级。学习规则朝这个目标迈出了一大步,也是我们推动 Bugbot 持续自我改进的整体工作的一部分。
你可以在 Cursor 仪表盘 中管理 Bugbot 的学习:启用学习规则,并对最近的 PR 进行回填;或者在我们的文档中了解更多。