PlanetScale 通过 Bugbot 保障生产环境可靠性

作者 Cursor Team 分类:客户
PlanetScale 和 Cursor 的合作关系
行业: 云基础设施|地域: 北美
80%
Bugbot 发现问题的解决率
>2,000
每月审查的 PR 数量
2 FTEs
节省的开发者审查人力(按全职折算)

PlanetScale 为客户托管云数据库工作负载,承载着最敏感的数据。可靠性就是产品本身,而每一次推送到生产环境的代码变更都必须做到万无一失。随着智能体让代码生成变得低成本且高速,代码审查也随之成为软件开发生命周期中的新瓶颈。

为确保正确性并自信地将代码发布到生产环境,PlanetScale 引入 Bugbot,作为一层专门的智能体审查层。如今,大约 80% 的 Bugbot 评论都会在合并前被处理,阻止问题流入生产环境,并为 PlanetScale 节省了相当于两名全职工程师的审查投入。

Agents 将 SDLC 中的瓶颈后移到下游

为了保持产品的可靠性,PlanetScale 的工程团队为代码评审设立了近乎苛刻的标准。PlanetScale 的软件工程师 Fatih Arslan 表示:“可靠性是我们产品的核心。每一次发布到生产环境的变更都必须毫无瑕疵。”

随着编码 Agents 成为开发工作流的核心,瓶颈从代码生成后移到了代码评审环节。Arslan 解释道:“代码已经变得廉价。现在的瓶颈在于你的代码是否正确,以及你是否真正理解它在做什么。”

代码产出迅速提升,而人工评审能力却保持不变。这种失衡给产品质量带来了压力。为了跟上节奏,PlanetScale 评估认为需要专门投入两名工程师只做代码评审。这样的取舍会削减用于产品开发的工程资源,而且在 Agents 采用规模持续扩大的情况下,依然无法从根本上解决长期的可靠性挑战。

我们意识到需要 Bugbot 的 Agent 式评审来补充现有流程。否则,要在对质量和正确性有足够信心的前提下将代码发布到生产环境,将会非常困难。

Fatih Arslan
Software engineer, PlanetScale

使用 Bugbot 消除生产环境宕机

在众多智能体评审工具中,Bugbot 脱颖而出,因为在 PlanetScale 庞大且复杂的代码库以及大量由智能体生成的代码中,它能够发现人类评审者因复杂度而容易遗漏的问题。

借助 Bugbot,工程师开始在开发早期就捕获并修复可能导致生产环境宕机的缺陷。

Bugbot 和其他工具不一样。它能发现一些作为人工评审者的我根本想不到要去检查的问题。这让我非常震撼。

Fatih Arslan
Software engineer, PlanetScale

与专注于机械正确性的静态分析工具和 linter 不同,Bugbot 会暴露出更深层次的语义和逻辑问题,例如:

  • 状态同步缺口:系统被过早标记为已完成
  • 逻辑流程变更:导致关键代码路径无法执行
  • 异步控制器交互:无法正确收敛
  • 边界情况(edge cases):可能触发生产环境数据库的重启

Bugbot 总能发现那些可能在生产环境中导致严重宕机、但人类却极难捕捉到的缺陷。

Fatih Arslan
Software engineer, PlanetScale

PlanetScale 还发现,仅仅让一个前沿模型来审查代码,并不能稳定地暴露出 Bugbot 能识别出的那些最关键问题。“当我使用一个推理模型,让它来审查分支时,它并不会发现这些问题。真正产生巨大差异的是那个专用的 harness,以及 Bugbot 的构建方式。”Arslan 说道。

评估 Bugbot 代码审查质量

PlanetScale 使用一个简单的指标来评估 Bugbot:问题解决率(resolution rate),用于衡量在合并时被解决的、由 Bugbot 识别出的问题所占的比例。

目前,每月在超过 2,000 个 PR 的审查中,大约有 80% 的 Bugbot 评论会被工程师处理。Arslan 表示:“Bugbot 的评论质量一流,并且会随着 Bugbot 获取更多上下文而不断提升。”

Bugbot 的信噪比非常高。只要 Bugbot 在 PR 上发表评论,我们就知道它指出的是一个必须修复的问题。

Fatih Arslan
Software engineer, PlanetScale

Bugbot 现在已经深度融入 PlanetScale 的工作流程中,让工程师能够确信,无论是人工编写的代码还是由智能体生成的代码,都可以安全地发布到生产环境。Arslan 说:“我爱 Bugbot。这就是我的座右铭。”

PlanetScale 现在可以在不牺牲质量的前提下更快地发布软件,工程师也可以专注于解决复杂的基础设施问题,而不必手动审查每一行由智能体生成的代码。

如果我把 Bugbot 从我们的工程团队拿走,他们肯定会造反。

Sam Lambert
CEO, PlanetScale

如果你希望通过智能体简化代码审查流程并提升产品可靠性,欢迎联系我们的团队,开始试用 Cursor。

归类于: 客户

作者: Cursor Team

PlanetScale 通过 Bugbot 保障生产环境可靠性 · Cursor