PlanetScale protège la fiabilité de la production avec Bugbot

PlanetScale gère les workloads de bases de données cloud contenant les données les plus sensibles de ses clients. La fiabilité est son produit, et chaque changement de code poussé en production doit être irréprochable. À mesure que les agents ont rendu la génération de code peu coûteuse et rapide, la revue de code est devenue le nouveau goulot d’étranglement dans le cycle de développement logiciel.
Pour garantir la correction du code et le déployer en production en toute confiance, PlanetScale a adopté Bugbot comme couche de revue agentique dédiée. Aujourd’hui, environ 80 % des commentaires de Bugbot sont traités avant le merge, ce qui empêche les problèmes d’atteindre la production et fait gagner à PlanetScale l’équivalent de deux ingénieurs à temps plein en effort de revue.
Les agents déplacent les goulots d'étranglement du SDLC plus en aval
Pour préserver la fiabilité du produit, l'équipe d'ingénierie de PlanetScale impose des exigences extrêmement strictes pour la revue de code. « La fiabilité est au cœur de notre produit. Chaque changement déployé en production doit être irréprochable », explique Fatih Arslan, ingénieur logiciel chez PlanetScale.
À mesure que les agents de codage sont devenus centraux dans les workflows de développement, les goulots d'étranglement se sont déplacés plus en aval, de la génération de code vers la revue de code. « Le code est devenu bon marché. Le goulot d'étranglement, maintenant, c'est de savoir si votre code est correct et si vous comprenez ce qu'il fait », poursuit Arslan.
La quantité de code produite a augmenté rapidement tandis que la capacité de revue humaine restait fixe. Ce déséquilibre a exercé une pression sur la qualité du produit. Pour suivre le rythme, PlanetScale a estimé qu'il lui faudrait consacrer deux ingénieurs exclusivement à la revue de code. Ce compromis aurait réduit la capacité d'ingénierie disponible pour le développement produit, sans pour autant résoudre le défi de fiabilité à long terme à mesure que l'adoption des agents continuait de croître.
Nous avons compris que nous avions besoin de la revue par agent de Bugbot pour compléter notre processus existant. Sans cela, il serait très difficile de mettre du code en production en ayant confiance dans sa qualité et sa exactitude.
Éliminer les interruptions de production avec Bugbot
Bugbot s'est démarqué des autres outils de revue pilotés par des agents en détectant des problèmes que les relecteurs humains manquaient en raison de la complexité de la base de code de PlanetScale et du volume de code généré par des agents.
Avec Bugbot, les ingénieurs ont commencé à détecter et à corriger plus tôt, pendant le développement, des bugs susceptibles de provoquer des interruptions de production.
Bugbot est différent des autres outils. Il détecte des problèmes qu’en tant que relecteur humain je n’aurais jamais l’idée de chercher. J’ai été bluffé.
Contrairement aux analyseurs statiques et aux linters qui se concentrent sur la correction mécanique, Bugbot fait ressortir des problèmes sémantiques et logiques plus profonds, comme :
- Des lacunes de synchronisation d’état où les systèmes sont marqués comme terminés de manière prématurée
- Des modifications du flux logique qui empêchent l’exécution de chemins de code critiques
- Des interactions asynchrones entre contrôleurs qui ne convergent pas correctement
- Des cas limites susceptibles de déclencher des redémarrages sur l’ensemble des bases de données de production
Bugbot trouve systématiquement des bugs qui peuvent entraîner des interruptions significatives en production, mais qui sont très difficiles à détecter pour les humains.
PlanetScale a également constaté que demander simplement à un modèle de pointe d’examiner le code ne faisait pas systématiquement remonter les problèmes les plus critiques que Bugbot identifie. « Quand j’utilise un modèle de raisonnement et que je lui demande de relire la branche, il ne trouve pas ces problèmes. C’est l’environnement spécialisé et la façon dont Bugbot est conçu qui changent tout », explique Arslan.
Mesurer la qualité des revues de Bugbot
PlanetScale évalue Bugbot à l'aide d'un indicateur simple : le taux de résolution, qui mesure la proportion de problèmes identifiés par Bugbot qui sont corrigés au moment du merge.
Environ 80 % des commentaires de Bugbot sont désormais traités par les ingénieurs sur plus de 2 000 PR examinées chaque mois. « Les commentaires de Bugbot sont de tout premier ordre et ne cessent de s'améliorer au fil du temps à mesure que Bugbot obtient plus de contexte », explique Arslan.
Le rapport signal/bruit de Bugbot est très élevé. Quand Bugbot commente une PR, nous savons qu'il met en évidence un problème que nous devons corriger.
Bugbot est désormais profondément intégré au flux de travail de PlanetScale et donne aux ingénieurs l'assurance que le code, qu'il soit écrit par des humains ou généré par des agents, peut être déployé en production en toute sécurité. « J'adore Bugbot. C'est ma devise », dit Arslan.
PlanetScale peut désormais livrer des logiciels plus rapidement sans sacrifier la qualité, tandis que les ingénieurs peuvent se concentrer sur la résolution de problèmes d'infrastructure complexes plutôt que de revoir manuellement chaque ligne produite par des agents.
Si je retirais Bugbot à notre équipe d'ingénierie, il y aurait une mutinerie.
Si vous êtes enthousiaste à l'idée de rationaliser la revue de code et d'améliorer la fiabilité de vos produits avec des agents, contactez notre équipe pour démarrer avec un essai de Cursor.