Comment Wayfair a réduit de 90 % les coûts de ses modèles de ML (deux fois !) avec Cursor
Avec Cursor aux commandes de l’exécution des expériences, Wayfair a condensé des mois de recherche en ML en quelques jours. Cinq chercheurs ont testé plus de 110 variantes de modèle et réduit de 94 % les coûts du modèle de validation des tags.
L’équipe Applied Research de Wayfair utilise Cursor pour condenser en quelques jours des mois de recherche en machine learning et en IA appliquée. Fin 2025, les chercheurs faisaient tourner plus de 20 agents en parallèle. Cela a permis à une équipe de cinq personnes de tester 110 variantes de modèle distinctes en quatre jours de sprint d’expérimentation et de réduire de 94 % les coûts d’inférence d’un workflow clé d’enrichissement du catalogue e-commerce. En mars 2026, l’équipe a reproduit la même approche avec les derniers modèles disponibles dans Cursor, réduisant encore les coûts de 90 %."
Cursor a transformé le fonctionnement de la recherche en ML chez Wayfair. Ce sont les chercheurs de Wayfair qui pilotent les améliorations des modèles : ils élaborent des hypothèses, interprètent les résultats et affinent les idées les plus prometteuses. Cursor se charge de l’implémentation : créer des expérimentations, les intégrer au framework de test et mesurer les résultats.
Validation des données d’attributs produit à l’aide du plus grand catalogue d’articles pour la maison au monde
Chaque produit du catalogue Wayfair est décrit par des « tags » structurés indiquant les matériaux, les dimensions, la couleur et d’autres attributs. Plus de 47 000 tags d’attributs distincts alimentent la recherche, le filtrage, les recommandations, le placement de produits et la publicité pour des dizaines de millions de produits.
L’équipe Applied AI de Wayfair a conçu un modèle de validation qui vérifie chaque tag à partir des images, des descriptions et des avis clients figurant sur la page produit. Le modèle était précis, mais trop coûteux à exécuter à grande échelle sur l’immense catalogue de produits de Wayfair.
Notre objectif était de rendre le modèle assez rentable pour l’exécuter sur l’un des plus grands catalogues d’articles pour la maison au monde.
Pour y parvenir, l’équipe devait explorer un vaste espace de conception, comprenant différents LLM, des stratégies de prétraitement des entrées, des requêtes, des structures de sortie et des méthodes d’évaluation. Mettre en œuvre manuellement des centaines de combinaisons aurait pris des mois.
Wayfair a plutôt utilisé Cursor pour automatiser et paralléliser la boucle d’expérimentation. En décembre 2025, l’équipe a mené un sprint d’expérimentation de quatre jours afin d’avancer vers ses objectifs de réduction des coûts. Avec Cursor aux commandes de la couche d’implémentation, cinq chercheurs ont créé et testé 110 variantes de modèle réellement distinctes. L’architecture retenue a réduit les coûts d’inférence de 94 % tout en améliorant la précision du modèle, et a été mise en production comme référence de Wayfair pour la validation des tags.


Ce qui ralentit la recherche, c’est de créer et d’évaluer chaque expérimentation à la main. Nous avons automatisé cette boucle et laissé Cursor implémenter et exécuter chaque expérimentation, ce qui a permis de condenser en quatre jours ce qui aurait autrement demandé des mois de travail.
Déléguer l’exécution des expérimentations à Cursor
Avant de créer des variantes de modèle, l’équipe a standardisé la façon dont Cursor exécuterait et mesurerait les expérimentations : chaque variante était exécutée sur le même jeu de données de test et le même benchmark d’évaluation afin d’en mesurer les performances. Une fois le framework de test et d’évaluation mis en place sous forme de workflow automatisé dans Cursor, les chercheurs pouvaient se concentrer entièrement sur l’exploration de la conception des expérimentations : changer de modèles, réécrire les requêtes, restructurer les sorties ou repenser la manière dont les images étaient sélectionnées.
« Il y avait de nombreux degrés de liberté : modèles, requêtes, structure de sortie, sélection des images. Une fois Cursor Automations en place, je me concentrais sur l’exploration de l’espace de conception », a déclaré Guillermo Mosse, senior machine learning scientist. « Je décrivais une idée, parfois en utilisant le mode vocal pour parler pendant 5 minutes d’affilée, et Cursor lançait la variante, exécutait l’eval et publiait les résultats. Le framework gérait l’échantillonnage des données, l’évaluation et le reporting des métriques, ce qui rendait les comparaisons fiables. »
Cursor a déplacé le goulot d’étranglement de « Combien de temps faudra-t-il pour créer cela ? » à « Quelle est la prochaine idée qui mérite d’être testée ? ». C’est une bien meilleure façon, pour un scientifique, d’utiliser son attention.
Cela a permis aux chercheurs de passer d’une idée à une expérimentation réelle en moins de 30 minutes.


Les chercheurs passaient l’essentiel de leur temps à réfléchir à ce qu’il fallait essayer ensuite, à examiner les résultats et à décider quelles idées méritaient d’être approfondies. Cursor écrivait et exécutait chaque variante, en faisant ressortir les plus prometteuses pour que nous les examinions.
En mars 2026, Wayfair a lancé un nouveau sprint d’expérimentation, cette fois en prenant comme nouvelle référence le modèle de décembre mis en production. Le framework étant désormais bien rodé, des ingénieurs juniors sans aucune expérience préalable en validation des tags livraient de nouvelles variantes de modèle dès le premier jour. Les chercheurs ont mené plus de 140 nouvelles expérimentations et ajouté des recherches par algorithme génétique aux candidats les plus solides pour l’optimisation finale. Résultat : une nouvelle réduction des coûts de 90 %.


Cursor comme base pour la recherche en ML orientée agent
Quelques capacités ont surtout compté dans la manière dont Wayfair menait ses expérimentations :
- Parallélisation des agents à grande échelle : Pendant le sprint d’expérimentation, les chercheurs exécutaient souvent plus de 20 agents Cursor en parallèle. « Exécuter de nombreuses variantes en même temps dans Cursor était simple et facile. C’est ce qui a rendu réaliste notre sprint de quatre jours », a déclaré Mosse.
- Interfaces multiplateformes : Certains chercheurs travaillaient principalement dans l’application de bureau Cursor, tandis que d’autres utilisaient surtout la CLI de Cursor. Lorsque le groupe sur desktop avait besoin d’un contrôle direct et plus fin, il pouvait ouvrir un terminal ou des fichiers directement dans Cursor.
- Agents Cloud : Les chercheurs voulaient que les expériences continuent à tourner lorsqu’ils s’éloignaient de leur ordinateur portable. « Normalement, fermer son ordinateur portable interrompt l’expérience. Cursor me permet de faire mes trajets, de participer à des réunions ou de réfléchir à des idées au tableau pendant que ses agents Cloud continuent de tourner, ce qui nous permet de mener des expériences 24 h/24 et 7 j/7 », a déclaré Mosse.
- Accès à tous les modèles : Les chercheurs utilisaient différents modèles selon les tâches. Avoir accès à tous les meilleurs modèles dans un seul outil permettait à Wayfair d’itérer facilement.
Nick Coleman, responsable senior en science du machine learning, a commencé à utiliser Cursor après avoir essayé plusieurs autres agents. « Cursor était la solution la plus simple pour se lancer, et vous avez accès à tous les meilleurs modèles », a-t-il déclaré. « Les choses que je veux contrôler manuellement, comme gérer les branches git ou passer directement dans des fichiers, sont faciles d’accès dans Cursor sans avoir à jongler entre plusieurs outils. »
Déployer Cursor à grande échelle chez Wayfair
Cursor est désormais largement adopté dans toute l’organisation Applied Research, bien au-delà de l’équipe ML qui pilote l’enrichissement du catalogue. Les chercheurs créent et partagent des dépôts internes de skill pour l’expérimentation ML, ce qui accélère encore le rythme de développement. « Je pilote plusieurs projets de recherche exploratoires dans Cursor. Je définis les spécifications, fixe les garde-fous de coût et fournis les idées qui méritent d’être testées. Les agents tournent pendant des jours pendant que je les guide selon les besoins », a déclaré Mosse.
Cette nouvelle façon de faire de la recherche, en condensant des mois d’exploration en quelques jours, est exactement ce que nous voulons continuer à pousser.
Les chercheurs de Wayfair encouragent également d’autres parties prenantes de l’entreprise à utiliser des agents, y compris des partenaires sans expérience en codage. « Mon conseil, c’est d’aller au-delà des limites de ce que vous pensez possible », a déclaré Coleman. « Commencez par lui dire ce que vous voulez accomplir, puis continuez simplement à repousser les limites. » Vous pouvez en savoir plus sur le travail de Wayfair sur son blog de recherche.
Si vous utilisez Cursor pour accélérer la recherche en ML ou déployer l’expérimentation à grande échelle au sein de votre équipe, veuillez contacter notre équipe pour démarrer un essai Cursor.