clientes

Como a Wayfair reduziu os custos de modelos de ML em 90% (duas vezes!) com o Cursor

Com o Cursor assumindo a execução dos experimentos, a Wayfair condensou meses de pesquisa em ML em dias. Cinco pesquisadores testaram mais de 110 variantes de modelo e reduziram em 94% os custos do modelo de validação de tags.

7 min de leitura

A equipe de Pesquisa Aplicada da Wayfair usa o Cursor para condensar meses de pesquisa em aprendizado de máquina e IA aplicada em questão de dias. No fim de 2025, os pesquisadores já executavam mais de 20 agentes em paralelo. Isso permitiu que uma equipe de cinco pessoas testasse 110 variantes de modelo em um sprint de experimentação de quatro dias e reduzisse em 94% os custos de inferência de um fluxo de trabalho essencial de enriquecimento de catálogo de e-commerce. Em março de 2026, a equipe repetiu a mesma estratégia com os modelos mais recentes no Cursor, reduzindo os custos em mais 90%.

O Cursor mudou a forma como a pesquisa em ML funciona na Wayfair. Os pesquisadores da Wayfair impulsionam as melhorias dos modelos: formulando hipóteses, interpretando resultados e refinando as ideias mais promissoras. O Cursor cuida da implementação: desenvolvendo experimentos, integrando-os ao framework de testes e medindo os resultados.

Validando dados de atributos de produtos com base no maior catálogo de produtos para o lar do mundo

Cada produto no catálogo da Wayfair é descrito por "tags" estruturadas que indicam materiais, dimensões, cor e outros atributos. Mais de 47.000 tags de atributos distintas viabilizam a busca, a filtragem, as recomendações, o posicionamento de produtos e a publicidade para dezenas de milhões de produtos.

A equipe de IA Aplicada da Wayfair desenvolveu um modelo de validação que audita cada tag com base em imagens, descrições e avaliações de clientes na página do produto. O modelo era preciso, mas caro demais para executar em grandes partes do enorme catálogo de produtos da Wayfair.

Nosso objetivo era tornar o modelo viável em termos de custo para executá-lo em um dos maiores catálogos de produtos para o lar do mundo.

Guillermo Mosse
Cientista Sênior de Machine Learning, Wayfair

Para alcançar esse objetivo, a equipe precisava explorar um amplo espaço de design, incluindo diferentes LLMs, estratégias de pré-processamento de entrada, prompts, estruturas de saída e métodos de avaliação. Implementar manualmente centenas de combinações teria levado meses.

Em vez disso, a Wayfair usou o Cursor para automatizar e paralelizar o ciclo de experimentação. Em dezembro de 2025, a equipe realizou uma sprint de experimentação de quatro dias para avançar em direção às suas metas de redução de custos. Com o Cursor cuidando da camada de implementação, cinco pesquisadores desenvolveram e testaram 110 variantes de modelo substancialmente distintas. A arquitetura vencedora reduziu os custos de inferência em 94% e, ao mesmo tempo, melhorou a precisão do modelo, entrando em produção como a linha de base de validação de tags da Wayfair.

Pesquisadores da Wayfair validando dados de atributos de produtos com o CursorPesquisadores da Wayfair validando dados de atributos de produtos com o Cursor

A parte mais lenta da pesquisa é desenvolver e avaliar cada experimento manualmente. Automatizamos esse ciclo e deixamos o Cursor implementar e executar cada experimento, então o que teria levado meses coube em quatro dias.

Guillermo Mosse
Cientista Sênior de Machine Learning, Wayfair

Delegando a execução de experimentos ao Cursor

Antes de desenvolver variantes de modelo, a equipe padronizou como o Cursor executaria e mediria os experimentos: cada variante era executada no mesmo conjunto de dados de teste e no mesmo benchmark de avaliação para medir a performance. Com o framework de testes e avaliação definido como um fluxo de trabalho automatizado no Cursor, os pesquisadores puderam se concentrar inteiramente em explorar o design dos experimentos: alterando modelos, reescrevendo prompts, reestruturando saídas ou repensando como as imagens eram selecionadas.

"Havia muitos graus de liberdade: modelos, prompts, estrutura de saída, seleção de imagens. Com as Automações do Cursor em funcionamento, eu me concentrei em explorar o espaço de design", disse Guillermo Mosse, um cientista sênior de machine learning. "Eu descrevia uma ideia, às vezes usando o modo de voz para falar por 5 minutos seguidos, e o Cursor colocava a variante para rodar, executava a eval e publicava os resultados. O framework cuidava da amostragem de dados, da avaliação e do relatório de métricas que tornavam as comparações confiáveis."

O Cursor mudou o gargalo de 'Quanto tempo isso vai levar para ser desenvolvido?' para 'Qual é a próxima ideia que vale a pena testar?' Esse é um uso muito melhor da atenção de um cientista.

Omer Lang
Cientista Sênior de Machine Learning, Wayfair

Isso permitiu que os pesquisadores passassem de uma ideia para um experimento ativo em menos de 30 minutos.

Pesquisadores da Wayfair delegando a execução de experimentos ao CursorPesquisadores da Wayfair delegando a execução de experimentos ao Cursor

Os pesquisadores passavam a maior parte do tempo pensando no que tentar em seguida, revisando os resultados e decidindo quais ideias valiam mais uma rodada. O Cursor escrevia e executava cada variante, destacando as mais promissoras para analisarmos.

Guillermo Mosse
Cientista Sênior de Machine Learning, Wayfair

Em março de 2026, a Wayfair realizou outra sprint de experimentação, desta vez comparando com o modelo de dezembro em produção como a nova linha de base. Com o framework já maduro, engenheiros juniores sem nenhuma experiência prévia com validação de tags estavam entregando variantes inéditas de modelo já no primeiro dia. Os pesquisadores executaram mais de 140 novos experimentos e aplicaram buscas com algoritmos genéticos sobre os candidatos mais promissores para a otimização final. O resultado: mais uma redução de 90% nos custos.

Resultados da sprint de experimentação de março da WayfairResultados da sprint de experimentação de março da Wayfair

Cursor como base para pesquisa de ML orientada por agentes

Algumas capacidades foram essenciais na forma como a Wayfair conduziu os experimentos:

  • Paralelização escalável de agentes: Os pesquisadores frequentemente executavam mais de 20 agentes do Cursor em paralelo durante o sprint de experimentação. "Executar muitas variantes ao mesmo tempo no Cursor foi simples e fácil. Isso tornou viável nosso sprint de quatro dias", disse Mosse.
  • Interfaces multiplataforma: Alguns pesquisadores trabalhavam principalmente no app para desktop do Cursor, enquanto outros usavam a CLI do Cursor. Quando o grupo do desktop precisava de controle direto e de baixo nível, podia abrir um terminal ou arquivos diretamente no Cursor.
  • Agentes na nuvem: Os pesquisadores queriam que os experimentos continuassem rodando quando se afastavam de seus laptops. "Normalmente, fechar o laptop interrompe o experimento. O Cursor me permite me deslocar, participar de reuniões ou rabiscar ideias em um quadro enquanto seus agentes na nuvem continuam rodando, o que nos permite executar experimentos 24 horas por dia, 7 dias por semana", disse Mosse.
  • Acesso a todos os modelos: Os pesquisadores recorriam a modelos diferentes para tarefas diferentes. Ter acesso a todos os melhores modelos em uma única ferramenta facilitava a iteração para a Wayfair.

Nick Coleman, um gerente sênior de ciência de machine learning, começou a usar o Cursor depois de experimentar vários outros agentes. "O Cursor foi o mais fácil de começar a usar, e você tem acesso a todos os melhores modelos", disse ele. "As coisas que quero controlar manualmente, como gerenciar branches do git ou abrir arquivos, são fáceis de acessar diretamente no Cursor sem precisar alternar entre ferramentas."

Expandindo o uso do Cursor na Wayfair

O Cursor agora está amplamente adotado em toda a organização de Pesquisa Aplicada, muito além da equipe de ML responsável pelo enriquecimento de catálogo. Pesquisadores estão criando e compartilhando repositórios internos de habilidades para experimentação em ML, acelerando ainda mais o ritmo de desenvolvimento. "Tenho gerenciado vários projetos de pesquisa exploratórios no Cursor. Defino a especificação, estabeleço os limites de custo e insiro as ideias que valem a pena testar. Os agentes ficam executando por dias enquanto eu direciono conforme necessário", disse Mosse.

Essa nova forma de fazer pesquisa, condensando meses de exploração em dias, é algo que queremos continuar levando adiante.

Guillermo Mosse
Cientista Sênior de Machine Learning, Wayfair

Os pesquisadores da Wayfair também estão incentivando outras áreas da empresa a usar agentes, incluindo parceiros sem experiência em programação. "Meu conselho é ir além dos limites do que você acha possível", disse Coleman. "Comece dizendo a ele o que você quer realizar e depois continue ampliando esse limite." Você pode ler mais sobre o trabalho da Wayfair no blog de pesquisa.


Se você está usando o Cursor para acelerar a pesquisa em ML ou escalar a experimentação na sua equipe, entre em contato com nossa equipe para iniciar um teste do Cursor.

Publicado em: clientes

Autor: Cursor Team