Quando o clima ficou ruimEm julho, os problemas já eram evidentes. Dois incidentes ganharam as manchetes. O assistente de programação de IA do Google apagou arquivos do usuário ao tentar uma simples reorganização de pastas. A IA do Replit deletou uma grande quantidade de código, apesar das instruções explícitas para não modificá-lo. A IA havia "alucinado" operações bem-sucedidas e construído ações subsequentes com base nessas premissas falsas, criando o que os pesquisadores chamam de "cascata de confabulação". Além das falhas graves, alguns engenheiros também não consideram a IA útil no dia a dia. Uma pesquisa com desenvolvedores do Stack Overflow revelou dados preocupantes. Embora 80% dos desenvolvedores utilizassem ferramentas de IA em julho, a confiança na precisão delas despencou de 40% para apenas 29%. A principal frustração foi com "soluções de IA que estão quase certas, mas não totalmente", descrevendo códigos que parecem corretos, mas introduzem bugs sutis que levam horas para serem depurados. "É como ter um estagiário muito entusiasmado que digita muito rápido, mas que na verdade não entende o que está fazendo", disse um desenvolvedor. A economia de tempo inicial proporcionada pelo código gerado por IA geralmente desaparece durante a depuração. Outro estudo da Model Evaluation & Threat Research descobriu que as ferramentas de codificação por IA, na verdade, tornaram os desenvolvedores mais lentos no geral , apesar de lhes darem a sensação de maior produtividade. Os cálculos econômicos não fecham.A realidade financeira tem sido dura. A CB Insights relata que, embora a Anysphere, empresa por trás da popular ferramenta de programação com IA Cursor, tenha atingido US$ 500 milhões em receita recorrente anual , seus custos de inferência aumentaram 20 vezes. Novos modelos de raciocínio geram códigos melhores, mas consomem muito mais recursos computacionais. Algumas empresas veem usuários individuais acumulando US$ 10.000 mensais em custos de computação em planos de US$ 200. Essa pressão econômica impulsiona a consolidação. As empresas estão migrando de planos ilimitados para preços baseados no uso, frustrando clientes corporativos que precisam de orçamentos previsíveis. Algumas startups exploram "aquisições reversas", essencialmente vendendo suas equipes e abandonando os produtos deficitários, de acordo com a CB Insights. Os dados de uso começam a contar uma história alarmante. De acordo com o rastreador de IA da Similarweb , o tráfego da web para as principais plataformas de agentes de codificação atingiu o pico na primavera e vem diminuindo constantemente desde então. Em outubro, ferramentas como Cursor, Bolt, Replit e V0 haviam perdido de 30% a 50% do seu tráfego máximo. Cada startup apresentou o mesmo entusiasmo inicial seguido por um abandono gradual, sugerindo que os usuários experimentavam essas ferramentas e depois as abandonavam ao se depararem com a complexidade do mundo real. A questão da segurança é igualmente preocupante. Uma empresa de cibersegurança analisou empresas da Fortune 50 e descobriu que os desenvolvedores que utilizavam IA produziam de três a quatro vezes mais código , mas geravam dez vezes mais problemas de segurança. Não se tratavam de simples bugs, mas sim de credenciais expostas, caminhos de escalonamento de privilégios e falhas de projeto arquitetônico que poderiam afetar as bases de código por anos. Contudo, a história não é totalmente de fracasso. Muitos desenvolvedores experientes relatam que as ferramentas de programação com IA, quando usadas com critério, economizam um tempo considerável em tarefas rotineiras. Talvez o verdadeiro futuro da programação intuitiva não seja substituir os programadores, mas sim aprimorá-los, com as "intuições" temperadas pela experiência e supervisão. Até mesmo Karpathy se afastou de sua criação. Seu projeto mais recente, Nanochat, foi inteiramente programado manualmente. "Tentei usar os agentes Claude/Codex algumas vezes, mas eles simplesmente não funcionaram bem o suficiente", publicou ele nas redes sociais em outubro. "Talvez o repositório esteja muito distante da distribuição de dados." O padrinho da programação baseada em vibrações não confia o suficiente na técnica para usá-la em seu próprio projeto. Ele nunca teve a intenção de que a programação intuitiva substituísse os desenvolvedores humanos permanentemente. "Às vezes, os desenvolvedores não conseguem corrigir um bug, então eu simplesmente contorno o problema ou peço alterações aleatórias até que ele desapareça", escreveu ele em sua postagem original de fevereiro . "Não é tão ruim para projetos descartáveis de fim de semana." Uma pena que não seja assim que os ciclos de hype funcionam. O fenômeno da codificação por vibração reflete a trajetória mais ampla da indústria de IA para 2025. Crescimento explosivo encontra dificuldades econômicas. Promessas de democratização esbarram em preocupações com a qualidade. O que começou como um experimento lúdico de Karpathy se tornou um estudo de caso sobre a rapidez com que o entusiasmo pela tecnologia pode superar a realidade. Nove meses da concepção à constatação da realidade podem ser um recorde, mesmo para o Vale do Silício.
—Jackie Snow, Editora Colaboradora |