O Boom da IA Tem uma Conta a Pagar: Ela Está Chegando Antes da Produtividade

Learning Valley

16 de junho de 2026 por

Daniel Couto Bergantini

| Nenhum comentário ainda

O ano em que a euforia encontrou a planilha de custos

Em 2023 e 2024, a narrativa dominante sobre IA generativa era de escassez de demanda: hyperscalers investiam centenas de bilhões de dólares em infraestrutura, mas a receita real ainda não acompanhava o ritmo. Em 2025, com a chegada de agentes autônomos como Claude Code e Codex, a história se inverteu — a demanda passou a superar a oferta de computação, e os servidores das grandes labs chegaram a operar no limite.

Mas em 2026, um terceiro capítulo começou a se escrever, e é o que interessa diretamente a qualquer empresa que está avaliando como (e quanto) investir em IA: a fase do "espera, isso vale o que estamos pagando?"

O caso mais emblemático é o da Uber. Segundo reportagem do The Information, o CTO da companhia, Praveen Neppalli Naga, revelou que a empresa esgotou o orçamento anual de IA para times de engenharia em apenas quatro meses — depois de ter incentivado agressivamente a adoção via rankings internos e metas de uso. A Microsoft, por sua vez, começou a restringir o acesso ao Claude Code e empurrar engenheiros para sua própria ferramenta interna (GitHub Copilot CLI), oficialmente por estratégia de produto, mas, segundo fontes do The Verge, principalmente porque o custo havia se tornado insustentável diante de ganhos de produtividade que não apareceram na mesma proporção.

Esses não são casos isolados de má gestão. São o resultado lógico de um fenômeno técnico-econômico que toda empresa — inclusive PMEs brasileiras — precisa entender antes de assinar o próximo contrato de licenças de IA: a economia dos agentes é fundamentalmente diferente da economia dos chatbots.

Por que agentes custam ordens de grandeza mais que chatbots

A diferença entre um chatbot e um agente não é apenas de interface. Um chatbot recebe uma pergunta e devolve uma resposta — uma transação. Um agente opera em loop: planeja, chama ferramentas, recupera resultados, atualiza o contexto e planeja novamente. Cada volta desse loop consome tokens, a unidade de computação que as plataformas de IA cobram.

De acordo com dados da SemiAnalysis citados pelo jornalista Derek Thompson, uma tarefa típica de agente consome cerca de 96 mil tokens antes de produzir uma resposta — mais texto do que o romance completo "O Grande Gatsby". A Tom's Hardware reporta que sistemas agênticos podem consumir até mil vezes mais tokens do que uma consulta padrão a um LLM,

dependendo do número de etapas necessárias para cumprir a instrução. O Goldman Sachs projeta que o consumo de tokens por IA agêntica pode crescer 24 vezes até 2030.

O resultado prático: segundo a Ramp, o gasto médio das empresas com tokens de IA já é 13 vezes maior do que era em janeiro de 2025. Em alguns casos documentados, o gasto mensal de uma única empresa em tokens superou o custo de uma equipe inteira de engenheiros seniores — exatamente a categoria de profissionais que a IA prometia substituir.

O erro de origem: confundir "uso de IA" com "produtividade"

Para justificar esse gasto crescente, várias empresas adotaram uma lógica perigosa: criar métricas internas que recompensam o volume de uso de IA, não o resultado. Na Meta, surgiram rankings internos medindo o consumo de tokens por equipe. Na Amazon, segundo reportagens, funcionários admitiram usar IA para tarefas desnecessárias apenas para inflar os indicadores de adoção — prática que passou a ser chamada de "tokenmaxxing".

O efeito colateral foi medido pela Faros AI: sob alta adoção de IA agêntica, o "code churn" — a proporção de linhas de código deletadas em relação às adicionadas — aumentou mais de 800%. Em outras palavras, a IA gerou muito código, mas boa parte dele teve que ser descartado ou refeito. Mais trabalho, não menos.

Esse é o ponto central que qualquer liderança precisa internalizar: tokens consumidos não são uma proxy de valor entregue. Uma empresa pode estar gastando fortunas em IA e, simultaneamente, gerando mais retrabalho do que produzia antes — um padrão que o CEO da Box, Aaron Levie, chamou de uma espécie de "psicose de IA" coletiva entre executivos: a crença de que mais IA é sempre melhor, que todo código gerado por um agente está pronto para produção, e que todo protótipo é uma ideia de um bilhão de dólares.

Os números que ninguém vê na fatura de energia (mas que voltam como inflação)

Há ainda uma camada macroeconômica que amplifica o problema, e que vale entender mesmo que sua empresa nunca tenha rodado um agente: o custo da infraestrutura de IA está sendo, em parte, transferido para toda a cadeia de consumo.

Segundo o Goldman Sachs, os preços de eletricidade nos EUA subiram 6,9% em 2025 — mais que o dobro da inflação geral —, impulsionados pela demanda de data centers, que já respondem por 40% do crescimento da demanda elétrica americana. Em regiões com alta concentração de data centers, os preços de energia no mercado de curto prazo chegaram a subir 267% em cinco anos, segundo a Bloomberg.

O mesmo movimento acontece com memória. Os preços contratuais de DRAM subiram entre 80% e 95% em um único trimestre, conforme TrendForce e Counterpoint Research, à medida que fabricantes como Samsung, SK Hynix e Micron realocam capacidade para chips de

memória de alto desempenho usados em servidores de IA. A IDC projeta aumentos de 10% a 20% nos preços de notebooks, tablets e smartphones até o fim de 2026.

O ponto não é alarmismo — é contexto. Os custos operacionais de IA não vivem isolados em uma linha de orçamento de TI; eles se propagam pela estrutura de custos de toda a economia, inclusive da sua empresa, via energia, hardware e serviços de nuvem. Ignorar essa dinâmica ao planejar investimentos em IA é planejar com dados incompletos.

A pergunta certa não é "a bolha vai estourar?"

É tentador interpretar esses sinais — cortes de licença, orçamentos estourados, pilotos fracassados — como prova de que a IA é um modismo superestimado. Mas essa leitura erra o alvo.

O estudo "The GenAI Divide", do Project NANDA do MIT, é o dado mais relevante aqui: apesar de US$ 30 a 40 bilhões em investimento corporativo em IA generativa, 95% dos pilotos empresariais não geraram nenhum impacto mensurável no resultado financeiro. Apenas 5% extraíram valor significativo. E o próprio MIT foi claro sobre a causa: o problema não está nos modelos, está na integração organizacional — fluxos de trabalho mal desenhados, governança ausente, e a confusão entre "ferramenta disponível" e "processo redesenhado".

Doug O'Laughlin, da SemiAnalysis, oferece a moldura histórica mais útil: toda tecnologia nova passa por um ciclo de (a) pouco investimento, seguido de (b) investimento excessivo, seguido de (c) correção exagerada para baixo, repetido até que as organizações encontrem o equilíbrio certo entre custo de mão de obra e custo de tecnologia. Estamos, claramente, na fase (b) virando (c) em várias empresas — e isso não invalida a tecnologia. Invalida a forma como ela foi adotada.

Por que "substituir pessoas por IA" continua sendo a aposta errada

A narrativa de substituição direta — "vamos demitir e automatizar" — é a que mais aparece em manchetes, e é também a que os próprios dados desmentem com mais força.

Primeiro, porque o custo real de operar IA em escala já supera, em diversos casos documentados, o custo da folha de pagamento que ela substituiria. Bryan Catanzaro, vice-presidente da Nvidia para deep learning aplicado, resumiu o paradoxo à Axios: "Para o meu time, o custo de computação está muito além do custo dos funcionários." Empresas que demitiram em massa apostando em IA — Meta cortou cerca de 8 mil posições enquanto comprometia mais de US$ 100 bilhões em infraestrutura de IA — estão descobrindo que a conta de "automated intelligence" (como O'Laughlin a chama) é uma nova categoria permanente de custo operacional, não um substituto barato de gente.

Segundo, e mais importante para a arquitetura de qualquer negócio: a IA agêntica funciona melhor como multiplicador de capacidade dentro de um processo desenhado por humanos, não como substituto autônomo de julgamento humano. Quando uma empresa tenta remover completamente a supervisão humana de um fluxo de trabalho complexo — atendimento ao cliente de alto risco, decisões de crédito, entrega logística — o resultado mais comum não é eficiência, é erro caro. Um exemplo recente e concreto: a rede Pizza Hut enfrentou um processo de US$ 100 milhões de franqueados depois que um sistema de entrega operado por IA fez os tempos de entrega saltarem de menos de 30 minutos para mais de 45.

A lição estrutural é simples: IA que substitui humanos em processos em que o erro não pode ser corrigido (cliente final) tende a transferir o custo do erro para o cliente — e o cliente devolve esse custo em forma de reputação, churn ou litígio. IA que aumenta a capacidade humana em processos internos, repetitivos e bem definidos, tende a gerar ganho real e mensurável.

É esteticamente atraente ver um agente de IA realizando ligações de prospecção, qualificando leads como um SDR ou respondendo tickets de suporte com fluência de linguagem natural. O problema é que ninguém está colocando na mesma tela, ao lado da demonstração, as duas perguntas que deveriam preceder qualquer decisão de implantação: qual é a taxa de conversão desse agente comparada a um profissional humano com treinamento adequado? E qual é o custo-benefício real da automação quando se contabiliza o custo por token, a taxa de erro, o custo de retrabalho e o impacto na percepção do cliente? A resposta honesta, hoje, é que em vendas consultivas, SDR de médio-alto ticket e suporte de exceção — contextos que exigem leitura de nuance, gestão de objeção e construção de vínculo — os números raramente fecham a favor da substituição completa. Pode ser que, em dois ou três anos, com modelos mais capazes e custos de inferência menores, essa equação mude. Mas tomar decisões de arquitetura organizacional com base em onde a tecnologia talvez chegue, e não em onde ela está, é exatamente o erro que produziu os orçamentos estourados de 2026.

Onde a IA realmente entrega ROI — segundo os dados, não segundo o hype

A análise da McKinsey para 2026 identificou ganhos de produtividade equivalentes a receita de 2,8% a 4,7% no setor bancário e financeiro, e de 2,6% a 4,5% em farmacêutica e indústria avançada — números modestos, mas reais e mensuráveis. O padrão que se repete nos casos de sucesso do próprio estudo do MIT é consistente: os projetos que funcionam são operacionais e estreitos — automação de código, processamento de documentos, triagem inicial, conciliação de dados — não os projetos de "visibilidade" amplos e ambiciosos que dominam a lista dos pilotos fracassados.

Para uma PME que está estruturando sua arquitetura empresarial e decidindo onde investir em IA, essa distinção é o ponto de partida de qualquer roadmap responsável. Existem, na prática, três zonas de adoção com perfis de risco e retorno muito diferentes:

Zona 1 — Núcleo operacional interno (alta prioridade). Processos internos, repetitivos, com regras claras e supervisão humana já existente: triagem e classificação de documentos, primeira versão de relatórios, reconciliação de dados entre sistemas, geração de rascunhos de contratos ou propostas, suporte a desenvolvimento de software com revisão de código por humanos, análise exploratória de dados antes da tomada de decisão. Aqui, o erro da IA é barato — é revisado antes de impactar qualquer parte externa — e o ganho de velocidade é direto.
Zona 2 — Atividades de marketing e comerciais com supervisão (prioridade média, com governança). Pontos de contato com cliente ou fornecedor onde a IA atua como copiloto, não como substituto: rascunhos de resposta de atendimento revisados por um humano antes do envio, pré-qualificação de leads que um vendedor confirma, geração de conteúdo de marketing revisado por um responsável de marca. O valor existe, mas exige um ponto de checagem humana explícito no processo — exatamente o tipo de governança que o MIT identificou como ausente nos 95% de pilotos que falharam.
Zona 3 — Decisões autônomas voltadas ao cliente final (baixa prioridade, alto risco). Substituição completa de julgamento humano em interações com consequência direta para o cliente — aprovação automática de crédito, despacho logístico sem supervisão, atendimento que decide reembolsos ou cancelamentos sem revisão. É exatamente essa zona que produziu os casos mais caros de fracasso público, porque o custo de um erro de borda não fica contido na empresa — ele se propaga para o cliente, e o cliente devolve esse custo amplificado.

A regra geral, portanto, se inverte em relação ao que o marketing de muitas plataformas sugere: comece de dentro para fora, não de fora para dentro. O núcleo operacional é onde a IA tem o maior retorno por dólar investido e o menor risco reputacional — e é, paradoxalmente, a zona que recebe menos atenção estratégica, porque não é "visível" para clientes ou investidores.

Tendência real para 2026 em diante: trabalho em conjunto, não substituição

O consenso que está emergindo entre os analistas que acompanham essa transição de perto — e que o caso da Uber e da Microsoft ilustra de forma involuntária — não é "menos IA", é "IA mais bem governada". As empresas que recuaram não abandonaram a tecnologia; recalibraram o uso, voltando a tratar agentes como ferramentas que operam sob supervisão humana definida, com escopo limitado e métricas de resultado (não de consumo).

Para uma PME, isso se traduz em uma recomendação de arquitetura concreta: antes de expandir o uso de IA, mapeie seus processos internos por dois critérios — (1) o custo de um erro nesse processo é contido internamente ou se propaga para fora da empresa? e (2) existe hoje um ponto de revisão humana nesse processo, ou a IA estaria operando sem rede de segurança? Processos que combinam "erro contido" e "revisão humana existente" são candidatos imediatos à automação com IA. Processos que combinam "erro propagado externamente" e "ausência de revisão" são candidatos a pilotos controlados, não a implantação ampla — independentemente de quão impressionante seja a demonstração da ferramenta.

A conta de 2026 está sendo apresentada às empresas que pularam essa etapa. A oportunidade, para quem ainda está desenhando sua arquitetura de adoção, é não repetir o mesmo erro de origem: tratar IA como substituto de gente, em vez de tratá-la como o que ela realmente é — uma nova camada de capacidade operacional, que só gera retorno quando integrada a um processo desenhado, com governança, por humanos.

Fontes: Derek Thompson (derekthompson.org), Tom's Hardware, Outlook Business, AI2Work, e dados citados de SemiAnalysis, Goldman Sachs, MIT Project NANDA, McKinsey, Ramp, Faros AI e Bloomberg.

Daniel Couto Bergantini 16 de junho de 2026

Faça login para deixar um comentário

O Maior Equívoco das Empresas ao Implantar um ERP

Learning Valley