Itaú tem 150 IAs em produção e 88% dos pilotos do mercado morrem antes

Em janeiro de 2026 o Itaú anunciou um número que merece ser lido devagar: 150 soluções de IA generativa em produção, com uso interno crescendo 141% no ano. O Bradesco, na mesma temporada, contabilizou mais de 600 casos de uso e uma assistente que resolve 87% das interações sozinha, em mais de 25 milhões de atendimentos. O Brasil, segundo a indústria, lidera a adoção de IA agêntica na América Latina.

Agora o outro lado da estatística, que quase ninguém coloca no mesmo slide: uma pesquisa de março de 2026 mediu que, para cada 33 protótipos de IA construídos, apenas 4 chegam à produção. Isso é uma taxa de mortalidade de 88%. A Gartner foi além e projetou que mais de 40% dos projetos de IA agêntica serão cancelados até o fim de 2027, por custo fora de controle, valor de negócio difuso e controle de risco fraco.

Então temos duas verdades convivendo: bancos colocando centenas de IAs pra rodar, e o mercado geral enterrando 9 em cada 10 iniciativas antes de elas verem um cliente. A pergunta certa não é qual modelo o Itaú usa. É o que o Itaú faz de diferente do piloto que morreu. E a resposta, quando você abre a caixa, não tem quase nada a ver com o modelo de IA.

O modelo virou commodity. O que mata o projeto é o entorno

Vale dizer o que ninguém quer ouvir num pitch: o modelo de linguagem é a parte mais fácil e mais barata da equação. Claude, Gemini, GPT, todos disponíveis por API, todos competentes, todos a um cartão de crédito de distância. Se a inteligência fosse o gargalo, a taxa de sucesso seria proporcional ao tamanho do modelo. Não é.

Quando você lê o diagnóstico dos 88% que falham, três causas se repetem e nenhuma delas é o modelo errou:

Lacuna de avaliação (64% dos líderes): a empresa não tem como medir se o agente está acertando. Sem métrica, o piloto vira fé. E fé não passa por um comitê de risco.
Atrito de governança (57%): ninguém definiu quem responde quando o agente erra, que dado ele pode tocar, em que ponto um humano precisa aprovar. O projeto trava no jurídico, não na engenharia.
Confiabilidade e dado podre (51%): a base que alimenta o agente está suja, fragmentada ou desatualizada. O modelo é tão bom quanto o processo que o abastece, e a maioria dos processos é uma colcha de retalhos de planilha.

O recado de uma frase: a IA não falha por ser burra. Falha porque a empresa não sabia medir, não sabia quem responde e não tinha o dado limpo. Isso é problema de gestão, não de tecnologia.

O que o Bradesco construiu antes de escalar (e o que isso te ensina)

O detalhe mais importante do anúncio do Bradesco passou batido na maioria das manchetes. Pra chegar a 600 casos, o banco construiu uma plataforma interna de orquestração e governança antes de sair distribuindo agentes. Ou seja: a primeira coisa que a maior referência de IA do varejo bancário brasileiro fez não foi treinar um modelo. Foi montar o trilho: catálogo de casos, controle de quem aprova, medição de resolutividade, governança de dado.

Traduzindo pra uma empresa de 50, 100, 300 pessoas: você não tem orçamento pra construir uma plataforma como a do Bradesco. Mas tem que ter os mesmos quatro trilhos, na sua escala:

Um caso de uso com dono. Não vamos usar IA. E sim: o Fulano é responsável por reduzir o tempo de resposta do SAC de 4h pra 30min usando triagem automática, e a meta é medida toda sexta.
Uma métrica antes do piloto. Se você não sabe o número de hoje, não tem como provar que a IA melhorou nada. Meça o baseline primeiro, sempre.
Uma regra de aprovação humana. Defina o que o agente faz sozinho e o que ele só sugere pra um humano bater o martelo. Isso é o que destrava o comitê de risco e o que evita a manchete ruim.
Um dado limpo na entrada. Antes de plugar IA no processo, arrume o processo. Se o cadastro do cliente está em três lugares diferentes, o agente vai errar com confiança.

Agent washing: metade do que te vendem como agente não é agente

Tem um segundo motivo, mais cínico, pra essa mortalidade toda. A Gartner cunhou o termo agent washing: de milhares de fornecedores que se anunciam como IA agêntica, a consultoria estima que só cerca de 130 entregam de verdade capacidade agêntica. O resto é chatbot velho, RPA antigo ou assistente de FAQ com etiqueta nova e preço de lançamento.

Pra quem decide compra numa PME, isso é uma armadilha cara. Você assina um agente de atendimento autônomo, descobre três meses depois que é uma árvore de decisão glorificada, e o projeto entra na estatística dos 88%, sem culpa nenhuma da sua equipe. A defesa é simples e desconfortável: peça pra ver o agente errar. Pergunte como ele é avaliado, o que acontece quando a entrada é ambígua, quem responde pelo erro. Fornecedor sério responde na hora. Fornecedor de agent washing muda de assunto.

Em 2026, a pergunta que separa quem ganha dinheiro de quem só queima orçamento não é: sua ferramenta tem IA. É: como sua ferramenta é medida quando a IA erra.

Governança não é uma camada só, e a Gartner avisou

Tem uma sutileza que vale destacar, porque ela derruba a solução preguiçosa. Em maio de 2026, a Gartner publicou um alerta específico: aplicar uma governança uniforme sobre todos os agentes leva ao fracasso. Traduzindo: tratar o agente que responde uma dúvida de horário de funcionamento com o mesmo rigor do agente que aprova um pagamento é matar os dois. Um morre de excesso de trava; o outro morre de falta dela.

Isso é exatamente o tipo de calibragem que uma empresa pequena consegue fazer melhor que um banco, se decidir fazer. Você conhece seus processos um a um. Sabe qual decisão é reversível (responder um e-mail errado, dá pra corrigir) e qual é irreversível (transferir dinheiro, conceder desconto, demitir). A regra de ouro: quanto mais irreversível a ação, mais o humano fica no circuito. Agente sozinho no reversível, humano no martelo do irreversível.

A conta que ninguém faz na hora de comprar

Existe um custo silencioso que derruba muito piloto e quase nunca entra na planilha de decisão: o custo de manter o agente vivo depois que ele entra no ar. Um modelo de linguagem não é como um software tradicional que você instala e esquece. Ele consome tokens a cada chamada, e quanto mais contexto você joga nele (histórico do cliente, base de conhecimento, regras), mais cara fica cada interação. Multiplicado por milhares de atendimentos, isso vira uma conta de custo variável que cresce com o sucesso, ao contrário de quase todo software que você conhece.

Os bancos aguentam essa conta porque cada interação automatizada substitui um custo de atendimento humano muito maior, e eles medem isso com precisão de centavo. A PME que entra sem medir descobre tarde que o agente ficou mais caro que o estagiário que ele ia substituir, porque ninguém calculou o custo por interação nem comparou com o baseline. É a mesma armadilha da lacuna de avaliação, só que pelo lado da despesa.

A defesa é a mesma disciplina de sempre: antes de assinar, faça a conta do custo por interação no volume real que você tem, projete pro volume de pico, e compare com o custo atual do processo manual. Se a IA não ganhar com folga nessa comparação, o caso de uso está errado, ou a etapa escolhida está errada. Não é fracasso da tecnologia; é fracasso de quem comprou sem medir. E é exatamente por isso que os 12% que sobrevivem começam por um único processo com número claro, em vez de comprar uma plataforma genérica que promete fazer tudo.

Por onde a PME brasileira começa de verdade

Se eu tivesse que resumir o que separa os 12% que chegam à produção, seria isto: eles trataram IA como um problema de operação, não como um projeto de tecnologia. Começaram pequeno, num processo que já entendiam, com métrica antes do piloto e regra de aprovação clara. Não compraram transformação. Compraram um gargalo resolvido.

É por essa lógica que desenhamos o facilita.ia: não como mais um chatbot pra empilhar na sua pilha de ferramentas, e sim acoplado aos processos de qualidade e gestão que você já precisa controlar (norma, indicador, não conformidade, ação corretiva). A IA entra onde existe um dado limpo e uma decisão com dono, que é exatamente o terreno onde ela não vira estatística de fracasso. O assistente sugere, registra e cruza; a pessoa aprova. É a calibragem que a Gartner está pedindo, embutida no produto.

O ponto final é quase chato de tão simples: a IA não vai te salvar de um processo que você não controla. Ela amplifica o que já existe. Empresa organizada coloca 150 IAs no ar; empresa desorganizada queima 9 pilotos em 10 e culpa o modelo. O modelo está ótimo. O que falta é o trilho. E o trilho você constrói antes, com método, do jeito que sempre se construiu qualidade: medindo, definindo responsável e arrumando o dado na entrada.

Comece por um processo. Meça o baseline. Defina quem aprova. Só então plugue a IA. É menos vistoso que revolução, mas é o caminho dos 12% que sobrevivem.

Klaus Fuchs Founder da facilita.etc. 15+ anos liderando gestão estratégica em saúde, educação e organizações sociais. Conduziu acreditações em uma das maiores OSS do Brasil. Escreve sobre o que pratica.

Quer aplicar isso na sua organização?

Em 5 minutos, faça um diagnóstico de prontidão e descubra onde sua operação ganha em organização, compliance e gestão.

Diagnóstico de prontidão Falar com a gente

O modelo virou commodity. O que mata o projeto é o entorno

O que o Bradesco construiu antes de escalar (e o que isso te ensina)

Agent washing: metade do que te vendem como agente não é agente

Governança não é uma camada só, e a Gartner avisou

A conta que ninguém faz na hora de comprar

Por onde a PME brasileira começa de verdade

Quer aplicar isso na sua organização?

Gostou? Receba isso toda segunda.