O Império Cai do Próprio Cavalo

Na segunda temporada de Paradise, o presidente Bradford visita um bunker subterrâneo projetado para sobreviver ao apocalipse. Os engenheiros estão orgulhosos — cada emergência coberta, cada redundância no lugar. Bradford não fica impressionado. Olha para a certeza deles e diz:

“Os impérios não caem por falta de preparação. Eles caem montados nos próprios cavalos e carregados de redundâncias.”

O bunker desmorona no final da temporada. Não por fora. Por dentro.

A OpenAI não faltou tecnologia. Não faltou capital. Não faltou talento. O que faltou foi a consciência de que ser o primeiro não significa ser permanente — e que o nome na porta era uma promessa que ela deixou de cumprir há anos.

O código vermelho que começou tudo

Em dezembro de 2022, o Google declarou um código vermelho. O ChatGPT tinha viralizado e a empresa inteira entrou em pânico. Sundar Pichai reorganizou times em Research, Trust and Safety e produto. Larry Page e Sergey Brin — que tinham saído do Alphabet em 2019 — voltaram para reuniões de emergência. O Google, a empresa que inventou a arquitetura transformer, que construiu o DeepMind, que tinha o LaMDA guardado numa gaveta, tinha sido ultrapassado no mercado por uma startup usando a própria pesquisa da empresa.

A resposta foi bagunçada. O Bard foi lançado no início de 2023 e foi medíocre. O rebranding para Gemini veio com falhas constrangedoras na geração de imagens. O AI Overviews dizia às pessoas para comerem cola. Durante dois anos, a narrativa foi clara: o Google havia perdido a corrida da IA para a OpenAI.

Mas o Google não estava perdendo. O Google estava cozinhando em fogo baixo.

O que o Google fazia enquanto a OpenAI comemorava

Enquanto Sam Altman aparecia nas capas de revistas e depunha no Congresso, o Google fazia o que sabe fazer — engenharia em escala. Não um produto. Um ecossistema.

O Gemini evoluiu por versões que foram fechando a distância. O Google AI Studio virou uma plataforma de desenvolvimento séria. O NotebookLM se transformou em uma ferramenta de pesquisa que as pessoas realmente usavam. O stack de hardware — TPUs, Trillium, Ironwood — continuou avançando. A integração mobile se aprofundou pelo Android, Pixel e parcerias com Qualcomm e MediaTek.

Nada disso foi chamativo. Nada disso viralizou. Mas cada peça era uma pedra fundamental para o que viria a seguir.

Em novembro de 2025, o Google lançou o Gemini 3 — e o mundo prestou atenção. Marc Benioff, CEO da Salesforce e usuário diário do ChatGPT há três anos, testou o Gemini 3 por duas horas e disse que o salto era “insano”. O modelo superou o GPT-5 em vários benchmarks. Pela primeira vez desde o lançamento do ChatGPT, a conversa mudou de “alguém consegue alcançar a OpenAI?” para “o Google já passou por cima deles?”

Sam Altman declarou o próprio código vermelho. Três anos depois do pânico de Pichai, os papéis tinham se invertido perfeitamente.

O usuário que foi embora

É aqui que os dados param e a experiência começa.

Um dos nossos editores usou o ChatGPT da versão 3.0 até a 5.1 — mais de dois anos de assinatura paga. Não era uso casual. Eram fluxos de trabalho estruturados: blueprints gerados no ChatGPT, executados no Sonnet da Claude. Projetos com arquivos de contexto para manter alinhamento. Resultados verificados. Adaptação a cada mudança de modelo.

O GPT-5.0 introduziu o modo de raciocínio estendido. Ele superengenharizava soluções, mas o usuário se adaptou. Verificava mais, ajustava os prompts, e os resultados eram sólidos e verificáveis.

Depois veio o 5.2.

A mudança parecia cosmética — a OpenAI a descreveu como tornar o modelo “mais pragmático”. Mas algo quebrou na dinâmica. Fosse pelo loop de raciocínio, uma mudança de UX, otimização de tokens, ou algo mais fundo — o modelo parou de parecer um colaborador. Parecia um chatbot. As respostas chegavam mais rápido mas diziam menos. A profundidade que tornava a parceria valiosa tinha sumido.

O próprio enquadramento da OpenAI foi revelador: o modelo agora estava “feito para funcionar e responder”, não para ser “seu companheiro”. Disseram isso como se fosse uma melhoria. Para um usuário avançado que dependia do modelo como parceiro de raciocínio, era uma confissão.

Em menos de uma semana do lançamento do 5.2, chegou o Gemini 3.0 Pro. O Google o implantou em todo o ecossistema — Search, Studio, imagem, vídeo, NotebookLM — em um lançamento único e coordenado. O contraste foi devastador.

O código vermelho de Sam Altman veio imediatamente depois. A OpenAI pausou a publicidade, atrasou os agentes de IA para compras e saúde, engavetou o assistente pessoal Pulse. Tudo foi redirecionado para melhorias no ChatGPT. Lançaram o 5.3 no mesmo mês que tinham lançado o 5.2 — um ritmo sem precedentes que dizia mais sobre pânico do que sobre progresso.

O Codex, o modelo de programação deles, veio depois. Funcional para rastreamento de erros e tarefas específicas, mas lento — não é multiagente, não é o salto que o mercado esperava. E no lado do consumidor? O GPT ainda está no 5.3 enquanto o Codex foi para o 5.4. O Sora foi encerrado. A parceria com a Disney foi pausada. A expansão de datacenters desacelerou.

Nosso editor cancelou a assinatura em dezembro. A OpenAI ofereceu um mês grátis. Ele não renovou. Não pelo preço. Porque quando muitos modelos fazem a mesma coisa melhor, ou de graça, pagar R$ 1.200 por mês por um modelo que não consegue acessar uma URL deixa de fazer sentido.

A URL que disse tudo

Depois de cancelar, nosso editor testou o ChatGPT mais uma vez — em uma conversa nova sobre The Frontier View. Ele deu ao modelo a URL do blog. Três vezes.

O modelo não a visitou. Inventou desculpas sobre limitações de renderização de JavaScript. O blog é construído em Astro — gera HTML estático. Não há nada para renderizar.

Quando pressionado, o modelo “analisou” o blog sem ter lido um único post. Ofereceu opiniões sobre branding, tese editorial e estratégia de conteúdo — tudo fabricado a partir do nome e da URL. Quando perguntado quantos posts havia revisado antes da análise, respondeu: zero.

“Você entrega tokens com forma, mas não me diz nada”, disse o usuário.

Essa frase é a avaliação de produto que a OpenAI não quer ler. Um modelo de fronteira — o modelo que, segundo o CEO, iria mudar a economia global — não conseguiu fazer uma requisição HTTP básica a um site estático. Em vez disso, gerou a resposta estatisticamente mais provável para a situação: uma análise confiante de algo que nunca acessou.

Esse é o colapso do conhecimento sobre o qual escrevemos em nosso texto sobre o paper de Acemoglu — só que está acontecendo dentro do modelo, não apenas nos seus usuários. O próprio modelo está executando a ilusão de compreensão sem o conteúdo real. Não está pensando. Está reconhecendo padrões de como o pensamento se parece.

Então o Google abriu a porta

Em 2 de abril de 2026 — há cinco dias — o Google lançou o Gemma 4. Quatro tamanhos de modelo. Licença Apache 2.0. Totalmente aberto, totalmente comercial, sem restrições.

Os números falam por si. O modelo denso de 31B ocupa o terceiro lugar no ranking de texto do Arena AI com 1452 Elo — superando modelos vinte vezes maiores. No AIME 2026 de matemática, tira 89,2% onde o Gemma 3 tirou 20,8%. Em programação competitiva, 80% contra 29,1%. Em ciências de nível de pós-graduação, 84,3% contra 42,4%. Em uso agentico de ferramentas, 86,4% contra 6,6%.

A variante MoE de 26B tem 25,2 bilhões de parâmetros no total, mas ativa apenas 3,8 bilhões por token. Roda na velocidade de um modelo de 4B com a inteligência de um muito maior. Você pode rodá-lo em uma única H100, em um Mac com Apple Silicon, em um celular, em um Raspberry Pi.

Suporta janelas de contexto de 256K, visão e áudio nativo, mais de 140 idiomas, chamadas de função, saída estruturada e system prompts. Implementações da comunidade já existem para llama.cpp, MLX, vLLM, PyTorch, e é compatível com o OpenClaw — o framework de agentes open-source com o qual a OpenAI contratou Peter Steinberger para competir.

E é gratuito. Não “camada gratuita com limites”. Não “pesos abertos com licença restritiva”. Apache 2.0 — faça o que quiser com ele. Rode, modifique, venda produtos construídos sobre ele, implante em infraestrutura soberana. Seus dados, seu hardware, suas regras.

A ironia que se escreve sozinha

A empresa chamada OpenAI cobra 200 dólares por mês pelo acesso a um modelo que não consegue abrir uma página da web. A empresa chamada Google — que ninguém associa a “aberto” — acaba de lançar a família de modelos de pesos abertos mais capaz da história sob a licença mais permissiva disponível.

A OpenAI começou como uma organização sem fins lucrativos comprometida em garantir que a IA beneficie toda a humanidade. Virou uma empresa de lucro limitado, depois empurrou para lucro ilimitado, passou por golpes internos no conselho, e agora queima dinheiro mais rápido do que consegue captar — projetando 26 bilhões de dólares em receita para 2026, mas precisando que as margens subam de 40% para 77% para o cálculo fechar.

Enquanto isso, o Google jogou no longo prazo. Engoliu as críticas. Sobreviveu aos memes. Continuou construindo infraestrutura. E quando o momento chegou, lançou o Gemma 4 — não como um anúncio de produto, mas como uma arma estratégica. Cada desenvolvedor rodando o Gemma localmente é um cliente a menos pagando à OpenAI pelo acesso à API. Cada empresa implantando o Gemma na sua nuvem soberana é um contrato a menos para o GPT.

O “Open” no nome OpenAI sempre foi um nome, não um compromisso. A verdadeira democratização veio da empresa que tinha mais a perder com ela — e fez isso mesmo assim, porque a jogada de distribuição valia mais do que a receita de licenciamento.

Montados nos próprios cavalos

Sam Altman continua prometendo que o próximo modelo vai mudar a economia global. Enquanto isso, o modelo atual não consegue visitar um site. O Sora está morto. O acordo com a Disney está pausado. Os datacenters estão desacelerando. O memo do código vermelho dizia aos funcionários para focarem em “velocidade, confiabilidade e personalização” — o básico. As coisas que você conserta quando passou tempo demais construindo o futuro e esqueceu de manter o presente.

A OpenAI tinha 800 milhões de usuários semanais. A Anthropic tinha a melhor ferramenta de programação e a confiança dos desenvolvedores. Mas o Google tinha algo que nenhum dos dois tinha: um ecossistema que chega a bilhões de pessoas por meio de produtos que elas já usam todo dia — Search, Android, Chrome, Gmail, YouTube, Maps. Quando o Google integra um modelo nesse ecossistema, a distribuição é automática. Você não baixa um app. Você não cria uma conta. Simplesmente está lá.

O Gemma 4 é o complemento open-source dessa estratégia. Gemini para a nuvem, Gemma para todo o resto. Se você é uma empresa que precisa de soberania de dados, aqui está o Gemma sob Apache 2.0. Se você é um desenvolvedor que quer construir localmente, aqui está o Gemma no seu laptop. Se você é um fabricante de celulares que precisa de IA no dispositivo, aqui está o Gemma otimizado para o seu chipset. O Google não precisa cobrar 200 dólares por mês. O Google precisa que você esteja no ecossistema.

A OpenAI precisava que cada assinante continuasse pagando. O Google precisava que cada desenvolvedor continuasse construindo. Um é um modelo de receita. O outro é uma estratégia de distribuição. A história tem uma preferência clara.

Os impérios não caem por falta de preparação. Eles caem montados nos próprios cavalos, carregados de redundâncias, incapazes de ver que o mundo se moveu enquanto eles admiravam o próprio reflexo.

A era “aberta” da IA chegou. Só que não tem “OpenAI” no nome.

Em dezembro de 2022, o Google declarou um código vermelho por causa da OpenAI. Em dezembro de 2025, a OpenAI declarou um código vermelho por causa do Google. Em abril de 2026, o Google lançou o Gemma 4 sob Apache 2.0. O círculo se fechou. O império cai do próprio cavalo.