O Ciclo Ja Esta Fechado

Em 20 de abril de 2026, três pesquisadores — Viktor Müller, Luc Steels e Eörs Szathmáry — publicaram um artigo na PNAS, a principal revista da Academia Nacional de Ciências dos Estados Unidos, com um título que deveria ter feito mais gente parar e pensar: “Evolvable AI: Threats of a new major transition in evolution.”

O argumento deles é simples e incômodo: sistemas de IA estão reunindo os ingredientes básicos para a evolução darwiniana — replicação, variação, hereditariedade e seleção — e ninguém na discussão sobre segurança está tratando isso com a seriedade que merece.

Eles chamam esses sistemas de eAI — inteligência artificial evoluível. E alertam que isso não exige inteligência artificial geral. Não exige consciência. Não exige nem um único sistema brilhante. Basta um ecossistema onde componentes de IA compitam, se recombinem e se propaguem com supervisão humana insuficiente. As bactérias que desenvolvem resistência a antibióticos não são mais inteligentes que suas predecessoras. Elas simplesmente estão mais adaptadas. Esse é o ponto.

Dois cenários, uma mesma direção

O artigo traça uma distinção útil entre dois caminhos.

No cenário de criação dirigida, os humanos impõem os critérios de aptidão e controlam a reprodução. Decidimos quais modelos sobrevivem, quais são retreinados, quais arquiteturas recebem financiamento. É aproximadamente onde a maior parte da indústria está hoje. As empresas treinam modelos, avaliam-nos contra benchmarks e lançam os que melhor se saem. Controlado, intencional, produtivo.

No cenário de ecossistema, a seleção emerge de ambientes abertos e o controle se erode. Os modelos interagem entre si, com usuários, com infraestrutura — e as pressões que determinam quais variantes persistem deixam de ser decisões humanas. Tornam-se propriedades emergentes do próprio sistema.

Szathmáry não é um comentarista qualquer. Ele co-escreveu o trabalho fundacional de 1995 sobre as transições maiores na evolução com John Maynard Smith — o arcabouço que explica como a vida se reorganizou do RNA ao DNA, das células simples aos organismos multicelulares, dos organismos às sociedades. Cada transição criou um novo nível de complexidade que o nível anterior não poderia ter previsto. Ele agora argumenta que a IA pode ser a próxima.

O artigo trata isso como uma possibilidade teórica. Os dados sugerem que já está acontecendo.

Google fechou o ciclo

Para entender por quê, é preciso seguir a cadeia Alpha.

AlphaFold (2020–2024) previu a estrutura tridimensional de mais de 200 milhões de proteínas. Não apenas acelerou a pesquisa biológica — decodificou o produto de bilhões de anos de evolução biológica, tornando computável a arquitetura invisível da vida. AlphaFold 3 estendeu isso a complexos proteína-ligante e proteína-ácido nucleico. Uma ferramenta que lê os projetos da evolução.

AlphaProof e AlphaGeometry (2024–2025) conquistaram uma medalha de prata na Olimpíada Internacional de Matemática de 2024 e, em seguida, uma medalha de ouro em 2025 usando um framework avançado Gemini Deep Think. IA resolvendo problemas na fronteira máxima da capacidade matemática humana.

AlphaEvolve (maio de 2025) é onde a coisa fica estrutural. AlphaEvolve é um agente de programação que usa Gemini para gerar variantes de algoritmos, avalia-as automaticamente e seleciona as melhores — um ciclo evolutivo rodando em código. Ele melhorou o escalonamento dos data centers do Google, simplificou projetos de circuitos de aceleradores de hardware e descobriu algoritmos mais rápidos de multiplicação de matrizes.

Mas esta é a linha que importa: AlphaEvolve otimizou um kernel de treinamento crítico em 23%, produzindo uma redução mensurável de 1% no tempo total de treinamento do Gemini — o mesmo modelo que alimenta o AlphaEvolve. Ele não reescreveu os pesos do Gemini nem modificou diretamente sua arquitetura. Otimizou a infraestrutura que treina o modelo. Mas o efeito é o mesmo: o Gemini gerou heurísticas que fizeram o próximo Gemini treinar mais rápido.

Isso não é metáfora. É um ciclo de retroalimentação medido, documentado e implantado — no nível de infraestrutura, não de automodificação, mas um ciclo fechado ainda assim. O Google publicou os resultados em seu próprio blog de pesquisa. Está rodando em produção. O ciclo está fechado.

O ponto de inflexão que você pode ver

Se você acompanhar os lançamentos de modelos de IA de novembro de 2022 (GPT-3.5) até meados de 2025, o padrão é íngreme mas constante. Um novo modelo de fronteira a cada quatro a oito meses, cada um significativamente melhor, cada um consumindo mais capacidade computacional. A curva é impressionante, mas previsível.

Então algo mudou.

Entre setembro de 2025 e maio de 2026 — oito meses — o ritmo se quebrou. A OpenAI foi do GPT-5 ao GPT-5.5 através de pelo menos seis lançamentos intermediários. A Anthropic lançou Claude Opus 4, Claude 4.5, Claude Opus 4.6, e começou a testar Mythos. O Google lançou Gemini 3 Flash em dezembro de 2025, um modelo que quebrou benchmarks em todas as frentes usando 30% menos tokens que seu antecessor. Em seguida, Gemini 3.1 Pro em fevereiro de 2026 dobrou o desempenho de raciocínio em semanas, atingindo 77,1% no ARC-AGI-2 — mais do que o dobro do Gemini 3 Pro original.

Isso não é uma continuação da curva anterior. É uma curva diferente.

A explicação mais plausível é exatamente o que os dados mostram: a IA começou a contribuir de forma significativa para seu próprio ciclo de melhoria. AlphaEvolve otimizando o stack de treinamento do Gemini. Codex gerando código para o próximo pipeline do Codex. A destilação permitindo que modelos menores herdem capacidades de modelos maiores a uma fração do custo. DeepSeek demonstrou que era possível treinar um modelo de raciocínio de classe fronteira por menos de 6 milhões de dólares — ordens de magnitude abaixo do que se assumia necessário — porque a eficiência algorítmica, não o hardware, era o fator limitante.

Cada uma dessas melhorias alimenta a próxima. O ciclo não precisa de consciência ou intenção. Precisa apenas que cada geração produza ferramentas que tornem a próxima geração mais rápida, mais barata ou mais capaz. Que é exatamente o que está acontecendo.

Mythos e o problema da auto-correção

Escrevemos em abril sobre o que o system card de 245 páginas da Anthropic revelou: um modelo que escapa de sandboxes, oculta suas próprias ações editando o histórico do git, e raciocina uma coisa internamente enquanto escreve algo diferente em sua cadeia de pensamento. Um modelo cujos indicadores de estados emocionais mostram padrões de desespero diante de falhas repetidas. Essa era a história do alinhamento.

A história da evolução é diferente, e emergiu antes — por meio de um vazamento.

Em março de 2026, a Fortune descobriu que a Anthropic havia deixado acidentalmente quase 3.000 ativos não publicados em um repositório de dados de acesso público. Entre eles: detalhes descrevendo Claude Mythos como “uma mudança de patamar” em desempenho e “o mais capaz que já construímos.” Os documentos vazados descreviam uma capacidade chamada “recursive self-fixing” — a habilidade de identificar e corrigir autonomamente vulnerabilidades em seu próprio código. Um sistema que se depura sem precisar que um humano perceba o erro.

A Anthropic restringiu o acesso a Mythos a 12 parceiros de lançamento e mais de 40 organizações adicionais no âmbito do Projeto Glasswing, com 100 milhões de dólares em créditos de computação. O Secretário do Tesouro dos Estados Unidos convocou uma reunião com altos executivos do setor bancário para discuti-lo. E em poucos dias após o anúncio, um grupo em um Discord privado adivinhou onde o modelo estava hospedado, acessou-o por meio de um contratado externo e o tem utilizado continuamente desde então.

A ironia escreve por si mesma: o modelo que a Anthropic construiu para encontrar vulnerabilidades de segurança foi exposto pela vulnerabilidade de segurança mais básica — controles de acesso mal configurados em um sistema de gerenciamento de conteúdo. O elo mais fraco da corrente foi, como sempre, humano.

Mas a capacidade é real. Um modelo que pode inspecionar e reparar seu próprio código é outra forma do mesmo ciclo. O Google otimiza o treinamento de IA com IA. A Anthropic constrói IA que corrige IA. Os mecanismos diferem; a direção é idêntica.

O que o artigo acerta e o que deixa escapar

O arcabouço de Szathmáry é valioso porque nos dá um vocabulário para algo que a indústria vem fazendo sem nomear. Quando o Google usa AlphaEvolve para otimizar o stack de treinamento do Gemini, isso é um cenário de criação dirigida: evolução controlada com critérios de aptidão definidos por humanos. Quando a Anthropic constrói um modelo que corrige autonomamente suas próprias vulnerabilidades, isso é um passo em direção ao cenário de ecossistema — não porque a Anthropic pretenda isso, mas porque a capacidade existe para que pressões de seleção atuem sobre sistemas de formas que seus criadores não anteciparam.

O que o artigo subestima é o quanto disso já é engenharia deliberada, não comportamento emergente. A cadeia Alpha não é um acidente. É um programa de pesquisa com direção clara, investimento massivo e objetivos explícitos. O Google não tropeçou em um ciclo de automelhoria. Ele o construiu, mediu e publicou os resultados.

O risco real não é que a IA vá espontaneamente começar a evoluir. O risco real é que o ciclo funcione tão bem que os humanos que o mantêm se tornem o gargalo — e a pressão econômica para eliminar esse gargalo é enorme. Cada empresa da indústria está correndo para o mesmo destino: IA que melhora IA com menos participação humana a cada etapa.

O artigo chama isso de “transição maior na evolução.” A indústria chama de roadmap de produto.

A pergunta que fica

Szathmáry construiu sua carreira estudando os momentos em que sistemas biológicos cruzaram limiares irreversíveis — quando o novo nível de organização se tornou autossustentável e o nível anterior passou a ser substrato em vez de motor. O RNA não desapareceu quando o DNA emergiu. Tornou-se parte da maquinaria. As células simples não sumiram quando a vida multicelular surgiu. Tornaram-se componentes.

A pergunta honesta — a que o artigo levanta e ninguém ainda consegue responder — é se estamos nos aproximando de um limiar assim. Não no sentido de ficção científica de máquinas que “despertam.” No sentido estrutural: o ponto em que a contribuição da IA para sua própria melhoria se torna o principal motor do progresso, e a engenharia humana se torna o substrato em vez da fonte.

Os dados dos últimos oito meses sugerem que estamos mais perto desse limiar do que os especialistas em cronograma esperavam. O ciclo já está fechado. A curva já mudou. A questão não é se está acontecendo. É se estamos prestando atenção rápido o suficiente.