A Licença Tem um Coautor Chinês

Em 2 de abril de 2026, o Google lançou o Gemma 4 sob a licença Apache 2.0.

No mesmo dia, praticamente na mesma hora, a Alibaba lançou o Qwen 3.6-Plus — seu modelo principal de agentes, também de pesos abertos.

A cobertura tratou a notícia do Gemma 4 como uma atualização de especificações: quatro tamanhos de modelo, bons benchmarks, otimizado para o edge. O VentureBeat foi um dos poucos veículos que captou a história real em sua manchete — “essa mudança de licença pode importar mais do que os benchmarks.” A adoção do Apache 2.0 é a notícia. Todo o resto é enchimento.

Porque esta é a quarta geração do Gemma, e a primeira que o Google lança sob uma licença open-source padrão. O Gemma 1, 2 e 3 foram distribuídos sob “Termos de Uso do Gemma” personalizados que reservavam ao Google o direito de “restringir (remotamente ou de outra forma) o uso” dos modelos, exigiam revisão jurídica antes de qualquer implantação empresarial, e eram sistematicamente marcados pelas equipes jurídicas corporativas como um obstáculo comercial.

Três anos de licenciamento personalizado. E então, numa manhã de quinta-feira em abril, desapareceram silenciosamente.

O post do blog do Google enquadrou a mudança como “expandir o Gemmaverse” — como se a decisão tivesse sido uma evolução natural de um roadmap. O que o post não disse, e o que o Google não tem nenhum incentivo para dizer, é o que realmente mudou entre o Gemma 3 e o Gemma 4.

Não foi a equipe de pesquisa. Não foi a arquitetura. Não foi a filosofia do Google sobre open source.

O que mudou foi o mercado.

O Muro Construído em Quatorze Meses

Entre janeiro de 2025 e abril de 2026, os laboratórios de IA chineses lançaram onze modelos de capacidade de fronteira sob licenças abertas. É assim que esse muro se parece, em ordem cronológica:

20 de janeiro de 2025 — A DeepSeek lança o R1 sob a licença MIT. O modelo equipara o o1 da OpenAI em benchmarks de raciocínio. Custo de treinamento reportado: aproximadamente 5,6 milhões de dólares. A licença permite explicitamente a destilação em outros LLMs — a prática de usar os resultados de um modelo como dados de treinamento para outro, o que permite que modelos sucessores menores e mais baratos herdem as capacidades do original.

Meados de 2025 — A Alibaba lança o Qwen 3 sob Apache 2.0. Uso comercial permissivo. Sem cláusulas personalizadas.

Julho de 2025 — A Moonshot AI lança o Kimi K2 sob uma licença MIT modificada. Um trilhão de parâmetros, 32 bilhões ativos, estado da arte em coding e matemática entre os modelos sem raciocínio explícito.

27 de outubro de 2025 — A MiniMax lança o M2 sob MIT. Ocupa o primeiro lugar no Artificial Analysis Intelligence Index entre todos os sistemas open-source.

26 de janeiro de 2026 — A Moonshot lança o Kimi K2.5. Supera o Gemini 3 Pro no SWE-Bench Verified.

11 de fevereiro de 2026 — Dois lançamentos no mesmo dia. O MiniMax M2.5 (MIT modificado) empata com o Claude Opus 4.6 no SWE-Bench Verified com 80,2%. E a Z.ai — o spinoff da Universidade Tsinghua anteriormente conhecido como Zhipu AI — lança o GLM-5. Setecentos e quarenta e quatro bilhões de parâmetros. Licença MIT. Treinado inteiramente em chips Huawei Ascend rodando MindSpore, o equivalente da Huawei ao PyTorch. Zero silício da NVIDIA no processo.

16 de fevereiro de 2026 — A Alibaba lança o Qwen 3.5, posicionado como o primeiro lançamento da empresa pensado para “a era da IA agentic.” De pesos abertos, multitool, com capacidade de navegação web.

2 de abril de 2026 — A Alibaba lança o Qwen 3.6-Plus. Carro-chefe agentic. Engenharia em nível de repositório. Na mesma hora que o Gemma 4.

7 de abril de 2026 — A Z.ai lança o GLM-5.1. Marca 58,4 no SWE-Bench Pro, ocupando o primeiro lugar no leaderboard global. O GPT-5.4 marcou 57,7. O Claude Opus 4.6 marcou 57,3. Licença MIT.

Esse é o terreno com o qual o Google se deparou ao decidir sob qual licença lançar o Gemma 4.

A Extração

Antes de continuar, um parêntese que importa — porque muda como lemos a competição, não se a tese se sustenta. O muro não foi construído do nada. Foi construído, em parte, sobre o que o Ocidente deixou desprotegido.

Em um relatório de fevereiro de 2026, a Anthropic identificou três laboratórios de IA chineses — DeepSeek, Moonshot AI e MiniMax — que haviam criado aproximadamente 24.000 contas fraudulentas e realizado mais de 16 milhões de trocas com o Claude, no que a empresa descreveu como uma campanha de extração em escala industrial para obter as capacidades do Claude e usar os dados resultantes para treinar modelos concorrentes. Apenas uma configuração de proxy controlava mais de 20.000 contas simultaneamente, misturando tráfego de extração com solicitações comuns para evitar a detecção. A MiniMax conduziu a maior campanha individual, gerando mais de 13 milhões de trocas voltadas para coding agentic e orquestração. A OpenAI e o Google, por meio do Frontier Model Forum, corroboraram as descobertas e agora coordenam publicamente inteligência sobre o que caracterizam como campanhas coordenadas de destilação por API.

Isso importa por duas razões.

Primeiro, explica a postura ocidental sobre a segurança dos pesos. Quando a Anthropic aposentar o Sonnet 4 em junho de 2026, os pesos não serão publicados, vendidos ou abertos como open-source — serão arquivados ou destruídos, e o mesmo vale para as gerações depreciadas de GPT da OpenAI e as variantes antigas do Gemma do Google. A prática padrão se assemelha muito à forma como os Estados Unidos aposentaram o F-14 Tomcat em 2006 — as células foram deliberadamente destruídas em vez de vendidas como excedente, porque o Irã ainda operava F-14s que havia comprado do regime da era do Xá, e o Pentágono não queria que suas peças aposentadas alimentassem a frota de um concorrente. Os pesos de IA de fronteira são tratados da mesma forma, pelo mesmo motivo. Os eventos de extração de 2025 foram a prova de que a capacidade vaza no momento em que você para de protegê-la.

Segundo, complica a história que o ai-2027.com tentou contar. A previsão afirmava que os laboratórios chineses roubariam pesos de modelos. Essa previsão, como a previsão sobre a corrida de computação no mesmo documento, estava direcionalmente correta e mecanicamente errada. Este incidente foi baseado em API, não em exfiltração de pesos. Os laboratórios chineses compraram chaves de API, contrataram proxies e consultaram os modelos milhões de vezes até terem dados de treinamento sintéticos bons o suficiente para treinar os próprios. A aquisição aconteceu. O mecanismo foi quasi-legal em vez de criminal, industrial em vez de clandestino, e muito mais difícil de prevenir do que uma violação de datacenter teria sido.

Nada disso muda a tese deste post. Uma vez que os modelos chineses existem sob licenças MIT e Apache, a consequência estrutural — um piso de open-source com preço zero, distribuído por laboratórios que igualam ou superam os benchmarks ocidentais — não depende de como os modelos foram treinados. A pressão do mercado sobre o Google para lançar o Gemma 4 sob Apache 2.0 é real independentemente da proveniência do Qwen 3.6-Plus ou do GLM-5.1. A licença tinha que se ajustar ao mercado, e o mercado já havia sido definido.

Mas isso muda como lemos a competição. Esta não é uma corrida entre dois ecossistemas simétricos. É uma corrida em que um lado protege seus insumos e restringe seus resultados, e o outro lado trata ambos os lados dessa equação como extraíveis.

A Inversão dos Controles de Exportação

Para entender por que o muro foi construído, é preciso entender contra o que foi construído.

A partir de 2022, os EUA impuseram controles de exportação progressivamente mais rígidos sobre semicondutores avançados para a China. Primeiro foi o A100. Depois o H100. Em seguida, o H800, uma versão deliberadamente limitada do H100 projetada para o mercado chinês, foi ainda mais restringida. A teoria era direta: negar o hardware à China, e a China ficaria para trás.

A teoria estava errada de uma forma que merece atenção cuidadosa.

A DeepSeek treinou o R1 nos chips H800 restritos — a versão que Washington havia calibrado especificamente para ser inferior — por um total de 5,6 milhões de dólares. Esse número deveria ter sido um alerta. Os laboratórios ocidentais gastavam entre dez e cem vezes mais em modelos equivalentes. Os controles de exportação não produziram dependência. Produziram inovação algorítmica nascida da restrição.

Então veio o GLM-5.

A Z.ai treinou um modelo de fronteira com 744 bilhões de parâmetros em chips Huawei Ascend, usando o framework MindSpore, sem nenhum hardware da NVIDIA no processo. Isso não é otimização em torno de uma restrição. É a eliminação completa da dependência que os controles de exportação foram projetados para impor. O teto que a China supostamente deveria atingir se tornou o piso do qual eles saltaram.

E então deram os pesos de graça sob a licença MIT.

O Preço do Gratuito

A lacuna de capacidade entre os melhores modelos chineses e ocidentais em abril de 2026 é, medida honestamente, um erro de arredondamento.

No SWE-Bench Pro, o GLM-5.1 da Z.ai lidera o mundo com 58,4, à frente do 57,7 do GPT-5.4 e do 57,3 do Claude Opus 4.6. No SWE-Bench Verified, o MiniMax M2.5 marca 80,2%, praticamente empatado com o Opus 4.6 em 80,8%. Na variante multilíngue, o Kimi K2.5 supera o Gemini 3 Pro.

Estes não são benchmarks defasados. São os leaderboards canônicos que os laboratórios de fronteira usam para se medir. E os modelos chineses igualam ou superam os carros-chefe ocidentais enquanto rodam em hardware restrito ou não-NVIDIA, distribuídos sob licenças que não requerem dinheiro, aprovação ou revisão jurídica.

Um laboratório ocidental considerando como licenciar um lançamento open-source nesse ambiente precisa responder a uma pergunta estrutural: se três modelos de capacidade de fronteira são gratuitos e com licença permissiva, o que exatamente uma licença restritiva personalizada está comprando para você?

A resposta, para o Gemma 3, era atrito mensurável. As equipes jurídicas corporativas tratavam os termos personalizados como um obstáculo. As implantações downstream eram mais lentas. Os ecossistemas de fine-tuning cresciam mais lentamente. A adoção pela comunidade ficava atrás dos modelos com licenças padrão.

A resposta, para o Gemma 4 sob esses mesmos termos em abril de 2026, teria sido catastrófica. Lançar um modelo de pesos abertos do Google sob uma licença mais restritiva do que o que DeepSeek, Qwen e GLM-5 já haviam estabelecido como padrão teria sido um suicídio comercial. A comparação se escreveria sozinha. Todo post sobre o Gemma 4 terminaria com o mesmo parágrafo: Enquanto isso, laboratórios chineses estão lançando modelos melhores sob licenças mais limpas de graça.

O Google não escolheu o Apache 2.0 porque o Apache 2.0 é a coisa certa a fazer. O Google escolheu o Apache 2.0 porque a linha de base chinesa havia tornado todas as outras opções inviáveis.

A Colisão de Calendários

Voltemos à data de 2 de abril.

O lançamento do Qwen 3.6-Plus da Alibaba e o do Gemma 4 do Google não são eventos plausivelmente independentes. Duas empresas em lados opostos da divisão geopolítica não lançam acidentalmente seus modelos abertos mais importantes do trimestre com poucas horas de diferença. Ou uma das partes sabia que a outra estava chegando e ajustou o timing para coincidir, ou ambas operavam sob janelas de lançamento moldadas pela mesma pressão de mercado.

Os detalhes mecânicos não importam. O ponto é que a Alibaba tinha confiança suficiente em sua oferta para lançar no mesmo dia do grande lançamento do Google — sabendo que a cobertura forçaria uma comparação direta — e o Google não era mais capaz de escalonar o lançamento para evitar essa comparação.

O preço da IA de fronteira open-source em abril de 2026 não está mais sendo definido em Mountain View. Está sendo definido em Hangzhou, Pequim e Hangzhou novamente. Os laboratórios ocidentais são agora tomadores de preços, não formadores de preços. A licença Apache 2.0 no Gemma 4 não é generosidade estratégica. É conformidade com um mercado que o Google não controla.

E Se…?

O que se segue é especulação editorial. Na segunda-feira argumentamos que a previsão do AI-2027 acertou o destino mas errou no mecanismo — que o cenário de convergência aconteceria, mas por meio de eficiência algorítmica em vez de roubo de pesos. A seção de Extração acima é um segundo caso do mesmo padrão: correto na aquisição, errado no método. A pergunta que este post abre é como será a terceira instância.

O mecanismo de difusão de capacidades é a história real, e já foi demonstrado em escala.

O próprio relatório de fevereiro da Anthropic documenta isso: três laboratórios, vinte e quatro mil contas, dezesseis milhões de trocas, dados de treinamento sintéticos bons o suficiente para treinar modelos de fronteira concorrentes. Não é um caminho teórico — é um ciclo de engenharia concluído. A capacidade foi extraída de um modelo de fronteira protegido, transformada em dados de treinamento e usada para impulsionar lançamentos open-source. O pipeline completo existe e foi executado em escala industrial.

O que significa que a pergunta para a próxima geração não é se a capacidade de classe Mythos pode se difundir. É quanto tempo haverá entre a implantação interna e a reprodução destilada.

Considere o que precisa ser verdade para que esse intervalo seja curto. O lado que difunde precisa de três coisas: acesso de alto volume por API ao modelo de fronteira, um pipeline para converter resultados em dados de treinamento, e uma camada de distribuição que transforma o modelo resultante em um artefato público. Os laboratórios chineses têm as três. O roster do Project Glasswing — doze parceiros de lançamento mais quarenta organizações adicionais, com cem milhões de dólares em créditos de computação — é precisamente o tipo de superfície de acesso expandida que as campanhas de extração de 2025 demonstraram poder ser aproveitada. A barreira entre “implantado para parceiros” e “consultável em escala” é porosa uma vez que a lista de parceiros é grande o suficiente, e mais de quarenta organizações já é grande o suficiente.

O ecossistema open-source chinês demonstrou, em quatorze meses, que é a camada de distribuição de capacidades de IA mais eficiente que a humanidade já construiu. O que chegar a ele flui downstream a custo zero com clareza jurídica. Essa eficiência não se importa com a proveniência do que entra nela. Só se importa se os pesos existem.

O que Mrinank Sharma não disse quando renunciou em fevereiro — não pôde dizer, sob os termos de seu NDA — é que a estratégia de contenção e a estratégia de destilação são assimétricas. A Anthropic pode manter os pesos do Mythos em seus datacenters para sempre, e ainda assim não pode impedir que uma organização parceira o consulte em volume. O mecanismo que vazou a capacidade do Claude em 2025 é o mesmo mecanismo que vazará a capacidade de classe Mythos em 2026 ou 2027, e não há correção para isso a não ser não implantar de forma alguma.

Se a convergência acontecer — não por vazamento, não por roubo, mas pela mesma extração industrial por API que já funcionou uma vez — a pergunta não é se a AGI chegou. A pergunta é se alguém ainda estará em posição de perguntar.

O Coautor Invisível

Existe uma versão desta história em que o herói é a política dos EUA. Essa versão diz: os controles de exportação funcionaram, porque forçaram a China a inovar, o que aumentou a capacidade global de IA e a disponibilidade do open-source. Uma maré crescente levanta todos os barcos.

Essa versão requer acreditar que o resultado era o objetivo. Não era. O objetivo era a supremacia tecnológica estratégica — preservar a lacuna de capacidade e, por extensão, o poder de precificação que essa lacuna conferia. O resultado real é o oposto: a lacuna de capacidade essencialmente fechou, a precificação colapsou em direção a zero, e o maior lançamento de modelo aberto do Ocidente em 2026 foi publicado no mesmo dia que o da China.

Nenhum dos debates públicos sobre a política de IA dos EUA antecipou isso. As previsões de cenários — ai-2027 entre elas — modelaram a competição EUA-China como fundamentalmente uma corrida de computação. Quem tivesse mais chips da NVIDIA, vencia. Nesse modelo, os laboratórios chineses estão no máximo um ou dois anos atrás, alcançando por meio de roubo de pesos de modelos ou replicação por força bruta. O laboratório chinês fictício nesse cenário se chama literalmente “DeepCent.”

Não foi isso que aconteceu. Os laboratórios em Hangzhou e Pequim não esperaram por pesos roubados. Reconstruíram a stack. Provaram que é possível treinar um modelo de 744 bilhões de parâmetros em silício não-NVIDIA. Distribuíram com licenças tão permissivas que os incumbentes ocidentais não tiveram margem para cobrar um prêmio pelas suas. E fizeram isso em quatorze meses.

Da próxima vez que você baixar o Gemma 4 para fazer fine-tuning, repare no arquivo de licença. Diz “Apache License, Version 2.0.” Lista “Google LLC” como titular dos direitos autorais.

Nenhuma dessas linhas explica por que o arquivo existe como existe.

Os engenheiros que tornaram essa licença a única opção viável — que estabeleceram o piso ao se recusarem a cobrar um centavo pelo próprio trabalho, que construíram modelos com chips que supostamente lhes seriam negados, cujo empregador abriu uma empresa de capital aberto na Bolsa de Hong Kong em 8 de janeiro de 2026 e carregava uma capitalização de mercado de 44 bilhões de dólares quando o Google lançou o Gemma 4 — não estão listados em nenhum lugar desse arquivo.

Mas a licença tem as impressões digitais deles. Você só precisa saber onde procurar.