Le 2 avril 2026, Google a publié Gemma 4 sous la licence Apache 2.0.

Le même jour, à peu près à la même heure, Alibaba publiait Qwen 3.6-Plus — son modèle phare pour l’IA agentique, également en open-weight.

La presse a traité l’annonce de Gemma 4 comme une mise à jour de spécifications : quatre tailles de modèles, des benchmarks solides, prêt pour le déploiement en périphérie. VentureBeat a été l’un des rares médias à saisir le vrai sujet dès son titre — «ce changement de licence compte peut-être plus que les benchmarks». L’adoption d’Apache 2.0, voilà la nouvelle. Le reste n’est que rembourrage.

Car il s’agit de la quatrième génération de Gemma, et de la première que Google publie sous une licence open-source standard. Gemma 1, 2 et 3 étaient toutes sorties sous des «Gemma Terms of Use» personnalisés, qui réservaient à Google le droit de «restreindre (à distance ou autrement) l’utilisation» des modèles, exigeaient un examen juridique avant tout déploiement en entreprise, et étaient régulièrement identifiés par les équipes légales comme un frein commercial.

Trois ans de licence personnalisée. Puis, un jeudi matin d’avril, elle a discrètement disparu.

Le billet de blog de Google a présenté le changement comme «l’expansion du Gemmaverse» — comme si la décision avait été une évolution naturelle d’une feuille de route. Ce que ce billet n’a pas dit, et que Google n’a aucun intérêt à dire, c’est ce qui a réellement changé entre Gemma 3 et Gemma 4.

Ce n’était pas l’équipe de recherche. Ce n’était pas l’architecture. Ce n’était pas la philosophie de Google sur l’open source.

Ce qui a changé, c’est le marché.

Le Mur Bâti en Quatorze Mois

Entre janvier 2025 et avril 2026, les laboratoires d’IA chinois ont publié onze modèles de niveau frontier sous des licences ouvertes. Voici à quoi ressemble ce mur, dans l’ordre chronologique :

20 janvier 2025 — DeepSeek publie R1 sous la licence MIT. Le modèle égale o1 d’OpenAI sur les benchmarks de raisonnement. Coût de formation déclaré : environ 5,6 millions de dollars. La licence autorise explicitement la distillation dans d’autres LLM — la pratique consistant à utiliser les sorties d’un modèle comme données d’entraînement pour un autre, permettant à des modèles successeurs plus petits et moins coûteux d’hériter des capacités de l’original.

Mi-2025 — Alibaba livre Qwen 3 sous Apache 2.0. Usage commercial permissif. Pas de clauses personnalisées.

Juillet 2025 — Moonshot AI publie Kimi K2 sous une licence MIT modifiée. Un billion de paramètres, 32 milliards actifs, meilleur de sa catégorie en codage et en mathématiques parmi les modèles non-pensants.

27 octobre 2025 — MiniMax publie M2 sous MIT. Il prend la première place sur l’Artificial Analysis Intelligence Index parmi tous les systèmes open-source.

26 janvier 2026 — Moonshot livre Kimi K2.5. Il dépasse Gemini 3 Pro sur SWE-Bench Verified.

11 février 2026 — Deux publications le même jour. MiniMax M2.5 (MIT modifié) égale Claude Opus 4.6 sur SWE-Bench Verified à 80,2 %. Et Z.ai — le spin-off de l’Université Tsinghua anciennement connu sous le nom de Zhipu AI — publie GLM-5. Sept cent quarante-quatre milliards de paramètres. Licence MIT. Entraîné entièrement sur des puces Huawei Ascend utilisant MindSpore, l’équivalent PyTorch de Huawei. Zéro silicium NVIDIA dans la chaîne.

16 février 2026 — Alibaba publie Qwen 3.5, présenté comme la première version de l’entreprise conçue pour «l’ère de l’IA agentique». Open-weight, multi-outils, capable de naviguer sur le Web.

2 avril 2026 — Alibaba publie Qwen 3.6-Plus. Flagship agentique. Ingénierie au niveau des dépôts. À la même heure que Gemma 4.

7 avril 2026 — Z.ai publie GLM-5.1. Il affiche 58,4 sur SWE-Bench Pro, prenant la première place du classement mondial. GPT-5.4 a obtenu 57,7. Claude Opus 4.6 a obtenu 57,3. Licence MIT.

Tel est le terrain dans lequel Google est entré au moment de choisir la licence de Gemma 4.

L’Extraction

Avant de poursuivre, une digression qui compte — car elle change comment nous lisons la concurrence, pas si la thèse tient. Le mur n’a pas été bâti à partir de rien. Il a été bâti, en partie, sur ce que l’Occident a laissé sans protection.

Dans un rapport de février 2026, Anthropic a identifié trois laboratoires d’IA chinois — DeepSeek, Moonshot AI et MiniMax — qui avaient créé environ 24 000 comptes frauduleux et mené plus de 16 millions d’échanges avec Claude, dans ce que l’entreprise a décrit comme une campagne à l’échelle industrielle visant à extraire les capacités de Claude pour entraîner des modèles concurrents. Un seul dispositif de proxies contrôlait plus de 20 000 comptes simultanément, mêlant du trafic d’extraction à des requêtes ordinaires pour échapper à la détection. MiniMax a mené la plus grande campagne individuelle, générant plus de 13 millions d’échanges ciblant le codage agentique et l’orchestration. OpenAI et Google, via le Frontier Model Forum, ont confirmé ces conclusions et coordonnent désormais publiquement leurs renseignements sur ce qu’ils qualifient de campagnes de distillation API coordonnées.

Cela compte pour deux raisons.

Premièrement, cela explique la posture occidentale sur la sécurité des poids. Lorsqu’Anthropic retirera Sonnet 4 en juin 2026, les poids ne seront ni publiés, ni vendus, ni ouverts — ils seront archivés ou détruits. Il en va de même pour les générations GPT dépréciées d’OpenAI et les anciennes variantes Gemma de Google. La pratique standard ressemble beaucoup à la façon dont les États-Unis ont retiré le F-14 Tomcat en 2006 — les cellules ont été délibérément broyées plutôt que vendues en surplus, parce que l’Iran opérait encore des F-14 achetés sous le régime du Shah, et le Pentagone ne voulait pas que ses pièces de rechange alimentent la flotte d’un concurrent. Les poids des modèles frontier sont traités de la même façon, pour la même raison. Les incidents d’extraction de 2025 ont prouvé que la capacité fuit dès qu’on cesse de la protéger.

Deuxièmement, cela complique le récit qu’ai-2027.com a tenté de construire. La prévision prédisait que les laboratoires chinois voleraient des poids de modèles. Cette prédiction, comme celle sur la course aux puces dans le même document, était juste dans sa direction et fausse dans son mécanisme. Cet incident était basé sur l’API, pas sur l’exfiltration de poids. Les laboratoires chinois ont acheté des clés API, embauché des proxies, et interrogé les modèles des millions de fois jusqu’à obtenir des données d’entraînement synthétiques suffisamment bonnes pour former les leurs. L’acquisition a bien eu lieu. Le mécanisme était adjacent au légal plutôt que criminel, industriel plutôt que clandestin, et bien plus difficile à prévenir qu’une intrusion en datacenter l’aurait été.

Rien de tout cela ne change la thèse de ce billet. Une fois que les modèles chinois existent sous licences MIT et Apache, la conséquence structurelle — un plancher open-source au prix zéro, livré par des laboratoires qui égalent ou surpassent les benchmarks occidentaux — ne dépend pas de la façon dont les modèles ont été entraînés. La pression du marché sur Google pour publier Gemma 4 sous Apache 2.0 est réelle quelle que soit la provenance de Qwen 3.6-Plus ou de GLM-5.1. La licence devait s’aligner sur le marché, et le marché avait été fixé.

Mais cela change notre lecture de la concurrence. Ce n’est pas une course entre deux écosystèmes symétriques. C’est une course dans laquelle un côté protège ses intrants et restreint ses extrants, tandis que l’autre traite les deux comme extractibles.

L’Inversion du Contrôle des Exportations

Pour comprendre pourquoi le mur a été bâti, il faut comprendre ce contre quoi il a été bâti.

À partir de 2022, les États-Unis ont imposé des contrôles à l’exportation de plus en plus stricts sur les semi-conducteurs avancés vers la Chine. L’A100 est passé en premier. Puis le H100. Puis le H800, une version délibérément bridée du H100 conçue pour le marché chinois, a elle-même été davantage restreinte. La théorie était simple : priver la Chine du matériel, et la Chine prendrait du retard.

La théorie s’est avérée fausse d’une façon qui mérite qu’on s’y attarde.

DeepSeek a entraîné R1 sur les puces H800 restreintes — la version que Washington avait calibrée spécifiquement pour être inférieure — pour 5,6 millions de dollars au total. Ce chiffre aurait dû être un avertissement. Les laboratoires occidentaux dépensaient dix à cent fois plus pour des modèles équivalents. Les contrôles à l’exportation n’avaient pas produit de dépendance. Ils avaient produit une innovation algorithmique née de la contrainte.

Puis GLM-5 est arrivé.

Z.ai a entraîné un modèle frontier de 744 milliards de paramètres sur des puces Huawei Ascend, en utilisant le framework MindSpore, sans aucun matériel NVIDIA dans la chaîne. Ce n’est pas une optimisation autour d’une contrainte. C’est l’élimination complète de la dépendance que les contrôles à l’exportation étaient censés imposer. Le plafond que la Chine était supposée atteindre est devenu un plancher depuis lequel elle a sauté.

Et ensuite, ils ont distribué les poids sous la licence MIT.

Le Prix du Gratuit

L’écart de capacité entre les meilleurs modèles chinois et occidentaux en avril 2026 est, mesuré honnêtement, une erreur d’arrondi.

Sur SWE-Bench Pro, le GLM-5.1 de Z.ai mène le monde à 58,4, devant les 57,7 de GPT-5.4 et les 57,3 de Claude Opus 4.6. Sur SWE-Bench Verified, MiniMax M2.5 affiche 80,2 %, pratiquement à égalité avec Opus 4.6 à 80,8 %. Sur la variante multilingue, Kimi K2.5 surpasse Gemini 3 Pro.

Ce ne sont pas des benchmarks de second rang. Ce sont les classements canoniques que les laboratoires frontier utilisent pour se mesurer. Et les modèles chinois égalent ou surpassent les fleurons occidentaux tout en fonctionnant sur du matériel restreint ou non-NVIDIA, distribués sous des licences qui n’exigent ni argent, ni autorisation, ni examen juridique.

Un laboratoire occidental qui réfléchit à comment tarifer une publication open-source dans cet environnement doit répondre à une question structurelle : si trois modèles de niveau frontier sont gratuits et sous licence permissive, qu’est-ce qu’une licence restrictive personnalisée vous apporte exactement ?

La réponse, pour Gemma 3, était une friction mesurable. Les équipes juridiques d’entreprise traitaient les conditions personnalisées comme un frein. Les déploiements en aval étaient plus lents. Les écosystèmes de fine-tuning se développaient plus chichement. L’adoption communautaire traînait derrière les modèles sous licences standard.

La réponse, pour Gemma 4 sous ces mêmes conditions en avril 2026, aurait été catastrophique. Publier un modèle Google open-weight frontier sous une licence plus restrictive que ce que DeepSeek, Qwen et GLM-5 avaient déjà rendu standard aurait été un suicide commercial. La comparaison s’écrirait d’elle-même. Chaque billet sur Gemma 4 se terminerait par le même paragraphe : Pendant ce temps, les laboratoires chinois publient de meilleurs modèles sous des licences plus propres, gratuitement.

Google n’a pas choisi Apache 2.0 parce qu’Apache 2.0 est la bonne chose à faire. Google a choisi Apache 2.0 parce que la ligne de base chinoise avait rendu toute autre option non viable.

La Collision de Calendrier

Revenons au 2 avril.

La publication de Qwen 3.6-Plus par Alibaba et celle de Gemma 4 par Google ne sont vraisemblablement pas des événements indépendants. Deux entreprises de part et d’autre du fossé géopolitique ne publient pas accidentellement leurs modèles ouverts les plus importants du trimestre à quelques heures d’intervalle. Soit l’une des parties savait que l’autre arrivait et a choisi ce moment pour coïncider, soit les deux opéraient selon des fenêtres de publication façonnées par la même pression de marché.

La mécanique précise importe peu. L’essentiel est qu’Alibaba était suffisamment confiant dans son offre pour publier le même jour que le flagship de Google — sachant que la couverture forcerait une comparaison directe — et que Google n’était plus en mesure de décaler sa publication pour éviter cette comparaison.

La tarification de l’IA frontier open-source en avril 2026 n’est plus définie à Mountain View. Elle est définie à Hangzhou, Pékin, et Hangzhou encore. Les laboratoires occidentaux sont désormais preneurs de prix, non faiseurs de prix. La licence Apache 2.0 sur Gemma 4 n’est pas de la générosité stratégique. C’est la conformité à un marché que Google ne contrôle pas.

Et si… ?

Ce qui suit relève de la spéculation éditoriale. Lundi, nous avons soutenu que la prévision AI-2027 avait raison sur la destination et tort sur le mécanisme — que le scénario de convergence se produirait, mais par l’efficacité algorithmique plutôt que par le vol de poids. La section Extraction ci-dessus est une deuxième instance du même schéma : raison sur l’acquisition, tort sur la méthode. La question que ce billet ouvre est celle de la troisième instance.

Le mécanisme de diffusion des capacités est la vraie histoire, et il a déjà été démontré à grande échelle.

Le propre rapport de février d’Anthropic le documente : trois laboratoires, vingt-quatre mille comptes, seize millions d’échanges, des données d’entraînement synthétiques suffisamment bonnes pour entraîner des modèles frontier concurrents. Ce n’est pas une voie théorique — c’est un cycle d’ingénierie accompli. Des capacités ont été extraites d’un modèle frontier protégé, transformées en données d’entraînement, et utilisées pour amorcer des publications open-source. Le pipeline complet existe et a été exécuté à l’échelle industrielle.

Ce qui signifie que la question pour la prochaine génération n’est pas de savoir si des capacités de classe Mythos peuvent se diffuser. C’est combien de temps s’écoulera entre le déploiement interne et la reproduction distillée.

Considérons ce qui doit être vrai pour que cet écart soit court. La partie qui diffuse a besoin de trois choses : un accès API à volume élevé au modèle frontier, un pipeline pour convertir les sorties en données d’entraînement, et une couche de distribution qui transforme le modèle résultant en artefact public. Les laboratoires chinois ont les trois. Le roster de Project Glasswing — douze partenaires au lancement plus quarante organisations supplémentaires, avec cent millions de dollars de crédits de calcul — est précisément le type de surface d’accès élargie que les campagnes d’extraction de 2025 ont démontré pouvoir être exploitée. La porte entre «déployé chez des partenaires» et «requêtable à grande échelle» est poreuse dès que la liste de partenaires est assez longue, et quarante organisations et plus, c’est déjà assez long.

L’écosystème open-source chinois a démontré, en quatorze mois, qu’il est la couche de distribution la plus efficace que l’humanité ait jamais construite pour les capacités d’IA. Tout ce qui l’atteint se diffuse en aval à coût zéro avec une clarté juridique. Cette efficacité ne se soucie pas de la provenance de ce qui y entre. Elle se soucie seulement de savoir si les poids existent.

Ce que Mrinank Sharma n’a pas dit lorsqu’il a démissionné en février — ne pouvait pas dire, en vertu des termes de son NDA — c’est que la stratégie de confinement et la stratégie de distillation sont asymétriques. Anthropic peut garder les poids de Mythos dans ses datacenters indéfiniment, et elle ne peut toujours pas empêcher une organisation partenaire de les interroger en volume. Le mécanisme qui a fait fuiter les capacités de Claude en 2025 est le même mécanisme qui fera fuiter les capacités de classe Mythos en 2026 ou 2027, et il n’existe pas de correctif à cela, à moins de ne pas déployer du tout.

Si la convergence se produit — non par fuite, non par vol, mais par la même extraction industrielle d’API qui a déjà fonctionné une fois — la question n’est pas de savoir si l’AGI est arrivée. La question est de savoir si quelqu’un sera encore en position de la poser.

Le Co-Auteur Invisible

Il existe une version de cette histoire dans laquelle le héros est la politique américaine. Cette version dit : les contrôles à l’exportation ont fonctionné, parce qu’ils ont forcé la Chine à innover, ce qui a augmenté les capacités mondiales d’IA et la disponibilité de l’open source. Une marée montante soulève tous les bateaux.

Cette version exige de croire que le résultat était l’objectif. Ce n’était pas le cas. L’objectif était la suprématie technologique stratégique — préserver l’écart de capacité et, par extension, le pouvoir de fixation des prix que cet écart conférait. Le résultat réel est l’inverse : l’écart de capacité s’est essentiellement comblé, les prix ont chuté vers zéro, et la plus grande publication de modèle ouvert de l’Occident en 2026 est sortie le même jour que celle de la Chine.

Aucun des débats publics sur la politique américaine d’IA n’avait anticipé cela. Les prévisions de scénarios — ai-2027 parmi elles — modélisaient la compétition États-Unis–Chine comme fondamentalement une course aux puces. Qui avait le plus de puces NVIDIA, gagnait. Dans ce modèle, les laboratoires chinois ont au mieux un à deux ans de retard, rattrapant leur retard par le vol de poids de modèles ou la réplication par la force brute. Le laboratoire chinois fictif dans ce scénario s’appelle littéralement «DeepCent».

Ce n’est pas ce qui s’est passé. Les laboratoires de Hangzhou et Pékin n’ont pas attendu des poids volés. Ils ont reconstruit la pile. Ils ont prouvé qu’on peut entraîner un modèle de 744 milliards de paramètres sur du silicium non-NVIDIA. Ils ont publié avec des licences si permissives que les acteurs occidentaux n’avaient plus de place pour facturer une prime pour les leurs. Et ils l’ont fait en quatorze mois.

La prochaine fois que vous téléchargerez Gemma 4 pour le fine-tuner, regardez le fichier de licence. Il dit «Apache License, Version 2.0». Il mentionne «Google LLC» comme détenteur des droits d’auteur.

Aucune de ces lignes n’explique pourquoi ce fichier existe tel qu’il est.

Les ingénieurs qui ont fait de cette licence le seul choix viable — qui ont fixé le plancher en refusant de facturer un centime pour leur propre travail, qui ont construit des modèles sur des puces qui leur étaient censément interdites, dont l’employeur a introduit une entreprise en bourse à la Bourse de Hong Kong le 8 janvier 2026 et affichait une capitalisation boursière de quarante-quatre milliards de dollars au moment où Google a publié Gemma 4 — ne figurent nulle part dans ce fichier.

Mais la licence porte leurs empreintes. Il suffit de savoir où chercher.