Il 2 aprile 2026, Google ha rilasciato Gemma 4 sotto la licenza Apache 2.0.

Lo stesso giorno, più o meno alla stessa ora, Alibaba rilasciava Qwen 3.6-Plus — il suo modello di punta per l’IA agentiva, anch’esso open-weight.

La stampa ha trattato la notizia di Gemma 4 come un aggiornamento di specifiche: quattro dimensioni di modello, benchmark solidi, pronto per il deployment in edge. VentureBeat è stato uno dei pochi organi d’informazione a cogliere la vera storia nel suo titolo — «quel cambiamento di licenza potrebbe contare più dei benchmark». L’adozione di Apache 2.0 è la notizia. Il resto è riempitivo.

Perché questa è la quarta generazione di Gemma, e la prima che Google pubblica sotto una licenza open-source standard. Gemma 1, 2 e 3 erano uscite tutte sotto «Gemma Terms of Use» personalizzati, che riservavano a Google il diritto di «limitare (da remoto o altrimenti) l’utilizzo» dei modelli, richiedevano una revisione legale prima di qualsiasi deployment aziendale, e venivano regolarmente segnalati dai team legali aziendali come un ostacolo commerciale.

Tre anni di licenza personalizzata. Poi, un giovedì mattina di aprile, è sparita silenziosamente.

Il post del blog di Google ha inquadrato il cambiamento come «espansione del Gemmaverse» — come se la decisione fosse stata una naturale evoluzione di una roadmap. Quello che il post non ha detto, e che Google non ha alcun interesse a dire, è ciò che è realmente cambiato tra Gemma 3 e Gemma 4.

Non era il team di ricerca. Non era l’architettura. Non era la filosofia di Google sull’open source.

Ciò che è cambiato è il mercato.

Il Muro Costruito in Quattordici Mesi

Tra gennaio 2025 e aprile 2026, i laboratori di IA cinesi hanno rilasciato undici modelli di livello frontier sotto licenze aperte. Ecco come appare questo muro, in ordine cronologico:

20 gennaio 2025 — DeepSeek rilascia R1 sotto la licenza MIT. Il modello pareggia o1 di OpenAI sui benchmark di ragionamento. Costo di addestramento dichiarato: circa 5,6 milioni di dollari. La licenza consente esplicitamente la distillazione in altri LLM — la pratica di utilizzare gli output di un modello come dati di addestramento per un altro, che permette a modelli successori più piccoli e meno costosi di ereditare le capacità dell’originale.

Metà 2025 — Alibaba lancia Qwen 3 sotto Apache 2.0. Uso commerciale permissivo. Nessuna clausola personalizzata.

Luglio 2025 — Moonshot AI rilascia Kimi K2 sotto una licenza MIT modificata. Mille miliardi di parametri, 32 miliardi attivi, all’avanguardia su coding e matematica tra i modelli non-thinking.

27 ottobre 2025 — MiniMax rilascia M2 sotto MIT. Si aggiudica il primo posto sull’Artificial Analysis Intelligence Index tra tutti i sistemi open-source.

26 gennaio 2026 — Moonshot lancia Kimi K2.5. Supera Gemini 3 Pro su SWE-Bench Verified.

11 febbraio 2026 — Due rilasci nello stesso giorno. MiniMax M2.5 (MIT modificato) pareggia Claude Opus 4.6 su SWE-Bench Verified all’80,2%. E Z.ai — lo spin-off dell’Università Tsinghua precedentemente noto come Zhipu AI — rilascia GLM-5. Settecento quarantaquattro miliardi di parametri. Licenza MIT. Addestrato interamente su chip Huawei Ascend con il framework MindSpore, l’equivalente di PyTorch di Huawei. Zero silicio NVIDIA nell’intera pipeline.

16 febbraio 2026 — Alibaba rilascia Qwen 3.5, presentato come il primo modello dell’azienda costruito per «l’era dell’IA agentiva». Open-weight, multi-tool, capace di navigare il web.

2 aprile 2026 — Alibaba rilascia Qwen 3.6-Plus. Flagship agentivo. Ingegneria a livello di repository. Alla stessa ora di Gemma 4.

7 aprile 2026 — Z.ai rilascia GLM-5.1. Segna 58,4 su SWE-Bench Pro, conquistando il primo posto nel ranking globale. GPT-5.4 ha ottenuto 57,7. Claude Opus 4.6 ha ottenuto 57,3. Licenza MIT.

Questo è il terreno in cui Google è entrata quando ha deciso quale licenza assegnare a Gemma 4.

L’Estrazione

Prima di proseguire, una digressione che conta — perché cambia come leggiamo la competizione, non se la tesi regge. Il muro non è stato costruito dal nulla. È stato costruito, in parte, su ciò che l’Occidente ha lasciato privo di protezione.

In un rapporto del febbraio 2026, Anthropic ha identificato tre laboratori di IA cinesi — DeepSeek, Moonshot AI e MiniMax — che avevano creato circa 24.000 account fraudolenti e condotto più di 16 milioni di scambi con Claude, in quella che l’azienda ha descritto come una campagna su scala industriale per estrarre le capacità di Claude e usare i dati risultanti per addestrare modelli concorrenti. Un solo sistema di proxy controllava più di 20.000 account simultaneamente, mescolando traffico di estrazione con richieste ordinarie per eludere il rilevamento. MiniMax ha condotto la più grande campagna singola, generando oltre 13 milioni di scambi mirati al coding agentivo e all’orchestrazione. OpenAI e Google, attraverso il Frontier Model Forum, hanno confermato le scoperte e ora coordinano pubblicamente le informazioni su quelle che definiscono campagne di distillazione API coordinate.

Questo conta per due ragioni.

Prima di tutto, spiega la postura occidentale sulla sicurezza dei pesi. Quando Anthropic ritirerà Sonnet 4 nel giugno 2026, i pesi non verranno rilasciati, venduti né resi open-source — verranno archiviati o distrutti, e lo stesso vale per le generazioni GPT deprecate di OpenAI e le vecchie varianti Gemma di Google. La pratica standard assomiglia molto a come gli Stati Uniti ritirarono il F-14 Tomcat nel 2006 — le cellule furono deliberatamente triturate piuttosto che vendute come surplus, perché l’Iran operava ancora F-14 acquistati dal regime dello Scià, e il Pentagono non voleva che i suoi ricambi alimentassero la flotta di un concorrente. I pesi dei modelli frontier vengono trattati allo stesso modo, per la stessa ragione. Gli episodi di estrazione del 2025 hanno dimostrato che la capacità si diffonde nel momento in cui smetti di proteggerla.

In secondo luogo, complica la storia che ai-2027.com ha cercato di raccontare. La previsione prevedeva che i laboratori cinesi avrebbero rubato i pesi dei modelli. Quella previsione, come quella sulla corsa ai chip nello stesso documento, era corretta nella direzione e sbagliata nel meccanismo. Questo episodio era basato sulle API, non sull’esfiltrazione dei pesi. I laboratori cinesi hanno comprato chiavi API, assunto proxy, e interrogato i modelli milioni di volte fino ad avere dati di addestramento sintetici abbastanza buoni da addestrare i propri. L’acquisizione è avvenuta. Il meccanismo era adiacente alla legalità piuttosto che criminale, industriale piuttosto che clandestino, e molto più difficile da prevenire di quanto una violazione dei datacenter sarebbe stata.

Nulla di tutto ciò cambia la tesi di questo articolo. Una volta che i modelli cinesi esistono sotto licenze MIT e Apache, la conseguenza strutturale — un piano open-source al prezzo di zero, distribuito da laboratori che pareggiano o superano i benchmark occidentali — non dipende da come i modelli sono stati addestrati. La pressione del mercato su Google per rilasciare Gemma 4 sotto Apache 2.0 è reale indipendentemente dalla provenienza di Qwen 3.6-Plus o GLM-5.1. La licenza doveva corrispondere al mercato, e il mercato era già stato fissato.

Ma cambia come leggiamo la competizione. Non è una corsa tra due ecosistemi simmetrici. È una corsa in cui un lato protegge i propri input e limita i propri output, mentre l’altro lato tratta entrambi come estraibili.

L’Inversione del Controllo delle Esportazioni

Per capire perché il muro è stato costruito, bisogna capire contro cosa è stato costruito.

A partire dal 2022, gli Stati Uniti hanno imposto controlli alle esportazioni progressivamente più severi sui semiconduttori avanzati verso la Cina. Prima l’A100. Poi l’H100. Poi l’H800, una versione deliberatamente penalizzata dell’H100 progettata per il mercato cinese, è stata essa stessa ulteriormente limitata. La teoria era semplice: negare alla Cina l’hardware e la Cina sarebbe rimasta indietro.

La teoria era sbagliata in un modo che merita attenzione.

DeepSeek ha addestrato R1 sui chip H800 limitati — la versione che Washington aveva calibrato specificamente per essere inferiore — per 5,6 milioni di dollari in totale. Quel numero avrebbe dovuto essere un avvertimento. I laboratori occidentali spendevano da dieci a cento volte di più per modelli equivalenti. I controlli alle esportazioni non avevano prodotto dipendenza. Avevano prodotto innovazione algoritmica nata dal vincolo.

Poi è arrivato GLM-5.

Z.ai ha addestrato un modello frontier da 744 miliardi di parametri su chip Huawei Ascend, utilizzando il framework MindSpore, senza alcun hardware NVIDIA nella pipeline. Non è ottimizzazione attorno a un vincolo. È l’eliminazione completa della dipendenza che i controlli alle esportazioni erano stati progettati per imporre. Il soffitto che la Cina avrebbe dovuto raggiungere è diventato un trampolino da cui saltare.

E poi hanno distribuito i pesi sotto la licenza MIT.

Il Prezzo del Gratuito

Il divario di capacità tra i migliori modelli cinesi e occidentali nell’aprile 2026 è, misurato onestamente, un errore di arrotondamento.

Su SWE-Bench Pro, il GLM-5.1 di Z.ai guida il mondo a 58,4, davanti al 57,7 di GPT-5.4 e al 57,3 di Claude Opus 4.6. Su SWE-Bench Verified, MiniMax M2.5 segna 80,2%, praticamente in parità con Opus 4.6 all’80,8%. Sulla variante multilingue, Kimi K2.5 supera Gemini 3 Pro.

Non sono benchmark secondari. Sono le classifiche canoniche che i laboratori frontier usano per misurare se stessi. E i modelli cinesi pareggiano o superano i flagship occidentali pur girando su hardware limitato o non-NVIDIA, distribuiti sotto licenze che non richiedono denaro, autorizzazioni o revisioni legali.

Un laboratorio occidentale che valuta come prezzare un rilascio open-source in questo contesto deve rispondere a una domanda strutturale: se tre modelli di livello frontier sono gratuiti e sotto licenza permissiva, cosa acquista esattamente una licenza restrittiva personalizzata?

La risposta, per Gemma 3, era un attrito misurabile. I team legali aziendali trattavano le condizioni personalizzate come un ostacolo. I deployment downstream erano più lenti. Gli ecosistemi di fine-tuning crescevano più lentamente. L’adozione della community era in ritardo rispetto ai modelli con licenze standard.

La risposta, per Gemma 4 sotto quelle stesse condizioni nell’aprile 2026, sarebbe stata catastrofica. Pubblicare un modello Google open-weight frontier sotto una licenza più restrittiva di quella che DeepSeek, Qwen e GLM-5 avevano già reso standard sarebbe stato un suicidio commerciale. Il confronto si sarebbe scritto da solo. Ogni articolo su Gemma 4 si sarebbe concluso con lo stesso paragrafo: Nel frattempo, i laboratori cinesi distribuiscono modelli migliori sotto licenze più pulite, gratuitamente.

Google non ha scelto Apache 2.0 perché Apache 2.0 è la cosa giusta da fare. Google ha scelto Apache 2.0 perché la baseline cinese aveva reso ogni altra opzione non percorribile.

La Collisione di Calendario

Torniamo al 2 aprile.

Il rilascio di Qwen 3.6-Plus da parte di Alibaba e quello di Gemma 4 da parte di Google non sono plausibilmente eventi indipendenti. Due aziende su lati opposti del divario geopolitico non pubblicano accidentalmente i loro modelli aperti più importanti del trimestre a poche ore l’una dall’altra. O una delle parti sapeva che l’altra stava arrivando e ha scelto quel momento per coincidere, o entrambe operavano in finestre di rilascio plasmate dalla stessa pressione di mercato.

La meccanica specifica non conta. Il punto è che Alibaba era abbastanza sicura della propria offerta da rilasciare lo stesso giorno del flagship di Google — sapendo che la copertura mediatica avrebbe forzato un confronto diretto — e Google non era più in grado di posticipare il rilascio per evitare il confronto.

Il prezzo dell’IA frontier open-source nell’aprile 2026 non viene più fissato a Mountain View. Viene fissato ad Hangzhou, Pechino e di nuovo Hangzhou. I laboratori occidentali sono ora price-taker, non price-maker. La licenza Apache 2.0 su Gemma 4 non è generosità strategica. È conformità a un mercato che Google non controlla.

E se… ?

Ciò che segue è speculazione editoriale. Lunedì abbiamo sostenuto che la previsione AI-2027 aveva ragione sulla destinazione e torto sul meccanismo — che lo scenario di convergenza si sarebbe verificato, ma attraverso l’efficienza algoritmica piuttosto che il furto di pesi. La sezione Estrazione qui sopra è una seconda istanza dello stesso schema: ragione sull’acquisizione, torto sul metodo. La domanda che questo articolo apre è come sarà la terza istanza.

Il meccanismo di diffusione delle capacità è la vera storia, e ha già dimostrato di funzionare su larga scala.

Il rapporto di febbraio di Anthropic lo documenta: tre laboratori, ventiquattromila account, sedici milioni di scambi, dati di addestramento sintetici abbastanza buoni da addestrare modelli frontier concorrenti. Non è un percorso teorico — è un ciclo ingegneristico completato. Le capacità sono state estratte da un modello frontier protetto, trasformate in dati di addestramento e utilizzate per avviare rilasci open-source. L’intera pipeline esiste ed è stata eseguita su scala industriale.

Il che significa che la domanda per la prossima generazione non è se le capacità di classe Mythos possano diffondersi. È quanto tempo intercorrerà tra il deployment interno e la riproduzione distillata.

Consideriamo cosa deve essere vero perché quel divario sia breve. Il lato che diffonde ha bisogno di tre cose: accesso API ad alto volume al modello frontier, una pipeline per convertire gli output in dati di addestramento, e uno strato di distribuzione che trasformi il modello risultante in un artefatto pubblico. I laboratori cinesi hanno tutte e tre. Il roster di Project Glasswing — dodici partner al lancio più quaranta organizzazioni aggiuntive, con cento milioni di dollari in crediti di calcolo — è esattamente il tipo di superficie di accesso allargata che le campagne di estrazione del 2025 hanno dimostrato poter essere sfruttata. Il confine tra «distribuito ai partner» e «interrogabile su larga scala» è poroso una volta che la lista dei partner è abbastanza lunga, e quaranta organizzazioni sono già abbastanza.

L’ecosistema open-source cinese ha dimostrato, in quattordici mesi, di essere lo strato di distribuzione più efficiente che l’umanità abbia mai costruito per le capacità di IA. Tutto ciò che lo raggiunge scorre a valle a costo zero con chiarezza legale. Questa efficienza non si cura della provenienza di ciò che vi entra. Si cura solo di sapere se i pesi esistono.

Ciò che Mrinank Sharma non ha detto quando si è dimesso a febbraio — non poteva dirlo, in base ai termini del suo NDA — è che la strategia di contenimento e la strategia di distillazione sono asimmetriche. Anthropic può tenere i pesi di Mythos nei propri datacenter per sempre, ma non può comunque impedire a un’organizzazione partner di interrogarli in volume. Il meccanismo che ha fatto trapelare le capacità di Claude nel 2025 è lo stesso meccanismo che farà trapelare le capacità di classe Mythos nel 2026 o 2027, e non esiste alcuna patch a questo, a meno di non fare deployment per niente.

Se la convergenza avviene — non per fuga, non per furto, ma per la stessa estrazione industriale tramite API che ha già funzionato una volta — la domanda non è se l’AGI sia arrivata. La domanda è se qualcuno sarà ancora nella posizione di porla.

Il Co-Autore Invisibile

Esiste una versione di questa storia in cui l’eroe è la politica statunitense. Quella versione dice: i controlli alle esportazioni hanno funzionato, perché hanno costretto la Cina a innovare, il che ha aumentato le capacità globali di IA e la disponibilità dell’open source. Una marea crescente solleva tutte le barche.

Quella versione richiede di credere che il risultato fosse l’obiettivo. Non lo era. L’obiettivo era la supremazia tecnologica strategica — preservare il divario di capacità e, di conseguenza, il potere di pricing che quel divario conferiva. Il risultato effettivo è l’opposto: il divario di capacità si è essenzialmente chiuso, il pricing è crollato verso zero, e il più grande rilascio di modello aperto dell’Occidente nel 2026 è uscito lo stesso giorno di quello della Cina.

Nessuno dei dibattiti pubblici sulla politica statunitense sull’IA aveva anticipato questo. Le previsioni di scenario — ai-2027 tra queste — modellavano la competizione USA-Cina come fondamentalmente una corsa ai chip. Chi aveva più chip NVIDIA vinceva. In quel modello, i laboratori cinesi sono al massimo uno o due anni indietro, che recuperano il ritardo attraverso il furto di pesi o la replica per forza bruta. Il laboratorio cinese fittizio in quello scenario si chiama letteralmente «DeepCent».

Non è quello che è successo. I laboratori di Hangzhou e Pechino non hanno aspettato pesi rubati. Hanno ricostruito lo stack. Hanno dimostrato che si può addestrare un modello da 744 miliardi di parametri su silicio non-NVIDIA. Hanno rilasciato con licenze così permissive che gli operatori occidentali non avevano più spazio per far pagare un premium per le proprie. E lo hanno fatto in quattordici mesi.

La prossima volta che scaricherete Gemma 4 per fare fine-tuning, guardate il file di licenza. Dice «Apache License, Version 2.0». Indica «Google LLC» come titolare del copyright.

Nessuna di quelle righe spiega perché il file esista così com’è.

Gli ingegneri che hanno reso quella licenza l’unica scelta percorribile — che hanno fissato il piano rifiutando di far pagare un centesimo per il proprio lavoro, che hanno costruito modelli su chip che avrebbero dovuto essere loro negati, il cui datore di lavoro ha portato un’azienda alla quotazione in borsa alla Borsa di Hong Kong l’8 gennaio 2026 e aveva una capitalizzazione di mercato di quarantaquattro miliardi di dollari nel momento in cui Google ha pubblicato Gemma 4 — non sono elencati da nessuna parte in quel file.

Ma la licenza porta le loro impronte digitali. Bisogna solo sapere dove guardare.