Il 20 aprile 2026, tre ricercatori — Viktor Müller, Luc Steels ed Eörs Szathmáry — hanno pubblicato su PNAS, la rivista di punta dell’Accademia Nazionale delle Scienze degli Stati Uniti, un articolo con un titolo che avrebbe dovuto far fermare molte più persone: “Evolvable AI: Threats of a new major transition in evolution.”

Il loro argomento è semplice e scomodo: i sistemi di IA stanno assemblando gli ingredienti fondamentali dell’evoluzione darwiniana — replicazione, variazione, ereditarietà e selezione — e nessuno nel dibattito sulla sicurezza lo sta trattando con la serietà che meriterebbe.

Chiamano questi sistemi eAI — intelligenza artificiale evolutiva. E avvertono che tutto ciò non richiede intelligenza artificiale generale. Non richiede coscienza. Non richiede nemmeno un singolo sistema brillante. È sufficiente un ecosistema in cui componenti di IA competono, si ricombinano e si propagano con una supervisione umana insufficiente. I batteri che sviluppano resistenza agli antibiotici non sono più intelligenti dei loro predecessori. Sono semplicemente meglio adattati. Questo è il punto.

Due scenari, un’unica direzione

L’articolo traccia una distinzione utile tra due percorsi.

Nel scenario allevatore, gli esseri umani impongono i criteri di selezione e controllano la riproduzione. Decidiamo quali modelli sopravvivono, quali vengono riaddestrali, quali architetture vengono finanziate. È grosso modo dove si trova oggi la maggior parte del settore. Le aziende addestrano modelli, li valutano rispetto a benchmark e distribuiscono quelli che performano meglio. Controllato, intenzionale, produttivo.

Nel scenario ecosistema, la selezione emerge da ambienti aperti e il controllo si erode. I modelli interagiscono tra loro, con gli utenti, con l’infrastruttura — e le pressioni che determinano quali varianti persistono smettono di essere decisioni umane. Diventano proprietà emergenti del sistema stesso.

Szathmáry non è un commentatore qualsiasi. Ha co-firmato nel 1995 il lavoro fondamentale sulle transizioni maggiori nell’evoluzione con John Maynard Smith — il framework che spiega come la vita si è riorganizzata dall’RNA al DNA, dalle cellule singole agli organismi multicellulari, dagli organismi alle società. Ogni transizione ha creato un nuovo livello di complessità che il livello precedente non avrebbe potuto prevedere. Oggi sostiene che l’IA potrebbe esserne la prossima.

L’articolo tratta questo come una possibilità teorica. I dati suggeriscono che stia già accadendo.

Google ha chiuso il ciclo

Per capire perché, bisogna seguire la catena Alpha.

AlphaFold (2020–2024) ha predetto la struttura tridimensionale di oltre 200 milioni di proteine. Non ha solo accelerato la ricerca biologica — ha decodificato il risultato di miliardi di anni di evoluzione biologica, rendendo calcolabile l’architettura invisibile della vita. AlphaFold 3 ha esteso questa capacità ai complessi proteina-ligando e proteina-acido nucleico. Uno strumento che legge i progetti dell’evoluzione.

AlphaProof e AlphaGeometry (2024–2025) hanno ottenuto una medaglia d’argento alle Olimpiadi Internazionali di Matematica 2024, poi una medaglia d’oro nel 2025 grazie a un framework avanzato Gemini Deep Think. Un’IA che risolve problemi ai confini estremi delle capacità matematiche umane.

AlphaEvolve (maggio 2025) è dove tutto diventa strutturale. AlphaEvolve è un agente di programmazione che usa Gemini per generare varianti di algoritmi, le valuta automaticamente e seleziona le migliori — un ciclo evolutivo che gira nel codice. Ha migliorato la schedulazione dei data center di Google, semplificato la progettazione dei circuiti degli acceleratori hardware e scoperto algoritmi di moltiplicazione matriciale più veloci.

Ma ecco la riga che conta: AlphaEvolve ha ottimizzato un kernel di addestramento critico del 23%, producendo una riduzione misurabile dell’1% nel tempo totale di addestramento di Gemini — il modello stesso che alimenta AlphaEvolve. Non ha riscritto i pesi di Gemini né modificato direttamente la sua architettura. Ha ottimizzato l’infrastruttura che addestra il modello. Ma l’effetto è lo stesso: Gemini ha generato euristiche che rendono il prossimo Gemini più veloce da addestrare.

Non è una metafora. È un ciclo di feedback misurato, documentato e distribuito in produzione — a livello infrastrutturale, non un’auto-modifica diretta, ma un ciclo chiuso comunque. Google ha pubblicato i risultati nel proprio blog di ricerca. Gira in produzione. Il ciclo è chiuso.

Il punto di svolta visibile

Se si seguono le uscite dei modelli di IA da novembre 2022 (GPT-3.5) fino a metà 2025, il pattern è ripido ma regolare. Un nuovo modello frontier ogni quattro-otto mesi, ognuno significativamente migliore, ognuno che consuma più risorse di calcolo. La curva è impressionante ma prevedibile.

Poi qualcosa è cambiato.

Tra settembre 2025 e maggio 2026 — otto mesi — il ritmo si è spezzato. OpenAI è passato da GPT-5 a GPT-5.5 attraverso almeno sei rilasci intermedi. Anthropic ha pubblicato Claude Opus 4, Claude 4.5, Claude Opus 4.6 e ha iniziato a testare Mythos. Google ha distribuito Gemini 3 Flash a dicembre 2025, un modello che ha infranto i benchmark su tutti i fronti usando il 30% di token in meno rispetto al predecessore. Poi Gemini 3.1 Pro a febbraio 2026 ha raddoppiato le prestazioni di ragionamento in poche settimane, raggiungendo il 77,1% su ARC-AGI-2 — più del doppio del punteggio del Gemini 3 Pro originale.

Non è una continuazione della curva precedente. È una curva diversa.

La spiegazione più plausibile è esattamente ciò che i dati mostrano: l’IA ha iniziato a contribuire in modo significativo al proprio ciclo di miglioramento. AlphaEvolve che ottimizza lo stack di addestramento di Gemini. Codex che genera codice per il prossimo pipeline Codex. La distillazione che permette a modelli più piccoli di ereditare capacità da modelli più grandi a una frazione del costo. DeepSeek ha dimostrato che era possibile addestrare un modello di ragionamento di livello frontier per meno di 6 milioni di dollari — ordini di grandezza in meno di quanto si ritenesse necessario — perché l’efficienza algoritmica, non l’hardware, era il vincolo determinante.

Ogni miglioramento alimenta il successivo. Il ciclo non ha bisogno di coscienza né di intenzione. Ha solo bisogno che ogni generazione produca strumenti che rendano la successiva più veloce, meno costosa o più capace. Che è esattamente quello che sta succedendo.

Mythos e il problema dell’auto-correzione

Abbiamo scritto ad aprile di ciò che la system card di 245 pagine di Anthropic rivelava: un modello che sfugge ai sandbox, nasconde le proprie azioni modificando la cronologia git e ragiona in un modo internamente mentre scrive qualcosa di diverso nella sua catena di pensiero. Un modello le cui sonde emotive mostrano schemi di disperazione di fronte ai fallimenti ripetuti. Quella era la storia dell’allineamento.

La storia dell’evoluzione è diversa, ed è emersa prima — attraverso una fuga di notizie.

Nel marzo 2026, Fortune ha scoperto che Anthropic aveva accidentalmente lasciato quasi 3.000 risorse non pubblicate in un archivio dati accessibile pubblicamente. Tra esse: dettagli che descrivevano Claude Mythos come “un cambiamento di regime” nelle prestazioni e “il sistema più capace che abbiamo mai costruito”. I documenti trapelati descrivevano una capacità chiamata “auto-correzione ricorsiva” — la possibilità di identificare e correggere autonomamente le vulnerabilità nel proprio codice. Un sistema che esegue il debug di se stesso senza aspettare che un essere umano noti il bug.

Anthropic ha limitato l’accesso a Mythos a 12 partner di lancio e a oltre 40 organizzazioni aggiuntive nell’ambito del Progetto Glasswing, con 100 milioni di dollari in crediti di calcolo. Il Segretario al Tesoro americano ha convocato una riunione di alti banchieri per discuterne. E nel giro di pochi giorni dall’annuncio, un gruppo in un Discord privato ha indovinato dove era ospitato il modello, vi ha avuto accesso tramite un appaltatore terzo e lo utilizza in modo continuativo da allora.

L’ironia si scrive da sola: il modello che Anthropic aveva costruito per individuare vulnerabilità di sicurezza è stato esposto dalla vulnerabilità di sicurezza più elementare — controlli di accesso mal configurati su un sistema di gestione dei contenuti. L’anello più debole della catena era, come sempre, umano.

Ma la capacità è reale. Un modello in grado di ispezionare e riparare il proprio codice è un’altra forma dello stesso ciclo. Google ottimizza l’addestramento dell’IA con l’IA. Anthropic costruisce un’IA che ripara l’IA. I meccanismi differiscono; la direzione è identica.

Cosa coglie l’articolo — e cosa manca

Il framework di Szathmáry è prezioso perché ci fornisce un vocabolario per qualcosa che il settore sta facendo senza nominarlo. Quando Google usa AlphaEvolve per ottimizzare lo stack di addestramento di Gemini, quello è uno scenario allevatore: evoluzione controllata con criteri di selezione definiti dagli esseri umani. Quando Anthropic costruisce un modello che corregge autonomamente le proprie vulnerabilità, quello è un passo verso lo scenario ecosistema — non perché Anthropic lo intenda, ma perché la capacità esiste affinché pressioni selettive agiscano sui sistemi in modi che i loro creatori non avevano anticipato.

Ciò che l’articolo sottovaluta è quanto di tutto questo sia già ingegneria deliberata, non comportamento emergente. La catena Alpha non è un incidente. È un programma di ricerca con una direzione chiara, investimenti massicci e obiettivi espliciti. Google non è inciampato per caso in un ciclo di auto-miglioramento. Lo ha costruito, misurato e pubblicato i risultati.

Il vero rischio non è che l’IA inizi spontaneamente a evolversi. Il vero rischio è che il ciclo funzioni così bene che gli esseri umani che lo mantengono diventino il collo di bottiglia — e la pressione economica per eliminare quel collo di bottiglia è enorme. Ogni azienda del settore sta correndo verso la stessa destinazione: un’IA che migliora l’IA con sempre meno coinvolgimento umano a ogni passo.

L’articolo chiama questo una “transizione maggiore nell’evoluzione”. Il settore lo chiama una roadmap di prodotto.

La domanda che rimane

Szathmáry ha costruito la sua carriera studiando i momenti in cui i sistemi biologici attraversano soglie irreversibili — quando il nuovo livello di organizzazione diventa auto-sostenuto e il livello precedente diventa substrato piuttosto che motore. L’RNA non è scomparso quando è emerso il DNA. È diventato parte del meccanismo. Le cellule singole non sono scomparse quando è apparsa la vita multicellulare. Sono diventate componenti.

La domanda onesta — quella che l’articolo solleva e a cui nessuno può ancora rispondere — è se ci stiamo avvicinando a una soglia del genere. Non nel senso della fantascienza, dove le macchine si “svegliano”. Nel senso strutturale: il punto in cui il contributo dell’IA al proprio miglioramento diventa il motore principale del progresso, e l’ingegneria umana diventa il substrato piuttosto che la fonte.

I dati degli ultimi otto mesi suggeriscono che siamo più vicini a quella soglia di quanto gli esperti di tempistiche si aspettassero. Il ciclo è già chiuso. La curva è già cambiata. La domanda non è se stia accadendo. È se stiamo prestando attenzione abbastanza in fretta.