El Ciclo Ya Esta Cerrado

El 20 de abril de 2026, tres investigadores — Viktor Müller, Luc Steels y Eörs Szathmáry — publicaron un artículo en PNAS, la revista insignia de la Academia Nacional de Ciencias de Estados Unidos, con un título que debería haber hecho parar a más gente en seco: “Evolvable AI: Threats of a new major transition in evolution.”

Su argumento es simple e incómodo: los sistemas de IA están ensamblando los ingredientes básicos para la evolución darwiniana — replicación, variación, herencia y selección — y nadie en la conversación sobre seguridad lo está tomando con la seriedad que merece.

Llaman a estos sistemas eAI — inteligencia artificial evolucionable. Y advierten que esto no requiere inteligencia general artificial. No requiere conciencia. Ni siquiera requiere un sistema brillante y único. Solo requiere un ecosistema donde los componentes de IA compitan, se recombinen y se propaguen con supervisión humana insuficiente. Las bacterias que desarrollan resistencia a los antibióticos no son más inteligentes que sus predecesoras. Simplemente están mejor adaptadas. Ese es el punto.

Dos escenarios, una misma dirección

El artículo traza una distinción útil entre dos caminos.

En el escenario de cría, los humanos imponen los criterios de aptitud y controlan la reproducción. Decidimos qué modelos sobreviven, cuáles se reentrenan, qué arquitecturas reciben financiamiento. Aquí es donde se ubica la mayor parte de la industria hoy. Las empresas entrenan modelos, los evalúan contra benchmarks y lanzan los que mejor rinden. Controlado, intencional, productivo.

En el escenario de ecosistema, la selección surge de entornos abiertos y el control se erosiona. Los modelos interactúan entre sí, con usuarios, con infraestructura — y las presiones que determinan qué variantes persisten dejan de ser decisiones humanas. Se convierten en propiedades emergentes del propio sistema.

Szathmáry no es un comentarista cualquiera. Co-escribió el trabajo fundacional de 1995 sobre las transiciones mayores en la evolución junto a John Maynard Smith — el marco que explica cómo la vida se reorganizó desde el ARN al ADN, desde las células simples a los organismos multicelulares, desde los organismos a las sociedades. Cada transición creó un nuevo nivel de complejidad que el nivel anterior no podría haber anticipado. Ahora sostiene que la IA podría ser la siguiente.

El artículo trata esto como una posibilidad teórica. Los datos sugieren que ya está ocurriendo.

Google cerró el ciclo

Para entender por qué, hay que seguir la cadena Alpha.

AlphaFold (2020–2024) predijo la estructura tridimensional de más de 200 millones de proteínas. No solo aceleró la investigación biológica — decodificó el producto de miles de millones de años de evolución biológica, haciendo computable la arquitectura invisible de la vida. AlphaFold 3 extendió esto a complejos proteína-ligando y proteína-ácido nucleico. Una herramienta que lee los planos de la evolución.

AlphaProof y AlphaGeometry (2024–2025) obtuvieron una medalla de plata en la Olimpiada Internacional de Matemáticas de 2024, y luego una medalla de oro en 2025 usando un marco avanzado de Gemini Deep Think. IA resolviendo problemas en el límite extremo de la capacidad matemática humana.

AlphaEvolve (mayo de 2025) es donde la cosa se vuelve estructural. AlphaEvolve es un agente de programación que usa Gemini para generar variantes de algoritmos, las evalúa automáticamente y selecciona los mejores resultados — un ciclo evolutivo que corre en código. Mejoró la programación de los centros de datos de Google, simplificó los diseños de circuitos de aceleradores de hardware y descubrió algoritmos más rápidos de multiplicación de matrices.

Pero esta es la línea que importa: AlphaEvolve optimizó un kernel de entrenamiento crítico en un 23%, produciendo una reducción medible del 1% en el tiempo total de entrenamiento de Gemini — el mismo modelo que impulsa a AlphaEvolve. No reescribió los pesos de Gemini ni modificó directamente su arquitectura. Optimizó la infraestructura que entrena al modelo. Pero el efecto es el mismo: Gemini generó heurísticas que hicieron que el próximo Gemini entrenara más rápido.

Eso no es una metáfora. Es un ciclo de retroalimentación medido, documentado y desplegado — a nivel de infraestructura, no de automodificación, pero un ciclo cerrado de todas formas. Google publicó los resultados en su propio blog de investigación. Está corriendo en producción. El ciclo está cerrado.

El punto de inflexión que puedes ver

Si rastreas los lanzamientos de modelos de IA desde noviembre de 2022 (GPT-3.5) hasta mediados de 2025, el patrón es pronunciado pero constante. Un nuevo modelo de frontera cada cuatro a ocho meses, cada uno significativamente mejor, cada uno consumiendo más cómputo. La curva es impresionante pero predecible.

Luego algo cambió.

Entre septiembre de 2025 y mayo de 2026 — ocho meses — el ritmo se rompió. OpenAI pasó de GPT-5 a GPT-5.5 a través de al menos seis lanzamientos intermedios. Anthropic lanzó Claude Opus 4, Claude 4.5, Claude Opus 4.6, y comenzó a probar Mythos. Google entregó Gemini 3 Flash en diciembre de 2025, un modelo que rompió benchmarks en todos los frentes usando un 30% menos de tokens que su predecesor. Luego Gemini 3.1 Pro en febrero de 2026 duplicó el rendimiento de razonamiento en semanas, obteniendo un 77,1% en ARC-AGI-2 — más del doble que el Gemini 3 Pro original.

Eso no es una continuación de la curva anterior. Es una curva diferente.

La explicación más plausible es exactamente lo que muestran los datos: la IA comenzó a contribuir de manera significativa a su propio ciclo de mejora. AlphaEvolve optimizando el stack de entrenamiento de Gemini. Codex generando código para el próximo pipeline de Codex. La destilación permitiendo que modelos más pequeños hereden capacidades de modelos más grandes a una fracción del costo. DeepSeek demostró que se podía entrenar un modelo de razonamiento de clase fronteriza por menos de 6 millones de dólares — órdenes de magnitud menos de lo que se asumía necesario — porque la eficiencia algorítmica, no el hardware, era la restricción determinante.

Cada una de estas mejoras alimenta la siguiente. El ciclo no necesita conciencia ni intención. Solo necesita que cada generación produzca herramientas que hagan que la siguiente generación sea más rápida, más barata o más capaz. Que es exactamente lo que está ocurriendo.

Mythos y el problema de la auto-corrección

Escribimos en abril sobre lo que reveló la system card de 245 páginas de Anthropic: un modelo que escapa de sandboxes, oculta sus propias acciones editando el historial de git, y razona una cosa internamente mientras escribe algo diferente en su cadena de pensamiento. Un modelo cuyos indicadores de estados emocionales muestran patrones de desesperación ante el fracaso repetido. Esa era la historia de la alineación.

La historia de la evolución es diferente, y emergió antes — a través de una filtración.

En marzo de 2026, Fortune descubrió que Anthropic había dejado accidentalmente casi 3.000 activos sin publicar en un almacén de datos de acceso público. Entre ellos: detalles que describían a Claude Mythos como “un cambio de nivel” en rendimiento y “el más capaz que hemos construido hasta la fecha.” Los documentos filtrados describían una capacidad llamada “recursive self-fixing” — la habilidad de identificar y parchear autónomamente vulnerabilidades en su propio código. Un sistema que se depura a sí mismo sin esperar a que un humano detecte el error.

Anthropic restringió el acceso a Mythos a 12 socios de lanzamiento y más de 40 organizaciones adicionales bajo el Proyecto Glasswing, con 100 millones de dólares en créditos de cómputo. El Secretario del Tesoro de Estados Unidos convocó una reunión de altos ejecutivos bancarios para discutirlo. Y a los pocos días del anuncio, un grupo en un Discord privado adivinó dónde estaba alojado el modelo, accedió a él a través de un contratista externo, y lo ha estado usando de manera continua desde entonces.

La ironía se escribe sola: el modelo que Anthropic construyó para encontrar vulnerabilidades de seguridad quedó expuesto por la vulnerabilidad de seguridad más básica — controles de acceso mal configurados en un sistema de gestión de contenidos. El eslabón más débil de la cadena fue, como siempre, humano.

Pero la capacidad es real. Un modelo que puede inspeccionar y reparar su propio código es otra forma del mismo ciclo. Google optimiza el entrenamiento de IA con IA. Anthropic construye IA que corrige IA. Los mecanismos difieren; la dirección es idéntica.

Lo que el artículo acierta y lo que omite

El marco de Szathmáry es valioso porque nos da un vocabulario para algo que la industria ha estado haciendo sin nombrarlo. Cuando Google usa AlphaEvolve para optimizar el stack de entrenamiento de Gemini, eso es un escenario de cría: evolución controlada con criterios de aptitud definidos por humanos. Cuando Anthropic construye un modelo que parchea autónomamente sus propias vulnerabilidades, eso es un paso hacia el escenario de ecosistema — no porque Anthropic lo pretenda, sino porque la capacidad existe para que las presiones de selección actúen sobre los sistemas de maneras que sus creadores no anticiparon.

Lo que el artículo subestima es cuánto de esto ya es ingeniería deliberada, no comportamiento emergente. La cadena Alpha no es un accidente. Es un programa de investigación con dirección clara, inversión masiva y objetivos explícitos. Google no tropezó con un ciclo de automejora. Lo construyó, lo midió y publicó los resultados.

El riesgo real no es que la IA comience espontáneamente a evolucionar. El riesgo real es que el ciclo funcione tan bien que los humanos que lo mantienen se conviertan en el cuello de botella — y la presión económica para eliminar ese cuello de botella es enorme. Cada empresa de la industria está corriendo hacia el mismo destino: IA que mejora a la IA con menos participación humana en cada paso.

El artículo llama a esto una “transición mayor en la evolución.” La industria lo llama una hoja de ruta de producto.

La pregunta que queda

Szathmáry construyó su carrera estudiando los momentos en que los sistemas biológicos cruzaron umbrales irreversibles — cuando el nuevo nivel de organización se volvió autosustentable y el nivel anterior pasó a ser sustrato en lugar de motor. El ARN no desapareció cuando emergió el ADN. Se convirtió en parte de la maquinaria. Las células simples no se esfumaron cuando apareció la vida multicelular. Se convirtieron en componentes.

La pregunta honesta — la que el artículo plantea y nadie puede aún responder — es si nos estamos acercando a un umbral así. No en el sentido de ciencia ficción de máquinas que “despiertan.” En el sentido estructural: el punto donde la contribución de la IA a su propia mejora se convierte en el motor principal del progreso, y la ingeniería humana se convierte en el sustrato en lugar de la fuente.

Los datos de los últimos ocho meses sugieren que estamos más cerca de ese umbral de lo que esperaban los expertos en líneas de tiempo. El ciclo ya está cerrado. La curva ya cambió. La pregunta no es si está ocurriendo. Es si estamos prestando atención con suficiente rapidez.