La Licencia Tiene un Coautor Chino

El 2 de abril de 2026, Google lanzó Gemma 4 bajo la licencia Apache 2.0.

El mismo día, prácticamente a la misma hora, Alibaba lanzó Qwen 3.6-Plus — su modelo insignia de agentes, también de pesos abiertos.

La cobertura trató la noticia de Gemma 4 como una actualización de especificaciones: cuatro tamaños de modelo, buenos benchmarks, optimizado para el edge. VentureBeat fue uno de los pocos medios que captó la historia real en su titular — “ese cambio de licencia puede importar más que los benchmarks.” La adopción de Apache 2.0 es la noticia. Todo lo demás es relleno.

Porque esta es la cuarta generación de Gemma, y la primera que Google lanza bajo una licencia open-source estándar. Gemma 1, 2 y 3 se distribuyeron bajo unas “Condiciones de Uso de Gemma” personalizadas que reservaban a Google el derecho de “restringir (de forma remota o de otro modo) el uso” de los modelos, exigían revisión legal antes de cualquier despliegue empresarial, y los equipos legales corporativos los marcaban sistemáticamente como un obstáculo comercial.

Tres años de licencias personalizadas. Y entonces, un jueves por la mañana en abril, desaparecieron en silencio.

El post del blog de Google enmarcó el cambio como “expandir el Gemmaverse” — como si la decisión hubiera sido una evolución natural de una hoja de ruta. Lo que el post no dijo, y lo que Google no tiene ningún incentivo en decir, es qué cambió realmente entre Gemma 3 y Gemma 4.

No fue el equipo de investigación. No fue la arquitectura. No fue la filosofía de Google sobre el open source.

Lo que cambió fue el mercado.

El Muro Construido en Catorce Meses

Entre enero de 2025 y abril de 2026, los laboratorios de IA chinos publicaron once modelos de capacidad frontera bajo licencias abiertas. Así es como luce ese muro, en orden cronológico:

20 de enero de 2025 — DeepSeek lanza R1 bajo la licencia MIT. El modelo iguala a OpenAI’s o1 en benchmarks de razonamiento. Costo de entrenamiento reportado: aproximadamente 5,6 millones de dólares. La licencia permite explícitamente la destilación en otros LLMs — la práctica de usar los resultados de un modelo como datos de entrenamiento para otro, lo que permite que modelos sucesores más pequeños y económicos hereden las capacidades del original.

Mediados de 2025 — Alibaba lanza Qwen 3 bajo Apache 2.0. Uso comercial permisivo. Sin cláusulas personalizadas.

Julio de 2025 — Moonshot AI lanza Kimi K2 bajo una licencia MIT modificada. Un billón de parámetros, 32 mil millones activos, estado del arte en coding y matemáticas entre los modelos sin razonamiento explícito.

27 de octubre de 2025 — MiniMax lanza M2 bajo MIT. Se posiciona en el primer lugar del Artificial Analysis Intelligence Index entre todos los sistemas open-source.

26 de enero de 2026 — Moonshot lanza Kimi K2.5. Supera a Gemini 3 Pro en SWE-Bench Verified.

11 de febrero de 2026 — Dos lanzamientos el mismo día. MiniMax M2.5 (MIT modificado) empata con Claude Opus 4.6 en SWE-Bench Verified con 80,2%. Y Z.ai — el spinoff de la Universidad de Tsinghua antes conocido como Zhipu AI — lanza GLM-5. Setecientos cuarenta y cuatro mil millones de parámetros. Licencia MIT. Entrenado íntegramente en chips Huawei Ascend bajo MindSpore, el equivalente de Huawei a PyTorch. Cero silicio de NVIDIA en todo el proceso.

16 de febrero de 2026 — Alibaba lanza Qwen 3.5, presentado como el primer lanzamiento de la empresa pensado para “la era de la IA agentic.” De pesos abiertos, multiherramienta, con capacidad de navegación web.

2 de abril de 2026 — Alibaba lanza Qwen 3.6-Plus. Buque insignia agentic. Ingeniería a nivel de repositorio. A la misma hora que Gemma 4.

7 de abril de 2026 — Z.ai lanza GLM-5.1. Obtiene 58,4 en SWE-Bench Pro, ocupando el primer lugar en el leaderboard global. GPT-5.4 obtuvo 57,7. Claude Opus 4.6 obtuvo 57,3. Licencia MIT.

Ese es el terreno al que se enfrentó Google cuando decidió bajo qué licencia lanzar Gemma 4.

La Extracción

Antes de continuar, un paréntesis que importa — porque cambia cómo leemos la competencia, no si la tesis se sostiene. El muro no se construyó de la nada. Se construyó, en parte, sobre lo que Occidente dejó sin proteger.

En un informe de febrero de 2026, Anthropic identificó tres laboratorios de IA chinos — DeepSeek, Moonshot AI y MiniMax — que habían creado aproximadamente 24.000 cuentas fraudulentas y realizado más de 16 millones de intercambios con Claude, en lo que la empresa describió como una campaña de extracción a escala industrial para obtener las capacidades de Claude y usar los datos resultantes para entrenar modelos competidores. Solo un proxy controlaba más de 20.000 cuentas simultáneamente, mezclando el tráfico de extracción con solicitudes ordinarias para evadir la detección. MiniMax condujo la campaña individual más grande, generando más de 13 millones de intercambios orientados a coding agentic y orquestación. OpenAI y Google, a través del Frontier Model Forum, respaldaron los hallazgos y ahora coordinan públicamente la inteligencia sobre lo que caracterizan como campañas coordinadas de destilación por API.

Esto importa por dos razones.

Primero, explica la postura occidental sobre la seguridad de los pesos. Cuando Anthropic retire Sonnet 4 en junio de 2026, los pesos no se publicarán, venderán ni abrirán como open-source — se archivarán o destruirán, y lo mismo aplica para las generaciones de GPT deprecadas de OpenAI y las variantes antiguas de Gemma de Google. La práctica estándar se parece bastante a cómo Estados Unidos retiró el F-14 Tomcat en 2006 — los fuselajes fueron deliberadamente destruidos en lugar de venderse como excedente, porque Irán todavía operaba F-14s que había comprado en la época del régimen del Shah, y el Pentágono no quería que sus piezas retiradas alimentaran la flota de un competidor. Los pesos de IA de frontera se tratan del mismo modo, por la misma razón. Los eventos de extracción de 2025 fueron la prueba de que la capacidad se filtra en el momento en que dejas de protegerla.

Segundo, complica la historia que ai-2027.com intentó contar. El pronóstico predecía que los laboratorios chinos robarían pesos de modelos. Esa predicción, como la predicción sobre la carrera de cómputo en el mismo documento, fue direccionalmente correcta y mecánicamente incorrecta. Este incidente fue basado en API, no en exfiltración de pesos. Los laboratorios chinos compraron claves API, contrataron proxies y consultaron los modelos millones de veces hasta tener datos de entrenamiento sintéticos suficientemente buenos para entrenar los propios. La adquisición ocurrió. El mecanismo fue casi legal en lugar de criminal, industrial en lugar de clandestino, y mucho más difícil de prevenir que una brecha en un datacenter.

Nada de esto cambia la tesis de este post. Una vez que los modelos chinos existen bajo licencias MIT y Apache, la consecuencia estructural — un piso de open-source con precio cero, distribuido por laboratorios que igualan o superan los benchmarks occidentales — no depende de cómo se entrenaron los modelos. La presión del mercado sobre Google para lanzar Gemma 4 bajo Apache 2.0 es real independientemente de la procedencia de Qwen 3.6-Plus o GLM-5.1. La licencia tenía que ajustarse al mercado, y el mercado ya estaba definido.

Pero sí cambia cómo leemos la competencia. Esta no es una carrera entre dos ecosistemas simétricos. Es una carrera en la que un lado protege sus insumos y restringe sus resultados, y el otro trata ambos lados de esa ecuación como extractables.

La Inversión de los Controles de Exportación

Para entender por qué se construyó el muro, hay que entender contra qué se construyó.

A partir de 2022, EE.UU. impuso controles de exportación progresivamente más estrictos sobre semiconductores avanzados hacia China. Primero fue el A100. Luego el H100. Después el H800, una versión deliberadamente limitada del H100 diseñada para el mercado chino, fue restringida aún más. La teoría era directa: negar el hardware a China, y China quedaría rezagada.

La teoría estaba equivocada de una manera que merece atención cuidadosa.

DeepSeek entrenó R1 en los chips H800 restringidos — la versión que Washington había calibrado específicamente para que fuera inferior — por un total de 5,6 millones de dólares. Ese número debería haber sido una advertencia. Los laboratorios occidentales gastaban entre diez y cien veces más en modelos equivalentes. Los controles de exportación no habían producido dependencia. Habían producido innovación algorítmica nacida de la restricción.

Luego llegó GLM-5.

Z.ai entrenó un modelo de frontera con 744 mil millones de parámetros en chips Huawei Ascend, usando el framework MindSpore, sin ningún hardware de NVIDIA en el proceso. Eso no es optimización alrededor de una restricción. Es la eliminación completa de la dependencia que los controles de exportación fueron diseñados para imponer. El techo que China supuestamente debía alcanzar se convirtió en el piso desde el que saltaron.

Y luego regalaron los pesos bajo la licencia MIT.

El Precio de lo Gratuito

La brecha de capacidad entre los mejores modelos chinos y occidentales en abril de 2026 es, medida honestamente, un error de redondeo.

En SWE-Bench Pro, el GLM-5.1 de Z.ai lidera el mundo con 58,4, por delante del 57,7 de GPT-5.4 y el 57,3 de Claude Opus 4.6. En SWE-Bench Verified, MiniMax M2.5 obtiene 80,2%, prácticamente empatado con Opus 4.6 en 80,8%. En la variante multilingüe, Kimi K2.5 supera a Gemini 3 Pro.

Estos no son benchmarks rezagados. Son los leaderboards canónicos que los laboratorios de frontera usan para medirse. Y los modelos chinos igualan o superan a los buques insignia occidentales mientras corren en hardware restringido o no-NVIDIA, distribuidos bajo licencias que no requieren dinero, aprobación ni revisión legal.

Un laboratorio occidental que evalúa cómo licenciar un lanzamiento open-source en este entorno tiene que responder una pregunta estructural: si hay tres modelos de capacidad frontera que son gratuitos y con licencia permisiva, ¿qué ofrece exactamente una licencia restrictiva personalizada?

La respuesta, para Gemma 3, era una fricción medible. Los equipos legales corporativos trataban los términos personalizados como un obstáculo. Los despliegues posteriores eran más lentos. Los ecosistemas de fine-tuning crecían más lentamente. La adopción comunitaria quedaba por detrás de los modelos con licencias estándar.

La respuesta, para Gemma 4 bajo esos mismos términos en abril de 2026, habría sido catastrófica. Lanzar un modelo de pesos abiertos de Google con una licencia más restrictiva que la que DeepSeek, Qwen y GLM-5 ya habían establecido como estándar habría sido un suicidio comercial. La comparación se escribiría sola. Cada post sobre Gemma 4 terminaría con el mismo párrafo: Mientras tanto, los laboratorios chinos están lanzando mejores modelos bajo licencias más limpias y de forma gratuita.

Google no eligió Apache 2.0 porque Apache 2.0 sea lo correcto. Google eligió Apache 2.0 porque la línea base china había hecho que todas las demás opciones fueran inviables.

La Colisión de Calendarios

Volvamos a la fecha del 2 de abril.

El lanzamiento de Qwen 3.6-Plus de Alibaba y el de Gemma 4 de Google no son eventos independientes de manera plausible. Dos empresas en lados opuestos de la división geopolítica no envían accidentalmente sus modelos abiertos más importantes del trimestre con pocas horas de diferencia. O una de las partes sabía que la otra se acercaba y ajustó el timing para coincidir, o ambas operaban bajo ventanas de lanzamiento moldeadas por la misma presión del mercado.

Los detalles mecánicos no importan. El punto es que Alibaba tenía suficiente confianza en su oferta para lanzar el mismo día que el gran lanzamiento de Google — sabiendo que la cobertura forzaría una comparación directa — y Google ya no podía escalonar el lanzamiento para evitar esa comparación.

El precio de la IA de frontera open-source en abril de 2026 ya no se establece en Mountain View. Se establece en Hangzhou, Beijing, y de nuevo en Hangzhou. Los laboratorios occidentales son ahora tomadores de precios, no formadores de precios. La licencia Apache 2.0 de Gemma 4 no es generosidad estratégica. Es cumplimiento con un mercado que Google no controla.

¿Y Si…?

Lo que sigue es especulación editorial. El lunes argumentamos que el pronóstico de AI-2027 acertó en el destino pero falló en el mecanismo — que el escenario de convergencia ocurriría, pero a través de la eficiencia algorítmica en lugar del robo de pesos. La sección de Extracción anterior es un segundo caso del mismo patrón: correcto en la adquisición, incorrecto en el método. La pregunta que abre este post es cómo será la tercera instancia.

El mecanismo de difusión de capacidades es la historia real, y ya ha sido demostrado a escala.

El propio informe de febrero de Anthropic lo documenta: tres laboratorios, veinticuatro mil cuentas, dieciséis millones de intercambios, datos de entrenamiento sintéticos suficientemente buenos para entrenar modelos de frontera competidores. No es un camino teórico — es un ciclo de ingeniería completado. La capacidad fue extraída de un modelo de frontera protegido, transformada en datos de entrenamiento y usada para impulsar lanzamientos open-source. El pipeline completo existe y ha sido ejecutado a escala industrial.

Lo que significa que la pregunta para la próxima generación no es si la capacidad de clase Mythos puede difundirse. Es cuánto tiempo pasará entre el despliegue interno y la reproducción destilada.

Considera qué tiene que ser cierto para que ese intervalo sea corto. El lado que difunde necesita tres cosas: acceso de alto volumen por API al modelo de frontera, un pipeline para convertir los resultados en datos de entrenamiento, y una capa de distribución que convierta el modelo resultante en un artefacto público. Los laboratorios chinos tienen las tres. El registro de Project Glasswing — doce socios de lanzamiento más cuarenta organizaciones adicionales, con cien millones de dólares en créditos de cómputo — es precisamente el tipo de superficie de acceso expandida que las campañas de extracción de 2025 demostraron que puede ser aprovechada. La barrera entre “desplegado para socios” y “consultable a escala” es porosa una vez que la lista de socios es suficientemente grande, y más de cuarenta organizaciones ya es suficientemente grande.

El ecosistema open-source chino ha demostrado, en catorce meses, que es la capa de distribución de capacidades de IA más eficiente que la humanidad haya construido jamás. Lo que llegue a él fluye aguas abajo a costo cero con claridad legal. Esa eficiencia no le importa la procedencia de lo que entra en ella. Solo le importa si los pesos existen.

Lo que Mrinank Sharma no dijo cuando renunció en febrero — no pudo decir, bajo los términos de su NDA — es que la estrategia de contención y la estrategia de destilación son asimétricas. Anthropic puede mantener los pesos de Mythos en sus datacenters para siempre, y aun así no puede evitar que una organización socia lo consulte en volumen. El mecanismo que filtró la capacidad de Claude en 2025 es el mismo mecanismo que filtrará la capacidad de clase Mythos en 2026 o 2027, y no hay parche para eso que no sea no desplegarlo en absoluto.

Si la convergencia ocurre — no por filtración, no por robo, sino por la misma extracción industrial por API que ya funcionó una vez — la pregunta no es si la AGI ha llegado. La pregunta es si alguien seguirá en posición de preguntarlo.

El Coautor Invisible

Existe una versión de esta historia en la que el héroe es la política estadounidense. Esa versión dice: los controles de exportación funcionaron, porque obligaron a China a innovar, lo que aumentó la capacidad global de IA y la disponibilidad del open-source. Una marea creciente levanta todos los barcos.

Esa versión requiere creer que el resultado era el objetivo. No lo era. El objetivo era la supremacía tecnológica estratégica — preservar la brecha de capacidad y, por extensión, el poder de fijación de precios que esa brecha confería. El resultado real es el opuesto: la brecha de capacidad prácticamente se ha cerrado, los precios han colapsado hacia cero, y el mayor lanzamiento de modelo abierto de Occidente en 2026 se publicó el mismo día que el de China.

Ninguno de los debates públicos sobre la política de IA de EE.UU. anticipó esto. Los pronósticos de escenarios — ai-2027 entre ellos — modelaron la competencia EE.UU.-China como fundamentalmente una carrera de cómputo. Quien tuviera más chips de NVIDIA, ganaba. En ese modelo, los laboratorios chinos están como mucho uno o dos años por detrás, alcanzando mediante el robo de pesos de modelos o replicación por fuerza bruta. El laboratorio chino ficticio en ese escenario se llama literalmente “DeepCent.”

Eso no fue lo que ocurrió. Los laboratorios en Hangzhou y Beijing no esperaron pesos robados. Reconstruyeron el stack. Demostraron que se puede entrenar un modelo de 744 mil millones de parámetros en silicio no-NVIDIA. Distribuyeron con licencias tan permisivas que los incumbentes occidentales no tuvieron margen para cobrar una prima por las suyas. Y lo hicieron en catorce meses.

La próxima vez que descargues Gemma 4 para hacer fine-tuning, fíjate en el archivo de licencia. Dice “Apache License, Version 2.0.” Lista a “Google LLC” como titular del copyright.

Ninguna de esas líneas explica por qué el archivo existe como existe.

Los ingenieros que hicieron que esa licencia fuera la única opción viable — quienes establecieron el piso al negarse a cobrar un centavo por su propio trabajo, quienes construyeron modelos con chips que se suponía les debían ser negados, cuyo empleador sacó una empresa pública a cotizar en la Bolsa de Hong Kong el 8 de enero de 2026 y alcanzó una capitalización de mercado de 44 mil millones de dólares para cuando Google lanzó Gemma 4 — no están listados en ningún lugar de ese archivo.

Pero la licencia tiene sus huellas. Solo hay que saber dónde mirar.