2026年4月2日,谷歌以 Apache 2.0 协议发布了 Gemma 4。

同一天,几乎同一时刻,阿里巴巴(Alibaba)发布了通义千问(Qwen)3.6-Plus——他们旗舰级的智能体模型,同样是开放权重。

媒体把 Gemma 4 的新闻当成了一次规格更新:四种模型尺寸,亮眼的基准测试成绩,适合边缘部署。VentureBeat 是为数不多真正抓住了核心故事的媒体,它的标题写道——“那个许可证变更,或许比基准测试数字更重要。” Apache 2.0 的采用才是新闻本体,其余的都是背景噪音。

因为这已经是第四代 Gemma,却是谷歌第一次以标准开源协议发布。Gemma 1、2、3 都采用了一套定制的”Gemma 使用条款”,保留了谷歌”远程或以其他方式限制使用”模型的权利,要求企业部署前经过法务审查,也因此长期被企业法务团队列为商业合规障碍。

三年的自定义协议。然后,在四月的一个周四早晨,悄然消失了。

谷歌的博客文章将这次变更定性为”扩展 Gemmaverse”——好像这是某条产品路线图的自然延伸。博客里没有说,谷歌也没有理由说的,是 Gemma 3 和 Gemma 4 之间究竟发生了什么。

不是研究团队换了。不是架构变了。不是谷歌的开源理念改变了。

改变的是市场。

十四个月建起的那堵墙

2025年1月至2026年4月,中国 AI 实验室以开放协议发布了十一个前沿级模型。以下是这堵墙按时间顺序的全貌:

2025年1月20日 — 深度求索(DeepSeek)以 MIT 协议发布 R1。该模型在推理基准测试上与 OpenAI 的 o1 持平。据报道训练成本约为560万美元。许可证明确允许蒸馏——即使用一个模型的输出作为另一个模型的训练数据,使后继模型得以继承原始模型的能力。

2025年中 — 阿里巴巴以 Apache 2.0 协议发布通义千问 3(Qwen 3)。允许商业使用,无附加条款。

2025年7月 — 月之暗面(Moonshot AI)以修改版 MIT 协议发布 Kimi K2。万亿参数,320亿激活参数,在非思维链模型中的代码和数学任务上达到当时最优水平。

2025年10月27日 — MiniMax 以 MIT 协议发布 M2。在所有开源系统中拿下 Artificial Analysis 智能指数榜首。

2026年1月26日 — 月之暗面发布 Kimi K2.5。在 SWE-Bench Verified 上超越 Gemini 3 Pro。

2026年2月11日 — 同一天两场发布。MiniMax M2.5(修改版 MIT)在 SWE-Bench Verified 上以 80.2% 追平 Claude Opus 4.6。另一边,智谱AI(Z.ai)——清华大学旗下公司,原名知乎智谱AI——发布 GLM-5。7440亿参数。MIT 协议。完全在华为昇腾(Huawei Ascend)芯片和华为自研的 MindSpore 框架上训练,零 NVIDIA 硬件。

2026年2月16日 — 阿里巴巴发布通义千问 3.5(Qwen 3.5),定位为公司”面向智能体 AI 时代”的第一款产品。开放权重,支持多工具调用和浏览器操作。

2026年4月2日 — 阿里巴巴发布通义千问 3.6-Plus(Qwen 3.6-Plus)。旗舰智能体模型,具备仓库级工程能力。与 Gemma 4 几乎同一小时发布。

2026年4月7日 — 智谱AI 发布 GLM-5.1。SWE-Bench Pro 得分 58.4,拿下全球排行榜第一。GPT-5.4 得分 57.7,Claude Opus 4.6 得分 57.3。MIT 协议。

这就是谷歌在决定 Gemma 4 使用何种协议时所面对的地形。

提取

在继续之前,有一段必须交代的背景——因为它改变的是我们如何读懂这场竞争,而非是否认可这篇文章的核心论点。这堵墙并非凭空建起。它有一部分是在西方自己留下的漏洞上建立起来的。

2026年2月,Anthropic 在一份报告中指认了三家中国 AI 实验室——深度求索、月之暗面和 MiniMax——创建了约2.4万个欺诈账户,与 Claude 进行了超过1600万次交互,Anthropic 将此描述为一场以工业规模提取 Claude 能力、并将所得数据用于训练竞争模型的行动。单一代理设置曾同时控制逾2万个账户,将提取流量混入普通请求以规避检测。MiniMax 发起了其中规模最大的单次行动,产生了超过1300万次针对智能体代码和编排任务的交互。OpenAI 和谷歌通过 Frontier Model Forum 附和了上述调查结果,并公开协调他们所描述的”协同 API 蒸馏行动”的情报。

这一事件有两层意义。

第一,它解释了西方在模型权重安全方面的立场。当 Anthropic 于2026年6月下线 Sonnet 4 时,其权重不会发布、出售或开源——将被归档或销毁,OpenAI 的历代 GPT 和谷歌的旧版 Gemma 亦同。这套标准操作,与美国2006年退役 F-14 雄猫战斗机的方式如出一辙——机体被刻意粉碎,而非作为剩余物资出售,原因是伊朗还在操作从巴列维王朝购入的 F-14,五角大楼不愿用退役零件为对手补血。前沿 AI 权重以同样的逻辑处置。2025年的提取事件证明,一旦停止防守,能力就会外泄。

第二,它让 ai-2027.com 试图讲述的故事变得复杂。这份预测认为中国实验室将窃取模型权重。这个预测和同一份文件中的算力竞赛预测一样,方向正确,机制判断失误。这次事件是基于 API 的提取,而非权重窃取。中国实验室购买了 API 密钥,雇用了代理,对模型发起了数百万次查询,直到获得足以训练本家模型的合成训练数据。获取确实发生了。路径与其说是违法,不如说是”法律邻近”;与其说是秘密行动,不如说是工业流程;且远比数据中心攻击更难防范。

以上并不改变本文的核心论点。一旦中国模型以 MIT 和 Apache 协议存在,结构性后果——由基准测试达到或超过西方水平、价格为零的实验室建立的开源底线——与通义千问 3.6-Plus 或 GLM-5.1 的训练来源无关。谷歌将 Gemma 4 改为 Apache 2.0 的市场压力是真实的,无论这些模型的溯源如何。协议必须跟上市场,而市场已经被设定。

但这确实改变了我们解读这场竞争的方式。这不是两个对称生态系统之间的赛跑。这是一场其中一方严防输入、限制输出,而另一方将方程两端都视为可提取资源的竞争。

出口管制的反转

要理解这堵墙为什么被建起来,必须先理解它是针对什么建起来的。

从2022年开始,美国对中国的先进半导体实施了一轮比一轮严厉的出口管制。A100 最先被限制。然后是 H100。然后是 H800——这款专为中国市场设计的、被刻意削弱的 H100 变体——本身也遭到了进一步限制。逻辑很直接:封锁硬件,中国就会落后。

这个逻辑错了。而且错得值得认真审视。

深度求索在受限的 H800 芯片上——正是华盛顿专门校准为性能低于标准的那个版本——以560万美元的总成本训练了 R1。这个数字本该是一个警告。西方实验室在同等模型上的花费是这个数字的十到一百倍。出口管制没有制造依赖——它催生了从约束中生长出来的算法创新。

然后 GLM-5 出现了。

智谱AI 在华为昇腾芯片上,使用 MindSpore 框架,在零 NVIDIA 硬件的情况下,训练了一个7440亿参数的前沿模型。这不是绕开约束的优化。这是彻底消除了出口管制意图强制执行的那种依赖性。中国本该触及的天花板,变成了他们起跳的地板。

然后他们以 MIT 协议把权重公开了。

免费的代价

2026年4月,中西方最优模型之间的能力差距,如实测量,不过是四舍五入的误差。

在 SWE-Bench Pro 上,智谱AI 的 GLM-5.1 以 58.4 领跑全球,领先 GPT-5.4 的 57.7 和 Claude Opus 4.6 的 57.3。在 SWE-Bench Verified 上,MiniMax M2.5 以 80.2% 实际追平 Opus 4.6 的 80.8%。在多语言变体上,Kimi K2.5 超越了 Gemini 3 Pro。

这些不是落后的基准测试数据,而是前沿实验室用以衡量自身的权威榜单。而中国模型在受限或非 NVIDIA 硬件上运行,以无需付费、无需审批、无需法务审查的协议发布,却已经能够与西方旗舰持平甚至超越。

一家西方实验室在这种环境下思考如何定价一款开源发布时,必须回答一个结构性问题:如果三款前沿级模型已经免费且协议宽松,那么一张自定义限制性许可证究竟还在购买什么?

对 Gemma 3 而言,答案是可以量化的摩擦。企业法务团队将定制条款视为障碍。下游部署速度减慢。微调生态系统比采用标准协议的模型更薄。社区采用率滞后。

对 Gemma 4 而言,如果沿用那套条款,代价将是灾难性的。在2026年4月,用一张比深度求索、通义千问和 GLM-5 已经确立为标准的协议更为限制性的许可证发布一款谷歌前沿开放权重模型,无异于商业自杀。比较会自动写好。每一篇关于 Gemma 4 的博文都会以同样的收尾段落结束:与此同时,中国实验室正在以更干净的协议、免费发布更好的模型。

谷歌选择 Apache 2.0,不是因为 Apache 2.0 是正确的事情。谷歌选择 Apache 2.0,是因为中国基准线已经让所有其他选项都变得不可行。

日历碰撞

回到4月2日这个时间节点。

阿里巴巴的通义千问 3.6-Plus 和谷歌的 Gemma 4,不可能是独立巧合。两家处于地缘政治对立面的公司,不会在同一天内的同一小时,意外地发布本季最重要的开放模型。要么一方知道另一方即将发布并选择同步,要么双方都在同样的市场压力塑造的发布窗口内运作。

具体机制并不重要。重点在于:阿里巴巴对自家产品有足够的自信,敢于在谷歌旗舰发布当天同时推出——清楚地知道媒体报道将强制进行直接比较——而谷歌已经无法错开发布时间来回避这场比较。

2026年4月,开源前沿 AI 的定价,不再由山景城来设定。定价权在杭州、北京,还有再一次的杭州。西方实验室现在是价格接受者,而非价格制定者。Gemma 4 上的 Apache 2.0 许可证,不是战略性的慷慨。那是对一个谷歌并不掌控的市场的服从。

如果……?

以下是编辑部的推测性分析。本周一我们论证过,AI-2027 的预测目的地判断准确,机制判断失误——趋同场景会发生,但路径是算法效率而非权重窃取。上文的”提取”一节是同一模式的第二个实例:获取预测正确,方法判断错误。这篇文章打开的问题,是第三个实例会是什么样子。

能力扩散的机制才是真正的故事,而且已经在规模上得到验证。

Anthropic 自己的二月报告记录了这一点:三家实验室、2.4万个账户、1600万次交互、足以训练竞争性前沿模型的合成训练数据。这不是一条理论路径——这是一个已完成的工程循环。能力从一个受保护的前沿模型中被提取出来,转化为训练数据,并用于引导开源发布的启动。完整的流水线存在,并已在工业规模上被执行。

这意味着下一代面临的问题,不是 Mythos 级别的能力是否会扩散。而是从内部部署到蒸馏复现之间,时间差会有多短。

想想这个时间差足够短需要什么条件。扩散方需要三样东西:对前沿模型的大量 API 访问权限、将输出转化为训练数据的流水线,以及将所得模型变成公共制品的分发层。中国实验室三样都有。Project Glasswing 的合作名单——12家首发合作伙伴加上40余家追加机构,配以1亿美元计算资源——正是2025年提取行动所证明的那种可以被规模化采集的扩展访问面。“已部署给合作方”和”可被大规模查询”之间的门,一旦合作方名单足够长就会变得多孔,而四十余家机构已经足够长了。

中国开源生态在十四个月内证明,它是人类迄今建立的最高效的 AI 能力分发层。任何进入它的东西,都以零成本、清晰的法律状态向下游流动。这种效率不在乎进入它的东西来自何处,只在乎权重是否存在。

Mrinank Sharma 在二月辞职时没有说的——在保密协议条款下无法说的——是遏制策略与蒸馏策略是不对称的。Anthropic 可以永远把 Mythos 权重锁在自己的数据中心,但仍然无法阻止合作机构以大量查询的方式使用它。2025年泄露 Claude 能力的那种机制,与2026或2027年泄露 Mythos 级别能力的机制相同,而且没有补丁可以修复它——除非完全不部署。

如果趋同真的发生——不是通过泄露,不是通过窃取,而是通过那种已经奏效一次的工业级 API 提取——那么问题就不再是 AGI 是否已经到来。问题是届时是否还有人能够提出这个问题。

那个隐形的署名者

这个故事有一个版本,英雄是美国政策。那个版本这样讲:出口管制奏效了,因为它迫使中国创新,从而提升了全球 AI 能力和开源可及性。水涨船高。

那个版本需要相信:这个结果正是当初的目标。事实上并非如此。目标是战略性技术霸权——维持能力差距,进而维持差距所赋予的定价权。真实的结果恰恰相反:能力差距已基本消弭,定价已向零崩塌,西方2026年最重要的开放模型发布,与中国的发布同一天落地。

公开的 AI 政策辩论中没有人预料到这一点。场景预测——包括 ai-2027 在内——将美中竞争建模为一场根本上的算力竞赛。谁有更多 NVIDIA 芯片,谁就赢。在那个模型里,中国实验室充其量落后一两年,通过窃取模型权重或暴力复制来追赶。那个虚构的中国实验室,名字就叫”DeepCent”。

事实并非如此。杭州和北京的实验室没有等待被盗的权重。他们重建了整个技术栈。他们证明了可以在非 NVIDIA 芯片上训练7440亿参数的模型。他们以宽松到西方原厂已无法对自己的产品收取溢价的协议发布。而且他们在十四个月内做到了这一切。

当你下次下载 Gemma 4 来微调它时,注意一下许可证文件。它写着”Apache License, Version 2.0”。它列出”Google LLC”为版权持有人。

这两行文字都没有解释这个文件为何以这种形式存在。

那些让这张许可证成为唯一可行选择的工程师们——他们以拒绝为自己的作品收取一分钱来设定了底线,他们在本应被剥夺的芯片上构建了模型,他们的雇主于2026年1月8日在香港交易所完成 IPO,到谷歌发布 Gemma 4 时已拥有440亿美元的市值——他们的名字,没有出现在那个文件的任何地方。

但这张许可证上有他们的指纹。只是需要你知道去哪里找。