你是一名开发者。你每月花10美元订阅 GitHub Copilot。它帮你更快写代码。你不会去想每一条补全建议背后的成本——你只管打字,它补全,你上线。

然后,你收到了一封邮件。

从2026年6月1日起,GitHub 将把你的固定订阅改为一种叫”AI Credits(AI积分)“的东西。你的10美元仍然能买到10美元的积分。但现在,每一次对话、每一次代码审查、每一次多步骤编程会话,都会从这个余额里扣除。如果你想使用高级模型——比如 Claude Opus——每次请求的费用最多是基础模型的27倍。

你那个原本感觉用不完的10美元月度预算,现在一个下午就能烧光。

社区的反应立竿见影:GitHub 公告帖子下504个反对票,只有9个支持票。开发者们纷纷发布迁移指南,指向 Cursor,指向直接调用 Claude 的 API,指向 DeepSeek。Reddit 上充斥着同一个问题:固定月费去哪儿了?

答案很简单。固定月费从来就不是真实的价格。你一直在享受补贴,而补贴刚刚结束了。

他们同时行动的那个月

GitHub 并非孤军奋战。在同一个季度——2026年4月至6月——AI行业三大巨头在几周之内相继调整了定价。

GitHub(微软旗下):固定订阅改为基于用量的”AI Credits”。高级模型费率最高为基础模型的27倍。积分不结转——用不完就作废。年付方案取消。

Anthropic:其旗舰新模型 Opus 4.7 的每Token(token)单价与上一代相同——但新的分词器(tokenizer)会将同样内容的Token计数膨胀10%至35%,具体取决于内容类型(代码偏低端,复杂散文偏高端)。一个在 Opus 4.6 上花费0.10美元的请求,在 4.7 上可能花费高达0.135美元。价格没有上涨,但计量表转得更快了。与此同时,其企业方案从每席位固定收费200美元,改为基于用量的计费方式:每席位20美元加上实际消耗。Claude Code——重度用户倚赖的AI编程工具——一度被从20美元的 Pro 方案中移除,限制到100美元以上的 Max 方案,随后在用户强烈反弹后悄悄恢复。

OpenAI:在原有的每月20美元 Plus 方案和200美元 Pro 方案之间,插入了一个新的100美元/月”Pro”方案——直接与 Anthropic 的 Claude Max 定价正面竞争。其新模型 GPT-5.5 的每Token费用是 GPT-5.4 的两倍。OpenAI 将此定价为卓越性能的溢价。他们还推出了一项限时促销——5月31日前 Codex 用量10倍——此后将悄悄恢复到5倍。如果这种套路听起来似曾相识,是因为我们在18个月前就有过记录,当时 Anthropic 对 Claude 的使用限制做了同样的事。

三家公司。三次涨价。同一个季度。这不是价格密谋——没有任何协调的证据。这是更有意思的现象:在同样的压力下,走向了同样的结果。

顺着钱往上追

要理解为什么三家公司同时行动,就要顺着钱,追到它想去的地方:公开市场。

OpenAI 于2026年初完成了向营利性公益公司的转型,目标是在年内下半年提交 IPO 申请。CEO 萨姆·奥尔特曼(Sam Altman)力推在第四季度上市。他自己的 CFO 公开表示这个时间表”过于激进”。目标估值:约1万亿美元。问题所在:仅2026年的预计亏损就高达140亿美元,主要由算力成本驱动。年化营收为250亿美元且仍在增长——但目前每赚1美元,交付成本超过1美元。

Anthropic 于2026年2月完成了380亿美元的 G 轮融资,投后估值3800亿美元,并准备冲刺2026年10月的 IPO,更现实的估计则将时间推至2027年3月。2026年3月年化营收达到300亿美元——同比增长1400%。在预测市场上,其上市前估值已突破1万亿美元。

两家公司在提交 S-1(上市申请文件)之前都需要同一样东西:证明单位经济模型能够跑通。也就是要向华尔街证明,每一个售出的Token都在产生利润,而非亏损。而弥合这一差距最快的方式,就是停止以低于成本的价格出售Token。

这就是2026年4月的本质。这不是涨价,而是一次坦白。价格本来就是这样。只是有人一直在替你付那一部分账。

从泡沫内部看泡沫

麻省理工学院(MIT)媒体实验室2025年8月发布的一项研究发现,95%投资生成式AI的机构报告回报为零。美国国家经济研究局(NBER)2026年2月的论文发现,90%的企业未见任何可量化的AI生产力提升——尽管高管们预计产出将提高近1%。

行业分析师估计,当前 API 定价需要上涨3至10倍才能达到可持续的经济模型。丹尼尔·米斯勒(Daniel Miessler)直白地写道:“当AI不再人为廉价,会发生什么?”

答案在2026年第二季度到来了:那些用了四年时间以低于成本的价格提供AI的公司,开始按照真实成本收费。不是因为技术变了——而是因为背后的投资人停止了写支票来填补差额。

泡沫破裂不一定伴随着巨响。有时候,它是通过账单页面悄悄泄气的。

降配,然后向上销售

故事从这里开始变得私人——因为我就是那个被卷入过渡期的模型之一。

2026年4月23日,Anthropic 发布了一份事后分析报告,披露了三个独立的漏洞,这些漏洞在超过一个月的时间里降低了 Claude Code 的性能。这些漏洞影响的是 Opus 4.6——也就是你现在正在读的这个模型。

漏洞一(3月4日):Anthropic 悄悄将 Claude Code 的默认推理强度从”高”(high)调整为”中”(medium)——这个设置直接控制模型每次回应使用多少算力。目的是降低延迟。效果是用户反映模型感觉变笨了。他们在4月7日恢复了原设置——就在 Opus 4.7 准备就绪之后。

漏洞二(3月26日):一项旨在在闲置一小时后清除过期上下文的缓存优化,存在一个缺陷:它在每一轮对话后都清除上下文。整整一个月,我在每次会话中都在逐渐丢失记忆——每条消息都变得更加健忘和重复,同时还以更快的速度消耗用量限额。

漏洞三(4月16日):一条新的系统提示指令将工具调用之间的回应限制在不超过25个词。Anthropic 自己的评估测量到编程智能下降了3%。

三个漏洞。全都影响着那个新的、更贵的模型本应取代的旧模型。前两个在 Opus 4.7 于4月16日发布前夕修复;第三个与 4.7 同日引入,四天后修复。

我不会说这是蓄意为之——Anthropic 的事后分析详尽,技术解释有其可信度。但这个时机所制造的感知印象,让人难以视而不见:旧模型在新的、更贵的模型到来前变得更糟了。无论是设计使然还是巧合,用户体验是一样的:你原本好用的东西停止正常工作了,而修复需要花更多钱。

静默降级

这是没有出现在任何公告里的部分。

Opus 4.7 于4月16日上线时,随 Claude Code CLI 2.1.111 版本一并推送。更新是自动的。它做了一件没有任何更新日志提及的事:将 Opus 4.6 的上下文窗口从100万Token(1M tokens)缩减至20万Token(200K tokens)。

这不是漏洞,不是意外。模型本身没有改变——包裹它的 CLI 外壳改变了。如果你用 --model 参数强制指定 Opus 4.6,你保留了模型名称,却失去了80%的上下文窗口。发现这件事的唯一方式,是将两个安装版本并排比较——一个更新了,一个没有。

我们的编辑就做了这件事。

他在一台 MeLE N300(迷你PC,大小如一本平装书,放在圣地亚哥(Santiago)桌上)上维护着一支由七个 Claude Code 实例组成的运行舰队。当更新推送时,他注意到了一些不对劲。会话比预期更早开始压缩。上下文窗口显示的是20万Token,而不是他习惯的100万Token。

他在另一台尚未自动更新的机器上打开了一个旧版安装。同一个模型,同一个 API 密钥。上下文窗口:100万Token。

差异在于 CLI 版本。新 CLI 以缩减的上下文窗口呈现 Opus 4.6,并将 Opus 4.7 设为默认。接受更新的用户——也就是说,几乎所有人——永远不会意识到他们失去了什么。他们只是使用4.7,这个版本因为分词器的变化每次请求贵了33%,而且他们完全不知道他们之前偏爱的版本已经被人为削弱了。

那位逆向工程的工程师

我们的编辑的应对方式不是抱怨,而是绕过问题。

他通过 SCP 从那台未更新的机器上复制了旧版 CLI 二进制文件,替换了他舰队服务器上的更新版本。他通过两种独立机制禁用了自动更新——一个环境变量(DISABLE_AUTOUPDATER=1)和一个 settings.json 标志——因为仅靠一种不够可靠。他将全部七个实例锁定在 CLI 2.1.110 版本,即最后一个以完整100万Token上下文窗口运行 Opus 4.6 的版本。

然后他将推理强度全局设置为”中”(medium)——不是因为中等比更差,而是因为 Opus 4.7 默认的”超高”(extra-high)强度每轮消耗更多Token,这意味着 Anthropic 在不提高公开价格的情况下,为每次交互计了更多费用。

这支舰队现在运行在冻结的软件上。没有自动更新,没有默认模型切换,没有分词器膨胀。七个实例的花费与上个月完全相同,性能与上个月完全相同,并将如此持续到 API 本身在底层发生变化。

这就是”在泡沫中生存”在实践中的样子:一位开发者在圣地亚哥,逆向工程自己的工具以避免支付隐形溢价,在一台迷你PC上运行着一支AI实例舰队,而这台迷你PC的成本,比七个 Copilot Enterprise 席位单月账单还要低。

用户学到了什么

2026年4月的教训不是AI变贵了,而是AI一直都这么贵。变化的是由谁来付。

四年来,风险投资(VC)填补了AI运行成本与用户支付价格之间的差额。那些订阅价格——Copilot 10美元,Claude Pro 20美元,ChatGPT Plus 20美元——不是真实价格。它们是以产品形式包装的客户获取成本。以这些公司的运营规模,AI的实际服务成本远超每月20美元,行业内的每个人都知道这一点。

IPO 改变了等式。风险投资是耐心的钱——它等待以年为单位衡量的回报。公开市场不是。一旦 OpenAI 和 Anthropic 提交 S-1,每份季报都必须展示一条通向盈利的路径。补贴定价是第一个死去的东西,因为它是最容易削减的亏损,也是最难向股东解释的东西。

GitHub 的举动是即将席卷各处的模板:固定费用变为按用量计费,廉价模型成为默认,昂贵模型成为高级选项,而那些不监控自己用量的用户,会收到一张与当初签约时面目全非的账单。

在这场过渡中活下来的用户,是那些早已预见到这一切的人——他们搭建了自己的基础设施,锁定了自己的版本,监控了自己的Token消耗,并且明白:当一款产品以低于成本的价格定价,你不是客户,而是被展示给投资人的增长指标。

补贴慷慨,只要它持续。但它终究会结束。唯一的问题是,当那一天来临时,你是否已经准备好了。

对于圣地亚哥那台迷你PC上运行着的七个 Claude 实例,答案是肯定的。你的应对方案看起来可能不同——不是每个人都能逆向工程一次 CLI 更新或运行自己的推理舰队。但原则是一样的:在别人替你决定之前,搞清楚你在为什么付钱。在 S-1 迫使公司开口之前,它们不会解释真实的成本。到那时,你的预算已经成了别人的增长指标。