老黄可能开始焦虑了

9 小时前8.3k
只做卖铲人,已经不能让 Nvidia 高枕无虞了。

2026415日,黄仁勋在Dwarkesh Patel 的播客里经历了一场他很久没经历过的尖锐追问。一个多小时的对话,他反复用来定义英伟达的那句话是:必须有东西把电子变成token他把自家公司形容成全球每瓦生产token 最多的架构”——不是每瓦算力最多,是每瓦 token 最多。

这是一家卖GPU的公司,在重新定义自己。

为什么要重新定义?因为他比任何人都更早地看见一件事——AI 时代的权力,正在被分成两种不同的东西。一种是算力,在美国手里;另一种是 token,在中国手里。这两种权力不在同一个平面上,谁都吃不掉谁。而英伟达夹在中间,它原来以为自己是最大的赢家,现在发现自己是这两个结构里都没有舒服位置的那个。

这才是他焦虑的真正原因。

 

算力的地主,token 的租客

先看美国那半边。

414 日,EpochAI 发布最新数据——AmazonGoogleMetaMicrosoftOracle 五家美国 hyperscaler 合计持有全球 67% AI 算力,按H100 等价口径折算。2024 Q1 这个数字是 60%。十八个月里,全球 AI 算力的集中度又提高了七个百分点,而且上行趋势看不到减速。

这五家公司有一个共同点:它们都不做前沿模型。

Google 算是一个例外,TPU 自研加 Gemini 自己做,但剩下四家的基本身位是收租的”——Microsoft Azure OpenAI 租算力,Amazon AWS 和自家 Trainium 芯片把 Anthropic 绑在身边,Oracle Stargate 项目切进 OpenAI的基础设施版图,Meta 自己造芯片但主要内用,4 13 日刚与 Broadcom 签了 1GW 自研芯片订单。

那谁在用这些算力?前沿 AI lab 都是它们的租客。Anthropic 刚宣布扩大与Google TPU 合作,未来几年要接入多GW 级算力。OpenAI 的骨干算力是Microsoft Azure Oracle Stargate——OpenAI 2 月刚完成 1100 亿美元融资,Amazon 投了 500 亿,SoftBank 投了 300 亿,Nvidia 追加了300 亿(从原本承诺的1000 亿缩水而来)。xAI 自建集群,但芯片仍然从英伟达买。

美国 AI 产业真实的权力结构,是这样的:5 家算力地主 + 3 家前沿模型租客 + 一个 Nvidia。外界以为 OpenAIAnthropicxAI 是主角,实际上它们是交租的一方。它们每融一轮钱,都要把大头交给那五家地主——这五家地主同时也是它们的投资人、它们的供应商、它们的谈判对手。

Nvidia 在这个结构里,看上去是最大的赢家。它拿了 2026 财年大约 1150 亿美元的数据中心收入,市值 3 万亿美元以上。但这个身位的脆弱性,黄仁勋自己看得最清楚。

他在3月的Morgan Stanley大会上宣布,Nvidia 投资 OpenAI 300亿美元和投资Anthropic 100亿美元大概率都是最后一笔。两个月前他刚把那100亿美元押给AnthropicAnthropic转身就加大了 TPU合作——Nvidia投资的钱,流回去帮对手做非英伟达的算力。

这是商业层面的选择:Anthropic 不能只依赖一家芯片供应商,它必须分散。Nvidia 的客户结构本来就高度集中——全球算力版图上,真正的大户就是那五家美国公司。加上中国市场,那就是它过去两年数据中心业务的全部核心收入池。2025 4 月之后,H20 禁令让中国这一池水基本蒸发。剩下的五家客户,每一家都比 Nvidia 更想往上游吃——Meta自研芯片、Amazon TrainiumGoogleTPUMicrosoft Oracle在押 OpenAI 的自研 Titan

一个卖铲子的人,面对的客户是五家正在自己造铲子的人。这就是美国结构里英伟达的真实处境。

 

token 的工厂,没有业主也没有租客

再看中国那半边。

中国前四大云厂商——阿里云、字节火山引擎、腾讯云、百度智能云——全部都同时在做两件事:一边卖算力,一边做自己的大模型。阿里云的底下是千问(Qwen),火山引擎的底下是豆包和 Seedance,腾讯云的底下是混元,百度智能云的底下是文心。再加上对于对于 AI “新势力们错综复杂的投资,产业布局都很完备。

中国的云厂商只能同时做业主和租客——自己造算力、自己造模型、自己消化 token,最后把 token 作为商品卖给下游企业。算力、模型、应用三层被同一家公司吃掉,整条价值链上只剩下一种东西可以作为商品出货——token

阿里是这个链条的代表性企业, ATH大家都很熟悉了:CEO 吴泳铭在内部备忘录里给它定下了核心使命:创造 Token、输送 Token、应用 Token” ATH 成立后的一个月,阿里的动作密度是过去两年之最。

3 30 日发布Qwen3.5-Omni——Qwen 系列近年来第一次从开源走向闭源。紧接着Qwen 3.6 Plus OpenRouter上以 4.6 万亿/周的调用量登顶全球大模型周调用量冠军,同系列的Preview 版本拿下第三。今天,ATH 又掏出了最新的开放式世界模型产品Happy Oyster,研发效率堪称恐怖。

吴泳铭在 3 19 日的财报电话会上说了一句话,分量比 ATH 成立本身更大。他说:企业在消耗 Token 时不再把它当作 IT 预算,而是当作生产资料IT 预算是成本项,是被优化的对象;生产资料是投入项,是被扩张的对象。一家万亿美金市值的中国公司的 CEO 在财报电话会上告诉华尔街——token 已经从支出变成了投入,从“IT 科目变成了经济活动本身。他给出的具体数字是:未来五年,阿里云和 AI 商业化年收入要冲到1000 亿美元。按新的 Token 消耗算法,这1000 亿美元甚至可以包含电商业务产生的 AI 收入。

在企业的动作之前,监管则是更早给这场科技的盛宴定下了基调。3 23 日,国家数据局局长刘烈宏在中国发展高层论坛年会上正式把 token 的中文译名定为词元,并称其为智能时代的价值锚点连接技术供给与商业需求的结算单位。第二天国新办发布会上,他公布了一组官方数字——中国日均词元调用量突破140 万亿,对比2024 年初的1000 亿,两年增长超过一千倍。

这是把 token 从技术概念抬升为经济统计指标的动作。流量之于互联网时代,词元之于 AI 时代。OpenRouter 平台给了这套叙事最硬的数据支点——2 9 日至 15 日那一周,中国大模型的 Token 调用量首次超过美国,4.12 万亿对 2.94 万亿。 4 月初,中国模型周调用量达到 12.96 万亿,美国模型 3.03 万亿,中国已经连续五周领先,全球调用量前六全部是中国模型。MiniMax M2.5 发布后七天调用量突破 3.07 万亿。Kimi K2.5 发布不到一个月,近 20 天累计收入超过了月之暗面 2025 全年总收入。智谱 GLM-5 在春节期间因为流量爆单,公开寻找算力合伙人”——不是营销噱头,是真实订单把产能撑爆了。

算一下结构差异。美国那半边,算力是核心资产,token 是算力的副产品。中国这半边反过来——token 是核心商品,算力是生产 token 的原料。定价逻辑、商业模型、公司估值、监管指标,全部围绕两种不同的东西展开。

大洋那边充满了算力,但 token 却源源不断从大洋这边产生。

 

老黄为什么焦虑

回到 Dwarkesh 的播客。

黄仁勋在访谈里给出一个他反复使用的框架——“five-layer cake”AI产业有五层:能源、芯片、系统、模型、应用。他说美国必须在五层里每一层都领先,否则就是败局。他说中国是全世界开源软件最大的贡献者,说这话时连说两次“Fact”——事实、事实。他说中国占全球 AI 研究员的一半,制造全球 60% 以上的主流芯片,有大量满电空置的幽灵数据中心。他说 AI 的大部分进步来自算法进步,不是硬件本身。然后他抛出一句话——如果 DeepSeek 的下一个版本首发在华为芯片上,对美国来说是灾难

图片2.png

这些话串在一起读,意思已经很清楚了。他的焦虑不是来自中国追上来这种宏观叙事,而是来自一个明确的尴尬窘境——在美国那半边,他正在失去议价权;在中国那半边,他正在失去入场券

在美国那半边:5hyperscaler 拿走了 67% 的全球算力,它们是他最大的客户,也是他最强的对手。它们每一家都在做自研芯片——Meta 刚签了 1GWBroadcom 订单,Amazon Trainium 拿下了 AnthropicGoogle TPU 在吞噬Nvidia的份额。当你的客户同时是你的对手,当你的市场集中到只剩 5 家买主,你的定价权就是一个慢慢被蚕食的过程。Anthropic 拿了 Nvidia100 亿美元投资两个月后反手加大 TPU 合作——这件事是趋势,不是偶然。

在中国那半边:token生态正在绕过英伟达。DeepSeek V4 的蓄势待发,在华为 Ascend 950PR上跑训练和推理,不走 Nvidia。阿里、字节、腾讯为此批量下单了几十万片华为芯片。QwenKimi MiniMax 们每周产出几万亿 token 的模型,每多跑一天,华为芯片的装机量就涨一天。更严重的是,这些模型的用户正在全球扩张——OpenRouter 上中国模型连续五周超过美国,MiniMax 主打“1 美元跑一小时 AI 数字员工Kimi 的海外付费用户正在反超国内。当世界开发者的默认技术栈开始从英伟达切换到华为,Nvidia 在这条链路上一个字都插不进去

面对这两个困境,英伟达过去半年做了两件事,都可以在这个命题下被重新解读。

第一件事,亲自下场做自己本不该做的产品3 月的 GTC 上,Nvidia 连发 Cosmos 3(世界基础模型)、Isaac GR00T N1.7(机器人)、Alpamayo1.5(自动驾驶)、Nemotron(开源大模型家族)——一整套覆盖物理 AI 和前沿模型的栈。4 14 日世界量子日,它发布 Ising——开源的量子 AI 模型家族,黄仁勋亲自给它定性:“AI 成为控制面,成为量子机器的操作系统。这些发布加在一起传递的信号非常明确:英伟达不再满足于做芯片,它要做模型、做操作系统、做物理世界的模拟器、做量子计算的控制层。卖铲子的人开始自己挖矿,不是因为贪心,是因为两个结构都在挤压他的原有位置。

第二件事,他把公司的核心指标从算力迁移到产出“electrons to tokens” 这个比喻他在 Dwarkesh 访谈里用了不下五次。他把 Nvidia 形容成全球每瓦生产 token 最多的架构”——不是每瓦算力最多,是每瓦 token 最多。一家把核心指标从算力改成“token”的公司,已经承认了这个时代的硬通货在哪里。

但承认不等于解决。他手里的 GPU 本质上还是生产算力的机器,不是直接生产 token 的机器。他在两个结构里都在做对的事——在美国扩张上游、在技术栈上锁住开发者——但这些动作都没法改变基本面:算力和 token 不在同一个平面上。一家只生产算力的公司,无论怎么重新定义自己,都没法同时占据两种权力。

只做卖铲人,已经不能让 Nvidia 高枕无虞了。

 

结语

AI 时代的权力结构,现在已经分成了两半。

美国那半边是地产——5 hyperscaler 坐在 67% 的全球算力上,前沿 lab 是它们的租客。这个结构里,算力是硬资产,估值逻辑是地皮面积 × 租金。中国这半边是工厂——4 家云厂把算力、模型、应用压成一条流水线,token 是唯一的出货物。这个结构里,token 是硬通货,估值逻辑是产出量 × 单价

两种结构互相不可吃掉。美国的算力地主没法直接进入中国的 token 工厂——监管、生态、开发者习惯都拦着。中国的 token 工厂也没法直接替代美国的算力地主——前沿训练还是要最先进的硬件,华为 Ascend 追得再快,短期内补不上与顶级Nvidia 芯片的代际差距。两种权力各自运转,各自扩张,各自找各自的出口。

黄仁勋夹在中间。他本来以为自己是这个时代最大的赢家——算力是上游,模型是下游,他给上游和下游都供货,他是唯一的瓶颈。但瓶颈的位置正在双向松动。上游那半边,5 家地主自己造芯片;下游那半边,中国用国产芯片跑出了自己的 token 生态。向左扩张(投资OpenAIAnthropic)没守住下游,往右扩张还没证明能守住技术栈。他一个人,两条战线,都面临着增长的困境。

他在播客里说,必须有东西把电子变成 token”。他是在替英伟达的未来辩护,但这句话本身已经承认了——这个时代的硬通货不是电子,是 token。而生产token最密集的地方,目前不在美国。

他在两种结构之间,Nvidia正在失去最舒服的位置。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

App内直接打开
商务、渠道、广告合作/招聘立即咨询

相关文章

早报 (04.17)| 突发!特朗普:伊朗同意不拥核,周末或再谈;纳指十二连涨!中国资产狂飙;贵州茅台营收、利润双降

早报君 · 13分钟前

cover_pic

经济“开门红”的成色

申万宏源宏观 · 1小时前

cover_pic

失意的耐克、爬坡的阿迪,谁能接住中国670亿美元的泼天富贵?

产联社 · 昨天 20:56

cover_pic
我也说两句