国产 AI 模型「霸榜真相」：一场被高估的胜利

全球视野, 下注中国

打开APP

5 个月前14.1k

二阶变量

聚焦 AI 科技，关注决定长期走向的二阶变量。

+关注

当我们为国产AI在OpenRouter上的表现而振奋时，也不得不冷静看待：短期内的的流量繁荣、平台本身的用属性限制、以及整个行业尚未解决的商业化难题，都在提醒我们，Token调用量的领先并非终局，一场更深刻、更艰难的价值创造竞赛才刚刚展开。

截屏2026-03-10 10.27.35.png 2026 年 2 月，国内 AI 产业发展迎来历史性时刻。

全球最大 AI 模型 API 聚合平台 OpenRouter 数据显示，国产 AI 模型的调用量三周大涨 127%，首次超越美国模型，全球前五中占据四席。

最新的 2 月 16 日至 22 日的周榜单中，平台调用量排名前五的模型中，有四款来自中国厂商，包括 MiniMax 的 M2.5、月之暗面的 Kimi K2.5、智谱的 GLM-5、DeepSeek 的 V3.2。

这四款模型合计贡献了 Top 5 总调用量的 85.7%。

截屏2026-03-10 10.27.43.png 这个数据迅速在科技圈引发热议——有人欢呼「中国 AI 终于逆袭了」，有人担心「这会不会是昙花一现？」，更多人则在思考：这背后究竟意味着什么？

如果我们将目光从单一的数据点移开，观察整个中国 AI 产业的发展轨迹，会发现国内 AI 大模型的路径分化，是面临当时的「AI 原生困境」，企业不得不寻找差异化的生存之道，最终催生了如今多元发展的格局。

当我们为国产 AI 在 OpenRouter 上的表现而振奋时，也不得不冷静看待——短期内的的流量繁荣、平台本身的用户属性限制、以及整个行业尚未解决的商业化难题，都在提醒我们：Token 调用量的领先并非终局，一场更深刻、更艰难的价值创造竞赛才刚刚展开。

1、国产 AI「群雄逐鹿」，凭什么让硅谷慌了？

「4」vs「1」，当下的局面确实有意思。国产 AI 模型这次能冲上来，靠的不是哪一家公司突然爆火，而是四家公司从不同方向一起发力，形成了一种「群雄逐鹿」的态势。

在具体分析之前，我们得先摆正一个基本事实：

美国的大模型公司，技术底子确实厚实。OpenAI 网罗了从谷歌、Meta 出来的顶尖 AI 人才，坐拥这个领域最聪明的一批大脑；Anthropic 则在 AI 安全和面向企业的市场里，早早筑起了自己的护城河。

必须承认，美国 AI 模型的确很强。其实在 2025 年，美国模型还是市场增长的绝对主力，在 OpenRouter 平台上，前十大模型的周调用量里，它们一度占了近 70%，而中国模型的份额还不到 20%。

谁能想到，进入 2026 年，局面开始松动。美国模型的增长显出了疲态，而国产 AI 模型却像踩足了油门，开启了「狂飙」模式。

这就引出一个核心问题：为什么中美 AI 的竞争，会演变成当下「4 vs 1」的格局？

如果仔细看，会发现美国这两家巨头有个共同点：它们都一致追求「技术领先」这条路径。OpenAI「赌上全部身家」追求通用人工智能（AGI），Anthropic 则在 AI 安全和企业级市场建立了一定壁垒。

在硅谷的逻辑里，只要技术足够顶尖，市场自然会跟来——这几乎是他们过去几十年成功的铁律。

但我们的故事，是完全不同的「剧本」。

国内大模型厂商不去卷通用的维度，而是更注重于不同的技术维度上深耕，从而走出了四条差异鲜明的路：

MiniMax：走的是情感体验路线。它想成为最懂你的「伴侣」、最了解你的「产品」，用多模态和强互动在 C 端市场扎根。

这背后是多模态融合技术的深度探索——如何让 AI 更好地理解情感、生成自然的交互。

月之暗面（Kimi）：押注长文本处理这个单点能力。它把「200 万字上下文」做成了自己的名片。这并非简单的参数堆砌，而是在注意力机制、内存优化、推理效率等底层技术上的重大突破，让 AI 真正成为人类记忆和知识的延伸。

智谱 AI：构建的是政企信任。背靠清华背景，深耕 To B 和 To G 市场，用安全可控的架构设计、数据隐私保护、行业知识融合等方面的服务建立起深厚的合作关系壁垒。

DeepSeek：追求的是极致效率。依托于 MoE 架构创新、FP8 混合精度训练、分布式系统设计等一系列技术突破，把大模型的训练和推理成本打到极低，成为「价格屠夫」，重新定义了性能与成本的平衡。

之前有观点认为，国产 AI 大模型凭借是因为「极致性价比」实现了「反超」——用接近美国模型的性能，但价格只有几分之一。这确实是撕开市场口子最锋利的「矛尖」。

但性价比只是刺穿壁垒的第一击。或许真正决定能走多远的，是握矛的整个「手掌」，是全身的协同发力。

比性价比优势更值得关注的，是国内 AI 展现出的多维竞争力：体验、能力、信任、效率，四个维度、四种活法。

换句话说，当这四家大模型厂商一起出现在全球 API 市场上时，它们形成了一种「多元覆盖」的网络——国际市场中，无论用户的需求是追求新奇体验、需要专业能力、要求绝对可靠，还是预算极度敏感，总有一款国产模型能对上号。

这不是国内某一家大模型厂商单挑国际 AI 巨头，而是共生的环境中，用不同的技术路径，回答「AI 如何创造价值」这同一个问题。

2、被逼出来的「生路」：国产 AI 反击的真相

当然，中国 AI 厂商的路径分化，如今看来是充满智慧的差异化布局。但如果回到三年前，从当时的资源约束和产业困境来看，这却不是主动的战略选择，而是在严苛的生存压力下，被逼出来的「达尔文式」进化。

2022 年 11 月，OpenAI 推出 ChatGPT，5 天用户破百万，两个月月活过亿。这不仅互联网历史上用户增长最快的纪录，更宣告了通用人工智能（AGI）时代的正式来临。

然而，在世界的另一端，国内 AI 从业者的反应却五味杂陈——兴奋、焦虑，还有一丝「又慢了一步」的无奈。

2023 年 5 月，复旦大学 MOSS 系统负责人邱锡鹏在采访时坦言：「我们不得不说，不光是国内的模型，包括谷歌，离 OpenAI 的 GPT4 都还是存在代差的，差距非常大，远远不是几个月就可以追赶上的。」在当时看来，这是一道中美 AI 模型间难以跨越的鸿沟。

横在面前的，是三座现实的大山：

第一座是算力的枷锁。

训练 GPT-4 级别的模型，需要约 25000 块顶级 GPU。但在起初，国内几乎无法获得这样的算力。2023 年 7 月，一颗 A800 芯片的价格从 9 万元飙升至 15 万元，还一卡难求。

第二座是资本的焦虑。

国内风投虽然热情高涨，但面对动辄数十亿甚至百亿美元的训练成本，普遍选择了保守，金沙江创投主管合伙人朱啸虎便在访谈中表示过，中国不需要在 AGI（通用人工智能）砸钱。因此，很少有国内大模型厂商愿意短期内巨额资金去赌一个「可能」的 AGI。

第三座是数据的尴尬。

北京智源人工智能研究院副院长林咏华曾指出，中文语料占英文开源语料的十分之一甚至更少，而政务、医疗等关键领域的合规数据获取更是难上加难，直接制约了模型训练。

这就是中国 AI 的「原生困境」：不是不想做全能冠军，而是在资源的重重约束下，必须另辟蹊径。于是，在特定维度上寻求技术与产品突破，成了更适合的道路。

2023 年，MiniMax 创始人闫俊杰便做出了一个明确的判断：

坚决不做移动端通用个人智能助手，类似豆包、ChatGPT 等对话产品，因为在这一方向上难以创造独特的价值。

日前，在 2025 年全年业绩电话会上，闫俊杰似乎更加庆幸当年自己做的决定：「从第一天起，MiniMax 就围绕全模态能力不断提升模型智能密度和边界，产生独特价值，并据此展开产品和业务布局。」

「有所为，有所不为，从而能够聚焦资源。」

2023 年 3 月，从硅谷归国不久后的杨植麟创立了月之暗面。

「全球每个 AI 大模型都有自己擅长的领域，即使是 ChatGPT-4，也只是擅长的领域较多，而不是没有短板。」在此背景下，Kimi 专注于长文本处理能力，快速打响了知名度，给用户留下了 Kimi 善于处理长上下文的印象。

当 2024 年 3 月，月之暗面宣布 Kimi 的上下文突破 200 万字时，整个行业为之侧目。

杨植麟或许也会感慨，没有被一时的大模型热潮裹挟，才能够绕开攀登 OpenAI 所在的那座高峰，而是在相邻的山脊上择路而行，悄悄建立起自己的营地。

而最让硅谷意外的，是 DeepSeek 的横空出世。

2024 年底，当全球目光聚焦于 GPT-4 和 Claude 时，DeepSeek 团队投下了一颗「成本炸弹」：

DeepSeek-V3，训练成本仅 557.6 万美元，性能却逼近 GPT-4o。Meta 实现类似能力需花费超六千万美元，而 DeepSeek 用不到其十分之一的成本就做到了。

业内人士表示，「这一成就的历史性意义在于，它是在硬件特别是高端芯片受限的情况下，通过创新算法和高效的工程设计实现的」。

从某种程度上说，中国的「路径分化」，是本土市场环境下塑造的必然结果。

所以，当我们回望过去几年中美 AI 的发展轨迹，一个清晰的对比浮现出来：

美国 AI 厂商在追求「更大、更强、更通用」，信奉用无限资本和算力堆出 AGI 的「缩放定律」。

国内 AI 厂商在探索「更低成本、更垂直、更特色」，是在有限条件下，为寻找生存空间而进行的「适者生存」。

这并非战略的高下之分，而是资源禀赋截然不同所导致的路径分岔。硅谷玩的是的是「拓荒」的游戏——在无人区开辟新大陆；国内 AI 厂商则是在这片大陆上特定的区域中，成为更加全能的生存者。

3、「榜单幻觉」之外，AI 模型的真正战场在哪里？

国内 AI 大模型虽然找到了一条独特的发展道路，但当我们仔细审视近期这份「漂亮的成绩单」时，还有几个事实不能够忽略。

关于这次在 OpenRouter 短时间内登顶的暴涨，业内其实有一些争议。

有观点认为，这次的 Token 数据可能有一定水分。

比如，MiniMax M2.5 单周 197% 的暴涨，很大程度上受益于 Kilo Code 和 Cline 两大 AI 编程工具的免费推广。

2 月 12 日起，Kilo Code 为超过 150 万开发者用户提供一周免费 M2.5 访问，Cline 也做了类似活动。

一位行业观察者指出，这和「中国模型打败美国模型」关系不大——之前 Grok Code Fast 免费的时候，也曾短暂冲上榜首。

这意味着，高调用量中，有一部分是由「免费」和「尝鲜」驱动的测试流量，它证明了市场吸引力和用户尝试的意愿，但长期来看，真正的考验在于：当免费午餐结束后，用户还会不会留下来继续付费使用？

还有一个因素也被低估了——OpenRouter 这个平台本身的用户属性。

有分析指出，OpenRouter 的核心用户群本就偏向于寻求高性价比、灵活切换模型的开发者和研究者。

普通消费者会直接使用 ChatGPT 等官方应用，而具有稳定、大规模需求的企业客户，则会直接与模型厂商签订协议，调用原生 API 以获得更好的服务、稳定性和商业条款。

因此，中国模型的「霸榜」目前局限在全球 AI 应用的「创新实验室」里，尚未攻入企业级的「中央机房」。

目前，OpenRouter 的短暂「胜利」，反映的是一个特定生态位的胜利，而非全面超越。当然，这个信号依然重要，它起码证明：在众多实际应用场景下，国内 AI 大模型已经达到了「够用」甚至「好用」的标准。

然而，行业的真正考验还在于用户留存和可持续的商业模式。

QuestMobile 2026 年 1-2 月生成式 AI 行业监测报告显示，国内主流 AI 应用的留存曲线呈现出「断崖式下跌」的典型特征。

从具体数据来看，AI 应用的首日留存率平均可达 65%，这得益于春节期间各大平台铺天盖地的营销推广与红包补贴。

然而，这份热度来得快去得更快，3 日留存率便骤降至 42%，7 日留存率仅剩 25%，15 日留存率跌破 18%，直至第 30 天，平均留存率定格在 12.8%，较首日留存跌幅超 80%。

4、这背后，还有一个更根本的问题：钱从哪里来？

当我们谈论 AI 的未来时，总绕不开一个现实——整个行业还在「烧钱换增长」的阶段。看看国内外的情况，其实大家都差不多。

OpenAI 算是走得最快的，靠着 ChatGPT 的先发优势和微软的支持，摸索出了订阅制加 API 调用的路子。

但即便如此，2025 年他们营收大概 40 亿美元，亏损却高达 50 亿美元，赚的钱还不够填窟窿。

Anthropic、Meta 这些巨头也一样，都在疯狂投入，离真正赚钱还有很长的路要走。说白了，技术跑得比商业模式快太多了。

算力成本高得吓人，但用户愿意付的钱却有限，这个矛盾到现在还没解决。

再来看看当前的付费模式，基本上就三条路：会员订阅、API 调用、企业级服务。

而每条路的竞争也异常激烈。会员订阅看起来最直接，但今天买了会员，下个月可能就不用了，续费率怎么保证？

API 调用倒是灵活，但中小开发者对价格敏感得很，一有免费替代品，立马就跑了。企业级服务毛利是高，可门槛也高，需要长时间的积累和信任，不是谁都能做的。

回到最初的问题：我们该如何看待被流量霸榜的「中国时刻」？答案显然比刷屏的数据更加复杂：

Token 调用量暴增可能只是一个过渡形态，而非行业终局。

用户愿不愿意持续付费？企业能不能找到稳定的盈利模式？这些问题，我们和国际领先者一样，都还在摸索。

短暂的登顶固然提振了行业信心，但真正的考验，从来不是榜单上的排名，而是当潮水退去后，还有多少用户愿意真金白银地为你买单。

行业需要的不是自欺欺人的数字游戏，而是回归用户价值、回归商业本质的长期主义。

毕竟，AI 的终极赛场，不在 OpenRouter 的排行榜上，而在千千万万普通用户的日常使用中。

格隆汇声明：文中观点均来自原作者，不代表格隆汇观点及立场。特别提醒，投资决策需建立在独立思考之上，本文内容仅供参考，不作为实际操作建议，交易风险自担。

App内直接打开

商务、渠道、广告合作/招聘立即咨询

我也说两句

相关文章

大湾区首单H回A！越疆科技86天过会，持续亏损叠加股权争议待解

深度 | 特斯拉利薄如纸，马斯克一把梭哈

“卓”识远见，“信”赢全球：香港卓信会计，让南昌企业的出海战略从容落地