Anthropic交表，MiniMax冲A，而我最想聊的是M3大模型

全球视野, 下注中国

打开APP

8 小时前14.5k

互联网怪盗团

互联网行业研究及观察者。

+关注

MiniMax M3是全球第一个集齐了Frontier三件套的开源大模型。

Anthropic刚刚向美国SEC递交了保密的招股书，一个万亿美元市值的IPO即将诞生——这也是迄今为止，AI产业规模最大的IPO。差不多同一时间，MiniMax开始冲刺A股上市。今年是人工智能的资本大年，也是技术和应用大年。归根结底，是技术进步推动了AI商业化的加速发展，从而进一步推动了资本市场的乐观情绪。这是本轮人工智能牛市与1990年代后期的互联网泡沫最大的不同点！

整整两个月以前，我跟一位在AI领域颇富经验的投资人朋友喝茶，讨论国产大模型公司的特点和战略定位。在谈到MiniMax时，我的观点是：“应用层做得不错，市场推广也很好，海外应用尤其成功。但是在基础模型技术上，似乎没有特殊之处，让我感觉不到特色。”出乎我意料的是，对方马上进行了全方位的反驳，表示：“低估MiniMax的基础模型实力，是很多人常犯的错误，尤其多见于资本市场。”当时他没能说服我，但是留下了一个预言：“几个月之内，你会重新审视对这家公司的技术水平的看法。”附带说一句，我们的讨论与资本市场的短期波动完全无关，当时如此，现在也是如此。

6月1日这一天，这件事情果然发生了：MiniMax M3大模型发布。不巧的是，在此前后，包括MiniMax在内的中国AI上市公司经历了普遍的深度调整，导致在社交媒体上，对模型的讨论基本让位于对股价的讨论（我对此深感遗憾）。而且由于今年以来，国产大模型更新频率太快，热门模型此起彼伏，很多人可能忽视了这个模型的特殊意义。但是对于AI编程以及Agentic Workflow的重度用户来说，应该能迅速掂量出这个模型的分量：

具备强大的Coding/Agent Frontier能力；
具备1M Context Window（上下文窗口）；
原生多模态能力，能理解图像、视频等多模态信息；
开源。

在国产大模型当中，MiniMax M3是第一个集齐了前三项（不妨称之为“Frontier三件套”）的。一个多月前发布的DeepSeek V4是一个很优秀的模型、已经积累了大量用户，但它是一个纯文本模型，暂不具备原生多模态能力。很多国产大模型有多模态能力，但要么上下文窗口偏小，要么Coding能力不够强，或者二者均有瑕疵（在此就不逐一点名分析了）。

而在全球范围内，只有Claude Opus 4.8, GPT 5.5, Gemini 3.1等前沿大模型具备“Frontier三件套”，但是很可惜，它们都不开源。MiniMax M3是迄今为止出现过的Coding/Agent能力最强大、最全面的开源大模型，这不仅是我个人的观点，也是许多专业评测者的观点。“硅谷闭源模型 VS 国产开源模型”，这不仅是一种媒体或资本市场的叙事范式，更是板上钉钉的现实趋势，而MiniMax M3的发布进一步确认了这一趋势。

嗯，不妨更准确地说——“高价的硅谷闭源模型 VS 低价的国产开源模型”。国产大模型的Token定价一贯以价廉物美、量大管饱著称，与十分昂贵的Claude形成了鲜明对比；而MiniMax M3的定价即便在国产大模型当中也是颇具竞争力的。就拿个人开发者的Token Plan付费方案来说，Max售价为每月119元人民币，提供18亿Token，相当于Claude Max 5x（每月100美元）容量的2倍，平均每100万Token的售价仅为0.066元。MiniMax官方显然认为，这样的定价对当前的模型能力和使用场景是最适合的。

当然，需要承认的是，在尖端的Coding能力上，Claude仍然难以替代，这是它索取溢价的底气。但是在大部分日常Agent Workflow当中，M3能够以很高的性价比提供令人满意的效果——大部分用户需要的不就是这个吗？在此援引知名AI技术大牛、Vercel CEO Guillermo Rauch的评论：“MiniMax M3……仅仅略逊于Opus & GPT5, 但是要便宜10倍。”(Right behind Opus & GPT5, but 10x cheaper.)

Artificial Analysis (AA)综合智能指数排行榜，MiniMax M3位列全球第七，这也是开源模型的全球最高排名

短短半年之前，资本市场还在争论“生成式AI什么时候才能跑通可持续的商业模式”。现在这已经不是问题了，因为已经跑通了，Anthropic刚刚递交了招股书、今年二季度即将实现盈利，OpenAI也快了。大模型的所谓“Token经济学”已经彻底建立起来了，卖Token成为了一门前途无量的生意，其核心推动力有二：第一是由OpenClaw推动的Agent风潮，第二是以Seedance, Happy Horse, Veo等为代表的视频大模型热潮。二者都具备很强的生产力属性，都会消耗大量Token；更奇妙的是，用户认为消耗的Token是值得的，买的越多，赚的就越多。双赢的生意！

今年一季度，我认为MiniMax的Coding & Agent能力无足轻重，因此低估了它。然而，M3足以彻底让包括我在内的所有人改变态度——与上一版本M2.7相比，它的进步是革命性的。在涵盖软件工程、终端执行等多个维度的国际权威Benchmark Test, 例如SWE-Bench Pro当中，M3达到了国际领先水平，甚至超过了GPT-5.5和Gemini 3.1 Pro，仅落后于Claude Opus 4.7。我注意到，哪怕是一些对MiniMax家的Coding能力持保留意见的评测者，也表示：“今后养龙虾的任务完全可以交给M3去做。”

附带说一句，专门为M3设计并与M3一起训练的Coding Agent产品MiniMax Code，已经与M3在同一时间发布了。明眼人都知道，今年年初以来AI Coding & Agent的大火，只有一半归功于基础模型的进步，另一半则应归功于Claude Code和GPT Codex这两大工具的发布——它们标志着Vibe Coding真正进入了Agentic时代，AI不仅能生成代码，还能像训练有素的软件工程师一样彻底理解任务，建立、修改和维护真实的软件系统。Vibe Coding的格局一打开，Token经济学的前景就无人能质疑了，怪不得马斯克的xAI要斥资600亿美元收购Cursor，其实就是买一张Agent时代的门票。

做基础模型难，做Agent也难，所以过去半年，虽然出现了多个有一定编程能力的国产大模型，但国产Coding Agent还是一片空白，开发者还得用Claude Code等第三方工具接入。换句话说，直到几天前，国产AI Coding还处于“有模型、无Agent”的阶段，在工具层面，大部分开发者直接接触的仍然是海外先进Agent。这一次，MiniMax Code算是填补了一个空白。平心而论，这款工具目前还处于草创阶段，还需要一个打磨产品功能、积累用户基础的爬坡过程。如果做得好，那么基础模型+Agent工具可以发挥1+1>2的作用；做的不好也不是大问题，用户仍然可以通过其他Coding Agent去操作M3以及后续版本的模型。我不是技术专家，对于MiniMax Code的未来就先不下结论了，未来几个季度应该能看到端倪。

MiniMax M3的上下文窗口高达1M，这一点很重要，因为上下文窗口必须足够长才能容纳复杂的输入输出，大部分人都能理解。而原生多模态能力这一条很容易被人忽视。很多人会认为，国内有Seedance、可灵，国外有Veo、Luma，多模态赛道已经很拥挤了，MiniMax的原生多模态有什么特别的实用性吗？如果是在过去，我恐怕也会提出同样的问题；可是最近两个月，我一直在做AI视频行业的深度调研，对这个问题还是有点发言权的。

多模态是一个复杂的概念，既包括多模态内容的输出，也包括对多模态输入的理解。M3具备对图像和视频内容的理解能力，结合强大的Coding能力，就可以解锁很多复杂的玩法——例如输入一段游戏视频，让模型分析核心玩法，然后试图编程复刻一个，或对其进行修改；又例如输入一段监控录像，规定什么样的情况需要标记、示警，让模型进行逐帧分析和标记；还有输入一大堆参考图像、参考动画段落，让模型总结人设和场景美术特点，乃至在此基础之上做新的美术策划案……

不要忘记，MiniMax还拥有文本、语音和视频大模型，可以做到不同类型内容的互相输入和生成。电影《阿嫲的情书》最近大火，同款情书成为了小红书爆款内容，基于M3可以轻易做出“侨批生成器”。对于AI短剧制作者来说，这更是福音，把剧本文本、参考图片和视频一起扔进去作为Prompt，就可以直接生成复杂的视频内容。M3超长的上下文窗口，则允许了创作者对视频进行反复修改。时至今日，绝大部分AI短剧还需要专业工具包进行辅助创作，门槛比一般人想象的要高。前不久Google I/O大会发布的Omni多模态大模型，让人看到了在一个对话窗口内直接完成全套创作任务的可能性；尽管目前与Omni还有功能上的差距，但是假以时日，或许MiniMax也能提供类似的可能性。

因此，Coding/Frontier能力、超长上下文窗口、原生多模态能力，三者构成了一个密不可分的整体，同时覆盖了当前Token经济学的两个焦点——Coding & Agent以及视频生成。在此基础之上开源，则更加难能可贵，大幅扩张了开发者生态圈。我经常感叹：硅谷的一线AI大厂，包括OpenAI和谷歌，早年都走过开源路线，可是技术越进步就越倾向于闭源；xAI一度将开源作为卖点，但是自从Grok 2.5以来也不再开源。时至今日，硅谷的开源大模型生态，也就剩下Meta的LLaMA系列、谷歌的Gemma系列以及OpenAI偶尔发布的几个小参数模型了，它们普遍比前沿大模型至少落后半代。这真的符合AI的普惠原则吗？

反观中国，MiniMax, Qwen, Kimi, DeepSeek……的前沿大模型都有开源版本，M3更是全球第一个集齐“Frontier三件套”的开源模型。在X和Reddit等美国社交媒体上，我们到处可以看到吐槽：当硅谷厂商把自己最先进的大模型严防死守不开源时，中国厂商却在以极其低廉的成本提供开源的前沿大模型。这究竟是单纯的商业模式选择不同，还是某种更深层次的不同？到底哪一方才代表了开放、平等、普惠的大趋势？

对于这个问题，我同样不敢妄下结论。我只能说：MiniMax M3是一个很好的模型，让我很激动，希望它以及其他中国大模型厂商，能够不断做出类似的既强大、又开放、人人皆可负担的大模型。我还想补充一句：以大模型为基础的生成式AI对人类社会的改造是以十年乃至更长时间为单位的，因此我不赞成聚焦于资本市场的短期变化——每天、每星期，资本市场都会因为各种各样的情绪而波动，但这并不影响基本面，尤其不影响基础研发和科技进步的大方向。

相关文章

史上增长最快的ETF，易主了！

全球首张！德适 AI AutoVision® 斩获三类证，医学影像智能进入L3时代

“德智米”三杰携手领涨！港股AI大模型2026第二波主升浪已至！