
Anthropic交表,MiniMax冲A,而我最想聊的是M3大模型
Anthropic刚刚向美国SEC递交了保密的招股书,一个万亿美元市值的IPO即将诞生——这也是迄今为止,AI产业规模最大的IPO。差不多同一时间,MiniMax开始冲刺A股上市。今年是人工智能的资本大年,也是技术和应用大年。归根结底,是技术进步推动了AI商业化的加速发展,从而进一步推动了资本市场的乐观情绪。这是本轮人工智能牛市与1990年代后期的互联网泡沫最大的不同点!
整整两个月以前,我跟一位在AI领域颇富经验的投资人朋友喝茶,讨论国产大模型公司的特点和战略定位。在谈到MiniMax时,我的观点是:“应用层做得不错,市场推广也很好,海外应用尤其成功。但是在基础模型技术上,似乎没有特殊之处,让我感觉不到特色。”出乎我意料的是,对方马上进行了全方位的反驳,表示:“低估MiniMax的基础模型实力,是很多人常犯的错误,尤其多见于资本市场。”当时他没能说服我,但是留下了一个预言:“几个月之内,你会重新审视对这家公司的技术水平的看法。”附带说一句,我们的讨论与资本市场的短期波动完全无关,当时如此,现在也是如此。
6月1日这一天,这件事情果然发生了:MiniMax M3大模型发布。不巧的是,在此前后,包括MiniMax在内的中国AI上市公司经历了普遍的深度调整,导致在社交媒体上,对模型的讨论基本让位于对股价的讨论(我对此深感遗憾)。而且由于今年以来,国产大模型更新频率太快,热门模型此起彼伏,很多人可能忽视了这个模型的特殊意义。但是对于AI编程以及Agentic Workflow的重度用户来说,应该能迅速掂量出这个模型的分量:
具备强大的Coding/Agent Frontier能力;
具备1M Context Window(上下文窗口);
原生多模态能力,能理解图像、视频等多模态信息;
开源。
在国产大模型当中,MiniMax M3是第一个集齐了前三项(不妨称之为“Frontier三件套”)的。一个多月前发布的DeepSeek V4是一个很优秀的模型、已经积累了大量用户,但它是一个纯文本模型,暂不具备原生多模态能力。很多国产大模型有多模态能力,但要么上下文窗口偏小,要么Coding能力不够强,或者二者均有瑕疵(在此就不逐一点名分析了)。
而在全球范围内,只有Claude Opus 4.8, GPT 5.5, Gemini 3.1等前沿大模型具备“Frontier三件套”,但是很可惜,它们都不开源。MiniMax M3是迄今为止出现过的Coding/Agent能力最强大、最全面的开源大模型,这不仅是我个人的观点,也是许多专业评测者的观点。“硅谷闭源模型 VS 国产开源模型”,这不仅是一种媒体或资本市场的叙事范式,更是板上钉钉的现实趋势,而MiniMax M3的发布进一步确认了这一趋势。
嗯,不妨更准确地说——“高价的硅谷闭源模型 VS 低价的国产开源模型”。国产大模型的Token定价一贯以价廉物美、量大管饱著称,与十分昂贵的Claude形成了鲜明对比;而MiniMax M3的定价即便在国产大模型当中也是颇具竞争力的。就拿个人开发者的Token Plan付费方案来说,Max售价为每月119元人民币,提供18亿Token,相当于Claude Max 5x(每月100美元)容量的2倍,平均每100万Token的售价仅为0.066元。MiniMax官方显然认为,这样的定价对当前的模型能力和使用场景是最适合的。
当然,需要承认的是,在尖端的Coding能力上,Claude仍然难以替代,这是它索取溢价的底气。但是在大部分日常Agent Workflow当中,M3能够以很高的性价比提供令人满意的效果——大部分用户需要的不就是这个吗?在此援引知名AI技术大牛、Vercel CEO Guillermo Rauch的评论:“MiniMax M3……仅仅略逊于Opus & GPT5, 但是要便宜10倍。”(Right behind Opus & GPT5, but 10x cheaper.)
Artificial Analysis (AA)综合智能指数排行榜,MiniMax M3位列全球第七,这也是开源模型的全球最高排名
短短半年之前,资本市场还在争论“生成式AI什么时候才能跑通可持续的商业模式”。现在这已经不是问题了,因为已经跑通了,Anthropic刚刚递交了招股书、今年二季度即将实现盈利,OpenAI也快了。大模型的所谓“Token经济学”已经彻底建立起来了,卖Token成为了一门前途无量的生意,其核心推动力有二:第一是由OpenClaw推动的Agent风潮,第二是以Seedance, Happy Horse, Veo等为代表的视频大模型热潮。二者都具备很强的生产力属性,都会消耗大量Token;更奇妙的是,用户认为消耗的Token是值得的,买的越多,赚的就越多。双赢的生意!
今年一季度,我认为MiniMax的Coding & Agent能力无足轻重,因此低估了它。然而,M3足以彻底让包括我在内的所有人改变态度——与上一版本M2.7相比,它的进步是革命性的。在涵盖软件工程、终端执行等多个维度的国际权威Benchmark Test, 例如SWE-Bench Pro当中,M3达到了国际领先水平,甚至超过了GPT-5.5和Gemini 3.1 Pro,仅落后于Claude Opus 4.7。我注意到,哪怕是一些对MiniMax家的Coding能力持保留意见的评测者,也表示:“今后养龙虾的任务完全可以交给M3去做。”
附带说一句,专门为M3设计并与M3一起训练的Coding Agent产品MiniMax Code,已经与M3在同一时间发布了。明眼人都知道,今年年初以来AI Coding & Agent的大火,只有一半归功于基础模型的进步,另一半则应归功于Claude Code和GPT Codex这两大工具的发布——它们标志着Vibe Coding真正进入了Agentic时代,AI不仅能生成代码,还能像训练有素的软件工程师一样彻底理解任务,建立、修改和维护真实的软件系统。Vibe Coding的格局一打开,Token经济学的前景就无人能质疑了,怪不得马斯克的xAI要斥资600亿美元收购Cursor,其实就是买一张Agent时代的门票。
做基础模型难,做Agent也难,所以过去半年,虽然出现了多个有一定编程能力的国产大模型,但国产Coding Agent还是一片空白,开发者还得用Claude Code等第三方工具接入。换句话说,直到几天前,国产AI Coding还处于“有模型、无Agent”的阶段,在工具层面,大部分开发者直接接触的仍然是海外先进Agent。这一次,MiniMax Code算是填补了一个空白。平心而论,这款工具目前还处于草创阶段,还需要一个打磨产品功能、积累用户基础的爬坡过程。如果做得好,那么基础模型+Agent工具可以发挥1+1>2的作用;做的不好也不是大问题,用户仍然可以通过其他Coding Agent去操作M3以及后续版本的模型。我不是技术专家,对于MiniMax Code的未来就先不下结论了,未来几个季度应该能看到端倪。
MiniMax M3的上下文窗口高达1M,这一点很重要,因为上下文窗口必须足够长才能容纳复杂的输入输出,大部分人都能理解。而原生多模态能力这一条很容易被人忽视。很多人会认为,国内有Seedance、可灵,国外有Veo、Luma,多模态赛道已经很拥挤了,MiniMax的原生多模态有什么特别的实用性吗?如果是在过去,我恐怕也会提出同样的问题;可是最近两个月,我一直在做AI视频行业的深度调研,对这个问题还是有点发言权的。
多模态是一个复杂的概念,既包括多模态内容的输出,也包括对多模态输入的理解。M3具备对图像和视频内容的理解能力,结合强大的Coding能力,就可以解锁很多复杂的玩法——例如输入一段游戏视频,让模型分析核心玩法,然后试图编程复刻一个,或对其进行修改;又例如输入一段监控录像,规定什么样的情况需要标记、示警,让模型进行逐帧分析和标记;还有输入一大堆参考图像、参考动画段落,让模型总结人设和场景美术特点,乃至在此基础之上做新的美术策划案……
不要忘记,MiniMax还拥有文本、语音和视频大模型,可以做到不同类型内容的互相输入和生成。电影《阿嫲的情书》最近大火,同款情书成为了小红书爆款内容,基于M3可以轻易做出“侨批生成器”。对于AI短剧制作者来说,这更是福音,把剧本文本、参考图片和视频一起扔进去作为Prompt,就可以直接生成复杂的视频内容。M3超长的上下文窗口,则允许了创作者对视频进行反复修改。时至今日,绝大部分AI短剧还需要专业工具包进行辅助创作,门槛比一般人想象的要高。前不久Google I/O大会发布的Omni多模态大模型,让人看到了在一个对话窗口内直接完成全套创作任务的可能性;尽管目前与Omni还有功能上的差距,但是假以时日,或许MiniMax也能提供类似的可能性。
因此,Coding/Frontier能力、超长上下文窗口、原生多模态能力,三者构成了一个密不可分的整体,同时覆盖了当前Token经济学的两个焦点——Coding & Agent以及视频生成。在此基础之上开源,则更加难能可贵,大幅扩张了开发者生态圈。我经常感叹:硅谷的一线AI大厂,包括OpenAI和谷歌,早年都走过开源路线,可是技术越进步就越倾向于闭源;xAI一度将开源作为卖点,但是自从Grok 2.5以来也不再开源。时至今日,硅谷的开源大模型生态,也就剩下Meta的LLaMA系列、谷歌的Gemma系列以及OpenAI偶尔发布的几个小参数模型了,它们普遍比前沿大模型至少落后半代。这真的符合AI的普惠原则吗?
反观中国,MiniMax, Qwen, Kimi, DeepSeek……的前沿大模型都有开源版本,M3更是全球第一个集齐“Frontier三件套”的开源模型。在X和Reddit等美国社交媒体上,我们到处可以看到吐槽:当硅谷厂商把自己最先进的大模型严防死守不开源时,中国厂商却在以极其低廉的成本提供开源的前沿大模型。这究竟是单纯的商业模式选择不同,还是某种更深层次的不同?到底哪一方才代表了开放、平等、普惠的大趋势?
对于这个问题,我同样不敢妄下结论。我只能说:MiniMax M3是一个很好的模型,让我很激动,希望它以及其他中国大模型厂商,能够不断做出类似的既强大、又开放、人人皆可负担的大模型。我还想补充一句:以大模型为基础的生成式AI对人类社会的改造是以十年乃至更长时间为单位的,因此我不赞成聚焦于资本市场的短期变化——每天、每星期,资本市场都会因为各种各样的情绪而波动,但这并不影响基本面,尤其不影响基础研发和科技进步的大方向。
US MiniMaxGroup,Inc US MiniMaxGroup,Inc.UnsponsoredADR HK MINIMAX-W
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


