MiniMax发布新一代大模型M3 编程能力评测超越GPT-5.5

3 天前12.5k
+关注
2026年6月1日,国产大模型公司稀宇科技(MiniMax)正式发布新一代通用模型MiniMax M3。

2026年6月1日,国产大模型公司稀宇科技(MiniMax)正式发布新一代通用模型MiniMax M3。该模型采用自研稀疏注意力架构MSA,在编程能力、超长上下文及原生多模态三个方向实现同步突破。

据MiniMax官方披露,在衡量编程能力的基准测试SWE-Bench Pro上,M3取得59.0%的得分,超过了OpenAI的GPT-5.5和谷歌的Gemini 3.1 Pro,接近Anthropic的Claude Opus 4.7。在考察多模态文档解析能力的OmniDocBench测试及评估智能体能力的Claw-Eval评测中,M3均超过Gemini 3.1 Pro。

M3的核心技术突破在于其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,prefilling阶段加速超过9倍,decoding阶段加速超过15倍。

公开资料显示,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。作为原生多模态模型,M3支持图片和视频的输入,并能操作电脑桌面,实现跨应用、跨文件、跨系统的复杂任务操作。

伴随模型发布,MiniMax同步推出了AI编程产品MiniMax Code。据官方介绍,其智能体集群可将大型任务拆解为多个可并发、可动态调整的阶段,以协作方式持续推进。在官方展示中,M3自主运行近12个小时,成功复现了一篇获奖AI论文《Learning Dynamics of LLM Finetuning》,验证了原论文提出的核心发现。

商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元提供6亿token,Max版每月119元提供18亿token,Ultra版每月469元提供55亿token。API定价方面,512k上下文以内输入价格为每百万Tokens 4.2元,输出价格为每百万Tokens 16.8元。官方同步开启了为期7天的API五折优惠活动。

MiniMax表示,M3的技术报告及完整模型权重将在10天内面向全球开发者正式开源。京东云同日宣布,其JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并开放服务。

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

App内直接打开
商务、渠道、广告合作/招聘立即咨询

相关文章

PCB背钻检测催生X射线需求:3D AXI检测设备供应商梳理

伏白的 交易笔记 · 49分钟前

cover_pic

“世界杯”效应?

申万宏源宏观 · 5小时前

cover_pic

暴力回撤!碳酸锂咋了?

弗雷迪 · 昨天 18:08

cover_pic
我也说两句