
Agentic Cloud,阿里云来认真的?

“阿里,在做一种很“新”的云。
如果你在5月20日之后打开阿里云新上线的“千问云”(qianwenai.com),大概率会愣住。
没有导航栏,没有产品列表,没有“立即购买”的按钮,没有任何一个你在过去17年里习惯看到的云厂商官网该有的东西。
只有一行字:
“安装Skills:npx skills add QianWen-AI/qianwen-ai”
这不是设计师偷懒,也不是产品经理短路。
这是阿里云做了一个“违背祖宗”的决定——云的终极用户,不再是“人”了。
5月20日,阿里云在2026峰会上发布了一套名为“芯-云-模型-推理”的全栈技术体系。听起来很技术,但翻译成人话就是:阿里云把自己拆了,然后按照AI Agent(智能体)的体型,重新长了一遍。
如果说过去17年是“人类操作云”的时代,那么从这一天起,阿里云正式宣告:Agentic Cloud时代,开幕。
被“逼疯”的AI
和迟来的觉醒
先问你一个问题:
现在的AI Agent,活得憋屈吗?
答案是——非常憋屈。
想象一下这个场景:你有一个智商180的博士生(大模型),你想让他帮你干点活,比如“在云上部署一个网站,然后监控它的运行状态”。
结果你发现,这个博士生没有手、没有眼睛、不能点鼠标、看不懂验证码、没法登录控制台。他想干活,唯一的办法是——你给他写一堆代码,告诉他怎么调用API、怎么传参数、怎么处理返回结果。
你说:“帮我看看服务器是不是挂了。”
他反手扔给你一份300页的API文档:“你先帮我把这段鉴权逻辑写清楚。”
这就是今天95%的企业正在经历的现实。阿里云旗下MuleRun团队观察了上千家企业后发现:绝大多数企业仍停留在“Copilot阶段”——人类承担80%的工作,AI只打打下手。
不是AI不想干,是基础设施根本不允许。
过去17年,云计算的交互逻辑是“人->控制台/API”。这套逻辑对人类很友好——我点点鼠标、写写脚本,就能把事办了。
但Agent不是人。
Agent不看你花里胡哨的仪表盘,不点按钮,不认识验证码。它需要的是结构化的能力描述、明确的调用协议、可预期的反馈机制。
人和Agent之间,存在巨大的“摩擦成本”。
不重构云,Agent永远只是个“聊天玩具”。
阿里云这次做的事,说穿了就一句话:把云从“给人用”改成了“给Agent用”。
从“芯”到“云”
给Agent铺一条高速公路
重构不是嘴上说说。阿里云这次动的是全身——芯片、服务器、操作系统、交互协议、运维体系,全拆了重来。
第一刀:算力底座——给Agent修“高速路”
Agent和人的工作方式完全不同。
人上网是“点一下、等一会儿、再点一下”,节奏是离散的。但Agent不是——一个Agent在执行任务时,可能在毫秒级内连续发起数十次模型调用。它不是在“浏览”,而是在“狂奔”。
这对底层算力的要求是质的改变。传统的GPU集群,是为“人”设计的——任务相对稳定,并发可控。但Agent的工作负载是“无规律弹性、短生命周期、瞬时起量即走”。
阿里云亮出的底牌是:平头哥自研AI芯片“真武M890”+磐久AL128超节点服务器。

数据是枯燥的,但你可以这么理解:
·M890的性能是上一代的3倍,显存144GB;
·128颗芯片通过自研互联芯片ICN Switch连成“一台计算机”,芯片之间的“对话”延迟低至150纳秒(纳秒是什么概念?光一秒钟跑30万公里,150纳秒光只能跑45米);
·单柜带宽达到Pb/s级。
翻译成人话:这是一条为Agent专门修建的“多车道无红灯高速公路”。
以前,成千上万个Agent同时在云上“狂奔”,会堵车、会撞车、会卡死。现在,真武M890+磐久AL128的组合,让每个Agent都有自己的快车道。
更值得关注的是平头哥透露的路线图:未来两年还将推出真武V900、J900两代芯片。截至目前,真武系列芯片已累计出货56万片,服务了中国电信、中国一汽、浦发银行等400多家客户。

这不是PPT,是已经在路上跑的车。
第二刀:交互重构——给Agent安上“手和脚”
芯片是心脏,但Agent要干活,还得有手有脚。
阿里云这次发布的首批官方“Skills”,就是Agent的手和脚。
解释一下什么是Skills:你可以把云产品的API想象成数万个复杂的“操作按钮”,每个按钮背后都有一大堆参数、鉴权逻辑、返回格式。人类工程师要看半天文档才能搞明白怎么按。
而Skills做的事情是:把这些复杂的API,封装成Agent能“秒懂”的标准化指令。
首批Skills覆盖了阿里云12条产品线、60多款云产品。
举个例子:以前你想让Agent“部署一个应用并配置监控”,你需要写一堆代码,告诉它怎么调ECS的API、怎么配云监控的规则。现在,你只需要用自然语言说一句,Agent自动调用对应的Skills,从识别资源到部署完成,一气呵成。
传统云产品的交互逻辑是为人设计的,Agent不看网页、不点按钮。阿里现在要做的是让每一个云产品都变成Agent可以“像调函数一样调用”的能力模块。

这还没完。
除了Skills,阿里云还把模型服务全面CLI化。什么是CLI化?就是Agent不需要打开任何网页,直接在命令行里就能完成模型选型、调用、用量查询、成本分析……全自动。
以前,开发者教Agent用云,像是在教外国人认汉字;现在,Skills和CLI给了Agent一双能干活的手。
第三刀:运维重构——让Agent自己给自己“看病”
Agent 24小时不间断工作,如果出了问题怎么办?难道还要半夜把人类运维工程师叫起来?
阿里云发布的STAROps全域智能运维平台,解决的就是这个问题。
这个平台的核心逻辑是:让Agent成为运维工程师的“数字员工”。
STAROps有三个核心能力:
1.智能助手:你(或另一个Agent)用自然语言问“过去24小时有哪些告警”,它直接给你答案,不用在日志、指标、链路三个系统里来回切。
2.长期任务机制:Agent可以接管巡检、周期报告、告警分析这些“脏活累活”,一次对齐目标,它能自主执行跨天甚至跨月的运维计划。
3.数字员工:企业可以为每个团队构建专属的SRE智能体,把专家经验固化下来,新人来了不需要从头学起。
更重要的是,STAROps内置了一套基于“证据链”的根因定位引擎——不是靠“老运维拍脑袋猜”,而是按规则查、按证据判。
阿里云还同步开源了UModel统一数据模型和RCA-100评测基准集(覆盖2000多条评测数据、700多个运维场景),联合信通院、小鹏汽车、中科院软件所等10多家机构发起行业标准倡议。
这意味着什么?
“靠人熬夜救火”的运维时代正在结束,“Agent自治”的运维时代正在开始。
干掉“Copilot”?
是时候来一场效率革命了
如果说芯片和Skills是“骨架和手脚”,那模型就是Agent的“大脑”。
阿里云这次发布的Qwen3.7-Max,不只是又一个大模型版本号迭代。它在做一件更本质的事:从“对齐人类偏好”转向“对齐任务目标”。
通俗地解释:
以前的模型,训练目标是“说得好”——回答问题像人、不胡说八道、有礼貌。
但Qwen3.7-Max的训练目标是“做得到”——你给我一个任务,我自己规划、自己执行、自己纠错、自己交付成果。
这个转变,是Agent能否真正“干活”的分水岭。
35小时的“连续剧”:一个让硅谷都沉默的案例
Qwen3.7-Max有一个案例,值得你花30秒认真看完。
它被放在一个训练时从未接触过的全新硬件平台——平头哥真武M890芯片上。没有性能分析数据、没有硬件文档、没有任何示例内核。
只有一个任务描述:“请优化这个推理内核。”
Qwen3.7-Max从零开始,完全自主地工作了35小时。

图:Qwen3.7-Max可独立执行35小时的长程复杂任务
在这35小时里,它干了什么?
·独立进行了432次内核评估
·调用了1158次工具
·自己写代码、自己编译、自己跑性能分析、自己找瓶颈、自己改架构
·甚至在运行超过30小时后,主动发起了一次关键的架构重设计
最终结果:优化后的推理内核,比官方参考实现性能提升了10倍。
10倍。
一个模型,在一个它从未见过的芯片上,从零开始,35小时不眠不休,干出了一个资深工程师团队可能要干几周甚至一两个月的活。
这不是“问答”,这是“工作”。
阿里巴巴通义大模型事业部负责人周靖人点出了本质:
“过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。”
在权威评测中,Qwen3.7-Max的成绩也印证了这一点——在三方机构Arena全球大模型盲测总榜中,与GPT、Claude、Gemini的最强模型接近。
近3个月内,千问旗舰模型已经迭代了3.5、3.6、3.7三个版本。阿里显然在刻意加速——模型能力的进化速度,必须匹配Agent场景的指数级需求增长。
10倍效率差:MuleRun揭示的企业生死线
模型强了,但企业怎么用?
阿里云旗下的Agent产品MuleRun给出了一个让人后背发凉的数据:
AI Native团队的效率,是Copilot团队的10倍。
什么是Copilot?人类承担80%工作,AI承担20%——打打下手、写写草稿、查查资料。
什么是AI Native?AI承担80%工作,人类只做20%——关键节点决策、最终把关、方向修正。
MuleRun负责人陈宇森说了一句值得所有企业主记住的话:“企业实现AI Native转型的窗口期,通常只有18个月。”
不是AI淘汰人,是会用的企业淘汰不会用的企业。
MuleRun已经服务了全球43个国家的用户。几个案例可以让你感受一下“AI Native”是什么样的:
·巴西一位自由职业者:用MuleRun输出了一整套营销方案——网站、竞品分析、内容策略、预算、短视频脚本。全程没打开过Word、PowerPoint、Excel任何一个传统办公软件。
·日本某保健品公司市场部:一个6周的产品上市项目,从策略制定、发邀约邮件,到数据复盘,全部通过MuleRun完成。
·墨西哥某连锁餐饮店店主:用西班牙语输入指令,一键生成了含本地支付与多语言适配的餐厅官网,立刻上线运营。
·拉美某大型数据中心运营商:同时在几个国家运营几十个机房。他们用MuleRun搭建了项目运营看板和站点智能选址工具——这些工作以前需要咨询公司+运维团队+高额预算,现在靠一个Agent平台就能搞定。
·世界泳联:组织全球顶级赛事时,曾经需要IT、市场、数据、运营四个部门协同。现在,用自然语言指令,MuleRun直接搭出了多语言营销落地页、内部管理系统、赛事调度中枢和实时数字孪生控制台。
MuleRun的数据还有一个细节很有意思:付费用户每周活跃工作日是2.6天,人均每周完成13个端到端交付的工作任务。
2.6天,13个任务。
换句话说,这些用户一周真正“干活”的时间不到3天,但产出却是传统模式的数倍。
这不是效率提升,这是工作方式的代际差异。
开放
是Agentic Cloud的“基本素养”
聊完芯片、模型、应用,我们回到一个更本质的问题:
阿里云到底想干什么?
如果只是发布一个更强的模型、一个更好的芯片,那充其量是“产品升级”。但阿里云这次的动作,明显不止于此。
注意一个细节:百炼平台全面开放,接入了智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可灵、Vidu Q3-Pro等第三方模型。

你没有看错。阿里云在自己的官方模型平台上,大大方方地卖起了竞品模型。
这背后的逻辑是什么?
过去,云厂商的竞争逻辑是“我的模型最好,所以你用我的云”。这是“锁客思维”。
阿里云现在换了一套逻辑:无论你用谁的模型(Qwen还是Kimi),只要你的Agent跑在我的架构上、用我的Skills调用资源、消耗我的Token,你就是我的用户。
这是一盘更大的棋:
·卖自研芯片(真武),是卖“铲子”;
·卖MaaS服务(Token),是卖“电”;
·建立Skills标准,是制定“插座规格”。
无论你是开发者、企业、还是另一个Agent,只要你需要“用电”,你就得用我这个规格的“插座”。
这就是为什么阿里云要强调“一个入口、多模型可选”——不是因为我做不出好模型,而是因为我的野心不止于做模型。
一个更值得关注的数据来自资本市场:阿里最新财报披露,AI模型及应用服务ARR(年经常性收入)已超过80亿元,预计年底突破300亿元。消息发布当天,阿里股价飙涨8%。
更重要的是,阿里云内部有一个判断:Agent驱动的MaaS收入,将取代ECS(弹性计算服务)成为阿里云最大的产品线。
这意味着什么?
阿里云的增长引擎,正在从“卖算力”全面切换为“卖Token”。
你不再只是为服务器的开机时间付费,你为Agent完成的每一个任务、消耗的每一次推理付费。商业模式的底层逻辑变了。
一行代码背后的野望
回到开头那个“什么都没有”的官网。
千问云首页上的那行指令,不是一个产品细节,它是一个宣言。
在过去17年里,云的交互逻辑一直是“人登录控制台→选产品→配参数→调API”。这套流程对人类来说已经很顺畅了,但对Agent来说完全不可用。
阿里云用一行代码替代了整个官网,是在赌一件事:
未来云的主要消费者,不是人,是Agent。
当这个判断成立的时候,所有为人类设计的界面、流程、交互逻辑,都将被重写。
这是一个极其大胆的押注。上一次中国头部科技公司以如此决绝的方式重构产品入口,可能要追溯到移动互联网早期——当所有人把PC官网的流量让位给App的那个阶段。
只不过这一次更彻底:App至少还需要人去点开,而Agent只需要“读”一条指令。
在不远的将来,你可能不再需要打开任何App。
你的Agent会读懂这行代码,帮你买好服务器、搭好环境、写好代码、剪好视频、监控好运行状态。
你只需要说一句:“帮我做个事。”
然后去忙你真正该忙的事。
当Agent学会使用工具,人类才真正开始只负责创造。
而阿里云,正在铺设这条创造之路的基石。
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


