
库克“谢幕”,苹果AI“起航”?|苹果2026WWDC
还记得在2024年WWDC,苹果高调发布的Apple Intelligence给了用户不少期待。最“苹果”的体验、最好的AI大模型协同(ChatGPT)、最顺畅的端云协同联动,这是当时苹果给所有消费者的承诺,也给了AI手机厂商不少AI智能体落地的参考。甚至,当时还有不少分析师和消费者认为苹果仍有可能自研AI。
但在2026年WWDC上,一切尘埃落定。Apple Intelligence是基于谷歌Gemini做的。
虽然没有披露太具体的细节,但我们仍可以从中审视苹果为AI搭建的全新架构。整体逻辑上,苹果AI还是当下智能硬件行业共识采用的端云协同架构。苹果的基础模型——AppleFoundation Models是跟谷歌基于Gemini共同打造的系列模型,并分别布局在手机端侧和云端(Private Cloud Compute)。

云端这边,就是苹果专门搭建的AI基础设施。这部分苹果给的说法是,云端只是用于处理用户的需求,处理完就“删”,苹果不掌握也看不到用户的数据。
这种设计有点反常识,因为AI大模型厂商都非常重视自己与用户的交互数据,这些数据能够不断迭代模型能力。但在苹果这边,更像是执行用户复杂需求(图像生成、复杂推理等)的“一锤子买卖”。这或许侧面说明苹果自己可能还没有完善的数据闭环,甚至独立训练模型的能力。
端侧这边,苹果今年把模型分成了高、低两个能力档位。首先,所有支持Apple Intelligence的设备都带一个约3B大小的基础模型。
在性能更好的设备上(例如最新款手机、PC),苹果额外搭载一个更大的模型,这个模型能给出更高质量的输出、更长的上下文。同时苹果苹果还配套了独立的语音模型,用于新Siri的自然对话和个性化语音合成。
在端侧基础模型这边,苹果的解法还是比较有参考性的。苹果做了一个叫System Orchestrator(系统编排器)的架构来调度整个Apple Intelligence。
在这里,先解释一下Orchestrator的概念。在AI领域(尤其是智能体时代的AI),AI执行任务已经不再是一个大模型回答所有任务,而是多个不同能力的小模型、工具(搜索、APP调用等)、端云任务结合、上下文(多步任务)记忆等环节共同协作。Orchestrator的任务就是把整体任务拆解成合适的大小,分配到最适合执行的部分。

在苹果这边,System Orchestrator调度的是四大功能模块,分别负责个人信息理解、世界知识、Actions和屏幕感知。
具体来说,上下文理解就是设备上的信息,文字、图片、邮件,这些手机AI都了如指掌,能调用正确信息。
世界知识就是一定程度的常识,苹果在线上做了一个世界知识服务,当本地模型知识不足或需要最新信息时,AI能找到合适的信息输出。
Actions就是让Siri AI 真正执行操作,而不是只聊天,相当于用户的“手替”,负责操作手机。
屏幕感知则是当用户的“眼替”,能阅读屏幕上的信息,作为AI模型的输入。
整体来看,四大调用模块是两两组合的结构。分别承担内部、外部获取信息和执行输出、信息输入的角色。按照苹果的说法,这就是以你为中心的AI。
结语
苹果花了两年时间,终于是给Apple Intelligence做出来了。但无论是从应用效果到AI布局,苹果的AI始终还是有一股“拧巴”味。
一方面,Apple Intelligence还是有不少“老款”AI助手的部分。例如世界知识部分,是苹果几年前就在运营的知识图谱,当时是希望解决Siri知识老旧、胡编乱造的问题。但在AI大模型都能联网的今天,显得有点多此一举。另一方面,下定决心跟谷歌合作AI模型,这对于“困在自研执念”的苹果也是一种跨越。
但无论如何,AI只要落地就一定是好事。尤其是在中国手机厂商不断炫技的2026年,苹果也终于明白了交付大于完成的道理。
最后是具体更新计划。苹果AI的更新最老到苹果11,pc必须是苹果芯片,中国和欧盟暂时用不了。
不过,相信中国用户很快也能用上。此前,苹果曾计划和百度合作,将文心一言4.0作为国行iPhone生成式AI底层,适配国内数据合规要求。后又同步与阿里合作落地中国AI合规审核。
在无法直接使用谷歌服务的情况下,苹果很可能要寻找一个新的本土大脑,而千问就是目前最有可能的对象。
这件事能不能做成,进展得快不快,直接决定了中国用户能否用上全新的Siri。
抛开区域限制,这次WWDC真正值得被记住的,是苹果完成了AI时代的重构,并将Agent植入到操作系统。
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


