智谱(02513.HK):GLM-5.2正式发布 继续探索开源模型智能上界

昨天 00:00

机构:长江证券
研究员:杨洋/郭敬超/刘思缘

  事件描述
  6 月17 日,智谱GLM-5.2 正式上线并开源,参数753B,主打长程任务能力,配合百万token上下文窗口,完全开源(MIT 协议)。
  事件评论
  本次1M 上下文窗口实现工程可用级别的稳定性,长程任务执行能力进一步提升。长任务实测表现比肩Opus 4.8:(1)Frontier SWE 长程任务能力测试仅落后Opus 4.8 约1%,差距极小,超越 GPT-5.5;(2)PostTrain Bench 测试得分与Opus 4.8 差距仅落后约3%,超越Opus 4.7;(3)SWE-Marathon(考察Agent 自主完成超长软件工程的测试集)上仍有进一步提高空间,低于Opus 4.8 约13%。实际体验中,GLM-5.2 能在一次长程任务中完成开发、联调、测试到打包上线,完整交付一个覆盖Web、移动端与小程序的多端应用,累计处理88 万tokens(在过去此类大型工程需要一支团队协作数周)。
  Coding 能力相比前代显著进步、比肩Opus 4.8,继续缩小开闭源差距。(1)SWE-benchPro 得分62.1,接近Opus 4.8(69.2),超过GPT-5.5(58.4);Terminal-Bench 2.1 得分81.0,接近Opus 4.8(85.0)、GPT-5.5(84.0),超过Gemini 3.1 Pro(74.0)。(2)接近的Token 预算水平下,GLM-5.2 提供了比前代显著更强的Agent Coding 能力,总体对比来看GLM-5.2 模型能力大致介于Opus 4.7 和Opus 4.8 之间。
  在实现长上下文稳定的层面,技术侧有哪些改进?(1)训练侧:面向编程Agent 这样的长轨迹场景深度拓展,保证工程落地质量;(2)架构侧:IndexShare 机制(索引共享),不牺牲模型质量、大幅减少冗余的索引器计算成本。每4 个稀疏注意力层共享同1 个轻量级索引器,百万token 长度下、单token 计算量降到原来的2.9 倍;MTP 层改进后接受长度提升 20%。(3)推理侧:配套专项工程优化,对KV 缓存、长文本调度、CPU 损耗做全链路优化,上下文越长、吞吐量优势越明显。整体来看实现了极致Infra 优化,今年公司Infra 能力得到进一步提升。
  Day 0 运行在国产算力平台,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。预计下半年昇腾 950 超节点上市后也将成为GLM-5.2 强劲的算力底座。
  当前时点,持续看好公司商业化落地进展。今年模型核心逻辑依旧是伴随能力提升继续强化带来市场不断扩容与多场景渗透逐步打开,模型发展的长期趋势向好,当前进化聚焦于长程任务能力、强化工程化落地能力,这也是模型能够真正走向多场景落地的关键。
  我们认为,伴随公司模型迭代、能力继续提升,或将打开B 端多个细分场景空间,在下一阶段有望实现MaaS 收入规模的跨越式增长与毛利率水平优化,进入量价齐升通道。
  预计公司2026-2028 年实现收入30/88/180 亿元,同比增长314%/193%/105%,对应当前PS 为215/73/36X,维持“买入”评级。
  风险提示
  1、AI 技术发展不及预期;
  2、下游应用需求不及预期。
相关股票

HK 智谱

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

22
商务、渠道、广告合作/招聘立即咨询