11:49
面壁智能发布基于稀疏-线性混合架构SALA训练9B模型
格隆汇2月12日|面壁智能今日正式发布稀疏-线性注意力混合架构SALA,以及基于该架构的文本模型MiniCPM-SALA,模型仅有9B参数。据介绍,MiniCPM-SALA不使用投机采样等加速算法,在云端推理芯片上,当序列长度为256K词元时推理速度高达Qwen3-8B的3.5倍,并支持在云端芯片和消费级端侧GPU上进行高达一百万词元上下文长度的推理。
相关主题/热点

2026-02-12236.6k

商务、渠道、广告合作/招聘立即咨询

相关文章

上海大力发展虚拟体育:沉浸式互动体验、历史AR导览产品齐发力

元力社 · 昨天 18:35

cover_pic

全球履带式智能挖掘机行业总体规模、市场占有率分析报告

QYResearch信息咨询 · 昨天 17:11

cover_pic

全球人工智能(AI)驱动的可持续发展报告软件研究报告:市场规模、头部企业竞争及产业链分析

QYResearch信息咨询 · 昨天 16:38

cover_pic

全球人工智能(AI)驱动的ESG软件研究报告:市场规模、头部企业竞争及产业链分析

QYResearch信息咨询 · 昨天 16:38

cover_pic

洞察美颜相机应用软件市场增长趋势:2032年规模将达7482百万美元

QYResearch信息咨询 · 昨天 14:57

cover_pic

洞察2026:全球与中国机器视觉相机行业深度研究及“十五五”规划策略分析报告

QYResearch信息咨询 · 昨天 14:47

cover_pic