20:19
首字延迟降低3.6倍,腾讯混元提出Stem稀疏注意力算法,长文推理加速新SOTA
格隆汇6月5日|腾讯混元宣布提出Stem稀疏注意力算法,已被机器学习顶会ICML-26收录。根据Stem算法×HPC算子的全栈加速方案,算法层面,Stem通过Token位置衰减(TPD)和输出感知度量(OAM)实现25%预算下的近无损精度;算子层面,HPC开源的Stem+BSA算子将稀疏收益转化为真实硬件加速,128K上下文下首字延迟降低3.7倍。
相关股票

HK 腾讯控股

2026-06-05407.3k

商务、渠道、广告合作/招聘立即咨询

相关文章

事关私募基金高质量发展,国办公布指导意见!

华一席 · 5小时前

cover_pic

智力折叠时代,悄然来临

独行侠 · 2小时前

cover_pic