18:08
DeepSeek-V3.2-Exp模型正式发布并开源
格隆汇9月29日丨DeepSeek-V3.2-Exp模型今日正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
相关主题/热点

2025-09-29488.9k

商务、渠道、广告合作/招聘立即咨询

相关文章

服装和纺织品测试服务研究报告:市场规模、头部企业竞争及产业链解析2026版

QYResearch信息咨询 · 7分钟前

cover_pic

人工智能(AI)加速器芯片市场占有率排名报告2026-2032

QYResearch信息咨询 · 10分钟前

cover_pic

2026-2032中国图形处理器市场现状研究分析与发展前景预测报告

QYResearch信息咨询 · 27分钟前

cover_pic

2026年AI数据中心固态变压器市场战略制定指南:主要企业占有率数据分析及排名参考

QYResearch信息咨询 · 37分钟前

cover_pic

2026年AI超算解决方案市场需求调研:总销售收入和十五五未来发展潜力

QYResearch信息咨询 · 47分钟前

cover_pic

全球人工智能个人旅行助理市场占有率排名及Top3企业分析(2026版)

QYResearch信息咨询 · 1小时前

cover_pic