
国产算力大跨越,最核心5大主线梳理
算力圈在2026年4月24日迎来了一个具有里程碑意义的时刻。
DeepSeek-V4系列的正式发布,不仅是国产大模型性能的一次跨越,更通过与华为昇腾950超节点的深度适配,彻底打通了国产算力链从底层架构到顶层应用的闭环。这不仅仅是一次软件更新,更是一场硬科技主线的全面爆发。
一、1.6万亿参数的极致性价比
DeepSeek-V4系列包含V4-Pro与V4-Flash两大版本,其核心亮点在于“超大规模”与“百万长度”。V4-Pro的参数规模达到了惊人的1.6万亿,虽然规模庞大,但通过MoE(混合专家模型)架构,激活参数仅为49B。
这种设计思路在保证性能达到闭源顶尖水平的同时,极大地降低了推理成本。V4-Flash作为轻量化版本,参数规模284B,激活参数13B,预训练数据量均超过了32T。
最让行业振奋的是,V4全系列原生支持100万token的超长上下文。在长文本处理、复杂代码编写及数学推理等STEM领域,V4的表现已经超越了多款主流闭源模型。对于投资者而言,这意味着国产模型在Agent(智能体)能力的落地应用上,已经拿到了通往全球第一梯队的入场券。
二、华为昇腾950超节点,破解万亿参数推理痛点
模型再强,也需要底层的算力基座。此次DeepSeek V4的发布,最关键的变量在于华为昇腾950超节点的硬支撑。通过实测数据可以看到:V4-Pro在单请求时延上低至20ms,多并发吞吐达到388TPS;而V4-Flash更是将单请求时延压到了10ms以内。
这种近乎实时的响应速度,源于华为在算力架构上的三大底层突破。
首先是原生精度的加速能力。华为950超节点全面支持FP8、MXFP8乃至MXFP4格式。在AI计算中,精度格式的优化直接决定了内存消耗。通过这些新格式的支持,算力在保障精度的前提下,内存占用降低了50%以上,理论算力实现翻倍。这为万亿级参数模型在有限硬件资源下的流畅运行奠定了基础。
其次是针对MoE模型特征的“稀疏访存优化”。传统芯片在处理MoE模型时,经常会因为专家路由的频繁调度导致带宽瓶颈。华为通过硬件级的技术强化,解决了离散访存的难题,让数据流转不再卡壳。
最后是存储架构的创新。华为实现了Vector与Cube共享Memory,这一设计消除了片上数据搬运的额外开销。在毫秒级的竞争中,减少数据搬运就意味着降低了端到端的时延。这种“模型与架构联合定义”的模式,标志着国产算力正式完成了对万亿参数大模型全流程支撑的闭环验证。
三、国产算力链,三条逻辑支撑全线狂飙
随着DeepSeek V4的开源和华为超节点的放量,整个国产算力产业链将迎来系统性的投资机会。
第一,高端硬件的国产替代空间被彻底打开。万亿参数模型对算力的极致追求,倒逼底层硬件升级。华为超节点的规模化部署,将直接带动高端封装载板、高性能基材等核心零部件的需求。随着技术成熟度提升,国产供应链在这些高毛利环节的份额将快速渗透。
第二,温控与液冷设备的需求激增。昇腾950超节点在实现算力翻倍的同时,高集成度带来的散热压力也不容小觑。算力密度的提升,使得传统的风冷方案难以为继,液冷技术正从“选配”转为“标配”。万卡级无收敛全互联扩展的实现,意味着大型数据中心对液冷管路、冷板及冷却液的需求将呈现非线性增长。
第三,模型调用量爆发推动算力持续扩容。DeepSeek V4通过极致的性价比吸引了大量开发者,Token调用量的激增必然导致对底层算力资源需求的持续缺口。这不仅利好算力租赁商,也将传导至上游的PCB、覆铜板、特种化学品等原材料环节。
核心概念整理:
算力核心:海光信息、禾盛新材、寒武纪、摩尔线程等;
产业链上游:凌玮科技(二氧化硅材料)、德福科技(高端铜箔)、东材科技(电子基材)、宏和科技(玻璃纤维布)、联瑞新材(球形硅粉)、华正新材(覆铜板)、川环科技(液冷管路)、飞龙股份(热管理泵类)等;
第三方芯片测试:利扬芯片;
服务器龙头:中科曙光;
算力租赁与运营:利通电子、盈峰环境、协创数据、东阳光等。
免责声明:以上内容仅供参考,不作为投资建议
近期热点发掘文章:
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


