Deepseek链: DS 或于近期发布V4/R2

1 个月前8.3k
DS 或于近期发布V4/R2,其核心路线是:“用算法压榨硬件潜力,用强化学习替代人力标注。”

1. #DS-V4:核心突破点预计在于工程能力的质变,若引入Engram模块,有望实现库级别的代码理解,让模型像拥有“长期记忆”一样,瞬间定位几万行代码外的函数定义,而不需要消耗巨额的 KV Cache ;V4若在保持 MoE(混合专家)架构的同时,通过更精妙的连接方式,实现更强的参数共享,有望使得 100B 规模的激活参数就能达到万亿参数的效果。

2. #DS-R2:核心是要解决“思考的代价”和“思考的广度”,让模型在更短的 CoT(思维链)内完成高质量逻辑推导,尤其在创意写作、战略分析、复杂角色扮演等缺乏唯一标准答案的领域,也能展现出深度思考,从而带来推理成本进一步剧降的可能。

#提示DS合作方:每日互动;杭州本地算力:杭钢股份、浙数文化、浙文互联。

作者利益披露:个人观点,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。



相关股票

SZ 每日互动 SH 浙数文化

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

App内直接打开
商务、渠道、广告合作/招聘立即咨询

相关文章

Token工厂概念股AI解析

炒谷养娃2007 · 昨天 21:09

cover_pic

银行数字化解决方案市场占有率报告:主要企业数据分析及排名

QYResearch信息咨询 · 03-12 11:22

cover_pic

IDC服务商全景解析

炒谷养娃2007 · 03-09 12:05

cover_pic
我也说两句