15:13
梁文锋署名,DeepSeek发布最新论文
格隆汇6月28日丨在6月中旬获得500亿融资后仅十几天,6月27日,DeepSeek团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》。这不是一次模型版本的迭代,而是在原有DeepSeek-V4-Pro和DeepSeek-V4-Flash基础上增加了一个推测解码模块,重点在于工程落地层面的优化。随DSpark一同开源的DeepSpec,是一个用于训练和评估推测解码草稿模型的全栈代码库,包含数据准备工具、草稿模型实现、训练代码和评估脚本,支持MIT许可。目前DeepSpec已内置DSpark、DFlash和Eagle3三种实现。值得注意的是,DeepSeek创始人梁文锋位列论文作者名单。在完成首轮融资的当下,创始人依然亲自参与技术论文撰写,这在AI行业并不多见。

2026-06-28207.5k

商务、渠道、广告合作/招聘立即咨询

相关文章

韩国房价暴涨

城北徐公 · 1小时前

cover_pic

疯狂过山车!半导体材料该降温了?

远禾 · 1小时前

cover_pic

美伊又开打!特朗普威胁:伊朗或将不复存在

林春木 · 9小时前

cover_pic

OpenAI、Anthropic 双双被“卡脖子”!AI 监管风暴撞上上市倒计时

林春木 · 1小时前

cover_pic