11:26
V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了
格隆汇12月2日|据硅星人Pro,就在上周,OpenAI前首席科学家在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100 倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。

然而仅过了几天,12月1日,DeepSeek用V3.2和V3.2-Speciale的发布,给出了一个不同的答案。模型发布后,DeepSeek研究员在X上发文:“如果Gemini-3证明了持续扩展预训练的可能性,DeepSeek-V3.2-Speciale则证明了在大规模上下文环境中强化学习的可扩展性。我们花了一年时间将DeepSeek-V3推向极限,得出的经验是:训练后的瓶颈需通过优化方法和数据来解决,而非仅等待更好的基础模型。”而针对模型当前在世界知识广度上的短板,DeepSeek在技术报告中直言是因训练FLOPs不足,并硬气宣布后续将“扩大预训练算力”以弥补差距。
相关主题/热点

2025-12-02227.6k

商务、渠道、广告合作/招聘立即咨询

相关文章

美法院驳回Anthropic上诉,五角大楼封禁措施持续生效

元力社 · 昨天 18:49

cover_pic

洞察软件测试服务市场增长趋势:2032年规模将达127130百万美元

QYResearch信息咨询 · 昨天 18:22

cover_pic

室外无人地面车辆(UGV)研究平台行业报告 | 2026年全球市场规模4048百万美元,年增长14.2%

QYResearch信息咨询 · 昨天 18:13

cover_pic

中国多功能智能灌溉服务市场现状及未来趋势报告2026

QYResearch信息咨询 · 昨天 18:10

cover_pic

2026年加热设备行业分析报告:市场数据与趋势调研

贝哲斯咨询 · 昨天 18:04

cover_pic

2026全球与中国视频监控市场总体规模分析报告

QYResearch信息咨询 · 昨天 17:50

cover_pic