20:31
李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成
格隆汇2月6日丨据科创板日报,今日有消息称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问(Qwen)模型。s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。
相关主题/热点

2025-02-06294.8k

商务、渠道、广告合作/招聘立即咨询

相关文章

食品和饮料中的人工智能 (AI)行业深度调研-市场发展情况及未来走向预测

贝哲斯咨询 · 昨天 18:42

cover_pic

中国农业数字孪生市场现状及未来趋势报告2026

QYResearch信息咨询 · 昨天 17:33

cover_pic

目标检测软件和工具市场占有率排名报告2026

QYResearch信息咨询 · 昨天 17:02

cover_pic

全球及中国呼叫中心人工智能市场占有率及排名分析报告-LP information

环洋市场咨询 Global Info Research · 昨天 16:51

cover_pic

免税旅游零售市场占有率排名报告2026

QYResearch信息咨询 · 昨天 16:49

cover_pic

中国脑部电阻抗断层成像仪市场现状及未来趋势报告2026

QYResearch信息咨询 · 昨天 16:47

cover_pic