07:33
幻方量化重磅发布DeepSeek-V3:性能媲美GPT-4,训练成本创新低
格隆汇12月29日丨幻方量化12月26日晚发布全新一代大模型DeepSeek-V3,展现出惊人的技术突破。这款采用MoE(混合专家)架构的模型不仅在性能上媲美顶级闭源模型,其低成本高效率的特点更是引发业界关注。根据开源论文披露,按每GPU小时2美元计算,模型全部训练成本仅为557.6万美元。这一突破性成果得益于算法、框架和硬件的协同优化。OpenAI联合创始人Karpathy对此给予高度评价,指出DeepSeek-V3仅用280万GPU小时就达到了超越Llama3的性能,计算效率提升了约11倍。

2024-12-2995.4k

商务、渠道、广告合作/招聘立即咨询

相关文章

日经225大涨超3%,首破65000点再创新高!

小摩根 · 6小时前

cover_pic

华为“韬(τ)定律”引爆!半导体股掀涨停潮

茶山 · 2小时前

cover_pic

特朗普炒股,吃相有多难看?

独行侠 · 昨天 20:20

cover_pic