格隆汇12月29日丨幻方量化12月26日晚发布全新一代大模型DeepSeek-V3，展现出惊人的技术突破。这款采用MoE（混合专家）架构的模型不仅在性能上媲美顶级闭源模型，其低成本高效率的特点更是引发业界关注。根据开源论文披露，按每GPU小时2美元计算，模型全部训练成本仅为557.6万美元。这一突破性成果得益于算法、框架和硬件的协同优化。OpenAI联合创始人Karpathy对此给予高度评价，指出DeepSeek-V3仅用280万GPU小时就达到了超越Llama3的性能，计算效率提升了约11倍。

相关文章

日经225大涨超3%，首破65000点再创新高！

华为“韬(τ)定律”引爆！半导体股掀涨停潮

特朗普炒股，吃相有多难看？