
DeepSeek 不再只属于梁文锋
过去两年,梁文锋一直在做着违背硅谷常识的事:
不融资、不上市、不商业化。
当 OpenAI、Anthropic 这些顶尖 AI 独角兽在通过高融资、高利润预期推高资本市场估值时,当同一梯队的月之暗面、智谱分别融资、上市时,DeepSeek 仍维持着封闭实验室的姿态。
直到今年 4 月下旬,事情开始起变化,无论是梁文锋本人,还是围绕他建起的 DeepSeek 这座理想主义堡垒,都开始有松动迹象。
梁文锋不是一个抗拒变化的人,他曾经在公开访谈中提到,在大模型竞争中,「决定性力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。」
1、DeepSeek向 AI 基础设施层更进一步
起初,DeepSeek 融资是一次投石问路,梁文锋只是想象征性融一笔几亿美元的钱。
随着消息传开,估值像雪球般越滚越大,100 亿美元,200 亿美元,440 亿美元。从对标月之暗面这样的初创独角兽,到对标智谱、MiniMax 这样的港股上市公司。
直到 5 月 6 日,更确凿的信息传来,据《金融时报》和界面新闻消息,中国国家集成电路产业投资基金正在洽谈领投深度求索(DeepSeek)的首轮融资,估值 450 亿美元。
过去几年,梁文锋关起了投资的门,拒绝一众送上门的投资;过去一个月,相继传出DeepSeek和腾讯、阿里的融资新闻,又被陆续否认。
直到这次国家队下场领投,结合此前曝出的 DeepSeek 计划估值 3000 亿元(440 亿美元),这次的融资信息看起来更真切一些。
跟投的有其它国资背景基金和互联网巨头,梁文锋个人也会出资。
此前有媒体报道,梁文锋明确表示不接受财务投资机构的钱,那跟投方会在给 DeepSeek 带来业务互补和生态协同的产业资本,以及国家资本中产生。
此次领投方中国国家集成电路产业投资基金,是中国最大的国有半导体投资机构,成立于 2014 年,目的是扶持国内芯片产业发展,摆脱对外依赖。财政部是最大股东。
国家集成电路产业投资基金过去十年都在投资和扶持国内的芯片产业自主化,同时也是中芯国际等具有国家战略价值的国产芯片龙头的投资方。
和芯片一样,AI 也是国家战略的一环。
国资进入大模型赛道并不新鲜。智谱、MiniMax、月之暗面背后,都已经出现过地方国资、产业基金或央企资本的身影。
但国家集成电路产业投资基金这样的国家级半导体基金出现在 DeepSeek 融资传闻中,释放出不同信号。
领投方不是一般地方产业基金,而是长期承担国产芯片产业扶持任务的国家级半导体基金。
它意味着 DeepSeek 不只是被当作一家大模型公司来定价,也可能被放进国产芯片、国产算力和 AI 基础设施协同的更大框架中。
这种融入国家战略、成为 AI 基础设施的一部分的可能性,和梁文锋在过去接受访谈时的期待、以及后来的模型技术路线不谋而合。
梁文锋在对DeepSeek 的构想上,曾经表达过,希望「形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek 的基础上构建toB、toC的业务。」
而 DeepSeek 在过去的 R1 及最新的 V4 上,保持着低利润,低价格,以及彻底的开源,在这些基础上性能还能有不俗的表现。
开源能够让它迅速占领生态,超低成本能够让它保持竞争,和国产芯片适配能够让它摆脱对外国高端芯片的依赖,这些都能支撑 DeepSeek 向成为 AI 基础设施层的目标迈进。
2、DeepSeek 的纯粹与雄心
相比其它家,DeepSeek 背景更加纯净一些。本土团队、本土资本、本土算力适配、本土创新叙事,一切都站在本土立场。
梁文锋善于发掘、任用中国的人才潜力。
大模型公司去海外挖人才时,梁文锋认为「前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人」。
DeepSeek V2 模型的研发团队,都是本土环境生长起来、发掘出来的研究员,国内 Top 高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。没有海外背景。
技术上,DeepSeek 突破了高端芯片被禁用造成的算力荒,更具代表性,符合国家叙事。
梁文锋曾经提到,公司面临的问题不是钱,是高端算力被禁运。在算力受限的背景下,DeepSeek 转而研究起了效率优化,做出 R1 这样的低成本高效率模型。
DeepSeek V4 新版本,在技术报告中将华为昇腾 NPU 与英伟达 GPU 并列写入,正式验证了国产算力平台上的推理部署能力;
与此同时,V4-Pro 在开源模型部分能力的性能表现已逼近美国顶尖闭源模型。
DeepSeek 技术报告中的测评,部分能力表现优异
此前有研究称,美国 AI 实验室目前拥有的算力大约是中国同行的 5 到 10 倍,这直接导致中国模型落后美国顶尖闭源模型半年时间。
此外,公司没有海外融资、没有出海业务、没有外资股东;商业化上没有表现出很急迫,更多追求基础模型提升和前沿创新。
与 Manus 走国内开发、海外落地、海外收购路线不同,DeepSeek 有着坚定的本土站位,过去的两次公开访谈中,梁文锋表露出对抗西方科技领先叙事的雄心。
过去国内的科技公司踩着国外引领者的脚印往前走,习惯了作为跟随者等待创新发生、技术突破,而非开拓者。
而梁文锋希望 DeepSeek 提供新的东方科技叙事,让中国站在技术的前沿,参与进全球创新浪潮,引领、推动技术发展。
3、以理想主义著称的实验室,开始面对现实
在这之前,DeepSeek 从未引入任何外部资金。
梁文锋过去一直保持着乐观自信的姿态,不融资,也不急于商业化。
因为「不缺钱」。梁文锋曾表示,即使缺钱了也可以取消过去每年几个亿的公益捐款,补贴研发开支。
DeepSeek 曾持续依靠母公司幻方量化输血。早在 2008 年,梁文锋及创始团队就尝试人工智能在量化交易上应用,后来凭此成为国内头部量化机构,巅峰时期管理资产过千亿,2025 年营收约 50 亿。
幻方量化给 DeepSeek 第一期研发投入自主出资 30 亿元人民币,其利润足以支撑最初几年的基模研究。
作为最早用人工智能切入金融场景做应用的人,梁文锋后来做AI 大模型的态度是,更多专注于研究层面。2023 年接受采访时,梁文锋尚还透露出做研究的纯粹和不计回报投入的热情。
事情起变化是在 2025 年下半年,DeepSeek 开启了商业化进程。今年 4 月,从前的姿态进一步松动,传出融资的消息。
相比国际顶尖闭源模型 Anthropic 的 9000 亿美元,OpenAI 的 8520 亿美元, DeepSeek 此次的 450 亿美元估值,看起来相对保守。
不过也合理,Claude 和 ChatGPT 都已经在商业化上摸索了三年,而 DeepSeek 的商业化直到 2025 年下半年才起步,V4 模型发布后 API 也一度降价甩卖,目前没看到明晰可持续的商业回报。
另一方面,这种保守也来源于创始人的审慎。
梁文锋身上同时叠着两重身份——既是在实验室一线带队做 AI 研究的科学家,也是曾经手握过千亿资产、在资本市场摸爬滚打的量化基金老板。
面对第一笔大额外部融资,他不会有初次创业者那种面对估值数字和大笔融资的兴奋。
融资能给公司输血,也能让公司变形。估值高了,同样的融资额会稀释更少的股权,DeepSeek 本身的品牌也会放大,研究员们也能看到自己手中股票期权的财富潜力。
但这也会带来业绩压力,扰乱研究节奏。如果没有与之匹配的增长,后续会有更多问题。
这几年外部世界变化迅猛,模型更新迭代飞快,等到2026 年 DeepSeek V4 发布,已经难做到像当年 R1 发布时那样石破天惊,V4 尚能在开源模型中保持前列,但仍和顶尖闭源模型有差距。
在大模型的研发上,也不是当年那种成本就可以解决的了的,算力在涨价,token 在涨价,人才也在涨价。
算力的问题,DeepSeek 正在通过适配国产芯片解决。人才的问题,除了谈理想,还得谈钱。
毕竟吸引顶尖人才们的除了有探索 AI 上限的好奇心,也有巨大财富的诱惑。
DeepSeek 从前在前者上做得足够到位,凭借这些,打造出理想主义堡垒,聚起一众求真理的同道人。
但后者的诱惑难以抵挡,没有人会和钱过不去。
前有互联网大厂给 AI 实习生开出五千日薪的传闻,后有不久前传出原 DeepSeek 核心研究员被字节挖走,薪酬近亿元。
从前 DeepSeek 没有融资时,上市也遥遥无期,身处其中的研究员看不到财富自由的希望。
对于 DeepSeek 这样一百多个研究员组成的实验室,如果都按照市场价支付薪酬,即使背靠幻方量化也难以供养。
因此,这次融资有着补齐后者短板、笼络人心的意味。通过融资敲定一个市场估值,让研究员们看到手中股票期权的现有价值和长远上市后的财富自由潜力。
如果之前传出的 500 亿元融资额度属实,那 DeepSeek 可以有更多的资金投入算力,可以用更大规模的算力做实验,不受限的算力也相应保障模型上限的探索。
同时,这笔融资最终落地,它的意义不会只是补充资金,还会把 DeepSeek 放进一个更大的国产 AI 基础设施叙事里。
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


