100亿美元、200亿美元,甚至有人称300亿美元到400亿美元,坊间关于DeepSeek融资前的估值数字一直在变化,还传出腾讯、阿里争抢入局的消息。
一位接近DeepSeek的一线机构投资人士告诉我们,这些数字都不准确,DeepSeek融前估值是3000亿人民币,约合440亿美元。
这一估值超过当前已经上市的大模型公司Minimax的2400亿(4月23日),接近智谱的3800亿元。
自2025年,DeepSeek R1创造轰动全球效应后,人们期待的大迭代版本DeepSeek R2 和DeepSeek V4尽管一直未发布,但丝毫未影响资本市场对DeepSeek的期待。
此次融资金额之巨,对投资人的限制要求之高,刷新了以往科技公司融资纪录。上述人士称,DeepSeek计划增资500亿,内部增资200亿,对外募资300亿。所有参与投资的机构必须50亿起投,甚至对LP也有身份要求。
一家一线投资机构因为募资的基金里有许多个人投资人未达标,也被拒之门外。
因为背靠创始人梁文锋及其关联方幻方量化,DeepSeek一直未引入外部资金。外界也无从知晓DeepSeek估值。此次罕见宣布融资,无疑刷新了国内AI模型公司单笔融资*规模。
不过相比美国大模型巨头OpenAI、Anthropic,仍不在一个量级。OpenAI今年4月最新完成的募资规模1220亿美元,Anthropic于2月完成G轮融资规模是200亿美元。
DeepSeek从不融资,到对外融资,某种程度上看,是对现实的一种妥协。大模型的投入,是一场巨额资本、算力和*人才的全方位比拼。
很长一段时间,DeepSeek示外的形象,都是更纯粹也更追求AGI理想的研究型Lab。从梁文锋到团队成员都刻意隐身,除了公开发布的技术报告外,外界几乎很难窥伺到这家明星公司的任何举动。报道里用到梁文锋的照片,翻来覆去只有一张多年前他演讲时的那张。
但2025年下半年以来,外界的变化正在深度影响这家公司。大模型厂商竞赛迎来新的资本追捧热潮。智谱上市后,市值涨了7倍,Kimi不断获得融资,春节前后的三个月里估值也翻了4倍,至180亿美元,并有评估赴港IPO的可能性。
甚至AI基模四小龙里存在感较弱的阶跃星辰,今年1月已获得超50亿融资。我们最新了解到,3个月后阶跃正在展开新一轮Pre-IPO,估值涨到了90亿美元。
当其他模型厂商在资本上纷纷广聚弹药,争抢卡位赛时,同一赛道的DeepSeek若不及时行动,即使有幻方输血也可能会失去先发优势。
更重要的是,外部的激烈角逐还影响到DeepSeek内部人才的稳定。梁文锋赋予公司自由、灵活的研究气氛,但面对不确定的期权,和大厂动辄数千万甚至上亿的年包,内部成员对这种诱惑很难无动于衷。
目前已经公开报道出的DeepSeek离职人员里,就包括LLM核心作者王炳宣(入职腾讯姚顺雨团队)、OCR系列的核心作者魏浩然,以及R1的核心作者郭达雅,他们都被爆出已入职大厂。
不仅人才问题,算力紧张也一度是国内AI公司要面对的恒定难题。今年年初爆火的小龙虾,被视为一种新的范式切换,AI agent执行长任务链所消耗的token大幅增加,推理成本逼近训练成本,推动算力成本指数级膨胀。
大模型训练成本也在爬升,当大模型参数量从千亿级迈向万亿级,单次训练的算力投入都在陡峭上升。当前大模型泛化能力正处于突破的关键期,需要巨额的算力支撑,而算力背后就是资本的比拼。
除了融资,更多的变化信号在DeepSeek内部发生。4月20日DeepSeek更新了岗位信息,其北京、杭州办公室正在招聘企业文化主管,首要职责就是负责企业内部大型活动及日常关怀活动,营造有归属感的组织氛围。目的自然是为了留住员工。
再早几天,DeepSeek还推出商务采购岗位,其职责包括收集内部ToC 云业务商务需求,看起来是负责“内部技术需求”与“外部供应商资源”,确保业务既有足够的算力支撑,又能控制成本。这被解读为这家专注技术的公司,开始关注做产品、服务C端用户。
DeepSeek的另一关注点是新模型。3月份我们就*报道,DeepSeek V4将于4月发布。近期一些媒体获得更确切的消息,称发布时间就在本周。
无论是新模型还是融资,DeepSeek的一举一动都牵动人心。它从拒绝资本到敞开融资大门,从开源黑马到估值冲上3000亿,每一步都在改写国产大模型的资本叙事与技术格局。
【本文由投资界合作伙伴微信公众号:白鲸实验室授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。



