DeepSeek V4 发布前夕启动融资:估值百亿美元,应对算力与人才挑战
2026/04/18 10:20阅读量 5
中国 AI 初创企业 DeepSeek(深度求索)被曝正寻求至少 3 亿美元的外部融资,计划以不低于 100 亿美元的估值进行首轮外部融资。此举标志着其打破此前拒绝投资的惯例,旨在为即将发布的 V4 模型储备资金,以应对高昂的算力成本及核心人才流失压力。尽管母公司幻方量化业绩强劲,但大模型竞赛的烧钱速度及地缘政治因素仍给融资带来不确定性。
事件概述
据媒体报道,中国人工智能初创企业 DeepSeek(深度求索)正在与投资者洽谈首轮外部融资,计划募集不少于 3 亿美元资金,投后估值预计高达 100 亿美元。这是 DeepSeek 成立以来首次引入外部资本,打破了其此前多次拒绝头部风投与科技巨头投资邀约的“不融资”惯例。
核心信息
-
融资背景与目的:
- DeepSeek 原计划于 2026 年 2 月发布 V4 模型,因需完成国产算力平台(如华为昇腾)的深度适配、架构重构及系统稳定性强化,发布时间推迟至 4 月下旬。
- 融资主要用于充实资金储备,加大算力资源投入,推进模型开发,并为顶尖人才提供更具竞争力的薪酬待遇。
- 尽管母公司幻方量化(Hundun Quant)2025 年管理规模超 700 亿元,利润估算达 350-400 亿元,足以支撑数年研发,但万亿级参数模型的算力成本呈指数级增长,且面临严峻的人才流失挑战。
-
人才流动现状:
- 自 R1 模型成功后,DeepSeek 已失去多位核心研究员。例如,DeepSeek-V2 架构关键贡献者罗福莉加入小米;95 后研究员郭达雅入职字节跳动 Seed 团队;多模态研究员阮翀加盟元戎启行;OCR 系列作者魏浩然及第一代 LLM 作者王炳宣分别流向大厂和腾讯。
- 行业呈现双向流动特征,字节跳动、腾讯等大厂也在积极从 DeepSeek 挖角或向其输送人才(如徐名宇加入 DeepSeek 模型结构组)。
-
V4 模型进展:
- V4 模型参数规模达到万亿级别,支持百万级上下文长度,并首次实现对华为昇腾等国产 AI 芯片的深度适配。
- 该版本将采用 Apache 2.0 开源协议,允许企业自主部署。目前已有国内头部科技企业提前采购数十万片新一代 AI 加速芯片,计划通过云端服务集成 V4。
- 3 月底平台曾出现约 13 小时的服务中断,业内推测与 V4 灰度测试或全量部署有关,恢复后模型在响应逻辑、代码生成及 SVG 矢量图形生成能力上显著提升。
值得关注
- 商业化路径:与 Kimi、智谱等已实现可观收入的同行相比,DeepSeek 最大的资产仍是技术本身,商业化模式尚不清晰。此次融资被视为为 V4 这一关键战役备足粮草。
- 地缘政治风险:作为中国企业,部分美国风险投资机构可能对投资持谨慎态度,跨境资本流动面临复杂考量。
- 战略转折意义:创始人梁文锋曾坚持“技术理想主义”,拒绝商业绑架。此次融资抉择折射出中国 AI 初创企业在技术追求与商业生存之间的艰难平衡,如何在资本加持下保持技术创新的纯粹性将是后续最大挑战。
