看到Claude Mythos展现超强能力,梁文锋决定为DeepSeek融资
2026/06/29 16:54阅读量 2
The Information爆料,DeepSeek融资的直接导火索是梁文锋看到Anthropic的Claude Mythos通过海量算力训练出的超强能力,意识到必须储备弹药。融资74亿美元中梁文锋个人出资200亿人民币,团队计划从300人翻倍,并加速适配华为芯片。梁文锋强调继续开源、低价、专注AGI。
事件概述
据The Information最新消息,DeepSeek启动融资的直接导火索源于梁文锋观察到Anthropic的Claude Mythos通过海量算力和数据训练出的超强能力,使其意识到“不储备弹药根本没法打下去了”。时间线上,Claude Mythos于今年4月发布首个预览,而DeepSeek的融资传闻也在4月中旬首次传出。
核心信息
- 融资细节:本轮融资总额74亿美元,梁文锋个人出资200亿人民币(约30亿美元),占总额的五分之二。融资后设立员工持股计划,按实际估值分配股份。
- 团队扩张:DeepSeek目前约300人,融资后所有部门招人至少翻倍,覆盖AI系统开发、基础设施、产品开发和深度学习研究。核心Harness团队(负责将模型转化为自主AI智能体)已进入每天面试状态,该团队负责人崔添翼于今年3月从Jane Street跳槽加入。
- 华为芯片适配:梁文锋坚信华为芯片几年内能追上英伟达,DeepSeek应率先完成适配。但由于训练和部署系统围绕英伟达CUDA搭建,工程师需重写底层软件才能高效运行在华为芯片上,这导致DeepSeek长达15个月未发布新一代模型,错过了去年下半年Anthropic Claude Code掀起的编程工具热潮。梁文锋在路演中表示,编程工具和AI聊天机器人都是AI进化中的临时产物,重注押在短期产品上会偏离通往AGI的终极目标。
- 战略与影响:梁文锋表示战略不变——继续开源、保持低价、专注AGI(机器在理解、推理、学习、规划、适应等广泛任务上达到人类水平)。他认为AI不应被少数人控制,DeepSeek是目前唯一将所有模型底层代码完全公开的主要AI实验室。在美国开发者群体中,今年4月发布的旗舰模型V4在5月于Vercel的AI Gateway平台上token用量份额从不到1%飙升至17%,成为该平台第三大模型,轻量版V4 Flash价格比Anthropic模型便宜20到50倍。
值得关注
- DeepSeek在长达15个月的模型发布空窗期后,通过融资和扩张试图弥补算力与人才的差距。
- 适配华为芯片的战略选择虽然代价高昂,但体现了其自主可控的长期布局。
- 开源和低价策略已在美国开发者市场产生显著增长,未来可能进一步冲击现有大模型格局。
