看到Claude Mythos展现超强能力，梁文锋决定为DeepSeek融资

2026/06/29 16:54阅读量 2

The Information爆料，DeepSeek融资的直接导火索是梁文锋看到Anthropic的Claude Mythos通过海量算力训练出的超强能力，意识到必须储备弹药。融资74亿美元中梁文锋个人出资200亿人民币，团队计划从300人翻倍，并加速适配华为芯片。梁文锋强调继续开源、低价、专注AGI。

事件概述
据The Information最新消息，DeepSeek启动融资的直接导火索源于梁文锋观察到Anthropic的Claude Mythos通过海量算力和数据训练出的超强能力，使其意识到“不储备弹药根本没法打下去了”。时间线上，Claude Mythos于今年4月发布首个预览，而DeepSeek的融资传闻也在4月中旬首次传出。

核心信息

融资细节：本轮融资总额74亿美元，梁文锋个人出资200亿人民币（约30亿美元），占总额的五分之二。融资后设立员工持股计划，按实际估值分配股份。
团队扩张：DeepSeek目前约300人，融资后所有部门招人至少翻倍，覆盖AI系统开发、基础设施、产品开发和深度学习研究。核心Harness团队（负责将模型转化为自主AI智能体）已进入每天面试状态，该团队负责人崔添翼于今年3月从Jane Street跳槽加入。
华为芯片适配：梁文锋坚信华为芯片几年内能追上英伟达，DeepSeek应率先完成适配。但由于训练和部署系统围绕英伟达CUDA搭建，工程师需重写底层软件才能高效运行在华为芯片上，这导致DeepSeek长达15个月未发布新一代模型，错过了去年下半年Anthropic Claude Code掀起的编程工具热潮。梁文锋在路演中表示，编程工具和AI聊天机器人都是AI进化中的临时产物，重注押在短期产品上会偏离通往AGI的终极目标。
战略与影响：梁文锋表示战略不变——继续开源、保持低价、专注AGI（机器在理解、推理、学习、规划、适应等广泛任务上达到人类水平）。他认为AI不应被少数人控制，DeepSeek是目前唯一将所有模型底层代码完全公开的主要AI实验室。在美国开发者群体中，今年4月发布的旗舰模型V4在5月于Vercel的AI Gateway平台上token用量份额从不到1%飙升至17%，成为该平台第三大模型，轻量版V4 Flash价格比Anthropic模型便宜20到50倍。

值得关注

DeepSeek在长达15个月的模型发布空窗期后，通过融资和扩张试图弥补算力与人才的差距。
适配华为芯片的战略选择虽然代价高昂，但体现了其自主可控的长期布局。
开源和低价策略已在美国开发者市场产生显著增长，未来可能进一步冲击现有大模型格局。

阅读原文详情

准备好启动您的定制项目了吗？