DeepSeek V4发布与融资传闻:告别“孤胆英雄”,迈向基础设施级竞争
2026/04/24 17:07阅读量 3
DeepSeek于2026年4月24日推出V4系列模型(含Pro和Flash版本),标志着其从单纯追求性价比转向支持百万token上下文、复杂推理及Agent能力的深度场景应用。与此同时,市场传闻腾讯与阿里正洽谈合计约18亿美元的投资,估值超200亿美元,旨在解决算力成本上升、人才争夺及生态闭环等挑战。这一动向表明DeepSeek正从独立的研究型团队转型为需要资本、云资源和产业入口支撑的基础设施级公司。
事件概述
2026年4月24日,DeepSeek正式开启V4系列模型的预览服务,同时市场传出腾讯与阿里巴巴正在洽谈投资的消息。这标志着DeepSeek结束了早期依靠极致工程效率的“单点突破”阶段,开始进入需要大规模资本投入、生态协同和商业化落地的“持久战”阶段。
核心信息:V4模型的技术演进
DeepSeek V4系列的发布并非简单的参数堆叠,而是针对复杂任务场景的系统性升级:
- 产品架构:包含两个MoE(混合专家)模型版本。
- V4-Pro:总参数1.6T,激活参数49B,定位为能力上限版本,承担复杂推理和高难度任务。
- V4-Flash:总参数284B,激活参数13B,定位为规模化调用版本,覆盖速度、成本和高频场景。
- 关键能力:
- 长上下文:两者均支持100万token上下文,能够处理超长资料阅读和连续任务。
- Agent能力:强化Thinking Mode(思考模式)、Tool Calls(工具调用)及JSON输出,使其更易被接入外部系统,稳定服务于应用层。
- 效率导向:延续了DeepSeek“不单纯堆参数,压榨系统效率”的核心路线,试图在降低长文本处理成本的同时提升交付能力。
融资动态:资本与生态的引入
尽管DeepSeek官方尚未确认融资细节,但多方报道指出腾讯和阿里正在洽谈投资,预计合计投资额约18亿美元,投后估值超过200亿美元。此次融资背后的逻辑主要基于以下三个维度的压力与需求:
-
成本结构变化:
- 训练与推理成本:相比V3时代(671B参数,2.788M H800 GPU hours),V4规模显著扩大(1.6T参数,32T+预训练tokens)。随着用户量增加,推理侧成为长期成本黑洞,仅靠工程优化难以完全覆盖资本开支。
- 国产算力适配:为应对国际环境不确定性,DeepSeek需加强与华为昇腾(Ascend 950芯片)等国产算力栈的适配,这需要额外的资源投入。
-
人才竞争白热化:
- 2025年后,中国AI核心研究员面临“天价争夺”。DeepSeek原有的“小团队、高密度、研究自由”模式难以抵挡巨头以现金、期权、算力和数据进行的全面挖角。融资有助于将人才激励升级为“长期利益绑定”。
-
生态闭环需求:
- 腾讯的价值:提供微信、企业微信、腾讯云等“低干预、高分发、高场景”的入口,是天然的Agent试验田,且历史上对保持被投企业独立性较为友好。
- 阿里的价值:提供阿里云基础设施及通义千问(Qwen)开源生态,形成“自研+外部最强开源系”的双支点,增强阿里云在模型市场的吸引力。
- 为何非字节:字节拥有强C端产品(豆包)和自研模型,若入股可能带来战略竞争张力,不利于DeepSeek保持独立研究路线。
行业影响与趋势分析
DeepSeek的发展历程折射出大模型行业的竞争范式转移:
- 从“技术奇袭”到“系统协同”:早期DeepSeek通过V2、V3和R1证明了工程效率和开源路线可以打破巨头垄断;而V4与融资传闻则表明,未来的竞争是模型、芯片、云、框架和应用场景之间的系统协同。
- 身份转变:DeepSeek正从“幻方量化AI副线”演变为“独立的开源模型团队”,进而成为“全球AI叙事搅局者”,最终走向“被大厂押注的基础设施级公司”。
- 商业化压力:开源带来的声望无法自动转化为算力账单的支付能力。DeepSeek必须补全资本、云资源和分发渠道,才能完成从“能打仗的研究团队”到“长期守城的基础设施公司”的跨越。
