DeepSeek V4发布：回归效率本位，技术路线与商业化公司分道扬镳

2026/04/25 07:31阅读量 23

DeepSeek正式发布V4预览版，其核心定位并非追求榜单排名的“顶尖”，而是坚持极致的性价比与计算效率。对比Kimi等竞品，DeepSeek采用混合注意力架构在系统层做减法，而Kimi则在任务层做加法，两者技术路径截然不同。此外，V4虽未完全脱离英伟达训练生态，但通过引入领域专用语言（DSL）实现了跨平台适配，为未来国产芯片替代打下基础。

事件概述

2026年4月24日，DeepSeek发布V4预览版模型。不同于外界期待的再次“震惊行业”的颠覆性产品，DeepSeek此次明确将自身定义为追求极致性价比的模型。资本市场对此反应迅速，发布后港股大模型板块震荡，智谱与MiniMax股价一度分别下跌超10%和12%，反映出市场对国产模型定价逻辑及DeepSeek作为行业变量的高度关注。

核心信息与技术路线对比

DeepSeek V4展现了与当前主流AI创业公司截然不同的技术底色，主要体现在以下方面：

1. 技术架构：系统层“减法”vs 任务层“加法”

DeepSeek V4：采用混合注意力架构（Hybrid Attention），结合CSA（压缩稀疏注意力）与HCA（重度压缩注意力）。在100万token场景下，单token推理FLOPs降至上一代模型的27%，KV Cache占用降至10%。其思路是在底层计算结构上优化，解决根本的效率问题。
竞品（如Kimi）：长期强调线性注意力路线，通过Agent系统、任务编排和多轮调用，将复杂任务拆解为多个步骤由多个智能体协作完成。这种模式在任务层做“加法”，虽然能处理长链路任务，但往往消耗更多Token。

2. 能力边界与定位

代码与长上下文：V4原生支持1M上下文，并强化长链路推理能力，内部将其定位为Agentic Coding模型。这与Kimi K2.6等产品的功能标签高度重合，但实现路径不同。
效率导向：DeepSeek追求的是Token本身的计算效率，即单位算力的产出；而Kimi等公司更关注Token被消耗后的产出效率，即用户体验和工作流节省的时间。

3. 母公司基因影响

DeepSeek：背靠量化机构幻方量化，团队文化天然强调效率、收益率、速度与稳定性。梁文锋及其团队更倾向于先做难而慢的基础设施优化（如MoE、推理优化、注意力重构），而非急于商业化变现。
Kimi：作为标准AI创业公司，需面对融资与增长压力，迭代节奏更贴近用户需求与付费意愿，致力于成为可交付的生产力工具。

国产替代与工程化进展

关于“国产替代”的传闻，V4技术报告提供了更客观的视角：

硬件依赖现状：DeepSeek仅在报告中确认验证了NVIDIA GPU和华为Ascend NPU平台上的EP（专家并行）方案，并未明确表示已全面切换至华为昇腾进行训练。行业推测，目前更现实的路径是：预训练阶段仍依赖英伟达芯片，推理阶段率先迁移至国产芯片。彻底切换训练底座可能导致研发周期大幅延长。
工具链升级：DeepSeek不再强调深度绑定英伟达底层的PTX编程语言，转而采用TileLang等面向AI算子优化的领域专用语言（DSL）。这一转变意味着模型开发在保持性能的同时，降低了对单一硬件生态的依赖，提升了跨平台适配能力，为未来逐步切换到国产芯片训练奠定了基础。

结论

DeepSeek V4的发布证明了其“不诱于誉，不恐于诽”的战略定力。当行业还在争夺入口和用户时，DeepSeek选择继续深耕单位智能成本的压低与算力消耗的优化。这种看似“朴素”的工程化改进，正在逐步解决大模型发展的瓶颈，使其与其他基座模型公司处于不同的竞争维度。

阅读原文详情