DeepSeek-V4 正式发布开源,华为云首发适配并推出 Flash 版本

2026/04/24 18:10阅读量 5

4 月 24 日,DeepSeek-V4 模型正式开源发布,具备百万 Token 超长上下文及领先的 Agent 与推理能力。华为云作为首发适配方,在系统、算子及集群层协同优化,提供免部署的 API 服务。其中,参数降至 284B 的 DeepSeek-V4-Flash 版本旨在降低推理成本,金山办公等企业已率先接入。

事件概述

4 月 24 日,DeepSeek-V4 模型正式发布并开源。该模型在 Agent 能力、世界知识储备及推理性能方面均达到国内与开源领域的领先水平,核心特性包括支持百万 Token 超长上下文。

核心信息:DeepSeek-V4-Flash 版本

  • 参数与成本:DeepSeek-V4-Flash 模型参数量下降至 284B,激活参数更小,显著降低了推理成本。
  • 服务目标:旨在提供更快捷、经济的 API 服务,实现百万上下文的普惠化应用。
  • 当前状态:华为云 MaaS(模型即服务)平台已上线该版本的 Tokens 服务,开发者可免部署、一键调用。

技术适配与优化

华为云在系统层、算子层和集群层进行了关键能力的协同,从调度效率、计算效率和数据流转效率三个维度保障高性能落地:

  1. 注意力机制优化:首发适配模型分层注意力压缩机制,实现 V4 注意力机制下 KVCache 的高效分配管理。
  2. 算子与框架支持:提供 TopK、SWA、CFA 等 10+ 昇腾高性能融合算子;结合框架异步调度、MTP(多步投机)等优化技术。
  3. 长上下文推理:支持原生 1M 长上下文的高性能推理。

生态进展

  • 企业接入:金山办公、360 等企业已通过华为云接入 DeepSeek 新模型。
  • 后续计划:DeepSeek-V4-Pro 版本预计将于近日上线。
  • 基础设施:华为云以“硅基黑土地”为理念,开放接纳自研及第三方主流大模型,助力企业提升生产效率。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。