DeepSeek-V4 正式发布开源，华为云首发适配并推出 Flash 版本

2026/04/24 18:10阅读量 5

4 月 24 日，DeepSeek-V4 模型正式开源发布，具备百万 Token 超长上下文及领先的 Agent 与推理能力。华为云作为首发适配方，在系统、算子及集群层协同优化，提供免部署的 API 服务。其中，参数降至 284B 的 DeepSeek-V4-Flash 版本旨在降低推理成本，金山办公等企业已率先接入。

事件概述

4 月 24 日，DeepSeek-V4 模型正式发布并开源。该模型在 Agent 能力、世界知识储备及推理性能方面均达到国内与开源领域的领先水平，核心特性包括支持百万 Token 超长上下文。

核心信息：DeepSeek-V4-Flash 版本

参数与成本：DeepSeek-V4-Flash 模型参数量下降至 284B，激活参数更小，显著降低了推理成本。
服务目标：旨在提供更快捷、经济的 API 服务，实现百万上下文的普惠化应用。
当前状态：华为云 MaaS（模型即服务）平台已上线该版本的 Tokens 服务，开发者可免部署、一键调用。

技术适配与优化

华为云在系统层、算子层和集群层进行了关键能力的协同，从调度效率、计算效率和数据流转效率三个维度保障高性能落地：

注意力机制优化：首发适配模型分层注意力压缩机制，实现 V4 注意力机制下 KVCache 的高效分配管理。
算子与框架支持：提供 TopK、SWA、CFA 等 10+ 昇腾高性能融合算子；结合框架异步调度、MTP（多步投机）等优化技术。
长上下文推理：支持原生 1M 长上下文的高性能推理。

生态进展

企业接入：金山办公、360 等企业已通过华为云接入 DeepSeek 新模型。
后续计划：DeepSeek-V4-Pro 版本预计将于近日上线。
基础设施：华为云以“硅基黑土地”为理念，开放接纳自研及第三方主流大模型，助力企业提升生产效率。

阅读原文详情

事件概述

核心信息：DeepSeek-V4-Flash 版本

技术适配与优化

生态进展

准备好启动您的定制项目了吗？