DeepSeek-V4 正式发布开源,华为云首发适配并推出 Flash 版本
2026/04/24 18:10阅读量 5
4 月 24 日,DeepSeek-V4 模型正式开源发布,具备百万 Token 超长上下文及领先的 Agent 与推理能力。华为云作为首发适配方,在系统、算子及集群层协同优化,提供免部署的 API 服务。其中,参数降至 284B 的 DeepSeek-V4-Flash 版本旨在降低推理成本,金山办公等企业已率先接入。
事件概述
4 月 24 日,DeepSeek-V4 模型正式发布并开源。该模型在 Agent 能力、世界知识储备及推理性能方面均达到国内与开源领域的领先水平,核心特性包括支持百万 Token 超长上下文。
核心信息:DeepSeek-V4-Flash 版本
- 参数与成本:DeepSeek-V4-Flash 模型参数量下降至 284B,激活参数更小,显著降低了推理成本。
- 服务目标:旨在提供更快捷、经济的 API 服务,实现百万上下文的普惠化应用。
- 当前状态:华为云 MaaS(模型即服务)平台已上线该版本的 Tokens 服务,开发者可免部署、一键调用。
技术适配与优化
华为云在系统层、算子层和集群层进行了关键能力的协同,从调度效率、计算效率和数据流转效率三个维度保障高性能落地:
- 注意力机制优化:首发适配模型分层注意力压缩机制,实现 V4 注意力机制下 KVCache 的高效分配管理。
- 算子与框架支持:提供 TopK、SWA、CFA 等 10+ 昇腾高性能融合算子;结合框架异步调度、MTP(多步投机)等优化技术。
- 长上下文推理:支持原生 1M 长上下文的高性能推理。
生态进展
- 企业接入:金山办公、360 等企业已通过华为云接入 DeepSeek 新模型。
- 后续计划:DeepSeek-V4-Pro 版本预计将于近日上线。
- 基础设施:华为云以“硅基黑土地”为理念,开放接纳自研及第三方主流大模型,助力企业提升生产效率。
