DeepSeek 融资后首项开源成果：推理加速方案 DSpark，生成速度提升 85%

2026/06/27 16:59阅读量 28

DeepSeek 在完成 500 亿元融资后，开源了推测解码框架 DSpark 及训练工具 DeepSpec，相关论文由梁文锋署名。DSpark 采用半自回归架构与置信度调度校验机制，在线上服务中可将单用户生成速度提升 60%-85%，同时维持同等吞吐。该方案旨在降低大模型推理成本，提升工程化效率。

事件概述

2026 年 6 月 27 日，DeepSeek 在完成首轮 500 亿元融资后，首次发布开源成果：推出 DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash-DSpark 模型，并开源推测解码框架 DSpark 及训练框架 DeepSpec。相关论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》由梁文锋署名，联合北京大学完成。

核心信息

技术原理：推测解码是一种无损加速技术，通过“先打草稿、后验证”加速推理。当前主流并行草稿器存在后续 token 通过率快速下滑的问题，且无差别校验会浪费算力。DSpark 采用半自回归架构，将并行主干与轻量串行模块结合，缓解末尾 token 通过率衰减；同时引入置信度调度校验机制，根据前缀通过概率和引擎吞吐特征动态调整校验长度，减少无效校验。
性能提升：在承接真实用户流量的线上系统中，相较于成熟基线方案 MTP-1，在保持整体吞吐不变的前提下，DSpark 将单用户生成速度提升 60%-85%。在严格时延约束下，DSpark 避免了吞吐率大幅滑坡，推高了服务系统的帕累托最优边界。
开源内容：
- DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash-DSpark 并非新模型，而是在原有版本上增加推测解码模块。
- DSpark 框架的开源包含模型权重和推理示例。
- DeepSpec 是全栈训练和评估工具链，支持 DSpark、DFlash、Eagle3 等草稿模型，开发者可用其对 Qwen3、Gemma 等模型训练草稿模型。代码以 MIT 许可发布。
战略意义：此次发布是 DeepSeek 融资后在推理优化赛道的率先落子，意图加速模型迭代和产品化，同时抢占算力效率竞争制高点。

值得关注

DSpark 将高吞吐并行生成与自适应校验结合，在保持吞吐率的同时显著提升单用户响应速度，有助于在推理成本与用户体验之间取得更好的平衡。
DeepSpec 开放了完整训练框架，降低了推测解码技术的落地门槛，可被第三方模型直接复用。

阅读原文详情

准备好启动您的定制项目了吗？