DeepSeek 融资后首项开源成果:推理加速方案 DSpark,生成速度提升 85%
2026/06/27 16:59阅读量 28
DeepSeek 在完成 500 亿元融资后,开源了推测解码框架 DSpark 及训练工具 DeepSpec,相关论文由梁文锋署名。DSpark 采用半自回归架构与置信度调度校验机制,在线上服务中可将单用户生成速度提升 60%-85%,同时维持同等吞吐。该方案旨在降低大模型推理成本,提升工程化效率。
事件概述
2026 年 6 月 27 日,DeepSeek 在完成首轮 500 亿元融资后,首次发布开源成果:推出 DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash-DSpark 模型,并开源推测解码框架 DSpark 及训练框架 DeepSpec。相关论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》由梁文锋署名,联合北京大学完成。
核心信息
- 技术原理:推测解码是一种无损加速技术,通过“先打草稿、后验证”加速推理。当前主流并行草稿器存在后续 token 通过率快速下滑的问题,且无差别校验会浪费算力。DSpark 采用半自回归架构,将并行主干与轻量串行模块结合,缓解末尾 token 通过率衰减;同时引入置信度调度校验机制,根据前缀通过概率和引擎吞吐特征动态调整校验长度,减少无效校验。
- 性能提升:在承接真实用户流量的线上系统中,相较于成熟基线方案 MTP-1,在保持整体吞吐不变的前提下,DSpark 将单用户生成速度提升 60%-85%。在严格时延约束下,DSpark 避免了吞吐率大幅滑坡,推高了服务系统的帕累托最优边界。
- 开源内容:
- DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash-DSpark 并非新模型,而是在原有版本上增加推测解码模块。
- DSpark 框架的开源包含模型权重和推理示例。
- DeepSpec 是全栈训练和评估工具链,支持 DSpark、DFlash、Eagle3 等草稿模型,开发者可用其对 Qwen3、Gemma 等模型训练草稿模型。代码以 MIT 许可发布。
- 战略意义:此次发布是 DeepSeek 融资后在推理优化赛道的率先落子,意图加速模型迭代和产品化,同时抢占算力效率竞争制高点。
值得关注
- DSpark 将高吞吐并行生成与自适应校验结合,在保持吞吐率的同时显著提升单用户响应速度,有助于在推理成本与用户体验之间取得更好的平衡。
- DeepSpec 开放了完整训练框架,降低了推测解码技术的落地门槛,可被第三方模型直接复用。
