DeepSeek 融资后首项开源成果:推理加速方案 DSpark,生成速度提升 85%

2026/06/27 16:59阅读量 28

DeepSeek 在完成 500 亿元融资后,开源了推测解码框架 DSpark 及训练工具 DeepSpec,相关论文由梁文锋署名。DSpark 采用半自回归架构与置信度调度校验机制,在线上服务中可将单用户生成速度提升 60%-85%,同时维持同等吞吐。该方案旨在降低大模型推理成本,提升工程化效率。

事件概述

2026 年 6 月 27 日,DeepSeek 在完成首轮 500 亿元融资后,首次发布开源成果:推出 DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash-DSpark 模型,并开源推测解码框架 DSpark 及训练框架 DeepSpec。相关论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》由梁文锋署名,联合北京大学完成。

核心信息

  • 技术原理:推测解码是一种无损加速技术,通过“先打草稿、后验证”加速推理。当前主流并行草稿器存在后续 token 通过率快速下滑的问题,且无差别校验会浪费算力。DSpark 采用半自回归架构,将并行主干与轻量串行模块结合,缓解末尾 token 通过率衰减;同时引入置信度调度校验机制,根据前缀通过概率和引擎吞吐特征动态调整校验长度,减少无效校验。
  • 性能提升:在承接真实用户流量的线上系统中,相较于成熟基线方案 MTP-1,在保持整体吞吐不变的前提下,DSpark 将单用户生成速度提升 60%-85%。在严格时延约束下,DSpark 避免了吞吐率大幅滑坡,推高了服务系统的帕累托最优边界。
  • 开源内容
    • DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash-DSpark 并非新模型,而是在原有版本上增加推测解码模块。
    • DSpark 框架的开源包含模型权重和推理示例。
    • DeepSpec 是全栈训练和评估工具链,支持 DSpark、DFlash、Eagle3 等草稿模型,开发者可用其对 Qwen3、Gemma 等模型训练草稿模型。代码以 MIT 许可发布。
  • 战略意义:此次发布是 DeepSeek 融资后在推理优化赛道的率先落子,意图加速模型迭代和产品化,同时抢占算力效率竞争制高点。

值得关注

  • DSpark 将高吞吐并行生成与自适应校验结合,在保持吞吐率的同时显著提升单用户响应速度,有助于在推理成本与用户体验之间取得更好的平衡。
  • DeepSpec 开放了完整训练框架,降低了推测解码技术的落地门槛,可被第三方模型直接复用。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。