DeepSeek 被指“模型蒸馏”:技术争议背后的商业博弈与路径分歧

美国 AI 巨头 Anthropic 指控中国三家头部企业(DeepSeek、Moonshot、MiniMax)利用虚假账户对 Claude 模型进行大规模“蒸馏”攻击,但 DeepSeek 在交互数据中占比不足 1%。该事件引发行业关于版权法律边界、合同违约性质及西方巨头自身训练数据来源的激烈争论。DeepSeek 代表的“效率革命”路线与西方“规模信仰”形成鲜明对比,其无明确商业模式的现状也面临可持续性挑战。

事件概述

2026 年 2 月 23 日,美国 AI 公司 Anthropic 发布调查报告,指控中国三家头部 AI 企业——深度求索(DeepSeek)、月之暗面(Moonshot)和稀宇科技(MiniMax),通过“工业化规模”的手段对其旗舰模型 Claude 发动了模型蒸馏攻击。

Anthropic 声称,涉事方使用了约 2.4 万个虚假账户和超过 1600 万次交互,构建了一套名为“九头蛇集群”的分布式架构,绕过地区访问限制和安全防护,系统性地提取了 Claude 的推理能力、工具调用及编程数据。然而,数据显示 DeepSeek 在此次指控中的交互次数仅为约 15 万,占比不到 1%,远低于 MiniMax(超 1300 万)和 Moonshot(超 340 万)。

核心争议点

1. “蒸馏”的技术与法律边界

  • 技术定义:知识蒸馏(Knowledge Distillation)是机器学习领域的成熟技术,旨在用大模型(教师)的输出训练小模型(学生),以降低运行成本并复现核心能力。Anthropic 承认前沿实验室常对自身模型进行蒸馏以提供廉价版本。
  • 法律定性:美国版权局 2025 年 1 月的裁定确认,仅提供提示词生成的输出不受版权保护。因此,即便蒸馏行为属实,在法律层面更接近于违反服务条款(ToS)的合同违约,而非知识产权盗窃。
  • 行业惯例:多位开发者指出,利用竞争对手 API 输出训练自有模型在行业内属于“公开的秘密”,处于灰色地带。

2. 舆论战与政治叙事

  • 双重标准质疑:xAI 创始人埃隆·马斯克嘲讽 Anthropic 指责他人偷窃其从人类程序员处获取的内容,直指 Anthropic 曾在 2025 年 9 月因使用盗版书籍(超 700 万本)训练 Claude 而支付 15 亿美元和解金。
  • 战略动机:分析认为,Anthropic 此时抛出指控正值其与五角大楼谈判国防合同(价值 2 亿美元)的关键期,且竞争对手 xAI 刚获合作。将中国企业列为靶子,意在渲染“中国 AI 威胁论”,向美国政府表忠以强化国家安全价值。

3. DeepSeek 的路径困境

  • 技术突围 vs. 黑箱质疑:DeepSeek 凭借 R1 模型(训练成本约 560 万美元)在推理测试中比肩 OpenAI o1,被视为“效率革命”的代表。但其未公开训练数据集,导致外界质疑其优势是否源于架构创新还是数据窃取。
  • 商业模式缺失:DeepSeek 定位为“开源基建提供者”,虽占据全球开源模型 Token 吞吐量的一半以上,但缺乏清晰的变现模式。其低成本神话依赖于母公司幻方量化(2025 年利润超 7 亿美元)的持续输血,一旦外部环境变化或母公司业绩波动,生存将面临考验。
  • 技术路线差异:与 OpenAI、Google 等信奉“规模信仰”(堆算力、大数据)不同,DeepSeek 选择用算法创新对冲算力封锁。但在多模态领域布局滞后,可能错失视频生成、语音合成等新红利。

关键结论

这场争议本质上是全球 AI 行业话语权争夺的缩影。所谓的“偷窃”指控更像是一场精心包装的商业竞争叙事。DeepSeek 代表了中国 AI 在算力封锁下的独特突围路径,但也面临着规则制定权缺失和商业模式可持续性的严峻拷问。未来,如何在技术上“并跑”并在规则上实现有效对话,是中国 AI 企业必须面对的挑战。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。