DeepSeek 被指“模型蒸馏”：技术争议背后的商业博弈与路径分歧

2026/03/11 08:55阅读量 32

美国 AI 巨头 Anthropic 指控中国三家头部企业（DeepSeek、Moonshot、MiniMax）利用虚假账户对 Claude 模型进行大规模“蒸馏”攻击，但 DeepSeek 在交互数据中占比不足 1%。该事件引发行业关于版权法律边界、合同违约性质及西方巨头自身训练数据来源的激烈争论。DeepSeek 代表的“效率革命”路线与西方“规模信仰”形成鲜明对比，其无明确商业模式的现状也面临可持续性挑战。

事件概述

2026 年 2 月 23 日，美国 AI 公司 Anthropic 发布调查报告，指控中国三家头部 AI 企业——深度求索（DeepSeek）、月之暗面（Moonshot）和稀宇科技（MiniMax），通过“工业化规模”的手段对其旗舰模型 Claude 发动了模型蒸馏攻击。

Anthropic 声称，涉事方使用了约 2.4 万个虚假账户和超过 1600 万次交互，构建了一套名为“九头蛇集群”的分布式架构，绕过地区访问限制和安全防护，系统性地提取了 Claude 的推理能力、工具调用及编程数据。然而，数据显示 DeepSeek 在此次指控中的交互次数仅为约 15 万，占比不到 1%，远低于 MiniMax（超 1300 万）和 Moonshot（超 340 万）。

核心争议点

1. “蒸馏”的技术与法律边界

技术定义：知识蒸馏（Knowledge Distillation）是机器学习领域的成熟技术，旨在用大模型（教师）的输出训练小模型（学生），以降低运行成本并复现核心能力。Anthropic 承认前沿实验室常对自身模型进行蒸馏以提供廉价版本。
法律定性：美国版权局 2025 年 1 月的裁定确认，仅提供提示词生成的输出不受版权保护。因此，即便蒸馏行为属实，在法律层面更接近于违反服务条款（ToS）的合同违约，而非知识产权盗窃。
行业惯例：多位开发者指出，利用竞争对手 API 输出训练自有模型在行业内属于“公开的秘密”，处于灰色地带。

2. 舆论战与政治叙事

双重标准质疑：xAI 创始人埃隆·马斯克嘲讽 Anthropic 指责他人偷窃其从人类程序员处获取的内容，直指 Anthropic 曾在 2025 年 9 月因使用盗版书籍（超 700 万本）训练 Claude 而支付 15 亿美元和解金。
战略动机：分析认为，Anthropic 此时抛出指控正值其与五角大楼谈判国防合同（价值 2 亿美元）的关键期，且竞争对手 xAI 刚获合作。将中国企业列为靶子，意在渲染“中国 AI 威胁论”，向美国政府表忠以强化国家安全价值。

3. DeepSeek 的路径困境

技术突围 vs. 黑箱质疑：DeepSeek 凭借 R1 模型（训练成本约 560 万美元）在推理测试中比肩 OpenAI o1，被视为“效率革命”的代表。但其未公开训练数据集，导致外界质疑其优势是否源于架构创新还是数据窃取。
商业模式缺失：DeepSeek 定位为“开源基建提供者”，虽占据全球开源模型 Token 吞吐量的一半以上，但缺乏清晰的变现模式。其低成本神话依赖于母公司幻方量化（2025 年利润超 7 亿美元）的持续输血，一旦外部环境变化或母公司业绩波动，生存将面临考验。
技术路线差异：与 OpenAI、Google 等信奉“规模信仰”（堆算力、大数据）不同，DeepSeek 选择用算法创新对冲算力封锁。但在多模态领域布局滞后，可能错失视频生成、语音合成等新红利。

关键结论

这场争议本质上是全球 AI 行业话语权争夺的缩影。所谓的“偷窃”指控更像是一场精心包装的商业竞争叙事。DeepSeek 代表了中国 AI 在算力封锁下的独特突围路径，但也面临着规则制定权缺失和商业模式可持续性的严峻拷问。未来，如何在技术上“并跑”并在规则上实现有效对话，是中国 AI 企业必须面对的挑战。

阅读原文详情