七家中国财经媒体联合声明：禁止AI未经授权使用内容训练模型

2026/04/30 20:23阅读量 2

2026年4月27日，包括《21世纪经济报道》在内的七家中国主流财经媒体首次同步发布声明，明确禁止未经许可将原创内容用于机器学习及大模型训练。此举标志着中国AI数据治理从无序默许转向有序主张，旨在应对高质量财经数据被系统性“原料化”且未获回报的现状。媒体计划采取“技术防御+法律维权”双重策略，并优先寻求与头部AI公司进行授权谈判，以探索新的数据资产变现模式。

事件概述

这一行动比美国同行（如《纽约时报》于2023年采取行动）晚了约两年半，折射出中国AI商业化进程、媒体商业模式及司法环境演进的阶段性特征。随着百度“文心一言”、阿里“通义千问”、字节“豆包”等产品在2024-2025年的密集推出，财经数据的准确性与专业性成为稀缺训练资产，媒体开始意识到内容正被系统性“原料化”。

核心背景与动因

数据价值觉醒：长期以来，中国媒体将内容视为“流量入口”，但在AI时代，精准金融数据与深度行业分析已成为高价值语料。面对核心资产被无偿使用，维权成为必然选择。
行业协同效应：七家媒体分属不同集团却能统一发声，表明行业已形成集体议价共识。这种协同可能催生首个“财经数据联盟”，显著改变AI公司与内容提供者的力量对比。
政策与司法驱动：
- 2025年7月，《生成式人工智能服务管理暂行办法》正式实施，明确要求训练数据需有“合法来源”。
- 国家版权局印发相关意见，设定至2030年的发展目标。
- 司法实践加速：上海首例AI著作权侵权案（2025年11月）确立用户直接侵权责任；深圳法院在“雪球诉航某公司”案中认定AI爬取数据构成不正当竞争；杭州互联网法院认定生成式AI服务提供者可能构成帮助侵权。

应对策略与未来路径

1. 技术防御升级

更新 robots.txt 协议，明确禁止AI爬虫访问。
部署API访问控制与异常抓取监测系统。
利用行为分析与动态指纹技术追踪侵权证据。

2. 谈判优先，诉讼备选

基于当前环境，七家媒体可能采取渐进策略：

组建联合谈判体：与百度、阿里、腾讯、字节等头部AI公司展开授权谈判。
探索合作模式：
- 按Token付费：参考国际模式，根据训练数据使用量计费。
- 收入分成：提取AI产品收入的一定比例。
- 战略合作：探索数据换股权或技术共享。
- 分层授权：区分研究用途与商业用途，设置差异化费率。
诉讼准备：若谈判破裂或监管收紧，将启动法律程序。最高人民法院已指出，违反robots协议或破坏技术措施可能承担民事责任。

行业影响前瞻

对AI公司：训练数据成本显性化，“免费爬取”时代终结。合规获取高质量数据将成为核心竞争力，未做好准备的企业可能面临数据短缺风险。
对媒体：开启数据资产化新路径，但需解决数据价值量化、授权模式设计及开放与保护的平衡问题。
对法律领域：AI数据治理涉及著作权法、反不正当竞争法等多领域，复合型专业人才需求激增，首批授权合同与诉讼案件将形成行业范本。

这场博弈将重塑中国AI产业生态，推动建立公平可持续的数据流通秩序。

阅读原文详情