七家中国财经媒体联合声明:禁止AI未经授权使用内容训练模型
2026/04/30 20:23阅读量 2
2026年4月27日,包括《21世纪经济报道》在内的七家中国主流财经媒体首次同步发布声明,明确禁止未经许可将原创内容用于机器学习及大模型训练。此举标志着中国AI数据治理从无序默许转向有序主张,旨在应对高质量财经数据被系统性“原料化”且未获回报的现状。媒体计划采取“技术防御+法律维权”双重策略,并优先寻求与头部AI公司进行授权谈判,以探索新的数据资产变现模式。
事件概述
2026年4月27日,中国财经媒体界发生标志性事件。《21世纪经济报道》《证券时报》《上海证券报》《证券日报》《中国基金报》、第一财经及《每日经济新闻》七家主流媒体,首次集体更新版权声明:未经书面许可,严禁将其原创内容用于机器学习、数据挖掘及大模型训练等AI应用场景。
这一行动比美国同行(如《纽约时报》于2023年采取行动)晚了约两年半,折射出中国AI商业化进程、媒体商业模式及司法环境演进的阶段性特征。随着百度“文心一言”、阿里“通义千问”、字节“豆包”等产品在2024-2025年的密集推出,财经数据的准确性与专业性成为稀缺训练资产,媒体开始意识到内容正被系统性“原料化”。
核心背景与动因
- 数据价值觉醒:长期以来,中国媒体将内容视为“流量入口”,但在AI时代,精准金融数据与深度行业分析已成为高价值语料。面对核心资产被无偿使用,维权成为必然选择。
- 行业协同效应:七家媒体分属不同集团却能统一发声,表明行业已形成集体议价共识。这种协同可能催生首个“财经数据联盟”,显著改变AI公司与内容提供者的力量对比。
- 政策与司法驱动:
- 2025年7月,《生成式人工智能服务管理暂行办法》正式实施,明确要求训练数据需有“合法来源”。
- 国家版权局印发相关意见,设定至2030年的发展目标。
- 司法实践加速:上海首例AI著作权侵权案(2025年11月)确立用户直接侵权责任;深圳法院在“雪球诉航某公司”案中认定AI爬取数据构成不正当竞争;杭州互联网法院认定生成式AI服务提供者可能构成帮助侵权。
应对策略与未来路径
1. 技术防御升级
- 更新
robots.txt协议,明确禁止AI爬虫访问。 - 部署API访问控制与异常抓取监测系统。
- 利用行为分析与动态指纹技术追踪侵权证据。
2. 谈判优先,诉讼备选
基于当前环境,七家媒体可能采取渐进策略:
- 组建联合谈判体:与百度、阿里、腾讯、字节等头部AI公司展开授权谈判。
- 探索合作模式:
- 按Token付费:参考国际模式,根据训练数据使用量计费。
- 收入分成:提取AI产品收入的一定比例。
- 战略合作:探索数据换股权或技术共享。
- 分层授权:区分研究用途与商业用途,设置差异化费率。
- 诉讼准备:若谈判破裂或监管收紧,将启动法律程序。最高人民法院已指出,违反
robots协议或破坏技术措施可能承担民事责任。
行业影响前瞻
- 对AI公司:训练数据成本显性化,“免费爬取”时代终结。合规获取高质量数据将成为核心竞争力,未做好准备的企业可能面临数据短缺风险。
- 对媒体:开启数据资产化新路径,但需解决数据价值量化、授权模式设计及开放与保护的平衡问题。
- 对法律领域:AI数据治理涉及著作权法、反不正当竞争法等多领域,复合型专业人才需求激增,首批授权合同与诉讼案件将形成行业范本。
这场博弈将重塑中国AI产业生态,推动建立公平可持续的数据流通秩序。
