湖南台AI主播引争议,但每小时5700万条AI错误信息更值得警惕
2026/05/04 10:15阅读量 14
湖南经视启用AI主播“声声”“双双”播报新闻引发网友热议,但更严峻的是AI搜索的高错误率。数据显示,Google AI Overview功能错误率达9%,相当于每小时传播5700万条错误信息。错误类型包括直接答错、推断错误和矛盾回答,且来源大量依赖社交媒体,超过一半的正确回答无法被验证。
事件概述
湖南经视在五一假期期间启用AI主播“声声”和“双双”播报常态化新闻,画面标注“AI生成”,仍引发大量网友吐槽,话题一度登上微博热搜第一。类似港剧《新闻女王2》中的AI数字人情节正在现实中上演,全球电视台已开始试点AI主播。
核心信息:AI搜索错误率触目惊心
- 根据《纽约时报》委托AI初创公司Oumi进行的系统测试,Google AI Overview功能在Gemini 2时期准确率约85%,错误率15%;升级至Gemini 3后准确率提升至91%,错误率仍达9%。
- Google每年处理超5万亿次搜索,按9%错误率计算,相当于每小时传播超5700万条错误信息,每分钟数十万条。
错误典型模式
- 直接答错:如AI Overview回答鲍勃·马利故居博物馆于1987年开放,实际为1986年5月11日。引用来源包括马利女儿的Facebook帖子(未提时间)、旅游博客和Wikipedia。
- 推断错误:询问哪条河流在北卡罗来纳州戈尔兹伯勒市西侧时,AI回答尼斯河(Neuse River),实际上该河在西南方,西侧为小河。
- 矛盾回答:问题“马友友是哪一年被引入古典音乐名人堂”,AI正确链接该组织官网(明确列出马友友等165位入选者),却回答“没有记录显示他被引入过”。
错误根源:依赖社交媒体且难以验证
- Oumi分析5380个引用来源,Facebook和Reddit分别为第二和第四大被引用源。当AI Overview给出错误回答时,引用Facebook的比例为7%,正确时比例为5%。
- Gemini 3版本中,56%的正确回答是“无根据的”,即链接网站并不完全支持所给信息,比例较去年10月的37%有所上升。Oumi CEO指出:“即使答案是对的,你怎么知道它是对的?你怎么检查?”
- 可被操纵:BBC播客记者Thomas Germain发布一篇虚构的“最擅长吃热狗的科技记者”博客,24小时后Google AI Overview将其列为第一名,并引用虚构比赛成绩。Google发言人回应称此类搜索不现实,但机制对所有搜索均有效。
值得关注:搜索引擎角色的转变风险
- 过去Google搜索是“目录”,告知信息位置,用户自行判断;现在成为“答案机器”,将不确定回答包装成权威答案置于顶部,用确定语气呈现。
- 尽管每一条AI Overview下方都提示“AI可能会犯错,请双重检查”,但顶部放置与权威排版天然诱导用户信任,违背交叉验证原则。核心问题不在于9%的错误率本身,而在于设计上让用户默认信任一个可能错误的信息。
