马里兰大学研究:AI写小说的叙事套路被彻底拆解,Claude平铺、GPT爱做梦、Gemini只讲“他如何”
马里兰大学与Google DeepMind联合发布论文《StoryScope》,通过分析61608篇故事中的304个叙事特征,发现仅凭叙事结构即可93.2%准确区分人类与AI写作。AI普遍存在说教式叙事、单线程情节、过度身体描写、缺乏读者意识及故事趋同问题;不同模型有独特“叙事指纹”。该研究指出,修改表层风格无法改变AI的底层叙事逻辑。
事件概述
马里兰大学计算机系Jenna Russell团队联合Google DeepMind在arXiv发布论文《StoryScope: Investigating idiosynerasies in AI fiction》,对AI与人类写作在叙事层面的本质差异进行了大规模量化分析。沃顿商学院教授Ethan Mollick在X上分享后获31.5万次查看。
核心信息
-
实验规模:收集10272个写作提示,每个提示分别由人类和Claude、DeepSeek、Gemini、GPT、Kimi五个模型各写一篇约5000词的故事,共获61608篇。每篇提取304个叙事特征。
-
检测能力:仅用叙事特征(排除用词、句式、标点等风格线索),区分人类/AI的准确率达93.2%;六类归属(五个模型+人类)准确率68.4%。
-
AI写作五大叙事差异:
- 说教倾向:77%的AI故事直接点明主题(人类52%);59%的AI对话包含哲学讨论(人类34%);AI引用方式72%为模糊暗指(人类更常明确提及作品名称)。
- 线性叙事:79%的AI故事无支线情节(人类57%);69%为完全驱动型结局(人类46%);人类更倾向开放结局,AI习惯为每个角色交代结局。
- 过度身体描写:81%的AI通过生理感受传达情绪(人类38%);82%的AI使用嗅觉意象(人类57%);人类直接使用情绪标签的比例29%,AI仅8%。
- 缺乏读者意识:仅7%的AI故事出现“打破第四面墙”的读者对话(人类28%);人类提及具体文本和作者的比例是AI的两倍。
- 叙事趋同:所有AI模型的故事在“叙事空间”聚集在同一区域,而人类故事散布更广;人类角色更常存在道德矛盾(59% vs 38%)。
-
不同模型的叙事指纹:
- Claude:事件升级平淡,情节推进像白开水。
- GPT:频繁使用梦境序列作为叙事转折。
- Gemini:默认使用外部视角描述角色,避免进入内心。
DeepSeek和Kimi也各有鲜明倾向。六类归属准确率达68.4%。
值得关注
研究团队公开了全部代码、10272个写作提示及51336篇AI生成文本。论文强调,即使要求AI用不同风格写作(如模仿海明威),其底层叙事逻辑(如单线程、回避道德模糊性)几乎无法改变。这引发了对“原创性”定义的深层讨论:当AI生成文本大量涌入,需要一套能穿透表层直达叙事底层的检测工具。对于写作者而言,核心提示是:AI可以写出通顺文字,但无法替代真实的生活体验——而这才是好故事的真正来源。
(本研究论文地址:https://arxiv.org/abs/2604.03136)
