马里兰大学研究：AI写小说的叙事套路被彻底拆解，Claude平铺、GPT爱做梦、Gemini只讲“他如何”

2026/05/31 08:56阅读量 3

马里兰大学与Google DeepMind联合发布论文《StoryScope》，通过分析61608篇故事中的304个叙事特征，发现仅凭叙事结构即可93.2%准确区分人类与AI写作。AI普遍存在说教式叙事、单线程情节、过度身体描写、缺乏读者意识及故事趋同问题；不同模型有独特“叙事指纹”。该研究指出，修改表层风格无法改变AI的底层叙事逻辑。

事件概述

马里兰大学计算机系Jenna Russell团队联合Google DeepMind在arXiv发布论文《StoryScope: Investigating idiosynerasies in AI fiction》，对AI与人类写作在叙事层面的本质差异进行了大规模量化分析。沃顿商学院教授Ethan Mollick在X上分享后获31.5万次查看。

核心信息

实验规模：收集10272个写作提示，每个提示分别由人类和Claude、DeepSeek、Gemini、GPT、Kimi五个模型各写一篇约5000词的故事，共获61608篇。每篇提取304个叙事特征。
检测能力：仅用叙事特征（排除用词、句式、标点等风格线索），区分人类/AI的准确率达93.2%；六类归属（五个模型+人类）准确率68.4%。
AI写作五大叙事差异：
1. 说教倾向：77%的AI故事直接点明主题（人类52%）；59%的AI对话包含哲学讨论（人类34%）；AI引用方式72%为模糊暗指（人类更常明确提及作品名称）。
2. 线性叙事：79%的AI故事无支线情节（人类57%）；69%为完全驱动型结局（人类46%）；人类更倾向开放结局，AI习惯为每个角色交代结局。
3. 过度身体描写：81%的AI通过生理感受传达情绪（人类38%）；82%的AI使用嗅觉意象（人类57%）；人类直接使用情绪标签的比例29%，AI仅8%。
4. 缺乏读者意识：仅7%的AI故事出现“打破第四面墙”的读者对话（人类28%）；人类提及具体文本和作者的比例是AI的两倍。
5. 叙事趋同：所有AI模型的故事在“叙事空间”聚集在同一区域，而人类故事散布更广；人类角色更常存在道德矛盾（59% vs 38%）。
不同模型的叙事指纹：
- Claude：事件升级平淡，情节推进像白开水。
- GPT：频繁使用梦境序列作为叙事转折。
- Gemini：默认使用外部视角描述角色，避免进入内心。
  DeepSeek和Kimi也各有鲜明倾向。六类归属准确率达68.4%。

值得关注

研究团队公开了全部代码、10272个写作提示及51336篇AI生成文本。论文强调，即使要求AI用不同风格写作（如模仿海明威），其底层叙事逻辑（如单线程、回避道德模糊性）几乎无法改变。这引发了对“原创性”定义的深层讨论：当AI生成文本大量涌入，需要一套能穿透表层直达叙事底层的检测工具。对于写作者而言，核心提示是：AI可以写出通顺文字，但无法替代真实的生活体验——而这才是好故事的真正来源。

（本研究论文地址：https://arxiv.org/abs/2604.03136）

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？