马里兰大学研究:AI写小说的叙事套路被彻底拆解,Claude平铺、GPT爱做梦、Gemini只讲“他如何”

2026/05/31 08:56阅读量 3

马里兰大学与Google DeepMind联合发布论文《StoryScope》,通过分析61608篇故事中的304个叙事特征,发现仅凭叙事结构即可93.2%准确区分人类与AI写作。AI普遍存在说教式叙事、单线程情节、过度身体描写、缺乏读者意识及故事趋同问题;不同模型有独特“叙事指纹”。该研究指出,修改表层风格无法改变AI的底层叙事逻辑。

事件概述

马里兰大学计算机系Jenna Russell团队联合Google DeepMind在arXiv发布论文《StoryScope: Investigating idiosynerasies in AI fiction》,对AI与人类写作在叙事层面的本质差异进行了大规模量化分析。沃顿商学院教授Ethan Mollick在X上分享后获31.5万次查看。

核心信息

  • 实验规模:收集10272个写作提示,每个提示分别由人类和Claude、DeepSeek、Gemini、GPT、Kimi五个模型各写一篇约5000词的故事,共获61608篇。每篇提取304个叙事特征。

  • 检测能力:仅用叙事特征(排除用词、句式、标点等风格线索),区分人类/AI的准确率达93.2%;六类归属(五个模型+人类)准确率68.4%。

  • AI写作五大叙事差异

    1. 说教倾向:77%的AI故事直接点明主题(人类52%);59%的AI对话包含哲学讨论(人类34%);AI引用方式72%为模糊暗指(人类更常明确提及作品名称)。
    2. 线性叙事:79%的AI故事无支线情节(人类57%);69%为完全驱动型结局(人类46%);人类更倾向开放结局,AI习惯为每个角色交代结局。
    3. 过度身体描写:81%的AI通过生理感受传达情绪(人类38%);82%的AI使用嗅觉意象(人类57%);人类直接使用情绪标签的比例29%,AI仅8%。
    4. 缺乏读者意识:仅7%的AI故事出现“打破第四面墙”的读者对话(人类28%);人类提及具体文本和作者的比例是AI的两倍。
    5. 叙事趋同:所有AI模型的故事在“叙事空间”聚集在同一区域,而人类故事散布更广;人类角色更常存在道德矛盾(59% vs 38%)。
  • 不同模型的叙事指纹

    • Claude:事件升级平淡,情节推进像白开水。
    • GPT:频繁使用梦境序列作为叙事转折。
    • Gemini:默认使用外部视角描述角色,避免进入内心。
      DeepSeek和Kimi也各有鲜明倾向。六类归属准确率达68.4%。

值得关注

研究团队公开了全部代码、10272个写作提示及51336篇AI生成文本。论文强调,即使要求AI用不同风格写作(如模仿海明威),其底层叙事逻辑(如单线程、回避道德模糊性)几乎无法改变。这引发了对“原创性”定义的深层讨论:当AI生成文本大量涌入,需要一套能穿透表层直达叙事底层的检测工具。对于写作者而言,核心提示是:AI可以写出通顺文字,但无法替代真实的生活体验——而这才是好故事的真正来源。

(本研究论文地址:https://arxiv.org/abs/2604.03136)

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。