6.4k Stars！Claude Code写论文流水线开源：4个Skill覆盖研究/写作/审稿/定稿

2026/05/17 12:59阅读量 11

开源项目academic-research-skills（ARS）基于Claude Code，提供4个skill覆盖论文研究、写作、审稿和定稿全流程。项目内置引用核验、完整性闸门、反谄媚协议、三层数据隔离等防错机制，跑完一篇1.5万字论文约需4-6美元成本，GitHub星标已达6.4k。

事件概述

开源项目 academic-research-skills（ARS） 基于 Anthropic 的 Claude Code，将论文写作全流程打包成一套可复用的 skill 包。项目上线后 GitHub 星标达 6.4k，直接面向学生和研究者的学术写作需求。

ARS 包含四个核心 skill，分别对应科研流程的不同阶段：

Deep Research：由13个 Agent 组成的研究团队，负责文献调研、问题构建、方法论设计及 PRISMA 综述撰写。团队内包含文献溯源 Agent（调用 Semantic Scholar API 验证引用）、苏格拉底导师 Agent（对话引导）和魔鬼代言人 Agent（挑刺防思维固化）。
Academic Paper：12个 Agent 的写作团队，覆盖大纲、论证、草稿、双语摘要、图表可视化、引用格式转换。支持风格校准（学习用户过往写作风格），输出格式包括 Markdown、DOCX、LaTeX，可编译为 APA 7.0 或 IEEE 格式 PDF。
Academic Paper Reviewer：7个 Agent 的审稿团队，模拟真实期刊评审。主编 EIC 带领三位领域审稿人加魔鬼代言人，从方法论、学科视角等多维度打分（0-100分：80分以上接受，65-79小修，50-64大修，50以下拒稿），同时输出详细修改路线图。
Academic Pipeline：流程编排器，将上述三个团队串联成10阶段流水线（从研究、写作、完整性检查、同行评审、修订、最终检查到发表准备）。用户可在任意阶段插入，支持从初稿或审稿意见切入。

ARS 在底层设计上系统性防止 AI 引起学术不端：

引用核验：Deep Research 阶段使用 Semantic Scholar API 做存在性确认，并采用 Levenshtein 相似度算法模糊匹配（阈值 ≥0.70），防止幻觉引用。
完整性闸门：在 Stage 2.5 和 Stage 4.5 设置不可跳过检查点，运行基于 2026 年 Nature 论文总结的 7 项 AI 失败模式检查清单（覆盖引用幻觉、数据捏造、方法论造假等）。任何在 2.5 标记为 SUSPECTED 的问题必须在 4.5 变为 CLEAR 或人工覆盖记录。实测在一篇真实论文中抓出 15 个伪造引用和 3 个统计错误。
反谄媚协议：审稿团队中的魔鬼代言人负责挑刺，但其反驳评分低于 4 分（1-5 分）时，写作团队不允许承认。攻击强度在修订过程中必须保持，评分轨迹被追踪，防止 AI 讨好用户。
三层数据隔离：原始输入（Layer 1）、通过完整性验证后的产物（Layer 2）、评分标准与参考答案（Layer 3）严格隔离。写作团队只接收自然语言反馈，看不到原始评分标准，灵感来自 Anthropic 的 w2s-researcher 研究。
诚实文档化：每个产物生成 repro_lock 文件记录运行配置，但强制声明 LLM 输出不是字节级可复现，不保证复现结果。

安装：在 Claude Code 中运行两行命令即可安装 skill 包，或直接将 SKILL.md 上传到 claude.ai 项目知识库（仅支持单 Agent 简化版）。
支持语言：繁体中文和英文。
费用参考：推荐使用 Claude Opus 4.7 + Max 订阅计划（每月 100 或 200 美元）。完整跑完一篇 1.5 万字论文约消费 20 万+ 输入 token 和 10 万+ 输出 token，单独子模块用量更少，整体成本约 4-6 美元。
项目作者在更新日志中提交了三百多次 commit（从 2 月上线至今），README 核心哲学："AI 是你的副驾驶，不是飞行员。"