6.4k Stars!Claude Code写论文流水线开源:4个Skill覆盖研究/写作/审稿/定稿
2026/05/17 12:59阅读量 11
开源项目academic-research-skills(ARS)基于Claude Code,提供4个skill覆盖论文研究、写作、审稿和定稿全流程。项目内置引用核验、完整性闸门、反谄媚协议、三层数据隔离等防错机制,跑完一篇1.5万字论文约需4-6美元成本,GitHub星标已达6.4k。
事件概述
开源项目 academic-research-skills(ARS) 基于 Anthropic 的 Claude Code,将论文写作全流程打包成一套可复用的 skill 包。项目上线后 GitHub 星标达 6.4k,直接面向学生和研究者的学术写作需求。
核心架构:4个Skill
ARS 包含四个核心 skill,分别对应科研流程的不同阶段:
- Deep Research:由13个 Agent 组成的研究团队,负责文献调研、问题构建、方法论设计及 PRISMA 综述撰写。团队内包含文献溯源 Agent(调用 Semantic Scholar API 验证引用)、苏格拉底导师 Agent(对话引导)和魔鬼代言人 Agent(挑刺防思维固化)。
- Academic Paper:12个 Agent 的写作团队,覆盖大纲、论证、草稿、双语摘要、图表可视化、引用格式转换。支持风格校准(学习用户过往写作风格),输出格式包括 Markdown、DOCX、LaTeX,可编译为 APA 7.0 或 IEEE 格式 PDF。
- Academic Paper Reviewer:7个 Agent 的审稿团队,模拟真实期刊评审。主编 EIC 带领三位领域审稿人加魔鬼代言人,从方法论、学科视角等多维度打分(0-100分:80分以上接受,65-79小修,50-64大修,50以下拒稿),同时输出详细修改路线图。
- Academic Pipeline:流程编排器,将上述三个团队串联成10阶段流水线(从研究、写作、完整性检查、同行评审、修订、最终检查到发表准备)。用户可在任意阶段插入,支持从初稿或审稿意见切入。
关键防错设计
ARS 在底层设计上系统性防止 AI 引起学术不端:
- 引用核验:Deep Research 阶段使用 Semantic Scholar API 做存在性确认,并采用 Levenshtein 相似度算法模糊匹配(阈值 ≥0.70),防止幻觉引用。
- 完整性闸门:在 Stage 2.5 和 Stage 4.5 设置不可跳过检查点,运行基于 2026 年 Nature 论文总结的 7 项 AI 失败模式检查清单(覆盖引用幻觉、数据捏造、方法论造假等)。任何在 2.5 标记为 SUSPECTED 的问题必须在 4.5 变为 CLEAR 或人工覆盖记录。实测在一篇真实论文中抓出 15 个伪造引用和 3 个统计错误。
- 反谄媚协议:审稿团队中的魔鬼代言人负责挑刺,但其反驳评分低于 4 分(1-5 分)时,写作团队不允许承认。攻击强度在修订过程中必须保持,评分轨迹被追踪,防止 AI 讨好用户。
- 三层数据隔离:原始输入(Layer 1)、通过完整性验证后的产物(Layer 2)、评分标准与参考答案(Layer 3)严格隔离。写作团队只接收自然语言反馈,看不到原始评分标准,灵感来自 Anthropic 的 w2s-researcher 研究。
- 诚实文档化:每个产物生成 repro_lock 文件记录运行配置,但强制声明 LLM 输出不是字节级可复现,不保证复现结果。
安装与费用
- 安装:在 Claude Code 中运行两行命令即可安装 skill 包,或直接将 SKILL.md 上传到 claude.ai 项目知识库(仅支持单 Agent 简化版)。
- 支持语言:繁体中文和英文。
- 费用参考:推荐使用 Claude Opus 4.7 + Max 订阅计划(每月 100 或 200 美元)。完整跑完一篇 1.5 万字论文约消费 20 万+ 输入 token 和 10 万+ 输出 token,单独子模块用量更少,整体成本约 4-6 美元。
- 项目作者在更新日志中提交了三百多次 commit(从 2 月上线至今),README 核心哲学:"AI 是你的副驾驶,不是飞行员。"
