不是不能写,只是这流程太碎、磨人。
一个研究想法从冒出来,到真正变成一篇可以投稿的论文,中间要经历找方向、拆研究问题、查文献、筛文献、做综述、搭论文结构、整理引用、补图表、改格式,最后还要面对审稿意见,一轮轮修改、回复、再提交。
更现实的是,这些事很多时候并没有人能陪你完整走一遍。
同事有自己的项目要忙,师兄师姐也不一定有时间逐段帮你看。指导教授更不用说,能在关键节点给方向已经很不错了,很难真的从研究问题、文献证据、方法设计、论证逻辑到引用细节,把你的论文从头到尾认真审一遍。
所以很多论文在正式投稿前,其实从来没有被真正“审稿”过。
它可能只是被自己改了很多遍,被导师快速扫过一遍,被同门简单提了几个建议,然后就带着一堆潜在问题进入投稿系统。
AI 出现之后,学术写作似乎一下子变快了。
它可以帮你查资料、写摘要、扩展段落、润色语言,甚至还能模拟审稿人提出修改建议。
表面看,科研终于有了一个全天候在线的“学术助理”,不嫌你问题多,不嫌你反复改,也随时能陪你把一篇论文从头看到尾。
但问题也在这里。
AI 能把一段话写得很像论文,却不一定真的理解这篇论文;它能生成一串格式正确的参考文献,却不代表这些文献真实存在;它能把一个观点写得非常坚定,却不代表原始文献真的支持这个观点。
更危险的是,这些错误往往不是一眼就能看出来的,它们会被包裹在流畅的学术表达里,看起来严谨、完整、甚至很有说服力。
论文《LLM hallucinations in the wild: Large-scale evidence from non-existent citations》就给出了一个很刺眼的信号。
论文链接:
https://arxiv.org/pdf/2605.07723
论文作者审计了 arXiv、bioRxiv、SSRN、PubMed Central 上 250 万篇论文中的 1.11 亿条引用,保守估计,仅在 2025 年就出现了 146932 条幻觉引用。
更麻烦的是,这些问题并不会止步于预印本。
论文作者追踪了 2241 篇包含异常引用的 bioRxiv 预印本,查看它们进入 PubMed Central 后的正式发表版本。结果发现,预印本中已经出现的幻觉引用,有 85.3% 仍然“存活”到了正式发表记录里。
也就是说,一旦错误引用混进研究流程,它很可能并不会在投稿、审稿、出版环节被自动清除,反而会一路留下来,成为正式学术记录的一部分。
而这篇论文还提醒了一个更难解决的问题,不存在的引用,其实是最容易被发现的一类幻觉。真正隐蔽、常见的风险,是引用本身是真的,但它被用来支撑了原文并没有提出过的主张。
这才是今天学术 AI 工具真正危险的地方。
今天要给大家分享的开源项目 Academic Research Skills(ARS),正是瞄准这类问题而来。目前,该项目在 GitHub 已收获 26k Star。
项目链接:
https://github.com/Imbad0202/academic-research-skills
它是一套面向 Claude Code 的学术研究技能包,覆盖从研究规划、文献调研、论文撰写、引用核查、同行评审模拟、修订回复,到最终出版输出的全流程。它真正想做的,不只是让 AI 帮忙写论文,而是把 AI 参与学术研究这件事,变成一个有流程、检查点、审稿机制、诚信闸门的工程系统。
01
从查文献到模拟审稿,
ARS 把 Claude Code 变成科研搭子
ARS 本质上是为 Claude Code 打造的一套学术研究技能套件,它将完整的研究-发表流程拆解为结构化 pipeline。
研究者无需反复提示 Claude Code 查文献、写大纲、审论文、改格式,而是可以让它按照明确的学术工作流推进,同时保留人工决策权。
(1)Deep Research 技能
在研究阶段,Deep Research 技能承担“把问题真正想清楚”的核心任务。它不是简单的文献搜索+摘要的流程,而是围绕研究问题澄清、研究架构设计、系统化文献检索、来源验证、证据综合、偏差风险评估、伦理审查等环节展开多智能体协作( 13 个专项 agent)。
许多论文写不下去,并非因为不会组织句子,而是因为初始研究问题过于宽泛且未被充分澄清。
例如“AI 对教育有什么影响”是一个宏大话题,无法直接成文。ARS 通过苏格拉底式对话(Socratic mode)不断收窄问题,帮助用户明确研究对象、理论框架、方法路径和证据边界。它更像一位严谨的研究助教,而非代写工具。
(2)Academic Paper 技能
进入论文撰写阶段后,Academic Paper 技能(有 12 个 agent)会基于前序产出的研究问题、方法蓝图、注释书目和综合报告,进一步形成论文结构。
它支持完整撰写、论文规划、大纲生成、修订、摘要撰写、文献综述、格式转换、引用检查和 AI 使用声明等多种模式。支持LaTeX/DOCX-via-Pandoc/PDF 输出。
(3)Academic Paper Reviewer 技能
Academic Paper Reviewer 是另一个独立技能,通过 7 个 agent 模拟同行评审流程。
第一轮会生成 5 份评审报告,包括主编(EIC)、方法论审稿人、领域审稿人、跨学科审稿人和魔鬼辩护人(Devil’s Advocate )的意见。采用 0-100 质量量表,并给出接受、小修、大修、退稿等编辑决策,同时生成详细的修订路线图。
这一设计特别关键。传统 AI 写作工具擅长生成初稿,却难以“反对自己”。一旦顺着某个框架写下去,模型容易默认框架成立,甚至持续强化潜在问题。
ARS 通过魔鬼辩护人、让步阈值协议、攻击强度保持等机制,让 AI 扮演能提出反对意见的审稿人,而非一味迎合用户的写手。
(4)Academic Pipeline 技能
将所有环节真正串联起来的是 Academic Pipeline 技能,它将流程拆分为:研究 → 撰写 → 完整性检查 → 评审 → 修改 → 复审 → 再次修改 → 最终完整性检查→ 定稿。
每个阶段结束都需要用户确认 checkpoint,其中 Stage 2.5 和 Stage 4.5 是强制学术诚信闸门(先机器验证,再用户确认报告,不可跳过)。
这种设计的价值在于,它不把 AI 当成“全自动论文工厂”,而是嵌入一套带有显性检查点和 human-in-the-loop 的协作流程,研究者始终掌握最终决策权,AI 则在每个关键节点主动提醒。
在引用与事实核查上,ARS 支持 Semantic Scholar API 验证、来源 provenance、claim-level audit 等增强功能。目标不是让 AI 输出“更像人”,而是让 AI 的参与过程更透明、可验证。
总而言之,ARS 不是帮助规避 AI 痕迹的 humanizer,而是一个真正以学术诚信优先的研究协作操作系统。它承认大模型可能出现的幻觉、谄媚或固定框架,并通过多层审查、强制闸门和人工确认点,将这些风险显性化并系统性降低。
02
安装教程
对于 Claude Code CLI、VS Code 扩展或 JetBrains 扩展用户,推荐使用 Plugin 方式安装。
/plugin marketplace add Imbad0202/academic-research-skills/plugin install academic-research-skills
/ars-plan/ars-lit-review "你的研究主题".claude/skills/ 目录下。https://github.com/Imbad0202/academic-research-skills/blob/main/docs/SETUP.md
03
ARS 让更多人拥有
“被认真带一遍”的科研训练
过去,一个研究新人要靠导师反复带,才能慢慢理解什么叫研究问题,什么叫方法论一致,什么叫审稿人视角。
但导师时间有限。
很多时候,学生真正缺的不是灵感,而是一个能陪他反复追问、不断反馈、帮他检查低级错误的研究环境。
ARS 这种工具,至少给了一个雏形。
它不能替代导师,但它可以让更多人提前接触到一套相对完整的研究流程。不是只学会写一篇论文,而是学会论文是怎么被构思、验证、质疑、修订、格式化和记录下来的。
这才是它最值得关注的地方。
AI 进入学术研究,不应该只是让论文数量暴涨。真正有价值的方向,是让研究者把精力从重复劳动里解放出来,把注意力重新放回问题本身。
也让那些过去只有少数人能获得的研究训练、审稿视角、流程化质量控制,被更多普通研究者摸到一点边。
当然,工具只是工具,论文最终写得好不好,研究有没有价值,引用是否诚实,方法是否可靠,责任仍然在作者身上。
但如果你正在用 Claude Code,又刚好有论文、综述、研究报告、投稿修订这些需求,这个项目确实值得认真看一下。
它不是帮你作弊的捷径,更像是一套把你拉回学术规范里的脚手架,这也是 AI 科研工具接下来最该走的方向。