scholar-agentlisted
Install: claude install-skill zfy465914233/scholar-agent
# Scholar-Agent
## 适用场景
- 搜索论文、找 benchmark 或 baseline
- 编写文献综述、related work、survey 或阅读清单
- 比较方法、归纳研究脉络、制定研究方向
- 补单篇或批量论文笔记,并要求结果可验收、可追溯
## 核心原则
- 目标是交付可验收产物,不是“调用过工具”或“落了一个 md 文件”。
- 默认 fail-closed。命中 skeleton、placeholder、路径漂移、元数据缺失或结构不达标时,必须显式失败。
- 默认 canary-first。新流程、新模板、新输入策略先做 1 篇样例,通过后再批量。
- 默认 staging-first。论文 note 先写 staging,再验证,再 promote 到正式目录。
- 不允许静默降级为快速摘要、模板骨架或占位笔记;若用户只要快速概览,必须显式声明这不是完整 scholar 流程。
## 状态机流程
1. Scope Contract
- 明确任务类型:找论文、单篇 note、批量 note、综述、研究规划。
- 明确交付标准:完整论文笔记、快速概览、综述卡片,或其中组合。
- 若需求含糊,先澄清,不自行压缩或扩张范围。
2. Inventory
- 先枚举目标论文集合,并记录最少身份信息:title、authors、year、paper id、source type、existing note status。
- 对批量任务,先给出计划中的核心论文集合,再进入生成。
3. Metadata Gate
- 生成完整论文笔记前,至少满足以下最低输入契约之一:
- `abstract` 或 `summary`
- 本地 `pdf_path`
- 可解析的 `arxiv_id` 或等价稳定 paper id
- 若只有 title 和 authors,不允许直接进入完整 note 生成。
- 对批量任务,缺 metadata 的论文进入 blocked 列表,不得混入 batch generation。
4. Canary Generation
- 每次新任务先只生成 1 篇样例。
- 输出必须先写到 staging 目录,例如 `paper-notes/.staging/<job-id>/`。
- 生成后必须运行 `scripts/validate_note.py`;未通过前不得继续批量。
5. Batch Generation
- 仅当 canary 通过验证时,才允许批量执行。
- 批量中每篇都必须独立验证,不允许因为前一篇通过就跳过后续校验。
6. Validation
- 验证是硬门,不是建议。至少检查:
- skeleton / placeholder / duplicated frontmatter
- 核心 section 是否存在且有实质内容
- `unknown` 等占位值是否进入正式内容
- 关键结论是否带有最小证据锚点或可回溯 source id
- 路径是否符合 canonical policy
- 推荐使用:
- 严格校验:`python scripts/validate_note.py --note <path> --paper-type <type> --require-frontmatter --require-evidence --dataset-policy required`
- 有条件回退:`python scripts/validate_no