← ClaudeAtlas

getbiblisted

用低幻觉工作流为一篇或多篇学术论文获取可靠的 BibTeX。当用户提供论文标题和可选作者信息,并希望得到:(1) 带理由的权威候选链接,(2) 通过浏览器实际获取而不是猜测生成的 BibTeX,(3) 类似 bib_link_candidates.md 这样的可审阅过程文档,或 (4) 多篇论文的批量 BibTeX 收集结果时,应使用此 skill。
shilong20/getbib · ★ 13 · Data & Documents · score 67
Install: claude install-skill shilong20/getbib
# Getbib ## 概述 使用这个 skill,可以把论文标题转成一条可审阅的引用获取工作流: 1. 使用 agent 自带的 web search 工具为每篇论文找到最可靠的发表链接。如果用户配置了 `config.json`,也可以使用内置的 Grok 搜索脚本代替。 2. 使用由 Playwright 驱动的浏览器提取流程,从推荐链接或其站点内可推导的元数据路径中获取 BibTeX。 3. 将中间审阅文档和最终 BibTeX 文件都写入磁盘。 当用户希望尽量降低文献引用幻觉风险,并愿意在信任最终 BibTeX 之前先检查中间文档时,优先使用这个 skill。 ## 工作流 ### 1. 收集输入 支持以下输入形式: - 单篇论文: - 仅 `title` - `title + author` - 批量论文: - 在 prompt 中重复给出多个标题 - 带 `title` 和可选 `author` 列的 `csv` / `tsv` - 形如 `{title, author}` 数组的 `json` / `jsonl` - 每行一个标题,或使用 `title<TAB>author` 格式的 `txt` 如果用户没有提供批量输入文件,就根据对话内容隐式构造输入,并用重复的 `--title` 和可选的 `--author` 调用脚本。 ### 2. 搜索链接 默认使用 agent 自带的 web search 工具为每篇论文搜索最合适的发表链接。搜索时遵循来源路由章节中的优先级。 如果项目根目录下存在 `config.json`(Grok 或其他 OpenAI 兼容搜索 API 配置),则改用内置的 `scripts/grok_search.py` 自动搜索,无需 agent 手动搜索。`config.json` 中的 `base_url` 支持填写任何 OpenAI 兼容端点(不限于 Grok)。 两种搜索方式的结果都需要整理为链接 JSON 格式: ```json [ {"title": "Attention Is All You Need", "url": "https://dblp.org/rec/conf/nips/VaswaniSPUJGKP17.html"}, {"title": "BERT", "url": "https://openreview.net/forum?id=..."} ] ``` ### 3. 运行编排脚本 默认模式(agent 自行搜索链接后调用): `python3 scripts/getbib.py --title "Paper Title" --links-json links.json` Grok 模式(有 `config.json`): `python3 scripts/getbib.py --title "Paper Title" [--author "Author Name"]` 批量模式: `python3 scripts/getbib.py --input papers.csv [--links-json links.json]` 常用选项: - `--output-dir <dir>`:将所有输出写入指定目录 - `--links-json <file>`:使用预先准备好的链接 JSON,跳过 Grok 搜索 - `--mode links`:只生成可审阅的链接文档(仅在 Grok 模式下有意义) - `--m