getbiblisted
Install: claude install-skill shilong20/getbib
# Getbib
## 概述
使用这个 skill,可以把论文标题转成一条可审阅的引用获取工作流:
1. 使用 agent 自带的 web search 工具为每篇论文找到最可靠的发表链接。如果用户配置了 `config.json`,也可以使用内置的 Grok 搜索脚本代替。
2. 使用由 Playwright 驱动的浏览器提取流程,从推荐链接或其站点内可推导的元数据路径中获取 BibTeX。
3. 将中间审阅文档和最终 BibTeX 文件都写入磁盘。
当用户希望尽量降低文献引用幻觉风险,并愿意在信任最终 BibTeX 之前先检查中间文档时,优先使用这个 skill。
## 工作流
### 1. 收集输入
支持以下输入形式:
- 单篇论文:
- 仅 `title`
- `title + author`
- 批量论文:
- 在 prompt 中重复给出多个标题
- 带 `title` 和可选 `author` 列的 `csv` / `tsv`
- 形如 `{title, author}` 数组的 `json` / `jsonl`
- 每行一个标题,或使用 `title<TAB>author` 格式的 `txt`
如果用户没有提供批量输入文件,就根据对话内容隐式构造输入,并用重复的 `--title` 和可选的 `--author` 调用脚本。
### 2. 搜索链接
默认使用 agent 自带的 web search 工具为每篇论文搜索最合适的发表链接。搜索时遵循来源路由章节中的优先级。
如果项目根目录下存在 `config.json`(Grok 或其他 OpenAI 兼容搜索 API 配置),则改用内置的 `scripts/grok_search.py` 自动搜索,无需 agent 手动搜索。`config.json` 中的 `base_url` 支持填写任何 OpenAI 兼容端点(不限于 Grok)。
两种搜索方式的结果都需要整理为链接 JSON 格式:
```json
[
{"title": "Attention Is All You Need", "url": "https://dblp.org/rec/conf/nips/VaswaniSPUJGKP17.html"},
{"title": "BERT", "url": "https://openreview.net/forum?id=..."}
]
```
### 3. 运行编排脚本
默认模式(agent 自行搜索链接后调用):
`python3 scripts/getbib.py --title "Paper Title" --links-json links.json`
Grok 模式(有 `config.json`):
`python3 scripts/getbib.py --title "Paper Title" [--author "Author Name"]`
批量模式:
`python3 scripts/getbib.py --input papers.csv [--links-json links.json]`
常用选项:
- `--output-dir <dir>`:将所有输出写入指定目录
- `--links-json <file>`:使用预先准备好的链接 JSON,跳过 Grok 搜索
- `--mode links`:只生成可审阅的链接文档(仅在 Grok 模式下有意义)
- `--m