mineru-locallisted
Install: claude install-skill LeoLin990405/grimoire-skill
# MinerU 双通道:本地 + mineru.net 云端
> **配置(bundled into grimoire-skill)**:本地服务地址由环境变量
> `MINERU_LOCAL_URL` 指定,默认 `http://127.0.0.1:8010`。原作者用的是内网
> tailnet 主机,移植进本仓库时已脱敏为 localhost 默认值 + 可配置变量。
> 自己机器上:`export MINERU_LOCAL_URL=http://<你的-mineru-host>:8010`;
> 无本地服务时自动回落 mineru.net 云端(需 `~/.config/mineru/token`)。
## 服务架构
```
客户端
├── 默认/auto + 文件输入 + local 在线
│ → curl POST ${MINERU_LOCAL_URL:-http://127.0.0.1:8010}/file_parse
│ → M5 mbp mineru-api 3.1.4 (launchd KeepAlive)
│ → pipeline / vlm-transformers 后端(Apple Silicon MPS)
│
└── URL 输入 / --cloud / --format / auto+local 挂
→ ~/.claude/skills/mineru/scripts/mineru-parse.sh
→ POST https://mineru.net/api/v4/extract/task (Bearer JWT)
→ 异步轮询 → ZIP 下载 → 解压拿 .md + images + JSON
```
**helper**:`~/bin/pdf2md`(已 chmod +x)— 自动路由 local / cloud
**Token**:`~/.config/mineru/token`(exp 2026-05-28,到期前提示重新申请)
## 触发场景
用户提到下面任意一条 → 立即用本 skill:
- "把这个 PDF 转成 Markdown"
- "解析这个 PDF"
- "PDF to Markdown"
- "pdf2md"
- "用 mineru 本地解析"
- "提取 PDF 文字 / 表格 / 公式"
- "OCR 这个扫描件"
**不要走 cloud API**(旧 `mineru` skill 是 cloud 的,已不推荐 — token 收费、600 页限制、数据出机)。
## 通道速览
| 通道 | 配额 | 单文件上限 | 速度(暖态)| 鉴权 | 状态 |
|---|---|---|---|---|---|
| **local M5** | 无 | 无 | 1-3s | 无 | ✅ |
| **cloud `/api/v4`** | 1k 高优页/天 | **200 页** / 200MB | 10-30s | Bearer JWT | ✅ |
| ~~web (Playwright)~~ | 5k 页/天 独立池 | 600 页 | 30-90s | session cookie | ⚠️ EXPERIMENTAL(runtime 调试中,见 mineru-web skill)|
## 决策表(自动路由)
| 用户给的输入 / 需求 | 路由到 | 命令 |
|--