legal-fact-checkerlisted
Install: claude install-skill prasti8527/legal-ai-skills
# Legal Fact Checker — 法律产出事实核查技能
## 核心原则
**一切法律产出必须有事实依据。禁止编纂案例、法规或事实。**
本技能在法律相关任务中强制执行三道防线:
1. 用户材料锚定——优先核对用户放在任务文件夹里的法规、案例、PDF、网页截图、数据库结果和 Word 文档
2. 可用时回源——有北大法宝 MCP 或网页权限时再做回源核验;没有权限时标 `[待补: 来源]`,不得声称已验证
3. 无据声明——提交前自检,单独输出无据内容清单
---
## 工作流程
### 阶段一:文档转换与锚定(Document Anchoring)
当用户提供包含 PDF 或 Word 文件的文件夹时:
1. **扫描文件夹**:识别所有 `.pdf`、`.docx`、`.doc` 文件
2. **逐个转换**:
- PDF 文件 → **优先使用 `markitdown`**(对长文档更可靠,不易截断);如需版面还原则用 `PaddleOCR Document Parsing` 补充
- Word 文件 → 使用 `docx` 或 `Docx Cn` skill 转为 Markdown
3. **⚠️ 转换完整性验证(强制)**:转换完成后必须执行以下检查,**不得跳过**:
- **章节覆盖检查**:提取 MD 中所有章节标题(`## Chapter`、`## 第X章`等),与 PDF 目录页对照,确认最后一章在 MD 中存在
- **长度合理性检查**:如果 MD 长度明显偏短(如只有预期的 60%),必须怀疑截断,用 markitdown 交叉验证
- **关键词锚定检查**:如果用户问的是特定内容,搜索该内容是否在 MD 中出现;**搜索未命中时,先怀疑解析不完整,再怀疑原文确实没有**
- **双工具交叉验证**:长 PDF(>30页)必须同时用 markitdown 和 PaddleOCR 转换,取内容更完整的版本
4. **保留引用位置**:转换后的 Markdown 必须标注原文出处位置(页码、段落号、章节标题),格式示例:
```
<!-- 来源:某某判决书.pdf 第3页 -->
原告[当事人A]于[日期]通过[交易/行为]取得[标的物]……
```
5. **存储转换结果**:将所有转换后的 MD 文件存放在工作目录的 `_source_md/` 子文件夹中
6. **锚定声明**:在后续所有工作中,凡引用文件夹内容,必须能在 `_source_md/` 中找到对应原文。**不得凭记忆或推测补充细节。**
> ⚠️ 如果文档转换失败或内容不完整,必须明确告知用户哪些部分未能转换,不得跳过此步骤直接开始写作。
>
> 🚫 **绝对禁止**:在未验证转换完整性的情况下,基于不完整的转换结果下"原文没有"的结论。这是已发生过的严重错误(2026-04-26:PaddleOCR 丢失 PDF 后半部分,直接得出"Outline 不含 Chapter 7-9"的错误结论)。
### 阶段二:内容撰写与引用纪律
在撰写法律文件时:
1. **严格引用**:所有事实陈述必须可追溯到 `_source_md/` 中的原文、用户提供的数据库/网页材料,或经可用 PKULaw MCP/网页回源的来源
2. **案例引用规则**:
- 案号必须完整准确(如 `(20XX)XX民初XXXXX号`)
- 当事人姓名必须与原文一致
-