law-to-markdown

Solid

将法条/规范文件（.txt/.docx/.pdf）转为 Markdown。适用于用户要求“法条转 markdown”“pdf/docx 转 markdown”。处理 .pdf/.docx 时先检查是否已安装 mineru-ocr skill；未安装先引导安装，安装后优先用 mineru-ocr；仅在用户明确同意时再用本地回退方案。

Data & Documents 4,328 stars 421 forks Updated today

Install

View on GitHub

Quality Score: 83/100

Stars 20%

100

Recency 20%

100

Frontmatter 20%

Documentation 15%

100

Issue Health 10%

License 10%

Description 5%

100

Skill Content

# Law To Markdown ## 处理规则 1. 输入为 `.txt`：直接转存为 `.md`。 2. 输入为 `.pdf` / `.docx`： - 先检查是否已安装 `mineru-ocr` skill。 - 未安装：提示先安装 `mineru-ocr`，安装地址： `https://github.com/cat-xierluo/legal-skills/tree/main/skills/mineru-ocr` - 已安装：优先调用 `mineru-ocr` 处理。 - 调用失败：先提示检查 `mineru-ocr` 配置/Token。 - 仅当用户明确同意时，才使用本地回退（`python-docx` / `pdfplumber`）。 3. 第一阶段完成后默认执行第二阶段格式调整（仅格式，不改原文字符）： - 由调用该 skill 的大模型先判断“法律/非法律”，并把结果传给脚本。 - 若调用方未传结果，则脚本使用硬规则自动识别（`--law-decision auto`）。 - 法律名称 `#` - 编/分编 `##` - 章 `###` - 节 `####` - 条 `#####`（仅“第X条”为标题；`第X条【条标】`整行为标题不拆） - 款/项/目无标题 - 项、目按标记换行 - 清理多余空格：去行尾空格、去行首 ASCII 空格、去正文行首全角缩进、规范标题后的空格 4. 若识别为明显非法律文本（如 GB/标准类文档），第二阶段明确拒绝：`Stage2: rejected (non-law-document)`。 5. 若第二阶段未识别法律结构或保真校验失败，则自动 no-op，不改文本。 6. 默认执行第三阶段检查（双子阶段，硬门槛）： - Stage3-A：校验 `stage2` 相对 `stage1` 的文字内容准确性（去标题符号与空白后字符流必须一致） - Stage3-B：校验结构效果（结构层级、条标题规则、非法律策略、空格规范、项/目换行） - 任一失败触发自动重走，最多 2 次；仍失败默认报错退出 ## 二阶段识别参数 - `--law-decision law`：调用方已判定为法律文本，直接按法律结构优化。 - `--law-decision non-law`：调用方已判定为非法律文本，阶段二直接拒绝。 - `--law-decision auto`：不传判定时的默认模式，使用脚本内硬规则。 ## 三阶段参数 - `--skip-stage3-check`：跳过第三阶段检查（默认不跳过）。 - `--stage3-max-retries`：失败后自动重走次数，默认 `2`。 - `--stage3-strict` / `--no-stage3-strict`： - 默认严格模式（失败即报错退出） - 非严格模式仅输出报告，不阻断流程 - `--artifact-level minimal|standard|debug`： - `minimal`（默认）：面向交付，输出最少 - `standard`：保留过程文件（`stage1/stage2/stage3-check`）便于排查 - `debug`：保留全部过程产物（包含调试信息） ## 输出规则 - 默认输出到输入文件同目录的 `markdown/` 子目录，并按输入文件名创建独立目录： - `mar...

Details

Author: anbeime
Repository: anbeime/skill
Created: 5 months ago
Last Updated: today
Language: Python
License: None

Similar Skills

Semantically similar based on skill content — not just same category

Data & Documents Listed

read-paper

精读并拆解学术论文（以 PDF 为主），自动适配论文类型（理论证明 / 实验方法 / 综述 / 系统）。把一篇或多篇论文整理成一套详细、可教学的分析条目（每个承重结果 / 方法 / 实验一个 markdown 文件）外加一份导航总览：含形式陈述或问题动机、大白话直觉、分步推导或实验解读、非平凡之处、以及它在全局里的角色；公式用规范 LaTeX，关系图用 mermaid、几何图用内联 SVG。当用户要求读论文 / 解读 / 拆解 / 整理 / 分析 / 精读 / summarize / analyze / digest 一篇或多篇论文、PDF、或要把论文变成学习笔记时使用。

0 Updated 1 weeks ago

LuoHaomin

Web & Frontend Listed

cognitive-html-doc

将密集、线性的 Markdown 技术/产品文档重构为认知降维的工业级单文件 HTML 文档。核心目标是让读者 3 秒抓核心、30 秒理解全貌、3 分钟查到细节。使用此 skill 当用户：把 markdown 转成 HTML、要求做"漂亮的 HTML 文档"、要求"工业级 HTML"、要"技术文档可视化"、给一份 markdown 蓝图要 HTML 化、需要带 TOC/Mermaid 图表/卡片设计的长文档、提到"降低认知负荷"或"扫视即可获取"。即使没明说"HTML 文档"，只要涉及把密集文字降维成结构化、可扫读的形态，就用此 skill。不要用于简单 markdown 渲染（一行命令即可）或纯打印样式 PDF。

0 Updated 4 days ago

beihai23

Data & Documents Featured

mineru-pdf-parser

用 MinerU 将复杂PDF文档转换为LLM友好的Markdown/JSON格式。适用于：(1) PDF转Markdown/JSON，(2) 提取PDF中的文本、表格、公式、图像，(3) 解析学术论文、技术文档、商业报告，(4) 为RAG应用准备文档数据，(5) 批量处理PDF。触发关键词："PDF解析"、"PDF转Markdown"、"提取PDF表格/公式"、"MinerU"、"parse PDF"等。不用于：PDF的阅读/填表/签名/拆分合并（用宿主pdf工具）、Word/PPT等非PDF格式解析、只需读几页内容的场景（直接读即可，不必转换）。

631 Updated 1 weeks ago

staruhub