← ClaudeAtlas

local-rag-builderlisted

本地 RAG 系统搭建技能,支持环境检测修复、嵌入模型多源下载、5种切分策略 + GuardStack + 后处理 + 插件注册、多知识库管理 + 自动分类规则、可调 Prompt、Web 可视化配置 + 极客模式 + 模板管理
Ldxs001/workbuddy-skills · ★ 1 · AI & Automation · score 78
Install: claude install-skill Ldxs001/workbuddy-skills
# local-rag-builder(本地 RAG 搭建工具) 一站式本地 RAG 系统搭建工具。支持环境自动检测修复、嵌入模型多源下载、5 种切分策略 + GuardStack 守卫栈 + 后处理子切 + 插件注册、多知识库管理与自动分类规则、可调 Prompt、Web 可视化配置。 **两种运行模式:** - **🔌 集成模式(默认)** — 纯检索,不调用 LLM。智能体(xxxx 等)根据检索到的 context 自行回答。无需配置 LLM,无额外推理成本。 - **🤖 独立模式** — 检索 + LLM 全链路。`rag_standalone.py` 直接调用外部 LLM(LM Studio / Ollama / vLLM)完成回答,不经过智能体。用户自行选择平台和模型。 > **工作流说明(以下 xxxx 代指任意智能体):** > > **集成模式:** > 1. 你把文档/链接给 xxxx → xxxx 调用 `rag_skill.py` 向量化入库 > 2. 你提问 → xxxx 调用 `rag_skill.py --query "..."` 检索知识库 > 3. xxxx 根据检索到的 context 组织回答 > > **独立模式:** > 1. 你把文档/链接给 xxxx → xxxx 调用 `rag_standalone.py --import-file <path>` 入库 > 2. 你提问 → xxxx 调用 `rag_standalone.py --query "..."` > 3. `rag_standalone.py` 自行检索知识库 → 调用本地 LLM → 输出回答 > 4. xxxx 仅透传结果,不参与推理 ## 触发场景 - **搭建 RAG** — "帮我搭一个本地 RAG 系统" - **环境检测** — "检查我的 Python 环境能否跑 RAG" - **下载模型** — "下载一个嵌入模型" / "换个模型源重试" - **切分文档** — "对这个 Markdown 文件做层级切分" - **向量检索** — "把这份资料入库,搜索相似内容" - **知识库管理** — "创建一个知识库" / "把这类资料存入指定库" - **调整参数** — "更新切分参数" / "改 Prompt 模板" - **智能体集成** — "根据这份资料回答:xxx"(智能体调用 skill 的集成模式) - **不触发**:纯 LLM 聊天不需要检索、简单问答不需要外部资料 ## 核心能力 > 📚 **渐进式加载**:本技能采用渐进式 MD 体系,`SKILL.md` 为入口(≤230行),详细内容拆分到 `references/*.md` 按需加载。 | # | 能力 | 说明 | |---|------|------| | 1 | **环境自动检测修复** | 检测 Python 版本(需 3.8-3.11)、缺失包,自动创建虚拟环境安装 | | 2 | **嵌入模型管理** | 多源下载(ModelScope / HuggingFace 镜像 / 官方 / LLM 找源),自动重试,完整性校验,路径修正 | | 3 | **5 种切分策略 + GuardStack + 后处理** | 固定窗口、递归切、层级/标题切、按句切、语义切;守卫栈(mermaid/代码块/公式/表格/HTML 保护);后处理子切(递归/固定/语义,metadata 白名单继承) | | 4 | **