audiocut-keywordlisted

音频关键字过滤工具 - 根据关键字配置自动识别并删除音频中的指定内容
frank-syncmarket/skills · ★ 3 · Data & Documents · score 68

Install: claude install-skill frank-syncmarket/skills

# 音频关键字过滤工具 > 基于 FunASR 语音识别和 FFmpeg 剪辑的音频关键字过滤 Skill ## 功能特性 - **精确转录**: 使用 FunASR Paraformer 进行 30s 分段转录，获取字符级时间戳 - **关键字识别**: 根据配置文件自动识别音频中的关键字 - **智能剪辑**: 使用 FFmpeg 精确删除关键字片段并合成最终音频 - **可配置**: 支持自定义关键字列表和缓冲时间 ## 使用场景 1. **YouTube 转播客**: 删除视频中的"关注"、"订阅"、"点赞"等引导语 2. **广告过滤**: 自动删除音频中的广告和推广内容 3. **内容清理**: 批量处理音频，删除不需要的关键字片段 ## 快速开始 ### 基本用法 ```bash python3 ~/.claude/skills/audiocut-keyword/scripts/audiocut_keyword.py <音频文件> ``` ### 指定输出文件 ```bash python3 ~/.claude/skills/audiocut-keyword/scripts/audiocut_keyword.py \ input.mp3 \ -o output.mp3 ``` ### 使用自定义关键字配置 ```bash python3 ~/.claude/skills/audiocut-keyword/scripts/audiocut_keyword.py \ input.mp3 \ -k my_keywords.json ``` ### 调整缓冲时间 ```bash python3 ~/.claude/skills/audiocut-keyword/scripts/audiocut_keyword.py \ input.mp3 \ --buffer-before 1.0 \ --buffer-after 1.0 ``` ## 工作流程 ``` 1. 音频转录（FunASR 30s 分段） ↓ 2. 加载关键字配置 ↓ 3. 查找关键字位置（字符级时间戳） ↓ 4. 生成删除计划（合并重叠片段） ↓ 5. FFmpeg 剪辑并合成 ↓ 6. 输出处理后的音频 ``` ## 关键字配置文件配置文件位于: `~/.claude/skills/audiocut-keyword/config/keywords.json` ```json { "keywords": [ "广告", "赞助", "推广", "关注", "订阅", "点赞", "转发", "分享", "评论区", "链接在简介", "微信公众号", "小程序" ], "buffer_before": 0.5, "buffer_after": 0.5, "description": "关键字配置文件" } ``` ### 配置说明 - `keywords`: 关键字列表，支持中文和英文 - `buffer_before`: 删除前缓冲时间（秒），避免删除不完整 - `buffer_after`: 删除后缓冲时间（秒），避免删除不完整 ## 技术实现 ### 1. 音频转录使用 FunASR Paraformer 模型进行 30s 分段转录： - **模型