voice-changerlisted

音频变声处理工具 - 使用 RVC AI 模型进行真实的声音转换
frank-syncmarket/skills · ★ 3 · AI & Automation · score 68

Install: claude install-skill frank-syncmarket/skills

# voice-changer Skill ## 概述 voice-changer 是一个音频变声处理 skill，使用 RVC AI 模型进行真实的音色转换（不只是音高调整）。 ## 功能特性 - 🎙️ **RVC AI 模型** - 真实的音色转换 - ⚡ **自动分块处理** - 长音频自动分块，避免内存问题 - 🔧 **灵活配置** - 支持多种声音预设和自定义参数 - 🎯 **简单易用**: 命令行一键调用 - 🔌 **可被调用** - 可被其他 skills 集成调用 ## 技术方案 ### 当前实现: RVC 方法（AI 模型） **优点:** - 真实的音色转换（不只是音高调整） - 音质自然，效果更好 - 可以真正"克隆"声音 - 支持跨语言 **原理:** 使用 HuBERT 特征提取 + RVC 模型推理： 1. HuBERT 提取音频特征 2. F0 提取基频 3. RVC 模型进行声音转换 4. 长音频自动分块处理 **适用场景:** - 高质量变声需求 - 需要真实音色转换 - 播客、配音等场景 ## 目录结构 ``` voice-changer/ ├── SKILL.md # 本文档 ├── README.md # 使用说明 ├── scripts/ │ └── voice_change.py # 核心变声脚本 ├── config/ │ └── voice_config.json # 声音配置文件 └── models/ # RVC 模型目录 ├── rvc_env_310/ # Python 3.10 环境 ├── rvc_core/ # RVC 核心代码 └── rvc_models/ # RVC 模型文件 ``` ## 依赖要求 ### 必需依赖 - Python 3.10（RVC 兼容性） - FFmpeg 4.0+ - FFprobe ### Python 依赖（已包含在 rvc_env_310/） - torch==2.5.1 - fairseq==0.12.2 - librosa - soundfile - pyworld - parselmouth - faiss-cpu - torchcrepe - pedalboard ## 配置说明 ### voice_config.json 结构 ```json { "method": "rvc", "rvc_model_path": "models/rvc_models/trained_models/kohane.pth", "default_voice": "female_3", "voices": { "female_3": { "name": "女声（甜美）", "method": "rvc", "model_path": "...kohane.pth", "index_path": "...kohane.index", "f0up_key": -1, "f0_method": "harvest" } } } ``` ### 参数说明 - `method`: 处理方法（`rvc` 或 `pedalboard`） - `f0up_key`: 音高调整（