voice-changerlisted
Install: claude install-skill frank-syncmarket/skills
# voice-changer Skill
## 概述
voice-changer 是一个音频变声处理 skill,使用 RVC AI 模型进行真实的音色转换(不只是音高调整)。
## 功能特性
- 🎙️ **RVC AI 模型** - 真实的音色转换
- ⚡ **自动分块处理** - 长音频自动分块,避免内存问题
- 🔧 **灵活配置** - 支持多种声音预设和自定义参数
- 🎯 **简单易用**: 命令行一键调用
- 🔌 **可被调用** - 可被其他 skills 集成调用
## 技术方案
### 当前实现: RVC 方法(AI 模型)
**优点:**
- 真实的音色转换(不只是音高调整)
- 音质自然,效果更好
- 可以真正"克隆"声音
- 支持跨语言
**原理:**
使用 HuBERT 特征提取 + RVC 模型推理:
1. HuBERT 提取音频特征
2. F0 提取基频
3. RVC 模型进行声音转换
4. 长音频自动分块处理
**适用场景:**
- 高质量变声需求
- 需要真实音色转换
- 播客、配音等场景
## 目录结构
```
voice-changer/
├── SKILL.md # 本文档
├── README.md # 使用说明
├── scripts/
│ └── voice_change.py # 核心变声脚本
├── config/
│ └── voice_config.json # 声音配置文件
└── models/ # RVC 模型目录
├── rvc_env_310/ # Python 3.10 环境
├── rvc_core/ # RVC 核心代码
└── rvc_models/ # RVC 模型文件
```
## 依赖要求
### 必需依赖
- Python 3.10(RVC 兼容性)
- FFmpeg 4.0+
- FFprobe
### Python 依赖(已包含在 rvc_env_310/)
- torch==2.5.1
- fairseq==0.12.2
- librosa
- soundfile
- pyworld
- parselmouth
- faiss-cpu
- torchcrepe
- pedalboard
## 配置说明
### voice_config.json 结构
```json
{
"method": "rvc",
"rvc_model_path": "models/rvc_models/trained_models/kohane.pth",
"default_voice": "female_3",
"voices": {
"female_3": {
"name": "女声(甜美)",
"method": "rvc",
"model_path": "...kohane.pth",
"index_path": "...kohane.index",
"f0up_key": -1,
"f0_method": "harvest"
}
}
}
```
### 参数说明
- `method`: 处理方法(`rvc` 或 `pedalboard`)
- `f0up_key`: 音高调整(