text-to-speechlisted
Install: claude install-skill frank-syncmarket/skills
# Text-to-Speech Skill
将文本转换为语音,支持播客脚本解析、情绪标记处理和 voice-changer 后处理。
## 使用说明
当用户请求将文本转换为语音时,使用以下命令:
```bash
# 基本用法
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py <文本文件>
# 指定输出文件
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -o output.mp3
# 指定声音
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -v zh-CN-XiaoxiaoNeural
# 启用后处理(voice-changer)
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --post-process
# 列出所有可用声音
python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py --list-voices
```
## 核心功能
### 1. 脚本解析
自动识别并移除播客脚本中的注释和标记:
- 时间戳:`(00:00)`
- BGM 注释:`[BGM渐入:...]`
- 舞台指示:`(主播声音:...)` `(停顿 1秒)`
- 情绪标记:`(语速放慢,加重语气)`
- Markdown 标记:`**文本**`
### 2. 多种声音支持
支持 18+ 种中文声音,包括:
- **男声**:YunyangNeural(新闻播音)、YunxiNeural(年轻活力)、YunjianNeural(成熟稳重)
- **女声**:XiaoxiaoNeural(温柔亲切)、XiaoyiNeural(活泼开朗)、XiaoyanNeural(新闻播音)
### 3. 语音参数调整
- 语速调整:`--rate "+20%"` 或 `--rate "-10%"`
- 音调调整:`--pitch "+5Hz"` 或 `--pitch "-3Hz"`
- 音量调整:`--volume "+20%"` 或 `--volume "-10%"`
### 4. 后处理集成
可选集成 voice-changer skill 进行变声处理。
## 配置文件
配置文件位于:`~/.claude/skills/text-to-speech/config/tts_config.json`
### 主要配置项
```json
{
"edge_tts": {
"voice": "zh-CN-YunyangNeural",
"rate": "+0%",
"pitch": "+0Hz",
"volume": "+0%"
},
"script_parsing": {
"enabled": true,
"remove_timestamps": true,
"remove_bgm_notes": true,
"remove_stage_directions": true,
"remove_markdow