text-to-speechlisted

文本转语音工具 - 支持脚本解析、情绪标记和后处理，基于 Edge TTS
frank-syncmarket/skills · ★ 3 · AI & Automation · score 68

Install: claude install-skill frank-syncmarket/skills

# Text-to-Speech Skill 将文本转换为语音，支持播客脚本解析、情绪标记处理和 voice-changer 后处理。 ## 使用说明当用户请求将文本转换为语音时，使用以下命令： ```bash # 基本用法 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py <文本文件> # 指定输出文件 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -o output.mp3 # 指定声音 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt -v zh-CN-XiaoxiaoNeural # 启用后处理（voice-changer） python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py script.txt --post-process # 列出所有可用声音 python3 ~/.claude/skills/text-to-speech/scripts/text_to_speech.py --list-voices ``` ## 核心功能 ### 1. 脚本解析自动识别并移除播客脚本中的注释和标记： - 时间戳：`(00:00)` - BGM 注释：`[BGM渐入：...]` - 舞台指示：`(主播声音：...)` `(停顿 1秒)` - 情绪标记：`(语速放慢，加重语气)` - Markdown 标记：`**文本**` ### 2. 多种声音支持支持 18+ 种中文声音，包括： - **男声**：YunyangNeural（新闻播音）、YunxiNeural（年轻活力）、YunjianNeural（成熟稳重） - **女声**：XiaoxiaoNeural（温柔亲切）、XiaoyiNeural（活泼开朗）、XiaoyanNeural（新闻播音） ### 3. 语音参数调整 - 语速调整：`--rate "+20%"` 或 `--rate "-10%"` - 音调调整：`--pitch "+5Hz"` 或 `--pitch "-3Hz"` - 音量调整：`--volume "+20%"` 或 `--volume "-10%"` ### 4. 后处理集成可选集成 voice-changer skill 进行变声处理。 ## 配置文件配置文件位于：`~/.claude/skills/text-to-speech/config/tts_config.json` ### 主要配置项 ```json { "edge_tts": { "voice": "zh-CN-YunyangNeural", "rate": "+0%", "pitch": "+0Hz", "volume": "+0%" }, "script_parsing": { "enabled": true, "remove_timestamps": true, "remove_bgm_notes": true, "remove_stage_directions": true, "remove_markdow