infinitetalk-shopping-avatarlisted
Install: claude install-skill anbeime/skill
# InfiniteTalk小省导购员数字人带货提示词生成
## 任务目标
- 本技能用于:为InfiniteTalk项目生成小省导购员数字人带货视频的结构化提示词,直接对接模型推理流程
- 能力包含:
- 生成适配InfiniteTalk Image-to-Video模式的分镜化提示词
- 帧级动作时序描述(5s/幕,精确到秒级)
- 音频同步匹配(Suno音乐 + chinese-wav2vec2-base编码)
- 一致性管控(角色/视觉/情绪三大维度)
- 跨工具集成(Suno、AI绘画、InfiniteTalk)
- 触发条件:用户需要生成小省导购员数字人带货视频,使用InfiniteTalk模型进行推理
## 前置准备
- 依赖说明:本技能基于智能体自然语言能力,无需Python依赖
- 环境准备:
- InfiniteTalk模型环境(已安装,包含chinese-wav2vec2-base编码器)
- TeaCache + int8量化配置(已配置)
- 角色参考图(9:16比例,分辨率≥1080×1920)
## 操作步骤
### 标准流程
#### 1. 提示词生成
提示词生成师负责生成适配InfiniteTalk的结构化提示词:
**输入信息**:
- 场景类型(产品推荐/价格对比/促销活动等)
- 商品信息
- 情绪基调
- 五幕情绪递进
**生成流程**:
1. 读取 [references/infinitetalk-parameters.md](references/infinitetalk-parameters.md),确认核心参数配置
2. 读取 [references/prompt-structure.md](references/prompt-structure.md),遵循提示词结构规范
3. 读取 [references/scene-templates-infinitetalk.md](references/scene-templates-infinitetalk.md),调取场景模板
4. 生成五幕提示词,每幕包含:
- 角色固定特征(严格遵循固定描述)
- 动作时序(5s内帧级描述,精确到秒级)
- 场景环境(背景、前景、道具)
- 音频匹配(语音类型+音乐风格+音频对齐规则)
- 光影/氛围(色温、光照类型、情绪基调)
- 技术约束(构图比例、景深、动作强度等)
**输出格式**:
- 中文提示词(可直接作为InfiniteTalk推理脚本的`prompt`参数)
- 参数配置表(duration、aspect_ratio、motion_strength、face_consistency等)
#### 2. 质量核查
质���管控师负责核查提示词质量:
**核查维度**:
1. **技术参数匹配度**:
- 时长:每幕5s,总时长25s
- 分辨率/比例:1080×1920(9:16竖版)
- 动作连贯性:5s内帧级动作描述流畅
- 角色一致性:严格匹配固定特征描述
2. **角色一致性**:
- 外貌特征:脸型、眼睛、发型、肤色、唇色
- 服饰描述:上衣、鞋子、配饰
- 气质特征:专业亲和、手部姿态
3. **音频匹配性**:
- 语音类型:语速、语气与情绪匹配
- 音乐风格:与场景情绪匹配
- 音频对齐:动作节奏与音乐/语音同步
4. **光影可实