infinitetalk-shopping-avatar

Solid

专为InfiniteTalk项目设计的小省导购员数字人带货提示词生成技能，基于四大智能体协同（提示词生成师、质量管控师、知识库运维师、跨环节适配师），生成适配Image-to-Video模式的结构化提示词（角色固定特征+动作时序+场景环境+音频匹配+光影氛围+技术约束），支持9:16竖屏、5s/幕、音频同步（Suno+chinese-wav2vec2-base）、一致性管控（角色/视觉/情绪），直接对接模型推理流程

Code & Development 4,328 stars 421 forks Updated today

Install

View on GitHub

Quality Score: 83/100

Stars 20%

100

Recency 20%

100

Frontmatter 20%

Documentation 15%

100

Issue Health 10%

License 10%

Description 5%

100

Skill Content

# InfiniteTalk小省导购员数字人带货提示词生成 ## 任务目标 - 本技能用于：为InfiniteTalk项目生成小省导购员数字人带货视频的结构化提示词，直接对接模型推理流程 - 能力包含： - 生成适配InfiniteTalk Image-to-Video模式的分镜化提示词 - 帧级动作时序描述（5s/幕，精确到秒级） - 音频同步匹配（Suno音乐 + chinese-wav2vec2-base编码） - 一致性管控（角色/视觉/情绪三大维度） - 跨工具集成（Suno、AI绘画、InfiniteTalk） - 触发条件：用户需要生成小省导购员数字人带货视频，使用InfiniteTalk模型进行推理 ## 前置准备 - 依赖说明：本技能基于智能体自然语言能力，无需Python依赖 - 环境准备： - InfiniteTalk模型环境（已安装，包含chinese-wav2vec2-base编码器） - TeaCache + int8量化配置（已配置） - 角色参考图（9:16比例，分辨率≥1080×1920） ## 操作步骤 ### 标准流程 #### 1. 提示词生成提示词生成师负责生成适配InfiniteTalk的结构化提示词： **输入信息**： - 场景类型（产品推荐/价格对比/促销活动等） - 商品信息 - 情绪基调 - 五幕情绪递进 **生成流程**： 1. 读取 [references/infinitetalk-parameters.md](references/infinitetalk-parameters.md)，确认核心参数配置 2. 读取 [references/prompt-structure.md](references/prompt-structure.md)，遵循提示词结构规范 3. 读取 [references/scene-templates-infinitetalk.md](references/scene-templates-infinitetalk.md)，调取场景模板 4. 生成五幕提示词，每幕包含： - 角色固定特征（严格遵循固定描述） - 动作时序（5s内帧级描述，精确到秒级） - 场景环境（背景、前景、道具） - 音频匹配（语音类型+音乐风格+音频对齐规则） - 光影/氛围（色温、光照类型、情绪基调） - 技术约束（构图比例、景深、动作强度等） **输出格式**： - 中文提示词（可直接作为InfiniteTalk推理脚本的`prompt`参数） - 参数配置表（duration、aspect_ratio、motion_strength、face_consistency等） #### 2. 质量核查质量管控师负责核查提示词质量： **核查维度**： 1. **技术参数匹配度**： - 时长：每幕5s，总时长25s - 分辨率/比例：1080×1920（9:16竖版） - 动作连贯性：5s内帧级动作描述流畅 - 角色一致性：严格匹配固定特征描述 2. **角色一致性**： - 外貌特征：脸型、眼睛、发型、肤色、唇色 - 服饰描述：上衣、鞋子、配饰 - 气质特征：专业亲和、手部姿态 3. **音频匹配性**： - 语音类型：语速、语气与情绪匹配 - 音乐风格：与场景情绪匹配 - 音频对齐：动作节奏与音乐/语音同步 4. **光影可实现性...

Details

Author: anbeime
Repository: anbeime/skill
Created: 5 months ago
Last Updated: today
Language: Python
License: None

Similar Skills

Semantically similar based on skill content — not just same category

AI & Automation Solid

dream-video-prompt-generator

小省导购员数字人带货版即梦视频提示词生成系统，基于四大智能体协同（提示词生成师、质量管控师、知识库运维师、跨环节适配师），按照"主体+运动+场景+（镜头语言+光影+氛围）"公式输出中英文双版提示词，适配5s短视频。确保人物一致性、视觉连贯性、情绪连贯性，支持知识库智能复用和跨工具适配（Suno音乐、AI绘画），为数字人带货视频提供高质量提示词生成服务。

4,328 Updated today

anbeime

AI & Automation Solid

agentkit-multimedia-shopping

基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能，整合多模态内容生成能力（图像、视频、音频），支持AI绘画、语音合成、视频生成，与小省导购员人设融合，9:16竖屏适配，直接对接带货视频生成流程

4,328 Updated today

anbeime

Code & Development Solid

infinitetalk

音频驱动的稀疏帧视频配音工具，支持音频驱动的 Video-to-Video 和 Image-to-Video 生成，实现精准的唇形、头部、身体姿态同步，支持无限时长视频生成

4,328 Updated today

anbeime