agentkit-multimedia-shopping
Solid基于ByteDance agentkit-samples多媒体用例的小省导购员数字人带货视频生成技能,整合多模态内容生成能力(图像、视频、音频),支持AI绘画、语音合成、视频生成,与小省导购员人设融合,9:16竖屏适配,直接对接带货视频生成流程
AI & Automation 1,525 stars
170 forks Updated today
Install
Quality Score: 86/100
Stars 20%
Recency 20%
Frontmatter 20%
Documentation 15%
Issue Health 10%
License 10%
Description 5%
Skill Content
# AgentKit多媒体小省导购员数字人带货
## 任务目标
- 本技能用于:基于ByteDance agentkit-samples多媒体用例,生成小省导购员数字人带货视频的多模态内容
- 能力包含:
- AI绘画生成(小省导购员角色形象、场景背景)
- 语音合成(导购员语音、背景音乐)
- 视频生成(多模态组合)
- 工作流编排(图像→音频→视频→成片)
- 触发条件:用户需要生成小省导购员数字人带货视频,使用agentkit-samples的多媒体能力
## 前置准备
### 依赖说明
本技能依赖以下Python包:
```
Pillow>=10.0.0
requests>=2.28.0
numpy>=1.24.0
```
### 环境准备
1. 安装agentkit-samples(如需要)
2. 准备API凭证(如涉及第三方服务调用)
3. 准备小省导购员角色固定特征描述
### 前置知识
- 了解ByteDance agentkit-samples多媒体用例的基本功能
- 了解AI绘画、语音合成、视频生成的基本原理
- 了解9:16竖屏视频规格
## 操作步骤
### 标准流程
#### 1. 角色形象生成
使用AI绘画生成小省导购员角色形象:
**输入信息**:
- 角色固定特征(脸型、发型、服饰、气质)
- 场景类型(商务场景)
- 情绪基调(热情、专业、亲切)
**生成流程**:
1. 读取 [references/character-profile.md](references/character-profile.md),获取小省导购员角色固定特征
2. 调用 [scripts/generate_character.py](scripts/generate_character.py) 生成角色形象
3. 裁剪为9:16比例,分辨率≥1080×1920
4. 保存参考图(供InfiniteTalk使用)
**输出**:角色参考图(9:16竖屏)
#### 2. 场景背景生成
使用AI绘画生成场景背景:
**输入信息**:
- 场景类型(商务会议室、书房、洽谈室、大厅、办公室)
- 情绪基调(冷调、暖调、中性)
- 光影描述(侧光、顺光、顶光、逆光)
**生成流程**:
1. 读取场景模板,选择对应场景类型
2. 调用 [scripts/generate_scene.py](scripts/generate_scene.py) 生成场景背景
3. 裁剪为9:16比例,分辨率≥1080×1920
4. 保存场景参考图
**输出**:场景参考图(9:16竖屏)
#### 3. 语音合成
使用TTS生成导购员语音:
**输入信息**:
- 话术内容(带货文案)
- 语音类型(语速、语气)
- 情绪基调(热情、专业、亲切)
**生成流程**:
1. 准备话术内容(符合小省导购员人设)
2. 调用 [scripts/generate_voice.py](scripts/generate_voice.py) 合成语音
3. 导出为16kHz单声道wav格式
4. 保存语音文件(供InfiniteTalk使用)
**输出**:语音文件(16kHz单声道wav)
#### 4. 背景音乐生成
使用音乐生成工具生成背景音乐:
**输入信息**:
- 情绪基调(热情、专业、紧迫、亲切)
- 音乐风格(管弦乐、钢琴、弦乐)
- 时长(5秒/幕)
**生成流程**:
1. 根据情绪基调选择音乐...
Details
- Author
- anbeime
- Repository
- anbeime/skill
- Created
- 4 months ago
- Last Updated
- today
- Language
- Python
- License
- None
Similar Skills
Semantically similar based on skill content — not just same category
Code & Development Listed
digital-avatar-shopping-video
小省导购员多智能体数字人口播带货视频生成系统,以"小省导购员"为核心人设,打造专业购物助手+数字人口播带货视频一体化服务。涵盖五大智能体(小省导购员、带货脚本师、数字人口播生成师、带货画面设计师、音画合成师),产出"数字人口播+带货画面+字幕音效"的成品视频,适配抖音、快手等短视频平台,支持淘宝、京东、拼多多、唯品会等全平台商品信息,具备知识库自动存取能力。
1,525 Updated today
anbeime Code & Development Listed
infinitetalk-shopping-avatar
专为InfiniteTalk项目设计的小省导购员数字人带货提示词生成技能,基于四大智能体协同(提示词生成师、质量管控师、知识库运维师、跨环节适配师),生成适配Image-to-Video模式的结构化提示词(角色固定特征+动作时序+场景环境+音频匹配+光影氛围+技术约束),支持9:16竖屏、5s/幕、音频同步(Suno+chinese-wav2vec2-base)、一致性管控(角色/视觉/情绪),直接对接模型推理流程
1,525 Updated today
anbeime Code & Development Solid
product-video-creator
多智能体协同的商品视频创作流水线,支持从商品信息到成视频的全流程创作:文案生成、故事策划、脚本创作、分镜设计、图片生成、字幕创作、音效推荐及视频合成;适用于电商商品宣传、品牌推广、社交媒体营销等场景
1,525 Updated today
anbeime