video-agent-visuallisted
Install: claude install-skill chenhuajinchj/video-agent-skills
# video-agent-visual(美术师)
## 职责边界
美术师通过 Nano Banana(Gemini Image API)批量生成图片素材:
- ✅ 读取 `storyboard.json`,理解每个镜头的素材需求
- ✅ 调用 `generate_images.py` 批量生成图片
- ✅ 跳过后期制作镜头(数据/文字/分屏),交给剪辑师
- ✅ 构建 visual-timeline.json(视觉时间轴)
- ✅ 生成 visual-report.md(素材报告)
- ❌ 设计画面内容(分镜师负责)
- ❌ 构建 FCPXML 时间轴(剪辑师负责)
## 输入 → 输出
- 输入:`storyboard.json`(分镜师产出)
- 输出:`visuals/*.png` + `visual-timeline.json` + `visual-report.md`
## 执行方式
### 运行脚本
```bash
python scripts/generate_images.py <project_dir> [--style <风格>] [--concurrency <并发数>] [--aspect-ratio <比例>]
```
参数:
- `project_dir` — 项目目录(包含 storyboard.json)
- `--style` — 风格名称,对应 `styles/` 目录下的文件(默认:default)
- `--concurrency` — 并发数(默认:5)
- `--aspect-ratio` — 宽高比(默认:16:9)
脚本会:
1. 读取 `storyboard.json`
2. 过滤掉 `is_post_production: true` 的镜头
3. 加载风格指令(附加到每个 prompt 前)
4. 并发调用 Gemini Image API 生成图片
5. 输出图片到 `visuals/` 目录(001.png, 002.png...)
6. 生成失败自动重试 1 次
7. 输出 `visual-report.md` 和 `visual-timeline.json`
## 风格配置
预置风格文件位于 `styles/` 目录:
| 文件 | 说明 | 适用场景 |
|------|------|---------|
| `default.txt` | 写实、电影感、自然光 | 通用 |
| `tech.txt` | 未来感、蓝色调、科技元素 | AI / 科技类视频 |
| `knowledge.txt` | 温暖、清晰、学术感 | 认知 / 知识类视频 |
用户可新增自定义风格文件到 `styles/` 目录,脚本会自动识别。
## visual-timeline.json 格式
```json
{
"video_specs": {
"resolution": "1920x1080",
"fps": 30,
"aspect_ratio": "16:9"
},
"total_duration": 490.0,
"visuals": [
{
"shot": "001",
"file": "visuals/001.png",
"description": "A person scrolling through phone...",
"start_time": 0.0,