6.2 KiB
6.2 KiB
RPG 世界草稿开局 CG 手动生成技术方案(2026-05-03)
1. 背景与本次口径
本方案落地“RPG 游戏开场 CG”第一版。它继承 docs/prd/AI_NATIVE_RPG_OPENING_ANIMATION_PRD_2026-04-25.md 的资产化方向,但本次不采用旧 PRD 中“4 张关键帧 + 3 段视频拼接”的方案,而采用更短的两阶段链路:
世界草稿
-> GPT Image 2 生成 3*4 故事板图,2k,16:9
-> Seedance 使用故事板作为参考图生成单段 15 秒视频,480p,16:9
-> OSS 保存故事板与成片
-> 前端把 openingCg 回写到当前世界草稿 profile
本次明确不在生成世界草稿时自动生成开局 CG。入口只放在世界草稿结果页的世界 Tab,由用户手动触发。
2. 用户体验
- 世界 Tab 展示一个轻量的“开局 CG”资产槽。
- 未生成时只提供手动生成按钮。
- 生成中展示阶段状态和进度,不把规则说明长文写进 UI。
- 生成成功后展示视频预览和重新生成按钮。
- 每次点击生成扣
80积分,失败自动退款。 - UI 预计等待文案为
预计 10 分钟,真实等待由后端同步请求完成后返回。 - 只在世界草稿中手动生成;世界底稿、角色图、幕背景图自动补齐流程不生成开局 CG。
3. 数据结构
在 CustomWorldProfile 新增可选字段:
type CustomWorldOpeningCgStatus =
| 'not_started'
| 'storyboard_generating'
| 'video_generating'
| 'ready'
| 'failed';
type CustomWorldOpeningCgProfile = {
id: string;
status: CustomWorldOpeningCgStatus;
storyboardImageSrc?: string | null;
storyboardAssetId?: string | null;
videoSrc?: string | null;
videoAssetId?: string | null;
posterImageSrc?: string | null;
posterAssetId?: string | null;
storyboardPrompt?: string | null;
videoPrompt?: string | null;
imageModel: 'gpt-image-2';
videoModel: string;
aspectRatio: '16:9';
imageSize: '2k';
videoResolution: '480p';
durationSeconds: 15;
pointCost: 80;
estimatedWaitMinutes: 10;
generatedAt?: string | null;
updatedAt: string;
errorMessage?: string | null;
};
该字段保存在现有 profile JSON 内,不新增 SpacetimeDB 表字段。发布与保存沿用当前 profile_payload_json 整包存储能力。
4. 后端接口
新增接口:
POST /api/runtime/custom-world/opening-cg
请求:
type GenerateCustomWorldOpeningCgRequest = {
profile: CustomWorldProfile;
};
响应:
type GenerateCustomWorldOpeningCgResponse = {
openingCg: CustomWorldOpeningCgProfile;
};
接口职责:
- 校验登录态与 profile 基本结构。
- 校验至少存在可扮演角色、世界基调、世界概述、核心冲突和首个场景第一幕背景图。
- 使用
execute_billable_asset_operation_with_cost(..., 80, ...)做预扣和失败退款。 - 生成故事板图片并持久化为
custom_world_opening_cg_storyboard资产。 - 使用故事板图作为 Seedance 参考图生成视频并持久化为
custom_world_opening_cg_video资产。 - 返回可直接合并进 profile 的
openingCg。
5. 提示词
5.1 故事板
图片模型固定使用 gpt-image-2,尺寸语义为 2k、16:9;2026-05-09 起实际请求 VectorEngine gpt-image-2-all,下游 size 按迁移文档归一为 1536x1024。
模板:
以3*4网格格式创建故事板,16:9。像素风角色扮演游戏开场动画CG。
故事流程:先展示角色,展示故事背景,然后表现核心冲突,最后衔接开局场景
故事基调:{世界草稿.tone}
玩家扮演:将玩家扮演角色作为角色参考图并引用世界草稿中的角色简介
故事背景:{世界草稿.summary}
核心冲突:{世界草稿.coreConflicts}
开局场景:将首个场景的第一幕背景图作为参考图
参考图:
- 玩家扮演角色使用第一个可扮演角色的
imageSrc。 - 开局场景使用
sceneChapterBlueprints[0].acts[0].backgroundImageSrc。 - 若缺少任一参考图,返回可理解错误,不降级到无参考图生成。
5.2 视频
视频模型复用当前 Ark Seedance 配置,分辨率 480p,比例 16:9,时长 15 秒。
提示词固定:
利用参考图作为故事板,生成一段连贯的动画,没有旁白
请求参数必须开启生成音频与联网搜索。若当前上游字段名存在差异,后端在 Ark 请求体中以 audio / generate_audio / web_search 的兼容布尔字段表达,保证不会影响现有角色动画接口。
开局 CG 视频链路的上游等待窗口不得低于 10 分钟,以匹配产品侧“预计 10 分钟”的展示口径。
6. 资产与计费
资产写入:
| 产物 | assetKind | entityKind | slot |
|---|---|---|---|
| 故事板图 | custom_world_opening_cg_storyboard |
custom_world_profile |
opening_cg_storyboard |
| 成片视频 | custom_world_opening_cg_video |
custom_world_profile |
opening_cg_video |
计费:
- 每次点击生成消耗
80积分。 - 故事板生成失败、视频任务创建失败、轮询失败、下载失败或 OSS 持久化失败都退款。
- 扣费流水的 asset id 使用本次 opening CG id,避免同一次请求重试重复扣费。
7. 前端落点
CustomWorldEntityCatalog在世界 Tab 增加开局 CG 槽。rpgCreationAssetClient新增generateOpeningCg。RpgCreationResultViewImpl持有生成中状态,生成完成后onProfileChange({ ...profile, openingCg })。- 视频展示使用签名 URL 读取组件,不把签名 URL 写入 profile。
- 草稿生成时不调用该接口。
8. 验收点
- 新草稿生成完成后
openingCg为空或不存在。 - 世界 Tab 可以手动生成开局 CG。
- 生成请求 payload 包含角色参考图与开局第一幕背景图。
- 故事板请求使用
gpt-image-2、2048x1152/2k语义、16:9。 - 视频请求使用 Seedance、
480p、16:9、15秒,并传入故事板参考图。 - 单次生成扣
80积分,任一失败路径退款。 - 生成成功后 profile 内出现
openingCg.videoSrc,刷新/保存/发布后能保留。 - 视频链路上游超时不低于
10分钟,避免低于产品展示的预计等待时长。