Adds/updates documentation, assets and implementation for Match3D and puzzle image generation workflows. Key changes: decision logs and pitfalls updated to prefer VectorEngine Gemini for Match3D material sheets and to require edits (multipart) for 1:1 container reference images; guidance added for when to use APIMart vs VectorEngine. .env.example clarified APIMart/Responses config. Many new public assets and PPT visuals added. Code changes across frontend and backend: updated shared contracts, server-rs match3d/puzzle/image-generation handlers, VectorEngine/OpenAI image generation clients, and multiple React components/tests to handle UI/background/container image signing, edits workflow, and puzzle UI background resolution. Added src/services/puzzle-runtime/puzzleUiBackgroundSource.ts and related test updates. Includes notes about multipart HTTP/1.1 requirement and test/verification commands in docs.
38 KiB
抓大鹅草稿素材生成流水线 2026-05-10
0. 2026-05-14 临时关闭音频生成
抓大鹅音频生成能力暂时关闭:
match3d_compile_draft不再调用 Suno 生成背景音乐,也不再生成点击音效。- 结果页
素材配置不再展示背景音乐子 Tab;物品详情面板不再展示点击音效提示词和生成按钮。 - 批量新增物品只生成 2D 五视角图片,不生成点击音效。
- 通用
/api/creation/audio/*路由对match3d_work/match3d_item暂时返回410 Gone;视觉小说专用音频路由保持可用。 - 历史
generatedItemAssets[].backgroundMusic与clickSound字段保留,运行态仍可消费旧音频。
1. 范围
本方案用于改造 生成抓大鹅草稿 的首版生成链路:点击按钮后先进入独立生成过程页,生成结束后自动进入抓大鹅结果页,并在结果页 素材配置 > 物品 预览本次生成的 2D 多视角物品素材。
草稿生成不再调用 Hyper3D Rodin,也不再生成 GLB 模型。物品素材继续沿用原来的“生成图片 -> 网格拆分 -> 上传 OSS -> 写回草稿”机制,但每个物品必须生成 5 个不同视角的 2D 视图。试玩和正式运行态的消除次数、总物品数和物品种类数以结果页 难度配置 保存的难度为准。难度对应物品种类固定为:轻松 3 种、标准 9 种、进阶 15 种、硬核 21 种。历史硬核草稿若仍保存 clearCount = 20,运行态按新硬核升为 21 次消除、63 件总物品。正式发布前如果已生成 image_ready 且具备至少 5 张有效 imageViews[] 的物品种类不足当前难度要求,必须阻断发布;试玩不阻断,但启动时把物品种类自动降到当前可用 2D 素材数量。
2. 前端流程
入口仍复用 Match3DAgentWorkspace 表单。点击 生成抓大鹅草稿 后必须先弹出 确认消耗泥点 面板,展示 消耗 10 泥点;用户确认后才进入后端生成流程:
- 创建 Match3D session。
- 后端先用当前题材和本地兜底元信息创建同一个 Match3D 草稿 profile,草稿 Tab 必须立即能看到这份存档。
- 进入
match3d-generating生成过程页。 - 过程页复用拼图生成页的
CustomWorldGenerationView结构。 - 生成成功后自动进入
match3d-result。 - 生成失败时停留在生成过程页,允许重新生成或返回创作中心;重新生成必须复用同一个 session / profile,并从缺失的素材阶段继续,不新建第二份草稿。
生成页步骤固定为:
建立草稿存档 -> 生成作品计划 -> 生成背景提示词 -> 分批生成素材图 -> 切割独立图片 -> 上传图片资产 -> 校验素材结构 -> 生成UI背景与容器 -> 写入草稿页
生成页只展示题材和物品数量,不展示玩法规则说明。
当前 match3d-generating 进度页不是后端 task 状态订阅页,而是一个覆盖 match3d_compile_draft 长 action 的本地时间进度页:前端每 500ms 以本地时间刷新阶段展示,真正的生成完成仍以 action 返回为准。为避免长 action 未返回时页面完全无感,生成页在 match3d_compile_draft 执行期间每 3 秒旁路读取一次 session 和 work detail,并用 profile 中已写回的 generatedItemAssets 更新图片素材完成数量。若 generatedItemAssets 已出现 image_ready 且带 imageViews,前端应逐步显示完成数量。
3. 后端编排边界
外部生图和 OSS 上传全部由 api-server 编排,不进入 SpacetimeDB reducer。音频生成当前临时关闭。SpacetimeDB 继续只负责 Match3D 会话、草稿和作品 profile 的确定性写入。
match3d_compile_draft action 的后端顺序为:
- 读取 session config。
- 对本次
match3d_compile_draft生成动作按sessionId + profileId + action 时间戳构造幂等流水并预扣10泥点。余额不足时不继续创建草稿;后续任一步失败时自动按同额退款。 - 草稿编译先创建可恢复 profile;素材生成数量由入口页难度派生的物品种类决定:轻松
3种、标准9种、进阶15种、硬核21种。 - 先调用 SpacetimeDB compile procedure 写入草稿。首次执行使用新
profileId;重试时复用 session draft / work profile 中已有profileId。这一步不能等待 LLM、图片或 OSS 成功后才执行。 - 基于入口页题材设定文本调用文本模型生成作品生成计划。模型固定请求
gpt-4o,只返回 JSON,其中gameName为 4 到 12 个中文字符的游戏名称,summary为 18 到 48 个中文字符的作品描述。生成计划还必须包含tags、backgroundPrompt,以及items[]中每个物品的name与soundPrompt。soundPrompt只作为历史字段保留,当前不触发音效生成;backgroundPrompt用于生成局内竖屏纯背景图,只描述题材氛围、色彩和环境,不得描述锅、圆盘、托盘、拼图槽、物品槽、HUD、UI、文字、按钮、倒计时、分数或物品。文本模型不可用时保留第 4 步的本地兜底,不阻断草稿。 - 后端把生成计划中的
gameName和summary写入match3d_work_profile作品信息后,自动调用作品标签生成器。标签生成器使用题材、作品名称和作品描述生成 3 到 6 个中文短标签;若调用失败或返回不足,则使用生成计划 tags 和本地兜底标签补齐。结果页手动AI生成作品标签也使用同一接口,并传入当前作品描述。 - 后端从同一份作品生成计划读取当前难度所需数量的短物品名称,并兼容保存历史
soundPrompt字段;当前不生成点击音效。 - 调用 VectorEngine Gemini 原生图片接口生成
1:1素材图,请求模型固定为gemini-3-pro-image-preview,走POST {VECTOR_ENGINE_BASE_URL}/v1beta/models/gemini-3-pro-image-preview:generateContent?key={VECTOR_ENGINE_API_KEY}。请求体使用contents[].parts[].text和generationConfig.responseModalities = ["TEXT", "IMAGE"]、generationConfig.imageConfig.aspectRatio = "1:1",响应从candidates[].content.parts[].inlineData.data/inline_data.data读取 base64 图片。提示词必须合入入口页选择的assetStylePrompt,并强制每格使用统一纯绿色绿幕背景,避免白底或纹理背景进入运行态素材。该调整只作用于抓大鹅物品素材 sheet;封面和9:16纯背景图继续使用 VectorEngine/v1/images/generations的gpt-image-2-allJSON 链路,1:1容器 UI 图必须使用 VectorEngine/v1/images/editsmultipart 图生图链路,不能再把参考图作为 generations 的image数组弱参考。 - 每个物品固定需要
5个不同视角。单张素材图固定为5*5 = 25格,因此单张图承载5个物品。若用户要求或难度派生的物品种类不是5的倍数,后端必须向上补齐物品名称和对应图片到最近的5的倍数;例如标准难度需要9种玩法物品,实际生成10个物品名称和对应五视角图片。若草稿物品数超过5,后端按每批5个物品自动分批,多张素材图并行生成。 - 将每张素材图按固定
5 行 * 5 列切割成独立图片,并按物品顺序连续分配5张视角图。素材图提示词必须要求5*5严格均匀排布、每格主体完整居中、统一纯绿色绿幕背景、相邻物体主体至少保留1/4单格宽度空白间距、不得跨格、贴边或越界,避免裁剪后相邻格内容污染。切割前必须先在整张素材图上做透明背景后处理:连通到 sheet 外边缘的绿幕/近白底要清成 alpha;每格内部未连到外边缘但高置信的纯绿绿幕块也必须清成 alpha;物品边缘的绿幕抗锯齿和近白白边要做透明或去污染处理;不够纯的绿色主体像素不得被当作绿幕误删。随后再在每个理论格子内按透明背景/前景像素做内容边界校准,并带少量安全留白导出;不能做固定内缩裁剪,避免贴近格线但未跨格的樱桃、叶片、把手等主体边缘被切掉。每个物品 JSON 写入imageViews[],同时把第一个视角兼容写入imageSrc/imageObjectKey。 - 将素材图和每张独立视角图片上传到 OSS。每次获得可恢复的图片资产后,都要回写
match3d_work_profile.generated_item_assets_json。成功素材状态为image_ready;失败素材保留已成功图片引用并记录error。每个素材 JSON 可继续保存历史soundPrompt;不再写入新的backgroundMusicTitle/backgroundMusicStyle/backgroundMusicPrompt。 - UI 背景生成由
api-server分成两张资产:第一张是9:16纯背景图,走 VectorEngine/v1/images/generations的gpt-image-2-allJSON 请求,不传锅参考图,且必须禁止锅、圆盘、托盘、拼图槽、物品槽、HUD、文字、按钮、倒计时、分数和物品;第二张是1:1题材容器 UI 图,走 VectorEngine/v1/images/editsmultipart 请求,把public/match3d-background-references/pot-fused-reference.png作为imagepart 上传,只生成一个贴合题材设定的圆形或浅盘状竞技容器,不生成整页背景、文字、按钮或物品。容器图必须沿用参考图的大尺寸轻俯视构图:外轮廓接近画布四边,宽度约占86%-92%、高度约占82%-90%,内口为横向椭圆,禁止生成小容器、正俯视圆盘、侧视碗、餐盘或小托盘。纯背景上传到generated-match3d-assets/{sessionId}/{profileId}/background/{taskId}/background.png,容器 UI 图上传到generated-match3d-assets/{sessionId}/{profileId}/ui-container/{taskId}/container.png,两者都作为backgroundAsset挂在首个generatedItemAssets[]JSON 上;HTTP DTO 同时顶层输出兼容的backgroundPrompt、backgroundImageSrc、backgroundImageObjectKey与generatedBackgroundAsset,容器图通过generatedBackgroundAsset.containerImageSrc/containerImageObjectKey返回。若作品尚无用户自定义封面,草稿生成完成后默认把容器 UI 图写入coverImageSrc,作为草稿架和作品信息的默认封面。 - 在 HTTP 返回的 draft/profile DTO 中附带本次生成的素材资产预览信息、背景资产信息和默认封面;后续重进草稿页时从 work profile 的持久化
generatedItemAssets与coverImageSrc恢复同一批素材、UI 与封面。历史音频字段只做兼容传递。
若文本模型不可用或返回无法解析,后端必须降级为 {themeText}抓大鹅、本地作品描述与本地标签兜底,不阻断素材生成;标签仍通过作品标签生成器优先生成,失败后再用兜底标签补齐。
草稿生成阶段不再调用 Hyper3D Rodin,不生成 GLB,也不等待任何模型轮询。前端 match3d_compile_draft action 的长耗时主要来自文本生成、分批 1K 生图、切图、OSS 上传、纯背景图和容器 UI 图。批量新增物品由 POST /api/creation/match3d/works/{profileId}/item-assets 复用同一套 2D 素材图生成、固定 5*5 切图和 OSS 上传链路;若本次新增数量不是 5 的倍数,同样向上补齐名称和图片到最近的 5 的倍数。整图生成完成后立即丢弃补齐用临时物品,只对用户实际新增项执行绿幕抠背景、切割和上传,并只把这些真实新增项的 imageViews[] 写回 generatedItemAssets。批量重新生成同样调用该接口,但请求体增加 mode = "replace",前端从现有素材列表收集用户确认的物品名称;后端只匹配已存在的同名素材,保留原 itemId、列表顺序、UI 背景、历史背景音乐和点击音效字段,只替换该素材的 imageSrc/imageObjectKey/imageViews/status/error,避免试玩和正式运行态的物品类型映射漂移。
4. 图片提示词
素材图提示词必须显式包含:
生成一张1:1图片
生成严格5*5均匀网格素材图
整体画风遵循:...
只绘制这些物品:...
每格背景必须是统一纯绿色绿幕背景,方便后续转透明
物品本身不得使用与绿幕相同的纯绿色
每格主体完整居中,禁止跨格、贴边或越界影响裁剪后的效果
相邻物体主体之间至少保留 1/4 单格宽度空白间距,物体主体不得占满格子
不要出现文字、水印、UI、边框、网格线、白色背景、灰色背景、纹理背景
包含若干个物品名称 在落地中解释为“按生成出的物品名称绘制对应主体”,不要求图片上写出物品名称。这样可以避免文字渲染污染切图和局内 2D 素材表现。
内置 像素复古 不能只写“复古像素”或“有限色板”。入口页、参考图脚本和后端素材图 prompt 必须使用同一组硬约束:真正复古像素 2D 游戏道具 sprite,先按约 64x64 低分辨率像素块绘制再整数倍放大,硬边方块像素清晰可见,有限色板 12-24 色;同时在负向约束中禁止抗锯齿、柔焦、平滑渐变、真实 3D 渲染、PBR 材质、摄影光照和平滑插画。后端即使只收到 assetStyleId = pixel-retro 或 assetStyleLabel = 像素复古,也必须补齐这组约束,避免旧会话、恢复会话或批量新增物品退回普通插画风格。
入口页内置 2D 风格参考图通过同一 VectorEngine gpt-image-2-all 能力生成,执行命令为 npm run assets:match3d-style-references -- --live。每张入口参考图只展示 1 个完整独立物品,不能展示 5 个物品样张或多物品散点图,避免风格选择被误读为物品数量配置。保存路径固定为:
public/match3d-style-references/flat-icon.png
public/match3d-style-references/cel-cartoon.png
public/match3d-style-references/pixel-retro.png
public/match3d-style-references/watercolor.png
public/match3d-style-references/sticker-outline.png
public/match3d-style-references/painterly-icon.png
这些图片只作为入口页风格选择的视觉参考,不进入用户草稿资产,不替代生成时的物品素材图。
局内容器 UI 图生成固定参考图路径为:
public/match3d-background-references/pot-fused-reference.png
这张图只作为容器 UI 图的 VectorEngine /v1/images/edits multipart image part,用来锁定“大尺寸轻俯视浅盘容器”的构图。参考图本身是 1:1 透明底容器素材,外轮廓接近画布四边,内口为横向椭圆;结果页没有真实生成容器时也只把它作为容器预览兜底,不能再作为 9:16 背景预览。每次草稿生成仍会根据 backgroundPrompt 生成新的题材化纯背景图;纯背景图不再传入该参考图,也不得生成锅或 UI 元素。
5. OSS 路径
新增 generated legacy prefix:
generated-match3d-assets
建议对象分组:
generated-match3d-assets/{sessionId}/{profileId}/material-sheet/{taskId}/sheet.png
generated-match3d-assets/{sessionId}/{profileId}/items/{itemSlug}/views/view-01.png
generated-match3d-assets/{sessionId}/{profileId}/items/{itemSlug}/views/view-02.png
generated-match3d-assets/{sessionId}/{profileId}/items/{itemSlug}/views/view-03.png
generated-match3d-assets/{sessionId}/{profileId}/items/{itemSlug}/views/view-04.png
generated-match3d-assets/{sessionId}/{profileId}/items/{itemSlug}/views/view-05.png
generated-match3d-assets/{sessionId}/{profileId}/background/{taskId}/background.png
itemSlug 必须带 itemId 前缀,例如 match3d-item-1-item。中文物品名清洗后可能都退回 item,不能只用物品名做路径,否则多张切割图会写到同一个 object key,导致草稿页预览图全部一致。
HTTP DTO 同时返回兼容字段 imageSrc、imageObjectKey,以及正式 2D 字段 imageViews[]、backgroundAsset 和 status。图片素材生成成功后 status = image_ready;纯背景和容器 UI 图都生成成功后首个素材的 backgroundAsset.status = image_ready,并携带 containerImageSrc/containerImageObjectKey。前端通过 /api/assets/read-url 将 generated legacy path 换签后加载私有图片,不直接请求裸 /generated-match3d-assets/... 路径。运行态背景图和容器 UI 图同样通过 /api/assets/read-url 换签后加载:背景作为全屏 object-cover,容器作为中心棋盘视觉层;当容器图成功解析为可渲染图片时,Match3DRuntimeShell 必须移除默认圆形锅壳、边框和径向底色,让生成容器接管棋盘外观。
结果页手动点击 素材配置 > UI > 重新生成 时,目标库可能仍运行旧 SpacetimeDB wasm,缺少钱包扣退费或 Match3D 写回相关 procedure。api-server 对这类 No such procedure 只做临时容错:泥点预扣阶段跳过扣费,背景图和容器 UI 已经生成但草稿写回失败时,HTTP 响应仍返回本次生成的 generatedBackgroundAsset 和带该资产的内存 profile,避免草稿页直接报错。该容错不等于持久化成功;刷新、换设备或公开详情稳定恢复仍以发布最新 SpacetimeDB module、确认 procedure 导出和重新生成 bindings 为准。
5.1 运行态 2D 素材消费
生成的 2D 五视角素材不仅用于结果页预览,也必须进入游戏运行态。运行态入口的传递链路为:
Match3DWorkProfile / PlatformMatch3DGalleryCard
-> Match3DRuntimeShell(generatedItemAssets, generatedBackgroundAsset, backgroundImageSrc)
-> Match3DPhysicsBoard / Match3DTrayPreviewBoard
运行态按运行快照中的 itemTypeId 稳定排序后,把 generatedItemAssets 顺序映射到对应类型。加载某个物品实例时,从该类型素材的 imageViews[] 中按实例 id 稳定随机选择一个视角;若历史数据没有 imageViews[],则回退到 imageSrc/imageObjectKey。没有生成图片或图片加载失败时,继续使用默认积木图标兜底。
运行态背景优先读取 backgroundImageSrc / 顶层 generatedBackgroundAsset.imageSrc/imageObjectKey,为空时从 generatedItemAssets[].backgroundAsset.imageSrc/imageObjectKey 兜底。中心容器优先读取顶层 generatedBackgroundAsset.containerImageSrc/containerImageObjectKey,再读取 generatedItemAssets[].backgroundAsset.containerImageSrc/containerImageObjectKey;为空或换签/图片加载失败时继续使用默认圆形容器样式。容器图成功加载后,Match3DRuntimeShell 的棋盘容器必须切换为透明、可溢出承载,不再叠加默认 rounded-full 圆形锅壳、金色边框和默认径向背景,避免 AI 生成的大尺寸轻俯视容器被裁切或被默认锅视觉覆盖。运行态入口判断是否需要补读作品详情时,只能把 imageViews[] 或 imageSrc/imageObjectKey 视为“已有物品图片素材”;backgroundMusic.audioSrc、clickSound.audioSrc、generatedBackgroundAsset、backgroundAsset.image* 和 backgroundAsset.containerImage* 是随物品素材一起传入的附属运行态资产,不能单独证明物品素材已完整。也不能继续只用历史 modelSrc/modelObjectKey 判断,否则新 2D 草稿会在试玩或推荐流中被当成“无素材”并回退默认积木。Match3DRuntimeShell 只保留顶部返回、倒计时、重开三个控件;这些顶部控件和底部备选栏统一使用题材无关的半透明玻璃组件样式,不能随背景题材改成木质、金属、果园、科幻等主题皮肤,也不能重新烘进 AI 背景图。进度、组数、版本等状态信息不得再作为顶部常驻 UI 出现,避免遮挡生成背景和中心容器。
前端加载规则:
- 优先读取
imageViews[]中的imageSrc/imageObjectKey,为空时使用兼容字段imageSrc/imageObjectKey。 - 对 generated legacy path 通过同源
/api/assets/read-url换签后交给浏览器图片加载;结果页音频试听入口当前隐藏,后续恢复时也必须先换签,不能把裸/generated-match3d-assets/...音频路径直接交给<audio>。 - 场内物品、点击命中和备选栏继续使用后端快照中的
itemInstanceId/itemTypeId/x/y/radius/layer;生成 2D 图片只替换视觉表现,不承接规则真相。 - 同一物品类型的多个实例可以展示不同视角,但同一实例在本局中应稳定使用同一个视角,避免移动或入槽时闪图。
- 图片缺失、读取失败或解码失败时,继续使用默认积木素材,不能阻断开局、点击、入槽或结算。
结果页点击 试玩 时,前端必须把当前结果页可见的 generatedItemAssets 带入运行态启动入参。PUT /api/runtime/match3d/works/{profileId} 若因为并发或旧快照返回了缺少素材的 profile,Match3DResultView 需要把当前 draft / profile 的素材重新合并到运行态 profile,并在启动试玩前调用生成素材保存接口把当前可见的 generatedItemAssets 写回作品 profile;不能只在内存里把素材补到 onStartTestRun(profile)。发布同理必须先落库当前素材,再调用 publish_match3d_work,否则公开推荐流和正式运行态只能读到旧 profile 快照。结果页顶部返回按钮固定回到平台创作页,不再回到抓大鹅专属内嵌入口表单;需要修改题材时由用户在创作页重新选择或从草稿继续进入。若历史草稿同时存在旧 draft.generatedItemAssets 和较新的 profile.generatedItemAssets,同 itemId 下以 profile 中已有的 imageViews[]、imageSrc、imageObjectKey、backgroundMusic 或 backgroundAsset 补齐 draft,不能让旧 draft 把素材覆盖成空列表。PlatformEntryFlowShellImpl 在渲染 match3d-runtime 时按 run.profileId 优先使用当前 match3dRuntimeProfile / match3dProfile.generatedItemAssets,只有 profileId 不匹配时才读取 selectedPublicWorkDetail.generatedItemAssets;即使当前 profile 暂时没有物品图片,也不能把同 profile 的已有 generatedItemAssets 覆盖为空数组。推荐流内嵌正式运行态也必须走同一解析器;当推荐卡片摘要缺少物品图片素材时,启动前补读 getMatch3DWorkDetail(profileId),把详情里的生成图片、历史背景音乐和 UI 素材写入 match3dRuntimeProfile 后再传给运行态。这样可以避免从公开详情页残留状态或推荐卡片旧摘要进入试玩 / 正式游戏时,把已生成草稿的 2D 素材、历史音乐或 UI 覆盖成空列表。
2026-05-14 补充:backgroundMusic 虽然暂存在 generatedItemAssets[] 中,但语义上是作品级音乐。前端读取、保存、试玩、推荐流和运行态入口都必须先通过统一归一化逻辑把任意素材上的 backgroundMusic/backgroundMusicTitle/backgroundMusicStyle/backgroundMusicPrompt 迁移到首个素材,并清空其它素材上的作品级音乐字段,避免 action response 中缺音乐的 draft assets 覆盖 work detail 中已经持久化的音乐,也为未来恢复音乐入口保留稳定读取口径。match3d_compile_draft action 完成后,如果同时拿到 response.session.draft.generatedItemAssets 和 getMatch3DWorkDetail(profileId).item.generatedItemAssets,必须以同 itemId 合并,保留详情里的历史背景音乐、UI 背景和点击音效,再进入结果页或试玩。
历史草稿若仍保存 status = model_ready、modelSrc 或 modelObjectKey,仅作为旧版本兼容读取,不再参与新素材生产。历史外部模型链接转存接口只用于清理旧数据,不能被新草稿生成、批量新增或结果页普通编辑入口调用。
生成完成后自动进入试玩依赖 selectionStageRef.current === 'match3d-generating' 的同步判断。执行 match3d_compile_draft 前切到生成页时,必须同时写 selectionStageRef.current = 'match3d-generating' 和 setSelectionStage('match3d-generating');只调用 React state 会让 action 很快返回时读到旧 stage,表现为生成页已经 100% 但不进入试玩或结果页。拼图、大鱼吃小鱼、方洞挑战等同类生成页也遵循同一规则。
6. 自动保存与草稿恢复
点击 生成抓大鹅草稿 后,草稿存档创建与素材生成解耦:
- 首次 compile 必须先写
match3d_work_profile草稿行,即使后续卡在文本模型、图片生成或 OSS 上传任意阶段。 - 失败态前端要重新读取 session / work detail,并刷新草稿作品架,保证用户离开生成页后仍能在草稿 Tab 找到这份作品。
- 重新生成时优先使用当前 session 的
draft.profileId或publishedProfileId,不得重新创建 session;后端读取同一 profile 的generated_item_assets_json后,只补齐缺失图片、UI 背景或容器资源。 - 已有
status = image_ready且带imageViews[]或imageSrc/imageObjectKey的素材视为完成,不再重复生成图片。
抓大鹅结果页的基础信息自动保存继续调用 PUT /api/runtime/match3d/works/{profileId} 更新名称、题材、描述、标签、封面、消除数和难度;该保存不得清空 generated_item_assets_json。结果页 素材配置 > 物品 只在独立面板中预览和编辑当前素材,不再提供单项重新生成入口;删除单项或批量新增成功后,都必须把当前素材列表重新序列化成 generatedItemAssets 并写回作品 profile,否则试玩、发布和重进草稿会读取旧素材快照。SpacetimeDB update_match3d_work / publish_match3d_work 必须保留当前行的生成素材 JSON。
草稿架重进路径为:
草稿 Tab -> getMatch3DWorkDetail(profileId) -> Match3DResultView(profile.generatedItemAssets)
若草稿卡已经带有前端生成中标记,即使作品列表已经刷新成真实 match3d_work_profile 草稿行,点击该卡也必须优先回到 match3d-generating 生成过程页,并按 sourceSessionId 重新读取当前 session;不能因为 getSession 返回了带 draft 的快照就直接进入结果页。若后台生成已经收口为 ready 且草稿卡仍有未读红点,首次点击必须消费红点并直接启动抓大鹅试玩,返回后展示 Match3DResultView;红点已读后的后续点击才按常规结果页恢复路径进入 Match3DResultView。因此点击恢复优先级固定为:未读 ready 红点自动试玩 > 仍在 generating 的本地 / 后台任务回生成页 > 普通草稿结果页。
因此 map_match3d_work_summary_response / map_match3d_work_profile_response 需要从 work profile snapshot 反序列化 generated_item_assets_json 并输出 generatedItemAssets 与顶层背景字段。前端 Match3DResultView 的读取顺序为:有 draft.generatedItemAssets 时先用 draft 保留本次生成顺序和图片;同 itemId 在 profile.generatedItemAssets 中已有 imageViews[] 或 imageSrc/imageObjectKey 时,用 profile 图片字段补齐 draft;背景资产同样必须从 profile 或 draft 的首个 backgroundAsset 保留到保存 payload;从草稿架重进没有 draft 时,用 profile.generatedItemAssets;两者都没有才回退到默认素材占位。
结果页 作品信息 Tab 字段命名对齐拼图草稿:
作品名称对应 Match3DgameName。作品描述对应 Match3Dsummary,草稿生成阶段由同一次作品生成计划自动填入。作品标签对应 Match3Dtags,草稿生成阶段在写入名称和描述后自动调用标签生成器填入;结果页仍允许用户继续编辑或再次 AI 生成。- 封面图与作品名称不再拆成左右两个大模块;封面只作为同一 Tab 内的可选入口,避免和作品基础信息割裂。旧称“碰面图”统一改为“封面图”。草稿生成默认使用生成出的中心容器 UI 图作为
coverImageSrc。点击封面图必须弹出独立编辑面板,不允许在当前作品信息面板下方展开。封面面板布局对齐拼图创作页上传卡:移动端优先,左侧/上方为方形预览卡,预览卡本身就是上传热区;上传图片后,预览卡内出现和拼图入口一致的AI重绘开关与删除按钮,面板底部不再额外展示旧AI重绘选项。已有上传图时,右侧/下方输入框标题为AI重绘要求;关闭 AI 重绘时只把上传图 Data URL 写入封面字段,不调用生图模型。没有上传图时,输入框标题为封面描述,可选择多张参考图后调用 VectorEnginegpt-image-2-all文生图链路,参考图通过请求体image数组传入;参考图来源支持直接引用物品素材/UI素材中已有图片,也支持自定义上传。上传图 AI 重绘与无上传图多参考图生成都通过api-server的 Match3D 作品封面生成接口完成,生成结果转存到generated-match3d-assets/{sessionId}/{profileId}/cover/{taskId}/cover.png后再写回coverImageSrc。
结果页 难度配置 Tab 取代旧 玩法配置,不再展示旧的分散输入项。该 Tab 顶部使用横向离散拖动条调整难度,四个刻度分别为 轻松 / 标准 / 进阶 / 硬核;拖动条只能落在这四个点上,刻度标签可点击切换。该 Tab 必须与创作入口页使用同一组难度选项,并统一把原“类型素材图片 / 局内类型”等口径归一为 物品种类:
| 难度 | clearCount | difficulty | 总物品数 | 物品种类 |
|---|---|---|---|---|
| 轻松 | 8 | 2 | 24 | 3 |
| 标准 | 12 | 4 | 36 | 9 |
| 进阶 | 16 | 6 | 48 | 15 |
| 硬核 | 21 | 8 | 63 | 21 |
预览区展示 需要消除、总物品数、物品种类 和 已生成物品种类。历史草稿如果保存的是旧 clearCount/difficulty,前端按 clearCount 精确命中优先、否则按 difficulty 就近归一到上述选项,并把归一后的数值保存回 profile。发布校验以 generatedItemAssets[] 中 image_ready 且至少有 5 张有效 imageViews[] 的素材数量为准;试玩启动时用同一数量计算 itemTypeCountOverride,不足时自动降低,不修改草稿难度配置本身。历史单图 imageSrc/imageObjectKey 只作为运行态和预览兜底,不计入新发布素材完成数。
结果页 素材配置 Tab 取代旧一级素材入口,当前包含三个子 Tab:
物品:显示 2D 物品素材列表、五视角预览和素材名称;点击音效提示词与生成入口已临时隐藏。UI:预览生成的竖屏游戏纯背景图,并在独立运行态 UI 预览面板中叠加当前中心容器形象。背景读取顺序为 draft 顶层背景、draftgeneratedBackgroundAsset、profile 顶层背景、profilegeneratedBackgroundAsset、generatedItemAssets[].backgroundAsset、本地兜底图;容器读取generatedItemAssets[].backgroundAsset.containerImageSrc/containerImageObjectKey,缺失时使用默认圆形容器。该页必须展示默认画面描述提示词,默认值来自草稿生成计划的backgroundPrompt或持久化backgroundAsset.prompt;用户修改后点击重新生成,先弹出确认消耗泥点面板并展示消耗 2 泥点,确认后调用POST /api/creation/match3d/works/{profileId}/background-image,现阶段后端仍会同时生成纯背景图和容器 UI 图,并把新的backgroundAsset写回同一份generated_item_assets_json。确认后按钮区域必须显示生成进度条,按90秒估算倒计时,后端真实返回后立即收口。UI 子 Tab 的预览面板直接用当前纯背景图、容器 UI 图、顶部返回/倒计时/重开控件和底部默认托盘模拟竖屏页面,不在 Tab 下方内联展开。容器形象:预览和重新生成1:1中心容器 UI 图,页面能力与UI子 Tab 对齐,包含方形容器预览、容器提示词输入、独立运行态 UI 预览面板、泥点确认和生成进度。默认提示词来自持久化backgroundAsset.containerPrompt,缺失时从当前题材、作品描述和容器参考约束生成兜底提示词;用户修改后点击重新生成,先弹出确认消耗泥点面板并展示消耗 2 泥点,确认后调用POST /api/creation/match3d/works/{profileId}/container-image,按钮区域同样按90秒估算显示倒计时进度。该接口只重新生成并写回backgroundAsset.containerPrompt/containerImageSrc/containerImageObjectKey,必须保留已有纯背景prompt/imageSrc/imageObjectKey、物品素材、历史背景音乐和点击音效字段,避免用户只换容器时刷新掉背景图或物品素材。
旧一级 音乐 Tab 删除;素材配置 > 背景音乐 当前也不展示。
素材配置 > 物品 详情页只保留:
- 五视角预览区:优先展示
imageViews[],缺失时展示兼容字段imageSrc/imageObjectKey。 - 素材名称输入。
- 不展示点击音效提示词输入或点击音效生成入口。
五视角预览区采用“上方大预览 + 底部缩略图栏”的布局:上方是方形焦点预览区,中间横向排列当前物品的各视角图片,并用内框标出当前焦点;底部缩略图栏固定露出 4 个方形槽位,多出的第 5 个视角通过横向滚动访问。点击缩略图只切换焦点视角,不在面板内新增说明文案或额外规则区。
详情页不再展示参考图、用途、模型提示词、文生/图生切换、状态查询、下载列表、taskUuid 或 subscriptionKey。
物品素材 列表项点击必须弹出独立预览面板,不允许在列表右侧或列表下方内联展示。列表本身使用移动端至少两列的多列卡片布局;每个列表项只展示图片预览、物品名称和垃圾箱删除图标,不展示用途、状态胶囊、视角数量或 2D素材 标记。预览面板只承担查看五视角图片和编辑素材名称;不再展示单项 重新生成 按钮。列表项自身支持单项删除,删除后立即把剩余 generatedItemAssets 写回作品 profile。批量新增通过列表顶部按钮打开独立面板,面板内每个输入框只输入一个物品名称,新增物品名称 按钮追加一个输入框;提交按钮点击后必须先弹出 确认消耗泥点 面板并展示按当前有效名称计算出的泥点数,用户确认后才按输入框顺序清洗、去重并调用 Match3D 作品批量生图接口。批量重新生成通过列表顶部另一个按钮打开独立面板,面板预填当前全部素材名称,用户可清空不需要重新生成的输入框;提交按钮点击后同样先弹出泥点确认面板,确认后按输入框顺序清洗、去重并以替换模式调用同一接口。生成进度同时显示在批量面板和 素材配置 > 物品 列表顶部,面板可关闭,后台生成继续推进,不阻塞封面或 UI 生成操作。后端复用草稿生成的素材图、切图和 OSS 上传流程,但新增模式仅按实际可新增名称持久化,不重新生成已有物品;替换模式仅按实际匹配到的已有名称持久化,不新增物品、不改变 itemId。两者都不新增 SpacetimeDB 表,最终仍写回同一份 generated_item_assets_json。批量新增和批量重新生成都先补齐到 5 个参与整图生成,随后丢弃补齐用临时物品,只对真实新增或真实替换物品抠背景、切割和上传。计费按实际新增或替换名称每 5 个消耗 2 泥点,不足 5 个向上取整;重复名称、已有名称、未匹配名称和超过容量上限的名称不计费。
6.1 音频生成与扣费
抓大鹅结果页音频生成当前临时关闭:
素材配置 > 背景音乐不展示。素材配置 > 物品详情面板不展示点击音效提示词和生成入口。- 通用
/api/creation/audio/*路由对match3d_work/match3d_item暂时返回410 Gone,防止旧前端或脚本继续触发抓大鹅扣费音频任务。 - 历史
generatedItemAssets[].backgroundMusic与clickSound字段保留,运行态仍可消费旧音频;结果页不提供重新生成入口。
创作入口不展示 生成音效 Toggle。草稿生成阶段不产生背景音乐或物品点击音效任务,也不产生音频相关扣费;入口只产生一次固定 10 泥点的草稿生成扣费。结果页 素材配置 > UI 重新生成背景固定扣 2 泥点;素材配置 > 容器形象 单独重新生成容器同样固定扣 2 泥点。
7. 验收
建议执行:
npm run check:encoding
npm run test -- src\services\miniGameDraftGenerationProgress.test.ts
npm run test -- src\components\match3d-result\Match3DResultView.test.tsx
npm run test -- src\components\match3d-runtime\Match3DRuntimeShell.test.tsx
npm run test -- src\components\rpg-entry\RpgEntryFlowShell.agent.interaction.test.tsx
npm run typecheck
cargo test -p shared-contracts match3d --manifest-path server-rs\Cargo.toml
cargo test -p spacetime-client match3d --manifest-path server-rs\Cargo.toml
cargo test -p platform-oss --manifest-path server-rs\Cargo.toml
cargo test -p api-server match3d --manifest-path server-rs\Cargo.toml
cargo check -p api-server --manifest-path server-rs\Cargo.toml
cargo check -p spacetime-client --manifest-path server-rs\Cargo.toml
cargo check -p spacetime-module --manifest-path server-rs\Cargo.toml
真实草稿生成需要本地私密环境配置 VECTOR_ENGINE_BASE_URL / VECTOR_ENGINE_API_KEY / VECTOR_ENGINE_IMAGE_REQUEST_TIMEOUT_MS;其中物品素材 sheet 走 VectorEngine Gemini 原生 generateContent,封面和 9:16 纯背景走 VectorEngine /v1/images/generations 的 gpt-image-2-all JSON 链路,1:1 容器 UI 走 VectorEngine /v1/images/edits multipart 参考图链路。同时必须补齐完整 ALIYUN_OSS_BUCKET、ALIYUN_OSS_ENDPOINT、ALIYUN_OSS_ACCESS_KEY_ID、ALIYUN_OSS_ACCESS_KEY_SECRET。如果只配置 bucket 和 endpoint,抓大鹅素材、封面或背景生成会在调用外部生图前返回 OSS 未完成环境变量配置,details.missingEnv 会列出缺少的 AccessKey 项;不要回退到 Rodin/GLB 或伪造本地上传成功。临时关闭期间不需要音频上游配置。后端改动后使用 npm run api-server 启动,并检查 /healthz。