15 KiB
Genarrative 视觉小说“一句话生成”最小闭环落地计划
生成时间:2026-05-13 11:22
工作区:C:/proj/Genarrative/.worktrees/hermes-visual-novel
参考文档:C:/Users/DSK/Documents/Interactive-fiction/一句话生成视觉小说整体流程总结.md
1. 目标
把 Interactive-fiction 总结文档中的“一句话生成视觉小说”流程,映射并落地到 Genarrative 现有视觉小说能力中,优先做成一个可端到端验证的最小闭环:
- 用户在视觉小说入口输入一句话并选择画风。
- 前端进入生成过程页,展示分阶段进度。
- 后端创建视觉小说创作会话,并基于 seedText 生成
VisualNovelResultDraft。 - 生成完成后进入草稿结果页,可看到世界观、角色、场景、剧情阶段、开场选择。
- 草稿可编译/保存为作品 profile,并进入视觉小说运行态测试/正式游玩。
本计划只覆盖 Genarrative 内部最小闭环,不引入 Interactive-fiction 原项目的独立 TXT 播放记录、分享播放包、外部活动运营、独立账号/交易/资产系统。
2. 当前上下文与已发现实现
2.1 Interactive-fiction 总结文档提炼
参考文档将整体流程分为:
- 输入侧:一句话创意、主题/风格、可选文档或素材。
- 生成侧:理解意图、扩展世界观、角色、场景、剧情阶段、开场与选择。
- 编辑侧:草稿页可查看和调整生成结果。
- 运行侧:从草稿进入视觉小说游玩,支持剧情推进、玩家选择、历史与状态。
- 资产侧:角色立绘、背景、音乐/音效可作为后续增强,最小闭环可先使用文字描述与空资产占位。
2.2 Genarrative 已有实现基础
已确认项目中视觉小说相关能力并非从零开始:
- 前端入口表单:
src/components/visual-novel-creation/VisualNovelAgentWorkspace.tsx- 已有“一句话创作” textarea、6 个视觉画风选项、提交按钮“生成视觉小说草稿”。
- 前端入口 payload/progress:
src/components/visual-novel-creation/visualNovelEntryGeneration.ts- 已有
VisualNovelEntryFormPayload、锚点展示、一句话/画风生成进度步骤。
- 前端平台主流程:
src/components/platform-entry/PlatformEntryFlowShellImpl.tsx- 已接入
createVisualNovelDraftFromForm,会创建 session、stream message、进入visual-novel-generating,完成后进入visual-novel-result。
- 前端 API client:
src/services/visual-novel-creation/visualNovelCreationClient.ts- 已封装 session/message/action/compile 接口。
- 共享契约:
packages/shared/src/contracts/visualNovel.ts- 已定义
VisualNovelResultDraft、world/characters/scenes/storyPhases/opening/runtimeConfig/work/run/history 等结构。
- 后端 API:
server-rs/crates/api-server/src/visual_novel.rs- 已有创建 session、发消息、流式消息、执行 action、compile、work、runtime run 等接口。
- 后端 prompt:
server-rs/crates/api-server/src/prompt/visual_novel.rs- 已有
VISUAL_NOVEL_CREATION_SYSTEM_PROMPT、结构化输出契约、runtime GM prompt、repair prompt。
- SpacetimeDB 模块:
server-rs/crates/spacetime-module/src/visual_novel.rs- 已有 session/message/work/run/history/event 表与 procedure。
- 文档参考:
docs/prd/AI_NATIVE_VISUAL_NOVEL_TEMPLATE_PRD_2026-05-05.mddocs/technical/VISUAL_NOVEL_IMPLEMENTATION_HANDOFF_2026-05-07.mddocs/technical/VISUAL_NOVEL_PROMPT_AND_LLM_TOOLS_VN03_2026-05-05.md
2.3 关键实现判断
当前项目已经实现了视觉小说的主要骨架,本次不应大规模重写。更合理的落地方式是补齐“一句话生成”闭环中最容易断裂的点:
- 入口输入与画风信息是否被稳定传给后端 prompt。
- 后端生成 draft 后是否自动保存/关联可编辑 work profile。
- 生成过程页是否能清晰展示 Interactive-fiction 文档中提到的阶段。
- 结果页是否有足够的字段展示与继续游玩入口。
- 运行态是否能基于 opening/choices 正常启动,而不依赖尚未生成的图片/音乐资产。
3. 拟采用方案
3.1 最小闭环范围
本次优先实现:
- “一句话 + 视觉画风”作为
sourceMode: 'idea'的 seedText。 - 后端生成完整
VisualNovelResultDraft,包括:- world
- 3-6 个角色
- 3-8 个场景
- 3-6 个剧情阶段
- opening narration/firstDialogue/2-4 个 choices
- runtimeConfig
- 若 LLM 输出失败,使用 repair 或确定性 fallback,保证可回到草稿页并显示错误/警告。
- 结果页支持保存/编译为 work profile。
- work profile 支持启动 runtime run,opening 能展示初始场景、旁白、对话和选择。
暂不做或仅预留:
- 真实图片/音乐生成队列。
- 多文档解析导入的完整链路。
- 复杂分镜/节点图编辑器。
- 外部 Interactive-fiction 项目的播放器、TXT 记录包、分享活动、独立账号系统。
3.2 与 Genarrative 架构的映射
| Interactive-fiction 概念 | Genarrative 落点 |
|---|---|
| 一句话创意 | VisualNovelEntryFormPayload.ideaText / seedText |
| 画风/主题 | seedText 中的“视觉画风/画风要求”,后续可结构化为 metadata |
| 世界观设定 | VisualNovelResultDraft.world |
| 角色设定 | VisualNovelResultDraft.characters |
| 场景设定 | VisualNovelResultDraft.scenes |
| 剧情阶段/章节 | VisualNovelResultDraft.storyPhases |
| 开场文本与选项 | VisualNovelResultDraft.opening |
| 运行时剧情推进 | VisualNovelRuntimeStep[] + run snapshot/history |
| 发布/作品库 | VisualNovelWorkProfileRecord / works API |
4. 分步计划
Step 1:补齐入口 payload 与生成过程语义
涉及文件:
src/components/visual-novel-creation/VisualNovelAgentWorkspace.tsxsrc/components/visual-novel-creation/visualNovelEntryGeneration.tssrc/components/platform-entry/PlatformEntryFlowShellImpl.tsx
任务:
- 保持现有 6 个画风选项,但确认每个 option 的 prompt 会进入
seedText。 - 将生成过程阶段从当前 3 步细化为更贴合参考文档的 4-5 步,例如:
- 理解一句话创意
- 扩展世界观与玩家身份
- 设计角色/场景/剧情阶段
- 生成开场与选择
- 准备可编辑草稿
- 生成过程页的 anchor 保留“一句话”和“视觉画风”,必要时增加“生成目标:视觉小说草稿”。
- 确认
createVisualNovelDraftFromForm对失败状态会保留返回入口/重试能力。
验收点:提交一句话后能进入 visual-novel-generating,看到阶段进度;完成后进入 visual-novel-result。
Step 2:增强后端 creation prompt 与 fallback 约束
涉及文件:
server-rs/crates/api-server/src/prompt/visual_novel.rsserver-rs/crates/api-server/src/visual_novel.rs- 如已有 domain crate:
server-rs/crates/module-visual-novel/**或相关 normalize/validate 文件
任务:
- 在 creation prompt 中显式吸收 Interactive-fiction 的“一句话生成”目标:
- 从 seedText 提取核心创意、视觉风格、故事类型。
- 生成可直接运行的 opening 和 choices。
- 图片/音乐资产先置 null,但必须有可生成图像的描述。
- 强化输出约束:
opening.sceneId必须指向存在且 availability 为opening的 scene。opening.initialChoices必须 2-4 个。storyPhases[0]必须包含 opening scene 和主要角色。publishReady的判定与 validationIssues 一致。
- 检查
submit_visual_novel_message_turn/resolve_action_draft/ compile 相关代码:- 如果 LLM 失败,是否已有 fallback;没有则补确定性 fallback draft。
- 如果 draft 不完整,是否会 normalize/repair 并写入 session。
- 保留现有“不要输出旧 TXT 播放记录、分享播放包、外部商业字段”的约束,避免把参考项目的外部概念误并入 Genarrative。
验收点:后端给定 seedText 时,返回 session.draft 不为空且满足共享契约。
Step 3:确认草稿结果页、保存/编译与作品库链路
涉及文件:
src/components/platform-entry/PlatformEntryFlowShellImpl.tsxsrc/components/visual-novel-creation/**src/services/visual-novel-works*或相关 visual novel works clientserver-rs/crates/api-server/src/visual_novel.rspackages/shared/src/contracts/visualNovel.ts
任务:
- 查找并确认
visual-novel-result页面组件:- 是否显示 workTitle/workDescription/world/characters/scenes/storyPhases/opening。
- 是否有保存/发布/开始试玩按钮。
- 确认
compileVisualNovelWorkProfile或executeVisualNovelAction({kind:'compile_work_profile'})会生成/更新 work profile。 - 确认作品架上使用
profileId而不是 sessionId 作为稳定作品 ID。 - 如果结果页缺少“一句话来源/画风”的可视化提示,可在结果页或 summary 中补轻量展示,避免用户以为画风丢失。
验收点:生成完成后能保存为作品;作品出现在“我的作品/创作架”;再次打开能读取同一 draft。
Step 4:确认运行态 opening 闭环
涉及文件:
src/components/visual-novel-runtime/**src/services/visual-novel-runtime*server-rs/crates/api-server/src/visual_novel.rsserver-rs/crates/api-server/src/prompt/visual_novel.rspackages/shared/src/contracts/visualNovel.ts
任务:
- 启动 visual novel work run 时,优先使用
draft.opening生成第一轮 runtime snapshot/history。 - 如果没有图片/音乐,前端 runtime shell 必须可用文字 fallback,不应白屏或阻断游玩。
- 玩家选择
choice后,后端 runtime GM prompt 生成下一轮VisualNovelRuntimeStep[]。 - 确认正式游玩入口调用
work_play_start,并满足已有埋点约定:scope_kind=workscope_id=稳定作品 ID- metadata 包含
playType/workId/sourceRoute/userId等。
验收点:从生成出的作品进入运行态,能看到 opening 并点击至少一个选择推进一轮。
Step 5:补测试与文档
涉及文件:
- 前端测试:按仓库现有测试布局查找
*.test.ts/*.test.tsx - Rust 测试:
server-rs/crates/api-server/src/**或 domain crate tests - 文档:可追加到
docs/technical/或.hermes/shared-memory/decision-log.md(如团队约定需要)
建议测试:
- TypeScript 单元测试:
buildVisualNovelEntryGenerationProgress阶段输出。buildVisualNovelEntryGenerationAnchorEntries能展示一句话和画风。
- Rust 单元测试:
- creation prompt 包含 seedText、sourceMode、输出契约。
- draft normalize/fallback 能生成合法 opening/choices。
- runtime opening 或 first-step 构造不依赖图片/音乐。
- 集成/手工测试文档:
- 访问平台视觉小说入口。
- 输入一句话。
- 选择画风。
- 点击生成。
- 查看结果页。
- 保存作品。
- 启动试玩并点击选择。
5. 可能改动文件清单
高概率改动:
src/components/visual-novel-creation/VisualNovelAgentWorkspace.tsxsrc/components/visual-novel-creation/visualNovelEntryGeneration.tssrc/components/platform-entry/PlatformEntryFlowShellImpl.tsxserver-rs/crates/api-server/src/prompt/visual_novel.rsserver-rs/crates/api-server/src/visual_novel.rspackages/shared/src/contracts/visualNovel.ts
中概率改动:
src/components/visual-novel-runtime/**src/services/visual-novel-creation/**src/services/visual-novel-runtime/**src/services/visual-novel-works/**server-rs/crates/spacetime-module/src/visual_novel.rsserver-rs/crates/spacetime-client/**生成/绑定文件,若 SpacetimeDB contract 需要更新
低概率/仅文档:
docs/technical/VISUAL_NOVEL_IMPLEMENTATION_HANDOFF_2026-05-07.mddocs/prd/AI_NATIVE_VISUAL_NOVEL_TEMPLATE_PRD_2026-05-05.md.hermes/shared-memory/decision-log.md
6. 验证计划
6.1 静态检查
在 worktree 根目录执行:
npm run typecheck
如仓库无统一 typecheck,则按 package scripts 选择最接近的前端类型检查命令。
6.2 前端定向测试
优先运行与 visual novel / platform entry 相关测试,如存在:
npm test -- visual-novel
npm test -- platform-entry
若仓库使用 vitest:
npm run test -- visual-novel
6.3 Rust 定向测试
在 server-rs 下运行 visual novel 相关测试:
cargo test -p api-server visual_novel
cargo test -p shared-contracts visual_novel
如改动 SpacetimeDB module:
cargo test -p spacetime-module visual_novel
6.4 人工验收步骤
- 启动本地 dev 栈。
- 访问 Genarrative 主站。
- 进入创作/视觉小说入口。
- 输入:
一个雨夜,失忆的高中生在旧图书馆发现一本会回应她心声的日记。 - 选择任一画风,例如“映画动画”。
- 点击“生成视觉小说草稿”。
- 预期:进入生成过程页,能看到分阶段进度。
- 预期:完成后进入草稿结果页,包含标题、简介、世界观、角色、场景、剧情阶段和 opening choices。
- 点击保存/编译作品。
- 从作品入口进入试玩。
- 预期:opening 文本出现,至少 2 个选择可点击;点击后剧情继续推进一轮。
7. 风险、权衡与开放问题
7.1 风险
- 现有视觉小说代码已较完整,贸然新增一套 parallel pipeline 会制造重复逻辑;应复用当前
VisualNovelResultDraft与 creation agent flow。 - LLM 输出不稳定可能导致草稿结构不完整;需要 normalize/repair/fallback 确保最小闭环。
- 视觉/音乐资产生成未接入时,UI 必须接受 null asset,否则运行态可能白屏。
PlatformEntryFlowShellImpl.tsx文件很大,改动需局部、谨慎,避免影响其他玩法入口。- 若改动 SpacetimeDB 表结构,可能牵涉 publish、client binding、清库/迁移;最小闭环阶段应尽量避免 schema 变更。
7.2 权衡
- 先让文字版视觉小说完整跑通,再补角色立绘/背景图生成。
- 先用
seedText承载画风,再考虑把visualStyleId/Label/Prompt结构化进 draft metadata。 - 先用现有 result/work/runtime 页面闭环,不引入新编辑器。
7.3 开放问题
- 用户是否要求把 Interactive-fiction 原项目中的具体 UI 样式/页面布局迁移到 Genarrative?当前计划只迁移流程语义,不迁移独立 UI。
- 画风是否需要成为作品可编辑字段?当前以 seedText/prompt 影响生成内容,后续可在 draft 中增加 metadata。
- 文档导入模式是否本期要做?当前计划聚焦一句话模式,document 模式只保留契约能力。
- 是否需要真实图片/音乐生成?当前计划作为后续增强,不纳入最小闭环。
8. 建议实施顺序
- 先做只改 prompt/progress/少量前端展示的轻量闭环修补。
- 运行前后端定向测试,确认现有能力是否已足够。
- 如果后端没有 fallback 或 normalize,再补 Rust 层确定性兜底。
- 手工跑通“一句话 -> 生成 -> 结果页 -> 保存 -> 试玩”。
- 最后再考虑是否需要资产生成、文档导入、结构化画风 metadata。