2.0 KiB
2.0 KiB
方洞挑战 Agent LLM 超时兜底修复 2026-05-05
1. 问题
现场错误:
方洞挑战聊天生成失败,请稍后重试。:LLM 请求超时,累计尝试 1 次
方洞挑战创作 Agent 在同一轮流式 JSON 中需要返回 replyText、玩法配置、形状选项、洞口选项和图片提示词。模型可能先返回可见回复,再继续输出完整 JSON;如果上游在流式读取阶段超过通用 LLM 请求超时,后端会发送 SSE error,前端只能保留本地 warning 消息,本轮后端会话不会成功推进。
2. 根因
platform-llm 的 LlmTextRequest 只有全局 AppConfig.llm_request_timeout_ms。创作 Agent 统一走 Responses 流式协议,方洞提示词扩展为视觉资产配置后,单轮输出长度明显增加;通用 30 秒超时更适合普通聊天,不适合结构化创作 Agent 的完整 JSON 流。
request_text 的初始 HTTP 请求会按 max_retries 重试,但 stream_text 已经进入 response.chunk() 读取后,当前错误路径固定记录为一次读取超时,所以用户看到“累计尝试 1 次”。
3. 落地策略
- 在
platform-llm::LlmTextRequest增加请求级request_timeout_ms覆写。 execute_request优先使用请求级超时,没有覆写时继续使用全局配置。creation_agent_llm_turn的流式 JSON 请求统一使用更长的创作 Agent 超时窗口。- 该超时窗口只影响创作 Agent 的结构化流式 turn,不改变 RPG 运行时聊天、图片生成、SpacetimeDB procedure 或方洞玩法判定。
- 不新增 SpacetimeDB 表结构,不修改
migration.rs。
4. 验收标准
platform-llm测试覆盖请求级 timeout 会让慢响应提前超时。creation_agent_llm_turn测试覆盖流式 JSON 请求带创作 Agent timeout。cargo test -p platform-llm -p api-server creation_agent --manifest-path server-rs/Cargo.toml通过。- 后端代码变更后按项目约束运行
npm run api-server:maincloud并确认/healthz。