Skip to content

里程碑规划

里程碑规划

Milestone 0:现有项目梳理

目标:明确当前 AgentDrivenSurvey 的可复用部分和需要重构的边界。

任务:

  • 梳理现有前后端目录结构。
  • 梳理当前 questionnaire/context/config 存储方式。
  • 梳理 tool_use、extract_data、conclude_interview、render_interactive 的实现。
  • 梳理 session/transcript 数据结构。
  • 梳理 Notion export。
  • 标记单项目假设。

产出:

  • repo audit document;
  • refactor checklist;
  • migration risk list。

Milestone 1:多 Project / Study 基础架构

目标:打破单项目限制。

任务:

  • 新增 workspace/project/study 数据模型。
  • 新增 study version。
  • 把原有全局配置迁移到 study config。
  • 修改 session 与 study_version 绑定。
  • Admin UI 支持 project/study 切换。

验收:

  • 可以创建多个 study。
  • 每个 study 使用独立 prompt/config/schema。
  • 旧单项目 demo 可以作为一个 study 运行。

Milestone 2:Agent Harness v1

目标:把现有对话逻辑改造成显式 harness。

任务:

  • 定义 SessionState。
  • 定义 StudyObjective。
  • 实现 choose_next_objective。
  • 实现 decide_next_action。
  • 实现 action executor。
  • 记录 AgentDecisionLog。
  • 实现 conclude rules。

验收:

  • Agent 能按 objective 推进访谈。
  • 能基于 coverage 决定追问。
  • 能稳定结束。
  • 每次 action 有日志。

Milestone 3:Interaction UI 协议

目标:让 Agent 能自主调用前端交互组件。

任务:

  • 定义 InteractionToolCall schema。
  • 定义 InteractionToolResult schema。
  • 后端持久化 tool_call/result。
  • 前端实现 RadioCardGroup。
  • 前端实现 CheckboxCardGroup。
  • 前端实现 LikertScale。
  • 前端实现 RankingList。
  • 接入 streaming event。

验收:

  • Agent 调用 render_interaction 后,前端能渲染组件。
  • 用户提交后,Agent 能继续对话。
  • 交互结果进入 transcript 和 extraction。

Milestone 4:Output Schema + Extraction v1

目标:结构化结果和证据链。

任务:

  • 定义 output_schema_versions。
  • 实现 schema builder 初版。
  • 实现 post-session extraction。
  • 实现 evidence quote linking。
  • 实现 confidence 和 needs_review。
  • Results 页面展示字段和 evidence。

验收:

  • 每个 session 结束后生成字段表。
  • 点击字段可看到证据 quote。
  • 字段可人工修改。
  • 可以导出 JSON/CSV。

Milestone 5:Knowledge Base / RAG v1

目标:让每个 project/study 有独立知识库。

任务:

  • KB CRUD。
  • 文本文档上传/编辑。
  • chunking。
  • embedding。
  • retrieval tool。
  • study 关联 KB。
  • Agent 在需要时调用 retrieve_knowledge。

验收:

  • 不同 study 可选择不同 KB。
  • Agent 能根据 KB 回答概念/产品说明。
  • Retrieval 结果有来源。

Milestone 6:Results Dashboard + Review

目标:研究人员能真正使用结果。

任务:

  • Sessions table。
  • Session detail。
  • Transcript viewer。
  • Tool call viewer。
  • Extracted fields table。
  • Evidence panel。
  • Review queue。
  • Export。

验收:

  • 研究人员能检查每个 AI 结论。
  • 低置信字段能集中 review。
  • 导出可用于 Notion/CSV/JSON。

Milestone 7:Demo + Documentation

目标:发布可演示版本。

任务:

  • Seed demo project。
  • Seed demo study:AgentSurvey 需求验证。
  • 写 README。
  • 写 deployment guide。
  • 录制 demo flow。
  • 写 architecture docs。

验收:

  • 新用户可以本地启动。
  • 可以跑完整 demo。
  • README 清楚解释定位和架构。

版本建议

v0.1

  • 单 workspace。
  • 多 project/study。
  • 基础 chat + 2 个 interaction components。
  • post-session extraction。

v0.2

  • 4-5 个 interaction components。
  • evidence-backed fields。
  • study version。
  • basic KB。

v0.3

  • Agent Harness decision log。
  • Results dashboard。
  • review queue。
  • CSV/JSON/Notion export。

v0.4

  • templates。
  • cross-session synthesis。
  • model gateway。
  • observability。

v1.0

  • 稳定 self-host。
  • 多项目生产可用。
  • 插件化 tool registry。
  • 文档完善。
  • 基础安全隐私能力。