Skip to content

Latest commit

 

History

History
148 lines (112 loc) · 8.44 KB

File metadata and controls

148 lines (112 loc) · 8.44 KB

loop-deepseek 路线图 (ROADMAP.md)

版本路线图与后续规划。当前版本 v0.1.0 为 ReAct Loop 引擎核心。

Copyright 2026 Perry Link | License: Apache 2.0


当前状态 / Current Status

指标
当前版本 v0.1.0 (2026-06-13)
功能完成度 ~95%(ReAct loop 引擎 + reasoning_content 管理 + 6 工具 + Guard + Budget + 收敛判断 + 项目治理文件体系 + E2E 测试骨架)
工作流完整度 ~15%(仅 ReAct loop 引擎,无完整软件工程工作流)

版本路线 / Version Roadmap

v0.2.0 -- E2E 集成与可观测性(预计 Q3 2026)

目标: 补齐 v0.1.0 中的待完善项,提升可观测性。

  • [~] E2E 集成测试 -- 完整的端到端测试套件,覆盖多轮 tool calling 场景,验证 reasoning_content 跨轮次回传完整性。v0.1.1 已具备 CLI 参数解析和错误处理的 E2E 骨架(tests/e2e.test.ts),多轮 tool calling 场景的深度 E2E 测试仍需完善。
  • Bash 沙箱增强 -- 当前 Windows 上隔离度不足;探索基于 Docker/Podman 的容器化沙箱方案(--sandbox docker),或 Windows Job Object 限制
  • Reasoning 缓存去重算法 -- 跨轮次 reasoning_content 精确去重,提升缓存命中率统计精度(当前使用首 200 字符摘要 + 标记位检测)
  • state.json 持久化 -- 内存状态落盘,支持中断后恢复(resume)、崩溃恢复(atomic write + tmp 文件 + rename)、外部监控标准化接口
    • 参考:Creative_supplement_audit8.txt 补充1 完整方案
    • 字段:state_version, turn, task, budget_snapshot, modified_files, last_reasoning_hash, last_checkpoint_timestamp
    • 写入策略:每轮结束后原子写入(tmp → rename),最大保留 5 个 checkpoint
  • --resume 能力 -- 从 state.json 恢复中断的任务继续执行

v0.3.0 -- 工具生态扩展(预计 Q4 2026)

  • MCP 工具集成 -- 支持 Model Context Protocol (MCP) 工具服务器,允许扩展外部工具(数据库查询、API 调用、云服务管理等)。
    • 启动时通过 --mcp-server <url> 参数注册 MCP 工具
    • 工具定义动态注入,与内置 6 工具统一调度
    • Guard Layer 扩展:MCP 工具同样受 L0/L1/L2 规则约束
  • 多 Tool 并行调用 -- 单轮多个 tool_call 并发执行(当前为顺序执行)。
    • 无依赖关系的 tool_call 并行执行(bash 修改 A 文件 + write 创建 B 文件)
    • 有依赖关系的 tool_call 保持顺序(write → read 验证)
    • 依赖图分析基于文件路径和工具类型
  • --verbose 模式完善 -- 完整 diagnostics 输出(消息结构、token 粒度统计、Gate 状态),当前仅有基础实现

v0.4.0 -- 子 Agent 与工作流(预计 Q1 2027)

  • 子 Agent 分派 -- 支持主 agent 派生子 agent 处理独立子任务。
    • 子 agent 继承主 agent 的配置和 token budget 配额
    • 子 agent 结果以结构化摘要回传给主 agent
    • 子 agent 拥有独立的 Guard Layer 和收敛判断
    • 灵感来源:loop-claudecode 的 subagent-driven-development 模式
  • Part 1 设计气泡 -- 多轮 brainstorming 收敛,在启动执行前进行设计讨论。
    • 给定任务后,先进行 2-5 轮设计迭代(探索方案、权衡利弊)
    • 产出设计气泡摘要注入 system prompt
    • 设计轮次不计入 maxTurns(但受 token budget 约束)
  • 基础 Artifacts 管理 -- 产物索引、checksum 校验、过期检测。
    • artifacts/ 目录 + artifacts.json 索引文件
    • SHA256 checksum + 文件大小 + 创建时间 + 关联轮次
    • 会话结束后过期检测(临时文件自动清理)

v1.0.0 -- 完整工作流(预计 Q2 2027)

  • Part 2 完整工作流 -- Plan → Task 拆分 → 实施 → Code Review → E2E 测试 → 验证 → 路由。
    • 灵感来源:loop-claudecode 完整工作流体系
    • Plan 阶段:分析任务 → 拆分子任务 → 生成实施计划
    • Task 阶段:按计划逐步实施,每步可独立收敛
    • CR 阶段:自动 code review(基于代码质量规则和 Guard Layer)
    • Test 阶段:自动生成和执行 E2E 测试
    • Verify 阶段:验证产物正确性(checksum / diff / 功能验证)
    • Route 阶段:根据结果路由(通过 → 下一子任务 / 失败 → 回退重试 / 完成 → 退出)
  • 完整 convergence_counter -- 从 loop-claudecode 移植的完整收敛检测。
    • P0/P1/P2 问题分级(致命 / 重要 / 轻微)
    • 收敛计数器——连续 N 轮无 P0/P1 问题时判定收敛
    • 自适应轮次上限——根据任务复杂度动态调整 maxTurns
  • state.json 状态机 -- 完整的 phase 分发状态机(Plan → Task → CR → Test → Verify → Route)。
    • .lock 协议防止并发写入
    • 崩溃恢复(从 tmp 文件恢复最后一致状态)
    • 跨会话状态迁移(v1 → v2 schema 升级)

已完成 / Completed

版本 功能 状态
v0.1.0 ReAct Loop 引擎(自建 Thought→Action→Observation) 已完成
v0.1.0 reasoning_content 三策略管理(FULL_RETENTION / CACHE_INJECTION / THINKING_DISABLED) 已完成
v0.1.0 6 个内置工具(bash / read / write / edit / glob / grep) 已完成
v0.1.0 Guard Layer 20 规则三级拦截(L0/L1/L2) 已完成
v0.1.0 Token Budget 追踪(分离三计数器 + 90% compaction / 98% hard stop) 已完成
v0.1.0 收敛判断 5+2 停止条件 已完成
v0.1.0 DeepSeek API 客户端(SSE 流解析 + 指数退避重试) 已完成
v0.1.0 Message 全生命周期构建器(reasoning_content round-trip) 已完成
v0.1.0 单二进制 Bun 编译(零运行时依赖) 已完成
v0.1.1 E2E 测试骨架(CLI 参数解析 / 帮助输出 / 错误处理 / smoke test) 已完成
v0.1.1 项目治理文件体系(.editorconfig / .eslintrc / .prettierrc / ISSUE+PR 模板 / SECURITY / CONTRIBUTING) 已完成
v0.1.1 文档完善(DESIGN.md v2 路线图澄清 / CHANGELOG v0.1.1 / README & ROADMAP 完成度更新) 已完成

技术债务与改进项(跨版本)

以下改进项贯穿于所有版本开发过程中:

性能

  • 首轮响应加速 -- 预连接 HTTP keep-alive;减少首次 API 调用延迟
  • Compaction 摘要质量优化 -- 增加文件变更列表、关键操作摘要、每轮 reasoning 缓存注入
  • Streaming 输出实时化 -- 模型 content 实时流式输出到 stdout(当前仅在 SSE 解析完成后整块输出)

可移植性

  • Windows 沙箱增强 -- Bash 工具在 Windows 上的隔离度提升(Job Object / 容器化)
  • 非 Bash Shell 支持 -- 支持 cmd.exe / PowerShell 作为 bash 替代(Windows 环境无 Git Bash 时)
  • Node.js 兼容 -- 探索 node 运行时替代 Bun 的可能性(降低用户门槛)

安全

  • Guard Layer 规则热更新 -- 支持从外部规则文件加载自定义 Guard 规则(签名校验防止篡改)
  • Token Budget 审计日志 -- 完整的 token 消耗审计日志(时间戳、模型、消耗量、成本),便于财务核算
  • API Key 加密存储 -- 支持从加密文件或系统凭据管理器读取 API key(替代明文环境变量)

文档

  • API 参考文档(各模块完整函数签名 + 参数说明)
  • 架构决策记录(ADR -- Architecture Decision Records)
  • 性能基准报告(benchmark 数据:不同模型、不同任务规模的 token 消耗和耗时)

贡献指南

欢迎提交 PR 和 Issue 参与路线图讨论。具体功能的技术方案请先通过 Issue 讨论后再实施。

  • 技术上完全可行的直接标记 help wanted / good first issue
  • 需进一步论证的请先发 Discussion
  • 安全相关请遵循 SECURITY.md 报告流程

参考来源