版本路线图与后续规划。当前版本 v0.1.0 为 ReAct Loop 引擎核心。
Copyright 2026 Perry Link | License: Apache 2.0
| 指标 | 值 |
|---|---|
| 当前版本 | v0.1.0 (2026-06-13) |
| 功能完成度 | ~95%(ReAct loop 引擎 + reasoning_content 管理 + 6 工具 + Guard + Budget + 收敛判断 + 项目治理文件体系 + E2E 测试骨架) |
| 工作流完整度 | ~15%(仅 ReAct loop 引擎,无完整软件工程工作流) |
目标: 补齐 v0.1.0 中的待完善项,提升可观测性。
- [~] E2E 集成测试 -- 完整的端到端测试套件,覆盖多轮 tool calling 场景,验证 reasoning_content 跨轮次回传完整性。v0.1.1 已具备 CLI 参数解析和错误处理的 E2E 骨架(
tests/e2e.test.ts),多轮 tool calling 场景的深度 E2E 测试仍需完善。 - Bash 沙箱增强 -- 当前 Windows 上隔离度不足;探索基于 Docker/Podman 的容器化沙箱方案(
--sandbox docker),或 Windows Job Object 限制 - Reasoning 缓存去重算法 -- 跨轮次 reasoning_content 精确去重,提升缓存命中率统计精度(当前使用首 200 字符摘要 + 标记位检测)
-
state.json持久化 -- 内存状态落盘,支持中断后恢复(resume)、崩溃恢复(atomic write + tmp 文件 + rename)、外部监控标准化接口- 参考:
Creative_supplement_audit8.txt补充1 完整方案 - 字段:
state_version,turn,task,budget_snapshot,modified_files,last_reasoning_hash,last_checkpoint_timestamp - 写入策略:每轮结束后原子写入(tmp → rename),最大保留 5 个 checkpoint
- 参考:
-
--resume能力 -- 从state.json恢复中断的任务继续执行
- MCP 工具集成 -- 支持 Model Context Protocol (MCP) 工具服务器,允许扩展外部工具(数据库查询、API 调用、云服务管理等)。
- 启动时通过
--mcp-server <url>参数注册 MCP 工具 - 工具定义动态注入,与内置 6 工具统一调度
- Guard Layer 扩展:MCP 工具同样受 L0/L1/L2 规则约束
- 启动时通过
- 多 Tool 并行调用 -- 单轮多个 tool_call 并发执行(当前为顺序执行)。
- 无依赖关系的 tool_call 并行执行(bash 修改 A 文件 + write 创建 B 文件)
- 有依赖关系的 tool_call 保持顺序(write → read 验证)
- 依赖图分析基于文件路径和工具类型
-
--verbose模式完善 -- 完整 diagnostics 输出(消息结构、token 粒度统计、Gate 状态),当前仅有基础实现
- 子 Agent 分派 -- 支持主 agent 派生子 agent 处理独立子任务。
- 子 agent 继承主 agent 的配置和 token budget 配额
- 子 agent 结果以结构化摘要回传给主 agent
- 子 agent 拥有独立的 Guard Layer 和收敛判断
- 灵感来源:loop-claudecode 的
subagent-driven-development模式
- Part 1 设计气泡 -- 多轮 brainstorming 收敛,在启动执行前进行设计讨论。
- 给定任务后,先进行 2-5 轮设计迭代(探索方案、权衡利弊)
- 产出设计气泡摘要注入 system prompt
- 设计轮次不计入 maxTurns(但受 token budget 约束)
- 基础 Artifacts 管理 -- 产物索引、checksum 校验、过期检测。
artifacts/目录 +artifacts.json索引文件- SHA256 checksum + 文件大小 + 创建时间 + 关联轮次
- 会话结束后过期检测(临时文件自动清理)
- Part 2 完整工作流 -- Plan → Task 拆分 → 实施 → Code Review → E2E 测试 → 验证 → 路由。
- 灵感来源:loop-claudecode 完整工作流体系
- Plan 阶段:分析任务 → 拆分子任务 → 生成实施计划
- Task 阶段:按计划逐步实施,每步可独立收敛
- CR 阶段:自动 code review(基于代码质量规则和 Guard Layer)
- Test 阶段:自动生成和执行 E2E 测试
- Verify 阶段:验证产物正确性(checksum / diff / 功能验证)
- Route 阶段:根据结果路由(通过 → 下一子任务 / 失败 → 回退重试 / 完成 → 退出)
- 完整 convergence_counter -- 从 loop-claudecode 移植的完整收敛检测。
- P0/P1/P2 问题分级(致命 / 重要 / 轻微)
- 收敛计数器——连续 N 轮无 P0/P1 问题时判定收敛
- 自适应轮次上限——根据任务复杂度动态调整 maxTurns
-
state.json状态机 -- 完整的 phase 分发状态机(Plan → Task → CR → Test → Verify → Route)。.lock协议防止并发写入- 崩溃恢复(从 tmp 文件恢复最后一致状态)
- 跨会话状态迁移(v1 → v2 schema 升级)
| 版本 | 功能 | 状态 |
|---|---|---|
| v0.1.0 | ReAct Loop 引擎(自建 Thought→Action→Observation) | 已完成 |
| v0.1.0 | reasoning_content 三策略管理(FULL_RETENTION / CACHE_INJECTION / THINKING_DISABLED) | 已完成 |
| v0.1.0 | 6 个内置工具(bash / read / write / edit / glob / grep) | 已完成 |
| v0.1.0 | Guard Layer 20 规则三级拦截(L0/L1/L2) | 已完成 |
| v0.1.0 | Token Budget 追踪(分离三计数器 + 90% compaction / 98% hard stop) | 已完成 |
| v0.1.0 | 收敛判断 5+2 停止条件 | 已完成 |
| v0.1.0 | DeepSeek API 客户端(SSE 流解析 + 指数退避重试) | 已完成 |
| v0.1.0 | Message 全生命周期构建器(reasoning_content round-trip) | 已完成 |
| v0.1.0 | 单二进制 Bun 编译(零运行时依赖) | 已完成 |
| v0.1.1 | E2E 测试骨架(CLI 参数解析 / 帮助输出 / 错误处理 / smoke test) | 已完成 |
| v0.1.1 | 项目治理文件体系(.editorconfig / .eslintrc / .prettierrc / ISSUE+PR 模板 / SECURITY / CONTRIBUTING) | 已完成 |
| v0.1.1 | 文档完善(DESIGN.md v2 路线图澄清 / CHANGELOG v0.1.1 / README & ROADMAP 完成度更新) | 已完成 |
以下改进项贯穿于所有版本开发过程中:
- 首轮响应加速 -- 预连接 HTTP keep-alive;减少首次 API 调用延迟
- Compaction 摘要质量优化 -- 增加文件变更列表、关键操作摘要、每轮 reasoning 缓存注入
- Streaming 输出实时化 -- 模型 content 实时流式输出到 stdout(当前仅在 SSE 解析完成后整块输出)
- Windows 沙箱增强 -- Bash 工具在 Windows 上的隔离度提升(Job Object / 容器化)
- 非 Bash Shell 支持 -- 支持
cmd.exe/ PowerShell 作为 bash 替代(Windows 环境无 Git Bash 时) - Node.js 兼容 -- 探索
node运行时替代 Bun 的可能性(降低用户门槛)
- Guard Layer 规则热更新 -- 支持从外部规则文件加载自定义 Guard 规则(签名校验防止篡改)
- Token Budget 审计日志 -- 完整的 token 消耗审计日志(时间戳、模型、消耗量、成本),便于财务核算
- API Key 加密存储 -- 支持从加密文件或系统凭据管理器读取 API key(替代明文环境变量)
- API 参考文档(各模块完整函数签名 + 参数说明)
- 架构决策记录(ADR -- Architecture Decision Records)
- 性能基准报告(benchmark 数据:不同模型、不同任务规模的 token 消耗和耗时)
欢迎提交 PR 和 Issue 参与路线图讨论。具体功能的技术方案请先通过 Issue 讨论后再实施。
- 技术上完全可行的直接标记
help wanted/good first issue - 需进一步论证的请先发 Discussion
- 安全相关请遵循 SECURITY.md 报告流程
- DESIGN.md -- 项目设计文档(§1.3 v2 规划)
- Creative.txt -- 完整技术规范(§2 暂不开发列表、§3.3 收敛判断 v2 展望)
- Creative_supplement_audit8.txt -- state.json 持久化方案
- IMPLEMENTATION_PLAN.md -- 实施计划(M5 可选优化项)
- loop-claudecode -- 完整工作流参考(Part 1/2、convergence_counter、artifacts、state.json 状态机)