loop-deepseek 路线图 (ROADMAP.md)

版本路线图与后续规划。当前版本 v0.1.0 为 ReAct Loop 引擎核心。

Copyright 2026 Perry Link | License: Apache 2.0

当前状态 / Current Status

指标	值
当前版本	v0.1.0 (2026-06-13)
功能完成度	~95%（ReAct loop 引擎 + reasoning_content 管理 + 6 工具 + Guard + Budget + 收敛判断 + 项目治理文件体系 + E2E 测试骨架）
工作流完整度	~15%（仅 ReAct loop 引擎，无完整软件工程工作流）

版本路线 / Version Roadmap

v0.2.0 -- E2E 集成与可观测性（预计 Q3 2026）

目标： 补齐 v0.1.0 中的待完善项，提升可观测性。

[~] E2E 集成测试 -- 完整的端到端测试套件，覆盖多轮 tool calling 场景，验证 reasoning_content 跨轮次回传完整性。v0.1.1 已具备 CLI 参数解析和错误处理的 E2E 骨架（tests/e2e.test.ts），多轮 tool calling 场景的深度 E2E 测试仍需完善。
Bash 沙箱增强 -- 当前 Windows 上隔离度不足；探索基于 Docker/Podman 的容器化沙箱方案（--sandbox docker），或 Windows Job Object 限制
Reasoning 缓存去重算法 -- 跨轮次 reasoning_content 精确去重，提升缓存命中率统计精度（当前使用首 200 字符摘要 + 标记位检测）
state.json 持久化 -- 内存状态落盘，支持中断后恢复（resume）、崩溃恢复（atomic write + tmp 文件 + rename）、外部监控标准化接口
- 参考：Creative_supplement_audit8.txt 补充1 完整方案
- 字段：state_version, turn, task, budget_snapshot, modified_files, last_reasoning_hash, last_checkpoint_timestamp
- 写入策略：每轮结束后原子写入（tmp → rename），最大保留 5 个 checkpoint
--resume 能力 -- 从 state.json 恢复中断的任务继续执行

v0.3.0 -- 工具生态扩展（预计 Q4 2026）

MCP 工具集成 -- 支持 Model Context Protocol (MCP) 工具服务器，允许扩展外部工具（数据库查询、API 调用、云服务管理等）。
- 启动时通过 --mcp-server <url> 参数注册 MCP 工具
- 工具定义动态注入，与内置 6 工具统一调度
- Guard Layer 扩展：MCP 工具同样受 L0/L1/L2 规则约束
多 Tool 并行调用 -- 单轮多个 tool_call 并发执行（当前为顺序执行）。
- 无依赖关系的 tool_call 并行执行（bash 修改 A 文件 + write 创建 B 文件）
- 有依赖关系的 tool_call 保持顺序（write → read 验证）
- 依赖图分析基于文件路径和工具类型
--verbose 模式完善 -- 完整 diagnostics 输出（消息结构、token 粒度统计、Gate 状态），当前仅有基础实现

v0.4.0 -- 子 Agent 与工作流（预计 Q1 2027）

子 Agent 分派 -- 支持主 agent 派生子 agent 处理独立子任务。
- 子 agent 继承主 agent 的配置和 token budget 配额
- 子 agent 结果以结构化摘要回传给主 agent
- 子 agent 拥有独立的 Guard Layer 和收敛判断
- 灵感来源：loop-claudecode 的 subagent-driven-development 模式
Part 1 设计气泡 -- 多轮 brainstorming 收敛，在启动执行前进行设计讨论。
- 给定任务后，先进行 2-5 轮设计迭代（探索方案、权衡利弊）
- 产出设计气泡摘要注入 system prompt
- 设计轮次不计入 maxTurns（但受 token budget 约束）
基础 Artifacts 管理 -- 产物索引、checksum 校验、过期检测。
- artifacts/ 目录 + artifacts.json 索引文件
- SHA256 checksum + 文件大小 + 创建时间 + 关联轮次
- 会话结束后过期检测（临时文件自动清理）

v1.0.0 -- 完整工作流（预计 Q2 2027）

Part 2 完整工作流 -- Plan → Task 拆分 → 实施 → Code Review → E2E 测试 → 验证 → 路由。
- 灵感来源：loop-claudecode 完整工作流体系
- Plan 阶段：分析任务 → 拆分子任务 → 生成实施计划
- Task 阶段：按计划逐步实施，每步可独立收敛
- CR 阶段：自动 code review（基于代码质量规则和 Guard Layer）
- Test 阶段：自动生成和执行 E2E 测试
- Verify 阶段：验证产物正确性（checksum / diff / 功能验证）
- Route 阶段：根据结果路由（通过 → 下一子任务 / 失败 → 回退重试 / 完成 → 退出）
完整 convergence_counter -- 从 loop-claudecode 移植的完整收敛检测。
- P0/P1/P2 问题分级（致命 / 重要 / 轻微）
- 收敛计数器——连续 N 轮无 P0/P1 问题时判定收敛
- 自适应轮次上限——根据任务复杂度动态调整 maxTurns
state.json 状态机 -- 完整的 phase 分发状态机（Plan → Task → CR → Test → Verify → Route）。
- .lock 协议防止并发写入
- 崩溃恢复（从 tmp 文件恢复最后一致状态）
- 跨会话状态迁移（v1 → v2 schema 升级）

已完成 / Completed

版本	功能	状态
v0.1.0	ReAct Loop 引擎（自建 Thought→Action→Observation）	已完成
v0.1.0	reasoning_content 三策略管理（FULL_RETENTION / CACHE_INJECTION / THINKING_DISABLED）	已完成
v0.1.0	6 个内置工具（bash / read / write / edit / glob / grep）	已完成
v0.1.0	Guard Layer 20 规则三级拦截（L0/L1/L2）	已完成
v0.1.0	Token Budget 追踪（分离三计数器 + 90% compaction / 98% hard stop）	已完成
v0.1.0	收敛判断 5+2 停止条件	已完成
v0.1.0	DeepSeek API 客户端（SSE 流解析 + 指数退避重试）	已完成
v0.1.0	Message 全生命周期构建器（reasoning_content round-trip）	已完成
v0.1.0	单二进制 Bun 编译（零运行时依赖）	已完成
v0.1.1	E2E 测试骨架（CLI 参数解析 / 帮助输出 / 错误处理 / smoke test）	已完成
v0.1.1	项目治理文件体系（.editorconfig / .eslintrc / .prettierrc / ISSUE+PR 模板 / SECURITY / CONTRIBUTING）	已完成
v0.1.1	文档完善（DESIGN.md v2 路线图澄清 / CHANGELOG v0.1.1 / README & ROADMAP 完成度更新）	已完成

技术债务与改进项（跨版本）

以下改进项贯穿于所有版本开发过程中：

性能

首轮响应加速 -- 预连接 HTTP keep-alive；减少首次 API 调用延迟
Compaction 摘要质量优化 -- 增加文件变更列表、关键操作摘要、每轮 reasoning 缓存注入
Streaming 输出实时化 -- 模型 content 实时流式输出到 stdout（当前仅在 SSE 解析完成后整块输出）

可移植性

Windows 沙箱增强 -- Bash 工具在 Windows 上的隔离度提升（Job Object / 容器化）
非 Bash Shell 支持 -- 支持 cmd.exe / PowerShell 作为 bash 替代（Windows 环境无 Git Bash 时）
Node.js 兼容 -- 探索 node 运行时替代 Bun 的可能性（降低用户门槛）

安全

Guard Layer 规则热更新 -- 支持从外部规则文件加载自定义 Guard 规则（签名校验防止篡改）
Token Budget 审计日志 -- 完整的 token 消耗审计日志（时间戳、模型、消耗量、成本），便于财务核算
API Key 加密存储 -- 支持从加密文件或系统凭据管理器读取 API key（替代明文环境变量）

文档

API 参考文档（各模块完整函数签名 + 参数说明）
架构决策记录（ADR -- Architecture Decision Records）
性能基准报告（benchmark 数据：不同模型、不同任务规模的 token 消耗和耗时）

贡献指南

欢迎提交 PR 和 Issue 参与路线图讨论。具体功能的技术方案请先通过 Issue 讨论后再实施。

技术上完全可行的直接标记 help wanted / good first issue
需进一步论证的请先发 Discussion
安全相关请遵循 SECURITY.md 报告流程

参考来源

DESIGN.md -- 项目设计文档（§1.3 v2 规划）
Creative.txt -- 完整技术规范（§2 暂不开发列表、§3.3 收敛判断 v2 展望）
Creative_supplement_audit8.txt -- state.json 持久化方案
IMPLEMENTATION_PLAN.md -- 实施计划（M5 可选优化项）
loop-claudecode -- 完整工作流参考（Part 1/2、convergence_counter、artifacts、state.json 状态机）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

loop-deepseek 路线图 (ROADMAP.md)

当前状态 / Current Status

版本路线 / Version Roadmap

v0.2.0 -- E2E 集成与可观测性（预计 Q3 2026）

v0.3.0 -- 工具生态扩展（预计 Q4 2026）

v0.4.0 -- 子 Agent 与工作流（预计 Q1 2027）

v1.0.0 -- 完整工作流（预计 Q2 2027）

已完成 / Completed

技术债务与改进项（跨版本）

性能

可移植性

安全

文档

贡献指南

参考来源

FilesExpand file tree

ROADMAP.md

Latest commit

History

ROADMAP.md

File metadata and controls

loop-deepseek 路线图 (ROADMAP.md)

当前状态 / Current Status

版本路线 / Version Roadmap

v0.2.0 -- E2E 集成与可观测性（预计 Q3 2026）

v0.3.0 -- 工具生态扩展（预计 Q4 2026）

v0.4.0 -- 子 Agent 与工作流（预计 Q1 2027）

v1.0.0 -- 完整工作流（预计 Q2 2027）

已完成 / Completed

技术债务与改进项（跨版本）

性能

可移植性

安全

文档

贡献指南

参考来源