detoks

🔔 업데이트 안내

0.2.0 릴리스는 기존 main의 0.1.2 대비 로컬 LLM 런타임과 RAG/TUI 흐름이 크게 바뀝니다. 기존 detoks 설정 파일이 있는 사용자는 새 버전 실행 시 CLI에서 업데이트 안내를 1회 확인할 수 있습니다.

주요 변경점:

로컬 LLM 실행이 node-llama-cpp Node.js 네이티브 바인딩 기반으로 변경되었습니다.
별도 llama-server 실행이나 Python 런타임 없이 GGUF 모델을 Node.js 프로세스 안에서 로드합니다.
RAG 의미 검색, Cross-Session Cache, TUI/embedded PTY 흐름이 강화되었습니다.
전역 설치: npm install -g @sorlros/detoks@latest
전역 업데이트: npm update -g @sorlros/detoks
로컬 설치: npm install @sorlros/detoks@latest

새 기능과 변경점은 GitHub Releases 또는 릴리스 노트에서 함께 안내하는 것을 권장합니다.

detoks는 codex, gemini, claude 같은 LLM CLI 앞단에서 동작하는 interactive wrapper CLI입니다. 입력, 컨텍스트, 세션, 실행 경계를 정리해 LLM CLI 작업 흐름을 더 안정적이고 재현 가능하게 만드는 것이 목표입니다.

한눈에 보기

one-shot 실행과 REPL 모드 (text / TUI 전체 화면)
task graph / context / state 관리
adapter / subprocess 경계 분리: codex / gemini / claude
stub / real 실행 모드
세션 저장 및 재개 기반 워크플로우 (checkpoint 지원)
로컬 LLM 런타임: node-llama-cpp Node.js 네이티브 바인딩으로 GGUF 모델을 in-process 로드
RAG 시스템: 세션 간 컨텍스트 재사용, 의미 검색, 실패 패턴 인식
캐시 시스템: Cross-Session Cache, 해시 기반 유효성 검사, /cache REPL 명령
TUI 모드 (전체 화면):
- 실시간 파이프라인 상태 / 캐시 라이브 스트림 / RAG 컨텍스트 요약
- 테마 시스템: dark / light / colorblind 내장 팔레트
- 런타임 분할 크기 조절: /layout 명령 + Alt+↑/↓
- 인라인 커서 편집: Ctrl+A/E, ←/→, Home/End
- 입력 히스토리: ↑/↓ 로 이전 프롬프트 recall + 디스크 영속
- Nerd Font 아이콘 지원

요구 사항

Node.js >=24.15.0 <26
codex, gemini, 또는 claude CLI: 해당 adapter를 사용할 때
로컬 모델 추론 사용 시: node-llama-cpp에서 로드 가능한 GGUF 모델
로컬 LLM 실행은 Node.js 프로세스 안에서 처리되며, 별도 llama-server 실행이나 Python 런타임이 필요하지 않습니다.

자세한 버전 기준은 STACK_VERSIONS.md와 LLAMA_CPP_SERVER_SPEC.md를 참고하세요.

설치

1) 로컬 설치

현재 폴더에 설치합니다. 어느 경로에서든 실행할 수 있지만, 설치 결과는 현재 디렉터리의 node_modules에 들어갑니다.

npm install @sorlros/detoks

프로젝트 안에서 CLI를 실행할 때:

npx detoks --help

2) 전역 설치

npm install -g @sorlros/detoks

설치 후 어디서나 바로 실행할 때:

detoks --help

3) 설치 없이 바로 실행

npx @sorlros/detoks --help

빠른 시작

detoks --help
detoks repl
detoks "summarize the current repo status"

REPL 예시:

# Text REPL (기본값)
detoks repl --adapter codex --execution-mode stub

# TUI REPL (전체 화면 UI)
detoks repl --adapter codex --execution-mode stub --tui

# TUI — 라이트 테마
DETOKS_THEME=light detoks repl --adapter gemini --tui

# TUI — Nerd Font 아이콘 활성화
DETOKS_NERD_FONT=1 detoks repl --adapter claude --tui

TUI REPL 명령어

TUI / Text REPL 실행 중 사용할 수 있는 슬래시 명령:

명령	설명
`/help`	사용 가능한 명령 목록 표시
`/adapter`	어댑터 전환 (codex / gemini / claude)
`/model`	모델 변경
`/cache [stats\|clear\|disable\|enable]`	RAG 캐시 상태 관리
`/layout [reset\|transcript=N\|result=N\|+\|-]`	TUI 분할 크기 런타임 조절
`/nerd [on\|off]`	Nerd Font 아이콘 토글
`/verbose`	상세 출력 토글
`/exit`	REPL 종료

TUI 키보드 단축키:

단축키	동작
↑ / ↓	입력 히스토리 탐색
←/→, Home/End	커서 이동
Ctrl+A / Ctrl+E	줄 처음 / 끝으로 이동
Alt+↑ / Alt+↓	분할 크기 조절

환경 변수

변수	설명	기본값
`DETOKS_THEME`	TUI 테마: `dark` / `light` / `colorblind`	`dark`
`DETOKS_NERD_FONT`	Nerd Font 아이콘 활성화 (`1` = on)	`0`
`LOCAL_LLM_RUNTIME_PROVIDER`	로컬 LLM 런타임 provider. 현재 `node-llama-cpp`만 지원	`node-llama-cpp`
`LOCAL_LLM_MODEL_NAME`	로컬 LLM 모델 이름	`unsloth/Qwen3.5-4B-GGUF`
`LOCAL_LLM_MODEL_PATH`	직접 지정한 GGUF 모델 파일 경로	없음
`LOCAL_LLM_MODEL_DIR`	GGUF 모델 캐시 디렉터리	`~/.detoks/models/llm/<repo>`
`LOCAL_LLM_HF_REPO`	Hugging Face GGUF repo와 quantization	`unsloth/Qwen3.5-4B-GGUF:Q4_K_M`
`LOCAL_LLM_HF_FILE`	로드할 GGUF 파일명	`Qwen3.5-4B-Q4_K_M.gguf`
`LOCAL_LLM_CONTEXT_SIZE`	로컬 LLM context size	`4096`
`LOCAL_LLM_MAX_TOKENS`	로컬 LLM 기본 생성 토큰 수	`512`
`RAG_ENABLED`	RAG 비활성화 플래그 (`0` = off)	모델 존재 시 on
`RAG_EMBEDDING_MODEL_PATH`	RAG 임베딩 GGUF 모델 경로	`~/.detoks/models/embedding/mykor-KURE-v1-gguf/KURE-v1-Q4_K_M.gguf`
`DETOKS_CACHE_DISABLED`	Cross-session cache 비활성화 (`1` = off)	`0`

detoks가 해주는 일

입력을 작업 단위로 정리
task graph와 의존성을 구성
현재 실행에 필요한 context만 주입 (RAG 의미 검색으로 세션 간 재사용)
adapter / subprocess boundary 또는 node-llama-cpp in-process 런타임을 통해 실행
결과를 세션에 저장해 다음 실행에서 재사용 (캐시 + 패턴 학습)

변경 이력

0.2.0 (main 병합 예정)

이전 main(0.1.2) 대비 핵심 변화

패키지 버전이 0.1.2에서 0.2.0으로 올라갑니다.
로컬 LLM 실행 경로가 외부 llama.cpp / llama-server 프로세스 중심에서 node-llama-cpp Node.js 네이티브 바인딩 기반 in-process 런타임으로 변경되었습니다.
로컬 모델 추론에 Python 런타임 또는 Python helper 스크립트를 사용하지 않습니다.
LOCAL_LLM_RUNTIME_PROVIDER는 현재 node-llama-cpp만 허용하며, GGUF 모델은 LOCAL_LLM_MODEL_PATH 또는 LOCAL_LLM_MODEL_DIR + LOCAL_LLM_HF_FILE 기준으로 로드합니다.
node-llama-cpp, better-sqlite3, sqlite-vec, node-pty가 런타임 의존성으로 추가되어 로컬 GGUF 추론, RAG 벡터 검색, embedded TUI/PTY 흐름을 지원합니다.
add:py 계열 Python 의존성 관리 스크립트가 제거되고, Node.js/TypeScript 중심의 build·test·packaging 흐름으로 정리되었습니다.
main push 이후 GitHub Release 및 npm publish가 연동되도록 릴리즈 자동화가 업데이트되었습니다.

로컬 LLM 런타임

node-llama-cpp로 GGUF 모델을 Node.js 프로세스 안에서 직접 로드
외부 OpenAI-compatible HTTP llama-server fallback 미지원
기본 모델: unsloth/Qwen3.5-4B-GGUF / Qwen3.5-4B-Q4_K_M.gguf
모델 선택 UI에서 내장 GGUF 모델 또는 사용자 지정 Hugging Face GGUF 파일 선택 가능
KURE-v1 GGUF 임베딩 모델 기반 RAG 인덱싱 지원

TUI 대폭 개선

테마 시스템: dark / light / colorblind 내장 팔레트 + DETOKS_THEME 환경 변수
런타임 분할 크기 조절: /layout REPL 명령 + Alt+↑/↓ 단축키
인라인 커서 편집: Ctrl+A/E, ←/→, Home/End, 위치 기반 Backspace
입력 히스토리: ↑/↓ 이전 프롬프트 recall + 디스크 영속
Nerd Font 아이콘 지원: DETOKS_NERD_FONT=1 또는 /nerd on
어댑터 트랜스크립트 자동 저장 + 결과 패널 파일 경로 표시
결과 패널: Resume 안내 / Task grid / Verbose 비용 상시 표시
캐시 라이브 스트림 + RAG 컨텍스트 요약 상시 표시
Embedded PTY 렌더링 최적화 (와이드 문자 연속 렌더링)
디자인 토큰 + 이벤트 라우터 + 선언형 레이아웃 스키마 도입

RAG 시스템 (Phase 1~2)

Cross-Session Cache: 이전 세션 컨텍스트를 현재 prompt에 재사용
의미 검색: sqlite-vec + BGE-M3 임베딩 기반 벡터 검색
패턴 학습: Task 시퀀스 추출, 실패 패턴 인식, 워크플로우 템플릿 자동 생성
ProjectMemory project_id 격리 (다중 프로젝트 캐시 분리)
/cache [stats|clear|disable|enable] REPL 명령 추가
KURE-v1 임베딩 모델 적용 + 첫 실행 시 자동 다운로드
RAG 인덱싱 진행 상태 TUI 표시

번역 및 기타

번역 preamble 자동 제거 + fallback 안정성 개선
번역 모델 시각화 벤치마크 스크립트 추가 (npm run benchmark:translate-report)

0.1.2 (2026-05-06)

설치 문서 개선: 로컬 / 전역 / npx 설치 흐름 명확화
최초 실행 모델 설정 영속 안정화

0.1.1 (2026-05-04) — 첫 npm 공개 릴리스

@sorlros/detoks npm 패키지 공개
claude 어댑터 추가 (codex, gemini에 이어 세 번째 공식 어댑터)
task type 세션 결과 영속 (재시작 후에도 task 분류 유지)
codex reasoning flow 개선
초기 로컬 llama-server 연동 기반 Role 1 번역 파이프라인
TUI 기반 구축: embedded PTY, 실시간 스트리밍, 한글 IME 입력 처리
세션 checkpoint 저장 및 재개 (list / continue / fork / restore)
Role 1 번역 파이프라인 + Guardrails 출력 검증

문서

Authors

This project was created and maintained by the DeToks Team.

sorlros
Evan-Yoon
SihoHan11
Ziro-kun

License

This project is licensed under the Apache License 2.0.

Name		Name	Last commit message	Last commit date
Latest commit History 345 Commits
.github		.github
.trace		.trace
bin		bin
datasets/rag_embedding_eval		datasets/rag_embedding_eval
docs		docs
scripts		scripts
src		src
tests		tests
tmp		tmp
video-demo/book-rental-service		video-demo/book-rental-service
.env.example		.env.example
.gitignore		.gitignore
.npmignore		.npmignore
.nvmrc		.nvmrc
LICENSE		LICENSE
README.en.md		README.en.md
README.ko.md		README.ko.md
README.md		README.md
content.png		content.png
model.json		model.json
package-lock.json		package-lock.json
package.json		package.json
test-replace.js		test-replace.js
tsconfig.json		tsconfig.json
uv.lock		uv.lock
vitest.config.ts		vitest.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

detoks

🔔 업데이트 안내

한눈에 보기

요구 사항

설치

1) 로컬 설치

2) 전역 설치

3) 설치 없이 바로 실행

빠른 시작

TUI REPL 명령어

환경 변수

detoks가 해주는 일

변경 이력

0.2.0 (main 병합 예정)

0.1.2 (2026-05-06)

0.1.1 (2026-05-04) — 첫 npm 공개 릴리스

문서

Authors

License

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

detoks

🔔 업데이트 안내

한눈에 보기

요구 사항

설치

1) 로컬 설치

2) 전역 설치

3) 설치 없이 바로 실행

빠른 시작

TUI REPL 명령어

환경 변수

detoks가 해주는 일

변경 이력

0.2.0 (main 병합 예정)

0.1.2 (2026-05-06)

0.1.1 (2026-05-04) — 첫 npm 공개 릴리스

문서

Authors

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages