"With hedwig-cg, your coding agent knows what to read."
クイックスタート · English · 한국어 · 中文 · Deutsch
raw data from a given number of sources is collected, then compiled by an LLM into a .md wiki, then operated on by various CLIs by the LLM to do Q&A and to incrementally enhance the wiki - Andrej Karpathy
hedwig-cgは10,000ファイル以上のコードベースとナレッジドキュメントから、軽量ローカルLLMモデルを使用してクエリ可能なコードグラフとナレッジベースを構築します。Two-Stage 5シグナル・ハイブリッド検索(ベクトル+グラフ+キーワード+コミュニティ→RRF融合→Cross-Encoderリランキング)でコーディングエージェントがプロジェクト全体を真に理解できるようになります。インストールすればClaude Codeが全体像を把握できます——追加のトークンも、追加のコマンドも不要、すべて100%ローカルで実行されます。
pip install hedwig-cg
cd your-project/
hedwig-cg claude installClaude Codeに伝えてください:
「このプロジェクトのコードグラフをビルドして」
以上です。Claude Codeがグラフをビルドし、以降すべての検索で自動的に参照します。セッション終了時にグラフが自動的にリビルドされます。
hedwig-cgは主要なAIコーディングエージェントと1コマンドで統合できます:
| エージェント | インストール | 説明 |
|---|---|---|
| Claude Code | hedwig-cg claude install |
Skill + CLAUDE.md + PreToolUseフック |
| Codex CLI | hedwig-cg codex install |
AGENTS.md + PreToolUseフック |
| Gemini CLI | hedwig-cg gemini install |
GEMINI.md + BeforeToolフック |
| Cursor IDE | hedwig-cg cursor install |
.cursor/rules/ルールファイル |
| Windsurf IDE | hedwig-cg windsurf install |
.windsurf/rules/ルールファイル |
| Cline | hedwig-cg cline install |
.clinerulesファイル |
| Aider CLI | hedwig-cg aider install |
CONVENTIONS.md + .aider.conf.yml |
| MCPサーバー | claude mcp add hedwig-cg -- hedwig-cg mcp |
Model Context Protocol 5ツール |
各installはコンテキストファイルの書き込みと(対応プラットフォームの場合)ツール呼び出し前のフック登録を行います。削除:hedwig-cg <platform> uninstall。
hedwig-cgはtree-sitterとネイティブパーサーを使用して、関数、クラス、メソッド、呼び出し、import、継承を抽出します。
| Python | JavaScript | TypeScript | Go |
| Rust | Java | C | C++ |
| C# | Ruby | Swift | Scala |
| Lua | PHP | Elixir | Kotlin |
| Objective-C | Terraform/HCL |
設定・ドキュメント形式も構造抽出対応:YAML、JSON、TOML、Markdown、PDF、HTML、CSV、Shell、Rなど。
テキストノード(ドキュメント、コメント、マークダウン)はintfloat/multilingual-e5-smallで埋め込まれ、100以上の自然言語をサポートします — 日本語、韓国語、中国語、ドイツ語、フランス語など。お好きな言語で検索し、あらゆる言語の結果を見つけます。
AIコーディングエージェント(Claude Code、Codexなど)と統合すると、hedwig-cgはコード変更時に自動的にグラフをリビルドします。Stop/SessionEndフックがgit diffで変更ファイルを検出し、バックグラウンドでインクリメンタルビルドを実行します — 手動操作は不要です。
3つのソースからIgnoreパターンをサポートし、すべて完全なgitignoreスペック(否定!、**グロブ、ディレクトリ専用パターン)に対応:
| ソース | 説明 |
|---|---|
| ビルトイン | .git、node_modules、__pycache__、dist、buildなど |
.gitignore |
プロジェクトルートから自動読み込み — 既存のgit ignoreがそのまま動作 |
.hedwig-cg-ignore |
コードグラフ用のプロジェクト固有オーバーライド |
ファイルごとのSHA-256コンテンツハッシュ。変更されたファイルのみ再抽出・再埋め込み。未変更ファイルは既存グラフからマージ — 通常フルビルドより95%以上高速。
4GBメモリバジェットとステージ別解放。パイプラインは各段階で生成→保存→解放:抽出結果はグラフ構築後に解放、埋め込みはバッチ単位でストリーミングしDB書き込み後に解放、グラフ全体は永続化後に解放。GCは75%閾値で先制的にトリガー。
クラウドサービスなし、APIキーなし、テレメトリなし。SQLite + FAISSでストレージ、sentence-transformersで埋め込み。すべてのデータがローカルに保持されます。
すべてのクエリは2段階のパイプラインを経ます:
ステージ1 — 5シグナル検索(RRF融合)
| シグナル | 検索対象 |
|---|---|
| コードベクトル | 意味的に類似したコード |
| テキストベクトル | 100+言語のドキュメントとコメント |
| グラフ展開 | 構造的に接続されたノード(呼び出し元、インポート) |
| 全文検索 | 正確なキーワードマッチ(BM25) |
| コミュニティコンテキスト | 同じクラスタの関連ノード |
ステージ2 — Cross-Encoderリランキング
Cross-Encoderモデルが候補を再評価し、実装コードをテスト・ドキュメントノードより上位にランクします。結果にはノード間の関係エッジが含まれます。
すべてのコマンドはデフォルトでコンパクトなJSONを出力します(AIエージェント向けに設計)。
| コマンド | 説明 |
|---|---|
build <dir> |
コードグラフをビルド(--incremental) |
search <query> |
Two-Stage 5シグナルハイブリッド検索(--top-k、--fast、--expand) |
search-vector <query> |
ベクトル類似度のみ(コード+テキストデュアルモデル) |
search-graph <query> |
グラフ展開のみ(ベクトルシードからBFS) |
search-keyword <query> |
FTS5キーワードマッチのみ(BM25ランキング) |
search-community <query> |
コミュニティクラスターマッチのみ |
query |
インタラクティブ検索REPL |
communities |
コミュニティの一覧と検索(--search、--level) |
stats |
グラフ統計 |
node <id> |
ファジーマッチによるノード詳細 |
export |
JSON、GraphML、D3.jsでエクスポート |
visualize |
インタラクティブHTML可視化 |
clean |
.hedwig-cg/データベースを削除 |
doctor |
インストール状態の確認 |
mcp |
MCPサーバーを起動(stdio) |
claude install|uninstall |
Claude Code統合管理 |
codex install|uninstall |
Codex CLI統合管理 |
gemini install|uninstall |
Gemini CLI統合管理 |
cursor install|uninstall |
Cursor IDE統合管理 |
windsurf install|uninstall |
Windsurf IDE統合管理 |
cline install|uninstall |
Cline統合管理 |
aider install|uninstall |
Aider CLI統合管理 |
hedwig-cg自体のコードベースでのベンチマーク(約3,500行、90ファイル、1,300ノード):
| 操作 | 時間 |
|---|---|
| フルビルド | ~14秒 |
| インクリメンタルビルド(変更あり) | ~4秒 |
| インクリメンタルビルド(変更なし) | ~0.4秒 |
| コールド検索(デュアルモデル) | ~2.8秒 |
コールド検索(--fast) |
~0.2秒 |
| ウォーム検索 | ~0.08秒 |
| キャッシュヒット | <1ms |
- 埋め込みモデル: ~470MB、
~/.hedwig-cg/models/に一度だけダウンロード - データベース: ~2MB(SQLite + FTS5 + FAISSインデックス)
- インクリメンタルビルド: SHA-256ハッシュ、フルビルドより95%+高速
- Python 3.10+
- 埋め込みモデル ~470MB(初回使用時にキャッシュ)
# オプション: PDF抽出
pip install hedwig-cg[docs]pip install -e ".[dev]"
pytest
ruff check hedwig_cg/MIT License。LICENSEを参照。
コントリビューションを歓迎します!CONTRIBUTING.mdを参照。
