Commit cdd346c
fix: 검색 품질 개선 — kind soft boost, phrase 필터, evidence threshold 조정
## 개선 내역 (벤치마크 검증)
### 1. agent_search kind 필터: hard filter → soft boost (MRR +9.0%)
- search.py: node_kinds 매칭 시 하드 제거 → 1.5x score boost로 변경
- 자체 시나리오 MRR 0.767 → 0.836 (+9.0%), R@5 0.700 → 0.750 (+7.1%)
- recall 보존하면서 preferred kind 우선 랭킹
### 2. _phrase 노드 검색 결과 노출 차단
- search.py: phrase 노드 fallback padding 제거 — 부족하면 적은 결과 반환
- S8 LLM ablation에서 phrase 노이즈로 MRR -6.8% 발생했던 원인 해결
### 3. Evidence Chain 압축 threshold 상향
- evidence.py: relevance_threshold 0.2 → 0.3 (불필요한 문장 제거)
- 첫 문장 position bias +0.1 추가 (주요 정보는 첫 문장에 집중)
### 4. PhraseExtractor year 추출 dead code 제거
- phrase_extractor.py: _RE_YEAR regex 삭제 (_is_meaningful이 digits 차단하여 실질 미동작)
### FTS word boundary 시도 → 롤백
- 영문 의학 용어(APOE4, BRCA) + 형태 변화(stocks)에서 매칭 실패
- SciFact -27.5%, FiQA -42.4% 악화 → substring 매칭 유지
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>1 parent 56bbb64 commit cdd346c
File tree
5 files changed
+35
-34
lines changed- src/synaptic
- backends
- extensions
- tests
5 files changed
+35
-34
lines changed| Original file line number | Diff line number | Diff line change | |
|---|---|---|---|
| |||
2 | 2 | | |
3 | 3 | | |
4 | 4 | | |
| 5 | + | |
5 | 6 | | |
6 | 7 | | |
7 | 8 | | |
| |||
96 | 97 | | |
97 | 98 | | |
98 | 99 | | |
| 100 | + | |
| 101 | + | |
| 102 | + | |
99 | 103 | | |
100 | 104 | | |
101 | 105 | | |
| |||
114 | 118 | | |
115 | 119 | | |
116 | 120 | | |
117 | | - | |
| 121 | + | |
| 122 | + | |
| 123 | + | |
| 124 | + | |
| 125 | + | |
| 126 | + | |
| 127 | + | |
| 128 | + | |
118 | 129 | | |
119 | 130 | | |
120 | | - | |
| 131 | + | |
| 132 | + | |
| 133 | + | |
| 134 | + | |
| 135 | + | |
| 136 | + | |
| 137 | + | |
121 | 138 | | |
122 | 139 | | |
123 | 140 | | |
| |||
| Original file line number | Diff line number | Diff line change | |
|---|---|---|---|
| |||
76 | 76 | | |
77 | 77 | | |
78 | 78 | | |
79 | | - | |
| 79 | + | |
80 | 80 | | |
81 | 81 | | |
82 | 82 | | |
| |||
292 | 292 | | |
293 | 293 | | |
294 | 294 | | |
295 | | - | |
| 295 | + | |
296 | 296 | | |
297 | 297 | | |
298 | 298 | | |
299 | 299 | | |
300 | 300 | | |
301 | 301 | | |
| 302 | + | |
| 303 | + | |
| 304 | + | |
302 | 305 | | |
303 | 306 | | |
304 | 307 | | |
| |||
| Original file line number | Diff line number | Diff line change | |
|---|---|---|---|
| |||
48 | 48 | | |
49 | 49 | | |
50 | 50 | | |
51 | | - | |
52 | | - | |
53 | | - | |
54 | | - | |
55 | | - | |
56 | 51 | | |
57 | 52 | | |
58 | 53 | | |
| |||
79 | 74 | | |
80 | 75 | | |
81 | 76 | | |
82 | | - | |
| 77 | + | |
83 | 78 | | |
84 | 79 | | |
85 | 80 | | |
86 | 81 | | |
87 | 82 | | |
88 | | - | |
| 83 | + | |
89 | 84 | | |
90 | 85 | | |
91 | 86 | | |
| |||
262 | 257 | | |
263 | 258 | | |
264 | 259 | | |
265 | | - | |
266 | | - | |
267 | | - | |
268 | | - | |
269 | 260 | | |
| Original file line number | Diff line number | Diff line change | |
|---|---|---|---|
| |||
164 | 164 | | |
165 | 165 | | |
166 | 166 | | |
167 | | - | |
| 167 | + | |
168 | 168 | | |
169 | 169 | | |
170 | | - | |
171 | | - | |
172 | | - | |
173 | | - | |
174 | | - | |
| 170 | + | |
| 171 | + | |
| 172 | + | |
175 | 173 | | |
176 | 174 | | |
177 | 175 | | |
| |||
213 | 211 | | |
214 | 212 | | |
215 | 213 | | |
216 | | - | |
217 | | - | |
218 | | - | |
219 | | - | |
220 | | - | |
221 | | - | |
222 | | - | |
223 | | - | |
224 | | - | |
225 | | - | |
| 214 | + | |
| 215 | + | |
| 216 | + | |
226 | 217 | | |
227 | 218 | | |
228 | 219 | | |
| |||
| Original file line number | Diff line number | Diff line change | |
|---|---|---|---|
| |||
90 | 90 | | |
91 | 91 | | |
92 | 92 | | |
93 | | - | |
94 | | - | |
| 93 | + | |
| 94 | + | |
95 | 95 | | |
96 | 96 | | |
97 | 97 | | |
98 | 98 | | |
99 | 99 | | |
100 | | - | |
101 | 100 | | |
102 | 101 | | |
103 | 102 | | |
| |||
0 commit comments