Skip to content

fix(rag): reverte config FTS p/ portuguese (regressão de eval)#149

Merged
BrunooMoniz merged 1 commit into
mainfrom
fix/fts-config-eval-regression
Jun 19, 2026
Merged

fix(rag): reverte config FTS p/ portuguese (regressão de eval)#149
BrunooMoniz merged 1 commit into
mainfrom
fix/fts-config-eval-regression

Conversation

@BrunooMoniz

Copy link
Copy Markdown
Owner

Hotfix: reverte o fix de FTS (regressão de eval)

O PR #145 casou a config do query keyword com a do índice (portuguese_unaccent) — teoricamente correto. Mas o npm run eval na VPS, pós-deploy, mostrou regressão no golden set:

metric baseline com unaccent delta
Recall@5 0.950 0.833 -0.117
MRR 0.725 0.598 -0.127

Unaccentuar o query alarga o leg keyword e, via RRF + rerank, piora o ranking neste corpus (o "mismatch" era load-bearing). Conforme o CLAUDE.md (eval vs baseline manda), reverte as 3 ocorrências para plainto_tsquery('portuguese') e fixa a decisão num teste + comentário.

O fix de FTS nunca foi necessário para o caso "ervilha" (palavra ASCII casa nas duas configs). A causa real do "ervilha vazio" era o header ausente no re-index, corrigida e mantida (unificação indexSinglePageindexDocument).

npm run build + npm test verdes (1267/1267). Vou re-rodar o eval pós-deploy pra confirmar volta ao baseline.

🤖 Generated with Claude Code

O PR #145 casou a config do query keyword com o índice (portuguese_unaccent),
teoricamente correto. Mas `npm run eval` na VPS mostrou REGRESSÃO no golden set:
Recall@5 0.95 -> 0.83, MRR 0.73 -> 0.60. Unaccentuar o query alarga o leg keyword
e, via RRF + rerank, piora o ranking neste corpus (o "mismatch" era load-bearing).

Volta as 3 ocorrências para plainto_tsquery('portuguese', $1) e fixa a decisão num
teste + comentário (não re-"corrigir" sem rodar o eval). O fix nunca foi necessário
para o caso 'ervilha' (palavra ASCII casa nas duas configs); a causa real do
'ervilha vazio' era o header ausente no re-index, já corrigida e mantida.

build+test verdes (1267/1267).

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
@BrunooMoniz BrunooMoniz merged commit db84a13 into main Jun 19, 2026
4 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant