🏥 LaudoScan: Extrator de Metadados de Laudos Médicos

Ferramenta de auditoria e automação para validação de dados clínicos.

📄 Sobre o Projeto

Este projeto foi desenvolvido para resolver um gargalo crítico durante um processo de migração de sistemas (ERP) na área da saúde. A necessidade era validar a integridade de milhares de arquivos legados e garantir que os dados contidos nos PDFs (conteúdo) correspondiam aos metadados do sistema.

O LaudoScan atua como um "auditor digital", varrendo diretórios recursivamente, aplicando leitura de texto e estruturando dados não estruturados em uma planilha para conferência massiva.

📋 Funcionalidades Principais

Varredura Recursiva: Localiza arquivos .pdf em todas as subpastas do diretório alvo, independente da profundidade.
Extração Inteligente (Regex):
- Identifica Nome do Paciente e Código do Atendimento baseando-se em padrões textuais específicos.
- Padroniza datas automaticamente para o formato dd/mm/aaaa.
Lógica de Títulos Complexos: Algoritmo customizado capaz de identificar títulos de exames que sofrem quebra de linha, tratando conectores específicos (ex: "USG ABDOME TOTAL \n POR MÉDICO X" é lido corretamente como um único título).
Tratamento de Erros (Fault Tolerance): O script possui robustez para não parar caso encontre um arquivo corrompido; ele registra o erro no relatório final e continua o processamento dos demais.
Exportação Compatível: Gera um relatório em CSV com encoding utf-8-sig, pronto para ser aberto no Excel ou Google Sheets sem erros de acentuação.

🛠️ Tecnologias Utilizadas

Python 3.x
pdfplumber: Para extração precisa de layout e texto dos PDFs.
RegEx (re): Para mineração e identificação

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🏥 LaudoScan: Extrator de Metadados de Laudos Médicos

📄 Sobre o Projeto

📋 Funcionalidades Principais

🛠️ Tecnologias Utilizadas

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🏥 LaudoScan: Extrator de Metadados de Laudos Médicos

📄 Sobre o Projeto

📋 Funcionalidades Principais

🛠️ Tecnologias Utilizadas

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages