Lexo

Lexo est un outil OCR permettant d'extraire du texte à partir d'images ou de PDF numérisés et de générer des fichiers Word ou texte avec le contenu structuré.

Fonctionnalités

Lecture de texte depuis des images (.png, .jpg, etc.) ou des PDF numérisés.
Extraction automatique du texte avec support multilingue (français et anglais).
Génération de fichiers .docx ou .txt contenant le texte structuré.
Interface utilisateur simple avec support pour glisser-déposer ou sélection de fichiers.
Gestion des erreurs et des logs.

Installation

Clonez ce dépôt :
```
git clone <URL_DU_DEPOT>
cd Lexo
```
Installez les dépendances :
```
pip install -r requirements.txt
```
Assurez-vous que Tesseract est installé sur votre système et accessible via le PATH.

Utilisation

Lancez le script principal :
```
python main.py
```
Une interface graphique s'ouvrira pour sélectionner les fichiers à traiter.

Configuration supplémentaire

Pour le support PDF, installez poppler-utils (nécessaire pour pdf2image).
- Sous Windows, téléchargez Poppler depuis ce lien.
- Ajoutez le chemin de poppler/bin à votre PATH.

Logs

Les logs des opérations sont enregistrés dans le fichier lexo.log.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Lexo

Fonctionnalités

Installation

Utilisation

Configuration supplémentaire

Logs

About

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
image		image
logs		logs
ui		ui
README.md		README.md
lexo.log		lexo.log
main.py		main.py
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Lexo

Fonctionnalités

Installation

Utilisation

Configuration supplémentaire

Logs

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Uh oh!

Contributors

Uh oh!

Languages