Rag Facile

######     #     #####     #######    #     #####  ### #       #######
#     #   # #   #     #    #         # #   #     #  #  #       #
#     #  #   #  #          #        #   #  #        #  #       #
######  #     # #  ####    #####   #     # #        #  #       #####
#   #   ####### #     #    #       ####### #        #  #       #
#    #  #     # #     #    #       #     # #     #  #  #       #
#     # #     #  #####     #       #     #  #####  ### ####### #######

Discutez avec vos documents PDF en utilisant le RAG (Retrieval-Augmented Generation).

Pourquoi RAG ?

Vous avez peut-être tenté de copier-coller un long document dans un chat avec une IA. Résultat : l'IA "oublie" des parties du texte, donne des réponses vagues, ou pire — invente des informations.

Le problème : Les modèles de langage ont une limite de contexte. Au-delà de quelques milliers de mots, ils perdent le fil. Et pour les documents de 100+ pages, c'est impossible.

La solution RAG (Retrieval-Augmented Generation) fonctionne différemment :

Le document est découpé en petits morceaux
Chaque morceau est transformé en embedding (une représentation numérique)
Quand vous posez une question, seuls les morceaux pertinents sont récupérés
L'IA génère sa réponse à partir de ces extraits uniquement

Les bénéfices :

🎯 Réponses précises basées sur le contenu réel
📄 Citations des pages sources pour vérification
💰 Coût réduit (moins de tokens consommés)
📚 Documents de n'importe quelle taille

Fonctionnalités

✅ Conversation avec vos PDF — Posez vos questions, obtenez des réponses avec citations de pages
✅ Indexation automatique — Fournissez une URL, le document est indexé et prêt à l'emploi
✅ Génération de quiz — Testez votre compréhension du document
✅ Pas de limite de taille — Documents de 500 pages aussi fluides que 5 pages

Démarrage rapide

Objectif : être opérationnel en moins d'une heure.

Prérequis

Node.js >= 22.0.0
pnpm — Installation
Clé API Albert — Demandez l'accès ici : https://albert.sites.beta.gouv.fr/access/

Installation

# Cloner le repository
git clone https://github.com/etalab-ia/rag-facile.git
cd rag-facile

# Installer les dépendances
pnpm install

# Configurer l'environnement
cp .env.example .env

Éditez le fichier .env avec vos identifiants Albert :

OPENAI_API_KEY=votre-cle-albert-api
OPENAI_BASE_URL=https://albert.api.etalab.gouv.fr/v1

Lancer le serveur

pnpm dev

Ouvrez localhost:4111 pour accéder à l'interface Mastra Studio.

Premier test

Dans l'interface, ouvrez l'agent "Chat with PDF"
Collez l'URL d'un PDF public
Attendez l'indexation (quelques secondes)
Posez une question sur le contenu

Architecture

┌─────────┐     ┌────────────┐     ┌──────────────┐
│ PDF URL │────▶│ Indexation │────▶│ Vector Store │
└─────────┘     └────────────┘     └──────────────┘
                                            │
┌──────────┐     ┌────────────┐             │
│ Question │────▶│ Recherche  │◀────────────┘
└──────────┘     └────────────┘
                       │
                       ▼
               ┌──────────────┐
               │  Albert API  │
               └──────────────┘
                       │
                       ▼
               ┌──────────────┐
               │ Réponse +    │
               │ Citations    │
               └──────────────┘

Structure du projet

src/mastra/
├── agents/          # Agent conversationnel
├── tools/           # Outils (recherche, listage documents)
├── workflows/       # Workflow d'indexation PDF
├── lib/             # Configuration vector store
└── index.ts         # Point d'entrée Mastra

Personnalisation

Changer le modèle

La configuration se trouve dans src/mastra/agents/pdf-chat-agent.ts :

model: {
  id: "albert-api/openai/gpt-oss-120b",  // Format Albert API OpenAI-compatible
  url: process.env.OPENAI_BASE_URL,
  apiKey: process.env.OPENAI_API_KEY,
}

Consultez la documentation Albert pour les modèles disponibles.

Changer la base vectorielle

Par défaut, Rag Facile utilise LibSQL (stockage fichier local). Mastra supporte d'autres options :

Pinecone
Qdrant
Chroma
pgvector
Cloudflare D1

Voir la documentation Mastra pour la configuration.

Intégrer dans votre application

Rag Facile expose une API via Mastra. Utilisez le Mastra Client SDK pour connecter votre frontend (React, Next.js, Vue).

Contribution

Les contributions sont bienvenues ! Ouvrez une issue ou soumettez une pull request.

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
.agents/skills/mastra		.agents/skills/mastra
.claude/skills		.claude/skills
.github		.github
.husky		.husky
.letta		.letta
.pi/skills		.pi/skills
.skills		.skills
src/mastra		src/mastra
.env.example		.env.example
.gitignore		.gitignore
.prototools		.prototools
CHANGELOG.md		CHANGELOG.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
biome.json		biome.json
package.json		package.json
pnpm-lock.yaml		pnpm-lock.yaml
pnpm-workspace.yaml		pnpm-workspace.yaml
skills-lock.json		skills-lock.json
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Rag Facile

Pourquoi RAG ?

Fonctionnalités

Démarrage rapide

Prérequis

Installation

Lancer le serveur

Premier test

Architecture

Structure du projet

Personnalisation

Changer le modèle

Changer la base vectorielle

Intégrer dans votre application

Contribution

Licence

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Rag Facile

Pourquoi RAG ?

Fonctionnalités

Démarrage rapide

Prérequis

Installation

Lancer le serveur

Premier test

Architecture

Structure du projet

Personnalisation

Changer le modèle

Changer la base vectorielle

Intégrer dans votre application

Contribution

Licence

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages