أداة تفاعلية لتعلم كيفية عمل نماذج المحوّل (Transformer) مع دعم كامل للغة العربية
شارح المحوّل هو أداة تعليمية تفاعلية تساعدك على فهم كيفية عمل نماذج اللغة مثل GPT. يمكنك:
- ✨ كتابة نص بالعربية ورؤية كيف يتم تقسيمه إلى رموز
- 🔍 مشاهدة مصفوفات الانتباه الذاتي بشكل مرئي
- 📊 رؤية توقعات النموذج للكلمة التالية
- 🎛️ تغيير درجة الحرارة ومعاملات أخرى
# استنساخ المشروع
git clone https://github.com/2pidata/transformer-explainer-arabic.git
cd transformer-explainer-arabic
# تثبيت التبعيات
npm install
# تشغيل وضع التطوير
npm run devثم افتح المتصفح على http://localhost:5173
Transformer Explainer Arabic is an interactive educational tool that helps you understand how language models like GPT work. You can:
- ✨ Write Arabic text and see how it gets tokenized
- 🔍 Visualize self-attention matrices
- 📊 See the model's predictions for the next token
- 🎛️ Adjust temperature and other parameters
# Clone the repository
git clone https://github.com/2pidata/transformer-explainer-arabic.git
cd transformer-explainer-arabic
# Install dependencies
npm install
# Run development server
npm run devThen open your browser at http://localhost:5173
transformer-explainer-arabic/
├── src/
│ ├── lib/
│ │ ├── store/ # Svelte stores (state management)
│ │ ├── utils/ # Tokenizer, inference, post-processing
│ │ ├── components/ # Svelte components
│ │ └── types/ # TypeScript types
│ └── routes/ # SvelteKit pages
├── static/
│ └── models/ # ONNX model files
├── scripts/ # Model conversion scripts
└── docs/ # Documentation
| Model | Parameters | Language | Status |
|---|---|---|---|
| AraGPT2-base | 135M | Arabic | ✅ Default |
| AraGPT2-medium | 370M | Arabic | 🔜 |
| JAIS-590M | 590M | Arabic | 🔜 |
To convert a model to ONNX format:
# Install Python dependencies
pip install transformers optimum onnx onnxruntime
# Convert AraGPT2-base
python scripts/convert_model.py --model aragpt2-base --quantize --testRuntime:
@huggingface/transformers- Tokenizationonnxruntime-web- Browser inferenced3- Visualizations
Development:
svelte+sveltekit- Frameworktailwindcss- Stylingtypescript- Type safety
Transformer Explainer Arabic est un outil éducatif interactif pour comprendre le fonctionnement des modèles de langage comme GPT. Vous pouvez :
- ✨ Écrire du texte en arabe et voir comment il est tokenisé
- 🔍 Visualiser les matrices d'attention
- 📊 Voir les prédictions du modèle pour le token suivant
- 🎛️ Ajuster la température et d'autres paramètres
# Cloner le dépôt
git clone https://github.com/2pidata/transformer-explainer-arabic.git
cd transformer-explainer-arabic
# Installer les dépendances
npm install
# Lancer le serveur de développement
npm run devOuvrez ensuite votre navigateur sur http://localhost:5173
- Tokenisation - Comment le texte est découpé en unités
- Embedding - Comment les tokens sont convertis en vecteurs
- Self-Attention - Comment le modèle "regarde" les autres mots
- MLP - Le réseau de neurones qui transforme les représentations
- Softmax - Comment les probabilités sont calculées
- Température - Comment contrôler la "créativité" du modèle
npm run build
npm run preview# Build with correct base path
npm run build
# The build output is in the 'build' folder
# Push to gh-pages branchnpm run test
npm run check- Inspired by Transformer Explainer from Georgia Tech
- AraGPT2 by AUB MIND Lab
- Transformers.js by Xenova
MIT License - see LICENSE for details.
Made with ❤️ by Miloud Belarebia | 2PiData | contact@2pidata.fr