أدوات شاملة لمعالجة بيانات ChatGPT وإنشاء قاعدة معرفة شخصية تعمل بشكل مستقل عن الإنترنت.
يحتوي هذا المستودع على نصوص Python لتحويل بيانات ChatGPT المُصدرة إلى قاعدة معرفة شخصية قابلة للبحث. الهدف هو إنشاء نظام عمل مستقل تماماً حيث يمكن للبوت المخصص الإجابة على الأسئلة باستخدام معرفتك الشخصية.
- 📥 استيراد وتحليل تاريخ ChatGPT المُصدر
- 📁 تنظيم المحادثات في ملفات نصية منفصلة
- 🔍 بحث ذكي في قاعدة المعرفة الشخصية
- 💾 عمل أوفلاين بالكامل
- 🤖 إمكانية التدريب المخصص للنماذج
- 🔗 تكامل مع النماذج مفتوحة المصدر
- Python 3.8+
- مساحة تخزين كافية للبيانات المُصدرة
- استنساخ المستودع:
git clone https://github.com/Maliki313/ABDUL-QASSIM.git
cd ABDUL-QASSIM- تثبيت المتطلبات:
pip install -r requirements.txt- في ChatGPT، افتح الإعدادات والبيتا ← التحكم في البيانات
- اختر تصدير البيانات - ستحصل على أرشيف ZIP يحتوي على ملف JSON مع تاريخ محادثاتك
- فك الضغط عن الأرشيف واحفظ مسار ملف
*.json
python scripts/parse_history.py path/to/conversations.json history/هذا سينشئ ملف نصي منفصل لكل محادثة في مجلد history/.
ضع أي ملفات .txt تريد من البوت الرجوع إليها داخل مجلد، مثل notes/. كل ملف يمكن أن يحتوي على جمل أو نقاط.
يقوم نص offline_bot.py ببحث بسيط بالكلمات المفتاحية في هذه الملفات:
python scripts/offline_bot.py notes "سؤالك هنا"النص يطبع الجمل التي تطابق جميع الكلمات المفتاحية في سؤالك. هذه نقطة بداية يمكن توسيعها بنموذج لغوي محلي أو بحث مبني على التضمين لتحسين جودة الإجابات.
إذا كنت تريد بناء نموذج أكثر تقدماً، يمكنك ضبط نموذج لغوي مفتوح المصدر (مثل LLaMA أو GPT-J) باستخدام بياناتك الخاصة. المحادثات المُصدرة وملاحظاتك يمكن أن تكون بيانات التدريب.
- LLaMA - نماذج Meta مفتوحة المصدر
- GPT-J - نموذج EleutherAI
- BERT - للمهام المتخصصة
- نماذج محلية أخرى
راجع وثائق النموذج الذي تختاره للحصول على تعليمات الضبط الدقيق.
ABDUL-QASSIM/
├── scripts/
│ ├── parse_history.py # تحليل تاريخ ChatGPT
│ └── offline_bot.py # بوت البحث المحلي
├── history/ # المحادثات المحولة
├── notes/ # ملاحظاتك الشخصية
├── requirements.txt # متطلبات Python
└── README.md # هذا الملف
- بحث بالكلمات المفتاحية
- مطابقة السياق
- ترتيب النتائج حسب الصلة
- جميع البيانات محلية
- لا توجد اتصالات خارجية
- تحكم كامل في البيانات
- قابل للتخصيص والتوسع
- دعم للنماذج الجديدة
- واجهة برمجية بسيطة
# إنشاء بيئة افتراضية
python -m venv abdul_qassim_env
source abdul_qassim_env/bin/activate # Linux/Mac
# أو
abdul_qassim_env\Scripts\activate # Windows
# تثبيت المتطلبات
pip install -r requirements.txtللبيانات الكبيرة، يمكن تحسين الأداء:
# معالجة متوازية
python scripts/parse_history.py conversations.json history/ --parallel
# ضغط البيانات
python scripts/compress_data.py history/ compressed/- Fork المستودع
- أنشئ فرع للميزة الجديدة (
git checkout -b feature/amazing-feature) - Commit التغييرات (
git commit -m 'إضافة ميزة رائعة') - Push للفرع (
git push origin feature/amazing-feature) - افتح Pull Request
هذا المشروع مرخص تحت ترخيص MIT - راجع ملف LICENSE للتفاصيل.
للاستفسارات والدعم:
- افتح Issue في المستودع
- راجع الوثائق المفصلة
- انضم لمجتمع المطورين
هذه النصوص مصممة لتكون خفيفة الوزن حتى تعمل بدون أي اتصال بالشبكة بمجرد تثبيت حزم Python المطلوبة.