Skip to content

Maliki313/ABDUL-QASSIM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ABDUL-QASSIM

أدوات شاملة لمعالجة بيانات ChatGPT وإنشاء قاعدة معرفة شخصية تعمل بشكل مستقل عن الإنترنت.

نظرة عامة

يحتوي هذا المستودع على نصوص Python لتحويل بيانات ChatGPT المُصدرة إلى قاعدة معرفة شخصية قابلة للبحث. الهدف هو إنشاء نظام عمل مستقل تماماً حيث يمكن للبوت المخصص الإجابة على الأسئلة باستخدام معرفتك الشخصية.

المميزات الرئيسية

  • 📥 استيراد وتحليل تاريخ ChatGPT المُصدر
  • 📁 تنظيم المحادثات في ملفات نصية منفصلة
  • 🔍 بحث ذكي في قاعدة المعرفة الشخصية
  • 💾 عمل أوفلاين بالكامل
  • 🤖 إمكانية التدريب المخصص للنماذج
  • 🔗 تكامل مع النماذج مفتوحة المصدر

التثبيت والإعداد

المتطلبات

  • Python 3.8+
  • مساحة تخزين كافية للبيانات المُصدرة

خطوات التثبيت

  1. استنساخ المستودع:
git clone https://github.com/Maliki313/ABDUL-QASSIM.git
cd ABDUL-QASSIM
  1. تثبيت المتطلبات:
pip install -r requirements.txt

استخراج بيانات ChatGPT

الحصول على تاريخ ChatGPT

  1. في ChatGPT، افتح الإعدادات والبيتاالتحكم في البيانات
  2. اختر تصدير البيانات - ستحصل على أرشيف ZIP يحتوي على ملف JSON مع تاريخ محادثاتك
  3. فك الضغط عن الأرشيف واحفظ مسار ملف *.json

تحويل التاريخ إلى ملفات نصية

python scripts/parse_history.py path/to/conversations.json history/

هذا سينشئ ملف نصي منفصل لكل محادثة في مجلد history/.

استخدام الملاحظات الشخصية

إعداد قاعدة الملاحظات

ضع أي ملفات .txt تريد من البوت الرجوع إليها داخل مجلد، مثل notes/. كل ملف يمكن أن يحتوي على جمل أو نقاط.

البحث في قاعدة المعرفة

يقوم نص offline_bot.py ببحث بسيط بالكلمات المفتاحية في هذه الملفات:

python scripts/offline_bot.py notes "سؤالك هنا"

النص يطبع الجمل التي تطابق جميع الكلمات المفتاحية في سؤالك. هذه نقطة بداية يمكن توسيعها بنموذج لغوي محلي أو بحث مبني على التضمين لتحسين جودة الإجابات.

التدريب المخصص

إنشاء نموذج متقدم

إذا كنت تريد بناء نموذج أكثر تقدماً، يمكنك ضبط نموذج لغوي مفتوح المصدر (مثل LLaMA أو GPT-J) باستخدام بياناتك الخاصة. المحادثات المُصدرة وملاحظاتك يمكن أن تكون بيانات التدريب.

خيارات النماذج المدعومة

  • LLaMA - نماذج Meta مفتوحة المصدر
  • GPT-J - نموذج EleutherAI
  • BERT - للمهام المتخصصة
  • نماذج محلية أخرى

راجع وثائق النموذج الذي تختاره للحصول على تعليمات الضبط الدقيق.

بنية المشروع

ABDUL-QASSIM/
├── scripts/
│   ├── parse_history.py    # تحليل تاريخ ChatGPT
│   └── offline_bot.py      # بوت البحث المحلي
├── history/                # المحادثات المحولة
├── notes/                  # ملاحظاتك الشخصية
├── requirements.txt        # متطلبات Python
└── README.md              # هذا الملف

المميزات المتقدمة

البحث الذكي

  • بحث بالكلمات المفتاحية
  • مطابقة السياق
  • ترتيب النتائج حسب الصلة

الخصوصية والأمان

  • جميع البيانات محلية
  • لا توجد اتصالات خارجية
  • تحكم كامل في البيانات

التوسع والتطوير

  • قابل للتخصيص والتوسع
  • دعم للنماذج الجديدة
  • واجهة برمجية بسيطة

الاستخدام المتقدم

إعداد البيئة

# إنشاء بيئة افتراضية
python -m venv abdul_qassim_env
source abdul_qassim_env/bin/activate  # Linux/Mac
# أو
abdul_qassim_env\Scripts\activate  # Windows

# تثبيت المتطلبات
pip install -r requirements.txt

معالجة البيانات الكبيرة

للبيانات الكبيرة، يمكن تحسين الأداء:

# معالجة متوازية
python scripts/parse_history.py conversations.json history/ --parallel

# ضغط البيانات
python scripts/compress_data.py history/ compressed/

المساهمة

  1. Fork المستودع
  2. أنشئ فرع للميزة الجديدة (git checkout -b feature/amazing-feature)
  3. Commit التغييرات (git commit -m 'إضافة ميزة رائعة')
  4. Push للفرع (git push origin feature/amazing-feature)
  5. افتح Pull Request

الترخيص

هذا المشروع مرخص تحت ترخيص MIT - راجع ملف LICENSE للتفاصيل.

الدعم والتطوير

للاستفسارات والدعم:

  • افتح Issue في المستودع
  • راجع الوثائق المفصلة
  • انضم لمجتمع المطورين

ملاحظة مهمة

هذه النصوص مصممة لتكون خفيفة الوزن حتى تعمل بدون أي اتصال بالشبكة بمجرد تثبيت حزم Python المطلوبة.

About

أدوات معالجة بيانات ChatGPT وإنشاء قاعدة معرفة شخصية - عمل أوفلاين

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages