الدرس 24 من 24

التقييم والنشر

الخطوات التالية

3 دقيقة للقراءة

تهانينا! لقد تعلمت كيفية ضبط نماذج اللغة الكبيرة باستخدام LoRA و QLoRA والأدوات الحديثة مثل Unsloth و TRL. دعنا نلخص ونستكشف أين نذهب بعد ذلك.

ما تعلمته

الوحدة 1: فهم الضبط الدقيق

  • لماذا ومتى نضبط دقيقاً مقابل استخدام المحثات
  • الضبط الدقيق الكامل مقابل طرق PEFT
  • مقارنات LoRA و QLoRA و DoRA

الوحدة 2: إعداد مجموعات البيانات

  • صيغ ضبط التعليمات (Alpaca، ShareGPT، ChatML)
  • إنشاء بيانات تدريب عالية الجودة
  • التحقق من البيانات وتنظيفها

الوحدة 3: LoRA و QLoRA عملياً

  • تكوين معاملات LoRA (r، alpha، target_modules)
  • التكميم 4-bit مع QLoRA
  • سير عمل SFTTrainer الكامل

الوحدة 4: التدريب مع Unsloth

  • تدريب أسرع 2x مع 70% ذاكرة VRAM أقل
  • تكوينات التدريب المُحسّنة
  • التصدير إلى صيغة GGUF

الوحدة 5: المحاذاة مع DPO

  • التحسين المباشر للتفضيلات مقابل RLHF
  • إنشاء مجموعات بيانات التفضيل
  • خط أنابيب SFT + DPO ثنائي المرحلة

الوحدة 6: التقييم والنشر

  • قياس جودة النموذج
  • تشخيص المشاكل الشائعة
  • النشر على Ollama

مجموعة أدوات الضبط الدقيق الخاصة بك

الأداةالغرض
transformersتحميل النموذج الأساسي والتدريب
peftتنفيذ LoRA/QLoRA
trlSFTTrainer و DPOTrainer
bitsandbytesالتكميم 4-bit
unslothتدريب أسرع 2x
datasetsتحميل ومعالجة البيانات
ollamaنشر النموذج محلياً

مسار التعلم الموصى به

بناءً على ما تعلمته، إليك خطواتك التالية:

فوري: مارس ما تعلمته

1. اضبط نموذجاً على بياناتك الخاصة
   └── اختر حالة استخدام محددة
   └── جهّز 1,000+ مثال
   └── درّب مع Unsloth + SFT
   └── قيّم وكرر

2. انشر على Ollama
   └── صدّر إلى GGUF
   └── أنشئ Modelfile مخصص
   └── ادمج في تطبيقك

الدورة التالية: أطر تقييم الذكاء الاصطناعي

بعد الضبط الدقيق يأتي التقييم. تعلم قياس جودة الذكاء الاصطناعي بشكل منهجي:

أطر تقييم الذكاء الاصطناعي: RAGAS، LangSmith والمقاييس المخصصة

ما ستتعلمه:

  • خطوط أنابيب التقييم الآلي
  • مقاييس RAG المحددة (RAGAS)
  • معايير التقييم المخصصة
  • أطر اختبار A/B
  • المراقبة في الإنتاج

هذه الدورة تتصل مباشرة بعمل الضبط الدقيق:

  • قس إذا حسّن الضبط الدقيق نموذجك فعلاً
  • قارن تكوينات التدريب المختلفة
  • ابنِ التقييم في خط أنابيب ML الخاص بك
  • راقب جودة النموذج في الإنتاج

موضوعات متقدمة للاستكشاف

الموضوعالوصف
التدريب متعدد GPUالتوسع لنماذج ومجموعات بيانات أكبر
استمرار التدريب المسبقتكييف النماذج الأساسية لمجالات جديدة
خليط الخبراءتدريب نماذج كبيرة فعالة
نماذج الرؤية-اللغةضبط النماذج متعددة الوسائط
دمج النماذجالجمع بين عدة نماذج مضبوطة

بناء محفظتك

أفكار المشاريع

  1. روبوت خبير المجال

    • اضبط على وثائق تقنية
    • انشر كمساعد أسئلة وأجوبة
    • قس تحسينات الدقة
  2. نموذج نقل الأسلوب

    • درّب على أساليب كتابة محددة
    • أنشئ صوت علامة تجارية متسق
    • اختبار A/B ضد النموذج الأساسي
  3. مساعد البرمجة

    • اضبط على قاعدة الكود الخاصة بك
    • تعلم اتفاقيات الفريق
    • ادمج مع IDE
  4. وكيل دعم العملاء

    • درّب على تذاكر الدعم
    • تعامل مع استفسارات المجال المحددة
    • قلل وقت الاستجابة

مشاركة عملك

# ادفع النموذج المضبوط إلى Hugging Face
huggingface-cli login
model.push_to_hub("your-username/model-name")

# شارك GGUF عبر Ollama
ollama push your-username/model-name

# وثّق عمليتك
# - تكوين التدريب
# - وصف مجموعة البيانات
# - نتائج التقييم
# - دليل النشر

الموارد

التوثيق

أوراق البحث

  • LoRA: Low-Rank Adaptation of Large Language Models
  • QLoRA: Efficient Finetuning of Quantized LLMs
  • DPO: Direct Preference Optimization

المجتمع

  • Hugging Face Discord
  • r/LocalLLaMA
  • Unsloth Discord

أفكار ختامية

الضبط الدقيق تقنية قوية تجسر الفجوة بين نماذج اللغة الكبيرة للأغراض العامة ومساعدي الذكاء الاصطناعي المتخصصين. مع الأدوات التي تعلمتها:

  • LoRA يجعل الضبط الدقيق متاحاً على أجهزة المستهلكين
  • QLoRA يمكّن تدريب نماذج كانت تتطلب سابقاً GPUs للمؤسسات
  • Unsloth يقطع وقت وتكاليف التدريب إلى النصف
  • DPO يحاذي النماذج بدون خطوط أنابيب RL معقدة
  • Ollama يجعل النشر بسيطاً كأمر واحد

مفتاح النجاح هو التكرار:

  1. ابدأ بمجموعة بيانات صغيرة
  2. درّب بسرعة مع Unsloth
  3. قيّم بدقة
  4. حسّن بياناتك
  5. كرر

تذكر: جودة البيانات تتفوق على الكمية. مجموعة بيانات منسقة جيداً من 1,000 مثال ستتفوق على 10,000 مثال مشوش. ركز على حالة استخدامك المحددة وكرر بناءً على نتائج التقييم.

حظاً موفقاً في رحلة الضبط الدقيق!


جاهز لمواصلة التعلم؟ تحقق من دورة أطر تقييم الذكاء الاصطناعي لإتقان فن قياس جودة الذكاء الاصطناعي. :::

مراجعة سريعة: كيف تجد هذا الدرس؟

اختبار

الوحدة 6: التقييم والنشر

خذ الاختبار
نشرة أسبوعية مجانية

ابقَ على مسار النيرد

بريد واحد أسبوعياً — دورات، مقالات معمّقة، أدوات، وتجارب ذكاء اصطناعي.

بدون إزعاج. إلغاء الاشتراك في أي وقت.