الدرس 1 من 24

تعمق في بنية RAG

ما وراء RAG الأساسي

6 دقيقة للقراءة

بنهاية هذه الدورة ستكون قد شحنت خدمة RAG عاملة على مستنداتك الخاصة — مع البحث الهجين، إعادة الترتيب، الاستشهادات، والتقييم — تعمل خلف نقطة نهاية FastAPI يمكنك نشرها اليوم. هذا الدرس يضع الأساس: لماذا "RAG الأساسي" يصل إلى 60% من الطريق ولماذا الـ 40% الأخيرة هي معظم العمل الهندسي.

النتيجة أولاً — ما ستبنيه في المشروع النهائي

قبل أن نتحدث عن النظرية، هذا ما تبدو عليه نهاية الدورة:

$ curl -X POST http://localhost:8000/ask \
  -H "Content-Type: application/json" \
  -d '{"q": "ماذا قررت بشأن Q3 في ملاحظات تخطيط مارس؟"}'

{
  "answer": "وفقاً لملاحظاتك 2026-03-14، أولويات Q3 هي: (1) شحن تكامل MCP [cite:1]،
             (2) إطلاق الموقع العربي [cite:2]، (3) خفض البنية 30% [cite:1].",
  "citations": [
    {"id": 1, "source": "meetings/2026-03-14-planning.md"},
    {"id": 2, "source": "meetings/2026-03-14-planning.md"}
  ]
}

كل تحسين تتعلمه عبر الوحدات الست القادمة — تقطيع أفضل، بحث هجين، إعادة ترتيب، تقييم RAGAS، مراقبة — يجعل هذه الخدمة تجيب بدقة أكبر على مستنداتك الفعلية. ليست لعبة.

لماذا يفشل "RAG الأساسي" في الإنتاج

الوصفة الساذجة تبدو أنيقة:

def naive_rag(query: str):
    docs = vectorstore.similarity_search(query, k=4)
    context = "\n".join(d.page_content for d in docs)
    return llm.invoke(f"Context: {context}\n\nQuestion: {query}")

شغّل هذا على 200 مستنداً حقيقياً وستصطدم بكل الأخطاء الأربعة الكلاسيكية في أول ساعة:

  1. عدم تطابق الاستعلام–المستند. المستخدمون يصيغون الأسئلة بلغة طبيعية ("ماذا قررت بشأن Q3؟"). المستندات مكتوبة بنثر تصريحي ("أولويات Q3: تكامل MCP، الإطلاق العربي، خفض البنية 30%"). التشابه الجيبي بينهما قد يكون منخفضاً بشكل مفاجئ.
  2. المقاطع غير ذات الصلة تلوث السياق. إذا كانت 2 من 4 مقاطع مسترجعة عن Q2 (وليس Q3)، النموذج غالباً يفضل الأغلبية ويختلق.
  3. لا تحقق من جودة الاسترجاع. RAG الأساسي يُرجع أعلى k سواء كان أيٌّ منها ذا صلة فعلاً أم لا. "ما عاصمة البرازيل؟" فوق مجلد مستندات شركتك يُرجع 4 مستندات شركة — ثم النموذج إما يهلوس أو يقول بحرج "لا أعرف."
  4. استرجاع ثابت بغض النظر عن التعقيد. "من يملك خدمة المدفوعات؟" تحتاج مقطعاً واحداً. "قارن أولويات Q2 و Q3 عبر الهندسة والتسويق" تحتاج 8 مقاطع من 3 مستندات مختلفة. top-k=4 خطأ لكليهما.

أجيال RAG الثلاثة

الجيلما يضيفهمتى تستخدمه
RAG الساذجبحث التضمين + استدعاء النموذجعروض، نماذج أولية، < 50 مستنداً
RAG المتقدمإعادة كتابة الاستعلام، بحث هجين، إعادة ترتيب، توليد مؤصّلإنتاج بـ 100–100K مستنداً — هذه الدورة
RAG الوكيلاسترجاع متعدد الخطوات، تصحيح ذاتي، استخدام أدواتاستعلامات تحليلية معقدة، وكلاء بحث عابرة المجالات

الحقيقة الصادقة التي تتخطاها معظم الدروس: RAG الوكيل عادة ليس ما تحتاجه. معظم أسئلة الأعمال ("ما سياسة الاسترداد؟"، "ماذا قال العميل عن X") تُجاب جيداً بواسطة RAG متقدم مضبوط بشكل صحيح، بجزء بسيط من الكمون والتكلفة.

تركيز هذه الدورة

ستبني RAG متقدماً — الأرضية الوسطى الجاهزة للإنتاج. وحدة تلو الأخرى:

الوحدةما تتعلمهما تشحنه بنهاية الوحدة
1 (هذه)لماذا يفشل الساذج، RAG مقابل الضبط، الأنبوب، أوضاع الفشلنموذج ذهني لمكان الجودة الفعلي
2اختيار التضمين + اختيار قاعدة المتجهاتمجموعة مفهرسة على Supabase pgvector بتضمينات 3072 بُعداً
3تقطيع يحافظ على المعنىمجموعتك معاد تقطيعها لتهبط الإجابات على حدود نظيفة
4بحث هجين + إعادة ترتيبمسترجع هجين مع BM25 + دمج متجهي + إعادة ترتيب LLM
5تقييم RAGAS + مجموعات اختبارمجموعة اختبار + درجات رقمية لنظامك
6تقوية الإنتاج + المشروع النهائيخدمة RAG FastAPI الكاملة، منشورة، باستشهادات

رؤية رئيسية

معظم إخفاقات RAG ليست مشاكل نموذج — إنها مشاكل استرجاع. أتقن الاسترجاع، وجودة الإجابة تتبع.

استبدل Claude Sonnet 4.6 بـ GPT-5 — جودة إجابتك بالكاد تتحرك. استبدل استرجاع top-k الساذج ببحث هجين مع إعادة ترتيب — جودة إجابتك تقفز من 60% مفيد إلى 90%.

نقطة تحقق — افعل هذا قبل الدرس التالي

لا تحتاج للبرمجة بعد، لكن تحتاج لاختيار:

  1. ما المجموعة التي ستبني RAG فوقها؟ تصدير Notion؟ ويكي شركتك؟ مجلد ملاحظات اجتماعات؟ اختر الآن، ليس لاحقاً. 20–200 مستنداً هي المنطقة الحلوة للبناء الأول.
  2. أين تعيش تلك المستندات؟ إذا كانت مبعثرة عبر Slack/البريد/إلخ، اقضِ 15 دقيقة في تصدير مجلد نظيف من ملفات .md / .pdf. جودة RAG خاصتك محدودة بما تغذيه به.
  3. اكتب 5 أسئلة تريد فعلاً إجابتها من تلك المجموعة. ستستخدمها لتقييم تحسين كل وحدة. وجود حقيقة مرجعية يهم أكثر من أي تقنية ستتعلمها.

التالي: RAG مقابل الضبط الدقيق — متى يفوز كل منهما، ومتى تكون الإجابة الصحيحة هي كلاهما. :::

مراجعة سريعة: كيف تجد هذا الدرس؟

اختبار

الوحدة 1: تعمق في بنية RAG

خذ الاختبار
نشرة أسبوعية مجانية

ابقَ على مسار النيرد

بريد واحد أسبوعياً — دورات، مقالات معمّقة، أدوات، وتجارب ذكاء اصطناعي.

بدون إزعاج. إلغاء الاشتراك في أي وقت.