تعمق في بنية RAG
ما وراء RAG الأساسي
بنهاية هذه الدورة ستكون قد شحنت خدمة RAG عاملة على مستنداتك الخاصة — مع البحث الهجين، إعادة الترتيب، الاستشهادات، والتقييم — تعمل خلف نقطة نهاية FastAPI يمكنك نشرها اليوم. هذا الدرس يضع الأساس: لماذا "RAG الأساسي" يصل إلى 60% من الطريق ولماذا الـ 40% الأخيرة هي معظم العمل الهندسي.
النتيجة أولاً — ما ستبنيه في المشروع النهائي
قبل أن نتحدث عن النظرية، هذا ما تبدو عليه نهاية الدورة:
$ curl -X POST http://localhost:8000/ask \
-H "Content-Type: application/json" \
-d '{"q": "ماذا قررت بشأن Q3 في ملاحظات تخطيط مارس؟"}'
{
"answer": "وفقاً لملاحظاتك 2026-03-14، أولويات Q3 هي: (1) شحن تكامل MCP [cite:1]،
(2) إطلاق الموقع العربي [cite:2]، (3) خفض البنية 30% [cite:1].",
"citations": [
{"id": 1, "source": "meetings/2026-03-14-planning.md"},
{"id": 2, "source": "meetings/2026-03-14-planning.md"}
]
}
كل تحسين تتعلمه عبر الوحدات الست القادمة — تقطيع أفضل، بحث هجين، إعادة ترتيب، تقييم RAGAS، مراقبة — يجعل هذه الخدمة تجيب بدقة أكبر على مستنداتك الفعلية. ليست لعبة.
لماذا يفشل "RAG الأساسي" في الإنتاج
الوصفة الساذجة تبدو أنيقة:
def naive_rag(query: str):
docs = vectorstore.similarity_search(query, k=4)
context = "\n".join(d.page_content for d in docs)
return llm.invoke(f"Context: {context}\n\nQuestion: {query}")
شغّل هذا على 200 مستنداً حقيقياً وستصطدم بكل الأخطاء الأربعة الكلاسيكية في أول ساعة:
- عدم تطابق الاستعلام–المستند. المستخدمون يصيغون الأسئلة بلغة طبيعية ("ماذا قررت بشأن Q3؟"). المستندات مكتوبة بنثر تصريحي ("أولويات Q3: تكامل MCP، الإطلاق العربي، خفض البنية 30%"). التشابه الجيبي بينهما قد يكون منخفضاً بشكل مفاجئ.
- المقاطع غير ذات الصلة تلوث السياق. إذا كانت 2 من 4 مقاطع مسترجعة عن Q2 (وليس Q3)، النموذج غالباً يفضل الأغلبية ويختلق.
- لا تحقق من جودة الاسترجاع. RAG الأساسي يُرجع أعلى k سواء كان أيٌّ منها ذا صلة فعلاً أم لا. "ما عاصمة البرازيل؟" فوق مجلد مستندات شركتك يُرجع 4 مستندات شركة — ثم النموذج إما يهلوس أو يقول بحرج "لا أعرف."
- استرجاع ثابت بغض النظر عن التعقيد. "من يملك خدمة المدفوعات؟" تحتاج مقطعاً واحداً. "قارن أولويات Q2 و Q3 عبر الهندسة والتسويق" تحتاج 8 مقاطع من 3 مستندات مختلفة. top-k=4 خطأ لكليهما.
أجيال RAG الثلاثة
| الجيل | ما يضيفه | متى تستخدمه |
|---|---|---|
| RAG الساذج | بحث التضمين + استدعاء النموذج | عروض، نماذج أولية، < 50 مستنداً |
| RAG المتقدم | إعادة كتابة الاستعلام، بحث هجين، إعادة ترتيب، توليد مؤصّل | إنتاج بـ 100–100K مستنداً — هذه الدورة |
| RAG الوكيل | استرجاع متعدد الخطوات، تصحيح ذاتي، استخدام أدوات | استعلامات تحليلية معقدة، وكلاء بحث عابرة المجالات |
الحقيقة الصادقة التي تتخطاها معظم الدروس: RAG الوكيل عادة ليس ما تحتاجه. معظم أسئلة الأعمال ("ما سياسة الاسترداد؟"، "ماذا قال العميل عن X") تُجاب جيداً بواسطة RAG متقدم مضبوط بشكل صحيح، بجزء بسيط من الكمون والتكلفة.
تركيز هذه الدورة
ستبني RAG متقدماً — الأرضية الوسطى الجاهزة للإنتاج. وحدة تلو الأخرى:
| الوحدة | ما تتعلمه | ما تشحنه بنهاية الوحدة |
|---|---|---|
| 1 (هذه) | لماذا يفشل الساذج، RAG مقابل الضبط، الأنبوب، أوضاع الفشل | نموذج ذهني لمكان الجودة الفعلي |
| 2 | اختيار التضمين + اختيار قاعدة المتجهات | مجموعة مفهرسة على Supabase pgvector بتضمينات 3072 بُعداً |
| 3 | تقطيع يحافظ على المعنى | مجموعتك معاد تقطيعها لتهبط الإجابات على حدود نظيفة |
| 4 | بحث هجين + إعادة ترتيب | مسترجع هجين مع BM25 + دمج متجهي + إعادة ترتيب LLM |
| 5 | تقييم RAGAS + مجموعات اختبار | مجموعة اختبار + درجات رقمية لنظامك |
| 6 | تقوية الإنتاج + المشروع النهائي | خدمة RAG FastAPI الكاملة، منشورة، باستشهادات |
رؤية رئيسية
معظم إخفاقات RAG ليست مشاكل نموذج — إنها مشاكل استرجاع. أتقن الاسترجاع، وجودة الإجابة تتبع.
استبدل Claude Sonnet 4.6 بـ GPT-5 — جودة إجابتك بالكاد تتحرك. استبدل استرجاع top-k الساذج ببحث هجين مع إعادة ترتيب — جودة إجابتك تقفز من 60% مفيد إلى 90%.
نقطة تحقق — افعل هذا قبل الدرس التالي
لا تحتاج للبرمجة بعد، لكن تحتاج لاختيار:
- ما المجموعة التي ستبني RAG فوقها؟ تصدير Notion؟ ويكي شركتك؟ مجلد ملاحظات اجتماعات؟ اختر الآن، ليس لاحقاً. 20–200 مستنداً هي المنطقة الحلوة للبناء الأول.
- أين تعيش تلك المستندات؟ إذا كانت مبعثرة عبر Slack/البريد/إلخ، اقضِ 15 دقيقة في تصدير مجلد نظيف من ملفات
.md/.pdf. جودة RAG خاصتك محدودة بما تغذيه به. - اكتب 5 أسئلة تريد فعلاً إجابتها من تلك المجموعة. ستستخدمها لتقييم تحسين كل وحدة. وجود حقيقة مرجعية يهم أكثر من أي تقنية ستتعلمها.
التالي: RAG مقابل الضبط الدقيق — متى يفوز كل منهما، ومتى تكون الإجابة الصحيحة هي كلاهما. :::