الدرس 9 من 20

الذاكرة والمعرفة

إدارة نافذة السياق

3 دقيقة للقراءة

كل نموذج لغة كبير له نافذة سياق محدودة—العدد الأقصى من الرموز التي يمكنه معالجتها في وقت واحد. إدارة هذه النافذة أمر حاسم لبناء وكلاء فعالين.

فهم نوافذ السياق

النموذجنافذة السياقما يعادلها بالكلمات تقريباً
GPT-5.41 مليون رمز~750,000 كلمة
Claude Sonnet 4.61 مليون رمز~750,000 كلمة
Gemini 3.1 Pro1 مليون رمز~750,000 كلمة

ملاحظة: سياق أطول ≠ أداء أفضل. النماذج غالباً تكافح مع المعلومات في "وسط" السياقات الطويلة.

اقتصاديات الرموز

كل استدعاء API يكلف رموزاً. محادثة وكيل نموذجية تتضمن:

موجه النظام:        ~500-2000 رمز
المحادثة:           متغير
تعريفات الأدوات:    ~100-500 لكل أداة
نتائج الأدوات:      متغير
الاستجابة:          ~200-2000 رمز

إدارة السياق بكفاءة

1. التلخيص

def manage_context(messages, max_tokens=50000):
    total_tokens = count_tokens(messages)

    if total_tokens > max_tokens:
        # تلخيص الرسائل القديمة
        old_messages = messages[:-10]  # الاحتفاظ بآخر 10
        summary = llm.generate(f"لخص هذه المحادثة: {old_messages}")

        return [
            {"role": "system", "content": f"السياق السابق: {summary}"},
            *messages[-10:]
        ]

    return messages

2. النافذة المنزلقة

الاحتفاظ فقط بالرسائل الأحدث:

def sliding_window(messages, window_size=20):
    if len(messages) > window_size:
        # الاحتفاظ دائماً برسالة النظام
        system = messages[0] if messages[0]["role"] == "system" else None
        recent = messages[-window_size:]
        return [system, *recent] if system else recent
    return messages

3. الاسترجاع الانتقائي

تضمين فقط السياق السابق ذي الصلة:

def selective_context(messages, current_query):
    # تضمين الاستعلام الحالي
    query_embedding = embed(current_query)

    # إيجاد الرسائل السابقة ذات الصلة
    relevant = []
    for msg in messages:
        similarity = cosine_similarity(query_embedding, embed(msg))
        if similarity > 0.7:
            relevant.append(msg)

    return relevant

أفضل الممارسات

الممارسةالفائدة
مراقبة استخدام الرموزالبقاء ضمن الحدود، التحكم في التكاليف
التلخيص بشكل استباقيالحفاظ على المعلومات الرئيسية
إعطاء الأولوية للسياق الحديثالأكثر صلة بالمهمة الحالية
تخزين التضمينات مؤقتاًاسترجاع أسرع
استخدام نماذج أصغر للتلخيصفعال من حيث التكلفة

المزالق الشائعة

  • تجاهل حدود السياق ← اقتطاع معلومات مهمة
  • تضمين كل شيء ← بطيء، مكلف، مشوش
  • الاقتطاع العدواني ← فقدان سياق رئيسي
  • التلخيص الذكي ← أفضل ما في العالمين

بعد ذلك، سنستكشف RAG—تقنية قوية لمنح الوكلاء الوصول إلى المعرفة الخارجية. :::

مراجعة سريعة: كيف تجد هذا الدرس؟

اختبار

الوحدة 3: الذاكرة والمعرفة

خذ الاختبار
نشرة أسبوعية مجانية

ابقَ على مسار النيرد

بريد واحد أسبوعياً — دورات، مقالات معمّقة، أدوات، وتجارب ذكاء اصطناعي.

بدون إزعاج. إلغاء الاشتراك في أي وقت.