الدرس 40 من 42

المشروع الختامي — ثلاثة أوامر إنتاجية

روبريك الـ10 نقاط

3 دقيقة للقراءة

كل prompt تشحنه في المشروع الختامي بيتقيّم قبال نفس العشر معايير. نقطة لكل معيار، مفيش نص نقاط. أي حاجة تحت 8/10 معناها الـprompt مش جاهز — أعد تصميمه قبل ما تدّعي إنه اتشحن.

الروبريك

#المعيارالنقاط
1الدور / الشخصية مذكورة1
2مهمة محدّدة بنتيجة قابلة للقياس1
3صيغة المدخل معرّفة1
4صيغة المخرج معرّفة (الطول، الهيكل، النبرة)1
5على الأقل قيدين صارمين (لازم / ممنوع)1
6على الأقل مثال واحد منفّذ (مدخل → مخرج متوقّع)1
7رفض أو خطة بديلة لما السؤال يبقى برّا النطاق1
8محفّز "ما عرفش" لما المعلومة تكون ناقصة1
9اتختبر على مدخل حقيقي واحد على الأقل — والمخرج بيوفي بالمواصفة1
10الطول الكلي أقل من 400 كلمة (الـsystem prompts اللي ما بتدخلش الذاكرة العاملة بتبوظ)1

النجاح = 8/10 (80%). أي حاجة تحت كده معناها أعد التصميم قبل الشحن. (حد النجاح 80% ثابت عبر كل مشاريع مسار هندسة الـPrompts الختامية — Code بيستخدم 40/50، Cross-Model بـrubric خماسي — نفس الحد، مقاييس مختلفة.)

روبريك الـ10 نقاط — مجمّع حسب اللي كل معيار بيحمي منه

1, 2, 3, 4, 10

هيكل (5 نقاط)

الدور مذكور1 نقطة
مهمة محدّدة1 نقطة
صيغة المدخل1 نقطة
صيغة المخرج1 نقطة
أقل من 400 كلمة1 نقطة
المزايا
  • بيربط مين وإيه
  • بيحدّد الشكل من البداية للنهاية
  • بيخلّيه قابل للقراءة
5, 7, 8

سلوك (3 نقاط)

قيود صارمة1 نقطة
نطاق رفض1 نقطة
محفّز ما عرفش1 نقطة
المزايا
  • بيمنع انحراف النبرة
  • بيمنع الخروج عن البراند
  • بيمنع الهلوسة الواثقة
6, 9

دليل (2 نقطة)

مثال منفّذ1 نقطة
اختبر على مدخل حقيقي1 نقطة
المزايا
  • بيقفل الشكل المشترك
  • بيمسك فشل حقيقي قبل الشحن
  • بيحوّل الروبريك لواقع

تقيّم كل بند إزاي، بصدق

الفخ في التقييم الذاتي إنك تبقى متساهل مع نفسك. المعايير مكتوبة بحيث "تقريباً" ما يحسبش. دي طريقة التقييم الصارم:

  • الدور مذكور — في جملة واحدة في الـprompt بتسمّي الدور والبراند. "إنت مفيد" ما تحسبش.
  • مهمة محدّدة بنتيجة قابلة للقياس — هل ممكن زميل يكتب فحص بسطر واحد بيقرّر المخرج عدّى ولا لأ؟ لو لأ، المهمة مش قابلة للقياس.
  • صيغة المدخل معرّفة — الـprompt بيسمّي شكل رسالة المستخدم (فقرة، JSON، كتلة كود، نص اجتماع). لو ما تعرفش تغذّيه، فشّله.
  • صيغة المخرج معرّفة — الطول والهيكل والنبرة كلهم محدّدين. اتنين من تلاتة بيفشّل.
  • قيدين صارمين — عدّهم. لازم يكونوا محدّدين ("ما تستخدمش 'unfortunately'") مش مبهمين ("كون ودود").
  • مثال واحد منفّذ — مدخل حقيقي ومخرج متوقّع حقيقي، مش وصف لـ"شكل المخرج الكويس".
  • نطاق الرفض — في سطر بيغطّي اللي المساعد مش هيعمله.
  • محفّز "ما عرفش" — في سطر بيغطّي المساعد بيقول إيه لما تنقصه المعلومة.
  • اتختبر على مدخل حقيقي — إنت فعلاً غذّيته برسالة حقيقية وقريت المخرج، مش "أنا بفكّر إنه هيشتغل".
  • أقل من 400 كلمة — افتح الـprompt في عدّاد كلمات. كون صادق.

ليه الروبريك ده موجود

الروبريك معكوس-هندسي من أنماط فشل prompts اتعطّلت في الإنتاج. كل معيار بيتربط بفئة بق:

  • دور ناقص → انحراف نبرة عبر الردود.
  • مهمة مبهمة → مخرجات "شكلها معقول" بس ما بتحلّش مشكلة المستخدم.
  • مفيش صيغة → عناوين ماركداون في كل حتة، أو ولا واحد.
  • مفيش أمثلة → النبرة بتطابق القواعد بس الشكل غلط.
  • مفيش رفض → المساعد بسعادة بيرد على أسئلة برّا البراند.
  • مفيش محفّز "ما عرفش" → هلوسة واثقة.
  • ما اتختبرش → كل اللي فوق اتشحن مع بعض.
  • فوق 400 كلمة → تناقضات جوّه الـprompt مش قادر تشوفها بنظرة سريعة.

لو سجّلت 8 أو فوق على prompt، تكون اتجنّبت كل فئات الفشل التمانية. ده الحد.

التالي: تلات سيناريوهات نموذجية تقدر تدرسها أو تستخدمها كقوالب. :::

اختبار

الوحدة 9: المشروع الختامي

خذ الاختبار
هل كان هذا الدرس مفيدًا؟

سجّل الدخول للتقييم