روبريك الـ10 نقاط — مسار هندسة الأوامر — الأساسيات — Nerd Level Tech

كل prompt تشحنه في المشروع الختامي بيتقيّم قبال نفس العشر معايير. نقطة لكل معيار، مفيش نص نقاط. أي حاجة تحت 8/10 معناها الـprompt مش جاهز — أعد تصميمه قبل ما تدّعي إنه اتشحن.

الروبريك

#	المعيار	النقاط
1	الدور / الشخصية مذكورة	1
2	مهمة محدّدة بنتيجة قابلة للقياس	1
3	صيغة المدخل معرّفة	1
4	صيغة المخرج معرّفة (الطول، الهيكل، النبرة)	1
5	على الأقل قيدين صارمين (لازم / ممنوع)	1
6	على الأقل مثال واحد منفّذ (مدخل → مخرج متوقّع)	1
7	رفض أو خطة بديلة لما السؤال يبقى برّا النطاق	1
8	محفّز "ما عرفش" لما المعلومة تكون ناقصة	1
9	اتختبر على مدخل حقيقي واحد على الأقل — والمخرج بيوفي بالمواصفة	1
10	الطول الكلي أقل من 400 كلمة (الـsystem prompts اللي ما بتدخلش الذاكرة العاملة بتبوظ)	1

النجاح = 8/10 (80%). أي حاجة تحت كده معناها أعد التصميم قبل الشحن. (حد النجاح 80% ثابت عبر كل مشاريع مسار هندسة الـPrompts الختامية — Code بيستخدم 40/50، Cross-Model بـrubric خماسي — نفس الحد، مقاييس مختلفة.)

روبريك الـ10 نقاط — مجمّع حسب اللي كل معيار بيحمي منه

1, 2, 3, 4, 10

هيكل (5 نقاط)

الدور مذكور1 نقطة

مهمة محدّدة1 نقطة

صيغة المدخل1 نقطة

صيغة المخرج1 نقطة

أقل من 400 كلمة1 نقطة

المزايا

بيربط مين وإيه
بيحدّد الشكل من البداية للنهاية
بيخلّيه قابل للقراءة

5, 7, 8

سلوك (3 نقاط)

قيود صارمة1 نقطة

نطاق رفض1 نقطة

محفّز ما عرفش1 نقطة

المزايا

بيمنع انحراف النبرة
بيمنع الخروج عن البراند
بيمنع الهلوسة الواثقة

6, 9

دليل (2 نقطة)

مثال منفّذ1 نقطة

اختبر على مدخل حقيقي1 نقطة

المزايا

بيقفل الشكل المشترك
بيمسك فشل حقيقي قبل الشحن
بيحوّل الروبريك لواقع

تقيّم كل بند إزاي، بصدق

الفخ في التقييم الذاتي إنك تبقى متساهل مع نفسك. المعايير مكتوبة بحيث "تقريباً" ما يحسبش. دي طريقة التقييم الصارم:

الدور مذكور — في جملة واحدة في الـprompt بتسمّي الدور والبراند. "إنت مفيد" ما تحسبش.
مهمة محدّدة بنتيجة قابلة للقياس — هل ممكن زميل يكتب فحص بسطر واحد بيقرّر المخرج عدّى ولا لأ؟ لو لأ، المهمة مش قابلة للقياس.
صيغة المدخل معرّفة — الـprompt بيسمّي شكل رسالة المستخدم (فقرة، JSON، كتلة كود، نص اجتماع). لو ما تعرفش تغذّيه، فشّله.
صيغة المخرج معرّفة — الطول والهيكل والنبرة كلهم محدّدين. اتنين من تلاتة بيفشّل.
قيدين صارمين — عدّهم. لازم يكونوا محدّدين ("ما تستخدمش 'unfortunately'") مش مبهمين ("كون ودود").
مثال واحد منفّذ — مدخل حقيقي ومخرج متوقّع حقيقي، مش وصف لـ"شكل المخرج الكويس".
نطاق الرفض — في سطر بيغطّي اللي المساعد مش هيعمله.
محفّز "ما عرفش" — في سطر بيغطّي المساعد بيقول إيه لما تنقصه المعلومة.
اتختبر على مدخل حقيقي — إنت فعلاً غذّيته برسالة حقيقية وقريت المخرج، مش "أنا بفكّر إنه هيشتغل".
أقل من 400 كلمة — افتح الـprompt في عدّاد كلمات. كون صادق.

ليه الروبريك ده موجود

الروبريك معكوس-هندسي من أنماط فشل prompts اتعطّلت في الإنتاج. كل معيار بيتربط بفئة بق:

دور ناقص → انحراف نبرة عبر الردود.
مهمة مبهمة → مخرجات "شكلها معقول" بس ما بتحلّش مشكلة المستخدم.
مفيش صيغة → عناوين ماركداون في كل حتة، أو ولا واحد.
مفيش أمثلة → النبرة بتطابق القواعد بس الشكل غلط.
مفيش رفض → المساعد بسعادة بيرد على أسئلة برّا البراند.
مفيش محفّز "ما عرفش" → هلوسة واثقة.
ما اتختبرش → كل اللي فوق اتشحن مع بعض.
فوق 400 كلمة → تناقضات جوّه الـprompt مش قادر تشوفها بنظرة سريعة.

لو سجّلت 8 أو فوق على prompt، تكون اتجنّبت كل فئات الفشل التمانية. ده الحد.

التالي: تلات سيناريوهات نموذجية تقدر تدرسها أو تستخدمها كقوالب. :::