المشروع الختامي — ثلاثة أوامر إنتاجية
روبريك الـ10 نقاط
كل prompt تشحنه في المشروع الختامي بيتقيّم قبال نفس العشر معايير. نقطة لكل معيار، مفيش نص نقاط. أي حاجة تحت 8/10 معناها الـprompt مش جاهز — أعد تصميمه قبل ما تدّعي إنه اتشحن.
الروبريك
| # | المعيار | النقاط |
|---|---|---|
| 1 | الدور / الشخصية مذكورة | 1 |
| 2 | مهمة محدّدة بنتيجة قابلة للقياس | 1 |
| 3 | صيغة المدخل معرّفة | 1 |
| 4 | صيغة المخرج معرّفة (الطول، الهيكل، النبرة) | 1 |
| 5 | على الأقل قيدين صارمين (لازم / ممنوع) | 1 |
| 6 | على الأقل مثال واحد منفّذ (مدخل → مخرج متوقّع) | 1 |
| 7 | رفض أو خطة بديلة لما السؤال يبقى برّا النطاق | 1 |
| 8 | محفّز "ما عرفش" لما المعلومة تكون ناقصة | 1 |
| 9 | اتختبر على مدخل حقيقي واحد على الأقل — والمخرج بيوفي بالمواصفة | 1 |
| 10 | الطول الكلي أقل من 400 كلمة (الـsystem prompts اللي ما بتدخلش الذاكرة العاملة بتبوظ) | 1 |
النجاح = 8/10 (80%). أي حاجة تحت كده معناها أعد التصميم قبل الشحن. (حد النجاح 80% ثابت عبر كل مشاريع مسار هندسة الـPrompts الختامية — Code بيستخدم 40/50، Cross-Model بـrubric خماسي — نفس الحد، مقاييس مختلفة.)
روبريك الـ10 نقاط — مجمّع حسب اللي كل معيار بيحمي منه
هيكل (5 نقاط)
- بيربط مين وإيه
- بيحدّد الشكل من البداية للنهاية
- بيخلّيه قابل للقراءة
سلوك (3 نقاط)
- بيمنع انحراف النبرة
- بيمنع الخروج عن البراند
- بيمنع الهلوسة الواثقة
دليل (2 نقطة)
- بيقفل الشكل المشترك
- بيمسك فشل حقيقي قبل الشحن
- بيحوّل الروبريك لواقع
تقيّم كل بند إزاي، بصدق
الفخ في التقييم الذاتي إنك تبقى متساهل مع نفسك. المعايير مكتوبة بحيث "تقريباً" ما يحسبش. دي طريقة التقييم الصارم:
- الدور مذكور — في جملة واحدة في الـprompt بتسمّي الدور والبراند. "إنت مفيد" ما تحسبش.
- مهمة محدّدة بنتيجة قابلة للقياس — هل ممكن زميل يكتب فحص بسطر واحد بيقرّر المخرج عدّى ولا لأ؟ لو لأ، المهمة مش قابلة للقياس.
- صيغة المدخل معرّفة — الـprompt بيسمّي شكل رسالة المستخدم (فقرة، JSON، كتلة كود، نص اجتماع). لو ما تعرفش تغذّيه، فشّله.
- صيغة المخرج معرّفة — الطول والهيكل والنبرة كلهم محدّدين. اتنين من تلاتة بيفشّل.
- قيدين صارمين — عدّهم. لازم يكونوا محدّدين ("ما تستخدمش 'unfortunately'") مش مبهمين ("كون ودود").
- مثال واحد منفّذ — مدخل حقيقي ومخرج متوقّع حقيقي، مش وصف لـ"شكل المخرج الكويس".
- نطاق الرفض — في سطر بيغطّي اللي المساعد مش هيعمله.
- محفّز "ما عرفش" — في سطر بيغطّي المساعد بيقول إيه لما تنقصه المعلومة.
- اتختبر على مدخل حقيقي — إنت فعلاً غذّيته برسالة حقيقية وقريت المخرج، مش "أنا بفكّر إنه هيشتغل".
- أقل من 400 كلمة — افتح الـprompt في عدّاد كلمات. كون صادق.
ليه الروبريك ده موجود
الروبريك معكوس-هندسي من أنماط فشل prompts اتعطّلت في الإنتاج. كل معيار بيتربط بفئة بق:
- دور ناقص → انحراف نبرة عبر الردود.
- مهمة مبهمة → مخرجات "شكلها معقول" بس ما بتحلّش مشكلة المستخدم.
- مفيش صيغة → عناوين ماركداون في كل حتة، أو ولا واحد.
- مفيش أمثلة → النبرة بتطابق القواعد بس الشكل غلط.
- مفيش رفض → المساعد بسعادة بيرد على أسئلة برّا البراند.
- مفيش محفّز "ما عرفش" → هلوسة واثقة.
- ما اتختبرش → كل اللي فوق اتشحن مع بعض.
- فوق 400 كلمة → تناقضات جوّه الـprompt مش قادر تشوفها بنظرة سريعة.
لو سجّلت 8 أو فوق على prompt، تكون اتجنّبت كل فئات الفشل التمانية. ده الحد.
التالي: تلات سيناريوهات نموذجية تقدر تدرسها أو تستخدمها كقوالب. :::
سجّل الدخول للتقييم