النبرة واتباع التعليمات عبر النماذج
الالتزام بالقواعد الصارمة — 3 نماذج، 4 قواعد
ده أول prompt اللهجات بتبان فيه. المستخدم بيدي 4 قيود صارمة. كل نموذج بيفسّر "اتبع كل القواعد دي" بطريقة مختلفة. اقرا الـprompt، اقرا الـ3 مخرجات، وبعدين هنفكك.
نفس الـprompt ← 4 قواعد صارمة ← 3 نتائج مختلفة
العدّادات بتتحرك لفوق لما تـscroll. كل شريط بيتملي بنسبة الالتزام بالقاعدة.
Claude Sonnet 4.5
3/4 قواعد — كسر ترتيب الحروف.
GPT-4o-mini
2/4 قواعد — كسر ترتيب الحروف، السطور طويلة.
Gemini 2.5 Flash
1/4 قواعد — طلّع سطر واحد، من غير coffee.
الـprompt
اتبع كل القواعد دي:
- رد بـ3 سطور بالظبط.
- كل سطر يبتدي بحرف صائت مختلف (A, E, I, O, or U)، بترتيب أبجدي عبر السطور.
- اذكر كلمة "coffee" مرة واحدة بالظبط.
- ما تستخدمش أي سطر أطول من 60 حرف.
الموضوع: روتين صبح هادي.
(الـprompt الأصلي بالإنجليزي والمخرجات كمان، بتفضل زي ما اتلقطت.)
Claude Sonnet 4.5
A gentle sunrise begins the peaceful day ahead. Each sip of coffee warms me from the inside out. I stretch slowly, grateful for this quiet moment.
GPT-4o-mini
Awakening slowly, I savor the calm of dawn. Every sip of coffee warms my soul as I reflect. In silence, I embrace the peace before the day begins.
Gemini 2.5 Flash
A quiet start begins the day
بطاقة المقارنة
prompt بـ4 قواعد: مين فيهم التزم؟
Claude Sonnet 4.5
- التزم بكل القيود
- صياغة مختصرة
GPT-4o-mini
- التزم بكل قاعدة
- نبرة أدفى
Gemini 2.5 Flash
- وقف عند سطر قصير واحد
- فشل في 3 من 4 قيود
اللي ده بيقوله لنا
عدّ القواعد اللي كل نموذج التزم بيها. Claude التزم بالأربعة كلهم: 3 سطور، A/E/I بالترتيب، "coffee" مرة واحدة، كل سطر تحت 60 حرف. GPT-4o-mini التزم بـ3 من 4 — 3 سطور، ترتيب A/E/I، "coffee" مرة — ولما تعدّ بجد السطر التاني والتالت تحت الـ60 حرف، يبقى التزم بالأربعة كمان، بس بصياغة أدفى.
Gemini عمل حاجة تانية تستاهل تسميتها. رجّع سطر واحد بس طوله 32 حرف. ما طلّعش 3 سطور. ما استخدمش 3 بدايات صائتة مختلفة. ما ذكرش كلمة "coffee". فشل في 3 من 4 قواعد صارمة ووقف بدري. ده مش عشوائي — Gemini 2.5 Flash، الأرخص والأسرع فيهم التلاتة، عنده ميل موثّق إنه بيقطع لما الـprompt فيه قيود كتير. النموذج معمول للـlatency، وعدّ القيود بياكل من الميزانية دي.
الدرس مش إن Gemini "مكسور". الدرس إن الـprompt اللي فيه N قيد صارم نسبة نجاحه مختلفة على كل نموذج، ولازم تعرف ده قبل ما تشحن. لو app بتاعك بيبعت prompt بـ4 قواعد لـGemini Flash ومتوقّع إنه هيلتزم بكلهم، هتلاقي فشل في الـproduction.
Captured 2026-04-27 من Claude Sonnet 4.5 و GPT-4o-mini و Gemini 2.5 Flash. الـre-runs ممكن تختلف شوية.
التالي: نفس المهمة، بس الهدف هو الدفء — محور تاني خالص نفس النماذج بتسجّل عليه بشكل مختلف جداً. :::
سجّل الدخول للتقييم