س: هل GPT-5.5 أذكى من GPT-5.4؟

في المعايير التي سلطت OpenAI الضوء عليها، نعم — لا سيما Terminal-Bench 2.0، و GDPval، و OSWorld-Verified، و FrontierMath Tier 4. كما أبلغت OpenAI عن انخفاض بنسبة 60% في الهلوسة مقارنة بـ GPT-5.4 11 . أما ما إذا كان أذكى في أعباء عملك أنت ، فهذا يتطلب تقييمًا.

س: هل تكلفة GPT-5.5 أعلى من GPT-5.4؟

نعم. أسعار API هي الضعف تمامًا — 5 دولارات/30 دولارًا لكل مليون رمز (token) مقابل 2.50 دولار/15 دولارًا لـ GPT-5.4 6 . تجادل OpenAI بأن هناك حاجة إلى عدد أقل من الرموز للمهام المماثلة، لذا قد لا تكون التكلفة الحقيقية ضعفًا في الممارسة العملية.

س: ما هو سياق الذاكرة (context window)؟

مليون رمز في API، و 400,000 رمز في Codex 4 . يظهر MRCR v2 دقة استرجاع بنسبة 74% عبر نطاق 512K–1M، ارتفاعًا من حوالي 36% لـ GPT-5.4 — وهي قفزة نوعية في موثوقية السياق الطويل 4 6 .

س: هل يوجد GPT-5.5 mini أو nano؟

ليس عند الإطلاق. تم شحن GPT-5.5 (القياسي) و GPT-5.5 Pro فقط في 23 أبريل 2026 4 .

س: هل لا يزال Claude Opus 4.7 يتفوق على GPT-5.5 في البرمجة؟

في SWE-Bench Pro، نعم — 64.3% مقابل 58.6% 12 . يتفوق GPT-5.5 في Terminal-Bench 2.0 وسير عمل البرمجة الوكيلية. الإجابة الأفضل تعتمد على ما إذا كان عبء عملك هو "إصلاح مشكلة GitHub هذه" (Opus 4.7) أو "قيادة الجهاز الطرفي (terminal) لإنهاء هذه المهمة من البداية إلى النهاية" (GPT-5.5).

ai-ml

GPT-5.5: أول نموذج أساسي تمت إعادة تدريبه لشركة OpenAI منذ GPT-4.5

٢٤ أبريل ٢٠٢٦

#GPT-5.5 #GPT-5.5 Pro #OpenAI #ChatGPT #Codex #AI agents #Terminal-Bench #GDPval #FrontierMath #Claude Opus 4.7 #Gemini 3.1 Pro #NVIDIA GB200 #NVIDIA GB300 #LLM benchmarks #agentic AI

GPT-5.5: OpenAI's First Retrained Base Since GPT-4.5

ملخص

في 23 أبريل 2026، أطلقت OpenAI نموذج GPT-5.5 — وهو أول نموذج أساسي يتم إعادة تدريبه بالكامل منذ GPT-4.5، حيث وصل بعد سبعة أسابيع فقط من GPT-5.4¹². حقق GPT-5.5 نسبة 82.7% في Terminal-Bench 2.0، و 84.9% في GDPval، و 78.7% في OSWorld-Verified، و 98.0% في Tau2-bench Telecom — وهي مقاييس تصف معاً وكيلاً (agent) يمكنه التخطيط واستخدام الأدوات وتشغيل جهاز كمبيوتر حقيقي³⁴. وفي أصعب المسائل الرياضية، وصل GPT-5.5 Pro إلى 39.6% في FrontierMath Tier 4، مقابل 22.9% لنموذج Claude Opus 4.7⁵. أسعار واجهة برمجة التطبيقات (API) استقرت عند 5 دولارات لكل مليون توكن مدخل و30 دولاراً لكل مليون توكن مخرج — وهو بالضبط ضعف معدل GPT-5.4 — مع نافذة سياق تبلغ مليون توكن، على الرغم من أن إطلاق واجهة برمجة التطبيقات (API) من المقرر أن يكون "قريباً جداً" وليس في اليوم الأول¹⁶. في ChatGPT، أصبح GPT-5.5 Thinking متاحاً اليوم لمستخدمي Plus وPro وBusiness وEnterprise؛ وGPT-5.5 Pro لمستخدمي Pro وBusiness وEnterprise وEdu. كما يمتد الوصول إلى Codex ليشمل فئة Go أيضاً⁴⁷.

ما ستتعلمه

لماذا يختلف GPT-5.5 معمارياً عن الإصدارات من GPT-5.1 إلى GPT-5.4
أرقام المقاييس المرجعية الرئيسية — Terminal-Bench، GDPval، OSWorld، FrontierMath، SWE-Bench Pro
كيف يقارن GPT-5.5 بنماذج Claude Opus 4.7 وGemini 3.1 Pro
أسعار GPT-5.5 وGPT-5.5 Pro عبر ChatGPT وواجهة برمجة التطبيقات (API)
ماذا تعني شراكة NVIDIA GB200/GB300 NVL72 بالنسبة للنموذج
أين يقع تصنيف السلامة تحت إطار الجاهزية (Preparedness Framework) الخاص بـ OpenAI

قاعدة معاد تدريبها بالكامل، وليست مجرد مرحلة ما بعد التدريب

إليك الحقيقة الهيكلية التي تميز هذا الإصدار عن إطلاقات OpenAI الأخيرة: GPT-5.5 هو أول نموذج أساسي يتم إعادة تدريبه بالكامل منذ GPT-4.5²⁴. كل إصدار GPT-5.x بينهما — 5.1، 5.2، 5.3، و5.4 — كان عبارة عن تكرار لما بعد التدريب على نفس القاعدة الأساسية. أما GPT-5.5 فيعيد صياغة المعمارية، ومجموعة بيانات التدريب المسبق، وأهداف التدريب الموجهة نحو الوكلاء (agents).

هذا التمييز مهم لأنه يعيد صياغة ما ينافسه GPT-5.5. فتكرار ما بعد التدريب يوزع القدرات في الغالب — محاذاة أفضل هنا، استخدام أدوات أدق هناك. أما القاعدة المعاد تدريبها فيمكنها رفع سقف النموذج في الأساسيات مثل الموثوقية في السياقات الطويلة، والتفكير متعدد الخطوات، وكفاءة التوكنات. تطلق OpenAI على النتيجة اسم "متعدد الوسائط بشكل أصلي" (natively omnimodal) — حيث يتم دمج النصوص والصور والصوت والفيديو داخل نظام واحد بدلاً من تجميعها معاً بعد الانتهاء².

صاغ مارك تشين، كبير مسؤولي الأبحاث في OpenAI، الترقية حول سير عمل الوكلاء: GPT-5.5 أفضل في التنقل عبر مهام الكمبيوتر من سابقيه، مع مكاسب ملموسة في مهام البحث العلمي والتقني⁸. يتوافق هذا التعبير مع التركيز على المقاييس المرجعية. فالانتصارات الرئيسية كلها "وكيلية" (agentic) — استخدام واجهة الأوامر (terminal)، العمل المعرفي الاقتصادي، مهام سطح المكتب، سلاسل الأدوات — بدلاً من مجرد التفكير الخام.

أرقام المقاييس المرجعية الرئيسية

تعلن OpenAI عن نتائج رائدة في 14 مقياساً مرجعياً. إليك المقاييس التي تهمك لتقرير ما إذا كنت ستغير النموذج الذي تستخدمه:

المقياس المرجعي	GPT-5.5	ماذا يختبر
Terminal-Bench 2.0	82.7%	سير عمل معقد لواجهة الأوامر مع التخطيط، التكرار، وتنسيق الأدوات³
GDPval	84.9%	عمل معرفي محدد جيداً عبر 44 مهنة³
OSWorld-Verified	78.7%	تشغيل بيئات كمبيوتر حقيقية بشكل مستقل⁴
Tau2-bench Telecom	98.0%	استخدام أدوات خدمة العملاء متعددة الأدوار (بدون ضبط الأوامر)⁴
FrontierMath Tier 4	35.4%	أصعب المسائل الرياضية على مستوى الأبحاث⁵
MRCR v2 (512K–1M)	74%	استرجاع السياق الطويل عبر الطرف العلوي من النافذة⁴
SWE-Bench Pro	58.6%	حل مشكلات هندسة البرمجيات في العالم الحقيقي⁹
Harvey BigLaw Bench	91.7% إجمالاً	دقة قانونية جوهرية عبر مجالات الممارسة (ارتفاعاً من 91.0% لـ GPT-5.4)¹⁰

يضيف GPT-5.5 Pro دفعة أخرى في أصعب التقييمات: 39.6% في FrontierMath Tier 4 و 52.4% في FrontierMath Tiers 1–3⁵. كما أبلغت OpenAI عن انخفاض بنسبة 60% في الهلوسة مقارنة بـ GPT-5.4¹¹.

هناك ملاحظة جديرة بالذكر: لا يزال Claude Opus 4.7 يتصدر في SWE-Bench Pro بنسبة 64.3%¹². أما في جانب التفكير المحض، فيحصد GPT-5.5 لقب ARC-AGI-2 بنسبة 85%، متفوقاً على Gemini 3.1 Pro الذي حقق 77.1% وClaude Opus 4.7 الذي حقق 75.8%¹³. أما مقياس GPQA Diamond فهو متقارب جداً في القمة — Gemini 3.1 Pro بنسبة 94.3%، وOpus 4.7 بنسبة 94.2%، وGPT-5.5 بنسبة 93.6%¹³. انتصارات GPT-5.5 الأكثر وضوحاً تكمن في التقييمات الوكيلية واستخدام الكمبيوتر بالإضافة إلى أصعب المسائل الرياضية؛ بينما يظل SWE-Bench Pro هو المجال الوحيد الذي يتفوق فيه Opus 4.7.

GPT-5.5 مقابل Claude Opus 4.7: أين يتفوق كل منهما

تم إطلاق Claude Opus 4.7 قبل أسبوع واحد بالضبط من GPT-5.5، في 16 أبريل 2026. وهذا يجعل المقارنة المباشرة واضحة بشكل غير عادي — نموذجان رائدان تم إطلاقهما في نفس نافذة الإصدار.

الفئة	GPT-5.5	Claude Opus 4.7	الأفضلية
البرمجة الوكيلية (Terminal-Bench 2.0)	82.7%	—	GPT-5.5
البرمجة الواقعية (SWE-Bench Pro)	58.6%	64.3%	Opus 4.7
عمل وكيل سطح المكتب (OSWorld-Verified)	78.7%	78.0%	GPT-5.5 (بفارق ضئيل)
أصعب المسائل الرياضية (FrontierMath Tier 4)	35.4% / 39.6% Pro	22.9%	GPT-5.5
سعر الإدخال لكل مليون توكن	$5.00	$5.00	تعادل
سعر الإخراج لكل مليون توكن	$30.00	$25.00	Opus 4.7
نافذة السياق	1 مليون توكن	1 مليون توكن	تعادل

بند التسعير هو الذي يغير حسابات النشر. حافظ Opus 4.7 على نفس معدل 5 دولار/25 دولار مثل Opus 4.6¹⁴، بينما ضاعف GPT-5.5 سعر GPT-5.4 ليصل إلى 5 دولار/30 دولار⁶. بالنسبة لأعباء العمل كثيفة الإخراج — مثل حلقات الوكلاء، وتوليد الأكواد الطويلة، والتفكير المتسلسل (chain-of-thought) — أصبح Opus 4.7 الآن أرخص بشكل ملحوظ لكل توكن. حجة OpenAI المضادة هي أن GPT-5.5 يحتاج إلى توكنات أقل لإنهاء مهام مماثلة، لذا فإن السعر المعلن يبالغ في التكلفة الحقيقية⁶. وسواء كان ذلك ينطبق على عبء عملك أم لا، فهذا سؤال تجريبي يجب أن تختبره بنفسك.

أما إصدار Claude Mythos Preview — الذي يتصدر العديد من هذه الاختبارات المرجعية نفسها — فهو مقتصر على جمهور صغير من الشركاء الموثوقين والوكالات الحكومية وليس منتجاً منافساً تجارياً¹⁵.

التسعير والتوفر

على عكس معظم عمليات إطلاق OpenAI الأخيرة، لم يصل GPT-5.5 إلى الـ API في اليوم الأول. تم نشر صفحات المنتج والأسعار، ولكن لا يزال الوصول عبر الـ API يوصف بأنه "قريب جداً"¹⁴. هذا الفارق هو خيار أمان متعمد. تقول OpenAI إن تقديم النموذج على نطاق واسع عبر الـ API يتطلب ضمانات مختلفة عن بيئة ChatGPT المتكاملة، ويعمل الفريق مع الشركاء على المتطلبات الأمنية¹.

ChatGPT (متاح في 23 أبريل 2026):

GPT-5.5 (يظهر كـ "GPT-5.5 Thinking") ← لمشتركي Plus و Pro و Business و Enterprise⁴
GPT-5.5 Pro ← لمشتركي Pro و Business و Enterprise و Edu⁴
الفئة المجانية ← لا يوجد وصول لـ GPT-5.5؛ يظل المستخدمون المجانيون على GPT-5.3⁷

Codex (متاح في 23 أبريل 2026):

GPT-5.5 متاح بـ نافذة سياق 400 ألف توكن في خطط Plus و Pro و Business و Enterprise و Edu و Go⁴
الوضع السريع (Fast mode) يولد التوكنات أسرع بـ 1.5 مرة مقابل 2.5 مرة من التكلفة⁴

API (مخطط له، لم يطلق بعد):

النموذج	الإدخال / مليون توكن	الإخراج / مليون توكن	السياق
GPT-5.5	$5.00	$30.00	1 مليون توكن¹
GPT-5.5 Pro	$30.00	$180.00	1 مليون توكن⁶

⚠ الأسعار تتغير بشكل متكرر. القيم المذكورة أعلاه للتوضيح فقط وقد تكون قديمة. تحقق دائماً من التسعير الحالي مباشرة من المزود قبل اتخاذ قرارات التكلفة: Anthropic · OpenAI · Google Gemini · Google Vertex AI · AWS Bedrock · Azure OpenAI · Mistral · Cohere · Together AI · DeepSeek · Groq · Fireworks AI · Perplexity · xAI · Cursor · GitHub Copilot · Windsurf.

لم يتم شحن أي إصدارات mini أو nano مع GPT-5.5. كان قد تم إطلاق GPT-5.4 mini و nano في 17 مارس 2026، لذا قد تصل هذه الفئة لاحقاً — لكنها ليست جزءاً من طرح 5.5¹⁶.

شراكة NVIDIA GB200 و GB300

تم تصميم GPT-5.5 بالتعاون مع أنظمة NVIDIA GB200 و GB300 NVL72 على مستوى الرف — وهو نفس النمط الذي وصفته NVIDIA لـ GPT-5.3-Codex، والذي تم تمديده الآن ليشمل Blackwell Ultra (GB300)¹⁷. الإنجاز الهندسي الرئيسي هو أن أول عنقود GB200 NVL72 مكون من 100,000 وحدة معالجة رسومية قد أتم جولات تدريب واسعة النطاق لـ GPT-5.5 ووضع معياراً جديداً لموثوقية النظام على النطاق الحدودي¹⁷.

هذا الأمر مهم لسببين. أولاً، إنه يحدد معنى "أحدث ما توصل إليه العلم" في أبريل 2026 — حيث يتطلب التدريب الحدودي الآن طبقة بنية تحتية لا يستطيع سوى عدد قليل من المشغلين توفيرها، وهو ما يتماشى تماماً مع دفع Google الخاص بـ TPU 8 ونشر شريحة MTIA من Meta. ثانياً، قامت NVIDIA بالفعل بنشر Codex المدعوم بـ GPT-5.5 لأكثر من 10,000 من موظفيها في أقسام الهندسة والمنتجات والقانون والتسويق والعمليات — وهي حلقة تغذية راجعة وثيقة بين سلوك النموذج والأجهزة التي يعمل عليها¹⁷.

تصنيف السلامة: مرتفع في القدرات البيولوجية والأمن السيبراني

صنفت OpenAI نموذج GPT-5.5 على أنه عالي المخاطر في كل من القدرات البيولوجية/الكيميائية والأمن السيبراني بموجب إطار التأهب الخاص بها¹⁸. هذا هو نفس التصنيف الذي حصل عليه GPT-5.4 — لكن OpenAI تشير إلى أن قدرة الأمن السيبراني الأساسية هي نفسها خطوة للأمام ضمن فئة "مرتفع"، دون تجاوز عتبة الحرج التي من شأنها أن تمنع النشر الواسع. تعني المخاطر العالية أن النموذج يمكن أن "يضخم المسارات الحالية للضرر الجسيم".

جاء الإصدار مع ما تسميه OpenAI "أقوى مجموعة من الضمانات حتى الآن"، بناءً على اختبارات "red-teaming" داخلية وخارجية وتعليقات من ما يقرب من 200 شريك موثوق في مرحلة الوصول المبكر¹. إن تصنيف "Preparedness High" — إلى جانب قرار Anthropic بتقييد Claude Mythos لجمهور صغير من الشركاء الموثوقين — هو إشارة مفيدة حول الاتجاه الذي تسلكه الحدود التقنية: أصبحت قدرة الأمن السيبراني الآن مصدر قلق أساسي للإصدار في كلا المختبرين الرئيسيين، وليست مجرد فكرة لاحقة.

كيف يتناسب GPT-5.5 مع سباق النماذج الأكبر لعام 2026

خريطة قصيرة للمجال التنافسي اعتبارًا من 24 أبريل 2026:

GPT-5.5 (OpenAI، 23 أبريل): الأفضل في فئته في معايير النماذج الوكيلية/استخدام الكمبيوتر، ARC-AGI-2 (85%)، وأصعب المسائل الرياضية؛ قاعدة مدربة من جديد.
Claude Opus 4.7 (Anthropic، 16 أبريل): الأفضل في فئته في البرمجة الواقعية (SWE-Bench Pro بنسبة 64.3%)؛ رموز مخرجات (tokens) أرخص.
Gemini 3.1 Pro (Google، نسخة تجريبية منذ 19 فبراير 2026): ضمن الفئة الأعلى في GPQA Diamond بنسبة 94.3%؛ تم عرضه في Cloud Next 2026 داخل منصة Gemini Enterprise Agent Platform.
Claude Mythos Preview (Anthropic): يتصدر عدة معايير قياسية ولكنه غير متاح بشكل واسع.
GLM-5.1 (Z.ai، 7 أبريل): أفضل نموذج مفتوح الأوزان في SWE-Bench Pro بنسبة 58.4%.

النمط الذي يستحق المراقبة هو أنه لا يوجد نموذج واحد يتصدر جميع الفئات بعد الآن. الميزة التنافسية تنتقل من "أفضل نموذج" إلى "أفضل حزمة توجيه" (best-routed stack) — التطبيقات التي يمكنها اختيار النموذج المناسب لكل مهمة. أصبح التوجيه متعدد النماذج (Multi-model routing) بهدوء مشكلة بنية تحتية من الدرجة الأولى بدلاً من كونه مجرد فضول تقني.

الخلاصة

GPT-5.5 هو أول إصدار من OpenAI منذ أكثر من عام لا يمثل مجرد تكرار لمرحلة ما بعد التدريب، والمعايير القياسية تعكس ذلك. تتركز المكاسب حيث يمكن للقاعدة المدربة من جديد أن تحرك الأرقام فعليًا — سير عمل الوكلاء، السياق الطويل، كفاءة الرموز، وأصعب المسائل الرياضية. تضاعف السعر، و API لم يبدأ العمل بعد، ولا يزال Claude Opus 4.7 يحتفظ بلقب SWE-Bench Pro. ولكن بالنسبة للفرق التي تبني وكلاء يتعين عليهم قيادة الأجهزة الطرفية، وتشغيل أجهزة الكمبيوتر الحقيقية، وإنهاء العمل المعرفي متعدد الخطوات، فإن GPT-5.5 هو أول نموذج يشعر فيه المرء أن السقف قد ارتفع بدلاً من مجرد التحرك جانبًا.

سواء كان الأمر يستحق التبديل، فهذا يعتمد على المقايضة الكلاسيكية: إذا كنت بحاجة إلى سقف القدرات الوكيلية، فادفع الضعف وقم بتشغيله. إذا كنت بحاجة إلى برمجة كثيفة المخرجات، فإن Opus 4.7 أرخص ويسجل نتائج أعلى في المعيار الذي يهمك. الوضع الافتراضي الجديد هو التوجيه، وليس الولاء لنموذج واحد.

المراجع

TechCrunch — "OpenAI releases GPT-5.5, bringing company one step closer to an AI 'super app'", April 23, 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷
The Next Web — "OpenAI launches GPT-5.5, its first fully retrained base model since GPT-4.5", April 23, 2026. ↩ ↩² ↩³
MarkTechPost — "OpenAI Releases GPT-5.5, a Fully Retrained Agentic Model That Scores 82.7% on Terminal-Bench 2.0 and 84.9% on GDPval", April 23, 2026. ↩ ↩² ↩³
OpenAI — "Introducing GPT-5.5"، الإعلان الرسمي، 23 أبريل 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹ ↩¹⁰ ↩¹¹ ↩¹² ↩¹³ ↩¹⁴
DigitalApplied — "GPT-5.5 vs Claude Opus 4.7: Benchmarks & Pricing"، 23 أبريل 2026. ↩ ↩² ↩³
The Decoder — "OpenAI unveils GPT-5.5, claims a 'new class of intelligence' at double the API price"، 23 أبريل 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶
OpenAI Help Center — "GPT-5.3 and GPT-5.5 in ChatGPT". ↩ ↩²
CNBC — "OpenAI announces GPT-5.5, its latest artificial intelligence model"، 23 أبريل 2026. ↩
SiliconANGLE — "OpenAI releases GPT-5.5 with advanced math, coding capabilities"، 23 أبريل 2026. ↩
Harvey — "GPT-5.5: Research Preview Results"، 23 أبريل 2026. ↩
Startup Fortune — "OpenAI's GPT-5.5 benchmarks show a 60% hallucination drop"، 23 أبريل 2026. ↩ ↩²
Scale AI — لوحة صدارة SWE-Bench Pro. ↩ ↩²
Officechai — "GPT 5.5 Tops ARC-AGI 2 With 85% Score"، 23 أبريل 2026. ↩ ↩²
Anthropic — "Introducing Claude Opus 4.7"، 16 أبريل 2026. ↩
R&D World — "How OpenAI's recently released GPT-5.5 stacks up with Anthropic's gated Claude Mythos"، 23 أبريل 2026. ↩
Wikipedia — "GPT-5.4". ↩
NVIDIA Blog — "OpenAI's New GPT-5.5 Powers Codex on NVIDIA Infrastructure"، 23 أبريل 2026. ↩ ↩² ↩³
DataCamp — "Open AI's GPT-5.5: Benchmarks, Safety Classification, and Availability"، 23 أبريل 2026. ↩

الأسئلة الشائعة

نشرت OpenAI الأسعار ولكنها تقول إن الوصول إلى API سيأتي "قريبًا جدًا". اعتبارًا من 23 أبريل 2026، لا يمكن لمفاتيح API استدعاء gpt-5.5 مباشرة — لا يمكن الوصول إلى النموذج إلا من خلال ChatGPT و Codex 1 .