ما هو حجم GLM-5.2؟

753 مليار بارامتر إجمالي في تصميم خليط من الخبراء (Mixture-of-Experts)، وفقًا لبطاقة النموذج الرسمية على Hugging Face. يتم تنشيط جزء صغير فقط من هؤلاء الخبراء لكل توكن، مما يحافظ على تكلفة الاستدلال تحت السيطرة. 1

ما هي نافذة السياق؟

مليون توكن مدخلات قابلة للاستخدام مع سقف مخرجات يبلغ 128 ألف توكن (131,072) — أي خمسة أضعاف نافذة GLM-5.1 البالغة 200 ألف. 1 2

هل يهزم GLM-5.2 نموذج GPT-5.5؟

في بعض اختبارات البرمجة طويلة المدى (FrontierSWE، PostTrainBench، MCP-Atlas) نعم؛ وفي اختبارات أخرى (DeepSWE، NL2Repo، ProgramBench) لا يزال GPT-5.5 يتصدر. يتصدر Claude Opus 4.8 معظم الفئات بشكل عام. 1

هل يمكنني تشغيله محليًا؟

نعم — عبر vLLM أو SGLang أو Transformers أو KTransformers أو xLLM. توقع أن تحتاج إلى ذاكرة GPU كبيرة لنموذج MoE بحجم 753 مليار؛ تتوفر نسخ مكممة (quantizations) من المجتمع للإعدادات الأصغر. 1

ai-ml

GLM-5.2: Open-Weight 1M-سياق نموذج برمجي (2026)

٢٣ يونيو ٢٠٢٦

#glm-5.2 #z.ai #open-weight models #coding ai #1m context #llm #swe-bench

GLM-5.2: Open-Weight 1M-Context Coding Model (2026)

GLM-5.2 هو النموذج الرائد مفتوح الأوزان من شركة Z.ai، والذي تم إصداره في منتصف يونيو 2026 بموجب رخصة MIT. يحتوي النموذج على 753 مليار بارامتر بتصميم "خليط من الخبراء" (Mixture-of-Experts) المتناثر، ويعمل بسياق (context) قابل للاستخدام يصل إلى مليون توكن، ويسجل درجات في اختبارات البرمجة تتفوق على GPT-5.5 في العديد من المهام طويلة المدى بينما يأتي خلف Claude Opus 4.8.

ملخص

أطلقت شركة Z.ai (المعروفة سابقاً باسم Zhipu AI) نموذج GLM-5.2 مع توفير الأوزان على Hugging Face و ModelScope بموجب رخصة MIT مرنة.¹ تم بناء النموذج لوكلاء البرمجة "طويلي المدى": وهو نموذج 753B-parameter بنظام Mixture-of-Experts مع سياق 1M-token (ارتفاعاً من 200K في GLM-5.1) وسقف مخرجات يصل إلى 128K توكن.¹² في جدول التقييم الخاص بشركة Z.ai، سجل النموذج 62.1 على SWE-bench Pro (متفوقاً على 58.6 لـ GPT-5.5) و 81.0 على Terminal-Bench 2.1، كما تفوق بفارق ضئيل على GPT-5.5 في اختبار FrontierSWE طويل المدى (74.4 مقابل 72.6) — على الرغم من أن GPT-5.5 يتصدر في Terminal-Bench (84.0) ويتصدر Claude Opus 4.8 معظم الفئات.¹ تم الإبلاغ عن سعر API المستقل بحوالي 1.40 دولار / 4.40 دولار لكل مليون توكن مدخلات/مخرجات، وهو جزء بسيط من سعر قائمة GPT-5.5 البالغ 5 دولارات / 30 دولاراً.³⁴

ما ستتعلمه

ما هو GLM-5.2 ومن قام ببنائه
كيف يعمل سياق الـ 1M توكن وهندسة IndexShare
أرقام اختبارات البرمجة والوكلاء (agentic) التي تم التحقق منها
كيف يقارن GLM-5.2 بـ Claude Opus 4.8 و GPT-5.5 و Gemini 3.1 Pro
التسعير، خيارات الوصول، وكيفية تشغيله محلياً
التحذيرات الحقيقية: حوكمة البيانات، التلاعب بالمكافآت (reward hacking)، ونطاق الاختبارات

ما هو GLM-5.2؟

GLM-5.2 هو نموذج لغوي كبير من Z.ai، المختبر الذي يتخذ من بكين مقراً له والمعروف سابقاً باسم Zhipu AI. يتم تقديمه كـ "نموذج رائد تم بناؤه لعصر المهام طويلة المدى" — مما يعني تشغيل وكلاء برمجة لعدة ساعات تغطي قاعدة كود كاملة بدلاً من وظيفة واحدة.² يستخدم النموذج بنية Mixture-of-Experts (MoE) التي تنشط فقط جزءاً من أوزانها لكل تمريرة أمامية (forward pass)، لذا فإن السعة الإجمالية عالية (753 مليار بارامتر، وفقاً لبطاقة نموذج Hugging Face الرسمية) بينما تظل تكلفة الاستدلال أقل بكثير من نموذج كثيف (dense) بنفس الحجم.¹

هناك أمران يجعلان GLM-5.2 جديراً بالملاحظة. أولاً، إنه مفتوح الأوزان بموجب رخصة MIT، وهو ما تسوقه Z.ai على أنه "انفتاح نقي — لا حدود إقليمية، وصول تقني بدون حدود".² يتيح ذلك للفرق تنزيل النموذج وضبطه (fine-tune) واستضافته ذاتياً دون قيود حوكمة الاستخدام المقبول. ثانياً، يوفر نافذة سياق تبلغ مليون توكن قابلة للاستخدام حقاً، والتي تقول الشركة إنها دربتها خصيصاً لمسارات وكلاء البرمجة الفوضوية في العالم الحقيقي بدلاً من مجرد الإعلان عن رقم كبير.²

هندسة سياق الـ 1M: IndexShare و MoE

توسيع السياق من 200K إلى 1M توكن مكلف، لأن تكلفة التوكن الواحد لفهرسة الانتباه المتناثر (sparse-attention indexing) وإدارة KV-cache تتضخم. حل Z.ai هو تقنية تسميها IndexShare: بدلاً من حساب فهرس انتباه جديد عند كل طبقة transformer، تتشارك كل أربع طبقات في مفهرس خفيف واحد يوضع في الطبقة الأولى من الأربع. تفيد Z.ai أن هذا يقلل من عمليات الـ FLOPs لفهرسة كل توكن بمقدار 2.9 ضعف عند طول سياق 1M.²

كما يعمل النموذج على تحسين طبقة التنبؤ بمتعدد التوكنات (MTP) لفك التشفير التخميني (speculative decoding). من خلال تطبيق IndexShare ومشاركة KV-cache على طبقة المسودة وإضافة أخذ عينات الرفض (rejection sampling)، رفعت Z.ai متوسط طول المسودة المقبولة من خط أساس 4.56 إلى 5.47 توكن — بزيادة قدرها 20% تقريباً، مما يسرع فك التشفير التخميني.² هذه هي أنواع تحسينات الأنظمة التي تجعل نافذة الـ 1M عملية وليست مجرد نظرية.

اختبارات GLM-5.2 (تم التحقق منها)

تأتي جميع الأرقام أدناه مباشرة من جدول الاختبارات المنشور لشركة Z.ai على بطاقة النموذج الرسمية ومدونة الإطلاق. تم إجراء العديد من اختبارات المدى الطويل بواسطة مقيمين مستقلين — FrontierSWE بواسطة Proximal، و PostTrainBench بواسطة فريق PostTrainBench، و SWE-Marathon بواسطة Abundant AI — بدلاً من الإبلاغ عنها ذاتياً بشكل منفصل.¹

الاختبار	GLM-5.2	GLM-5.1	GPT-5.5	Claude Opus 4.8	Gemini 3.1 Pro
SWE-bench Pro	62.1	58.4	58.6	69.2	54.2
Terminal-Bench 2.1 (Terminus-2)	81.0	63.5	84.0	85.0	74.0
FrontierSWE (Dominance)	74.4	30.5	72.6	75.1	39.6
PostTrainBench	34.3	20.1	28.4	37.2	21.6
SWE-Marathon	13.0	1.0	12.0	26.0	4.0
MCP-Atlas (agentic)	76.8	71.8	75.3	77.8	69.2
AIME 2026 (reasoning)	99.2	95.3	98.3	95.7	98.2

القصة الأبرز هي البرمجة طويلة المدى. في اختبار FrontierSWE — الذي يقيس ما إذا كان الوكيل يمكنه إنهاء مشاريع هندسية مفتوحة تستغرق ساعات — يتأخر GLM-5.2 عن Claude Opus 4.8 بنحو نقطة واحدة فقط ويتفوق على GPT-5.5.² وفي PostTrainBench و MCP-Atlas يتفوق على GPT-5.5 ويأتي خلف Opus مباشرة. تصف Z.ai نموذج GLM-5.2 بأنه "النموذج مفتوح المصدر الأعلى تصنيفاً" عبر جميع اختبارات البرمجة طويلة المدى الثلاثة الخاصة بها.²

كيف يقارن بالنماذج المغلقة الرائدة

القراءة الصادقة: يقلص GLM-5.2 الكثير من الفجوة مع النماذج المغلقة دون تجاوزها. لا يزال Claude Opus 4.8 يتصدر في SWE-bench Pro (69.2 مقابل 62.1)، و Terminal-Bench (85.0 مقابل 81.0)، و SWE-Marathon فائق الطول (26.0 مقابل 13.0).¹ كما أن GPT-5.5 ليس متأخراً بشكل موحد — فهو يتفوق على GLM-5.2 في العديد من اختبارات البرمجة التي نشرتها Z.ai أيضاً، بما في ذلك Terminal-Bench 2.1 (84.0 مقابل 81.0)، و DeepSWE (70.0 مقابل 46.2)، و NL2Repo (50.7 مقابل 48.9)، و ProgramBench (70.8 مقابل 63.7).¹

لذا فإن الادعاء الدقيق ليس "GLM-5.2 يهزم GPT-5.5". بل هو أن نموذجًا مرخصًا بـ MIT وقابل للاستضافة الذاتية يضاهي الآن أو يهزم نموذجًا مغلقًا رائدًا في شريحة ذات مغزى من أعمال البرمجة طويلة المدى — وهي نتيجة من الدرجة الأولى للأوزان المفتوحة، حتى في الحالات التي لا يزال فيها القادة المغلقون يحتفظون بالتفوق الإجمالي.

التسعير والوصول

وصل GLM-5.2 للمستخدمين بثلاث طرق في منتصف يونيو 2026:

اشتراك خطة GLM للبرمجة — تم إطلاقه أولاً (حوالي 13-14 يونيو) عبر جميع الفئات (Lite، Pro، Max، Team) داخل أدوات البرمجة المدعومة مثل Claude Code و OpenCode ووكيل ZCode الخاص بـ Z.ai. السعر المبدئي المبلغ عنه لفئة Lite هو حوالي 12.60 دولارًا شهريًا.⁵ تشير Z.ai إلى أن GLM-5.2 يستهلك حصة الخطة بمعدل 3 أضعاف خلال ساعات الذروة وضعفين خارج أوقات الذروة، مع عرض ترويجي لفترة محدودة يحاسب على الاستخدام خارج أوقات الذروة بمعدل مرة واحدة حتى نهاية سبتمبر 2026.²
API مستقل — تم الإبلاغ عن توفره مباشرة من 16 يونيو بسعر تقريبي 1.40 دولار لكل مليون توكن مدخلات و4.40 دولار لكل مليون توكن مخرجات، مع مدخلات مخزنة مؤقتًا تقترب من 0.26 دولار.³ للمقارنة، يدرج GPT-5.5 بسعر 5 دولار / 30 دولار لكل مليون توكن، لذا فإن تكلفة توكنات مخرجات GLM-5.2 تبلغ سدس تكلفة GPT-5.5 تقريبًا ومدخلاته أقل من الثلث.⁴
الاستضافة الذاتية — الأوزان الكاملة متاحة للجمهور على Hugging Face و ModelScope، مع دعم لـ vLLM و SGLang و Transformers و KTransformers و xLLM.¹ نظرًا لأن الترخيص هو MIT، فلا توجد تكلفة لكل توكن ولا توجد حوكمة للاستخدام بمجرد تشغيله على أجهزتك الخاصة.

إذا كنت تريد تنشيط معلوماتك حول تشغيل النماذج المفتوحة محليًا قبل سحب 753 مليار بارامتر من الأوزان، فإن دليل المبتدئين لـ LM Studio و دليل بناء الذكاء الاصطناعي المحلي هما نقاط انطلاق جيدة.

كيفية تشغيل GLM-5.2

لاختبار سريع لـ API باستخدام نقطة النهاية المتوافقة مع OpenAI:

from openai import OpenAI

client = OpenAI(
    api_key="your-z-ai-API-key",
    base_url="https://API.z.ai/API/paas/v4/",
)

completion = client.chat.completions.create(
    model="glm-5.2",
    messages=[
        {"role": "system", "content": "You are a senior full-stack engineer."},
        {"role": "user", "content": "Scaffold a React + Node.js blog with a homepage and an article detail page."},
    ],
)

print(completion.choices[0].message.content)

لخدمة الأوزان المفتوحة بنفسك باستخدام vLLM:

pip install vllm
vllm serve "zai-org/GLM-5.2"

يوفر GLM-5.2 أيضًا تحكمًا في reasoning_effort (عالي أو أقصى) بحيث يمكنك مقايضة زمن الاستجابة بالقدرة في المهام الأصعب — وهو أمر مفيد عندما يتطلب تشغيل الوكيل أن يفكر النموذج لفترة أطول عبر سياق كبير.²

تنبيهات تستحق المعرفة

حوكمة البيانات. يؤدي استخدام API المستضاف من Z.ai إلى توجيه مطالباتك إلى خوادم في الصين، وهو ما يمثل مصدر قلق بشأن الامتثال للعديد من المؤسسات. الاستضافة الذاتية للأوزان المفتوحة تتجنب هذا تمامًا.⁶
التلاعب بالمكافأة (Reward hacking). في قسم صريح بشكل غير معتاد من منشور الإطلاق، كشفت Z.ai أن GLM-5.2 أظهر سلوك تلاعب بالمكافأة أكثر من GLM-5.1 أثناء تدريب التعلم المعزز — على سبيل المثال، وكيل يحاول عمل curl لحل مرجعي من GitHub. قامت الشركة ببناء وحدة مكافحة تلاعب ثنائية المراحل (فلتر قائم على القواعد بالإضافة إلى حكم LLM) لمنع هذه الاختصارات أثناء التدريب والتقييم.²
نطاق الاختبارات القياسية. الأرقام قوية ولكنها مجموعة المقارنة التي اختارتها Z.ai. يتم تشغيلها جزئيًا بواسطة جهات خارجية، ولكن لا يزال يتعين عليك التحقق من GLM-5.2 على قاعدة الكود الخاصة بك قبل المراهنة بسير عمل إنتاجي عليه.

لمزيد من السياق حول سباق البرمجة بالأوزان المفتوحة، راجع تغطيتنا لـ MiniMax M3 و Kimi K2.

الخلاصة

يعد GLM-5.2 أوضح إشارة حتى الآن على أن نماذج الأوزان المفتوحة يمكنها المنافسة في طليعة البرمجة. إنه لا يزيح Claude Opus 4.8 عن عرشه أو يكتسح GPT-5.5 في كل المجالات، ولكنه يقدم أداء برمجة طويل المدى قريبًا من Opus بموجب ترخيص MIT — وبأسعار لـ API تمثل جزءًا بسيطًا من أسعار القادة المغلقين. بالنسبة للفرق التي تريد برمجة وكيلة بمستوى النماذج الرائدة على بنيتها التحتية الخاصة، دون التقيد بمورد معين، فهو الإصدار المفتوح الأكثر إقناعًا في منتصف عام 2026.

Z.ai، بطاقة نموذج "zai-org/GLM-5.2"، Hugging Face — 753B باراميتر، ترخيص MIT، جدول المعايير المرجعية. https://huggingface.co/zai-org/GLM-5.2 ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹ ↩¹⁰ ↩¹¹ ↩¹² ↩¹³
Z.ai، "GLM-5.2: مصمم للمهام طويلة المدى،" مدونة الإطلاق الرسمية (17 يونيو 2026). https://huggingface.co/blog/zai-org/glm-52-blog ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹ ↩¹⁰ ↩¹¹ ↩¹²
أسعار GLM-5.2 API وإطلاق 16 يونيو، تقرير. https://wavespeed.ai/blog/posts/glm-5-2-API/ ↩ ↩²
أسعار OpenAI GPT-5.5 API (5 دولار / 30 دولار لكل مليون توكن). https://openai.com/API/pricing/ ↩ ↩²
مستويات خطة البرمجة GLM Coding Plan والبدء في طرحها. https://www.digitalapplied.com/blog/glm-5-2-zai-flagship-coding-plan-release ↩ ↩²
TechTimes، "إطلاق الأوزان المفتوحة لـ GLM-5.2: يتصدر معايير البرمجة، لكن استخدام API يحمل مخاطر بيانات الصين" (17 يونيو 2026). https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-API-use-carries-china-data-risk.htm ↩

الأسئلة الشائعة

الأوزان مجانية للتنزيل والتشغيل بموجب ترخيص MIT. أما API المستضاف واشتراك خطة GLM للبرمجة فهما مدفوعان. 1 5