ai-ml

MiniMax M3: برمجة مفتوحة الأوزان بعُشر التكلفة (2026)

٩ يونيو ٢٠٢٦

MiniMax M3: Open-Weight Coding at 1/10 the Cost (2026)

إن MiniMax M3 هو نموذج لغوي صيني مفتوح الأوزان (open-weight)، تم إصداره في 1 يونيو 2026، يجمع بين قدرات البرمجة بمستوى النماذج الرائدة (frontier-level) مع نافذة سياق تصل إلى مليون توكن ووسائط متعددة أصلية (native multimodality) — وبسعر يقارب عُشر سعر التوكن الواحد في GPT-5.5 أو Claude Opus.12 معايير الأداء (benchmarks) المعلنة حقيقية، لكنها مُبلغ عنها ذاتيًا وتم قياسها مقابل نموذج من Anthropic تم تجاوزه بالفعل.

الجزء المثير للاهتمام هو آلية الانتباه الجديدة التي يعتمد عليها، وهي MiniMax Sparse Attention (MSA)، وهي ما يجعل تقديم سياق بمليون توكن ميسور التكلفة.1 كما أن الملاحظات الجانبية تستحق اهتمامك أيضًا: فالأرقام تأتي من بيئة اختبار MiniMax الخاصة، وسقف المقارنة كان Opus 4.7 بدلاً من Opus 4.8 الأحدث، وحتى وقت كتابة هذا التقرير — لا يمكنك بعد تنزيل الأوزان "المفتوحة".34

ملخص

MiniMax M3 هو نموذج مفتوح الأوزان من شركة الذكاء الاصطناعي MiniMax التي تتخذ من شنغهاي مقرًا لها، ويحقق نتائج من الفئة الرائدة في اختبارات البرمجة والمهام الوكيلية (agentic benchmarks) بينما يكلف تشغيله أقل بكثير من النماذج الرائدة المملوكة لشركات.12 ابتكاره الأساسي هو MSA (MiniMax Sparse Attention)، الذي يختار فقط الكتل ذات الصلة من ذاكرة التخزين المؤقت للقيم والمفاتيح (key-value cache) بدلاً من الانتباه إلى كل توكن، مما يقلل الحوسبة لكل توكن عند سياق مليون توكن إلى 1/20 من الجيل السابق، مع سرعة معالجة أولية (prefill) تزيد عن 9 أضعاف وسرعة فك تشفير (decode) تزيد عن 15 ضعفًا.1 في اختبار SWE-Bench Pro الخاص بشركة MiniMax، سجل M3 نسبة 59.0%، متفوقًا بفارق ضئيل على GPT-5.5 (58.6%)، ومتغلبًا على Gemini 3.1 Pro (54.2%)، بينما جاء خلف Claude Opus 4.7 (64.3%).15 هناك ثلاثة تحفظات مهمة: تم إنتاج كل معيار أداء رئيسي على بنية MiniMax التحتية وأدواتها؛ استخدمت المقارنة Opus 4.7، بينما كان Opus 4.8 (بنسبة 69.2% في SWE-Bench Pro) قد تم إطلاقه بالفعل قبل أيام؛36 وعلى الرغم من وصفه بأنه "مفتوح الأوزان"، إلا أن الأوزان والتقرير الفني كانا لا يزالان بانتظار إصدارهما الموعود حتى 9 يونيو 2026.14 النقطة التي يتفوق فيها M3 بوضوح هي السعر: حوالي 0.60 دولار لكل مليون توكن مدخلات و2.40 دولار لكل مليون توكن مخرجات، وهو ما يقل بنحو عشرة أضعاف عن GPT-5.5 وOpus 4.8.789

ما هو MiniMax M3؟

MiniMax M3 هو نموذج لغوي كبير من شركة MiniMax، وهي شركة صينية للذكاء الاصطناعي تأسست في عام 2022 ومدعومة من Alibaba وTencent، وأُدرجت في بورصة هونغ كونغ في يناير 2026.10 تم إصدار M3 في 1 يونيو 2026، وتم تقديمه كنموذج رائد للبرمجة والعمل الوكيلي، وتسوّقه MiniMax كأول نموذج مفتوح الأوزان يجمع بين ثلاثة أشياء كانت المختبرات المملوكة تحتفظ بها مجتمعة: برمجة من الدرجة الأولى، ونافذة سياق بمليون توكن، ووسائط متعددة أصلية تغطي مدخلات الصور والفيديو بالإضافة إلى استخدام كمبيوتر سطح المكتب.12

من الناحية التقنية، هو نموذج استدلال (reasoning model) مع مفتاح تبديل يقوم بتفعيل "التفكير" الممتد للمهام المعقدة أو إيقافه للمهام الحساسة لزمن الاستجابة (latency)، وبنفس السعر في كلتا الحالتين.1 تم تدريبه بوسائط مختلطة منذ البداية، وتقول MiniMax إنها رفعت حجم بيانات التدريب إلى حدود 100 تريليون توكن.1 يضع المُقيّم المستقل Artificial Analysis نموذج M3 عند الدرجة 55 في مؤشر الذكاء الخاص به — وهو أعلى بكثير من المتوسط للنماذج في فئته السعرية، وإن كان أقل من النماذج الرائدة المملوكة — مما يعد بمثابة فحص واقعي مفيد للادعاءات الذاتية الأكثر حماسًا.4

هناك تفصيل واحد يتجاهله التسويق: لم تكشف MiniMax عن عدد بارامترات M3، وتدرج Artificial Analysis حاليًا النموذج كنموذج مملوك (proprietary) تحديدًا لأن الأوزان ليست عامة بعد.4 لذا، في حين أن "مفتوح الأوزان" هو العرض التسويقي، فإن الحقائق القابلة للتحقق المتاحة اليوم تتعلق بمنتج API، وليس بنموذج قابل للتنزيل.

ما هو MiniMax Sparse Attention (MSA)؟

MiniMax Sparse Attention (MSA) هي بنية الانتباه التي تم تقديمها مع M3، وهي السبب في قدرة النموذج على تقديم سياق بمليون توكن دون خروج تكاليف الحوسبة عن السيطرة.1 آلية الانتباه الكاملة الكلاسيكية تقارن كل توكن بكل توكن آخر، لذا تنمو التكلفة بشكل تربيعي مع طول المدخلات. يتجنب MSA ذلك عن طريق حساب الانتباه فقط عبر أجزاء السياق التي تهم الاستعلام الحالي.3

ميكانيكيًا، يعمل MSA على مرحلتين. يتم تقسيم ذاكرة التخزين المؤقت للقيم والمفاتيح (KV cache) إلى كتل؛ يقوم فرع فهرسة (index branch) خفيف الوزن بتقييم الكتل والاحتفاظ بالأكثر صلة فقط عبر اختيار top-k؛ ثم يقوم فرع متناثر (sparse branch) بتشغيل انتباه كامل على تلك الكتل فقط.3 تشير التحليلات المستقلة لمخطط البنية الذي نشرته MiniMax إلى أن M3 يحتفظ بهيكل أساسي من نوع grouped-query attention (GQA) ويقوم بتشغيل الانتباه على KV حقيقي وغير مضغوط — على عكس نهج latent-attention (MLA) الخاص بـ DeepSeek، الذي يضغط المفاتيح والقيم في مساحة ذات أبعاد أقل — على الرغم من أن MiniMax لم تصدر بعد التقرير الفني الكامل لتأكيد تلك التفاصيل.11 ادعاء MiniMax الخاص والأكثر تحديدًا هو أن MSA يقسم KV إلى كتل بدقة أكبر من تصميمات الانتباه المتناثر المنافسة مثل DSA من DeepSeek وMoBA من Moonshot، مما يحقق تغطية سياق فعالة أعلى.1

قامت MiniMax أيضاً بإعادة صياغة التنفيذ على مستوى GPU باستخدام ما تسميه نهج "KV outer gather Q": فبدلاً من تحميل كتل KV بشكل منفصل لكل استعلام (query)، يتم معالجة الكتل بالتتابع ويتم تجميع كل استعلام يحتاج إلى كتلة معاً، بحيث تُقرأ كل كتلة من الذاكرة مرة واحدة في نمط متصل.13 وتدعي MiniMax أن هذا يعمل بشكل أسرع بأكثر من 4 مرات من نوى (kernels) الانتباه المتناثر (sparse-attention) مفتوحة المصدر، وأنه عبر تجارب الاستئصال (ablations)، طابق MSA الانتباه الكامل في الغالبية العظمى من القدرات.1 والنتيجة التي أبلغت عنها: عند مليون توكن من السياق، تبلغ حوسبة M3 لكل توكن 1/20 من الجيل السابق، مع تسريع عملية الـ prefill بأكثر من 9 مرات وفك التشفير (decoding) بأكثر من 15 مرة.12 إذا كنت قد تابعت سباق كفاءة السياق الطويل — من تصميمات الانتباه دون التربيعية (subquadratic) إلى حيل ضغط الـ KV-cache — فإن MSA هو محاولة قوية أخرى لنفس المشكلة، وهذه المرة يتم شحنها داخل نموذج من فئة النخبة (frontier-class).

اختبارات أداء MiniMax M3: قوية، لكنها مبلّغ عنها ذاتياً

على الورق، أرقام البرمجة لـ M3 ممتازة. عبر نتائج MiniMax المعلنة، حقق M3 نسبة 59.0% في SWE-Bench Pro، و66.0% في Terminal-Bench 2.1، و34.8% في SWE-fficiency، و28.8% في KernelBench Hard، و74.2% في MCP Atlas.1 وفي التصفح الذاتي للويب، سجل 83.5 في BrowseComp، متقدماً على 79.3 التي أدرجها لنموذج Opus 4.7.13 الإطار الرئيسي لـ MiniMax هو أن M3 "يتفوق على GPT-5.5 و Gemini 3.1 Pro ويقترب من Opus 4.7" في البرمجة.1

هذا هو الجزء الذي تتجاهله معظم التغطيات. كل واحد من هذه الأرقام تم إنتاجه على البنية التحتية الخاصة بـ MiniMax، باستخدام أدوات (scaffolding) اختارتها هي (بشكل أساسي Claude Code)، مقابل خطوط أساس (baselines) حددتها هي.1 هذا ليس غير صادق بطبيعته — فالمختبرات تجري اختبارات الأداء بهذه الطريقة بشكل روتيني — لكنه يعني أن النتائج هي ادعاءات تنتظر التحقق المستقل، وليست حقائق محسومة. أشار موقع TechTimes إلى هذا بالضبط في يوم الإطلاق، معنوناً تغطيته "ادعاءات رائدة، واختبارات أداء غير مؤكدة".5 نقطة البيانات المستقلة الوحيدة التي لدينا، وهي درجة مؤشر الذكاء من Artificial Analysis البالغة 55، جيدة حقاً بالنسبة لفئة السعر هذه ولكنها لا تضع M3 في قمة النخبة.4 تعامل مع درجات البرمجة لـ M3 كعرض افتتاحي قوي، وليس حكماً نهائياً.

مشكلة Opus 4.8: تم قياس M3 مقابل السقف الخاطئ

أهم تحفظ يتعلق بالتوقيت. قارنت MiniMax نموذج M3 بـ Claude Opus 4.7 وأبلغت عن "الاقتراب" منه في SWE-Bench Pro (59.0% مقابل 64.3%).16 لكن Anthropic كانت قد شحنت بالفعل Claude Opus 4.8 في 28 مايو 2026 — قبل أربعة أيام من إطلاق M3 في 1 يونيو — ويسجل Opus 4.8 نسبة 69.2% في SWE-Bench Pro، ارتفاعاً من 64.3% في 4.7.6 لاحظ موقع The Decoder، الذي غطى M3 في نفس اليوم، الفجوة مباشرة: "شحنت Anthropic منذ ذلك الحين Opus 4.8، وهو نموذج أقوى إلى حد ما".3

هذا يغير القصة. مقابل نموذج Anthropic الذي كان حالياً بالفعل عند الإطلاق، يتأخر M3 بنسبة 59.0% بحوالي عشر نقاط، وليس التقارب المريح الذي يوحي به الرسم البياني. إنه مثال كلاسيكي على كيف أن خط الأساس المختار ذاتياً يجمل النتيجة.

النموذجSWE-Bench Proمصدر الدرجةسعر الإدخال لكل مليونسعر الإخراج لكل مليون
MiniMax M359.0%MiniMax (أدوات داخلية)~$0.60~$2.40
GPT-5.558.6%مبلّغ عنه من MiniMax$5.00$30.00
Gemini 3.1 Pro54.2%مبلّغ عنه من MiniMax
Claude Opus 4.764.3%مبلّغ عنه من MiniMax$5.00$25.00
Claude Opus 4.869.2%Anthropic (النخبة الحالية)$5.00$25.00

يوضح الجدول أيضاً نقطة البيع الحقيقية — انظر إلى الأعمدة اليمنى، وليس فقط عمود الدرجات.16789 إن M3 ليس أفضل مبرمج هنا؛ بل هو الأرخص جدارةً وبفارق كبير.

تسعير MiniMax M3: أين يفوز النموذج فعلياً

بعيداً عن مسرح اختبارات الأداء، القصة الحقيقية هي التكلفة. يعمل API الخاص بـ M3 بحوالي 0.60 دولار لكل مليون توكن إدخال و2.40 دولار لكل مليون توكن إخراج بالأسعار القياسية، مع خصم 50% في أسبوع الإطلاق خفض تلك الأسعار إلى حوالي 0.30 دولار و1.20 دولار في الأيام الأولى بعد الإصدار.9 التسعير مقسم حسب طول الإدخال: الطلبات التي تصل إلى 512 ألف توكن تُحاسب بالسعر القياسي، بينما تكلف السياقات الأطول أكثر — وهو تقسيم منطقي بالنظر إلى أن معظم جلسات البرمجة والدردشة لا تقترب أبداً من السقف.1

قارن ذلك بالرواد أصحاب الملكية الخاصة وستجد أن الفجوة تصل إلى مرتبة عشرية كاملة. يُدرج GPT-5.5 بسعر 5.00 دولار للمدخلات و30.00 دولار للمخرجات لكل مليون توكن؛ وClaude Opus 4.8 بسعر 5.00 دولار و25.00 دولار.78 وهذا يجعل سعر مدخلات M3 حوالي 12% من سعر GPT-5.5 وسعر مخرجاته حوالي 8% — وهو إطار "5 إلى 10% من التكلفة" الذي صاحب ظهوره الأول.2 بالنسبة للفرق التي تدير أعباء عمل وكلاء (agentic) ذات حجم كبير، فإن النموذج الذي يقترب من GPT-5.5 في البرمجة بينما يكلف عُشر السعر هو عرض جاد، حتى مع وجود تحفظات على معايير القياس. تبيع MiniMax أيضًا خطط اشتراك للتوكنز تتضمن حصصًا كبيرة: 20 دولارًا شهريًا لحوالي 1.7 مليار توكن، وتصل إلى 120 دولارًا شهريًا لحوالي 9.8 مليار توكن.1 إنه نفس أسلوب التسعير الهجومي الذي رأيناه في مختبرات النماذج مفتوحة الأوزان الصينية طوال العام، وإطلاق DeepSeek V4 قبله.

عقبة الأوزان المفتوحة: لا يمكنك تحميله بعد

كلمة "مفتوح الأوزان" (open-weight) تلعب دورًا كبيرًا في تموضع M3، لذا يجدر بنا أن نكون دقيقين. عند الإطلاق، قالت MiniMax إنها ستنشر أوزان النموذج وتقريرًا تقنيًا كاملاً على Hugging Face و GitHub "خلال الأيام العشرة القادمة" — مما يشير إلى تاريخ 11 يونيو تقريبًا.1 وحتى 9 يونيو 2026، لم يحدث ذلك: الأوزان ليست موجودة على منظمة MiniMax في Hugging Face أو مستودع M3 في GitHub، على الرغم من أن أوزان M2.7 الأقدم للشركة متاحة للجمهور هناك بالفعل.4 وتعكس Artificial Analysis هذا الأمر، حيث لا تزال تصنف M3 كنموذج مملوك بعدد بارامترات غير معلن.4

لا يعني أي من هذا أن الأوزان لن تصل — فلدى MiniMax سجل حافل في جعل نماذجها مفتوحة المصدر، ونافذة الإصدار لا تزال مفتوحة. ولكن حتى تهبط الأوزان، فإن M3 هو وظيفيًا منتج متاح عبر API فقط يحمل ملصق "مفتوح الأوزان"، وتظل المزايا المعتادة للأوزان المفتوحة (الاستضافة الذاتية، الضبط الدقيق، تدقيق البنية) مجرد وعود وليست خيارات متاحة. إذا كنت تقيم M3 خصيصًا لأنه مفتوح، فهذا هو الأمر الذي يجب مراقبته هذا الأسبوع.

الخلاصة

يعد MiniMax M3 إنجازًا حقيقيًا مغلفًا بإطلاق مبالغ فيه قليلاً. بنية MSA هي إجابة ذكية حقًا لتكلفة السياق الطويل، ولا يزال الجمع بين الوسائط المتعددة وسياق المليون توكن نادرًا خارج المختبرات المملوكة الكبرى، والتسعير هو النوع الذي يعيد تشكيل ما يمكن للفرق ذات حجم العمل الكبير تحمل تكلفته.12 لكن رواية معايير القياس تعتمد على اختبارات ذاتية مقابل خط أساس (Opus 4.7) كانت Anthropic قد تجاوزته بالفعل بـ Opus 4.8، كما أن ملصق "مفتوح الأوزان" يصف إصدارًا لم يتم شحنه بعد.346 الملخص الصادق: M3 هو على الأرجح أفضل نموذج برمجة مقابل القيمة المالية يمكنك الوصول إليه عبر API اليوم، ومطالب أضعف بالريادة المطلقة مما توحي به مخططاته الخاصة. ستحدد معايير القياس المستقلة والأوزان الفعلية — وكلاهما متوقع في غضون أيام — أي نصف من هذه الجملة يحمل وزنًا أكبر.


قراءات ذات صلة: DeepSeek V4: رائد مفتوح الأوزان بـ 1/7 التكلفة، موجة نماذج البرمجة مفتوحة الأوزان في الصين، و Claude Opus 4.8: معايير القياس والتسعير.

Footnotes

  1. MiniMax، "MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model،" ١ يونيو ٢٠٢٦ (تاريخ الإصدار، بنية MSA، أرقام الكفاءة، المعايير المرجعية المسجلة، فئات التسعير، خطط الرموز (tokens)، الجدول الزمني للأوزان المفتوحة/التقرير التقني). https://www.minimax.io/blog/minimax-m3 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

  2. "MiniMax-M3 debuts, eclipsing GPT-5.5 and Gemini 3.1 Pro on key benchmark performance for just 5–10% of the cost،" VentureBeat، ١ يونيو ٢٠٢٦ (صياغة التكلفة، الكفاءة، التموضع). https://venturebeat.com/technology/minimax-m3-debuts-eclipsing-gpt-5-5-and-gemini-3-1-pro-on-key-benchmark-performance-for-just-5-10-of-the-cost 2 3 4 5 6 7

  3. "MiniMax M3: Open-weight model with a million-token context challenges proprietary leaders،" The Decoder، ١ يونيو ٢٠٢٦ (ميكانيكا MSA، ملاحظة Opus 4.8، سياق المعايير المرجعية). https://the-decoder.com/minimax-m3-open-weight-model-with-a-million-token-context-challenges-proprietary-leaders/ 2 3 4 5 6 7 8 9

  • "MiniMax-M3 — تحليل الذكاء والأداء والسعر،" Artificial Analysis (مؤشر الذكاء 55، تصنيف ملكية خاصة، معايير غير معلنة، الأوزان ليست علنية بعد). https://artificialanalysis.ai/models/minimax-m3 2 3 4 5 6 7 8 9

  • "نموذج البرمجة مفتوح الأوزان MiniMax M3: ادعاءات رائدة، واختبارات أداء غير مؤكدة،" TechTimes، 1 يونيو 2026. https://www.techtimes.com/articles/317532/20260601/minimax-m3-open-weight-coding-model-frontier-claims-unverified-benchmarks.htm 2 3

  • "إطلاق Claude Opus 4.8، واختبارات الأداء والمزيد،" LLM-Stats (SWE-Bench Pro 69.2%، ارتفاعاً من 64.3% في Opus 4.7)؛ تاريخ الإصدار 28 مايو 2026 وفقاً لـ "Anthropic تطلق Opus 4.8 مع أداة 'سير العمل الديناميكي' الجديدة،" TechCrunch، 28 مايو 2026. https://llm-stats.com/blog/research/claude-opus-4-8-launch 2 3 4 5 6

  • "GPT-5.5 — تسعير API،" OpenAI / OpenRouter (تسعير GPT-5.5 القياسي 5.00 دولار للمدخلات / 30.00 دولار للمخرجات لكل مليون توكن). https://openrouter.ai/openai/gpt-5.5 2 3 4

  • "تسعير Claude Opus 4.8 API،" مرجع السعر لكل توكن (تسعير Opus 4.8 القياسي 5.00 دولار للمدخلات / 25.00 دولار للمخرجات لكل مليون توكن). https://pricepertoken.com/pricing-page/model/anthropic-claude-opus-4.8 2 3 4

  • "MiniMax M3 — تسعير API،" OpenRouter (القياسي 0.60 دولار/مليون للمدخلات، 2.40 دولار/مليون للمخرجات؛ عرض أسبوع الإطلاق بخصم 50% 0.30 دولار/1.20 دولار). https://openrouter.ai/minimax/minimax-m3 2 3 4

  • "MiniMax تتضاعف قيمتها في أول ظهور لها في هونج كونج، مما يمثل إدراجاً صينياً آخر للذكاء الاصطناعي،" CNBC، 9 يناير 2026 (تأسست MiniMax عام 2022، بدعم من Alibaba/Tencent، طرح عام أولي في هونج كونج). https://www.cnbc.com/2026/01/09/minimax-hong-kong-ipo-ai-tigers-zhipu.html

  • "MiniMax تصبح Sparse: فك تشفير انتباه M3 من مخطط واحد،" Atlas Cloud (مقالة مجتمع Hugging Face)، 29 مايو 2026 (تحليل مستقل لـ MSA — عمود فقري GQA، KV حقيقي/غير مضغوط، مقارنة مع DeepSeek NSA/DSA/CSA؛ التفاصيل مستنتجة من مخطط MiniMax، في انتظار التقرير الفني الرسمي). https://huggingface.co/blog/AtlasCloud-AI/minimax-goes-sparse

  • الأسئلة الشائعة

    هو نموذج لغوي كبير مفتوح الأوزان أصدرته شركة الذكاء الاصطناعي الصينية MiniMax في 1 يونيو 2026، مصمم لمهام البرمجة والمهام الوكيلية (agentic). يجمع بين أداء برمجة من فئة النماذج الرائدة، ونافذة سياق تصل إلى مليون توكن، ووسائط متعددة أصلية (مدخلات نص وصور وفيديو) في نموذج واحد. 1 2