Gemini 3.5 Flash: اختبارات الأداء، الأسعار، السرعة (2026)

٢٣ مايو ٢٠٢٦

Gemini 3.5 Flash: Benchmarks, Pricing, Speed (2026)

ملخص

Gemini 3.5 Flash هو نموذج البرمجة الوكيل (agentic) الجديد من Google، والذي تم إطلاقه للإتاحة العامة في 19 مايو 2026 خلال مؤتمر Google I/O. إنه نموذج من فئة "Flash" — وهي الفئة السريعة والمتوسطة السعر — لكن Google تقول إنه يتفوق على نموذجها الرائد الأكبر، Gemini 3.1 Pro، في اختبارات البرمجة والمهام الوكيلية بينما يعمل أسرع بنحو 4 مرات.1 النتائج الرئيسية: 76.2% في Terminal-Bench 2.1، و1656 Elo في GDPval-AA، و83.6% في MCP Atlas.1 العائق الوحيد هو السعر. فبتكلفة 1.50 دولار لكل مليون توكن إدخال و9.00 دولار لكل مليون توكن إخراج، يكلف 3.5 Flash حوالي ستة أضعاف تكلفة Gemini 3.1 Flash-Lite الأرخص لكل توكن، ويقل سعره بنسبة 25% فقط عن Gemini 3.1 Pro.23 جعلت Google هذا النموذج هو الافتراضي في تطبيق Gemini وAI Mode في Search عالمياً يوم الإطلاق، ومن المقرر صدور نسخة 3.5 Pro الأكبر "الشهر المقبل".14


ما ستتعلمه

  • ما هو Gemini 3.5 Flash وموقعه في عائلة Gemini 3.5
  • نتائج الاختبارات المرجعية، وكيف يقارن Flash بنموذج Gemini 3.1 Pro
  • مدى سرعة تشغيل Gemini 3.5 Flash فعلياً
  • أسعار API لنموذج Gemini 3.5 Flash عبر جميع الفئات
  • متى تختار Flash بدلاً من 3.1 Pro الأكبر
  • أين يمكنك الوصول إلى Gemini 3.5 Flash اليوم
  • لماذا تراهن Google بفئة Flash الخاصة بها على الوكلاء (agents) وليس روبوتات الدردشة

ما هو Gemini 3.5 Flash؟

Gemini 3.5 Flash هو نموذج لغوي كبير متعدد الوسائط من Google DeepMind، تم إطلاقه في 19 مايو 2026 كأول نموذج في عائلة Gemini 3.5 الجديدة.1 تصف Google هذه العائلة بأنها "ذكاء رائد مع القدرة على التنفيذ" — وهي عبارة تشير إلى التحول الذي بُني النموذج حوله: فبدلاً من مجرد الإجابة على الأسئلة، تم تصميمه للتخطيط والبناء والتكرار في المهام طويلة الأمد بمدخلات بشرية محدودة.1

كلمة "Flash" هي تسمية Google لفئتها السريعة والمتوسطة، والتي تقع تحت نماذج "Pro" الأكبر من حيث التكلفة وزمن الاستجابة. ما يجعل 3.5 Flash غير عادي هو أنه كسر هذا التسلسل الهرمي في القدرات. تقول Google إنه "أقوى نموذج وكيل وبرمجي لدينا حتى الآن"، وصرح Koray Kavukcuoglu، كبير المسؤولين التقنيين في Google DeepMind، للصحفيين بأنه "يتفوق على أحدث نماذجنا الرائدة، 3.1 Pro، في جميع الاختبارات المرجعية تقريباً".14

بعض المواصفات التي تستحق المعرفة مسبقاً: أطلقت Google نموذج 3.5 Flash كنسخة متاحة عامة في يوم الإطلاق؛ معرف نموذج API هو gemini-3.5-flash؛ وهو يدعم نافذة سياق تصل إلى 1,048,576 توكن إدخال وما يصل إلى 65,536 توكن إخراج؛ وتاريخ انقطاع معرفته هو يناير 2025.125 أشار المطور Simon Willison، الذي راجع وثائق الإطلاق، إلى أن 3.5 Flash يحمل نفس ميزات منصة المطورين مثل سلسلة Gemini 3.x السابقة مع استثناء واحد — أداة استخدام الكمبيوتر (computer-use) لم يتم الكشف عنها لـ 3.5 Flash حتى وقت الإطلاق (لا يزال النموذج يحقق نتيجة قوية بنسبة 78.4% في اختبار OSWorld-Verified لاستخدام الكمبيوتر).35

أما الشقيق الأكبر، Gemini 3.5 Pro، فهو قيد الاستخدام الداخلي بالفعل وتقول Google إنه سيتم طرحه "الشهر المقبل".1

اختبارات Gemini 3.5 Flash المرجعية: التفوق على Gemini 3.1 Pro

القصة التي تريد Google أن تصل إليك هي أن نموذج Flash تفوق على نموذج Pro الأكبر. في الاختبارات المرجعية التي نشرتها Google، يقوم 3.5 Flash بذلك بالضبط عبر البرمجة، واستخدام الأدوات، والمهام المتخصصة.

إليك كيف يقارن 3.5 Flash مع Gemini 3 Flash السابق ومع Gemini 3.1 Pro الأكبر من Google، باستخدام أرقام Google المنشورة:15

الاختبار المرجعيGemini 3.5 FlashGemini 3 FlashGemini 3.1 Pro
Terminal-Bench 2.1 — البرمجة الوكيلية76.2%58.0%70.3%
MCP Atlas — استخدام الأدوات83.6%62.0%78.2%
Finance Agent v2 — المهام المتخصصة57.9%42.6%43.0%
GDPval-AA — العمل المعرفي (Elo)165612041314
CharXiv Reasoning — متعدد الوسائط84.2%80.3%83.3%
MRCR v2 128k — السياق الطويل77.3%67.2%84.9%
Humanity's Last Exam — الاستنتاج40.2%33.7%44.4%

يبرز نمطان هنا. أولاً، القفزة فوق Gemini 3 Flash السابق كبيرة: في MCP Atlas، يرتفع Flash من 62.0% إلى 83.6%؛ وفي GDPval-AA يرتفع من 1204 إلى 1656 Elo. ثانياً، يتفوق 3.5 Flash فعلياً على 3.1 Pro في البرمجة، واستخدام الأدوات، والمهام المالية المتخصصة، والاستنتاج متعدد الوسائط — وهي بالضبط أعباء العمل الوكيلية التي بنته Google من أجلها.

لكن الجدول نفسه يظهر الحدود. في اختبار Humanity's Last Exam، وهو اختبار استنتاج أكاديمي، لا يزال 3.1 Pro يتصدر بنسبة 44.4% مقابل 40.2%. وفي MRCR v2 — استرجاع السياق الطويل عبر نافذة 128 ألف توكن — يتصدر Pro بنسبة 84.9% مقابل 77.3%. لهذا السبب تمت صياغة ادعاء Kavukcuoglu بعناية كـ "جميع الاختبارات المرجعية تقريباً"، ولهذا السبب تبقي Google على 3.1 Pro في التشكيلة بدلاً من سحبه.4 عندما يكون المعرفة المخزنة الخام أو استرجاع "إبرة في كومة قش" أهم من التنفيذ الوكيلي، فإن النموذج الأكبر لا يزال هو الفائز.

هناك تنبيه صادق آخر: مجال "النماذج الرائدة" مزدحم. في جدول مقارنة Google الخاص، لا تزال نماذج GPT-5.5 من OpenAI وClaude Opus 4.7 من Anthropic تتفوق على 3.5 Flash في عدة اختبارات مرجعية، بما في ذلك GDPval-AA وHumanity's Last Exam.5 الحجة لصالح 3.5 Flash ليست أنه أذكى نموذج متاح على الإطلاق — بل أنه يقدم نتائج قريبة من النماذج الرائدة بسرعة Flash وبسعر أقل من Pro. تقول Google إنه يقع في "الربع العلوي الأيمن" من مؤشر ذكاء التحليل الاصطناعي (Artificial Analysis Intelligence Index)، وهو الركن الذي يجمع بين الذكاء العالي والسرعة العالية.1

ما مدى سرعة Gemini 3.5 Flash؟

السرعة هي المنتج الحقيقي هنا. ادعاء Google الأساسي هو أنه، عند قياسه برموز المخرجات (output tokens) في الثانية، فإن 3.5 Flash أسرع بـ 4 مرات من النماذج الرائدة الأخرى.1 وذهب Kavukcuoglu إلى أبعد من ذلك في مكالمة مع الصحفيين، قائلاً إن Google قامت ببناء نسخة محسنة من Flash تعمل بـ 12 مرة أسرع مع نفس الجودة.4

لماذا يهوّس فريق النماذج بالرموز في الثانية؟ لأن العمل القائم على الوكلاء (agentic work) يغير الحسابات. روبوت الدردشة يجيب على مطالبة واحدة ويتوقف. أما الوكيل فيخطط لمهمة، ويستدعي الأدوات، ويقرأ النتائج، ويراجع، ويكرر — أحياناً لساعات. وقالت Tulsee Doshi، مديرة أولى ورئيسة المنتجات في Google، إن 3.5 Flash يمكنه العمل بشكل مستقل لعدة ساعات، مع التوقف لطلب مدخلات بشرية عندما يصل إلى نقطة قرار أو حدود أذونات.4 عندما يعمل نموذج لهذه الفترة الطويلة ويولد وكلاء فرعيين متوازيين، فإن زمن الانتقال (latency) لكل خطوة يتراكم — لذا فإن تسريع العمل بمقدار 4 أضعاف هو الفرق بين وكيل ينهي عملاً خلال استراحة الغداء وآخر يستغرق طوال فترة بعد الظهر.

هذا الهدف التصميمي هو أيضاً السبب في أن Google تقول إن 3.5 Flash يمكنه القيام بعمل "كان يستغرق من المطور أياماً أو من المدقق أسابيع" في جزء بسيط من الوقت — وتدعي أنه "غالباً بأقل من نصف تكلفة النماذج الرائدة الأخرى".1

تسعير Gemini 3.5 Flash: فئة Flash أصبحت باهظة الثمن

هنا يصبح الإطلاق أكثر تعقيداً من التسويق. التسعير القياسي لـ Gemini 3.5 Flash، من صفحة تسعير API الرسمية لـ Google، هو:2

الفئةالمدخلات (لكل مليون رمز)المخرجات (لكل مليون رمز)
Standard$1.50$9.00
Batch$0.75$4.50
Priority$2.70$16.20

⚠ الأسعار تتغير بشكل متكرر. القيم أعلاه للتوضيح فقط وقد تكون قديمة. تحقق دائماً من التسعير الحالي مباشرة من المزود قبل اتخاذ قرارات التكلفة: Anthropic · OpenAI · Google Gemini · Google Vertex AI · AWS Bedrock · Azure OpenAI · Mistral · Cohere · Together AI · DeepSeek · Groq · Fireworks AI · Perplexity · xAI · Cursor · GitHub Copilot · Windsurf.

تبلغ تكلفة التخزين المؤقت للسياق (Context caching) في الفئة القياسية 0.15 دولار لكل مليون رمز، بالإضافة إلى رسوم تخزين قدرها 1.00 دولار لكل مليون رمز في الساعة.2 يتضمن الربط بالبحث (Search grounding) 5,000 مطالبة شهرياً مجاناً (مشتركة عبر عائلة Gemini 3)، ثم 14 دولاراً لكل 1,000 استعلام بحث.2

الرقم الذي فاجأ المطورين ليس كيفية مقارنة ذلك بـ Pro — بل كيفية مقارنته بـ فئة Flash القديمة. Gemini 3.1 Flash-Lite، نموذج Google الموفر للتكلفة، يكلف 0.25 دولار للمدخلات و1.50 دولار للمخرجات.2 عند 1.50 دولار و9.00 دولار، يكلف 3.5 Flash ستة أضعاف لكل رمز مقارنة بـ Flash-Lite. وحسب Simon Willison أن السعر يبلغ أيضاً حوالي ثلاثة أضعاف سعر Gemini 3 Flash Preview السابق.3

أمام Pro، تنعكس الصورة: يكلف Gemini 3.1 Pro مبلغ 2.00 دولار للمدخلات و12.00 دولار للمخرجات للمطالبات التي تصل إلى 200 ألف رمز، لذا فإن 3.5 Flash أرخص بنحو 25% لكل رمز.2 هذه هي المقارنة التي تتصدر بها Google — نتائج من الفئة الرائدة، بخصم 25% عن تسعير Pro.

لكن سعر الرمز الواحد ليس هو نفسه تكلفة المهمة الواحدة. Gemini 3.5 Flash هو نموذج تفكير (reasoning model)، وتسعير Google يحاسب على رموز "التفكير" الداخلية بمعدل المخرجات — لذا فإن المهمة التي تتطلب تفكيراً مكثفاً يمكن أن ترفع الفاتورة أكثر مما يوحي به السعر المعلن.2 أشار Willison إلى هذا مباشرة: عند تشغيله بجهد تفكير عالٍ، كلف Gemini 3.5 Flash أكثر عند تمريره عبر مجموعة اختبارات Artificial Analysis القياسية مما كلفه Gemini 3.1 Pro Preview، رغم انخفاض سعر الرمز في Flash.3 الدرس لأي شخص يضع ميزانية: اختبر عبء العمل الخاص بك قبل افتراض أن Flash هو الخيار الرخيص.

هذا الارتفاع في الأسعار هو نمط صناعي، وليس غريباً على Google. يلاحظ Willison أن GPT-5.5 من OpenAI أُطلق بضعف سعر GPT-5.4، وأن Claude Opus 4.7 أغلى بكثير من سلفه.3 يبدو أن المختبرات الثلاثة تختبر مدى استعداد عملاء API للدفع.

Gemini 3.5 Flash مقابل Gemini 3.1 Pro: أيهما تستخدم

مع تفوق Flash الآن على Pro في عدة اختبارات مع كونه أقل تكلفة لكل رمز، فإن السؤال البديهي هو ما إذا كان 3.1 Pro لا يزال يستحق الاستخدام. الإجابة الصادقة هي أن Google صممتهما ليلعبا أدواراً مختلفة.

استخدم Gemini 3.5 Flash عندما تكون المهمة قائمة على الوكلاء وكثيفة التنفيذ: خطوط أنابيب البرمجة، استخدام الأدوات متعدد الخطوات، الوكلاء الفرعيون المتوازيون، سير عمل معالجة المستندات، أو أي شيء تهم فيه السرعة والإنتاجية ويمكن التحقق من المهمة أثناء التنفيذ.

استخدم Gemini 3.1 Pro عندما تعتمد المهمة على التفكير العميق أو الاسترجاع الدقيق عبر سياقات طويلة جداً — مثل البحث عن "إبرة في كومة قش" في مستندات تزيد عن 100 ألف رمز، أو التحليل القانوني أو المالي المكثف، أو المشكلات التي تريد فيها المعرفة المخزنة في أكبر نموذج.

تأطير Google الخاص يشير إلى نفس الاتجاه. وصفت Doshi كيف أن 3.5 Pro و3.5 Flash القادمين مصممان للعمل كزوج: "يصبح 3.5 Pro هو المنسق والمخطط الخاص بك، ثم يمكنه في الواقع الاستفادة من Flash ليكون الوكلاء الفرعيين المختلفين".4 بعبارة أخرى، المستقبل الذي تبنيه Google ليس Flash أو Pro — بل هو نموذج مخطط يوجه سرباً من عمال Flash السريعين.

كيفية الوصول إلى Gemini 3.5 Flash

جعلت Google نموذج 3.5 Flash متاحاً على نطاق واسع في يوم الإطلاق.1 يمكنك الوصول إليه من خلال:

  • واجهة برمجة تطبيقات Gemini، عبر Google AI Studio وAndroid Studio — المسار للمطورين الذين يبنون تطبيقاتهم الخاصة.
  • Google Antigravity، وهي منصة تطوير وبيئة تطوير متكاملة (IDE) من Google تركز على الوكلاء (agent-first). أطلقت Google أيضاً Antigravity 2.0 في مؤتمر I/O كتطبيق سطح مكتب مستقل مبني حول تطوير الوكلاء الذكية.4
  • Gemini Enterprise ومنصة Gemini Enterprise Agent Platform المخصصة للمؤسسات.
  • تطبيق Gemini ووضع الذكاء الاصطناعي في Google Search، حيث أصبح 3.5 Flash الآن هو النموذج الافتراضي عالمياً للجميع.1

كما أنه يدعم المساعد الشخصي الجديد Gemini Spark من Google، وهو وكيل يعمل على مدار الساعة طوال أيام الأسبوع بدأت Google في طرحه للمختبرين الموثوق بهم، مع خطة لإطلاق نسخة تجريبية لمشتركي Google AI Ultra في الولايات المتحدة.1 ومن جانب الـ API، قرنت Google الإطلاق بـ Interactions API جديد، وهو حالياً في المرحلة التجريبية، ويضيف ميزة إدارة سجل المحادثات من جهة الخادم.3

لماذا راهنت Google بـ Flash على الوكلاء

أكثر جملة معبرة في الإطلاق هي الصياغة التي وضعتها TechCrunch: مع Gemini 3.5 Flash، تراهن Google بموجتها القادمة من الذكاء الاصطناعي على الوكلاء، وليس روبوتات الدردشة.4 إن وضع نتائج من الفئة الرائدة في نموذج سريع ومتوسط الفئة — وجعل هذا النموذج هو الافتراضي عبر Search وتطبيق Gemini — هو تصريح بأن Google تتوقع تحول النمط السائد لاستخدام الذكاء الاصطناعي من "اسأل سؤالاً، واقرأ إجابة" إلى "سلم مهمة، واحصل على نتيجة".

هذا الرهان يحمل مخاطرة حقيقية. أقرت Google بأنها عززت ضمانات النموذج السيبرانية والـ CBRN (الكيميائية والبيولوجية والإشعاعية والنووية) بموجب إطار عمل سلامة النماذج الرائدة (Frontier Safety Framework)، وأشارت TechCrunch إلى أن Google تواجه بالفعل دعوى قضائية مرتبطة بتفاعلات ضارة من Gemini.14 إن تسليم وكلاء مستقلين يعملون لساعات لمليارات المستهلكين يرفع المخاطر في كل قرار يتعلق بالسلامة.

ولا تزال العروض التوضيحية مجرد عروض. أظهرت Google وكلاء يبنون لعبة قابلة للعب وحتى نظام تشغيل من الصفر داخل Antigravity.14 هذا مثير للإعجاب — لكن العرض التوضيحي المجهز ليس سجلاً حافلاً من الإنجازات. الحكم الحقيقي على Gemini 3.5 Flash سيأتي من أعباء العمل التي ينفذها المطورون عليه خلال الأشهر القليلة القادمة، وليس من منصة الكلمة الرئيسية.

الخلاصة

يعد Gemini 3.5 Flash إصداراً بارزاً: نموذج من الفئة المتوسطة يتفوق في الاختبارات على نموذج Gemini 3.1 Pro الأكبر من Google في المهام الأكثر أهمية للوكلاء، وبأربعة أضعاف السرعة. بالنسبة للمطورين الذين يبنون أدوات برمجة، أو خطوط أتمتة، أو أنظمة متعددة الوكلاء، فهو نموذج سهل الاختبار ومن المرجح أن يكون خياراً افتراضياً قوياً.

لكن اقرأ السعر بعناية. كانت كلمة "Flash" تعني سابقاً الرخص. Gemini 3.5 Flash سريع وقادر، لكنه ليس رخيصاً — فهو يكلف ستة أضعاف لكل توكن مقارنة بنموذج Flash-Lite الذي يقع تحته، ويمكن أن تكلف أعباء العمل التي تتطلب تفكيراً مكثفاً أكثر من Gemini 3.1 Pro من البداية للنهاية. الخطوة الذكية هي الخطوة المتأنية: قم بتشغيل عبء عملك الحقيقي عليه، وقس التكلفة الكاملة لكل مهمة، وقرر بناءً على أرقامك الخاصة بدلاً من أرقام العرض التقديمي.

Footnotes

  1. Google — Gemini 3.5: frontier intelligence with action، مدونة The Keyword، ١٩ مايو ٢٠٢٦. https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/ 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

  2. Google — Gemini Developer API pricing، Google AI for Developers. https://ai.google.dev/gemini-API/docs/pricing 2 3 4 5 6 7 8 9 10 11

  3. Simon Willison — Gemini 3.5 Flash: more expensive, but Google plan to use it for everything، ١٩ مايو ٢٠٢٦. https://simonwillison.net/2026/May/19/gemini-35-flash/ 2 3 4 5 6 7

  4. TechCrunch — With Gemini 3.5 Flash, Google bets its next AI wave on agents, not chatbots، Rebecca Bellan، ١٩ مايو ٢٠٢٦. https://techcrunch.com/2026/05/19/with-gemini-3-5-flash-google-bets-its-next-ai-wave-on-agents-not-chatbots/ 2 3 4 5 6 7 8 9 10 11 12

  • Google DeepMind — صفحة نموذج Gemini 3.5 Flash (جدول مقارنة المعايير ومواصفات النموذج). https://deepmind.google/models/gemini/flash/ 2 3 4

  • الأسئلة الشائعة

    Gemini 3.5 Flash هو نموذج ذكاء اصطناعي سريع ومتعدد الوسائط من Google DeepMind، تم إصداره في 19 مايو 2026. وهو أول نموذج في عائلة Gemini 3.5 ومصمم للمهام الوكيلية (agentic) ومهام البرمجة — التخطيط، استخدام الأدوات، وسير العمل طويل الأمد بدلاً من الدردشة البسيطة. 1

    نشرة أسبوعية مجانية

    ابقَ على مسار النيرد

    بريد واحد أسبوعياً — دورات، مقالات معمّقة، أدوات، وتجارب ذكاء اصطناعي.

    بدون إزعاج. إلغاء الاشتراك في أي وقت.