ما هي نافذة السياق (context window) لـ Gemini 3.5 Flash؟

يدعم نافذة إدخال تصل إلى 1,048,576 توكن (~1 مليون) وما يصل إلى 65,536 توكن للمخرجات. 3

كم تبلغ تكلفة Gemini 3.5 Flash؟

في الفئة المدفوعة، تبلغ التكلفة 1.50 دولار لكل مليون توكن إدخال و9.00 دولار لكل مليون توكن مخرجات (تشمل المخرجات توكنز التفكير). ويخفض نظام Batch API هذه التكلفة بنسبة 50%. 4

هل Gemini 3.5 Flash أرخص من Gemini 3.1 Pro؟

نعم — فهو أرخص بنسبة 25% في كل من الإدخال والمخرجات (1.50 دولار/9.00 دولار مقابل 2.00 دولار/12.00 دولار)، على الرغم من أنه يبلغ 3 أضعاف سعر Gemini 3 Flash Preview الذي يحل محله. 4

هل يدعم Gemini 3.5 Flash ميزة Computer Use؟

لا. ميزة Computer Use غير مدعومة؛ وتوصي Google باستخدام Gemini 3 Flash Preview لهذه المهام. 2 3

متى سيصدر Gemini 3.5 Pro؟

قالت Google "الشهر القادم" في إعلانها الصادر في 19 مايو، مشيرة إلى يونيو 2026. وحتى منتصف يونيو 2026، لم يكن قد وصل بعد إلى مرحلة الإتاحة العامة. 1

ai-ml

Gemini 3.5 Flash: اختبارات الأداء، الأسعار و API (2026)

١٥ يونيو ٢٠٢٦

#Gemini 3.5 Flash #Google Gemini #Gemini API #AI benchmarks #LLM pricing #agentic AI #Gemini 3.5 Pro

Gemini 3.5 Flash: Benchmarks, Pricing & API (2026)

أطلقت Google نموذج Gemini 3.5 Flash في مؤتمر I/O 2026 وأتاحته بشكل عام في نفس اليوم. إنه نموذج برمجة وكيل (agentic) بسعة مليون توكن، وتقول Google إنه يتفوق على الجيل السابق Gemini 3.1 Pro في اختبارات البرمجة والوكلاء الرئيسية — لكنه يكلف أيضًا ثلاثة أضعاف نموذج Flash الذي يحل محله. إليك ما تم التحقق منه فعليًا، مباشرة من وثائق Google الرسمية.

ملخص

Gemini 3.5 Flash متاح بشكل عام (GA) تحت معرف النموذج gemini-3.5-flash، وتم الإعلان عنه في Google I/O 2026 في 19 مايو 2026.¹²
يحتوي على نافذة إدخال تبلغ 1,048,576 توكن (~1 مليون) وما يصل إلى 65,536 توكن للمخرجات، مع تاريخ انقطاع معرفي في يناير 2025.³
بناءً على أرقام Google المنشورة، سجل النموذج 76.2% في Terminal-Bench 2.1، و 83.6% في MCP Atlas، و 84.2% في CharXiv Reasoning، و 1656 Elo في GDPval-AA، بينما يعمل أسرع بنحو 4 مرات من النماذج الرائدة الأخرى.¹
تسعير API هو 1.50 دولار لكل مليون توكن إدخال و 9.00 دولار لكل مليون توكن إخراج — وهو 3 أضعاف سعر Gemini 3 Flash Preview الذي يحل محله، ولكنه أرخص بنسبة 25% من Gemini 3.1 Pro.⁴
التغيير الكبير في API: القيمة الافتراضية لـ thinking_level أصبحت الآن medium (انخفاضًا من high)، ولم يعد يُوصى باستخدام temperature/top_p/top_k لأي نموذج من عائلة Gemini 3.x.²
استخدام الكمبيوتر (Computer Use) غير مدعوم في 3.5 Flash. تم الإعلان عن Gemini 3.5 Pro إلى جانب Flash ولكن، اعتبارًا من منتصف يونيو 2026، لم يصل بعد إلى مرحلة الإتاحة العامة.¹²

ما ستتعلمه

ما هو Gemini 3.5 Flash وكيف يتناسب مع تشكيلة Gemini 3.x
أرقام الاختبارات التي نشرتها Google — وأي أرقام مقارنة يجب عدم الوثوق بها
تكلفة النموذج بالضبط، وكيف تقارن بسلفه وبنسخة Pro
ورقة المواصفات الكاملة: نافذة السياق، الوسائط، والقدرات المدعومة
تغييرات API التي ستؤدي إلى تعطل أو تغيير كود Gemini الحالي الخاص بك
كيفية استدعائه باستخدام Python، و Node.js، و REST
وضع Gemini 3.5 Pro الحالي وهل يجب انتظاره

ما هو Gemini 3.5 Flash

يعد Gemini 3.5 Flash أول نموذج في عائلة Gemini 3.5 من Google، والذي تم الإعلان عنه في مؤتمر Google I/O 2026 ووصفته Google بأنه يجمع بين "الذكاء الرائد والعمل".¹ تضعه Google كـ "أقوى نموذج برمجة ووكيل لها حتى الآن" — مصمم لنشر الوكلاء الفرعيين، وسير العمل متعدد الخطوات، والمهام طويلة المدى بدلاً من الدردشة البسيطة.¹³

الفكرة هي أنك لم تعد مضطرًا للمقايضة بين الجودة وسرعة الاستجابة: تقول Google إن 3.5 Flash يقدم ذكاءً يضاهي النماذج الرائدة الكبيرة مع الحفاظ على السرعة التي تشتهر بها سلسلة Flash، مما يضعه في الربع العلوي الأيمن (ذكاء عالٍ، سرعة عالية) في مؤشر تحليل الذكاء الاصطناعي (Artificial Analysis Intelligence Index).¹ وهو بالفعل النموذج الافتراضي لتطبيق Gemini و "الوضع الذكي" (AI Mode) في بحث Google عالميًا.¹

على عكس النماذج التجريبية التي سبقتها، فإن gemini-3.5-flash هو نموذج مستقر ومتاح بشكل عام (GA)، مما يعني أن Google تعتبره جاهزًا للاستخدام في الإنتاج على نطاق واسع.²

اختبارات أداء Gemini 3.5 Flash

نشرت Google النتائج التالية لنموذج Gemini 3.5 Flash، موضحة أن النموذج يتفوق على الجيل السابق Gemini 3.1 Pro في اختبارات البرمجة والوكلاء هذه:¹

الاختبار	Gemini 3.5 Flash	ماذا يقيس
Terminal-Bench 2.1	76.2%	مهام البرمجة/الطرفية الوكيلية
MCP Atlas	83.6%	استخدام الأدوات عبر بروتوكول سياق النموذج (Model Context Protocol)
CharXiv Reasoning	84.2%	فهم الرسوم البيانية/المستندات متعددة الوسائط
GDPval-AA	1656 Elo	العمل ذو القيمة الاقتصادية في العالم الحقيقي

فيما يتعلق بمعدل النقل، تشير تقارير Google إلى أن 3.5 Flash يولد المخرجات أسرع بنحو 4 مرات من النماذج الرائدة الأخرى.¹

تنبيه هام لمدققي الحقائق: هذه هي نتائج Gemini 3.5 Flash الخاصة. يقول إعلان Google إن النموذج يتفوق على Gemini 3.1 Pro في هذه الاختبارات، لكن Google لم تنشر جدول مقارنة مباشر لأرقام Pro الدقيقة في ذلك المنشور. العديد من جداول المقارنة بأسلوب "76.2% مقابل 70.3%" المتداولة في مدونات الطرف الثالث ليست من مصدر Google ويجب التعامل معها على أنها غير مؤكدة. عندما يذكر هذا المنشور رقمًا، فإنه يأتي من مواد Google الخاصة.

تسعير Gemini 3.5 Flash

هنا تصبح القصة أكثر تعقيدًا للفرق المهتمة بالتكلفة. في الفئة المدفوعة، يتم تسعير Gemini 3.5 Flash لكل مليون توكن كما يلي، مقارنة بنظرائه:⁴

النموذج	الإدخال / 1 مليون	الإخراج / 1 مليون	الحالة
Gemini 3.5 Flash	$1.50	$9.00	GA، مستقر
Gemini 3 Flash Preview	$0.50	$3.00	تجريبي (السلف)
Gemini 3.1 Pro Preview	$2.00	$12.00	تجريبي (مطالبات ≤200 ألف توكن)

هناك أمران بارزان. أولاً، يكلف Gemini 3.5 Flash ثلاثة أضعاف ما كان يكلفه Gemini 3 Flash Preview في كل من الإدخال والإخراج — وهي قفزة كبيرة لأي شخص يشغل أعباء عمل Flash كبيرة الحجم. تشير Google نفسها إلى ذلك في دليل الهجرة الخاص بها، وتقترح على المستخدمين المهتمين جدًا بالتكلفة التفكير في Gemini 3.1 Flash-Lite بدلاً من ذلك.²

ثانيًا، على الرغم من الزيادة، فإن 3.5 Flash أرخص بنسبة 25% من Gemini 3.1 Pro في كل من الإدخال (1.50 دولار مقابل 2.00 دولار) والإخراج (9.00 دولار مقابل 12.00 دولار).⁴ لذا فإن سؤال القيمة ليس "Flash مقابل سعره القديم" ولكن "نموذج أرخص وأسرع تقول Google إنه يتفوق في اختبارات البرمجة والوكلاء مقابل نسخة Pro الأغلى التي لا تزال تتصدر في التفكير طويل السياق".

تتضمن توكنات المخرجات توكنات التفكير، لذا فإن المطالبات التي تعتمد بكثافة على التفكير تُحاسب بسعر 9.00 دولار. يوفر Batch API تخفيضًا في التكلفة بنسبة 50% وهو مدعوم، تمامًا مثل التخزين المؤقت للسياق (context caching).²⁴

مواصفات Gemini 3.5 Flash

ورقة المواصفات الكاملة، من وثائق نماذج Google:³

الخاصية	القيمة
معرف النموذج (Model ID)	`gemini-3.5-flash`
حد توكنات المدخلات	1,048,576 (~1 مليون)
حد توكنات المخرجات	65,536 (~65 ألف)
المدخلات	نص، صورة، فيديو، صوت، PDF
المخرجات	نص
تاريخ انقطاع المعرفة	يناير 2025
آخر تحديث	مايو 2026

من حيث القدرات، يدعم 3.5 Flash كلًا من Batch API، والتخزين المؤقت للسياق، وتنفيذ الكود، والبحث في الملفات، واستدعاء الدوال (function calling)، والربط بخرائط Google (Google Maps grounding)، والربط ببحث Google (Google Search grounding)، والاستدلال ذو الأولوية (priority inference)، والمخرجات المهيكلة (structured outputs)، والتفكير، وسياق الروابط (URL context).³ ولكنه لا يدعم استخدام الكمبيوتر (Computer Use)، أو توليد الصور، أو Live API، أو توليد الصوت.³ إذا كنت بحاجة إلى مهام عمل تتطلب التحكم في المتصفح أو استخدام الكمبيوتر، تنصح Google بالبقاء على Gemini 3 Flash Preview في الوقت الحالي.²

يستحق انقطاع المعرفة في يناير 2025 الانتباه: لأي شيء حساس للوقت، يجب عليك ربط النموذج بأدوات البحث (Search grounding) أو سياق الروابط بدلاً من الاعتماد على معرفته البارامترية.²

تغييرات API التي ستؤثر على الكود الخاص بك

إذا كنت تنتقل من Gemini 3 Flash Preview أو من Gemini 2.5، فهناك عدة تغييرات سلوكية مهمة.²

تغير مستوى التفكير الافتراضي. يستخدم Gemini 3.5 Flash تعدادًا نصيًا (enum) لـ thinking_level بأربع قيم، والمستوى الافتراضي الآن هو medium (كان high في Gemini 3 Flash Preview):

المستوى	استخدمه لـ
`minimal`	السرعة؛ الدردشة، الإجابات الواقعية السريعة، استدعاءات الأدوات البسيطة
`low`	كود أقل زمن انتقال والمهام الوكيلية (agentic) ذات الخطوات القليلة
`medium` (افتراضي)	أفضل جودة لمعظم المهام
`high`	أصعب مشاكل الاستدلال والرياضيات والوكلاء (agents)

البارامتر الرقمي الخام thinking_budget لم يعد موصى به (على الرغم من أنه لا يزال مدعومًا للتوافق مع الإصدارات السابقة) — انتقل إلى thinking_level.²

توقف عن إرسال بارامترات أخذ العينات (sampling parameters). توصي Google الآن بإزالة temperature و top_p و top_k من جميع طلبات Gemini 3.x؛ حيث تم ضبط النماذج وفقًا لقيمها الافتراضية.²

الحفاظ على الأفكار تلقائي. يحمل النموذج الاستدلال الوسيط عبر المحادثات متعددة الأدوار من تلقاء نفسه، مما يحسن تصحيح الأخطاء وإعادة صياغة الكود (refactoring) بشكل متكرر — ولكن يمكن أن يزيد من عدد توكنات المدخلات عبر محادثة طويلة.²

استجابات استدعاء الدوال أكثر صرامة. يجب أن يتضمن كل FunctionResponse المعرف id من الاستدعاء الأصلي، ويطابق الاسم name، ويعيد استجابة واحدة بالضبط لكل استدعاء.²

بالنسبة للمشاريع الوكيلية (agentic) الجديدة، توصي Google الآن بـ Interactions API (في المرحلة التجريبية Beta) بدلاً من generateContent API الكلاسيكي، على الرغم من أن كليهما مدعوم.²

كيفية استدعاء Gemini 3.5 Flash

يبدو الاستدعاء البسيط هكذا. في Python باستخدام Gen AI SDK:²

from google import genai

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
)
print(response.text)

في JavaScript/TypeScript:²

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

const response = await ai.models.generateContent({
  model: "gemini-3.5-flash",
  contents: "Explain how parallel agentic execution works in three sentences.",
});
console.log(response.text);

لتجاوز مستوى التفكير الافتراضي لمشكلة صعبة، قم بتمرير إعدادات التفكير (thinking config):²

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Prove that the square root of 2 is irrational.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="high")
    ),
)
print(response.text)

واستدعاء REST المقابل:²

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-API-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
    "contents": [{
      "parts": [{"text": "Explain how parallel agentic execution works in three sentences."}]
    }]
  }'

أين تستخدمه — ومن يستخدمه بالفعل

يتوفر Gemini 3.5 Flash من خلال تطبيق Gemini، ووضع الذكاء الاصطناعي في البحث (AI Mode in Search)، و API الخاص بـ Gemini في Google AI Studio و Android Studio، ومنصة تطوير الوكلاء الأولى من Google Antigravity، ومنصة Gemini Enterprise Agent Platform.¹ كما أطلقت Google أيضًا Gemini Spark، وهو وكيل ذكاء اصطناعي شخصي مبني على 3.5 Flash، ويتم طرحه أولاً للمختبرين الموثوق بهم ثم في المرحلة التجريبية لمشتركي Google AI Ultra في الولايات المتحدة.¹

سمت Google العديد من شركاء الإطلاق الذين يستخدمون النموذج في سير عمل حقيقي، بما في ذلك Shopify (وكلاء فرعيون متوازيون لتوقعات نمو التجار)، و Macquarie Bank (الاستدلال على وثائق الإعداد التي تزيد عن 100 صفحة)، و Salesforce (التكامل في Agentforce)، و Ramp (التعرف الضوئي على الحروف للفواتير متعددة الوسائط)، و Xero (سير عمل النماذج الضريبية المستقلة)، و Databricks (تشخيص البيانات الوكيلية).¹

ماذا عن Gemini 3.5 Pro؟

أعلنت Google عن Gemini 3.5 Pro في نفس حدث I/O، قائلة إنه "يُستخدم بالفعل داخليًا" وسيتم طرحه "الشهر المقبل" — أي في يونيو 2026.¹ اعتبارًا من منتصف يونيو 2026، لم يصل Pro إلى التوفر العام؛ حيث يظل الخيار الأعلى مستوى الذي يستهدف الاستدلال المتقدم ومهام العمل ذات السياق الأطول.¹ إذا كان تطبيقك يعتمد على استرجاع حقائق محددة من مستندات طويلة جدًا، فقد يكون من المفيد انتظار التوفر العام لـ Pro بدلاً من الالتزام بـ Flash اليوم. بالنسبة للبرمجة الوكيلية ومعظم مهام عمل الإنتاج، فإن Flash جاهز للشحن الآن.

إذا كانت تكاليف التخزين المؤقت (caching) جزءاً من حساباتك، فإن دليلنا حول تخزين المطالبات مؤقتاً مع Claude API يغطي نفس المقايضات عبر الموردين، كما أن تحليلنا لـ اختبارات أداء Kimi K2.7-Code المملوكة للشركة يعد تذكيراً مفيداً لقراءة أرقام الإطلاق بعين ناقدة. بالنسبة للوظائف ذات الحجم الكبير، فإن نمط Batch API ينطبق هنا أيضاً.

الخلاصة

يعد Gemini 3.5 Flash خطوة حقيقية للأمام في أعمال الوكلاء (agentic) والبرمجة — فهو متاح بشكل عام، وسريع، مع نافذة سياق تبلغ مليون توكن، وتفوق في اختبارات الأداء التي أبلغت عنها Google على إصدار Pro من الجيل السابق في المقاييس التي تهم المطورين. النقطة الجديرة بالملاحظة هي التكلفة: بسعر 1.50 دولار/9.00 دولار، فإنه يمثل ثلاثة أضعاف سعر Flash القديم، لذا أعد مراجعة اقتصاديات الوحدة الخاصة بك قبل نقل أعباء العمل الكبيرة، وفكر في استخدام Flash-Lite إذا كانت ميزانيتك محدودة. تحقق من أي جدول مقارنة لاختبارات الأداء مقابل منشور Google الرسمي قبل الوثوق به، واعتمد على الربط بـ Search نظراً لأن تاريخ انقطاع المعرفة هو يناير 2025، وإذا كان عملك يتركز على استرجاع المعلومات في السياقات الطويلة، فقد يكون من المفيد انتظار الإتاحة العامة لـ Gemini 3.5 Pro.

هذا الموضوع يتطور بسرعة. جميع الأرقام هنا مستمدة من إعلان Google الرسمي ووثائق المطورين اعتباراً من 15 يونيو 2026؛ وقد تتغير الأسعار والتوافر.

Google, "Gemini 3.5: frontier intelligence with action," The Keyword (blog.google), May 19, 2026. https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/ ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹ ↩¹⁰ ↩¹¹ ↩¹² ↩¹³ ↩¹⁴ ↩¹⁵
Google AI for Developers، "ما الجديد في Gemini 3.5 Flash." https://ai.google.dev/gemini-API/docs/whats-new-gemini-3.5 ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹ ↩¹⁰ ↩¹¹ ↩¹² ↩¹³ ↩¹⁴ ↩¹⁵ ↩¹⁶ ↩¹⁷ ↩¹⁸ ↩¹⁹ ↩²⁰
Google AI for Developers، مرجع نموذج "Gemini 3.5 Flash". https://ai.google.dev/gemini-API/docs/models/gemini-3.5-flash ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷
Google AI for Developers، "أسعار Gemini Developer API." https://ai.google.dev/gemini-API/docs/pricing ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶

الأسئلة الشائعة

نعم. gemini-3.5-flash متاح بشكل عام (GA) ومستقر للاستخدام الإنتاجي اعتباراً من إطلاقه في 19 مايو 2026. 2