متى ستتوفر TPU 8t و TPU 8i؟

من المتوقع أن تصل كلتا الشريحتين إلى التوفر العام في وقت لاحق من عام 2026 1 4 . لم تنشر Google شهراً محدداً.

كيف تقارن TPU 8t بـ Ironwood؟

تدعي Google أن TPU 8t تقدم ما يقرب من 3 أضعاف أداء الحوسبة لكل مجموعة (pod)، وأداء مقابل سعر أفضل بنسبة تصل إلى 2.7 مرة للتدريب واسع النطاق، وأداء مقابل واط أفضل بنسبة تصل إلى مرتين، وتزيد حجم المجموعة الفائقة (superpod) من 9,216 شريحة إلى 9,600 شريحة 3 4 5 .

هل TPU 8i أسرع من Blackwell أو Vera Rubin من Nvidia؟

لم تنشر Google مقارنات مباشرة مع قطع Nvidia. ادعاؤها بـ "أداء أفضل بنسبة 80% لكل دولار" لـ TPU 8i هو مقابل جيلها السابق Ironwood، وليس مقابل Nvidia 4 . في نفس اليوم، أعلنت Google بشكل منفصل عن مثيلات A5X المدعومة بـ Nvidia Vera Rubin كجزء من AI Hypercomputer 13 .

هل سيعمل Claude من Anthropic على TPU 8؟

نعم. اتفاقية Anthropic مع Google التي تصل إلى مليون وحدة TPU (أكتوبر 2025، مع دخول حوالي 1 جيجاوات في الخدمة في 2026) وتوسعة أبريل 2026 مع Broadcom (3.5 جيجاوات إضافية في 2027، ليصبح المجموع حوالي 4.5 جيجاوات) يتم ملؤها بسعة الجيل الثامن من TPU 10 12 .

لماذا يختلف Boardfly عن 3D torus؟

في مجموعة (pod) مكونة من 1,024 شريحة، يمكن أن يتطلب 3D torus ما يصل إلى 16 قفزة (hops) بين شرائح عشوائية. تصميم Boardfly عالي الجذر (high-radix) والمحول ضوئياً يضغط ذلك إلى سبع قفزات — وهو تقليل بنسبة 56% في قطر الشبكة وتحسن يصل إلى 50% في زمن انتقال الكل إلى الكل (all-to-all latency)، وهو أمر مهم لاستدلال MoE حيث يتم توجيه الرموز (tokens) عبر خبراء يتم تنشيطهم بشكل متفرق 9 .

Google TPU 8t و TPU 8i: انقسام الرقائق في عصر الوكلاء الذكيين

٢٣ أبريل ٢٠٢٦

#Google TPU #TPU 8t #TPU 8i #Sunfish #Zebrafish #Google Cloud Next 2026 #AI chips #AI infrastructure #agentic AI #Broadcom #MediaTek #Anthropic

Google TPU 8t and TPU 8i: The Agentic-Era Chip Split

ملخص

في 22 أبريل 2026، في مؤتمر Google Cloud Next في لاس فيجاس، كشفت Google عن عائلة الجيل الثامن من وحدات TPU — ولأول مرة على الإطلاق، قسمتها إلى شريحتين مخصصتين لغرض معين: TPU 8t (الاسم الكودي Sunfish)، وهو مسرع تدريب تم تصميمه بالتعاون مع Broadcom، و TPU 8i (الاسم الكودي Zebrafish)، وهو مسرع استدلال (inference) تم تصميمه بالتعاون مع MediaTek¹². يوفر TPU 8t المخصص للتدريب أداءً مقابل السعر أفضل بنسبة تصل إلى 2.7 مرة من Ironwood للتدريب واسع النطاق، بينما يحقق TPU 8i المخصص للاستدلال أداءً مقابل الدولار أفضل بنسبة 80% لخدمة نماذج Mixture-of-Experts ذات زمن الاستجابة المنخفض³⁴. يتوسع الـ superpod الواحد من TPU 8t إلى 9,600 شريحة واثنين بيتابايت من ذاكرة HBM المشتركة، ليصل إلى 121 FP4 exaFLOPS لكل pod⁵. وفوق ذلك، يمكن لنسيج شبكة Virgo Network الجديد من Google ربط 134,000 شريحة TPU 8t في نسيج مركز بيانات واحد وأكثر من مليون شريحة عبر مواقع متعددة — وهي الركيزة المادية لتشغيل ما وصفه الرئيس التنفيذي Sundar Pichai بـ "المؤسسة الوكيلية" (agentic enterprise)⁶.

ستصل كلتا الشريحتين إلى التوفر العام في وقت لاحق من عام 2026¹⁴.

ما ستتعلمه

ما الجديد في الجيل الثامن من TPU من Google، ولماذا قسمته Google إلى وحدتين (SKUs)
مواصفات TPU 8t (Sunfish) و TPU 8i (Zebrafish) وادعاءات الأداء
كيف يختلف ترابط Boardfly الجديد عن 3D torus الكلاسيكي
ماذا تضيف شبكة Virgo Network — 134,000 شريحة في نسيج واحد، وأكثر من مليون عبر المواقع
كيف يتناسب TPU 8 مع صفقة Anthropic مع Google التي تصل إلى مليون شريحة
أين تقف الشراكة مع Nvidia في مؤتمر Google Cloud Next 2026

لماذا قسمت Google الجيل الثامن من TPU

كان كل جيل من أجيال TPU حتى الآن عبارة عن شريحة واحدة يُطلب منها القيام بكل شيء — التدريب المسبق (pre-training)، والضبط الدقيق (fine-tuning)، والتعلم المعزز (reinforcement learning)، والاستدلال (inference). كان Ironwood، الجيل السابع من TPU من Google الذي تم تقديمه في أبريل 2025 وأصبح متاحًا بشكل عام في نوفمبر 2025، قد تم تقديمه بالفعل كـ "أول Google TPU لعصر الاستدلال"، ولكن من الناحية المادية كان لا يزال تصميماً واحداً للسيليكون⁷⁸.

مع TPU 8، غيرت Google ذلك. الجيل الثامن عبارة عن شريحتين:

TPU 8t (Sunfish) — مسرع تدريب تم تصميمه بالتعاون مع Broadcom، مبني حول قالبي (dies) حوسبة، و chiplet واحدة للإدخال والإخراج (I/O)، وثماني مجموعات بارتفاع 12 من ذاكرة HBM3e².
TPU 8i (Zebrafish) — مسرع استدلال تم تصميمه بالتعاون مع MediaTek، يستخدم قالب حوسبة واحداً، وقالب إدخال وإخراج واحداً، وست مجموعات من ذاكرة HBM3e².

المنطق وراء ذلك بسيط. لقد تباعد التدريب والاستدلال إلى أشكال مختلفة من أعباء العمل. يتطلب التدريب مجموعات هائلة وكثيفة من الكل إلى الكل (all-to-all) عبر عشرات الآلاف من الشرائح. أما الاستدلال — خاصة لنماذج Mixture-of-Experts (MoE) المتفرقة التي تشغل أعباء عمل وكيلية بميزانيات زمن استجابة صارمة — فيتطلب شبكات ذات قطر أقل، وذاكرة أكبر على الشريحة، وأداءً أفضل مقابل الدولار لكل رمز (token) يتم تقديمه. إن مطالبة شريحة واحدة بالتحسين لكليهما يجعل القالب أكبر وأكثر سخونة وأغلى مما يحتاجه أي من عبئي العمل فعلياً.

يتيح تقسيم الوحدات (SKUs) لشركة Google دفع كل هدف إلى أقصى حدوده.

TPU 8t (Sunfish): حصان العمل للتدريب

تم تصميم TPU 8t ليكون الشريحة التي تبني عليها النماذج الرائدة (frontier models). تدعي Google أنه يمكنه "تقليل دورة تطوير النماذج الرائدة من أشهر إلى أسابيع".

مواصفات الشريحة الواحدة

الحوسبة: ما يصل إلى 12.6 FP4 petaFLOPS لكل شريحة⁵
HBM: سعة 216 جيجابايت من HBM3e لكل شريحة³
نطاق تردد HBM: سعة 6.5 تيرابايت/ثانية لكل شريحة³
الترابط بين الشريحة والأخرى: ما يصل إلى 19.2 تيرابت/ثانية⁵

نطاق الـ Pod والنسيج

Superpod: يضم 9,600 شريحة، متصلة ببعضها بواسطة توبولوجيا 3D torus المثبتة من Google⁵
الذاكرة المشتركة لكل pod: اثنان بيتابايت من HBM⁶
حوسبة الـ Pod بتنسيق FP4: تصل إلى 121 exaFLOPS⁵ (رقم 42.5 EFLOPS الأكثر تداولاً لـ Ironwood هو بتنسيق FP8، لذا فإن نسبة 121 مقابل 42.5 تخلط بين الدقة؛ عنوان Google الرئيسي هو "ما يقرب من 3 أضعاف الحوسبة لكل pod")
نسيج شبكة Virgo Network: ما يصل إلى 134,000 شريحة TPU 8t في نسيج مركز بيانات واحد، وأكثر من مليون شريحة عبر مراكز بيانات متعددة في عنقود تدريب واحد⁶

ادعاءات الأداء مقابل Ironwood

المقياس	TPU 8t مقابل Ironwood (TPU 7)
حوسبة التدريب لكل pod	ما يقرب من 3 أضعاف³⁵
الأداء مقابل السعر للتدريب واسع النطاق	ما يصل إلى 2.7 ضعف³
الأداء مقابل الواط	ما يصل إلى ضعفين⁴
ذروة مستوى الـ Pod: TPU 8t (FP4) مقابل Ironwood (FP8)	121 EFLOPS مقابل 42.5 EFLOPS⁵

ملاحظة على الصف الأخير: رقم 121 EFLOPS لـ TPU 8t هو رقم FP4، بينما رقم 42.5 EFLOPS الأكثر تداولاً لـ Ironwood هو FP8. قدم TPU 8t تنسيق FP4 الأصلي مع مضاعفة إنتاجية MXU، لذا فإن المقارنات مع pods الجيل السابق غالباً ما تخلط بين الدقة — اقرأ "حوالي 3 أضعاف الحوسبة لكل pod" كعنوان رئيسي لشركة Google بدلاً من فرق صافٍ بين FP4 و FP4.

بشكل منفصل: هذه هي أرقام Google الخاصة، والتي تقارن TPU الجديد بـ TPU السابق. إنها ليست اختبارات أداء مباشرة ضد Blackwell من Nvidia أو Vera Rubin الأحدث، ولم تنشر Google مثل هذه المقارنات عند الإطلاق⁴. إذا كنت تقيم TPU 8t مقابل بنية تعتمد على Nvidia، فستحتاج إلى أرقام أعباء العمل الخاصة بك.

TPU 8i (Zebrafish): متخصص الاستدلال

إذا كان TPU 8t يتعلق بتدريب النماذج الرائدة بشكل أسرع، فإن TPU 8i يتعلق بتشغيلها — وخدمة الملايين من الوكلاء المتزامنين — بسعر لا تستطيع Nvidia مضاهاته على وحدات معالجة الرسومات الكثيفة.

مواصفات الشريحة الواحدة

الحوسبة: 10.1 FP4 petaFLOPS لكل شريحة⁹
SRAM على الشريحة: 384 ميجابايت لكل شريحة — ثلاثة أضعاف الكمية في Ironwood⁴
HBM: سعة 288 جيجابايت من HBM3e لكل شريحة⁹
نطاق HBM الترددي: 8.6 تيرابايت/ثانية لكل شريحة⁹
نطاق ICI الترددي: 19.2 تيرابت/ثانية لكل شريحة، وهو ضعف الجيل السابق ومعدل خصيصاً لحركة مرور MoE all-to-all⁹

لاحظ أن TPU 8i يحمل في الواقع HBM أكثر من TPU 8t (288 جيجابايت مقابل 216 جيجابايت) ونطاق ترددي أعلى للذاكرة. هذا مقصود: الاستدلال لنماذج MoE الكبيرة مقيد بنطاق ذاكرة الترددي، وليس بالحوسبة. الشريحة التي تقدم الرموز (tokens) تحتاج إلى بث الأوزان وذاكرة التخزين المؤقت KV بشكل أسرع من الشريحة التي تدربها.

يتخلى TPU 8i أيضاً عن SparseCores المخصصة في Ironwood لصالح محرك تسريع جماعي جديد (CAE) يقوم بإخراج الاتصالات الجماعية من نوى التنسور (tensor cores)، مما يبقي وحدات الرياضيات أكثر انشغالاً خلال مراحل all-to-all⁹.

Boardfly: ترابط جديد لمجموعات الاستدلال (inference pods)

أكبر خروج معماري في TPU 8i ليس في القالب — بل في الشبكة. يحافظ TPU 8t على تقنية 3D torus المثبتة. أما TPU 8i فيتخلى عنها.

Boardfly هو ترابط Google الجديد عالي الشعاع (high-radix)، المنظم في ثلاث طبقات⁹:

لبنات البناء: تشكل كل صينية حلقة من أربع شرائح.
المجموعات: ثماني لوحات متصلة بالكامل بكابلات نحاسية.
Pod: ما يصل إلى 36 مجموعة — 1,024 شريحة نشطة — مرتبطة من خلال مفاتيح الدوائر الضوئية (OCS).

المكسب هو قطر الشبكة. في تكوين مكون من 1,024 شريحة، يمكن أن يتطلب 3D torus ما يصل إلى 16 قفزة بين شرائح عشوائية. يضغط Boardfly تلك الحالة الأسوأ إلى سبع قفزات — وهو انخفاض بنسبة 56% في القطر، وتحسن يصل إلى 50% في زمن انتقال اتصالات all-to-all⁹. بالنسبة لاستدلال MoE، حيث يتم توجيه كل رمز عبر مجموعة فرعية مختلفة من الخبراء الذين قد يتواجدون على شرائح مختلفة، تترجم القفزات الأقل بشكل مباشر تقريباً إلى زمن انتقال ذيل (tail latency) أقل.

ادعاء Google الرئيسي للاستدلال: أداء مقابل الدولار أفضل بنسبة 80% للاستدلال منخفض الكمون على نماذج MoE الكبيرة، مقارنة بـ Ironwood⁴.

مقارنة جنباً إلى جنب: TPU 8t مقابل TPU 8i

المواصفات	TPU 8t (Sunfish)	TPU 8i (Zebrafish)
الدور	التدريب	الاستدلال
شريك التصميم المشترك	Broadcom	MediaTek
حوسبة FP4 لكل شريحة	12.6 PFLOPS	10.1 PFLOPS
SRAM على الشريحة	128 ميجابايت	384 ميجابايت
سعة HBM	216 جيجابايت	288 جيجابايت
نطاق HBM الترددي	6.5 تيرابايت/ثانية	8.6 تيرابايت/ثانية
النطاق الترددي من شريحة لشريحة	يصل إلى 19.2 تيرابت/ثانية	19.2 تيرابت/ثانية
طوبولوجيا الترابط	3D torus	Boardfly (high-radix)
حجم الـ Pod	9,600 شريحة (superpod)	1,024 شريحة (Boardfly pod)
الادعاء الرئيسي	أداء مقابل السعر أفضل بـ 2.7 مرة من Ironwood للتدريب	أداء مقابل الدولار أفضل بنسبة 80% لاستدلال MoE

المصادر: ²³⁴⁵⁹.

شبكة Virgo: النسيج وراء مليون شريحة

لا يزال الـ superpod محدوداً. كانت قصة البنية التحتية الأكبر لـ Google في مؤتمر Next 2026 هي شبكة Virgo — نسيج التوسع الذي يربط الـ superpods في مجموعات تدريب على مستوى مركز البيانات ومراكز بيانات متعددة⁶.

أرقام Virgo الرئيسية:

نسيج واحد: يربط ما يصل إلى 134,000 شريحة TPU 8t في مركز بيانات واحد مع ما يصل إلى 47 بيتابت/ثانية من نطاق bisection الترددي غير المحظور⁶
مواقع متعددة: أكثر من مليون شريحة TPU 8t عبر مراكز بيانات متعددة، في مجموعة تدريب واحدة⁶
النطاق الترددي لكل مسرع: يصل إلى 4 أضعاف الجيل السابق⁶
زمن انتقال النسيج غير المحمل: أقل بنسبة 40% من الجيل السابق⁶

هذا هو الأساس الذي تحتاجه Google للوفاء بصفقات مثل اتفاقية Anthropic التي تصل إلى مليون TPU من أكتوبر 2025 (وهو التزام تم التعهد به جنباً إلى جنب مع صفقة Anthropic بقيمة 100 مليار دولار مع AWS Trainium متعددة السحاب) — لا يمكن لمركز بيانات واحد وحده استيعاب هذا العدد الكبير من المسرعات، لذا يجب أن يتصرف النسيج بين مراكز البيانات كآلة واحدة.

كيف يرتبط TPU 8 بصفقة Anthropic

في 23 أكتوبر 2025، أعلنت Anthropic أنها ستوسع استخدامها لـ Google Cloud، مما يتيح لها الوصول إلى ما يصل إلى مليون شريحة TPU وأكثر من جيجاوات من السعة التي ستدخل الخدمة في عام 2026، في صفقة تبلغ قيمتها عشرات المليارات من الدولارات¹⁰¹¹. كان ذلك بالفعل أكبر التزام لـ TPU من قبل الشركة.

في أبريل 2026، ومع تصاعد وتيرة إنتاج TPU 8t، وسعت Anthropic الصفقة مرة أخرى — حيث وقعت اتفاقية جديدة متعددة السنوات مع Google و Broadcom للحصول على سعة إضافية تبلغ 3.5 جيجاوات من الجيل القادم من وحدات TPU التي ستدخل الخدمة في عام 2027، بالإضافة إلى 1 جيجاوات بدأت بالفعل في عام 2026، ليصل إجمالي بصمة Google TPU إلى حوالي 4.5 جيجاوات¹². وقد تجاوز معدل الإيرادات السنوي لشركة Anthropic حاجز 30 مليار دولار — ارتفاعاً من حوالي 9 مليارات دولار في نهاية عام 2025 — ولديها الآن أكثر من 1000 عميل ينفقون أكثر من مليون دولار سنوياً على Claude¹².

تعد TPU 8t و TPU 8i هي السيليكون الذي تقوم عليه هذه الصفقة. تصمم Broadcom شريحة التدريب TPU 8t؛ بينما تصمم MediaTek شريحة الاستدلال TPU 8i². وكلاهما يتم تصنيعه بواسطة TSMC. ليست Google هي المورد الوحيد لشركة Anthropic — حيث يعمل Claude أيضاً على Amazon Trainium ومعالجات رسوميات Nvidia بموجب استراتيجيتها السحابية المتعددة — ولكن بصمة TPU هي الأكبر بفارق كبير، و TPU 8 هو ما تُبنى عليه السعة الجديدة.

بعيداً عن Anthropic، يشمل عملاء Google Cloud TPU العامون كلاً من Midjourney (التي نقلت غالبية أسطول استدلال Stable Diffusion XL و Flux إلى TPU v6e في الربع الثاني من عام 2025)، و Safe Superintelligence (الشركة الناشئة لـ Ilya Sutskever التي اختارت وحدات TPU على معالجات رسوميات Nvidia لأبحاثها)، و Salesforce، و Citadel Securities⁴.

ومع ذلك، لا تزال Nvidia حاضرة في المشهد

الأمر المثير للدهشة في مؤتمر Google Cloud Next 2026 ليس إعلان Google عن شرائحها الخاصة — بل إعلانها عنها جنباً إلى جنب مع شراكة موسعة مع Nvidia في نفس اليوم. إن AI Hypercomputer — وهو المظلة التي تضع Google Cloud تحتها بنيتها التحتية للذكاء الاصطناعي — يمتد الآن ليشمل TPU 8، و Vera Rubin من Nvidia، ومعالجات Axion المستندة إلى Arm من Google¹³.

تضمن جانب Nvidia من الإعلان ما يلي:

مثيلات A5X bare-metal المدعومة بأنظمة Nvidia Vera Rubin NVL72 على مستوى الرفوف (rack-scale)، مع ادعاء Google بخفض تكلفة الاستدلال لكل رمز (token) بنسبة تصل إلى 10 مرات وزيادة إنتاجية الرموز لكل ميجاوات بنسبة 10 مرات مقارنة بالجيل السابق¹³
توسيع نطاق A5X عبر بطاقات Nvidia ConnectX-9 SuperNICs وشبكات Virgo — ما يصل إلى 80,000 وحدة معالجة رسوميات Rubin في عنقود (cluster) واحد في موقع واحد، وما يصل إلى 960,000 عبر مواقع متعددة¹³
Gemini على Google Distributed Cloud، الذي يعمل على معالجات رسوميات Nvidia Blackwell و Blackwell Ultra، وهو متاح الآن في نسخة المعاينة — مما يسمح للعملاء بتشغيل Gemini مع بيانات حساسة داخل بيئاتهم الخاصة¹³

الرسالة من Google هي أن TPU و Nvidia ليسا خيارين متناقضين لعملائها. فبعض أعباء العمل تعمل بشكل أفضل على TPU، وبعضها يعمل بشكل أفضل على GPU، وسيقدم لك AI Hypercomputer أيهما أكثر منطقية للمهمة المطلوبة.

صياغة عصر الوكلاء الذكيين

قام Sundar Pichai بصياغة الإطلاق صراحةً حول الوكلاء الذكيين (AI agents). إليك الاقتباس من خطابه في مؤتمر Next 2026¹:

لقد تحول الحوار من "هل يمكننا بناء وكيل؟" إلى "كيف ندير الآلاف منهم؟" لهذا السبب نقدم منصة Gemini Enterprise Agent Platform الجديدة. إنها توفر النسيج الضام الآمن والمتكامل الذي تحتاجه لبناء وتوسيع وحوكمة وتحسين وكلائك بثقة — إنها غرفة تحكم للمؤسسات القائمة على الوكلاء.

تتمثل وجهة نظر Google في أن تقسيم TPU 8t/8i هو التعبير المادي (الأجهزة) عن هذا التحول. فتدريب وكلاء أكبر يحتاج إلى مجموعات (pods) كثيفة وعالية الأداء (FLOPs) التي يوفرها TPU 8t. أما تشغيل ملايين الوكلاء في وقت واحد — لكل منهم نافذة سياق خاصة به، واستدعاءات أدوات، وميزانية زمن استجابة (latency) محددة — فيحتاج إلى تصميم الاستدلال الغني بالذاكرة ومنخفض القفزات في TPU 8i. هذا التقسيم في الشرائح هو الطريقة التي تحاول بها Google جعل الوكلاء رخيصين بما يكفي للعمل على نطاق المؤسسات.

سواء كانت الجدوى الاقتصادية ستسير بهذا الاتجاه فعلاً، فهذا سيعتمد على أرقام التكلفة لكل مليون رمز ($/1M-token) لـ TPU 8i بمجرد شحن الشرائح وبدء تشغيل أعباء العمل عليها. لم تنشر Google أسعار تجزئة مستقلة؛ حيث كانت سعة TPU تُباع تاريخياً من خلال اتفاقيات مخصصة للمؤسسات بدلاً من قوائم أسعار عامة.

الجدول الزمني في لمحة

التاريخ	الحدث
9 أبريل 2025	تقديم Ironwood (TPU 7) في مؤتمر Google Cloud Next 25
23 أكتوبر 2025	Anthropic تعلن عن صفقة تصل إلى مليون وحدة TPU مع Google، بسعة تزيد عن 1 جيجاوات في عام 2026
أواخر نوفمبر 2025	وصول Ironwood إلى التوفر العام
7 أبريل 2026	Anthropic تضيف 3.5 جيجاوات من سعة Google TPU عبر Broadcom، بدءاً من عام 2027
22 أبريل 2026	Google تكشف عن TPU 8t و TPU 8i في مؤتمر Google Cloud Next 2026
في وقت لاحق من عام 2026	من المتوقع وصول TPU 8t و TPU 8i إلى التوفر العام

المصادر: ¹⁴⁷⁸¹⁰¹².

ملخص

TPU 8 هو المرة الأولى التي تتعامل فيها Google مع التدريب والاستدلال كمشكلتين مختلفتين على مستوى السيليكون، وهي تراهن على أن عصر الوكلاء (agentic era) سيكافئ هذه البنية. TPU 8t هو نسخة أكبر وأسرع من مجموعة التدريب المفهومة جيداً، مع وجود Broadcom في الداخل وشبكات Virgo حولها. أما TPU 8i فهو تصميم جديد حقاً للاستدلال — المزيد من HBM، والمزيد من SRAM، وناقل ربط جديد، وشريك تصميم مختلف وهو MediaTek.

الأرقام التي يجب مراقبتها هي 2.7x، و80%، ومليون. 2.7x هو ادعاء Google لسعر الأداء في التدريب مقارنة بـ Ironwood — وهو كبير بما يكفي ليكون مهماً إذا صمد أمام أعباء عمل العملاء، وصغير بما يكفي ليتأثر بالجيل القادم من Nvidia. و80% هو ادعاء سعر الأداء في الاستدلال، وهو المكان الذي تعيش فيه اقتصاديات الوكلاء فعلياً. ومليون هو عدد شرائح TPU 8 التي تقتضيها صفقة Anthropic والتي يجب أن تكون Google قادرة على ربطها معاً كآلة واحدة.

إذا صمدت هذه الأرقام الثلاثة عند استخدامها من قبل عملاء الإنتاج، فإن فرضية الموجة الثانية من السيليكون المخصص — Google TPU و Amazon Trainium و Meta MTIA و Microsoft Maia التي تقضم جميعاً من هوامش أرباح Nvidia — ستصبح أكثر مصداقية بكثير. وإذا لم يحدث ذلك، فسنرى ذلك في دورة الأرباح القادمة أيضاً.

Footnotes

Sundar Pichai shares news from Google Cloud Next 2026 — Google blog, April 22, 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵
Google Splits TPUv8 Strategy Into Two Chips, Handing Broadcom Training and MediaTek Inference Duties — Wccftech, April 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶
Google unveils chips for AI training and inference in latest shot at Nvidia — CNBC, April 22, 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷
Google Cloud launches two new AI chips to compete with Nvidia — TechCrunch, April 22, 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹ ↩¹⁰ ↩¹¹ ↩¹² ↩¹³
الجيل الثامن من وحدات TPU الخاصة بنا: شريحتان لعصر الوكلاء الذكيين — مدونة Google، 22 أبريل 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹
تقديم شبكة Virgo لمركز بيانات فائق النطاق — مدونة Google Cloud، أبريل 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸
Ironwood: أول وحدة Google TPU لعصر الاستنتاج — مدونة Google، 9 أبريل 2025. ↩ ↩²
Google تكشف عن Ironwood، الجيل السابع من وحدات TPU، لمنافسة Nvidia — CNBC، 6 نوفمبر 2025. ↩ ↩²
تعمق تقني في TPU 8t و TPU 8i — مدونة Google Cloud، 22 أبريل 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷ ↩⁸ ↩⁹
Anthropic توسع استخدامها لوحدات Google Cloud TPU وخدماتها — صحافة Google Cloud، 23 أكتوبر 2025. ↩ ↩² ↩³
Google و Anthropic تعلنان عن صفقة سحابية بقيمة عشرات المليارات من الدولارات — CNBC، 23 أكتوبر 2025. ↩
Anthropic توسع شراكتها مع Google و Broadcom — Anthropic، أبريل 2026. ↩ ↩² ↩³ ↩⁴
NVIDIA و Google Cloud تتعاونان لتطوير الذكاء الاصطناعي الوكيل والفيزيائي — مدونة Nvidia، 22 أبريل 2026. ↩ ↩² ↩³ ↩⁴ ↩⁵

الأسئلة الشائعة

TPU 8t (Sunfish) هي شريحة تدريب تم تصميمها بالتعاون مع Broadcom، وهي محسنة للحوسبة الكثيفة عبر مجموعات فائقة (superpods) تضم 9,600 شريحة على هيكل 3D torus. أما TPU 8i (Zebrafish) فهي شريحة استدلال تم تصميمها بالتعاون مع MediaTek، مع ذاكرة HBM أكبر، وناقل Boardfly جديد، وتركيز على تقديم نماذج Mixture-of-Experts بزمن استجابة منخفض. هذه هي المرة الأولى التي تشحن فيها Google شرائح مخصصة للتدريب والاستدلال في نفس الجيل 2 4 .

Google TPU 8t و TPU 8i: انقسام الرقائق في عصر الوكلاء الذكيين

ملخص

ما ستتعلمه

لماذا قسمت Google الجيل الثامن من TPU

TPU 8t (Sunfish): حصان العمل للتدريب

مواصفات الشريحة الواحدة

نطاق الـ Pod والنسيج

ادعاءات الأداء مقابل Ironwood

TPU 8i (Zebrafish): متخصص الاستدلال

مواصفات الشريحة الواحدة

Boardfly: ترابط جديد لمجموعات الاستدلال (inference pods)

مقارنة جنباً إلى جنب: TPU 8t مقابل TPU 8i

شبكة Virgo: النسيج وراء مليون شريحة

كيف يرتبط TPU 8 بصفقة Anthropic

ومع ذلك، لا تزال Nvidia حاضرة في المشهد

صياغة عصر الوكلاء الذكيين

الجدول الزمني في لمحة

ملخص

Footnotes

الأسئلة الشائعة

مقالات ذات صلة

رهان Google بقيمة ٤٠ مليار دولار على Anthropic: سيولة، حوسبة، وClaude

صفقة Meta وBroadcom بخصوص MTIA: 1GW من رقائق الذكاء الاصطناعي المخصصة بدقة 2nm

سباق رقائق الذكاء الاصطناعي المخصصة في 2026: Meta و Google و Amazon و Microsoft ضد Nvidia

Claude Opus 4.8: اختبارات الأداء، تدفقات العمل الديناميكية، الأسعار

ابقَ على مسار النيرد