🎙️ حلقة 31907:16 • ٢٩ يونيو ٢٠٢٦
GPT-5.6 Sol: معاينة OpenAI المقيدة حكومياً
اسمع الحلقة دي
مناقشة AI-generated بواسطة Alex و Jamie
عن هذه الحلقة
انضموا للمذيعين أليكس وجيمي في الحلقة دي من "Nerd Level Tech البودكاست الذكي" وهما بيغوصوا في العالم الحصري لأحدث عيلة نماذج من OpenAI — GPT-5.6 Sol و Terra و Luna. اكتشفوا ليه الإطلاق ده باين كأنه إيفينت VIP لعدد قليل من المختارين بس، واستكشفوا أبعاد تدخل الحكومة في إصدارات الذكاء الاصطناعي، واعرفوا إيه هي المميزات الثورية اللي ممكن تكون مستخبية عن عامة الناس. اربطوا الأحزمة لنظرة ممتعة ومفيدة عن مستقبل الذكاء الاصطناعي مش هتحبوا تفوتوها!
التفريغ النصي
[Alex]: أهلاً يا نيردز، وأهلاً بكم من جديد في "نيردو البودكاست الذكي"، البرنامج الوحيد اللي فيه مصطلح "frontier model" بيعتبر مدح وتشخيص في نفس الوقت. أنا Alex، مفسركم المقيم ومروض الـ API. [Jamie]: وأنا Jamie—موجود هنا عشان أسأل الأسئلة اللي ممكن تبعتها في رسالة خاصة لأذكى صديق عندك، لأن بين Sol وTerra وLuna، كنت فاكر إننا بنتكلم عن تطورات بوكيمون، مش نماذج GPT. [Alex]: قصدي، مين قال إن الذكاء الاصطناعي ميكونش قابل للجمع؟ النهاردة، بنفك شفرة الإطلاق الحصري والغامض جداً لأحدث عائلة نماذج من OpenAI—GPT-5.6 Sol، بالإضافة لإخواته Terra وLuna. [Jamie]: أو بمعنى أصح، النماذج اللي لسه مش مسموح لك تستخدمها، إلا لو كنت تقريباً على علاقة شخصية بوكالة حكومية. خلينا ندخل في التفاصيل. [Alex]: طيب، نبدأ بالعناوين الرئيسية: في 26 يونيو، قدمت OpenAI عرضاً مسبقاً لـ GPT-5.6 Sol—نموذجهم الرائد الجديد، ومن الواضح إنه الأفضل على الإطلاق. بس هنا المفاجأة: هو متاح بس لمجموعة صغيرة جداً من الشركاء المعتمدين من الحكومة. مفيش ChatGPT، مفيش API عام، مفيش زرار "اشترك الآن". هو زي إصدارات الكوتشيات الحصرية (sneaker drop) في عالم الذكاء الاصطناعي، بس للناس اللي معاهم تصريح أمني بس. [Jamie]: استنى، يعني إنت بتقولي إني حتى مقدرش *أجرب* البتاع ده؟ ولا حتى لو وعدت إني مش هشغل Skynet من صالة بيتي؟ [Alex]: ولا حتى لو وعدت، إلا لو كنت واحد من حوالي عشرين "شريك موثوق" أساميهم غالباً مشطوب عليها في مكان ما. كل ده بيحصل تحت الأمر التنفيذي السيبراني الأمريكي الجديد—EO 14409—اللي بيقول ببساطة، "يا جماعة، لو بنيتوا حاجة متطورة للدرجة دي، العم سام عايز يلقي نظرة قبلنا كلنا." [Jamie]: دي أول مرة إصدار ذكاء اصطناعي يحسسني إني بحاول أدخل نادي حصري. هل فيه حبل مخملي على الباب؟ هل محتاج أكون عارف حد واصل؟ [Alex]: بس لو الحد الواصل ده شغال في وكالة الأمن القومي (NSA). بس بكل جدية، ده تحول كبير. OpenAI فعلاً عرضت النماذج للحكومة الأول، وبناءً على طلبهم، بدأت بالإصدار المحدود ده. هما بينسقوا دلوقتي بشكل وثيق مع واشنطن. [Jamie]: تمام، إيه الجديد فعلاً في GPT-5.6 Sol؟ أو خليني أقول، إيه اللي فايتنا كلنا؟ [Alex]: سؤال ممتاز. بص، Sol هو الفئة الأعلى—اعتبره الـ "Pro Max Ultra" في نماذج GPT. هو متصمم لأصعب المشاكل: البرمجة، البيولوجيا، والأمن السيبراني. Terra هو "فرس الرهان للجميع"—أداء وسعر متوازنين. Luna هو الخيار الاقتصادي فائق السرعة للمهام الروتينية. [Jamie]: يعني Sol للمستخدمين المحترفين، وTerra للمطور العادي، وLuna لـ... المتدربين؟ [Alex]: [يضحك] Luna لما تكون محتاج حاجة سريعة ورخيصة. بس فعلاً، التسمية جديدة كمان—Sol وTerra وLuna بقوا "فئات" متكررة هتستمر معانا في الأجيال الجاية، مش مجرد أسماء كودية. [Jamie]: أظن اسم "GPT-5.6 Pro Max Plus" كان محجوز. [Alex]: أيوه، Apple مسجلة العلامة التجارية دي. [Jamie]: فيه أي ميزات جديدة كول غير حصرية "ممنوع اللمس" دي؟ [Alex]: فيه حاجتين بارزين. أولاً، Sol بييجي مع حاجة اسمها "max reasoning effort"—ببساطة، هيقضي وقت أطول في التفكير للمشاكل الصعبة جداً لو سمحت له بكده. تخيل إنك بتطلب من النموذج بتاعك "خد نفس عميق وحاول بجهد أكبر"—بس ده هيكلفك توكنز أكتر وشوية وقت زيادة. [Jamie]: يعني زيي وأنا بذاكر للامتحانات النهائية. بطيء، ومكلف، بس تفكير أعمق. [Alex]: بالظبط. الحاجة التانية الكبيرة هي الـ "ultra mode"—وده جنان. بيسمح لـ Sol إنه يشغل كذا عميل فرعي (subagents) عشان يشتغلوا على مشكلة بالتوازي. بدل ما نموذج واحد يفضل يطحن في الشغل، هو بيقود فريق ذكاء اصطناعي صغير عشان يخلص المهام المعقدة بسرعة أكبر. [Jamie]: تمام، كده بدأنا نتكلم صح. ده زي ما تعين فريق لمشروع جماعي وبيعملوا الشغل فعلاً. بس هل بييجي معاه الدراما المعتادة؟ [Alex]: بس لو اعتبرت الـ prompt engineering "دراما"، واللي هي بصراحة ساعات بتكون كده فعلاً. [Jamie]: طيب وبالنسبة للـ benchmarks؟ عادةً OpenAI بتحب تتباهى بالأرقام. هل نشروا أي حاجة؟ [Alex]: ده الجزء المضحك—هما سموا الاختبارات، زي TerminalBench للبرمجة، وGeneBench للبيولوجيا، وExploitBench للأمن السيبراني. بس مشاركوش معظم النتائج الفعلية. كأنهم بيقولوا، "ثق فيا يا صاحبي، هو بجد جامد." [Jamie]: مدرسة "ثق فيا يا صاحبي" في إطلاق المنتجات—أنا بحبها جداً. [Alex]: عشان نكون منصفين، قالوا إنهم هينشروا النتائج الكاملة لما النموذج يتاح للجميع. حالياً، الادعاء هو إن Sol بيتصدر الـ benchmarks دي، خصوصاً في مهام الأمن السيبراني. [Jamie]: يعني OpenAI بتستعرض عضلاتها، بس مش متبتة في الوصولات. فهمت. [Alex]: خلينا نتكلم عن القيود الحكومية. السبب في إن Sol مقفول عليه هو إنه أقوى نموذج أمن سيبراني عملته OpenAI لحد دلوقتي. الحكومة الأمريكية عايزة وصول مبكر عشان تتأكد إنه مش بيخترع بالصدفة ثغرات zero-days جديدة أو حاجة زي كده. [Jamie]: منطقي—محدش عايز يصحى يلاقي الذكاء الاصطناعي بيعمل اختراقات سريعة للبنية التحتية الوطنية. [Alex]: بالظبط. بس OpenAI كانت صريحة جداً: هما مش عايزين ده يكون هو العادي للأبد. حتى قالوا إن النوع ده من الإجراءات بيحرم المستخدمين والشركات والشركاء العالميين اللي ممكن يحتاجوا الأدوات دي من أفضل الإمكانيات. [Jamie]: يعني هما بيقولوا "إحنا فاهمين، بس بلاش نخلي ده في كل إصدار، ماشي؟" [Alex]: تقريباً كده. [Jamie]: ممكن تشرح لنا الأمر التنفيذي 14409 ده؟ إيه الإجراء الفعلي؟ [Alex]: طبعاً. EO 14409 كله بيدور حول "النشر الآمن لنماذج الـ frontier". بيحط إطار عمل تطوعي يقدر المطورين من خلاله يقدموا نماذجهم للحكومة لمدة تصل لـ 30 يوم قبل ما أي حد تاني يقدر يوصل لها. الحكومة بتستخدم الوقت ده عشان، إنت عارف، تجرب كل حاجة—وتتأكد إن مفيش حاجة خطيرة هتعدي. [Jamie]: تطوعي، بس لو عايز تلعب مع الكبار... بتبقى "متطوع إجباري"، صح؟ [Alex]: [يضحك] الموضوع فيه شوية من ده. إطلاق OpenAI لـ Sol هو ببساطة عرض حي لإزاي العملية دي هتتم. الأول، الحكومة بتاخد وصول مبكر، بعدين شركاء مختارين بعناية، بعدين بقيتنا—في النهاية. [Jamie]: طيب، لو إنت مطور عادي، كل ده معناه إيه؟ هل ده وقت القلق، ولا مجرد تحديث للمواقع المحفوظة عندك؟ [Alex]: حالياً، خليك شغال على GPT-5.5، أو يمكن Terra وLuna لما يفتحوا. Sol في حالة "قريباً" إلا لو كنت في قائمة الـ VIP. بس Terra ممكن يكون نقلة كبيرة: بيدعي أداء بمستوى GPT-5.5 بنص السعر. لو ده حقيقي، ناس كتير هتحب تنقل عليه. [Jamie]: التوكنز الأرخص دايماً جذابة. كمان، خد بالك: فيه حسابات جديدة للـ caching في GPT-5.6—فلو بتشغل تطبيقات بحجم بيانات كبير، خلي بالك من رسوم الـ cache-write الإضافية الجديدة بنسبة 1.25x. [Alex]: كلام شخص اتلسع قبل كده من فاتورة AWS. [Jamie]: [يتأوه] متفكرنيش. [Alex]: طيب، الصورة الكبيرة—العرض المسبق المقيد حكومياً ده غالباً هيكون هو الوضع الطبيعي الجديد لنماذج الذكاء الاصطناعي القوية، على الأقل لما يكون الأمن السيبراني جزء من الموضوع. ده عالم جديد غريب الأدوات الأفضل فيه بتنطلق ورا أبواب مقفولة... حالياً. [Jamie]: بس لو أي حد بيسمعنا "شريك موثوق"، ابعتلنا رسالة خاصة وقولنا Sol عامل إيه فعلاً. بنوعد مش هنقول لحد... كتير. [Alex]: [يضحك] ده كل اللي عندنا النهاردة في "نيردو البودكاست الذكي". اشتركوا، سيبولنا تقييم، وقولولنا إيه النموذج اللي تحبوا تسموه على اسم كوكب. [Jamie]: شكراً لمتابعتكم يا نيردز. نشوفكم في نيرد ليفل تك الجاي! [موسيقى الختام]