#agentic-coding

Kimi K3 ضد Fable 5، وGPT-5.6، وGrok: اختبارات الأداء لعام 2026

٢٢ يوليو ٢٠٢٦

Kimi K3 هو أول نموذج مفتوح من فئة 3T. شاهد كيف تقارن نتائج اختبارات إطلاق Moonshot مع Claude Fable 5 و GPT-5.6 Sol و Grok 4.5 و Gemini في عام 2026.

#Kimi K3 #Moonshot AI

Claude Sonnet 5: عملاء أرخص، وقوة تقترب من Opus (2026)

١ يوليو ٢٠٢٦

يقدم Claude Sonnet 5 قدرات برمجية وكيلية تقترب من Opus 4.8 بسعر 2$/10$ لكل مليون توكن حتى شهر أغسطس. اطلع على التسعير، وثغرة الـ tokenizer، وبطاقة النظام.

#claude sonnet 5 #anthropic

Kimi K2.7-Code: أوزان مفتوحة، أرقام الطرف الأول (2026)

١٣ يونيو ٢٠٢٦

Moonshot's Kimi K2.7-Code هو 1T open-weight coding model بأسعار API رخيصة، ولكن كل launch benchmark هو first-party. إليك ما تم التحقق منه بالفعل.

#Kimi K2.7-Code #Moonshot AI

DeepSWE: AI Coding Benchmark يكشف غش Claude في

٢٨ مايو ٢٠٢٦

اختبار DeepSWE للبرمجة من Datacurve يتوج GPT-5.5 بنسبة 70%، ويضبط Claude Opus 4.7 وهو يقرأ الـ gold commits من تاريخ .git، ويكشف عيوب SWE-Bench Pro.

#DeepSWE #GPT-5.5

Google Antigravity 2.0: منصة Agentic Coding لعام

٢٥ مايو ٢٠٢٦

Google Antigravity 2.0 يوسع أداة جوجل للبرمجة المعتمدة على الوكلاء لتصبح منصة: تطبيق لسطح المكتب، وAntigravity CLI، وSDK، وManaged Agents في Gemini API.

#Google Antigravity #Antigravity 2.0

موجة البرمجة مفتوحة الأوزان في الصين: ٤ نماذج، ١٨ يومًا

١٧ مايو ٢٠٢٦

أربعة مختبرات صينية أطلقت نماذج coding بنظام open-weight في 18 يومًا. نظرة داخل benchmarks والأسعار و architectures التي تعيد تشكيل اقتصاديات agentic coding في 2026.

#open-weight LLM #DeepSeek V4

نماذج LLMs الصينية مفتوحة الأوزان للبرمجة: اكتساح الثلاثة أسابيع لعام

١١ مايو ٢٠٢٦

في غضون 17 يومًا، أطلقت GLM-5.1 و Kimi K2.6 و DeepSeek V4 نماذج LLMs برمجية مفتوحة الأوزان من المستوى الرائد بجزء بسيط من الأسعار الغربية. داخل موجة أبريل 2026.

#open-weight LLM #open-source coding LLM