أساسيات Kubernetes لتعلم الآلة

Kubernetes للذكاء الاصطناعي: مشهد 2026

4 دقيقة للقراءة

أصبح Kubernetes طبقة التشغيل الفعلية للخدمات المدفوعة بالذكاء الاصطناعي. مع اعتماد 54% لأعباء عمل AI/ML وأكثر من 70% من المؤسسات التي تشغل أنظمة AI كبيرة على Kubernetes، فهم هذه المنصة ضروري لأي مهندس ML.

واقع السوق

نمو سوق Kubernetes

المقياس20252030معدل النمو
حجم السوق$2.57B$7.07B22.4%
حصة تنسيق الحاويات92%+95%-
النشر الإنتاجي+80%+90%-

اتجاهات أعباء عمل AI/ML:

  • 54% من المنظمات تشغل AI/ML على Kubernetes (Spectro Cloud 2025)
  • +90% من الفرق تتوقع نمو أعباء ML في الـ 12 شهراً القادمة
  • 45% يدمجون موازنة الأعباء المدفوعة بالذكاء الاصطناعي
  • حجم البحث عن "Kubernetes AI" زاد 300% في 2025

لماذا يهيمن Kubernetes على ML

┌────────────────────────────────────────────────────────────────┐
│                    متطلبات منصة ML                              │
├────────────────────────────────────────────────────────────────┤
│  القابلية للتوسع │  مهام التدريب: 1 → 1000 GPU                 │
│  إدارة الموارد   │  GPUs، TPUs، عقد ذاكرة عالية               │
│  إعادة الإنتاج   │  بيئات محتواة                               │
│  تعدد المستأجرين │  الفرق تتشارك موارد المجموعة               │
│  قابلية النقل   │  محلي ↔ سحابة ↔ حافة                        │
│  النظام البيئي  │  Kubeflow، KServe، MLflow، Airflow          │
└────────────────────────────────────────────────────────────────┘
                    Kubernetes يوفر الكل

تطور Kubernetes لـ AI/ML

المعالم الرئيسية (2024-2026)

الإصدارتاريخ الإصدارميزات AI/ML
1.32ديسمبر 2024Memory Manager GA
1.33أبريل 2025DRA Beta، In-Place Pod Resize Beta
1.34أغسطس 2025DRA GA، OCI Images as Volumes
1.35ديسمبر 2025KYAML Beta، DRA محسّن

Kubernetes 1.34: معلم AI/ML

Dynamic Resource Allocation (DRA) GA:

# ResourceClaim لتخصيص GPU
apiVersion: resource.k8s.io/v1
kind: ResourceClaim
metadata:
  name: gpu-claim
spec:
  devices:
    requests:
    - name: gpu
      deviceClassName: nvidia-gpu
      count: 2
---
# Pod يستخدم ResourceClaim
apiVersion: v1
kind: Pod
metadata:
  name: training-job
spec:
  resourceClaims:
  - name: gpu
    resourceClaimName: gpu-claim
  containers:
  - name: trainer
    image: my-training-image:latest
    resources:
      claims:
      - name: gpu

فوائد DRA الرئيسية:

  • اختيار وتخصيص GPU/TPU في الوقت المناسب
  • مشاركة الأجهزة بين عدة Pods
  • تتبع سعة الجهاز القابلة للاستهلاك
  • تقليل تكاليف الأجهزة لأعباء AI/ML

OCI Images as Volumes:

# تحميل أوزان نموذج ML بدون صور أساسية مخصصة
apiVersion: v1
kind: Pod
metadata:
  name: inference-server
spec:
  containers:
  - name: model-server
    image: kserve/serving:latest
    volumeMounts:
    - name: model-weights
      mountPath: /models
  volumes:
  - name: model-weights
    image:
      reference: myregistry/llama-7b-weights:v1
      pullPolicy: IfNotPresent

فئات أعباء عمل ML

التدريب مقابل الاستدلال

الجانبالتدريبالاستدلال
المدةساعات إلى أيامميلي ثانية
المواردGPU عالية، متقطعةثابتة، أقل
التوسعقائم على المهامتوسع تلقائي
النمطدفعاتطلب-استجابة
مورد K8sJob/CronJobDeployment/Service

موارد Kubernetes لـ ML

خط أنابيب التدريب:
┌─────────────┐    ┌─────────────┐    ┌─────────────┐
│    Job      │ → │ PersistentVC │ → │   Secret    │
│ (التدريب)   │    │ (البيانات)  │    │ (السجل)    │
└─────────────┘    └─────────────┘    └─────────────┘

مكدس الاستدلال:
┌─────────────┐    ┌─────────────┐    ┌─────────────┐
│ Deployment  │ → │   Service   │ → │   Ingress   │
│ (النموذج)   │    │ (داخلي)    │    │ (خارجي)    │
└─────────────┘    └─────────────┘    └─────────────┘

بنية منصة ML على Kubernetes

البنية المرجعية

┌─────────────────────────────────────────────────────────────────┐
│                    منصة ML على Kubernetes                        │
├─────────────────────────────────────────────────────────────────┤
│  طبقة المستخدم    │  Notebooks │ Pipelines │ Model Registry    │
├─────────────────────────────────────────────────────────────────┤
│  طبقة ML          │  Kubeflow  │  MLflow   │  KServe │ Feast   │
├─────────────────────────────────────────────────────────────────┤
│  طبقة المنصة      │  Istio     │  ArgoCD   │  Prometheus       │
├─────────────────────────────────────────────────────────────────┤
│  طبقة Kubernetes  │  Scheduler │  DRA      │  CNI    │ CSI     │
├─────────────────────────────────────────────────────────────────┤
│  البنية التحتية  │  عقد GPU   │  التخزين  │  الشبكة          │
└─────────────────────────────────────────────────────────────────┘

خدمات Kubernetes ML لمزودي السحابة

الميزةEKSGKEAKS
عقد GPUP4d، P5، G5A100، H100، TPUسلسلة NC، ND
إضافة MLSageMaker OperatorsVertex AIAzure ML Extension
AutopilotKarpenterGKE AutopilotKEDA
توافق AIمعتمدمعتمدمعتمد

التالي، سنستكشف بنية Kubernetes والمفاهيم الأساسية الضرورية لأعباء عمل ML. :::

اختبار

الوحدة 1: أساسيات Kubernetes لتعلم الآلة

خذ الاختبار
نشرة أسبوعية مجانية

ابقَ على مسار النيرد

بريد واحد أسبوعياً — دورات، مقالات معمّقة، أدوات، وتجارب ذكاء اصطناعي.

بدون إزعاج. إلغاء الاشتراك في أي وقت.