كم عدد الطبقات التي تجعل الشبكة "عميقة"؟

عادةً، أكثر من طبقتين مخفيتين تؤهل الشبكة لتكون عميقة. 2

هل أحتاج دائماً إلى وحدات معالجة رسومية (GPUs) للتعلم العميق؟

ليس بالضرورة. يمكن تدريب النماذج الصغيرة على وحدات المعالجة المركزية (CPUs)، لكن الـ GPUs تسرع التدريب بشكل كبير لمجموعات البيانات الكبيرة.

ما الفرق بين CNNs و RNNs؟

تتعامل الـ CNNs مع البيانات المكانية (مثل الصور)، بينما تتعامل الـ RNNs مع البيانات التسلسلية (مثل النصوص أو السلاسل الزمنية). 5

أين يمكنني تعلم المزيد؟

اطلع على الدورات والموارد المجانية المدرجة أدناه.

أساسيات Deep Learning: دليل شامل للمبتدئين

٢ أبريل ٢٠٢٦

#deep learning #neural networks #machine learning #AI fundamentals #PyTorch #training #optimization

Deep Learning Fundamentals: A Complete Beginner’s Guide

ملخص

التعلم العميق (Deep learning) هو جزء من التعلم الآلي يعتمد على شبكات عصبية متعددة الطبقات مستوحاة من دماغ الإنسان.¹²
تتعلم الشبكات العصبية تمثيلات هرمية للبيانات من خلال طبقات من الخلايا العصبية، والأوزان، والتنشيطات غير الخطية.²
يدعم التعلم العميق تطبيقات الذكاء الاصطناعي الحديثة مثل التعرف على الصور ومعالجة اللغات الطبيعية.¹³
ستتعلم كيف تعمل الشبكات العصبية، وكيفية تدريبها، ومتى تستخدم التعلم العميق بفعالية.
يتضمن أمثلة برمجية عملية، ونصائح لاستكشاف الأخطاء وإصلاحها، ومصادر تعليمية مختارة.

ما ستتعلمه

هيكلية وميكانيكا الشبكات العصبية
كيف يختلف التعلم العميق عن التعلم الآلي التقليدي
كيفية بناء وتدريب شبكة عصبية بسيطة من الصفر
متى يكون التعلم العميق هو الأداة المناسبة — ومتى لا يكون كذلك
الأخطاء الشائعة وكيفية تصحيح مشكلات التدريب
أين تواصل تعلمك بمصادر مجانية وعالية الجودة

المتطلبات الأساسية

لا تحتاج لأن تكون عالم بيانات للمتابعة، ولكنك ستحقق أقصى استفادة من هذا المقال إذا كان لديك:

معرفة أساسية بلغة Python
إلمام بالجبر الخطي وحساب التفاضل والتكامل (على الأقل من الناحية المفاهيمية)
بعض الاطلاع على مفاهيم التعلم الآلي مثل التعلم الخاضع للإشراف (supervised learning)

إذا كنت جديداً تماماً في عالم الذكاء الاصطناعي، فإن دورة Deep Learning Fundamentals المجانية من Lightning AI⁴ هي مكان رائع للبدء.

التعلم العميق هو فرع متخصص من التعلم الآلي يستخدم شبكات عصبية اصطناعية ذات طبقات متعددة للتعلم من البيانات. هذه الشبكات مستوحاة من هيكل ووظيفة الدماغ البشري — حيث تتصل الخلايا العصبية وتنقل الإشارات لمعالجة المعلومات.¹²

في جوهره، يقوم التعلم العميق بأتمتة استخراج الميزات (feature extraction). بدلاً من تصميم الميزات يدوياً (مثل الحواف في الصورة أو الكلمات المفتاحية في النص)، تتعلم الشبكات العميقة هذه الميزات مباشرة من البيانات الخام. هذه القدرة على التعلم من البداية إلى النهاية (end-to-end learning) هي ما يجعل التعلم العميق قوياً جداً للمهام المعقدة مثل تصنيف الصور، والتعرف على الكلام، وفهم اللغة الطبيعية.³

تشريح الشبكة العصبية

تتكون الشبكة العصبية من طبقات من الخلايا العصبية — تقوم كل منها بإجراء تحويلات رياضية على بيانات الإدخال.

المكونات الرئيسية

نوع الطبقة	الوصف	مثال
طبقة الإدخال (Input Layer)	تستقبل البيانات الخام (مثل قيم البكسل، أو تمثيلات الكلمات)	784 عقدة لصورة بمقاس 28×28
الطبقات المخفية (Hidden Layers)	تجري تحويلات غير خطية لتعلم الميزات	طبقات متعددة مع تنشيطات ReLU
طبقة الإخراج (Output Layer)	تنتج التوقعات النهائية	Softmax للتصنيف

تقوم كل خلية عصبية بحساب مجموع مرجح لمدخلاتها، وتضيف انحيازاً (bias)، وتطبق دالة تنشيط لإدخال اللاخطية.

التمرير الأمامي (Forward Pass)

رياضياً، يمكن التعبير عن مخرجات الخلية العصبية كالتالي:

$$ y = f(\sum_i w_i x_i + b) $$

حيث:

( w_i ): الأوزان (weights)
( x_i ): المدخلات (inputs)
( b ): الانحياز (bias)
( f ): دالة التنشيط (activation function) (مثل ReLU، sigmoid)

دوال التنشيط

تحدد دوال التنشيط كيفية تدفق الإشارات عبر الشبكة:

الدالة	الصيغة	الاستخدام الشائع
Sigmoid	( f(x) = 1 / (1 + e^{-x}) )	التصنيف الثنائي
ReLU	( f(x) = \max(0, x) )	الطبقات المخفية العميقة
Softmax	تحول القيم (logits) إلى احتمالات	المخرجات متعددة الفئات

متوسط مربع الخطأ (MSE) للانحدار (regression)
خسارة الـ Cross-Entropy للتصنيف

الخطوة 3: الانتشار العكسي (Backpropagation)

تقوم الشبكة بحساب تدرجات (gradients) الخسارة بالنسبة لكل وزن باستخدام قاعدة السلسلة في التفاضل.

الخطوة 4: التحسين (Optimization)

يتم تحديث الأوزان باستخدام محسن (optimizer) مثل Stochastic Gradient Descent (SGD) أو Adam.

# Example: Simple training loop in PyTorch
import torch
import torch.nn as nn
import torch.optim as optim

# Define a simple feedforward network
class SimpleNet(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(784, 128)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = self.relu(self.fc1(x))
        return self.fc2(x)

model = SimpleNet()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

for epoch in range(5):
    for inputs, labels in dataloader:  # assume dataloader is defined
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
    print(f"Epoch {epoch+1}, Loss: {loss.item():.4f}")

مثال لمخرجات التيرمينال

Epoch 1, Loss: 1.9821
Epoch 2, Loss: 1.4217
Epoch 3, Loss: 0.9873
Epoch 4, Loss: 0.6124
Epoch 5, Loss: 0.4128

تصور عملية التعلم

إليك تدفق مبسط لكيفية انتقال البيانات عبر نموذج التعلم العميق:

flowchart LR
A[Input Data] --> B[Input Layer]
B --> C[Hidden Layer 1]
C --> D[Hidden Layer 2]
D --> E[Output Layer]
E --> F[Predictions]
F --> G[Loss Function]
G --> H[Backpropagation]
H --> I[Weight Updates]
I --> B

تستمر هذه الحلقة حتى يتقارب النموذج (converges) — مما يعني أن الخسارة تتوقف عن الانخفاض بشكل ملحوظ.

متى تستخدم مقابل متى لا تستخدم التعلم العميق

السيناريو	استخدم التعلم العميق	تجنب التعلم العميق
مجموعات بيانات ضخمة ومصنفة	✅ أداء ممتاز	❌ ليس مثالياً إذا كانت البيانات شحيحة
أنماط معقدة (صور، نصوص، صوت)	✅ يتعلم ميزات هرمية	❌ مبالغ فيه للبيانات الجدولية البسيطة
توفر موارد حوسبة عالية	✅ يستفيد من الـ GPUs بفعالية	❌ مكلف على الأجهزة المحدودة
الحاجة إلى القابلية للتفسير	❌ غالباً ما يكون "صندوقاً أسود"	✅ النماذج الأبسط أكثر قابلية للتوضيح

الأخطاء الشائعة والحلول

المشكلة	السبب	الحل
Overfitting (فرط التخصيص)	النموذج يحفظ بيانات التدريب	استخدم dropout، أو regularization، أو بيانات أكثر
Vanishing gradients (تلاشي التدرج)	الشبكات العميقة مع sigmoid/tanh	استخدم ReLU أو batch normalization
Exploding gradients (انفجار التدرج)	تحديثات كبيرة أثناء التدريب	Gradient clipping
Slow convergence (بطء التقارب)	معدل تعلم (learning rate) سيئ	استخدم محسنات تكيفية (adaptive optimizers) مثل Adam
Data imbalance (عدم توازن البيانات)	توزيع غير متساوٍ للفئات	استخدم weighted loss أو data augmentation

خطوة بخطوة: بناء شبكة عصبية من الصفر

لنقم ببناء شبكة عصبية بسيطة باستخدام NumPy فقط لفهم الرياضيات التي تجري خلف الكواليس.

import numpy as np

# Initialize parameters
def initialize_parameters(input_dim, hidden_dim, output_dim):
    np.random.seed(42)
    W1 = np.random.randn(hidden_dim, input_dim) * 0.01
    b1 = np.zeros((hidden_dim, 1))
    W2 = np.random.randn(output_dim, hidden_dim) * 0.01
    b2 = np.zeros((output_dim, 1))
    return W1, b1, W2, b2

# Activation functions
def relu(Z):
    return np.maximum(0, Z)

def softmax(Z):
    expZ = np.exp(Z - np.max(Z))
    return expZ / expZ.sum(axis=0, keepdims=True)

# Forward propagation
def forward(X, W1, b1, W2, b2):
    Z1 = np.dot(W1, X) + b1
    A1 = relu(Z1)
    Z2 = np.dot(W2, A1) + b2
    A2 = softmax(Z2)
    return A1, A2

يساعدك هذا التنفيذ البسيط على فهم ما تقوم أطر العمل مثل PyTorch أو TensorFlow بأتمتته خلف الكواليس.

الأخطاء الشائعة التي يقع فيها الجميع

تخطي تطبيع البيانات (data normalization) – الشبكات العصبية حساسة لمقياس المدخلات.
استخدام طبقات كثيرة جداً في وقت مبكر جداً – ابدأ صغيراً؛ فالأعمق ليس دائماً الأفضل.
تجاهل خسارة التحقق (validation loss) – راقب دائماً مقاييس التدريب والتحقق معاً.
عدم ضبط البذور العشوائية (random seeds) – قابلية إعادة الإنتاج مهمة لتصحيح الأخطاء.
نسيان خلط البيانات (shuffle) – يمنع التحيز في تحديثات التدرج.

اختبار ومراقبة نماذج التعلم العميق

استراتيجيات الاختبار

اختبارات الوحدة (Unit tests) لمعالجة البيانات مسبقاً ووظائف النموذج
اختبارات التكامل (Integration tests) لخطوط الأنابيب (pipelines) من البداية للنهاية
اختبارات التراجع (Regression tests) لضمان أن تحديثات النموذج لا تضعف الأداء

المراقبة في بيئة الإنتاج

تتبع مقاييس مثل الدقة (accuracy)، والإحكام (precision)، والاستدعاء (recall)
مراقبة انزياح البيانات (data drift) — تغير توزيعات المدخلات بمرور الوقت
استخدام أطر عمل التسجيل (logging) لالتقاط زمن انتقال الاستنتاج (inference latency) والأخطاء

الاعتبارات الأمنية

يمكن أن تكون أنظمة التعلم العميق عرضة لـ:

الهجمات العدائية (Adversarial attacks): اضطرابات صغيرة في المدخلات تسبب تصنيفاً خاطئاً
تسميم البيانات (Data poisoning): بيانات خبيثة يتم حقنها في مجموعات التدريب
انعكاس النموذج (Model inversion): استخراج بيانات تدريب حساسة من النماذج

تشمل استراتيجيات التخفيف التحقق من صحة المدخلات، والتدريب العدائي، وتقنيات الخصوصية التفاضلية.

رؤى حول القابلية للتوسع

يتوسع التعلم العميق بشكل جيد مع البيانات والحوسبة، ولكن مع وجود مقايضات:

التوسع الأفقي (Horizontal scaling): توزيع التدريب عبر عدة وحدات معالجة رسومية (GPUs) أو عقد
ضبط حجم الدفعة (Batch size tuning): الدفعات الأكبر تحسن الإنتاجية ولكن قد تقلل من القدرة على التعميم
التدريب بدقة مختلطة (Mixed precision training): يسرع الحوسبة مع حد أدنى من فقدان الدقة

أطر عمل مثل PyTorch Lightning (المستخدمة في دورة Lightning AI⁴) تبسط إعدادات التدريب الموزع.

دليل استكشاف الأخطاء وإصلاحها

العرض	السبب المرجح	الإصلاح
الخسارة (Loss) لا تنقص	معدل التعلم مرتفع/منخفض جداً	اضبط جدول معدل التعلم
النموذج يتوقع نفس الفئة دائماً	عدم توازن البيانات أو خلايا عصبية ميتة	افحص مجموعة البيانات، استخدم ReLU
تجاوز ذاكرة الـ GPU	حجم الدفعة كبير جداً	قلل حجم الدفعة أو استخدم تراكم التدرج (gradient accumulation)
دقة التحقق تنخفض	Overfitting (فرط تخصيص)	أضف dropout أو توقف مبكر (early stopping)

تحدَّ نفسك

قم بعمل clone لمستودع Lightning-AI/dl-fundamentals.
قم بتشغيل دفاتر الملاحظات (notebooks) المقدمة لتدريب أول شبكة عصبية لك.
قم بتعديل البنية — أضف طبقة مخفية أو غير وظائف التنشيط.
لاحظ كيف تتغير الدقة والخسارة.

أهم النقاط المستفادة

التعلم العميق يدور حول بناء شبكات عصبية ذات طبقات تتعلم مباشرة من البيانات الخام — مما يؤدي إلى أتمتة استخراج الميزات وتحقيق أداء متطور في المهام المعقدة.

يتفوق مع مجموعات البيانات الكبيرة والبيانات عالية الأبعاد.

يتطلب ضبطاً دقيقاً، ومراقبة، وموارد حوسبة.

فهم الأساسيات — الطبقات، والتنشيط، والخسارة، والتحسين — هو الأساس لإتقان البنيات المتقدمة.

الخطوات التالية والقراءات الإضافية

freeCodeCamp – دليل أساسيات التعلم العميق: https://www.freecodecamp.org/news/deep-learning-fundamentals-handbook-start-a-career-in-ai/ ↩ ↩² ↩³ ↩⁴ ↩⁵
IBM – نظرة عامة على التعلم العميق: https://www.ibm.com/think/topics/deep-learning ↩ ↩² ↩³ ↩⁴
GeeksforGeeks – مقدمة في التعلم العميق: https://www.geeksforgeeks.org/deep-learning/introduction-deep-learning/ ↩ ↩²
Lightning AI – دورة أساسيات التعلم العميق: https://lightning.ai/pages/courses/deep-learning-fundamentals/ ↩ ↩² ↩³
Cognitive Class – مقدمة في التعلم العميق: https://cognitiveclass.ai/courses/introduction-deep-learning ↩ ↩²
GitHub – Lightning-AI/dl-fundamentals: https://GitHub.com/Lightning-AI/dl-fundamentals ↩
deeplizard – قائمة تشغيل أساسيات التعلم العميق: https://deeplizard.com/learn/playlist/PLZbbT5o_s2xq7LwI2y8_QtvuXZedL6tQU ↩

الأسئلة الشائعة

لا. التعلم العميق هو جزء فرعي من تعلم الآلة، والذي بدوره جزء فرعي من الذكاء الاصطناعي. 1