يقضي مهندسو البيانات جزءاً كبيراً من وقتهم في قراءة التوثيق. هذا الدرس يعلمك كيفية فك رموز الإنجليزية المستخدمة في هذه الوثائق.
| الطبقة |
تُسمى أيضاً |
الغرض |
| Source Layer |
المنبع |
مصدر البيانات (قواعد بيانات، واجهات برمجة، ملفات) |
| Ingestion Layer |
طبقة الاستيعاب |
جلب البيانات إلى المنصة |
| Raw Zone |
المنطقة الخام، الطبقة البرونزية |
تخزين البيانات كما هي بدون تحويل |
| Transformation Layer |
طبقة المعالجة |
تنظيف وتحقق وإثراء وإعادة تشكيل البيانات |
| Curated Zone |
الطبقة الذهبية |
بيانات نظيفة جاهزة للأعمال |
| Serving Layer |
طبقة الاستهلاك |
حيث تصل أدوات التقارير والتطبيقات للبيانات |
Bronze (برونزي) → بيانات خام كما وردت
Silver (فضي) → بيانات منظفة ومتحقق منها
Gold (ذهبي) → بيانات منمذجة جاهزة للأعمال
| المصطلح |
المعنى |
| DataFrame |
مجموعة موزعة من الصفوف بأعمدة مسماة |
| Partition |
جزء من البيانات يعالجه نواة منفذ واحد |
| Shuffle |
إعادة توزيع البيانات عبر الأقسام (مكلف) |
| Broadcast |
إرسال مجموعة بيانات صغيرة لجميع المنفذين |
| Lazy evaluation |
التحويلات لا تُنفذ حتى يُستدعى إجراء |
| Spill |
تجاوز الذاكرة والكتابة على القرص |
| المصطلح |
المعنى |
| Topic |
تدفق مسمى من السجلات (مثل قناة) |
| Partition |
تدفق فرعي مرتب داخل الموضوع للتوازي |
| Offset |
معرف تسلسلي لكل سجل داخل القسم |
| Consumer group |
مجموعة مستهلكين تتعاون لقراءة موضوع |
| Lag |
كم تأخر المستهلك عن آخر رسالة |
| Replication factor |
عدد نسخ كل قسم عبر الوسطاء |
| المصطلح |
المعنى |
| DAG |
تعريف المسار بالمهام والتبعيات |
| Operator |
نوع العمل الذي تؤديه المهمة |
| Sensor |
مشغل خاص ينتظر شرط خارجي |
| Backfill |
تشغيل DAG لتواريخ تاريخية فائتة |
| XCom |
تمرير بيانات صغيرة بين المهام |
| الخدمة |
المصطلح |
المعنى |
| BigQuery |
Slot |
وحدة سعة حوسبية لتشغيل الاستعلامات |
| Redshift |
Distribution key |
يحدد كيفية توزيع الصفوف عبر العقد |
| Snowflake |
Virtual warehouse |
مجموعة حوسبة لتشغيل الاستعلامات |
| Snowflake |
Time travel |
استعلام البيانات كما كانت في وقت سابق |
| Databricks |
Delta table |
تنسيق جدول يضيف معاملات ACID لملفات بحيرة البيانات |
| المصطلح |
المعنى |
| SLA |
اتفاقية مستوى الخدمة — التزام رسمي |
| SLO |
هدف مستوى الخدمة — هدف داخلي |
| SLI |
مؤشر مستوى الخدمة — المقياس المستخدم |
| Freshness |
مدى حداثة البيانات |
| P99 latency |
99% من التشغيلات تكتمل أسرع من هذا الوقت |
التالي: شرح البنية التحتية للبيانات لأصحاب المصلحة غير التقنيين
:::