مفردات جودة البيانات والحوكمة والامتثال
مفردات جودة البيانات والحوكمة والامتثال
8 دقيقة للقراءة
مهندسو البيانات مسؤولون بشكل متزايد عن جودة البيانات والحوكمة والامتثال التنظيمي. هذا الدرس يغطي المصطلحات الأساسية.
أبعاد جودة البيانات
| البُعد | التعريف | مثال |
|---|---|---|
| Accuracy (الدقة) | البيانات تمثل الكيان الحقيقي بشكل صحيح | بريد العميل يطابق بريده الفعلي |
| Completeness (الاكتمال) | كل البيانات المتوقعة موجودة | 98% من سجلات الطلبات تحتوي عنوان الشحن |
| Consistency (الاتساق) | نفس البيانات تتطابق عبر الأنظمة | اسم العميل في CRM يطابق الفوترة |
| Timeliness (التوقيت) | البيانات متاحة عند الحاجة | بيانات لوحة المتابعة لا تتجاوز 15 دقيقة |
| Validity (الصلاحية) | البيانات تتوافق مع القواعد المحددة | حقل البريد يحتوي تنسيق بريد صالح |
| Uniqueness (التفرد) | لا توجد سجلات مكررة | كل عميل يظهر مرة واحدة فقط |
مصطلحات الحوكمة
| المصطلح | التعريف |
|---|---|
| Data steward (أمين البيانات) | الإدارة اليومية لجودة ومعايير البيانات لنطاق معين |
| Data owner (مالك البيانات) | قائد الأعمال المسؤول عن البيانات في نطاقه |
| Data catalog (كتالوج البيانات) | جرد قابل للبحث لجميع أصول البيانات |
| Data lineage (سلالة البيانات) | التاريخ الكامل للبيانات — من أين جاءت وكيف تحولت |
| Data classification (تصنيف البيانات) | تصنيف البيانات حسب مستوى الحساسية |
| Golden record (السجل الذهبي) | النسخة الموثوقة الوحيدة بعد إزالة التكرار |
مصطلحات الامتثال (GDPR)
| المصطلح | التعريف |
|---|---|
| PII | معلومات التعريف الشخصي — بيانات يمكنها تحديد شخص |
| Right to erasure (حق المحو) | حق الشخص في حذف بياناته |
| Data retention (الاحتفاظ بالبيانات) | قواعد حول مدة الاحتفاظ بالبيانات |
| Anonymization (إخفاء الهوية) | إزالة المعلومات التعريفية بشكل لا رجعة فيه |
| Pseudonymization (الترميز المستعار) | استبدال الحقول التعريفية بمعرفات اصطناعية (قابل للعكس) |
| Data masking (إخفاء البيانات) | إخفاء أجزاء من البيانات (مثل آخر 4 أرقام من البطاقة) |
| Encryption at rest (التشفير في السكون) | تشفير البيانات أثناء التخزين |
عبارات الامتثال الشائعة
"This table contains PII — we need column-level encryption."
هذا الجدول يحتوي PII — نحتاج تشفير على مستوى العمود
"The retention policy requires deletion after 24 months."
سياسة الاحتفاظ تتطلب الحذف بعد 24 شهراً
"We received a right-to-erasure request."
تلقينا طلب حق محو
عقود البيانات
| العنصر | التعريف |
|---|---|
| Schema contract | أسماء الحقول والأنواع والقيود المتفق عليها |
| Quality contract | الحد الأدنى لعتبات الجودة |
| Freshness contract | الحد الأقصى المقبول لعمر البيانات |
| Volume contract | نطاق عدد السجلات المتوقع |
مراقبة البيانات
| المصطلح | التعريف |
|---|---|
| Data observability (مراقبة البيانات) | مراقبة صحة البيانات عبر المسار بالكامل |
| Anomaly detection (كشف الشذوذ) | تحديد الأنماط غير العادية تلقائياً |
| Schema drift (انحراف المخطط) | تغييرات غير مخططة في هيكل البيانات |
| Volume anomaly (شذوذ الحجم) | زيادة أو نقصان غير متوقع في عدد السجلات |
التالي: كتابة توثيق المسارات ومواصفات البيانات
:::