فهم جودة البيانات
الأبعاد الستة لجودة البيانات
ليست كل البيانات متساوية. يحدد إطار DAMA (جمعية إدارة البيانات) ستة أبعاد تحدد ما إذا كانت البيانات صالحة للاستخدام. فهم هذه الأبعاد يساعدك على اكتشاف المشكلات قبل أن تؤدي لقرارات سيئة.
إطار DAMA
| البُعد | السؤال الذي يجيب عنه |
|---|---|
| الدقة | هل تمثل هذه البيانات الواقع بشكل صحيح؟ |
| الاكتمال | هل جميع القيم المطلوبة موجودة؟ |
| الاتساق | هل تتطابق البيانات عبر جميع الأنظمة؟ |
| التوقيت | هل البيانات حديثة بما يكفي لاحتياجاتي؟ |
| التفرد | هل هناك سجلات مكررة؟ |
| الصلاحية | هل تتوافق البيانات مع الصيغ والقواعد المتوقعة؟ |
البُعد 1: الدقة
التعريف: البيانات تمثل بشكل صحيح الكيان أو الحدث الواقعي الذي تصفه.
مثال تجاري:
- ✅ عنوان العميل يطابق موقعه الفعلي
- ❌ بريد العميل الإلكتروني يرتد لأنه أُدخل بشكل خاطئ
علامات التحذير:
- بريد مُرتجع أو رسائل إلكترونية مرتدة
- العملاء يشكون من معلومات خاطئة
- أرقام لا تتطابق مع المستندات المصدر
كيفية الفحص: تحقق من عينة من السجلات مقابل المستندات المصدر أو تأكيد من الواقع.
البُعد 2: الاكتمال
التعريف: جميع البيانات المطلوبة موجودة—لا قيم مفقودة في الحقول الحرجة.
مثال تجاري:
- ✅ كل طلب يحتوي على عنوان الشحن ومعلومات الاتصال وتفاصيل الدفع
- ❌ 20% من سجلات العملاء تفتقد أرقام الهاتف
علامات التحذير:
- حقول فارغة في أعمدة مطلوبة
- نص "غير متاح" أو بديل في حقول مهمة
- تقارير تظهر فئات "غير معروفة"
حساب بسيط:
الاكتمال = (السجلات بجميع الحقول المطلوبة / إجمالي السجلات) × 100%
مثال: 950 مكتملة من 1,000 = 95% اكتمال
البُعد 3: الاتساق
التعريف: نفس البيانات تظهر بنفس الطريقة عبر جميع الأنظمة.
مثال تجاري:
- ✅ اسم العميل في CRM يطابق الاسم في نظام الفوترة
- ❌ المبيعات تقول "شركة أكمي" لكن المالية تقول "مؤسسة ACME"
علامات التحذير:
- إجماليات مختلفة في تقارير مختلفة لنفس المقياس
- اختلافات في الأسماء/العناوين عبر الأنظمة
- معلومات متناقضة عند دمج مجموعات البيانات
البُعد 4: التوقيت
التعريف: البيانات حديثة بما يكفي لتكون مفيدة لغرضها المقصود.
مثال تجاري:
- ✅ عدد المخزون محدث اليوم لقرارات التنفيذ
- ❌ استخدام قائمة العملاء من الشهر الماضي لحملة حساسة للوقت
علامات التحذير:
- طوابع زمنية قديمة على سجلات حرجة
- قرارات مبنية على "آخر مرة تحققنا"
- تقارير قديمة تُعامل على أنها حالية
السؤال الرئيسي: ما مدى حداثة البيانات التي أحتاجها لقراري؟
البُعد 5: التفرد
التعريف: كل كيان واقعي يُمثَّل مرة واحدة فقط—لا سجلات مكررة.
مثال تجاري:
- ✅ سجل عميل واحد لكل عميل
- ❌ "أحمد محمد" يظهر ثلاث مرات بمعلومات اتصال مختلفة
علامات التحذير:
- العميل يتلقى نسخًا متعددة من نفس البريد
- إجماليات تبدو أعلى من المتوقع
- معلومات متناقضة لنفس الكيان
البُعد 6: الصلاحية
التعريف: البيانات تتوافق مع قواعد العمل والصيغ المحددة.
مثال تجاري:
- ✅ عناوين البريد الإلكتروني تحتوي "@" ونطاق
- ❌ حقل العمر يحتوي "اثنان وثلاثون" بدلاً من "32"
علامات التحذير:
- صيغ غير صالحة (أرقام هاتف بحروف)
- قيم خارج النطاقات المقبولة (العمر = -5)
- تواريخ بصيغ غير متسقة (12/01/2025 مقابل 2025-01-12)
بطاقة مرجعية سريعة
| البُعد | افحص بالبحث عن |
|---|---|
| الدقة | التحقق مقابل المصدر |
| الاكتمال | قيم مفقودة، حقول فارغة |
| الاتساق | عدم تطابق عبر الأنظمة |
| التوقيت | طوابع زمنية قديمة، بيانات عتيقة |
| التفرد | سجلات مكررة |
| الصلاحية | أخطاء صيغة، انتهاكات قواعد |
تذكر: جودة البيانات الضعيفة لها تكلفة حقيقية. تخسر الشركات معدل 43 ساعة لكل موظف سنويًا بسبب مشكلات البيانات.
التالي: تعلم اكتشاف مشكلات البيانات الشائعة التي تشير لمشكلات جودة. :::