الدرس 5 من 6

مفردات أخلاقيات البيانات والخصوصية والتحيز

مفردات أخلاقيات البيانات والخصوصية والتحيز

8 دقيقة للقراءة

مع تزايد تأثير علم البيانات في صنع القرار، أصبحت المفردات المتعلقة بالأخلاقيات والخصوصية والتحيز ضرورية لكل عالم بيانات. يغطي هذا الدرس المصطلحات التي تحتاجها للمشاركة في هذه المحادثات المهمة.

مفردات GDPR وخصوصية البيانات

مصطلحات GDPR الأساسية

المصطلح المعنى مثال على الاستخدام
Data subject (صاحب البيانات) الفرد الذي يتم جمع أو معالجة بياناته "The data subject has the right to access their personal data."
Personal data (البيانات الشخصية) أي معلومة يمكنها تحديد شخص معين "Email addresses and IP addresses are personal data."
PII (معلومات التعريف الشخصية) بيانات تُحدد هوية الفرد مباشرة "Names and social security numbers are PII."
Consent (الموافقة) إذن صريح من صاحب البيانات لمعالجة بياناته "We need user consent before collecting data."
Data controller (متحكم البيانات) المنظمة التي تقرر لماذا وكيف تُعالج البيانات "As the data controller, we determine what data to collect."
Data processor (معالج البيانات) المنظمة التي تعالج البيانات نيابة عن المتحكم "Our cloud provider is a data processor."
Right to erasure (الحق في المحو) الحق في حذف جميع البيانات الشخصية بشكل دائم "A user exercised their right to erasure."
Data breach (خرق البيانات) وصول غير مصرح به أو إفشاء للبيانات الشخصية "We must report the breach within 72 hours."
Data minimization (تقليل البيانات) جمع البيانات الضرورية فقط للغرض المحدد "Following data minimization, we only collect what's needed."
Data retention (الاحتفاظ بالبيانات) مدة الاحتفاظ بالبيانات قبل حذفها "Our data retention policy: delete after 2 years of inactivity."

إخفاء الهوية مقابل الترميز المستعار

المفهوم كيف يعمل حالة GDPR قابل للعكس؟
Anonymization (إخفاء الهوية) يزيل بشكل دائم جميع المعلومات التعريفية لا يخضع لـ GDPR لا — لا رجعة فيه
Pseudonymization (الترميز المستعار) يستبدل المعرّفات بأكواد أو قيم مُجزّأة لا يزال يخضع لـ GDPR نعم — بالمفتاح

مفردات التحيز

أنواع التحيز

نوع التحيز التعريف مثال
Selection bias (تحيز الاختيار) عندما لا تمثل العينة المجتمع "Our survey only reached smartphone users."
Confirmation bias (تحيز التأكيد) البحث عن بيانات تدعم اعتقاداً موجوداً "We only analyzed metrics that confirmed our hypothesis."
Survivorship bias (تحيز البقاء) تحليل النجاحات فقط وتجاهل الإخفاقات "We studied successful startups but not why others failed."
Sampling bias (تحيز العينة) عندما تكون بعض المجموعات ممثلة بشكل زائد أو ناقص "90% male applicants in training data."
Algorithmic bias (التحيز الخوارزمي) عندما ينتج النموذج بشكل منهجي نتائج غير عادلة "The model scores certain neighborhoods lower."
Historical bias (التحيز التاريخي) عندما تعكس البيانات السابقة تفاوتات مجتمعية "Historical hiring data reflects past discrimination."
Proxy discrimination (التمييز بالوكالة) عندما يعمل متغير محايد كبديل لخاصية محمية "Zip code serves as a proxy for race."

مقاييس العدالة

المقياس التعريف
Demographic parity (التكافؤ الديموغرافي) معدل التنبؤ الإيجابي يجب أن يكون متساوياً عبر جميع المجموعات
Equalized odds (الاحتمالات المتساوية) معدل الإيجابيات والسلبيات الحقيقية يجب أن يكون متساوياً
Equal opportunity (تكافؤ الفرص) معدل الإيجابيات الحقيقية يجب أن يكون متساوياً عبر المجموعات
Disparate impact (التأثير المتباين) نسبة النتائج الإيجابية للأقلية مقابل الأغلبية (قاعدة 80%)

مفردات الذكاء الاصطناعي المسؤول

المبدأ المعنى مثال
Explainability (قابلية التفسير) القدرة على شرح كيف ولماذا يتخذ النموذج قرارات "We use SHAP values for explainability."
Transparency (الشفافية) الانفتاح حول البيانات المستخدمة وكيفية عمل النماذج "Our model card documents everything."
Accountability (المساءلة) وجود ملكية واضحة لقرارات الذكاء الاصطناعي ونتائجها "The data science team is accountable for fairness."
Fairness (العدالة) ضمان عدم تمييز أنظمة الذكاء الاصطناعي ضد أي مجموعة "We run fairness checks before deployment."
Privacy by design (الخصوصية بالتصميم) بناء حماية الخصوصية في الأنظمة من البداية "Personal data is encrypted at rest and in transit."
Human-in-the-loop (إنسان في الحلقة) الحفاظ على الرقابة البشرية في صنع قرار الذكاء الاصطناعي "For high-stakes decisions, we keep a human in the loop."
Auditability (القابلية للتدقيق) القدرة على مراجعة قرارات نظام الذكاء الاصطناعي بعد الحقيقة "Every prediction is logged for auditability."

عبارات لمناقشة الأخلاقيات

"We need to audit the training data for representation bias."
نحتاج تدقيق بيانات التدريب للتحقق من تحيز التمثيل

"I have concerns about using zip code as a feature —
it could serve as a proxy for race."
لدي مخاوف بشأن استخدام الرمز البريدي كميزة —
قد يعمل كوكيل للعرق

"We should implement guardrails — if the model's confidence
is below 70%, route to human review."
يجب تطبيق حواجز حماية — إذا كانت ثقة النموذج أقل من 70%
يُحال للمراجعة البشرية

"Who is accountable if the model makes a wrong prediction?"
من المسؤول إذا أخطأ النموذج في التنبؤ؟

مفردات حوكمة البيانات

المصطلح المعنى
Data governance (حوكمة البيانات) إطار السياسات والعمليات لإدارة أصول البيانات
Data steward (أمين البيانات) الشخص المسؤول عن جودة البيانات والامتثال في مجال محدد
Data catalog (كتالوج البيانات) جرد مركزي لجميع أصول البيانات في المنظمة
Access control (التحكم في الوصول) قواعد تحدد من يمكنه قراءة أو تعديل البيانات
Data classification (تصنيف البيانات) تصنيف البيانات حسب مستوى الحساسية (عام، داخلي، سري، مقيد)
Audit trail (مسار التدقيق) سجل زمني لمن وصل أو عدّل البيانات
Data sovereignty (سيادة البيانات) قوانين تتطلب تخزين البيانات في البلد الذي جُمعت فيه

النقاط الرئيسية

  1. اعرف الفرق بين إخفاء الهوية (لا رجعة فيه) والترميز المستعار (قابل للعكس)
  2. تقليل البيانات — اجمع فقط ما تحتاجه
  3. دقق التحيز قبل النشر وليس بعده
  4. قابلية التفسير ليست اختيارية للقرارات عالية المخاطر
  5. وثّق كل شيء — بطاقات النماذج ونسب البيانات والتقييمات الأخلاقية

التالي: كتابة تقارير التحليل وتوثيق البيانات

:::

اختبار

اختبار مفردات أخلاقيات البيانات والخصوصية والتحيز

خذ الاختبار