يقرأ علماء البيانات باستمرار أوراق بحثية وتوثيق مكتبات ومخرجات إحصائية. يعلمك هذا الدرس المفردات والاستراتيجيات للتنقل في هذه المواد بكفاءة.
| القسم |
الغرض |
ما تبحث عنه |
| Abstract (الملخص) |
موجز من 150-300 كلمة للورقة بأكملها |
الادعاء الرئيسي والنتائج الرئيسية |
| Introduction (المقدمة) |
تشرح المشكلة وأهميتها |
الفجوة البحثية والدافع والمساهمات |
| Related Work (الأعمال ذات الصلة) |
تستعرض المقاربات الموجودة |
كيف تختلف هذه الورقة عن الطرق السابقة |
| Methodology (المنهجية) |
تصف المقاربة المقترحة بالتفصيل |
بنية النموذج والخوارزمية والافتراضات |
| Results (النتائج) |
تعرض النتائج بجداول وأشكال |
أرقام الأداء والمقارنات مع خطوط الأساس |
| Discussion (المناقشة) |
تفسر النتائج وتعترف بالقيود |
لماذا تعمل الطريقة ومتى قد تفشل |
| Conclusion (الخاتمة) |
تلخص المساهمات وتقترح عملاً مستقبلياً |
النقاط الرئيسية والمشاكل المفتوحة |
| العبارة |
المعنى |
مستوى الثقة |
| "We demonstrate that..." |
إثبات قوي بأدلة |
عالي |
| "Our results show that..." |
أدلة واضحة من التجارب |
عالي |
| "We observe that..." |
الإبلاغ عما وُجد في البيانات |
متوسط-عالي |
| "The results suggest that..." |
الأدلة تشير في هذا الاتجاه |
متوسط |
| "We hypothesize that..." |
تخمين مدروس يحتاج اختباراً |
منخفض |
| العبارة |
ماذا تعني |
| "Our method outperforms the baseline" |
طريقتنا أفضل من النموذج المرجعي |
| "We achieve state-of-the-art results" |
نتائجنا الأفضل المُبلغ عنها حتى الآن |
| "Comparable to previous work" |
نتائجنا مماثلة (ليست بالضرورة أفضل) |
| "We improve upon [method] by X%" |
نحصل على نتائج أفضل بنسبة X% |
| العبارة |
ماذا تعني |
| "This approach has limitations" |
هناك نقاط ضعف معروفة |
| "Further investigation is needed" |
لم نحل المشكلة بالكامل |
| "Beyond the scope of this paper" |
لم نتناول هذا عمداً |
DataFrame.groupby(by=None, axis=0, level=None, sort=True, dropna=True)
كيفية قراءته:
by=None — الأعمدة للتجميع حسبها؛ None هي القيمة الافتراضية
axis=0 — تطبيق على الصفوف (0) أو الأعمدة (1)؛ الافتراضي هو الصفوف
sort=True — النتائج مرتبة افتراضياً
dropna=True — القيم المفقودة مستبعدة افتراضياً
| المصطلح |
المعنى |
| Parameters (المعاملات) |
القيم المُدخلة التي تقبلها الدالة |
| Returns (القيم المُرجعة) |
ما تُرجعه الدالة |
| Raises (الأخطاء) |
الأخطاء التي قد تطرحها الدالة |
| Deprecated (مُهمل) |
هذه الميزة ستُزال في إصدار مستقبلي |
| Examples (أمثلة) |
كود يوضح كيفية استخدام الدالة |
| الطريقة |
الغرض |
مثال |
.fit(X, y) |
تدريب النموذج على البيانات |
model.fit(X_train, y_train) |
.predict(X) |
إجراء تنبؤات بالنموذج المُدرّب |
predictions = model.predict(X_test) |
.transform(X) |
تحويل البيانات (تغيير المقياس، الترميز) |
X_scaled = scaler.transform(X_test) |
.fit_transform(X) |
التدريب والتحويل في خطوة واحدة |
X_scaled = scaler.fit_transform(X_train) |
.score(X, y) |
تقييم النموذج |
accuracy = model.score(X_test, y_test) |
| الرمز |
المعنى |
| * |
p < 0.05 (دال إحصائياً) |
| ** |
p < 0.01 (دال جداً) |
| *** |
p < 0.001 (دال بشكل عالي) |
| n.s. |
غير دال إحصائياً |
| ± |
زائد أو ناقص (يُظهر الانحراف المعياري) |
| الاختصار |
المصطلح الكامل |
| Acc. |
Accuracy (الدقة) |
| Prec. |
Precision (الضبط) |
| Rec. |
Recall (الاستدعاء) |
| Avg. |
Average (المتوسط) |
| Std. |
Standard deviation (الانحراف المعياري) |
| N |
Number of samples (عدد العينات) |
| w/ |
With (مع) |
| w/o |
Without (بدون) |
| vs. |
Versus (مقابل) |
| المصطلح |
المعنى |
| Cell (الخلية) |
كتلة واحدة من الكود أو النص في الدفتر |
| Code cell (خلية كود) |
خلية تحتوي كوداً قابلاً للتنفيذ |
| Markdown cell (خلية نص) |
خلية تحتوي نصاً منسقاً أو معادلات أو صوراً |
| Kernel (النواة) |
محرك الحوسبة الذي ينفذ الكود |
| Output (المخرجات) |
النتيجة المعروضة أسفل خلية الكود بعد التنفيذ |
"I read the paper on transformer architectures —
their main contribution is a new attention mechanism."
قرأت الورقة عن بُنى المحولات — مساهمتهم الرئيسية آلية انتباه جديدة
"The pandas documentation says groupby drops NaN values by default."
توثيق pandas يقول إن groupby يحذف قيم NaN افتراضياً
"According to the paper, their results are statistically significant
at p < 0.001."
وفقاً للورقة، نتائجهم ذات دلالة إحصائية عند p < 0.001
"The scikit-learn docs recommend using fit_transform on training data
but only transform on test data to avoid data leakage."
توثيق scikit-learn يوصي باستخدام fit_transform على بيانات التدريب
فقط transform على بيانات الاختبار لتجنب تسرب البيانات
- اقرأ الملخصات أولاً — تخبرك إذا كانت الورقة ذات صلة
- تعلم توقيعات الدوال — المعاملات والقيم الافتراضية وأنواع الإرجاع
- افهم رموز الدلالة — *، **، ***، n.s.
- القيم بخط عريض في الجداول عادةً تعني "أفضل نتيجة"
- انتبه للغة التحفظ — "suggests" أضعف من "demonstrates"
التالي: تقديم رؤى البيانات لجمهور غير تقني
:::