W&B Weave للتقييم

مقدمة W&B Weave

3 دقيقة للقراءة

W&B Weave هو إطار Weights & Biases لبناء وتقييم والتكرار على تطبيقات LLM. يؤكد على التطوير المبني على التقييم وتتبع التجارب السلس.

ما هو Weave؟

Weave يوفر:

الميزةالوصف
التتبعالتسجيل التلقائي لاستدعاءات LLM والسلاسل
التقييمإطار تقييم مدمج مع مسجلين
الإصدارتتبع التغييرات في الموجهات والنماذج والبيانات
التصورواجهة تفاعلية لاستكشاف النتائج

لماذا Weave؟

Weave مصمم حول مبدأ التطوير المبني على التقييم:

  1. اكتب التقييمات أولاً
  2. شغّل التجارب مقابل التقييمات
  3. كرر بناءً على النتائج
  4. تتبع التحسينات عبر الزمن

التثبيت

pip install weave openai

البداية السريعة

هيئ Weave وابدأ التتبع:

import weave
from openai import OpenAI

# هيئ Weave مع مشروعك
weave.init('my-team/my-llm-project')

client = OpenAI()

# جميع استدعاءات OpenAI تُتتبع تلقائياً الآن
response = client.chat.completions.create(
    model="gpt-5.4-mini",
    messages=[{"role": "user", "content": "مرحباً، عالم!"}]
)

مُزخرِف @weave.op()

تتبع أي دالة مع مُزخرِف @weave.op():

import weave

weave.init('my-team/my-project')

@weave.op()
def generate_summary(text: str) -> str:
    """لخّص النص المُعطى."""
    response = client.chat.completions.create(
        model="gpt-5.4-mini",
        messages=[
            {"role": "system", "content": "لخّص النص التالي بإيجاز."},
            {"role": "user", "content": text}
        ]
    )
    return response.choices[0].message.content

# كل استدعاء يُتتبع مع المدخلات والمخرجات
summary = generate_summary("نص مقال طويل هنا...")

هيكل التتبع

Weave ينشئ تتبعات هرمية:

استدعاء دالة @weave.op()
├── Input: معاملات الدالة
├── Output: القيمة المُرجعة
├── Duration: وقت التنفيذ
├── Cost: استخدام التوكنات (إذا كان متاحاً)
└── Nested calls: العمليات الفرعية

عرض التتبعات

الوصول إلى تتبعاتك في واجهة W&B:

  1. اذهب إلى wandb.ai
  2. انتقل إلى مشروعك
  3. اختر تبويب Weave
  4. تصفح التتبعات، صفّي، وحلل

تنظيم المشروع

هيكل مشاريع Weave الخاصة بك:

my-team/
├── support-bot/          # روبوت دعم الإنتاج
│   ├── traces
│   ├── evaluations
│   └── experiments
├── content-generator/    # خط أنابيب توليد المحتوى
│   ├── traces
│   └── evaluations
└── rag-system/          # تطبيق RAG
    ├── traces
    └── evaluations

المصادقة

عيّن مفتاح API الخاص بـ W&B:

export WANDB_API_KEY=your-api-key

أو سجّل الدخول تفاعلياً:

wandb login

المفاهيم الرئيسية

المفهومالوصف
Opدالة مُتتبعة مُزخرَفة بـ @weave.op()
Traceتنفيذ مُسجل لـ op مع جميع البيانات
Evaluationمجموعة حالات اختبار مع مسجلين
Modelإعداد LLM مُصدَّر

نصيحة: ابدأ بإضافة @weave.op() لدوال LLM الرئيسية. يمكنك إضافة تتبع أكثر تفصيلاً لاحقاً.

التالي، سنتعلم كيفية إعداد خطوط أنابيب التقييم في Weave. :::

مراجعة سريعة: كيف تجد هذا الدرس؟

اختبار

الوحدة 5: W&B Weave للتقييم

خذ الاختبار
نشرة أسبوعية مجانية

ابقَ على مسار النيرد

بريد واحد أسبوعياً — دورات، مقالات معمّقة، أدوات، وتجارب ذكاء اصطناعي.

بدون إزعاج. إلغاء الاشتراك في أي وقت.