W&B Weave للتقييم

مقدمة W&B Weave

3 دقيقة للقراءة

W&B Weave هو إطار Weights & Biases لبناء وتقييم والتكرار على تطبيقات LLM. يؤكد على التطوير المبني على التقييم وتتبع التجارب السلس.

ما هو Weave؟

Weave يوفر:

الميزة الوصف
التتبع التسجيل التلقائي لاستدعاءات LLM والسلاسل
التقييم إطار تقييم مدمج مع مسجلين
الإصدار تتبع التغييرات في الموجهات والنماذج والبيانات
التصور واجهة تفاعلية لاستكشاف النتائج

لماذا Weave؟

Weave مصمم حول مبدأ التطوير المبني على التقييم:

  1. اكتب التقييمات أولاً
  2. شغّل التجارب مقابل التقييمات
  3. كرر بناءً على النتائج
  4. تتبع التحسينات عبر الزمن

التثبيت

pip install weave openai

البداية السريعة

هيئ Weave وابدأ التتبع:

import weave
from openai import OpenAI

# هيئ Weave مع مشروعك
weave.init('my-team/my-llm-project')

client = OpenAI()

# جميع استدعاءات OpenAI تُتتبع تلقائياً الآن
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "مرحباً، عالم!"}]
)

مُزخرِف @weave.op()

تتبع أي دالة مع مُزخرِف @weave.op():

import weave

weave.init('my-team/my-project')

@weave.op()
def generate_summary(text: str) -> str:
    """لخّص النص المُعطى."""
    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[
            {"role": "system", "content": "لخّص النص التالي بإيجاز."},
            {"role": "user", "content": text}
        ]
    )
    return response.choices[0].message.content

# كل استدعاء يُتتبع مع المدخلات والمخرجات
summary = generate_summary("نص مقال طويل هنا...")

هيكل التتبع

Weave ينشئ تتبعات هرمية:

استدعاء دالة @weave.op()
├── Input: معاملات الدالة
├── Output: القيمة المُرجعة
├── Duration: وقت التنفيذ
├── Cost: استخدام التوكنات (إذا كان متاحاً)
└── Nested calls: العمليات الفرعية

عرض التتبعات

الوصول إلى تتبعاتك في واجهة W&B:

  1. اذهب إلى wandb.ai
  2. انتقل إلى مشروعك
  3. اختر تبويب Weave
  4. تصفح التتبعات، صفّي، وحلل

تنظيم المشروع

هيكل مشاريع Weave الخاصة بك:

my-team/
├── support-bot/          # روبوت دعم الإنتاج
│   ├── traces
│   ├── evaluations
│   └── experiments
├── content-generator/    # خط أنابيب توليد المحتوى
│   ├── traces
│   └── evaluations
└── rag-system/          # تطبيق RAG
    ├── traces
    └── evaluations

المصادقة

عيّن مفتاح API الخاص بـ W&B:

export WANDB_API_KEY=your-api-key

أو سجّل الدخول تفاعلياً:

wandb login

المفاهيم الرئيسية

المفهوم الوصف
Op دالة مُتتبعة مُزخرَفة بـ @weave.op()
Trace تنفيذ مُسجل لـ op مع جميع البيانات
Evaluation مجموعة حالات اختبار مع مسجلين
Model إعداد LLM مُصدَّر

نصيحة: ابدأ بإضافة @weave.op() لدوال LLM الرئيسية. يمكنك إضافة تتبع أكثر تفصيلاً لاحقاً.

التالي، سنتعلم كيفية إعداد خطوط أنابيب التقييم في Weave. :::

اختبار

الوحدة 5: W&B Weave للتقييم

خذ الاختبار