W&B Weave للتقييم
مقدمة W&B Weave
3 دقيقة للقراءة
W&B Weave هو إطار Weights & Biases لبناء وتقييم والتكرار على تطبيقات LLM. يؤكد على التطوير المبني على التقييم وتتبع التجارب السلس.
ما هو Weave؟
Weave يوفر:
| الميزة | الوصف |
|---|---|
| التتبع | التسجيل التلقائي لاستدعاءات LLM والسلاسل |
| التقييم | إطار تقييم مدمج مع مسجلين |
| الإصدار | تتبع التغييرات في الموجهات والنماذج والبيانات |
| التصور | واجهة تفاعلية لاستكشاف النتائج |
لماذا Weave؟
Weave مصمم حول مبدأ التطوير المبني على التقييم:
- اكتب التقييمات أولاً
- شغّل التجارب مقابل التقييمات
- كرر بناءً على النتائج
- تتبع التحسينات عبر الزمن
التثبيت
pip install weave openai
البداية السريعة
هيئ Weave وابدأ التتبع:
import weave
from openai import OpenAI
# هيئ Weave مع مشروعك
weave.init('my-team/my-llm-project')
client = OpenAI()
# جميع استدعاءات OpenAI تُتتبع تلقائياً الآن
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": "مرحباً، عالم!"}]
)
مُزخرِف @weave.op()
تتبع أي دالة مع مُزخرِف @weave.op():
import weave
weave.init('my-team/my-project')
@weave.op()
def generate_summary(text: str) -> str:
"""لخّص النص المُعطى."""
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[
{"role": "system", "content": "لخّص النص التالي بإيجاز."},
{"role": "user", "content": text}
]
)
return response.choices[0].message.content
# كل استدعاء يُتتبع مع المدخلات والمخرجات
summary = generate_summary("نص مقال طويل هنا...")
هيكل التتبع
Weave ينشئ تتبعات هرمية:
استدعاء دالة @weave.op()
├── Input: معاملات الدالة
├── Output: القيمة المُرجعة
├── Duration: وقت التنفيذ
├── Cost: استخدام التوكنات (إذا كان متاحاً)
└── Nested calls: العمليات الفرعية
عرض التتبعات
الوصول إلى تتبعاتك في واجهة W&B:
- اذهب إلى wandb.ai
- انتقل إلى مشروعك
- اختر تبويب Weave
- تصفح التتبعات، صفّي، وحلل
تنظيم المشروع
هيكل مشاريع Weave الخاصة بك:
my-team/
├── support-bot/ # روبوت دعم الإنتاج
│ ├── traces
│ ├── evaluations
│ └── experiments
├── content-generator/ # خط أنابيب توليد المحتوى
│ ├── traces
│ └── evaluations
└── rag-system/ # تطبيق RAG
├── traces
└── evaluations
المصادقة
عيّن مفتاح API الخاص بـ W&B:
export WANDB_API_KEY=your-api-key
أو سجّل الدخول تفاعلياً:
wandb login
المفاهيم الرئيسية
| المفهوم | الوصف |
|---|---|
| Op | دالة مُتتبعة مُزخرَفة بـ @weave.op() |
| Trace | تنفيذ مُسجل لـ op مع جميع البيانات |
| Evaluation | مجموعة حالات اختبار مع مسجلين |
| Model | إعداد LLM مُصدَّر |
نصيحة: ابدأ بإضافة
@weave.op()لدوال LLM الرئيسية. يمكنك إضافة تتبع أكثر تفصيلاً لاحقاً.
التالي، سنتعلم كيفية إعداد خطوط أنابيب التقييم في Weave. :::