إعداد بيئة الوكيل الخاصة بك
رسم الذاكرة البياني والصوت والبريد الإلكتروني
حتى الآن وكيلك يستطيع التفكير والتواصل. لكنه لا يستطيع تذكر ما حدث الأسبوع الماضي، أو سماع صوتك، أو إرسال بريد إلكتروني نيابةً عنك. هذه التكاملات الثلاثة — الذاكرة والصوت والبريد الإلكتروني — تحوّل وكيلك من روبوت دردشة تفاعلي إلى نظام استباقي يراكم المعرفة ويقبل المدخلات الطبيعية ويتخذ إجراءات في العالم الحقيقي.
Obsidian كرسم بياني للذاكرة
الوكيل بدون ذاكرة مستمرة كموظف ينسى كل شيء في نهاية كل يوم. تحتاج قاعدة معرفية منظمة وقابلة للبحث يستطيع وكيلك القراءة منها والكتابة فيها.
Obsidian هو تطبيق ملاحظات قائم على Markdown يخزن الملفات محلياً كنص عادي. هذا يجعله خلفية ذاكرة ممتازة للوكلاء لأن:
- الملفات نص Markdown عادي — الوكيل يمكنه قراءتها وكتابتها بعمليات ملفات قياسية
- رسم الروابط البياني — صيغة
[[wikilink]]في Obsidian تنشئ رسماً بيانياً معرفياً قابلاً للتصفح بين الملاحظات - محلي أولاً — لا اعتماد على السحابة، البيانات تبقى على جهازك أو VPS
- قابل للقراءة البشرية — يمكنك تصفح وتعديل نفس قاعدة المعرفة التي يستخدمها وكيلك
كيف يستخدم الوكيل Obsidian
يتفاعل الوكيل مع خزنة Obsidian (مجلد ملفات Markdown) عبر الوصول لنظام الملفات:
# إعداد الذاكرة يشير إلى خزنة Obsidian
memory:
type: obsidian
vault_path: /home/agent/obsidian-vault
index_on_startup: true
عند الإعداد، يستطيع الوكيل:
- تخزين معرفة جديدة: بعد إكمال مهمة بحث، الوكيل ينشئ ملاحظة جديدة بالنتائج ويربطها بملاحظات ذات صلة
- استدعاء سياق سابق: قبل الرد، الوكيل يبحث في الخزنة عن معرفة سابقة ذات صلة
- بناء الروابط: الوكيل ينشئ
[[روابط]]بين المفاهيم المرتبطة، ليبني رسماً بيانياً معرفياً بمرور الوقت
# مثال: الوكيل ينشئ ملاحظة مرتبطة
def save_research(topic, findings, related_topics):
note_content = f"# {topic}\n\n"
note_content += f"{findings}\n\n"
note_content += "## ذو صلة\n"
for related in related_topics:
note_content += f"- [[{related}]]\n"
# الكتابة في خزنة Obsidian
with open(f"{vault_path}/{topic}.md", "w") as f:
f.write(note_content)
التأثير المركب كبير — بعد أسابيع من التشغيل، يكون الوكيل قد بنى رسماً بيانياً معرفياً غنياً لمشاريعك وتفضيلاتك وقراراتك يمكنه الرجوع إليه في التفاعلات المستقبلية.
Whisper لتحويل الصوت إلى نص
أحياناً الكتابة غير عملية. أنت تمشي أو تقود أو ببساطة تفكر أسرع مما تستطيع الكتابة. المدخلات الصوتية تحل هذا بالسماح لك بالتحدث طبيعياً وجعل الوكيل يعالج كلماتك كنص.
Whisper من OpenAI هو نموذج التعرف على الكلام مفتوح المصدر الذي يحوّل الصوت إلى نص بدقة عالية عبر لغات متعددة.
مسار التكامل
خط أنابيب الصوت يعمل هكذا:
- ترسل رسالة صوتية (عبر ملاحظة صوتية في تيليجرام، أو تطبيق تسجيل، أو ميكروفون)
- الملف الصوتي يُمرر إلى Whisper للتحويل
- النص المُحوّل يُغذى لوكيلك كمدخل نصي عادي
- الوكيل يعالجه ويرد عبر القناة العادية
# تكامل تحويل الصوت إلى نص
import whisper
# تحميل النموذج (الخيارات: tiny, base, small, medium, large)
model = whisper.load_model("base")
def transcribe_voice(audio_path):
"""تحويل الصوت إلى نص باستخدام Whisper."""
result = model.transcribe(audio_path)
return result["text"]
# مثال على الاستخدام في خط أنابيب الوكيل
voice_text = transcribe_voice("/tmp/voice_message.ogg")
agent_response = agent.process(voice_text)
مقايضات حجم النموذج:
| النموذج | السرعة | الدقة | VRAM المطلوب |
|---|---|---|---|
tiny |
الأسرع | جيد للكلام الواضح | أدنى |
base |
سريع | دقة عامة جيدة | منخفض |
small |
معتدل | دقة أفضل | معتدل |
medium |
أبطأ | دقة عالية | أعلى |
large |
الأبطأ | أعلى دقة | كبير |
لمعظم استخدامات الوكلاء، نموذج base أو small يوفر أفضل توازن بين السرعة والدقة.
AgentMail لتكامل البريد الإلكتروني
البريد الإلكتروني يبقى من أهم قنوات الاتصال في الحياة المهنية. منح وكيلك عنوان بريد إلكتروني خاص يفتح سير عمل قوية — الوكيل يمكنه استقبال الرسائل وصياغة الردود وإرسال الإشعارات وإدارة المراسلات.
AgentMail (agentmail.to) هي خدمة مصممة خصيصاً لمنح وكلاء الذكاء الاصطناعي عناوين بريد إلكتروني خاصة بهم. هي شركة مدعومة من Y Combinator (YC S25) جمعت 6 ملايين دولار في التمويل وسلّمت أكثر من 100 مليون رسالة إلكترونية.
لماذا خدمة بريد إلكتروني مخصصة
يمكنك إعداد مزود بريد إلكتروني عادي، لكن خدمات البريد المخصصة للوكلاء تقدم مزايا:
- تصميم API أولاً — مبنية للوصول البرمجي، ليس لصناديق البريد البشرية
- قابلية التسليم — مهيأة مسبقاً لمعدلات تسليم عالية
- عناوين متعددة — سهولة توفير عناوين بريد مختلفة لأدوار وكيل مختلفة
- دعم Webhook — الرسائل الواردة تُطلق إجراءات الوكيل تلقائياً
مثال على الإعداد
# إعداد تكامل البريد الإلكتروني
email:
provider: agentmail
api_key: ${AGENTMAIL_API_KEY}
addresses:
- address: "assistant@yourdomain.com"
purpose: "المراسلات العامة"
- address: "reports@yourdomain.com"
purpose: "تسليم التقارير الآلية"
# معالجة البريد الوارد
def on_email_received(email):
"""معالجة البريد الوارد وإنشاء رد."""
sender = email["from"]
subject = email["subject"]
body = email["body"]
# الوكيل يحلل البريد الإلكتروني
analysis = agent.process(
f"بريد وارد من {sender}، "
f"الموضوع: {subject}. المحتوى: {body}"
)
# صياغة رد إذا كان مناسباً
if analysis.should_respond:
send_email(
to=sender,
subject=f"Re: {subject}",
body=analysis.draft_response
)
نظام المدخلات متعدد الأنماط
عندما تجمع هذه التكاملات الثلاثة، تنشئ نظام مدخلات متعدد الأنماط حيث يمكن لوكيلك استقبال المعلومات عبر قنوات متعددة:
| طريقة الإدخال | متى تستخدمها | إجراء الوكيل |
|---|---|---|
| النص (تيليجرام/ديسكورد) | على مكتبك، تعليمات دقيقة | معالجة مباشرة |
| الصوت (Whisper) | أثناء التنقل، العصف الذهني | تحويل ثم معالجة |
| البريد الإلكتروني (AgentMail) | التواصل الرسمي، جهات خارجية | تحليل، رد، أو تصعيد |
| الذاكرة (Obsidian) | مرجع في الخلفية | استرجاع السياق ذي الصلة |
القوة في الجمع. ترسل ملاحظة صوتية أثناء المشي: "ابحث عن صفحة أسعار المنافس وأرسل لي ملخصاً بالبريد الإلكتروني." الوكيل يحوّل صوتك إلى نص، ويجري بحثاً على الويب، ويخزن النتائج في Obsidian، ويرسل لك ملخصاً منسقاً بالبريد الإلكتروني — كل ذلك من رسالة صوتية واحدة.
النقطة الرئيسية: الذاكرة والصوت والبريد الإلكتروني تحوّل وكيلك من واجهة محادثة بسيطة إلى نظام متعدد الأنماط يراكم المعرفة. Obsidian يمنحه ذاكرة مستمرة، وWhisper يمنحه آذاناً، وAgentMail يمنحه قناة اتصال احترافية. معاً، ينشئون وكيلاً يصبح أكثر قدرة بمرور الوقت.
التالي: الحفاظ على تشغيل وكيلك على مدار الساعة مع مركز التحكم والعمليات المستمرة. :::