Qwen3.5-Omni: Alibaba Omnimodal AI
١ أبريل ٢٠٢٦
يعالج Qwen3.5-Omni من Alibaba النصوص والصور والصوت والفيديو بشكل أصلي مع مخرجات صوتية في الوقت الفعلي، والتعرف على 113 لغة، و215 مهمة صوتية فرعية SOTA.
يعالج Qwen3.5-Omni من Alibaba النصوص والصور والصوت والفيديو بشكل أصلي مع مخرجات صوتية في الوقت الفعلي، والتعرف على 113 لغة، و215 مهمة صوتية فرعية SOTA.
موديل Voxtral TTS من Mistral هو موديل text-to-speech بنظام open-weight وحجم 4B بنسبة فوز 68.4% مقابل ElevenLabs Flash v2.5. 9 لغات، voice cloning في 3 ثوانٍ، 0.016 دولار لكل 1000 حرف.
استكشف الأبعاد الأخلاقية والتقنية والقانونية لاستنساخ الصوت بتقنية AI — من مخاطر deepfake إلى ممارسات التصميم والاختبار والنشر المسؤولة.
بريد واحد أسبوعياً — دورات، مقالات معمّقة، أدوات، وتجارب ذكاء اصطناعي.
بدون إزعاج. إلغاء الاشتراك في أي وقت.