#voice-cloning

Qwen3.5-Omni: نموذج Alibaba Omnimodal AI (2026)

١ أبريل ٢٠٢٦

يعالج نموذج Qwen3.5-Omni من Alibaba النصوص والصور والصوت والفيديو بشكل أصلي مع مخرجات صوتية في الوقت الفعلي، والتعرف على 113 لغة، و215 مهمة صوتية فرعية بمستوى SOTA.

#Qwen3.5-Omni #Alibaba Cloud

Voxtral TTS: ذكاء اصطناعي مفتوح الأوزان ينافس ElevenLabs (2026)

٣١ مارس ٢٠٢٦

نموذج Voxtral TTS من Mistral هو نموذج تحويل نص إلى كلام مفتوح الأوزان بحجم 4B، مع نسبة فوز بلغت 68.4% مقابل ElevenLabs Flash v2.5. يدعم 9 لغات، واستنساخ صوتي في 3 ثوانٍ، وبتكلفة 0.016 دولار لكل 1000 حرف.

#Voxtral TTS #Mistral AI

أخلاقيات AI Voice Cloning: التوازن بين الابتكار والمسؤولية

١٦ فبراير ٢٠٢٦

استكشف الأبعاد الأخلاقية والتقنية والقانونية لاستنساخ الصوت بتقنية AI — من مخاطر deepfake إلى ممارسات التصميم والاختبار والنشر المسؤولة.

#AI ethics #voice cloning