علي بابا تطلق Qwen لاستنساخ الصوت من ثلاث ثوانٍ (فيديو)
أعلنت شركة علي بابا عن إطلاق نموذجين جديدين من الذكاء الاصطناعي ضمن عائلة Qwen، قادرين على توليد الأصوات البشرية واستنساخها بدقة عالية، في خطوة تعزز المنافسة المتسارعة في تقنيات تحويل النص إلى كلام واستنساخ الصوت.
ويحمل النموذجان الجديدان اسمَي Qwen3-TTS-VD-Flash و Qwen3-TTS-VC-Flash، وقد جرى تطويرهما عبر فريق Qwen التابع لـ Alibaba Cloud، مع تركيز واضح على السرعة والدقة والقدرة على التحكم التفصيلي في نبرة الصوت وأسلوبه.
نماذج Qwen الجديدة لاستنساخ الصوت
يتيح نموذج Qwen3-TTS-VD-Flash إنشاء أصوات بشرية انطلاقًا من أوصاف نصية دقيقة، حيث يمكن للمستخدم تحديد سمات متعددة مثل العمر، والجنس، والانفعال، وسرعة الإلقاء، وحتى الأسلوب التعبيري.
فعلى سبيل المثال، يمكن طلب صوت “رجل في منتصف العمر بنبرة جهورية قوية وأداء حماسي سريع بأسلوب إعلاني مبالغ فيه”، ليقوم النموذج بتوليد الصوت وفق هذه المواصفات بدقة.
ووفقًا لشركة علي بابا، يتفوق هذا النموذج من حيث جودة الإخراج والتحكم الصوتي على واجهة GPT-4o mini-tts التي أطلقتها OpenAI في وقت سابق من هذا العام.
استنساخ الصوت من ثلاث ثوانٍ فقط
أما النموذج الثاني Qwen3-TTS-VC-Flash من علي بابا، فيقدم ميزة أكثر إثارة، إذ يستطيع استنساخ أي صوت بشري من ثلاث ثوانٍ فقط من التسجيل الصوتي، مع القدرة على إعادة إنتاجه بما يصل إلى 10 لغات مختلفة.
وتؤكد Qwen أن النموذج يحقق معدل أخطاء أقل مقارنة بمنافسين بارزين مثل ElevenLabs و MiniMax.
ولا تقتصر قدرات النموذج على تقليد الأصوات البشرية فحسب، بل يمكنه أيضًا التعامل مع نصوص معقدة، ومحاكاة أصوات الحيوانات، واستخلاص الصوت البشري من تسجيلات مختلطة تحتوي على ضوضاء أو أصوات متعددة.
أتاحت علي بابا النموذجين عبر واجهة Alibaba Cloud البرمجية (API)، ما يفتح المجال أمام المطورين والشركات لاستخدامهما في تطبيقات متعددة، مثل صناعة المحتوى، والألعاب، والمساعدات الصوتية، والدبلجة، والإعلانات.
كما يمكن تجربة النماذج عبر عروض توضيحية متاحة على منصة Hugging Face، سواء لنموذج تصميم الصوت أو نموذج استنساخ الصوت، في خطوة تهدف إلى تسريع تبني التقنية داخل مجتمع الذكاء الاصطناعي.
ويعكس هذا الإطلاق توجه علي بابا الواضح لتعزيز حضورها في سباق تقنيات الذكاء الاصطناعي التوليدي، خصوصًا في مجال الصوت، الذي يشهد نموًا متسارعًا ومنافسة شرسة بين عمالقة التقنية عالميًا.
