نظام ذكاء اصطناعي من مايكروسوفت لتحويل النصوص إلى أصوات بطريقة أذكى

تعتبر الخوارزميات الحديثة لتحويل النصوص إلى صوتيات مذهلة بشكل لا يصدق، فلا تحتاج إلى البحث عن أدلة أكثر من أدوات جوجل مفتوحة المصدر SpecAugment  أو  Translatotron حيث يُمكن للأخيرة ترجمة صوت الشخص مباشرة إلى لغة أخرى مع الاحتفاظ بالنبرة والمدة ولكن هناك دائمًا مجال للتحسين.

 

تزايد ذكاء منصات وأنظمة تحويل النصوص إلى أصوات بشكل مطرد، لكن هناك مشكلة، فقد يتزايد الأمر كثيرًا في أوقات التدريب والموارد لإنتاج مخرجات طبيعية، لكن قد يكون لدى مايكروسوفت والباحثين الصينيين طريقة أكثر فعالية، فقد قاموا بصياغة نظام ذكاء اصطناعي يحول النص إلى صوت مسموع ويستطيع النظام توليد خطاب واقعي باستخدام 200 عينة صوتية فقط (حوالي 20 دقيقة) ومطابقة للنسخ.

 

اقرأ أيضًا >> أحدث تصميمات رقائق ARM أسرع بنسبة 60% من الذكاء الاصطناعي على الهواتف

 

يعتمد نظام الذكاء الاصطناعي جزئيًا على المحولات أو الشبكات العصبونية العميقة والتي تحاكي الخلايا العصبية في المخ تقريبًا، تزن المحولات كل المدخلات والمخرجات أثناء التنقل مثل الارتباطات التشابكية مما يساعدهم على معالجة تسلسلات طويلة حتى بكفاءة عالية.

 

النتائج ليست مثالية مع صوت روبوت طفيف، لكنها دقيقة للغاية مع وضوح الكلمات بنسبة 99.84% والأهم من ذلك قد يحول هذا النص إلى كلام أكثر سهولة ولن تحتاج إلى بذل الكثير من الجهد للحصول على أصوات واقعية وجعلها في متناول الشركات الصغيرة وحتى الهواة.

 

اقرأ أيضًا >> إل جي تسرّع تطوير الذكاء الاصطناعي برقاقة جديدة خاصة بها

 

يبشر ذلك بالخير القادم من المستقبل، فالباحثون يأملون في التدريب على بيانات لا مثيل لها، لذلك قد يتطلب الأمر قدرًا أقل من العمل لإنشاء حوار واقعي.

 

اقرأ كذلك:

>> ما الخطر من وجود منصات الذكاء الاصطناعي التي تنتج صورًا وهمية؟

>> أمازون توفر الذكاء الاصطناعي كخدمة طبية في مستشفى هارفارد

>> إنفيديا تعلن عن خط حواسب استوديو المحمولة لمنافسة حواسب ماك بوك برو

>> 5 تطورات جديدة في مجال الذكاء الاصطناعي وتعلّم الآلة من أمازون  

>> الذكاء الاصطناعي يُعيد كتابة محتوى إعلان سيارة ليكزس ES

 

قد يعجبك ايضا