نظام جديد من جوجل يستطيع انتقاء الأصوات الفردية في حشد من الناس

يمتلك البشر القدرة على عزل صوت شخص ما لكن هل تستطيع أجهزة الحاسوب القيام بذلك؟ بالطبع الأمر ليس هكذا بالضبط لكن هناك الكثير من المحاولات التي تبحث عن تطوير سماعة ذكية في المنزل تستطيع تحديد الأصوات الفردية داخل الحشود.

 

قدمت شركة جوجل حلًا مدهشًا وهو عبارة عن نظام تعليم عميق يمكنه اختيار أصوات معينة من خلال النظر إلى وجوه الأشخاص عندما يتحدثون، وقد قام الفريق بتدريب نموذج الشبكة العصبية للتعرف على الأفراد الذين يتحدثون بأنفسهم ثم قاموا بإنشاء حفلات افتراضية (حفلات كاملة مع ضجيج بالخلفية) لتدريب النظام على كيفية عزل الأصوات المتعددة إلى مسارات صوتية متميزة.

 

 

مواضيع مشابهة

النتائج، كما تروها في المقطع المرئي أعلاه توضح الدقة الكاملة لتنقية الصوت الواحد من بين أصوات عدة من خلال شخصين يتحدثان في وقت واحد أثناء وجود خلفية عشوائية من الأصوات وذلك بتحديد الوجه حتى وإن كان هناك حجب جزئي للوجه من إيماءات اليد أو الميكروفون.

 

تعمل شركة جوجل حاليًا على استكشاف الفرص لاستخدام هذه الميزة في منتجاتها التي نجد منها عددًا قليلًا من المرشحين لكن من المحتمل أن تكون مثالية لخدمات الدردشة المرئية مثل هانج آوت و تطبيق دو وبهذا تستطيع فهم الأشخاص الذين يتحدثون داخل غرفة مزدحمة وستساعد هذه التقنية كذلك على تحسين جودة الأصوات أثناء تسجيل الفيديو.

 

هناك الكثير من التسهيلات التي ستقدمها هذه التقنية للكثير من الأجهزة والتطبيقات، ومن الجميل في هذه التقنية أنها ستكون مدمجة داخل نظام عالمي مثل أندرويد.

 

شارك المحتوى |
close icon