طور باحثو Deezer نظام ذكاء إصطناعي يكتشف المزاج الموسيقي للأغاني

198

طور الباحثون في Deezer نظام ذكاء إصطناعي قادر على ربط بعض الأغاني مع المزاجية, كما ورد في موقع VentureBeat. تم وصف العمل في ورقة منشورة حديثًا على موقع Arxiv.org بعنوان “اكتشاف المزاج الموسيقي للأغاني الصوتية استنادًا إلى الشبكات العصبية العميقة”.

لتحديد الحالة الموسيقية للأغنية, نظر الفريق في كل من الإشارة الصوتية وكلمات الأغاني. في البداية قاموا بتغذية الإشارات الصوتية في شبكة عصبية, جنبا إلى جنب مع النماذج التي تعيد بناء السياقات اللغوية للكلمات. بعد ذلك لتعليمه كيفية تحديد مزاج الأغنية, إستخدموا قاعدة بيانات مليونية للأغاني وهي مجموعة من البيانات الوصفية لأكثر من مليون أغنية معاصرة على وجه الخصوص, ثم إستخدموا مجموعة بيانات موقع Last.fm التي تحدد كلمات الأغاني لأكثر من 500,000 أغنية مميزة. العديد من هذه العلامات مرتبطة بالمزاج العام الموسيقي,  وأعطيت أكثر من 14000 كلمة إنجليزية من هذه العلامات تصنيفين على مستوى المقياس يتناسبان مع مدى سلبية أو إيجابية الكلمة, وكذلك مدى هدوء أو نشاط الأغنية لتدريب النظام علي تمييز الأغاني.

تحتوي قاعدة البيانات علي بيانات وصفية لأكثر من مليون أغنية و لذلك يقرن الفريق كل هذه المعلومات إلى كتالوج Deezer باستخدام معرّفات مثل عناوين الأغاني وأسماء الفنانين وألقاب الألبومات. تم استخدام حوالي 60 في المائة من مجموعة البيانات الناتجة 18,644 أغنية لتدريب الذكاء الاصطناعي, بينما تم إستخدام الباقي للتحقق من صحة واختبار النظام.

في النهاية, خلص الباحثون إلى أن الذكاء الاصطناعي كان أكثر قدرة على اكتشاف مدى الهدوء أو النشاط في الأغنية أفضل من الطرق التقليدية التي لم تستخدم الذكاء الاصطناعي, وعندما يتعلق الأمر باكتشاف ما إذا كانت الأغنية إيجابية أم سلبية كان النظام نشط للغاية وكتب الباحثون في الصحيفة: “يبدو أن هذه المكاسب في الأداء هو نتيجة لقدرة نموذجنا على كشف النقاب واستخدام علاقات الإرتباط بين الصوت والأغاني, خاصة عندما يتعلق الأمر بتوقع نوع الأغنية”

من الملاحظ في الورقة أنه من أجل الاستفادة من هذا العمل. فإن “قاعدة البيانات المزودة بأغاني متزامنة وصوتية من شأنها أن تساعد بشكل كبير على المضي قدمًا”. في حالة وجود قاعدة بيانات كهذه, يعتقد الفريق أنه بإمكانه تحديد مدى الإختلاف في مزاجية الأغاني “في بعض الحالات ، يمكن أن يكون هناك تباين كبير بين المستمعين” (قد لا يتفق الناس دائمًا على ما إذا كانت الأغنية إيجابية أو سلبية, على سبيل المثال). في نهاية المطاف, يعتقد الباحثون أن هذا النوع من العمل يُنظر إليه كطريقة لتوضيح كيفية ارتباط الموسيقى, بالكلمات والمزاج وكذلك إمكانية وجود نماذج التعلم العميق التي تمكن من فرز وإيجاد البيانات ذات الحجم الكبير.

يمكن أن يستخدم Deezer هذا النوع من التعلم الآلي في المستقبل لفرز وفهرسة الموسيقى تلقائيًا ليس فقط مع البيانات الوصفية الأساسية, مثل اسم الفنان أو نوع الموسيقى, ولكن شيء أكثر دقة مثل المزاج.

تمت ترجمة المقال الأصلي والموجود بالرابط أدناه

https://www.theverge.com/2018/9/23/17888240/deezer-researchers-ai-system-detect-song-musical-mood

 

تعليقات