معهد MIT للتكنولوجيا يخلق ذكاء إصطناعى قادر علي أن يتنبأ بالإكتئاب من كلام الأشخاص

395

الإكتئاب هو أحد أكثر الإضطرابات شيوعًا على مستوى العالم ويؤثر على حياة أكثر من 300 مليون شخص, ويؤدي الى حوالي 800,000 حالة إنتحار سنويًا, وفقًا لأرقام منظمة الصحة العالمية في مارس 2018. تشخيص الإكتئاب قد يكون تحديًا ومعقدًا. ووفقًا لموقع Mayo Clinic, تختلف أعراض الإكتئاب, وقد يستخدم الأطباء إختبارًا جسديًا وإختبارات معملية وإستبيانًا للتقييم النفسي ومعايير من الجمعية الأمريكية للطب النفسي DSM-5 (الدليل التشخيصي والإحصائي للاضطرابات العقلية) من أجل تحديد تشخيص الإكتئاب. بالنسبة إلى أخصائي الصحة العقلية, فإن طرح الأسئلة الصحيحة وتفسير الإجابات هو عامل رئيسي في التشخيص. ولكن ماذا لو كان من الممكن تحقيق التشخيص من خلال المحادثة الطبيعية, مقابل إجراء محادثة مكونة من سؤال وجواب؟

إكتشف فريق أبحاث مبتكر من معهد ماساتشوستس للتكنولوجيا (MIT) يتكون من Tuka Alhanai وJames Glass في CSAIL (مختبر علوم الكمبيوتر والذكاء الإصطناعي) وMohammad Ghassemi في معهد الهندسة الطبية والعلوم (IMES) طريقة للكشف عن الإكتئاب في الأفراد من خلال تحديد أنماط في المحادثة الطبيعية.

طور الباحثون في معهد MIT نموذجًا للذكاء الإصطناعي يعتمد على الشبكات العصبية ويمكنه التنبؤ بالإكتئاب إستنادًا إلى تحديد أنماط الكلام من النسخ الصوتية والنصية من المقابلات. بإستخدام مجموعة بيانات من 142 من المقابلات المسجلة للمريض, يهدف الفريق إلى إيجاد نموذج متسلسل للكشف عن الإكتئاب.
أولاً, سعى الفريق إلى تقييم دقة التنبؤ للسمات الصوتية والنصية “عندما يتم النظر فيها بشكل مستقل عن نوع السؤال المطروح والوقت الذي سئل فيه خلال جلسة المقابلة” – وبعبارة أخرى, النمذجة “الخالية من السياق”. قام الفريق بتغذية 279 ميزة صوتية و 100 ميزة نصية لنموذج تراجع منطقي. بالنسبة لميزات النص, قام الفريق بتسخير Doc2Vec لمكتبة Python Gensim لـ “ما مجموعه 8050 من الأمثلة التدريبية, و 272,418 كلمة, وحجم مفردات 7,411.” بالنسبة للسمات الصوتية, قام الفريق “بإستخراج مجموعة أولية من 553 ميزات تمثل كل إستجابة للموضوع.

في التجربة الثانية, يهدف الفريق إلى فهم الأداء التنبئي “عند التكييف على نوع السؤال المطروح, والمستقل عن الوقت الذي سئل فيه خلال جلسة المقابلة”. ولتحقيق ذلك, قاموا بإنشاء نموذج مرجح مماثل للسياق نموذج حر, مع إختلاف رئيسي – قام بتخصيص أوزان للنموذج بناءً على “القدرة التنبؤية للسؤال الموجود في مجموعة التدريب”.

وبالنسبة للتجربة الثالثة, ركز الفريق على “نمذجة التغيرات الزمنية للمقابلة” وإستخدم شبكة عصبية قصيرة المدى ثنائية الإتجاه (LSTM) لأنها كانت “الميزة الإضافية لنمذجة البيانات المتسلسلة.”

ومن المثير للاهتمام, اكتشف الباحثون أن النموذج يحتاج إلى أكثر من أربعة أضعاف البيانات عند إستخدام الصوت بدلا من النص عند التنبؤ بالإكتئاب. النموذج المطلوب في المتوسط ​​30 تسلسل للصوت, بالمقارنة مع سبعة تسلسلات فقط من سؤال النص والجواب. ولاحظ الفريق أن نمذجة التسلسل أكثر دقة للتنبؤ بالإكتئاب, وأن النموذج متعدد الوسائط لكل من النص والصوت كان الأفضل أداءً. من أعجب المفارقات أن طبيعة نماذج الشبكات العصبية للذكاء الإصطناعي تحدد بالضبط الأنماط التي تكتشفها من بيانات المدخلات. يرجع تعتيم الذكاء الإصطناعي إلى التعقيد المتأصل للشبكات العصبية مع التوصيلات المعقدة بين العقد والمقدار الهائل من المعلمات. وبغض النظر عن ذلك, تمثل دراسة معهد ماساتشوستس للتكنولوجيا خطوة مبتكرة نحو إنشاء أداة جديدة محتملة لمساعدة الأطباء ومهنيي الصحة العقلية في معالجة تعقيدات تشخيص الإكتئاب في المستقبل.

تمت ترجمة المقال الأصلي والموجود بالرابط أدناه

https://www.psychologytoday.com/us/blog/the-future-brain/201810/mit-creates-ai-predicts-depression-speech

 

 

 

تعليقات