نموذج جديد يساعد الروبوتات على القيادة بسلاسة مثل البشر

365

يستطيع البشر عادة التنقل في المساحات بأمان دون التفكير كثيرًا. يمكن أن يتعلموا من سلوك الآخرين ويلاحظون أي عقبات يجب تجنبها. من ناحية أخرى, تكافح الروبوتات مع هذه المفاهيم الملاحية.

إبتكر الباحثون في معهد MIT للتكنولوجيا الآن طريقة لمساعدة الروبوتات على التنقل مثل البشر. يتيح نموذج تخطيط حركة الملاحة الجديد للبرامج الروبوتية تحديد كيفية الوصول إلى هدف من خلال إستكشاف البيئة ومراقبة العوامل الأخرى وإستغلال ما تعلموه من قبل في حالات مماثلة. تم تقديم ورقة تصف النموذج في مؤتمر IEEE / RSJ الدولي هذا الأسبوع حول الروبوتات والأنظمة الذكية (IROS).

ستخلق خوارزميات تخطيط الحركة الشائعة شجرة من القرارات المحتملة التي تتفرع إلى أن تجد مسارات جيدة للتنقل. فالروبوت الذي يحتاج إلى التنقل في غرفة للوصول إلى باب, على سبيل المثال, سيخلق خريطة بحث خطوة بخطوة عن الحركات المحتملة ثم ينفذ أفضل مسار إلى الباب, مع مراعاة القيود المختلفة. ومع ذلك, فإن أحد العوائق هو أن هذه الخوارزميات نادرًا ما تتعلم: لا تستطيع الروبوتات الاستفادة من المعلومات حول كيفية تصرفها أو العوامل الأخرى سابقًا في بيئات مماثلة.

“مثلما هو الحال عند لعب الشطرنج, تتفرع هذه القرارات إلى أن تجد [الروبوتات] طريقة جيدة للتنقل. لكن على عكس لاعبي الشطرنج, فإن [الروبوتات] تستكشف كيف يبدو المستقبل دون أن تتعلم الكثير عن بيئتهم وعوامل أخرى, “يقول المؤلف المشارك Andrei Barbu, وهو باحث في مختبر علوم الكمبيوتر والذكاء الإصطناعي في معهد MIT للتكنولوجيا (CSAIL) ومركز العقول والعقول والآلات (CBMM) داخل معهد MIT’s McGovern. “المرة الأولى التي يمرون فيها بنفس الحشد دائما ما تكون معقدة. إنهم دائمًا ما يستكشفون, ونادراً ما يراقبون, ولا يستخدمون أبدًا ما حدث في الماضي. ”

طور الباحثون نموذجًا يجمع بين خوارزمية التخطيط والشبكة العصبية التي تتعلم التعرف على المسارات التي يمكن أن تؤدي إلى أفضل النتائج, وتستخدم هذه المعرفة لتوجيه حركة الروبوت في بيئة إستكشافية.

“عندما يتفاعل البشر مع العالم, نرى جسمًا تعاملنا معه من قبل, أو في مكان كنا فيه من قبل, لذلك نعرف كيف سنتصرف”, يقول Yen-Ling Kuo, طالب دكتوراه في CSAIL ومشارك في الورقة البحثية. “تكمن الفكرة وراء هذا العمل في إضافة نموذج للتعلم الآلي إلى مساحة البحث التي تعرف من التجربة السابقة كيفية جعل التخطيط أكثر كفاءة”.

Boris Katz, عالم أبحاث رئيسي ورئيس مجموعة InfoLab في CSAIL, هو أيضا مؤلف مشارك في الورقة البحثية. يستكشف مخططو الحركة التقليديون بيئة من خلال التوسع السريع لخريطة القرارات التي تغطّي مساحة كاملة في النهاية. ثم ينظر الرجل الآلي إلى الخريطة ليجد طريقة للوصول إلى الهدف, مثل الباب. لكن نموذج الباحثين يقدم “موازنة بين إستكشاف العالم واستغلال المعرفة السابقة”, يقول Kuo.

تبدأ عملية التعلم ببعض الأمثلة. يتم تدريب الروبوت باستخدام النموذج على عدة طرق للتنقل في بيئات مماثلة. تتعلم الشبكة العصبية ما الذي يجعل هذه الأمثلة تنجح من خلال تفسير البيئة التي تحيط بالروبوت, مثل شكل الجدران, وأفعال الآخرين, وخصائص الأهداف. يجمع النموذج بين سلوك الإستكشاف من الطرق السابقة مع هذه المعلومات المستفادة. المخطط الأساسي, المسمى RRT, تم تطويره من قبل أساتذة معهد MIT للتكنولوجيا Sertac Karaman و Emilio Frazzoli. (إنه نوع من خوارزمية تخطيط الحركة المستخدمة على نطاق واسع والمعروفة باسم Random-exploring Random Trees, أو RRT.) يقوم المخطط بإنشاء خريطة بحث بينما تعكس الشبكة العصبية كل خطوة وتقدم تنبؤات إحتمالية حول المكان الذي يجب أن ينتقل إليه الروبوت لاحقًا. عندما تقوم الشبكة بالتنبؤ بثقة عالية, إستنادًا إلى المعلومات المكتسبة, فإنها توجه الروبوت إلي مسار جديد. إذا كانت الشبكة لا تتمتع بثقة عالية, فإنها تتيح للروبوت إستكشاف البيئة بدلاً من ذلك, مثل مخطط تقليدي.

تعتمد النتائج في الورقة على فرص العثور على مسار بعد مرور بعض الوقت, وإجمالي طول المسار الذي وصل إلى هدف معين, ومدى إتساق المسارات. في كل من المحاكاة, رسم نموذج الباحثين بسرعة أكبر بكثير من المسارات القصيرة والمتناسقة أكثر من المخطط التقليدي.

في تجربة أخرى, قام الباحثون بتدريب وإختبار النموذج في بيئات التنقل مع العديد من العوامل المتحركة, وهو إختبار مفيد للسيارات ذاتية القيادة, خاصةً في التنقل بين التقاطعات والأنعطافات. يجب على الروبوت التنقل بنجاح حول العملاء الآخرين, وتجنب التصادمات, والوصول إلى الهدف.

يقول Barbu: “إن المواقف مثل الأنعطافات دائما ما تكون صعبة, لأنها تتطلب تفكيرًا حول كيفية إستجابة الآخرين لأفعالك, وكيف ستستجيب بعد ذلك إلى أعمالهم, وما الذي سيفعلونه بعد ذلك, وما إلى ذلك”. “في النهاية, تكتشف أن الإجراء الأول الخاص بك كان خطأ, لأنه في وقت لاحق سيؤدي إلى حادث محتمل. هذه المشكلة تزداد سوءًا بشكل كبير كلما زاد عدد السيارات التي تتعامل معها. ”

تشير النتائج إلى أن نموذج الباحثين يمكنه التقاط معلومات كافية حول السلوك المستقبلي للعوامل الأخرى (السيارات) لإستباق العملية مبكراً, مع الإستمرار في إتخاذ قرارات جيدة في الملاحة. وهذا يجعل التخطيط أكثر كفاءة. علاوة على ذلك, كانوا بحاجة فقط لتدريب النموذج على أمثلة قليلة من الأنعطافات مع عدد قليل فقط من السيارات. يقول Barbu: “إن الخطط التي تضعها الروبوتات تأخذ بعين الاعتبار ما ستفعله السيارات الأخرى, مثلما يفعل أي إنسان.”

يعد المرور عبر التقاطعات أو الأنعطافات أحد السيناريوهات الأكثر تحديًا التي تواجه السيارات المستقلة. قد يسمح هذا العمل يوما ما للسيارات بتعلم سلوك البشر وكيفية التكيف مع السائقين في بيئات مختلفة, وفقا للباحثين. هذا هو محور عمل مركز أبحاث Toyota-CSAIL المشترك. تطورجديد قد يسرع من وتيرة تطور وزخم السيارات ذاتية القيادة . هل نراها قريبا في مدننا ؟

تمت ترجمة المقال الأصلي والموجود بالرابط أدناه

http://news.mit.edu/2018/model-helps-robots-navigate-like-humans-1004

 

 

تعليقات