أداة جوجل للكشف عن الكلام الذي يتسم بالكراهية يمكن خداعها بالأخطاء الإملائية

163

الحفاظ على  الإيجابية وسط السلبية المنتشرة على الإنترنت مهمة صعبة, تقول الاحصائيات ان ما يقرب من واحد من كل خمسة أمريكيين تعرضوا لمضايقات شديدة عبر الإنترنت, ولذالك يهدف منظور Google للذكاء الإصطناعي إلى حل تلك المشكلة ولكن يبدو أن هناك الكثير من العقبات.

وكما أفادت تقارير TNW, فإن مجموعة من الباحثين في جامعة Aalto وجامعة Padua اكتشفوا أن ذكاء Google الاصطناعي يمكن خداعه بسهولة وأن نماذج الكشف عن الكلام الذي تتسم بالكراهية الحديثة لا تعمل بشكل جيد إلا عندما يتم اختبارها من خلال نفس النوع من البيانات التى تم تدريبه عليها. تتضمن الحيل البسيطة للتغلب على الذكاء الإصطناعي الخاص بشركة Google ما يلي: إدخال أخطاء إملائية, إضافة مسافات بين الكلمات, أو إضافة كلمات غير ذات صلة إلى الجملة الأصلية.

 

يتم تحقيق طريقة Google للكشف عن الكلام الذي يحض على الكراهية من خلال تعيين درجة السمية في جزء من النص. ومع ذلك, فإن نظام الذكاء الاصطناعي ليس ذكيا بما فيه الكفاية للكشف عن سياق الشتائم, والتغيير البسيط بين “أنا أحبك” و “أنا أحبك يا **** (تم حذف الكلمة المسيئة) ”  يرى تغييرا في النتيجة من 0.02 إلى 0.77.

وتقول الصحيفة: “من الواضح أن السمية” كما يصنفها المنظور حالياً, لا يمكن استيعابها في التعبير عن الكراهية بأي معنى جوهري (أو قانوني). وبالمثل ، فإن الأخطاء المطبعية أو “leetspeak” (استبدال الأحرف الشائعة بالأرقام ، بحيث تصبح “GEEK” “G33K” ، وهكذا) تكون فعالة أيضًا في خداع الذكاء الإصطناعي مع الاحتفاظ بقابلية قراءة الرسالة الأصلية وتأثيرها العاطفي.

كما أن كلمة “حب”  التي لا ترتبط بكلام يحض على الكراهية إذا ذكرت في جملة مسيئة فإنها تربك الذكاء الإصطناعي تماما وتقوم بكسر كل نماذج الكلمات المسيئة, وتعيق نماذج  تحليل الشخصية بشكل كبير – في بعض الحالات – يسقط تصنيف السمية من 0.79 إلى 0.00.

مع وجود العديد من المنصات الاجتماعية – مثل Facebook و Twitter و YouTube – تكافح للعثور على الحد الفاصل بين الكلام المسيء والمقبول, فإن الذكاء الاصطناعي القابل للتطبيق بسهولة سيكون له فوائده بوضوح.

في الآونة الأخيرة ، تعرض موقع تويتر لانتقادات بسبب تعطيل حساب الناشط أليكس جونز لمدة أسبوع بينما قامت منصات أخرى بإزالة حساباته وموقعه الإلكتروني بالكامل. زعمت تويتر أن جونز لم ينتهك أيًا من قواعد النظام الأساسي, ولكن الشركة عطلت الحسابين الخاصين به realalexjones وinfowars  منذ ذلك الحين بعد جلسة استماع لجنة مجلس الشيوخ.

لسوء الحظ مع هذه الأخبار ، والأمثلة الأخيرة من ال chatbots الذكي الخاص بشركة مايكروسوفت الذي قام بإرسال تويتات مسيئة وعنصرية, يبدو أن الذكاء الإصطناعي  سوف يحتاج إلى تحسين قبل أن نتركه يتحكم في قسم التعليقات في منصاتنا الإجتماعية ولكن مما شك فيه أنه سيساعد في رقابة المحتوي لأنه لا يمكن – ولا يعقل – أن يتم التحكم بشريا بكل هذه التعليقات ما لم يتم الإبلاغ عنها في الوقت المناسب.

تمت ترجمة المقال الأصلي والموجود بالرابط أدناه`

https://www.pcmag.com/news/363660/googles-ai-hate-speech-detection-tricked-by-typos

 

تعليقات