كل ما تحتاج معرفته عن تحليل العاطفة والتنقيب عن الآراء في الكلام – الجزء الثاني

174

تعرضنا في المقال السابق لمقدمة عن مهمة تحليل العاطفة وتعريفها وأنواعها، في هذا المقال سنعرض بتفاصيل أكثر طرق تنفيذها والتحديات التي تواجهها.

الجزء الأول من المقال

كيف يعمل تحليل العاطفة؟

خوارزميات تحليل العاطفة

هناك العديد من الطرق والخوارزميات لتنفيذ نظم تحليل العطفة ونصنفها لثلاث أنواع:

  • نظم قائمة على قواعد تتبع مجموعة من القاعد المحددة يدوياً لتحليل العاطفة.
  • نظم آلية تستخدم تقنيات تعلم الآلة لتتعلم تحليل العاطفة من الداتا.
  • نظم هجين تجمع بين النوعين السابقين.

نظم قائمة على قواعد

عادة ما تستخدم هذه النظم قواعد مكتوبة في لغة برمجة تحدد الموضوعية، القطبية، أو موضوع الرأي التي تقوم بتحليله.

قد تستخدم هذه النظم معطيات مختلفة مثل:

  • طرق معالجة اللغات الطبيعية NLP التقليدية مثل تقسيم الكلام tokenization وإرجاع الكلمات لأصولها stemming وتصنيف أقسام الكلام part-of-speech tagging والإعراب parsing.
  • موارد أخرى، مثل معاجم كلمات العاطفة

مثال بسيط لنظام قائم على قواعد كالآتي:

  1. نقوم بتعريف قائمة من الكلمات الدالة على العاطفة، مثل “سيء” “قبيح” للسالب و”جيد” “جميل” للموجب.
  2. للنص المراد تحليله:
    • نعدّ الكلمات الموجبة في النص
    • نعدّ الكلمات السالبة في النص
  3. إذا كان عدد الكلمات الموجبة أكثر من عدد الكلمات السالبة نحدد أن النص موجب، وعلى النقيض نحدد أن النص سالب. غير ذلك نحدد أن النص محايد العاطفة.

هذا النظام ساذج للغاية لأنه لا يأخذ في الاعتبار كيف تشكل الكلمات تسلسل النص. يمكننا بناء نظام أكثر تطوراً ولكن هذه النظم سرعان ما تصير شديدة التعقيد في بناءها. مما يجعلها صعبة العناية والتطوير لأنه دائماً سيحتاج إضافة قواعد جديدة للمفردات والتعبيرات المستجدة. كما أن إضافة قاعدة جديدة قد يكون له تأثيرات غير مرغوبة بسبب تفاعلها مع القواعد الأخرى. لذلك تتطلب هذه الأنظمة استثماراً قوياً في المجهود لضبط وحفظ قواعده المتداخلة.

نظم آلية

على عكس النظم المبنية على قواعد، لا تعتمد النظم الآلية على أي قواعد مصممة يدوياً ولكن تعتمد على تقنيات تعلم الآلة. عادة ما تصاغ مشكلة تحليل العاطفة كمشكلة تصنيف classification problem حيث نعطي النموذج النص ويخرج لنا التصنيف المناسب مثل موجب، سالب أو محايد (في حالة تحديد القطبية).

يمكن تنفيذ هذا النموذج بالخطوات التالية:

https://monkeylearn.com/static/img/automatic-approaches.png

عمليات التعلم والتوقع

في عملية التعلم (أ)، يتعلم النموذج أن يربط بين مدخل معين (نص) ومخرج مقابل (صنف) بناءً على الأمثلة التي تستخدم للتعلم. مستخرج الخصائص feature extractor يحول النص المدخل إلى متجه خصائص feature vector. ثم تُغذى أزواج من متجهات خصائص وأصناف (مثل موجب وسالب ومحايد) إلى خوارزمية تعلم الآلة لتصدر النموذج المتعلم.

في عملية التوقع (ب)، نستخدم نفس مستخرج الخصائص لتحويل النصوص غير المرئية إلى متجهات خصائص. هذه المتجهات تُدخل على النموذج المتعلم، ويقوم بإصدار أصناف متوقعة (كما وضحنا: موجب وسالب ومحايد).

استخراج الخصائص من النصوص

أول خطوة في أي نموذج تعلم آلة للنصوص هي تحويل النص إلى تمثيل رقمي عادة ما يكون متجه. عادة ما يعبر كل بعد في المتجه عن تكرار كلمة أو مصطلح في معجم معرف مسبقاً (مثل معاجم كلمات العاطفة). هذه هي عملية استخراج الخصائص feature extraction / text vectorization والطريقة التقليدية تستخدم نموذج حقيبة-الكلمات bag-of-words (أي كل كلمة تمثل كمية نعدها) وأعداد تكرارها.

ظهر حديثاً طرق أخري لاستخراج الخصائص تستخدم تضمين الكلمات word embeddings. هذا التمثيل يجعل من الممكن أن يكون للكلمات المتشابهة في المعنى تمثيلات رقمية متشابهة، مما يحسن كفاءة نماذج تعلم الآلة.

خوارزميات التصنيف

خطوة التصنيف عادة ما تتضمن نموذج إحصائي مثل:

  • Naïve Bayes عائلة من الخوارزميات الاحتمالية التي تستخدم نظرية بايز في تصنيف النصوص
  • Linear Regression الانحدار الخطي وهو أسلوب إحصائي للتوقع بقيمة ما (Y) بدلالة مجموعة من الخصائص (X)
  • Support Vector Machines أشعة الدعم الآلي وهي نموذج غير احتمالي يستخدم تمثيل النصوص كنقاط في مجال متعدد الأبعاد. تُحدد النصوص في المجال حيث النصوص المنتمية لنفس التصنيف (العاطفة) تقع في أجزاء مستقلة من المجال. ثم نحدد النصوص الجديدة إلى نفس المجال وتتوقع تصنيفها حسب المنطقة التي تقع فيها داخل المجال.
  • Deep Learning التعلم العميق وهو مجموعة من الخوارزميات المختلفة التي تحاول تقليد طريقة عمل مخ الإنسان باستخدام الشبكات العصبية الصناعية لمعالجة الداتا.

تقييم معايير تحليل العاطفة

هنالك العديد من الطرق للحصول على معايير أداء لتقييم النموذج وفهم مدى دقته في تحليل العاطفة. واحدة من أشهر هذه الطرق هي التحقيقات المتقاطعة cross-validation.

ما تفعله التحقيقات المتقاطعة هو تقسيم داتا التعلم training data إلى عدد من الأقسام للتعلم training folds (باستخدام 75% فقط من داتا التعلم) ونفس عدد الأقسام للاختبار testing folds (باستخدام المتبقي 25% من داتا التعلم)، ونستخدم أقسام التعلم لتعليم النموذج ونختبر كفاءة باستخدام أقسام الاختبار لنحصل على معايير لأداء النموذج (القسم التالي). نكرر هذه العملية عدة مرات ونأخذ متوسط معايير الأداء.

إذا كانت داتا الاختبار نفسها في كل مرة، قد يحدث ما يسمى بالتعلم الزائد overfitting لهذه داتا الاختبار. هذه يعني أننا قد نضبط تجاربنا بصورة مفرطة على الداتا المعطاة لدرجة أنها لا تعمم على داتا أخر ويفشل النموذج. تساعد التحقيقات المتقاطعة على منع ذلك، وكلما زادت كمية الداتا كلما تمكنا من زيادة عدد الأقسام.

الدقة precision والإرجاع recall والضبط accuracy

تعتبر الدقة والإرجاع والضبط معايير أساسية لتقييم أداء أي نموذج.

تقيس الدقة كم عدد النصوص التي توقع النموذج تصنيفها صحيحاً لصنف محدد، من كل النصوص التي توقع (صحيحة وغير صحيحة) أنها تنتمي لهذا الصنف.

يقيس الإرجاع كم عدد النصوص التي توقع النموذج تصنيفها صحيحاً لصنف محدد، من كل النصوص التي تنتمي لهذا الصنف. كلما زاد حجم داتا التعلم للنموذج كلما تحسن الإرجاع.

يقيس الضبط كم عدد النصوص التي توقع النموذج تصنيفها صحيحاً لكل الأصناف على مستوى كل النصوص.

كثيراً ما يستخدم الدقة والإرجاع لقياس الأداء لأن الضبط وحده لا يكفي لمعرفة تفاصيل جودة النموذج.

في مشكلة صعبة مثل تحليل العاطفة، غالباً ما تكون قيم الدقة والإرجاع منخفضة في البداية. لكن كلما غذينا النموذج بالمزيد من الداتا كلما تحسن الأداء. ولكن (كما سنرى لاحقاً) بما أن داتا التعلم مصنفة بطريقة يدوية فغالباً تحتوي بعض الأخطاء البشرية، لهذا فغالباً لا نرى قيمة مرتفعة للدقة. ولكن إذا استخدمنا داتا مصنفة يدوياً بصورة متناسقة، سنرى نتائج جيدة مثل أي مشكلة تصنيف في تعلم الآلة. وهذه من تحديات معالجة اللغات الطبيعية.

اتفاق بين المعلقين

أحد أشهر معايير الاتفاق بين المعلقين (أي الاتفاق بين البشر على وظيفة محددة للتصنيف) هي معامل كربندورف Krippendorff’s Alpha coefficient. طبقاً ل [1]، أفضل توافق بين المعلقين على داتا من تويتر لتحليل العاطفة هي 0.655 وتعني درجة جيدة من الاتفاق لأن المعامل موجب، ولكنه بعيد عن درجة عالية من الاتفاق (عند حوالي قيمة 0.8 للمعامل التي يستخدمها علماء العلوم الاجتماعية لتوثيق الداتا). ولكن نلاحظ أن النتائج تجريبية من هذا المقال المنوه.

على كل حال، فقيمة 0.65 مؤشر على مدى صعوبة تجليل العاطفة حتى للبشر. أخذاً في الاعتبار أن الآلة تتعلم من الداتا التي نوفرها، فمتوقع أن تحاكي الآلة مستوى البشر في الاختلاف وعدم التوافق في التصنيفات.

نظم هجين

فكرة النظم الهجين بديهية للغاية: فقط نجمع أحسن الأسلوبين، القائمة على القواعد والآلية. عادة الجمع بينهما تحسن الأداء في الدقة والإرجاع والضبط.

 

تحديات تحليل العاطفة

معظم الأبحاث عن تحليل العاطفة في السنوات الماضية تركز حول تطوير نماذج أعلى كفاءة في التعامل مع بعض التحديات والعوائق في المجال

الموضوعية والنبرة

التمييز بين النصوص الموضوعية والشخصية لا يقل أهمية عن تحليل نبرة الكلام فيها. في الواقع، النصوص الموضوعية حقاً لا تحتوي على أي عاطفة صريحة. لنرى المثال الجمل الآتية:

“الصندوق لطيف.”

“الصندوق أحمر.”

كثير من الناس قد يقول أن العاطفة موجبة للجملة الأولى ومحايدة للجملة الثانية، صحيح؟

جميع الصفات (النعت والحال والأفعال) لا ينبغي أن نعاملها بنفس الطريقة بخصوص تحليل العاطفة. في المثال السابق “لطيف” أكثر شخصية من “أحمر”.

السياق والقطبية

كل كلمة تُنطق في وقت معين، في مكان معين، من شخص لشخص، أي في سياق محدد وفريد. تحليل العاطفة من غير السياق يزيد الأمر صعوبة. ولكن الآلة لا تستطيع فهم السياق إلا إذا وضح لها صراحة. أحد المشاكل المتعلقة بالسياق هي التغير في القطبية. لنرى مثال بعض الجمل من استطلاع رأي:

“كل شيء فيها.”

“لا شيء قطعاً!”

تخيل أن الردود السابقة إجابة عن سؤال “ماذا أعجبك في المكان؟” الرد الأول موجب والثاني سالب. لكن لو كان السؤال “ماذا ضايقك في المكان؟” هذا يعكس قطبية نفس الردود!

نحتاج إلى الكثير من المعالجة قبل وبعد النموذج لأخذ في الاعتبار على الأقل جزء من السياق المحيط بالكلام الذي نحلله. ولكن هذه عمليات المعالجة سواء قبل أو بعد، بينما تحسن الأداء، إلا أنها ليست بسيطة وأحياناً شديدة التعقيد.

التهكم والسخرية

الاختلافات بين المعنى الحرفي والمعنى المراد (أي السخرية) والأشد منها إهانة (أي التهكم) كثيراً ما تغير العاطفة الموجبة إلى سالبة والعكس حيث تغير العاطفة المحايدة أو السالبة إلى موجبة. ولكن تحديد التهكم أو السخرية يحتاج إلى تحليل مفصل لسياق الكلام، مما يجعله مهمة صعبة للآلة.

المثال التالي إجابات عن السؤال “هل حصلتم على تجربة لطيفة مع خدمة العملاء؟”

“نعم، بالطبع.”

“ليس واحدة فقط، بل الكثير!”

أي عاطفة نعطي للردود السابقة؟ يصعب بدون سياق أو نبرة الكلام أن نحدد إذا ما كانت هذه الردود حرفية، أم أنها تهكمية لإبراز شدة الضيق.

المقارنة

من تحديات تحليل العاطفة هي كيفية التعامل مع المقارنات في العاطفة. في المثال التالي:

“هذا المنتج لا مثيل له.”

“هذا أفضل من القديم.”

“هذا أفضل من لا شيء.”

هناك بعض المقارنات لا تحتاج لتوضيح عن السياق لتصنيفها صحيحاً كما في المثال الأول. في المثال الثاني والثالث يزداد الأمر تعقيداً. هل نصنفهم كموجب أم محايد؟ ربما نختار موجب للثاني ومحايد للثالث. هنا السياق يشكل عامل كبير. فمثلا إذا كان “القديم” عديم الفائدة فنعتبره مثل الثالث “لا شيئ”، ولكن من دون السياق يبدو أن المثالين مختلفين.

الرموز التعبيرية emojis

هناك نوعان من الرموز التعبيرية وفقاً ل [2]. الرموز التعبيرية الغربية مثل “:D” والتي تمثل في حرف أو بعض الحروف، والرموز التعبيرية الشرقية مثل “¯ \ _ (ツ) _ / ¯” التي تتكون من عدد أكبر من الحروف. عملياً، تلعب الرموز التعبيرية دوراً مهماً في تحليل العاطفة.

تحليل العاطفة على تغريدات تويتر يحتاج اهتمام خاص على مستوى الحرف مثل مستوى الكلمات، ولهذا نحتاج لمعالجة قبلية لنصوص تركز على الحروف. كمثال، ربما نعالج التغريدات ونحول جميع الرموز التعبيرية الغربية منها والشرقية إلى كلمات محددة لتسهيل التعامل معها والتعرف عليها للنموذج. مثل تحويل “:D” إلى “وجه_مبتسم” أو ما شابه من كلمات محددة لا ترد في النص الأصلي.

هنا قائمة من الرموز التعبيرية:

https://unicode.org/emoji/charts/full-emoji-list.html

تعريف العاطفة المحايدة

تعريف ما نقصده عندما نقول أن تحليل عاطفة النص محايدة يعتبر تحدي آخر في تحليل العاطفة. كما في كل مشاكل التصنيف، تعريف الأصناف (وفي هذه الحالة) الصنف المحايد من أهم خطوات حل المشكلة. ماذا نعني “موجب” و”سالب” و”محايد”؟ لأن تصنيف الداتا يدوياً يحتاج معايير محددة للبشر القائمين بعملية التصنيف، فيجب أن يكون تعريف كل من الأصناف واضحاً ومتناسقاً.

بعض الأفكار لما يتضمنه معنى المحايد:

  1. النصوص الموضوعية. كما ذكرنا سابقاً، النصوص الموضوعية حقاً لا تحتوي على أي عاطفة، فيمكن إدراجها في صنف المحايد.
  2. المعلومات ليس لها علاقة بالموضوع، لكن تحديد أي النصوص ذا أهمية قد يمثل تحدي. علينا الحذر من تأثير هذا النوع على النموذج، فأحياناً إزالته بالكامل من الداتا يسوء الأداء، وأحياناً إضافته بمثابة ضوضاء تشوه على النموذج.
  3. نصوص الأمنيات. بعض الأماني مثل “أتمنى لو كان في المنتج المزيد من المرفقات” عامة محايدة. ولكن الأماني التي تحتوي مقارنات مثل “أتمنى لو كان المنتج أفضل” عادة يصعب تصنيفها.

المراجع:

[1] http://ceur-ws.org/Vol-1096/paper1.pdf

[2] https://hal-amu.archives-ouvertes.fr/hal-01529708/document

المقال الأصلي:

https://monkeylearn.com/sentiment-analysis

 

تعليقات