الخليل- معا- نشرت جامعة بوليتكنك فلسطين بحثاً علمياً في مجلة علمية مُحكمة من برنامج الدكتوراه في هندسة تكنولوجيا المعلومات حول"الكشف الذكي عن المعلومات المزيفة في التغريدات العربية"،"Intelligent Detection of FalseInformation in Arabic Tweets".وتم نشر الورقة في مجلة "Symmetry" التابعة لمؤسسة "MDBI" السويسرية.
وأكّد الطالب ثائر ظاهر من برنامج دكتوراة هندسة تكنولوجيا المعلومات المُشترك بيّن (جامعة بوليتكنك فلسطين وجامعة القدس والجامعة العربية الامريكية)،بأنّ نشر الورقة العلمية في مجال كشف الاخبار الزائفة جاء كثمرة لمساق استرجاع المعلومات بإشراف د. محمود الصاحب من جامعة بوليتكنك فلسطين، ومُشاركة د. حمزة طرابيةمن جامعة الطائف، ود. حمودة شنتر من جامعة سبها.
وتُعتبر المعلومات المُزيّفة أو الخاطئة على منصات التواصل الاجتماعي تحديًا كبيرًا يؤدي إلى تضليل المُستخدمين عمدًا، وذلك من خلال الإشاعات أو الدعاية أو المعلومات الخادعة عن شخص أو منظمة أو خدمة. ويُعد موقع "تويتر" من أكثر منصات التواصل الاجتماعي انتشاراً، خاصة في المنطقة العربية، حيث يتزايد عدد المُستخدمين بشكل مطرد، مصحوبًا بزيادة في معدل الأخبار المزيّفة. ولفت ذلك انتباه الباحثين إلى ضرورة توفير بيئة آمنة على الإنترنت خالية من المعلومات المُضللة..
وتهدف الورقة العلمية إلى اقتراح نموذج تصنيف ذكي للكشف المُبكر عن الأخبار الزائفة في التغريدات العربية باستخدام تقنيات معالجة اللغة الطبيعية " NLP"ونماذج التعلم الآلي"ML" و"HHO"Harris Hawks Optimizerكنهج اختيار ميّزة قائم على الغلاف"Wrapper-based".
وخلال العمل على هذا البحث تم استخدام مدونة "تويترعربية" مكونة من"1862" تغريدة مُصنفة مُسبقًا لتقييم كفاءة النموذج المُقترح. وتم استخدام نموذج حقيبة الكلمات "BoW" باستخدام مُخططات ترجيح مُصطلحات مُختلفة لاستخراج الميّزات. وتم التحقيق في ثمانية خوارزميات تعليمية معروفة باستخدام مجموعات مُختلفة من الميّزات، بما في ذلك ملف تعريف المُستخدم، والمُحتوى، وميّزات الكلمات. أظهرت نتائج البحث أنّ نموذج الانحدار اللوجستي "LR" مع نموذج التردد المعكوس للتردد "TF-IDF" حصل على أفضل مرتبة. علاوة على ذلك، يلعب اختيار الميّزات على أساس خوارزمية "HHO" الثنائية دورًا حيويًا في تقليل الأبعاد، وبالتالي تعزيز أداء نموذج التعلّم لاكتشاف الأخبار المزيفة. كما اظهر البحث أنّ نموذج "BHHO-LR" المقترح يمكن أن ينتج عنه تحسين أفضل بنسبة 5٪ مقارنة بالأعمال السابقة في نفس مجموعة البيانات.
مرفق رابط الورقة العلمية هنا