An Automatic Detection Model for Social Engineering Attacks Using Machine Learning Techniques in Saudi Twitter Feed

Thumbnail Image

Date

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Imam Abdulrahman Bin Faisal University

Abstract

Security issues are one of the most important issues that take the biggest attention of countries’ leaders. Social media especially Twitter is constituting a real threat on the national security as it is being used for publishing the extremist thoughts and terrorism. Despite of the great efforts provided by the government to maintain the national security, protecting people’s mentality from being deceived is a difficult mission to be achieved. In the field of information security, there is a lack of studies that provide an analysis of social engineering attacks in social networking sites especially in Saudi Arabia and the Arabic content. In this study, the researcher provided a taxonomy of social engineering attacks in Saudi Twitter feed (called SEAST) that was done using a data collected from Saudi Twitter. As a result, in Saudi Twitter feed, there are five main entities that can be used to classify a social engineering attack which are: social engineer, victim, goal, attack method, and persuasion factor. In addition, this study proposed a machine learning model for detecting a subset of SE attacks defined in SEAST taxonomy. This study proposed the use of three features sets in the ML model which are: URL-based features, tweet-based features, and account-based features. The proposed ML model showed that Random Forest classifier outperformed other classifiers used in the experiment with an accuracy of 97.88%. Finally, this study proposed a real-time system for detecting and preventing SE attacks in Twitter using Random Forest classifier in Python and it achieved an accuracy of 95.12%.

Description

تشكل وسائل التواصل الاجتماعي وخاصة تويتر تهديدًا حقيقيًا للأمن الوطني حيث يتم استخدامه لنشر الأفكار المتطرفة والإرهاب. على الرغم من الجهود الكبيرة التي بذلتها الحكومة للحفاظ على الأمن الوطني، فإن حماية عقلية المستخدم من الخداع هي مهمة صعبة، حيث أن المهندسون الاجتماعيون يستهدفون عقول البشر للوصول لأهدافهم التي قد تكون سياسية، مادية، أو شخصية عن طريق وسائل التواصل الاجتماعي. في مجال أمن المعلومات، هناك نقص في الدراسات التي تقدم تحليلًا لهجمات الهندسة الاجتماعية في مواقع التواصل الاجتماعي خاصة في المملكة العربية السعودية والمحتوى العربي. في هذه الدراسة، قدم الباحث تصنيفًا لهجمات الهندسة الاجتماعية في تويتر السعودية (يسمى SEAST) الذي تم إجراؤه باستخدام بيانات تم جمعها من موقع تويتر السعودي. نتيجة لذلك، في تويتر السعودية، هناك خمسة عوامل رئيسية يمكن استخدامها لتصنيف هجمات الهندسة الاجتماعية وهي: المهندس الاجتماعي، الضحية، الهدف، طريقة الهجوم، وعامل الإقناع. بالإضافة إلى ذلك، اقترحت هذه الدراسة نموذجًا للتعلم الآلي للكشف عن مجموعة فرعية من هجمات الهندسة الاجتماعية التي سبق ذكرها في SEAST. اقترحت هذه الدراسة استخدام ثلاث مجموعات أساسية من الخصائص في نموذج تعلم الآلة وهي: خصائص الرابط المرفق في التغريدة وخصائص التغريدة وخصائص الحساب الناشر للتغريدة. أظهر نموذج تعلم الآلة المقترح أن الخوارزمية Random Forest تفوقت على الخوارزميات الأخرى المستخدمة في التجربة بدقة 97.88٪. أخيرا، اقترحت هذه الدراسة نظامًا للكشف عن هجمات الهندسة الاجتماعية في تويتر عن طريق برنامج بلغة Python يقوم بتدريب الآلة على كشف هذا النوع من الهجمات باستخدام الخوارزمية Random Forest وأفضل خمس خصائص من الخصائص التي تم اختبارها مسبقا في التجربة وحقق النظام المقترح دقة بنسبة 95.12 ٪.

Keywords

national security, machine learning, Twitter information security, social engineering

Citation

Endorsement

Review

Supplemented By

Referenced By

Copyright owned by the Saudi Digital Library (SDL) © 2025