Severity Prediction Model for Highway Crashes in Qassim, Saudi Arabia Using Machine Learning Algorithms

Loading...
Thumbnail Image
Date
2023-06-01
Journal Title
Journal ISSN
Volume Title
Publisher
Qassim University
Saudi Digital Library
Abstract
Among the G20 countries, Saudi Arabia is focusing very much on traffic safety. Driver distraction is the primary cause of increased high-severity traffic accidents. Several models including lots of factors have been presented in investigations of severity of traffic accidents world-wide. Most of these studies are data specific and region specific. there are so many methods of analysis for this issue that the topic will remain hot issue for coming few years. In this study, severity prediction models were developed and implemented for Qassim Province in Saudi Arabia. Traffic accident data for the assessment period from January 2017 to December 2019 were obtained from the Ministry of Transport and Logistic Services. Three classifiers, two of which are ensemble machine learning methods including random forest and XGBoost, and third being logistic regression, modeled the crash injury severity. A resampling technique was used to deal with the problem of bias. SHapley Additive exPlanations (SHAP) analysis interpreted and ranked the factors contributing to crash injury. Two forms of modeling, namely multi and binary classification were adopted. Among the three models, XGBoost achieved the highest values of performance indicators including classification accuracy (71%), precision (70%), recall (71%), F1-scores (70%), and area under the Receiver Operating Characteristic (ROC) curve (AUC) (0.87) when used for multi-category classifications. While adopting the target as a binary classification, XGBoost again outperformed the other classifications with an accuracy of 94% and an AUC of 0.98. The SHAP results from both global and local interpretations illustrated that the accidents classified under property damage only, were primarily categorized by their consequences and the number of vehicles involved. The type of road and lighting conditions were mainly defined by the injury class. The death class was classified with respect to temporal parameters, including month and day of the week, as well as road type. Assessing the factors associated with the severe injuries caused by road traffic accidents will assist policy-makers in developing safety mitigation strategies in the Qassim Region, as well as in other regions of Saudi Arabia.
Description
من بين دول مجموعة العشرين ، تركز المملكة العربية السعودية بشكل كبير على السلامة المرورية. تشتيت انتباه السائق هو السبب الرئيسي لزيادة الحوادث المرورية ذات الخطورة الشديدة. حول العالم تم تقديم العديد من النماذج للتنبؤ بخطورة الحوادث كل منها يحتوي على معاملات كثيرة ومتنوعة. غالبية هذه الدراسات ذات بيانات ومناطق دراسة محددة. هناك العديد من طرق التحليل والنمذجة لهذه المشكلة والتي ستظل موضوعًا ساخنًا لسنوات قليلة قادمة. في هذه الدراسة ، تم تطوير وتنفيذ نماذج للتنبؤ بخطورة الحوادث لمنطقة القصيم في المملكة العربية السعودية. تم الحصول على بيانات الحوادث المرورية للفترة من يناير 2017 إلى ديسمبر 2019 من وزارة النقل والخدمات اللوجستية. تم استخدام ثلاثة مصنفات، وهي Random Forest و XGBoost والانحدار اللوجستي ، نمذجت شدة إصابة الاصطدام. تم استخدام تقنية إعادة التشكيل للتعامل مع مشكلة التحيز. قام تحليل SHapley Additive exPlanations (SHAP) بتفسير وتصنيف العوامل المساهمة في إصابة التصادم. تم اعتماد شكلين من النمذجة: التصنيف المتعدد والثنائي. من بين النماذج الثلاثة ، حقق XGBoost أعلى دقة تصنيف (71٪) وتدقيق (70٪) واسترجاع (71٪) ودرجة F1 (70٪) ومنطقة أسفل المنحنى ROC (AUC) (0.87) عند استخدامها للتصنيفات متعددة الفئات. أثناء اعتماد الهدف كتصنيف ثنائي ، تفوق XGBoost مرة أخرى على التصنيفات الأخرى بدقة 94٪ و AUC بقيمة 0.98. أظهرت نتائج SHAP من التفسيرات العامة والدقيقة على حد سواء أن الحوادث المصنفة تحت ضرر الممتلكات فقط تم تصنيفها في المقام الأول من خلال عواقب الحادث وعدد المركبات المنخرطة في الحادث. تم اختيار نوع الطريق و ظروف الإضاءة بشكل أساسي لتقع تحت الحوادث المصنفة بإصابة. الحوادث المصنفة تحت الوفاة تتعلق بالمعايير الزمنية ، بما في ذلك الشهر واليوم من الأسبوع ، وكذلك نوع الطريق. إن تقييم العوامل المرتبطة بالإصابات الخطيرة الناجمة عن حوادث المرور على الطرق سيساعد صانعي السياسات في تطوير استراتيجيات تخفيف السلامة في منطقة القصيم ، وكذلك في مناطق أخرى من المملكة العربية السعودية.
Keywords
traffic safety, severity prediction, machine learning, SHapley Additive exPlanations, SHAP, XGBoost, random forest, regression analysis, تعلم الآلة, الذكاء الاصطناعي, لوغرتميات, السلامة المرورية, الطرق السريعة, التنبؤ
Citation
Collections