Applying Educational Data Mining Techniques for Identifying At-Risk Student at the Preparatory Year of Higher Education

dc.contributor.advisorAslam, Nida
dc.contributor.authorAlwarthan, Sarah Abdulrahman
dc.date.accessioned2024-01-09T17:41:20Z
dc.date.available2024-01-09T17:41:20Z
dc.date.issued2022
dc.degree.departmentComputer Science Department
dc.degree.grantorImam Abdulrahman Bin Faisal University
dc.descriptionفي اآلونة األخيرة، واجهت المؤسسات التعليمية العديد من التحديات والتي من أهمها الكم الهائل للبيانات التعليمية المخزنة والتي يمكن االستفادة منها في اكتشاف أنماط جديدة لها مساهمة وتأثير كبير لكل من الطالب، المعلمين واإلداريين. أظهر الباحثون من مختلف المجاالت اهتما ًما كبي ًرا بتحسين جودة التعليم في المعاهد التعليمية والجامعات وذلك لغرض تحسين تحصيل الطالب ونتائج التعلم. تعتبر السنة التحضيرية سنة حاسمة لطالب التعليم العالي. فإذا تلقى الطالب المشورة والتوجيه المناسب في مرحلة مبكرة، فسيكون لذلك تأثير جيد على تحصيل الطالب خالل المراحل األكاديمية التالية. إضافة لذلك، فإن تحديد العناصر األكثر تأثراً على المعدل التراكمي ستساعد الطالب وأصحاب القرار على أخذ هذه العناصر بعين االعتبار. تم إجراء العديد من الدراسات للتنبؤ بإنجازات الطالب حيث ركزت معظم الدراسات السابقة على التنبؤ بأداء الطالب في وقت التخرج أو على مستوى مقرر معين. تهدف هذه الدراسة الى تصنيف معدل الطالب التراكمي CGPA في السنة التحضيرية والتنبؤ بالطالب المعرض لخطر الرسوب في مرحلة مبكرة. تطبق هذه الدراسة عدة خوارزميات منها RF وVoting وANN وSVM وDT وLR لبناء أربعة نماذج من اجل تحقيق أهداف هذه الدراسة. تم تقييم العديد من تقنيات اختيار العناصر مثل RFE وGA وPCA لغرض العثور على العناصر األكثر تأثي ًرا. إضافة لذلك، تم تطبيق تقنيات مختلفة لتحقيق التوازن بين مجموعة البيانات المستخدمة في هذه الدراسة منها Link Tomek وNearMiss و Under Random Sampling وSMOTE و Link .SMOTE-Tomek تم استخدام ثالث قواعد بيانات تتعلق بطالب السنة التحضيرية في مسار العلوم اإلنسانية بجامعة اإلمام عبدالرحمن بن فيصل. قواعد البيانات التي تم جمعها عبارة عن مجموعة بيانات غير متوازنة، وقد تم استخدام تقنية Link SMOTE-Tomek لموازنة قواعد البيانات الثالثة المقترحة. وأخي ًرا، أظهرت النتائج أن RF تفوقت على التقنيات األخرى حيث سجلت أعلى دقة وهي %99.66 و%92.20 و%95.36 لبناء النموذج الثاني والثالث والرابع. حققت تقنية Voting أعلى دقة حيث بلغت %99.25 لبناء النموذج األول. عالوة على ذلك، فان تقنية RFE المبنية على Information Mutual توصلت الى أفضل العناصر لبناء النموذجين األول والثاني. أخي ًرا، لم تقم هذه الدراسة فقط بتطوير العديد من نماذج التصنيف لتحديد الطالب المعرضين للخطر، ولكنها ذهبت أيضا إلى أبعد من ذلك، حيث استخدمت تقنيات XAI مثل LIME و model surrogate global SHAP لتفسير نماذج التنبؤ المقترحة، وشرح المخرجات و إبراز أسباب فشل الطالب.
dc.identifier.urihttps://hdl.handle.net/20.500.14154/71028
dc.language.isoen
dc.publisherImam Abdulrahman Bin Faisal University
dc.subjectComputer Science
dc.subjectData Mining
dc.titleApplying Educational Data Mining Techniques for Identifying At-Risk Student at the Preparatory Year of Higher Education
dc.typeThesis
sdl.degree.nameMaster's Degree

Files

Copyright owned by the Saudi Digital Library (SDL) © 2024