The Data Heterogeneity Issue Regarding COVID-19 Lung Imaging in Federated Learning

dc.contributor.advisorProf.Kamal Jambi
dc.contributor.authorAlhafiz,Fatimah
dc.date.accessioned2025-07-16T18:37:46Z
dc.date.issued2025-05-01
dc.description.abstractبرز التعلم المتحد في تدريب البيانات الطبية لما يقدمه من ضمان الحفاظ على خصوصية بيانات المرضى. التعلم المتحد هو إطار عمل يندرج تحت تعليم الآلة التعاوني حيث يتيح لعدد من الجهات الموزعة بتدريب بياناتها محليا دون الحاجة لمشاركة هذه البيانات أو الإفصاح عنها وتقوم هذه الجهات فقط بمشاركة أوزان النموذج الذي تم تدريبه. يتم احتساب اوزان جديده من نماذج التعلم التي تم تدريبها محليا ويسمى بالنموذج العالمي. بحيث يكون النموذج العالمي أكثر قدرة على تعميم النتائج وأقل تأثرًا بالانحرافات في البيانات المحلية نظراً لتحقق شرطي نجاح التعلم العميق وهي سعة البيانات الكبيرة والتنوع في هذه البيانات الخاضعة للتدريب. تعد مشكلة عدم تجانس البيانات الطبية تحدياً جوهرياً في نتائج التعلم المتحد وظهرت هذه المشكلة في جانحة كوفيد -19 بشكل جليّ. حيث اختلفت شدة المرض وأعراضه بين أعمار مختلفة من المصابين في عدد من التوزيعات السكانية حول العالم أدى ذلك لظهور مشكلة البيانات غير المتجانسة في المستشفيات والمراكز الصحية الموزعة. يناقش هذا البحث مشكلة عدم تجانس البيانات في صور الرئة الملتقطة لمرضى كوفيد -19، وتتمثل الإضافة الجوهرية في هذه الدراسة في اقتراح أنواع جديدة من تغاير البيانات الطبية بما في ذلك الانحراف الحاد في التصنيفات وانحراف الخصائص. يقسم هذا البحث أنواع التباين أو التغير في البيانات بناء على نوع الانحرافات المتعلقة بهذه البيانات. كما يقدم وصفاً رياضياً لستة أنواع من الانحرافات مستندة إلى الأحوال الواقعية التي تشهدها البيانات الطبية في المراكز الموزعة. ومن خلال تقييم هذه الأنواع على أداء التعلم المتحد ضمن سيناريوهات مختلفة من توزيع البيانات حيث بدأت بتوزيع مثالي ومن ثم يزداد تعقيداً لقياس قدرة النموذج على قراءة نتائج صحيحة في ظروف تغاير حادة، ظهرت من خلالها انحراف التوزيع الكمي وتوزيع التصنيفات بنتائج مشابهة للتوزيع المثالي بينما أظهر إنحراف التصنيفات الحاد وانحراف أنواع التصوير كأسوائها أثراً على أداء التعلم المتحدة، وأظهر إنحراف طرق جمع البيانات بنتائج مرضية مما قد يحقق الأهداف المرجوة من تعاون الأطراف الموزعة. من خلال التحليل العميق لأداء التعلم المُتحد في ظل التباين الواقعي للبيانات ، تؤكد هذه الدراسة على التحديات والفرص المحورية لتطوير أُطر تعلم تعاوني أكثر قوة ، وأكثر قابلية للتعميم ، وتتمتع بقدرة أعلى على التخصيص دون المساس بمبادئ الخصوصية والموثوقية في التطبيقات الطبية .
dc.format.extent147
dc.identifier.urihttps://hdl.handle.net/20.500.14154/75859
dc.language.isoen
dc.publisherSaudi Digital Library
dc.subjectFederated learning
dc.subjectData heterogeneity
dc.subjectNon-IID
dc.subjectGeneralization met ric
dc.subjectPersonalization metric
dc.titleThe Data Heterogeneity Issue Regarding COVID-19 Lung Imaging in Federated Learning
dc.typeThesis
sdl.degree.departmentFaculty of Computing and Information Technology
sdl.degree.disciplineComputer Sciences
sdl.degree.grantorKing Abdulaziz University
sdl.degree.nameDoctor of Philosophy

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
SACM-Dissertation.pdf
Size:
6.26 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.61 KB
Format:
Item-specific license agreed to upon submission
Description:

Copyright owned by the Saudi Digital Library (SDL) © 2025