Hierarchal clustering algorithm for large XML data
No Thumbnail Available
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Saudi Digital Library
Abstract
يتم استخدام خوارزميات تجميع البيانات في مجالات واسعه منها الأعمال التجارية ، والمجالات العلمية والهندسية. ومن الأمثلة على ذلك التسويق ، والمعلوماتية الحيوية وعلم الوراثة و الطب و التعليم. تجميع بيانات لغة اكس-ام-ال هي من البحوث النشطة لان لغة اكسام-ال هي التنسيق الأكثر شعبية لتبادل البيانات على شبكة الانترنت. علاوة على ذلك، فان تجميع بيانات لغة اكس-ام-ال يحسن من كفاءة معالج استعلام الجيل الجديد من قواعد البيانات ، قواعد بيانات لغة اكس-ام-ال.
في هذه الرسالة نقدم دراسة استقصائية لخوارزميات تجميع البيانات الغير منظمة و الشبة منظمة. ثم نقترح خوارزمية جديدة لتجميع بيانات لغة اكس-ام-ال والتي تستخدم لحفظ هذه النوعية من البيانات. أيضا في هذه الرسالة سنقوم بتوسيع خوارزمية بيرش ذات الخاصية الهرمية لتشمل القيم الغير رقمية. تبين التجارب ان الخوارزمية المقترحة في هذه الرسالة تقوم بمسح البيانات مرتين فقط للقيام بالتجميع العنقودي لهيكل و محتوى لغة اكس-ام-ال. و تبين التجارب أيضا أن اجزاء الخوارزمية المقترحة لديها نمو خطي في التحليل الزمني و نمو دون المستوى الخطي في تحليل المساحات، الأمر الذي يجعلها مناسبة للبيانات ذات الحجم الكبير. وقد بينت التجارب أن بالمئة وهي نسبة عالية في مجال تجميع البيانات الغير منظمة و الشبه منظمة. 5..8 معدل دقة الخوارزمية المقترحة هو
الكلمات الرئيسية : لغة الرقم القابلة للامتداد، التحليل العنقودي، تحليل البيانات ، تحليل لغة الرقم القابلة للامتداد ، استخراج البيانات، الخوارزميات ، تحليل الشبكة العنكبوتية، تحليل قواعد البيانات