Arabic Manuscripts Analysis and Retrieval

dc.contributor.authorRashad Ahmed Abdullah othman
dc.date2015
dc.date.accessioned2022-05-18T04:04:52Z
dc.date.available2022-05-18T04:04:52Z
dc.degree.departmentCollege of Computer Science and Engineering
dc.degree.grantorKing Fahad for Petrolem University
dc.description.abstractشهدت السنوات الأخيرة زيادة هائلة في عدد المخطوطات التي يتم حفظها ومعالجتها إلكترونيا والذي بدوره أدى إلى ضرورة ابتكار أساليب كفوءة للتحليل والاسترجاع. تحتوي المخطوطت العربية بدورها على نصوص رئيسية وحواشي و أشكال رسومية وزخارف. يقصد بمشكلة تحليل المخطوطات استخلاص الأجزاء المختلفة من المخطوطة وتصنيفها بحسب النوع. كما يقصد بمشكلة استرجاع محتوى المخطوطة استرجاع المخطوطات التي تحتوي على نصوص معينة. تم في الدراسات السابقة استخدام العديد من المميزات العامة والخاصة لهذا الغرض. المميزات الخاصة تتاثر بالتغيير والاختلاف في الكتابة. والمميزات الخاصة تركز على أجزاء محددة من الكتابة. تم في هذه الرسالة تطوير طريقة جديدة لاستخلاص النصوص الرئيسية والحواشي الموجودة في المخطوطات العربية. وتعتمد هذه الطريقة على اتجاه النص ، كثافة النص و وجود الفراغات بين أجزاء المخطوطة. كما تم تطوير طريقتين جديدتين لايجاد اتجاه النص. تعتمد الطريقتان على حساب تكرار اتجاهات مقاطع الكلمات. كما تم تطوير سمة جديدة تسمى حقيبة أجزاء الكلمات (Bag of Word Fragments (BoWFs)). تعتمد هذه السمة على أجزاء مختلفة من الكلمات مثل الإطار الخارجي للكلمة (Contour) والإطار الداخلي للكلمة (Skeleton). يتم في هذه الطريقة تقسيم مقاطع الكلمة العربية إلى أجزاء صغيرة للكلمة (Word Fragments). ثم يتم توصيف هذه الأجزاء باستخدام سمات سياق الشكل (Shape Context Descriptors) و تكرار الاتجاهات (Histogram of Gradient). تم اختبار طريقة استخلاص النصوص والحواشي باستخدام مجموعة من المخطوطات العربية وحققت الطريقة دقة تصل إلى حوالي 95% . كما تم اختبار السمة الجديدة باستخدام مجموعة من المخطوطات عربية بالإضافة الى الوثائق المطبوعة وحققت الطريقة نتائج متميزة للوثائق المطبوعة بمتوسط دقة يصل إلى 99.20% عندما يكون نسبة الاستراجاع 100% وجيدة للمخطوطات بمتوسط دقة يصل إلى 89.60% عندما يكون نسبة الاسترجاع 50%.
dc.identifier.other2979
dc.identifier.urihttps://drepo.sdl.edu.sa/handle/20.500.14154/669
dc.language.isoen
dc.publisherSaudi Digital Library
dc.thesis.levelDoctoral
dc.thesis.sourceKing Fahad for Petrolem University
dc.titleArabic Manuscripts Analysis and Retrieval
dc.typeThesis

Files

Copyright owned by the Saudi Digital Library (SDL) © 2025