Arabic Manuscripts Analysis and Retrieval

No Thumbnail Available

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Saudi Digital Library

Abstract

شهدت السنوات الأخيرة زيادة هائلة في عدد المخطوطات التي يتم حفظها ومعالجتها إلكترونيا والذي بدوره أدى إلى ضرورة ابتكار أساليب كفوءة للتحليل والاسترجاع. تحتوي المخطوطت العربية بدورها على نصوص رئيسية وحواشي و أشكال رسومية وزخارف. يقصد بمشكلة تحليل المخطوطات استخلاص الأجزاء المختلفة من المخطوطة وتصنيفها بحسب النوع. كما يقصد بمشكلة استرجاع محتوى المخطوطة استرجاع المخطوطات التي تحتوي على نصوص معينة. تم في الدراسات السابقة استخدام العديد من المميزات العامة والخاصة لهذا الغرض. المميزات الخاصة تتاثر بالتغيير والاختلاف في الكتابة. والمميزات الخاصة تركز على أجزاء محددة من الكتابة. تم في هذه الرسالة تطوير طريقة جديدة لاستخلاص النصوص الرئيسية والحواشي الموجودة في المخطوطات العربية. وتعتمد هذه الطريقة على اتجاه النص ، كثافة النص و وجود الفراغات بين أجزاء المخطوطة. كما تم تطوير طريقتين جديدتين لايجاد اتجاه النص. تعتمد الطريقتان على حساب تكرار اتجاهات مقاطع الكلمات. كما تم تطوير سمة جديدة تسمى حقيبة أجزاء الكلمات (Bag of Word Fragments (BoWFs)). تعتمد هذه السمة على أجزاء مختلفة من الكلمات مثل الإطار الخارجي للكلمة (Contour) والإطار الداخلي للكلمة (Skeleton). يتم في هذه الطريقة تقسيم مقاطع الكلمة العربية إلى أجزاء صغيرة للكلمة (Word Fragments). ثم يتم توصيف هذه الأجزاء باستخدام سمات سياق الشكل (Shape Context Descriptors) و تكرار الاتجاهات (Histogram of Gradient). تم اختبار طريقة استخلاص النصوص والحواشي باستخدام مجموعة من المخطوطات العربية وحققت الطريقة دقة تصل إلى حوالي 95% . كما تم اختبار السمة الجديدة باستخدام مجموعة من المخطوطات عربية بالإضافة الى الوثائق المطبوعة وحققت الطريقة نتائج متميزة للوثائق المطبوعة بمتوسط دقة يصل إلى 99.20% عندما يكون نسبة الاستراجاع 100% وجيدة للمخطوطات بمتوسط دقة يصل إلى 89.60% عندما يكون نسبة الاسترجاع 50%.

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By

Copyright owned by the Saudi Digital Library (SDL) © 2025