A Keyphrase Extraction Algorithm and its Potential on Arabic
No Thumbnail Available
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Saudi Digital Library
Abstract
تُظهِر العبارات المفتاحية في مستند ما المواضيع الأساسية المناقشة في ذلك المستند. ونظراً لعدم توفر العبارات المفتاحية في الكثير من مراكز المحتوى الرقمي، فقد أصبحت الحاجة ملحة إلى خوارزميات عالية الكفاءة لاستخراج العبارات المفتاحية. تهدف برمجيات استخراج العبارات المفتاحية آليا إلى الاستفادة من التقدم في الحوسبة من حيث السرعة والكفاءة لحساب حل مشاكل استكشاف واستخدام العبارات المفتاحية دون التكاليف )في الجهد والوقت( المرتبطة بعمل البشر في تصنيف المستندات. ندرس في هذا العمل البحثي بعضا من السمات التي يمكن استخدامها لتحسين جودة استخراج العبارات المفتاحية وتطبيقها على خوارزمية تدعى "خوارزمية استخراج العبارات المفتاحية". ونجري أيض ا دراسة تحليلية للخوارزمية المحسنة مقارنة مع بعض الخوارزميات المستخدمة في نفس المجال. ونستخدم في هذه الدراسة التحليلية مجموعتين من مجموعات البيانات. تحوي الأولى مستندات تمثل أبحاثا علمية باللغة الإنجليزية. بينما تحوي الثانية مستندات أنشأناها كجزء من هذا العمل تمثل وثائق باللغة العربية.