UTILIZING DATA-DRIVEN AND KNOWLEDGE-BASED TECHNIQUES TO ENHANCE ARABIC SPEECH RECOGNITION
No Thumbnail Available
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Saudi Digital Library
Abstract
تعتبر ظاهرة تغير نطق الكلمات واحدة من العوامل التي تؤدي إلى ضعف الأداء في أنظمة التعرف على الكلام العربي. وتظهر عوامل ضعف الأداء في شكلين أساسين: الأول هو حدوث التغير في النطق داخل الكلمة نفسها، بينما يتجلى العامل الثاني في حدوث التغير بين كلمتين متجاورتين، بحيث تندمج هاتان الكلمتان مع بعضهما مما يؤدي الى اختلاف النطق المفترض بسبب حدوث التداخل وفقدان الحد الفاصل بينهما. إن ظاهرة التغير في النطق سواء على مستوى الكلمة او بين كلمتين متجاورتين تؤدى الى ظهور كلمات جديدة غير مدرجة في القاموس الصوتي، وينتج عن ذلك زيادة في عدد الكلمات الخاطئة في النتائج والتي تؤدي أيضاً إلى انتاج تراكيب لغوية خاطئة. نقترح في هذه الرسالة استخدام معلومات اللغة وبيانات التدريب من أجل نمذجة ظاهرة التغير في نطق الكلمات (على مستوى الكلمة، بين كلمتين، ومشكلة التراكيب اللغوية الخاطئة). تم فحص الطرق المقترحة من خلال إستخدام نظام تعرف على الكلام تم بناؤه في جامعة الملك فهد للبترول والمعادن بإستخدام وسائل التعرف على الكلام (سفنكس) المقدمة من جامعة "كارنيجي ميلون". تم نمذجة ظاهرة التغير في النطق داخل الكلمة الواحدة وذلك بإستخدام طريقة البرمجة الديناميكية من اجل مطابقة سلاسل الفونيمات لإنتاج المتغيرات المقترحة من المدونة الصوتية. وقد أظهر استخدام هذه الطريقة تحسناً ملحوظاً في الأداء بنسبة 1.82 في المئة. كما تمت نمذجة ظاهرة إندماج الكلمات باستخدام ثلاثة طرق منفصلة كالتالي: بإستخدام معلومات اللغة التي تحتوى على القواعد الفونولوجية، إستخدام أقسام الكلام لدمج الكلمات المتجاورة، و بيانات التدريب لدمج الكلمات الصغيرة. وقد أظهر إستخدام هذه الطريق تحسناً ملحوظاً في الأداء. إذ تحسن الاداء بأعلى نسبة بإستخدام طريقة أقسام الكلام حيث كانت النسبة 2.39 في المئة، تلتها طريقة القواعد الفونولوجية بنسبة 2.30 في المئة، وبعدها طريقة دمج الكلمات الصغيرة بنسبة 2.16 في المئة. تم نمذجة ظاهرة الأخطاء التركيبية وذلك بإعادة تقييم الفرضيات الناتجة من نظام التعرف بحيث يتم إعتماد أفضل فرضية بعد عملية التقييم. تم إستخدام المدونة النصية (بعد توصيف كلماتها) من اجل التنقيب عن أكثر التراكيب شيوعاً في اللغة العربية وبالتالي ايجاد أفضل فرضية من حيث تطابقها مع تراكيب اللغة. ولم تظهر هذه الطريقة تحسناً في الأداء.