AUTOMATIC EXTRACTION OF ARABIC SUBWORD UNITS FOR CONTINUOUS SPEECH RECOGNITION

NAHAR KHAL MOHAMED OQLA

AUTOMATIC EXTRACTION OF ARABIC SUBWORD UNITS FOR CONTINUOUS SPEECH RECOGNITION

dc.contributor.author	NAHAR KHAL MOHAMED OQLA
dc.date	2013
dc.date.accessioned	2022-05-18T04:13:57Z
dc.date.available	2022-05-18T04:13:57Z
dc.degree.department	College of Computer Science and Engineering
dc.degree.grantor	King Fahad for Petrolem University
dc.description.abstract	تهتم الأبحاث الحديثة في مجال التعرف على الأصوات بالتعرف على الصوت المتصل المستقل عن المتحدث. إن تمييز الصوت المتصل هو أكثر تحديا من غيره من الاصوات وذلك بسبب التغير الكبير في نطق الكلمات أثناء الكلام المتواصل ويعزى ذلك إلى لهجة وعمر وجنس المتكلم وإلى قرب أو بعد الكلمات عن بعضها. إن النموذج الصوتي الذي يمثل كلمات لغة ما يسمى بالألفون. وقد وجدت بعض الدراسات التي تحقق في مدى دقة وأمثلية الفونات الخاصة باللغة الإنجليزية، في حين لا يوجد مثل هذه الدراسات للألفونات العربية والمستخدمة حاليا في تمييز الصوت المتصل. ومن الجدير بالذكر أنه وخلال هذه ألأطروحة تعرضىنا للعديد من خوارزميات وطرق التصنيف والتقطيع للبيانات الصوتية وقمنا بتقييمها بهدف الاستفاده منها في اشتقاق الوحدات الصوتية الأساسية للصوت العربي المتصل. كما قمنا باستحداث آلية مهجنة من طريقتين وهما نموذج ماركوف الخفي والشبكة العصبية الاصطناعية (HMM/LVQ-ANN) لتمييز الألفونات العربية الموضوعة من قبل خبراء اللغة. بالاعتماد على طرق الاستخلاص المباشر من البيانات الصوتية نفسها ، حيث قمنا بدراسة إستخلاص الوحدات الصوتية الأساسية العربية الأكثر ملائمة للغة. فقد قمنا بانتاج عدة مجموعات من الوحدات الصوتية الاساسية وبأحجام 30، 50، 70، 90 و 150 وقمنا باستخدام هذه المجموعات في انتاج المدونات الصوتية المقابلة لكل مجموعه. لقد تبين لنا أن المجموعة المكونة من 70 عنصرا من الوحدات الصوتية الأساسية كانت الأفضل من ناحية الدقة عند استخدامها في تمييز الصوت سواء على مستوى الوحدات الصوتية الأساسية أو على مستوى الكلمات . حيث بلغت نسبة الأولى 79.3% والثانية 34.08% و بالرغم من أن النسبة على مستوى الكلمات غير مقنعه إلا أن هذه الطريقة تعتبر فريدة من نوعها في مجال استخلاص الوحدات الصوتية الأساسية العربية بطريقة الاستخلاص المباشر من البيانات الصوتية.
dc.identifier.other	4373
dc.identifier.uri	https://drepo.sdl.edu.sa/handle/20.500.14154/962
dc.language.iso	en
dc.publisher	Saudi Digital Library
dc.thesis.level	Doctoral
dc.thesis.source	King Fahad for Petrolem University
dc.title	AUTOMATIC EXTRACTION OF ARABIC SUBWORD UNITS FOR CONTINUOUS SPEECH RECOGNITION
dc.type	Thesis

Collections

King Fahad for Petrolem University

AUTOMATIC EXTRACTION OF ARABIC SUBWORD UNITS FOR CONTINUOUS SPEECH RECOGNITION

Files

Collections