Automatic classification of speech and music in digitized audio
dc.contributor.author | Muhammad Kashif Saeed Khan | |
dc.date | 2005 | |
dc.date.accessioned | 2022-05-18T04:52:08Z | |
dc.date.available | 2022-05-18T04:52:08Z | |
dc.degree.department | College of Computer Science and Engineering | |
dc.degree.grantor | King Fahad for Petrolem University | |
dc.description.abstract | ازداد الاهتمام في الآونة الأخيرة بمسألة القدرة على تمييز وتصنيف الإشارات الصوتية إلى إشارات موسيقية وإشارات خطابية. لقد أصبح هذا التصنيف جزءاً مهما من أنظمة قواعد بيانات مستندات متعددة الوسائط. وقد تم القيام بهذا التصنيف في السابق بطرق متعددة. ندرس في هذه الرسالة استخدام المعدل mean ودرجة الانحراف القياسي standatd deviation للتحويل المويحي المتقطع Discrete Wavelet Transform ودرجة الانحراف القياسي لعوالم ميل الترددية Mel-Frequency Cepstral Coefficients وجذر المعدل التربيعي للإشارة المخفضة Root Mean Square of a Lowpass Signal والفرق بين الحد الأقصى والحد الأدنى لعبور الصفر zero crossings إضافة لخصائص أخرى استخدمت سابقاً. وقد تم دراسة طرق التصنيف التالية: الشبكة العصبية التصورية متعددة الطبقات Multi-Layer Perceptron Neural Network والشبكة العصبية ذات الدوال القاعدية الإشعاعية Radial Basis Functions Neural Network ونماذج ماركوف المخفية Hidden Markov Models. كما اقترحنا خوارزمية جديدة لزيادة دقة تصنيف الشبكة العصبية التصورية متعددة الطبقات للإشارات الصوتية الطويلة. نتائج التجارب التطبيقية أثبتت نجاعة طرقنا المقترحة. | |
dc.identifier.other | 4418 | |
dc.identifier.uri | https://drepo.sdl.edu.sa/handle/20.500.14154/1523 | |
dc.language.iso | en | |
dc.publisher | Saudi Digital Library | |
dc.thesis.level | Master | |
dc.thesis.source | King Fahad for Petrolem University | |
dc.title | Automatic classification of speech and music in digitized audio | |
dc.type | Thesis |