Automatic classification of speech and music in digitized audio
No Thumbnail Available
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Saudi Digital Library
Abstract
ازداد الاهتمام في الآونة الأخيرة بمسألة القدرة على تمييز وتصنيف الإشارات الصوتية إلى إشارات موسيقية وإشارات خطابية. لقد أصبح هذا التصنيف جزءاً مهما من أنظمة قواعد بيانات مستندات متعددة الوسائط. وقد تم القيام بهذا التصنيف في السابق بطرق متعددة. ندرس في هذه الرسالة استخدام المعدل mean ودرجة الانحراف القياسي standatd deviation للتحويل المويحي المتقطع Discrete Wavelet Transform ودرجة الانحراف القياسي لعوالم ميل الترددية Mel-Frequency Cepstral Coefficients وجذر المعدل التربيعي للإشارة المخفضة Root Mean Square of a Lowpass Signal والفرق بين الحد الأقصى والحد الأدنى لعبور الصفر zero crossings إضافة لخصائص أخرى استخدمت سابقاً. وقد تم دراسة طرق التصنيف التالية: الشبكة العصبية التصورية متعددة الطبقات Multi-Layer Perceptron Neural Network والشبكة العصبية ذات الدوال القاعدية الإشعاعية Radial Basis Functions Neural Network ونماذج ماركوف المخفية Hidden Markov Models. كما اقترحنا خوارزمية جديدة لزيادة دقة تصنيف الشبكة العصبية التصورية متعددة الطبقات للإشارات الصوتية الطويلة. نتائج التجارب التطبيقية أثبتت نجاعة طرقنا المقترحة.