PENGOLAHAN SUARA MENGGUNAKAN TRANSFORMASI WAVELET DAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN PEMBICARA

Rustati Rahmi(1*)
(1) STMIK Banjarbaru
(*) Corresponding Author
DOI : 10.35889/progresif.v6i2.79

Abstract

        Pengenalan pembicara berbeda dari pengenalan ucapan (speech recognition), dimana pengenalan ucapan lebih dikonsentrasikan pada ekstraksi dari beberapa bagian informasi pesan yang didalamnya berisikan teks yang diucapkan.  Teks yang diucapkan ini mengandung unit-unit linguistic yang lebih dikenal sebagai Phonem, kata-kata kunci suatu pesan ataupun pesan yang lengkap.  Sedangkan pengenalan pembicara (speaker recognition) menekankan pada analisa suara yang diucapkan oleh setiap pembicara sehingga dapat dibedakan karakteristik unik suara dari tiap pembicara tersebut.

Dalam proses pengenalan pembicara akan dilakukan beberapa proses yaitu: akuisisi data suara digital, kemudian dilakukan proses frame blocking dan windowing (proses segmentasi dan frame) untuk meminimalkan diskontinyuitas sinyal pada bagian awal dan akhir sinyal suara.  Pada proses selanjutnya dilakukan Ekstraksi ciri sebagai proses pemampatan data agar berdimensi kecil tanpa mengubah karakteristik sinyal suara.  Proses ini dilakukan dengan menggunakan Transformasi Wavelet, yaitu menghasilkan koefisien prediksi.  Kemudian dilakukan proses referensi pembicara dengan melakukan pelatihan terhadap data sinyal suara yang telah di-ekstrak, untuk mendapatkan klasifikasi pola suara pembicara yang berbeda, proses ini dilakukan dengan metode JST Som Kohonen.

Dari penelitian ini telah didapati akurasi pengenalan pembicara dengan tingkat keberhasilan sebesar 96% dalam proses pengenalan pola suara.

 

Kata kunci:  Pengenalan Pembicara (recognition speaker), Transformasi Wavelet, SOM Kohonen

References


Agustini, Ketut. 2006. Speaker Identification with Discret Wavelet Transformation of Pra-processing and Neural Network.

Leon, C.G.K, 2009, Robust Computer Voice Recognition Using Improved MFCC Algorithm, Proc. IEEE

Raymond S. Wagner, An Architecture for Distributed Wavelet Analysis and Processing in Sensor Networks, IPSN’06, April 19–21, 2006, Nashville, Tennessee, USA.Copyright 2006 ACM 1595933344/06/0004

Pekka-Henrik Niemenlehto, Martti Juhola, And Veikko Surakka, (2006), Detection of Electromyographic Signals from Facial Muscles with Neural Networks, ACM Transactions on Applied Perception, Vol. 3, No. 1, January 2006, Pages 48–61

Agustini, Ketut, 2007, Biometrik Suara dengan Transformasi Wavelet Berbasis orthogonal Daubenchies, 50 Gematek Jurnal Teknik Komputer, Volume 9 Nomor 2.

Khairulvani, Feni, 2007, Identifikasi Individu Melalui Suara Ucapan dengan Ekstraksi Ciri Mel-Frequency Ceptral Coefficient (MFCC) sebagai Input Jaringan Syaraf Tiruan, Central Library ITB.

Campbell, J.P,JR, 1997, Speaker Recognition: A Tutorial. Proc. IEEE, vol. 85, no 9,pp1437-1462, 1997

Krishnan, M., Neophytou C.P., Prescott G.,(1994),Wavelet Transform Speech Recognition Using Vector Quantization, Dynamic Time Warping and Artificial Neural Network, Center of excellence ini computer aided sistem engineering and Telecomunication & Information Science Laboratory 2291 Irving Hill Drive,Lawrence, KS 66045.

Candra, Heru K.,(2000), Voice Pattern Of Recognition Sistem With The SOM Kohonen,digilib-ITS, Theses Informatics Engineering RT 006.3 Cans,

Lawrence B. Holder,Speech Recognition (Briefly), http://www.cs.berkeley.edu/~russell/classes/cs188/s05/slides/chapter15b.pdf, 16 Mei 2010

Burrus, C.S, Gopinath R.A., Guo, H. (1998), Introduction to Wavelet and Wavelet Transform A Primer, International Edition, Prentice-Hall International, Inc.

Dayhoff, Judith E., (1990),Neural Network Architectures: An Introduction, Van Nostrand Reinhold, New York.

Embree, P.M., Kimble, B., (1991),C Language Algoritms For Digital Signal Processing,Prentice Hall International, Inc.

Fauset, L. (1994),Fundamentals of Neural Network,Prentice Hall, Eaglewood Cliffs, NJ.

Kosko, Bart, (1992), Neural Network For Signal Processing,Prentice-Hall International,Inc

Parson, Thomas, W.,(1986),Voice and Speech Processing,McGraw-Hill,USA

Richard, H. David, M.G., Ivan, L.,(1993),Sound Blaster: The Official Book., McGraw.

Wael Al-Sawalmeh, Khaled Daqrouq, Omar Daoud, Abdel-Rahman Al-Qawasni,2010, Speaker Identification Sistem-based Mel Frequency and Wavelet Transform using Neural Network Classifier, European Journal of Scientific Research.

Firoz, Shah, A, Raji, Sukumar, A and Babu, Anto.P , 2010 , Discrete Wavelet Transforms and Artificial Neural Networks for Speech Emotion Recognition, International Journal of Computer Theory and Engineering, Vol 2, No.3 June

L.Salhi, M., Talbi, and A.Cherif, 2008, Voice Disorders Identification Using Hybrid Approach : Wavelet Analysis and Multilayer Neural Networks, World Academy of Science, Engineering and Technology.


How To Cite This :

Refbacks

  • There are currently no refbacks.