Implementasi Ekstraksi Fitur untuk Klasifikasi Suara Urban Menggunakan Deep Learning

Via Wahyuningtyas

doi:10.30872/jsakti.v3i1.4442

Implementasi Ekstraksi Fitur untuk Klasifikasi Suara Urban Menggunakan Deep Learning

Via Wahyuningtyas

Abstract

Pengolahan suara merupakan konsep yang sangat penting untuk semua jenis sistem yang membutuhkan interaksi manusia dalam kegiatan sehari-hari. Salah satu teknik yang digunakan dalam pengolahan suara adalah ekstraksi ciri suara dan klasifikasi yang memiliki pengaruh langsung dalam sistem pengenalan suara. Namun, teknik pengenalan audio yang telah dikembangkan sangat beragam yang bertujuan untuk memperbaiki dan meningkatkan efisiensi akurasi, pengenalan pola, pemrosesan sinyal, ekstraksi dan tingkat pengenalan untuk menghasilkan klasifikasi yang akurat. Dalam penelitian ini, untuk menganalisis dan membuktikan bahwa menggunakan metode Melf-Frequency Cepstral Coefficients (MFCC) untuk mengekstraksi data suara dari sampel yang berupa input suara dari lingkungan perkotaan dapat diimplementasikan dengan baik, kemudian melakukan klasifikasi dengan menggunakan Convolutional Neural Network (CNN) untuk menyempurnakan model dengan skor Akurasi Klasifikasi yang baik. Dari hasil penelitian, bahwa model berkinerja dengan sangat baik dan juga dapat di prediksi dengan baik saat diuji terhadap data audio baru.

Keywords

MFCC; Audio; CNN; Classification; Feature Extraction

Full Text:

PDF

References

L. M. Aiello, R. Schifanella, D. Quercia, and F. Aletta, “Chatty maps: Constructing sound maps of urban areas from social media data,” R. Soc. Open Sci., vol. 3, no. 3, 2016.

M. D. Egan, J. D. Quirt, M. Z. Rousseau, R. T. Beyer, and S. Walker, “Architectural Acoustics View online : https://doi.org/10.1121/1.398174 View Table of Contents : https://asa.scitation.org/toc/jas/86/2 Published by the Acoustical Society of America Architectural Acoustics : Principles and Practice The Journal of the Acoustical Society of America 104 , 3151 ( 1998 ); https://doi.org/10.1121/1.423953 REVIEWS Fourier Analysis,” vol. 4, no. 1989, 2010.

Yousra F. Al-Irhaim dan Enaam Ghanem Saeed,” Arabic Word Recognition Using Wavelet Neural Network " J. Chem. Inf. Model., vol. 53, no. 9, pp. 1689–1699, 2019.

Jayadeva, R. Khemchandani, and S. Chandra, “Twin support vector machines for pattern classification,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 29, no. 5, pp. 905–910, 2007.

B. K. Baniya, D. Ghimire, and J. Lee, “Automatic music genre classification using timbral texture and rhythmic content features,” Int. Conf. Adv. Commun. Technol. ICACT, vol. 2015-August, no. 3, pp. 434–443, 2015.

S. Zahid, F. Hussain, M. Rashid, M. H. Yousaf, and H. A. Habib, “Optimized Audio Classification and Segmentation Algorithm by Using Ensemble Methods,” Math. Probl. Eng., vol. 2015, 2015.

DOI: http://dx.doi.org/10.30872/jsakti.v3i1.4442

Refbacks

There are currently no refbacks.

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

2nd Floor, Faculty of Computer Science and Information Technology
Jl. Panajam Kampus Gn. Kelua Universitas Mulawarman Samarinda-Kalimantan Timur 75123
Phone: +62 813 31112002 (Haviluddin) +62 811 8207777 (Reza)
E-Mail: jurnal.sakti.fkti@gmail.com; sakti@unmul.ac.id

Sains, Aplikasi, Komputasi dan Teknologi Informasi by http://e-journals.unmul.ac.id/index.php/jsakti eISSN: 2684-8473 is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Username
Password
Remember me