Seleksi Fitur Information Gain dan Teknik Pruning Untuk Memperbaiki Akurasi Algoritma C4.5 dalam Kasus Keterlambatan Biaya Kuliah

Taghfirul Azhima Yoga Siswa, Gubtha Mahendra Putra, Anton Prafanto

Abstract


Penerapan biaya kuliah memiliki peranan yang sangat penting di suatu universitas untuk dapat meningkatkan mutu dan infrastruktur pendidikan khususnya di Universitas Muhammadiyah Kalimantan Timur (UMKT). Namun, dalam pelaksanaannya masih banyak mahasiswa yang terlambat dalam melakukan pembayaran biaya kuliah. Hal ini dapat mengganggu UMKT dalam sisi operasional dan pelaksanaan peningkatan mutu serta infrastruktur. Pada penelitian ini akan dilakukan penentuan fitur, penerapan algoritma C4.5, dan evaluasi kinerja algoritma C4.5 dengan menggunakan confusion matrix pada pembagian data 90% data training dan 10% data testing. Untuk mengoptimasi kinerja algoritma C4.5, pada penelitian ini akan diterapkan seleksi fitur menggunakan metode information gain dan pruning. Penelitian ini menggunakan data yang diperoleh dari Biro Administrasi Keuangan dan Biro Administrasi Akademik UMKT dengan jumlah data sebanyak 12.408. Hasil pengujian kinerja algoritma C4.5 tanpa menggunakan seleksi fitur information gain dan teknik pruning memperoleh nilai akurasi sebesar 61,40%. Adapun hasil pengujian kinerja algoritma C4.5 dengan menggunakan seleksi fitur information gain dan teknik pruning memperoleh hasil sebesar 64,86%. Hasil pengujian kinerja algoritma C4.5 dengan menggunakan seleksi fitur information gain dan teknik pruning terbukti mampu meningkatkan kinerja algoritma sebesar 3,45% pada kasus keterlambatan biaya kuliah.


Keywords


Data mining; Klasifikasi; C4.5; information gain; pruning; optimasi; keterlambatan biaya kuliah;

Full Text:

PDF

References


Adnan, G., & Latief, M. A. (2020). Metode Penelitian Pendidikan: Penelitian Kuantitatif, Penelitian Kualitatif, Penelitian Tindakan Kelas. Erhaka Utama, Yogyakarta. ISBN 978-602-5715-34-1.

Apandi, T. H., Maulana, R. B., Piarna, R., & Vernanda, D. (2019). Menganalisis Kemungkinan Keterlambatan Pembayaran Spp Dengan Algoritma C4.5 (Studi Kasus Politeknik Tedc Bandung). Jurnal Techno Nusa Mandiri, 16(2), 93–98.

Desiani, A., Yahdin, S., & Rodiah, D. (2020). Prediksi Tingkat Indeks Prestasi Kumulatif Akademik Mahasiswa dengan Menggunakan Teknik Data Mining. Jurnal Teknologi Informasi Dan Ilmu Komputer, 7(6), 1237-1244.

Daqiqil, I. (2021). Machine Learning : Teori, Studi Kasus dan Implementasi Menggunakan Python. (Versi 1). UNRI Press. https://doi.org/10.5281/ zenodo.5113507.

Ginting, V. S., Kusrini, K., & Taufiq, E. (2020). Implementasi Algoritma C4. 5 untuk Memprediksi Keterlambatan Pembayaran Sumbangan Pembangunan Pendidikan Sekolah Menggunakan Python. Inspiration: Jurnal Teknologi Informasi dan Komunikasi, 10(1), 36-44.

Hermawati, F.A. (2013). Data Mining. Yogyakarta: Penerbit Andi

Iskandar, I., Hiryanto, L., & Hendryli, J. (2018). Prediksi Kelulusan Mahasiswa Menggunakan Algoritma Decision Tree C4. 5 Dengan Teknik Pruning. Jurnal Ilmu Komputer dan Sistem Informasi, 6(1), 64-64.

Jensen, R., & Shen, Q. (2008). Computational Intelligence and Feature Selection - Rough and Fuzzy Approaches. IEEE Press series on computational intelligence.Johnson,

K. J., & Synovec, R. E. (2002). Pattern recognition of jet fuels: comprehensive GC× GC with ANOVA-based feature selection and principal component analysis. Chemometrics and Intelligent Laboratory Systems, 60(1-2), 225-237.

Junita, V., & Bachtiar, F. A. (2019). Klasifikasi Aktivitas Manusia menggunakan Algoritma Decision Tree C4. 5 dan Information Gain untuk Seleksi Fitur. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN, 2548, 964X.

Kurniawan, D. (2022). Pengenalan Machine Learning dengan Python. Jakarta: PT Elex Media Komputindo.

Mardi, Y. (2017). Data Mining: Klasifikasi Menggunakan Algoritma C4. 5. Jurnal Edik Informatika Penelitian Bidang Komputer Sains dan Pendidikan Informatika, 2(2), 213-219.

Nurhayati, Soekarno, I., Hadihardaja, I. K., & Cahyono, M. (2015). IEEE. A study of hold-out and k-fold cross validation for accuracy of groundwater modelling in tidal lowland reclamation using extreme learning machine. 10.1109/TIME-E.2014.7011623.

Nofriansyah, D., & Nurcahyo, G. (2015). Algoritma Data Mining dan Pengujian. Yogyakarta: DEEPUBLISH.

Rohmayani, D. (2020). Analysis of Student Tuition Fee Pay Delay Prediction Using Naive Bayes Algorithm With Particle Swarm Optimation Optimazation (Case Study : Politeknik Tedc Bandung). Jurnal Teknologi Informasi dan Pendidikan, 13(2), 1–8.

Pulungan, A. F. (2019). Analisis Kinerja Bray Curtis Distance, Canberra Distance dan Euclidean Distance pada Algoritma K-Nearest Neighbour. Tersedia di: https://repositori.usu.ac.id/handle/ 123456789/15051 [Diakses 28 Januari 2022]

Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information processing & management, 45(4), 427-437.

Wibawa, A. P. (2018). Metode-metode Klasifikasi. In Prosiding SAKTI (Seminar Ilmu Komputer dan Teknologi Informasi) (Vol. 3, No. 1, pp. 134-138).




DOI: http://dx.doi.org/10.30872/jim.v17i2.11794

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer

Editor Informatika Mulawarman Address:
ISSN 1858-4853 (Print) | ISSN 2597-4963 (Online)

Published by: Mulawarman University
Managed by : Informatika Department
Jalan Sambaliung No.9 Sempaja Selatan Samarinda Utara,
Kalimantan Timur 75117
 - Indonesia
E-mail: jim.unmul@gmail.com
OJS: http://e-journals.unmul.ac.id/index.php/JIM
Contact Person: Gubtha Mahendra Putra

 Creative Commons License

Informatika Mulawarman by http://e-journals.unmul.ac.id/index.php/JIM/index is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Under the CC BY-SA license, authors and other users are able to reprint, distribute or use the material for commercial purposes so long as they give attribution to the journal Informatika Mulawarman and license the republished material under the same license.