Perbandingan Kinerja IndoBERT dan KNN Dalam Analisis Sentimen Ulasan Tokopedia Google Playstore
Abstract
Perkembangan aplikasi e-commerce di Indonesia mendorong meningkatnya jumlah ulasan pengguna pada platform Google Playstore. Ulasan tersebut mengandung informasi penting mengenai persepsi dan tingkat kepuasan pengguna terhadap layanan aplikasi. Namun, besarnya volume data ulasan menyebabkan analisis manual menjadi tidak efisien. Oleh karena itu, diperlukan pendekatan otomatis berbasis Natural Language Processing (NLP) untuk mengklasifikasikan sentimen ulasan pengguna. Penelitian ini bertujuan untuk membandingkan kinerja model IndoBERT dan K-Nearest Neighbor (KNN) dalam analisis sentimen ulasan aplikasi Tokopedia di Google Playstore. Dataset yang digunakan berjumlah 12.172 ulasan pengguna yang diklasifikasikan ke dalam tiga kelas sentimen, yaitu positif, netral, dan negatif. Proses pelabelan sentimen dilakukan menggunakan kamus InSet. Evaluasi performa model dilakukan menggunakan metrik akurasi, precision, recall, dan F1-score, serta dianalisis menggunakan confusion matrix. Hasil penelitian menunjukkan bahwa model IndoBERT memiliki performa yang lebih unggul dibandingkan KNN dalam seluruh metrik evaluasi. Temuan ini menunjukkan bahwa model berbasis transformer lebih efektif dalam memahami konteks bahasa Indonesia pada data ulasan aplikasi.
Keywords
Full Text:
PDFReferences
Aji, B. P., & Aditya, R. (2025). Implementasi IndoBERT untuk Klasifikasi Sentimen Ulasan E-Commerce Indonesia. Jurnal Teknologi Informasi Dan Komputer, 15(1), 23–35.
Budiharto, W. (2016). Machine Learning untuk Klasifikasi Data Mining. Penerbit Andi.
Chevalier, J. A., & Mayzlin, D. (2006). The Effect of Word of Mouth on Sales: Online Book Reviews. Journal of Marketing Research, 43(3), 345–354.
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. ArXiv Preprint ArXiv:1810.04805.
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2020). BERT: Bidirectional Encoder Representations from Transformers. Journal of Machine Learning Research, 21(1), 1–15.
Feldman, R., & Sanger, J. (2007). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press.
Group, G. (2023). Annual Report 2023: Tokopedia Performance and Market Reach. GoTo Group Indonesia.
Han, J., Kamber, M., & Pei, J. (2022). Data Mining: Concepts and Techniques (4 (ed.)). Morgan Kaufmann Publishers.
Kasim Aidid, M., Dewi Putri, A., & Rais, Z. (2025). Penerapan Algoritma K-Nearest Neighbor (K-NN) untuk Analisis Sentimen Ulasan Aplikasi Lazada. Jurnal Teknologi Informasi, 13(1), 45–58.
Kotler, P., & Keller, K. L. (2016). Marketing Management (15 (ed.)). Pearson Education Limited.
Koto, F., Rahimi, A., Lau, J. H., & Baldwin, T. (2020). IndoLEM and IndoBERT: A Benchmark Dataset and Pre-trained Language Model for Indonesian NLP. Proceedings of the 28th International Conference on Computational Linguistics, 757–770.
Koto, F., & Rahmaningtyas, G. Y. (2017). InSet Lexicon: Evaluation of a Word List for Indonesian Sentiment Analysis in Microblogs BT - 2017 International Conference on Asian Language Processing (IALP).
Kusuma, I. H., & Cahyono, N. (2023). Analisis Sentimen Masyarakat Terhadap Penggunaan E-Commerce Menggunakan Algoritma K-Nearest Neighbor dan Natural Language Processing. Jurnal Sistem Informasi Bisnis, 13(2), 156–168.
Lillah, R. R., Maylawati, D. S. S., Budiawan, W., Zulfikar, W. B., Uriawan, W., & Wahana, A. (2023). Implementasi Algoritma K-Nearest Neighbor (KNN) untuk Analisis Sentimen Pengguna Aplikasi Tokopedia. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 7(4), 892–899.
Limbong, J. J. A., Sembiring, I., & Hartomo, K. D. (2022). Analisis Klasifikasi Sentimen Ulasan Pada E-commerce Shopee Berbasis Word Cloud Dengan Metode Naïve Bayes Dan K-Nearest Neighbor. Jurnal Media Informatika Budidarma, 6(3), 1725–1734.
Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers.
Luqyana, W. A., Cholissodin, I., & Perdana, R. S. (2018). Analisis Sentimen Cyberbullying pada Komentar Instagram dengan Metode Klasifikasi Support Vector Machine. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(11), 4704–4713.
Mas, R., Panca, R. W., Atmaja1, K., & Yustanti2, W. (2021). Analisis Sentimen Customer Review Aplikasi Ruang Guru Dengan Metode BERT (Bidirectional Encoder Representations from Transformers). Journal of Emerging Information Systems and Business Intelligence (JEISBI), 2(3), 2021. https://doi.org/10.26740/JEISBI.V2I3.41567
Medhat, W., Hassan, A., & Korashy, H. (2014). Sentiment Analysis Algorithms and Applications: A Survey. Ain Shams Engineering Journal, 5(4), 1093–1113.
Park, D. H., Lee, J., & Han, I. (2007). The Effect of On-Line Consumer Reviews on Consumer Purchasing Intention: The Moderating Role of Involvement. International Journal of Electronic Commerce, 11(4), 125–148.
Powers, D. M. W. (2020). Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness and Correlation. Journal of Machine Learning Technologies, 2(1), 37–63.
Rahman, M., & Ikhsan, M. F. (2025). Sentiment Analysis pada Platform E-Commerce: Pendekatan Berbasis Deep Learning. Jurnal Kecerdasan Buatan, 8(2), 89–101.
Rahman, R. D., Setiawan, N. Y., & Bachtiar, F. A. (2025). Analisis Sentimen Berbasis Aspek Menggunakan BERT dan KMeans Clustering pada Review Aplikasi Blibli. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 9(2), 234–245.
Rizqi, R. M., & Yustanti, W. (2021). Analisis Sentimen Customer Review Aplikasi Ruang Guru dengan Metode BERT (Bidirectional Encoder Representations from Transformers). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 5(9), 3657–3663.
Saifurridho, M., Martanto, & Hayati, U. (2023). Analisis Sentimen Ulasan Pengguna Aplikasi Shopee di Google Playstore Menggunakan K-Nearest Neighbor (K-NN). Jurnal Sistem Informasi Dan Teknologi, 11(3), 234–242.
Sanh, V., Debut, L., Chaumond, J., & Wolf, T. (2019). DistilBERT, a Distilled Version of BERT: Smaller, Faster, Cheaper and Lighter. ArXiv Preprint ArXiv:1910.01108.
Sarkar, D., Bali, R., & Sharma, T. (2018). Practical Machine Learning with Python: A Problem-Solver’s Guide to Building Real-World Intelligent Systems. Apress.
Schindler, R. M., & Bickart, B. (2005). Published Word of Mouth: Referable, Consumer-Generated Information on the Internet. In C. P. Haugtvedt, K. A. Machleit, & R. F. Yalch (Eds.), Online Consumer Psychology: Understanding and Influencing Consumer Behavior in the Virtual World (pp. 35–61). Lawrence Erlbaum Associates.
Sharda, R., Delen, D., & Turban, E. (2021). Analytics, Data Science, & Artificial Intelligence: Systems for Decision Support (11 (ed.)). Pearson Education Limited.
Sharma, A., Kumar, R., & Singh, P. (2021). Google Colaboratory for Deep Learning: A Comprehensive Study. International Journal of Computer Science and Mobile Computing, 10(5), 89–98.
Sofjan, A. (2017). Manajemen Pemasaran: Dasar, Konsep, dan Strategi. PT RajaGrafindo Persada.
Stanton, W. J., Etzel, M. J., & Walker, B. J. (1994). Fundamentals of Marketing (10 (ed.)). McGraw-Hill.
Sutopo, W., Kusumaningsih, A., & Nurlaeli, L. (2020). E-Marketplace untuk UMKM dalam Meningkatkan Daya Saing Produk. Jurnal Manajemen Teknologi, 19(2), 156–170.
Turban, E., Strauss, J., & Lai, L. (2015). Social Commerce: Marketing, Technology and Management. Springer International Publishing.
Tutuko, B., Fajri, F., & Sukemi, S. (2022). Membandingkan Nilai Akurasi BERT dan DistilBERT pada Dataset Twitter tentang COVID-19. Jurnal Teknologi Informasi Dan Ilmu Komputer, 9(4), 789–798.
Urva, G., Sharma, M., & Singh, R. (2023). Multi-level Sentiment Analysis: Document, Sentence and Aspect-based Approaches. Journal of Natural Language Processing, 18(2), 145–162.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2020). Attention is All You Need. Advances in Neural Information Processing Systems, 30, 5998–6008.
Zhang, Y., Li, M., Wang, S., & Liu, B. (2020). Distance Metrics in K-Nearest Neighbor Algorithm: A Comprehensive Review. Journal of Data Science and Analytics, 12(3), 234–248.
DOI: http://dx.doi.org/10.30872/jurti.v9i4.26305
Refbacks
- There are currently no refbacks.
Copyright (c) 2025 Jurnal Rekayasa Teknologi Informasi (JURTI)

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Alamat Redaksi :
Program Studi Informatika
Fakultas Teknik
Jl. Sambaliung No. 9 Kampus Gunung Kelua Samarinda 75119 - Kalimantan Timur
e-mail : jurti.unmul@fkti.unmul.ac.id
Url : http://e-journals.unmul.ac.id/index.php/INF
Contact Person : Medi Taruk [08195075640]
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.









