Pengujian Akurasi Sistem Rekomendasi Berbasis Content-Based Filtering

Wayan Gede Suka Parwita

Abstract


Rekomendasi dosen pembimbing dalam Sintesys memanfaatkan dokumen UPP dan dokumen publikasi atau penelitian calon dosen pembimbing sebagai dasar penentuan rekomendasi. Adapun dengan semakin banyaknya mahasiswa yang mengajukan UPP maka akan meningkatkan jumlah proses yang dilakukan sehingga perlu ditinjau pengaruh dari penerapan stopword removal sebagai salah satu proses dalam ektraksi dokumen. Penelitian dimulai dengan analisis sistem yang telah dibangun pada penelitian Parwita sebelumnya. Analisis ini memetakan komponen yang akan digunakan dalam pengujian sistem rekomendasi. Setelah analisis sistem, selanjutnya dilakukan pengumpulan data seperti stopword, rekomendasi dosen, dan dokumen penelitian dosen. Setiap dokumen penelitian dosen akan dibandingkan dengan UPP mahasiswa. Nilai tertinggi dari salah satu dokumen penelitian dosen akan digunakan sebagai nilai similaritas antara penelitian dosen dan UPP mahasiswa. Hasil pengujian merupakan nilai precission, recall, dan f-mesure yang digunakan dalam melakukan analisis hasil pengujian. Pengujian sistem rekomendasi dengan proses stopword menunjukkan nilai precission, recall, dan f-measure yang berbeda-beda untuk setiap minimum similarity yang ditetapkan. Nilai tertinggi pada sistem rekomendasi dengan proses stopword untuk precission didapatkan pada minimum similarity 30%, recall pada minimum similarity 5%, dan f-measure pada minimum similarity 20 % dan 25%.


Keywords


sistem rekomendasi; ekstraksi dokumen; pengujian information retrival;

Full Text:

PDF

References


Axler, S., Gehring, F., & Ribet, K. (1997). Linear Algebra Done Right, Second Edition. Computer Engineering, xv, 251. https://doi.org/10.1007/b97662

Debole, F., & Sebastiani, F. (2003). Supervised term weighting for automated text categorization. In Proceedings of the 2003 ACM symposium on Applied computing - SAC ’03 (p. 784). https://doi.org/10.1145/952686.952688

Feldman, R., & Sanger, J. (2006). The Text Mining Handbook. https://doi.org/10.1017/CBO9780511546914

Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques. San Francisco, CA, itd: Morgan Kaufmann. https://doi.org/10.1016/B978-0-12-381479-1.00001-0

Hulth, A. (2003). Improved Automatic Keyword Extraction Given More Linguistic Knowledge. Language, (2000), 216–223. https://doi.org/10.3115/1119355.1119383

Jannach, D., Zanker, M., Felfernig, A., & Friedrich, G. (2011). Recommender systems: an introduction. Cambridge University Press. https://doi.org/10.1017/CBO9780511763113

Lovins, J. B. (1968). Development of a stemming algorithm. Mechanical Translation and Computational Linguistics, 11(June), 22–31. Retrieved from http://journal.mercubuana.ac.id/data/MT-1968-Lovins.pdf

Manning, C. D., Ragahvan, P., & Schutze, H. (2009). An Introduction to Information Retrieval. Information Retrieval. https://doi.org/10.1109/LPT.2009.2020494

Oelze, I. (2009). Automatic Keyword Extraction for Database Search. L3Sde, 17–20. Retrieved from http://www.l3s.de/~demidova/students/thesis_oelze.pdf

Parwita, W. G. S., Swari, M. H. P., & Welda, W. (2018). Perancangan Sistem Rekomendasi Dokumen Dengan Pendekatan Content-Based Filtering. CESS(Journal of Computer Engineering System and Science), 3(1), 65–74.

Srividhya, V., & Anitha, R. (2010). Evaluating preprocessing techniques in text categorization. International Journal of Computer Science and Application, (2010), 49–51. Retrieved from http://www.sinhgad.edu/IJCSA-2012/pdfpapers/1_11.pdf

Tala, F. Z. (2003). A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. M.Sc. Thesis, Appendix D. https://doi.org/10.22146/teknosains.26972

Weiss, S. M., Indurkhya, N., Zhang, T., & Damerau, F. J. (2005). Text mining: Predictive methods for analyzing unstructured information. Text Mining: Predictive Methods for Analyzing Unstructured Information. https://doi.org/10.1007/978-0-387-34555-0

Zobel, J., & Moffat, A. (1998). Exploring the similarity space. ACM SIGIR Forum. https://doi.org/10.1145/281250.281256




DOI: http://dx.doi.org/10.30872/jim.v14i1.1272

Refbacks

  • There are currently no refbacks.


Copyright (c) 2019 Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer

Editor Informatika Mulawarman Address:
ISSN 1858-4853 (Print) | ISSN 2597-4963 (Online)

Published by: Mulawarman University
Managed by : Informatika Department
Jalan Sambaliung No.9 Sempaja Selatan Samarinda Utara,
Kalimantan Timur 75117
 - Indonesia
E-mail: jim.unmul@gmail.com
OJS: http://e-journals.unmul.ac.id/index.php/JIM
Contact Person: Gubtha Mahendra Putra

 Creative Commons License

Informatika Mulawarman by http://e-journals.unmul.ac.id/index.php/JIM/index is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Under the CC BY-SA license, authors and other users are able to reprint, distribute or use the material for commercial purposes so long as they give attribution to the journal Informatika Mulawarman and license the republished material under the same license.