Penghapusan Kolom dan Baris Pertama pada Matriks Distance Untuk Optimasi Spell Checker Damerau-Levenshtein Distance

Puji Santoso, Pundhi Yuliawati, Ridwan Shalahuddin, Ilham Ari Elbaith Zaeni

Abstract


Damerau-Levenshtein Distance menentukan jarak atau jumlah minimum operasi yang dibutuhkan untuk mengubah satu string menjadi string lain, di mana operasi yang digunakan untuk menentukan tingkat kemiripian antar String adalah insertion, deletion, substitution dan transposition. Algoritma ini sendiri dapat juga digunakan untuk mengoreksi kesalahan kata. Namun, Algoritma Damerau-Levenshtein Distance mempunyai kelemahan, yaitu waktu pemrosesan yang lama. Pada perhitungan jarak antara dua string dengan algoritma Damerau-Levenshtein, setiap huruf dari kedua string akan dibandingkan dengan membuat matriks distance. Karena Kamus Bahasa Indonesia memiliki lebih dari 30.000 kata dasar, operasi perhitungan jarak akan dilakukan lebih dari 30.000 kali untuk setiap kesalahan. Penelitian ini mengusulkan peningkatan untuk mempersingkat waktu pemrosesan algoritma Damerau-Levenshtein dengan mengurangi baris dan kolom matriks distance. Hasil akhir yang diharapkan dari penelitian ini adalah waktu pemrosesan menjadi lebih cepat tanpa harus mengorbankan akurasi.

Full Text:

PDF


DOI: http://dx.doi.org/10.30872/jsakti.v2i2.2669

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Sains, Aplikasi, Komputasi dan Teknologi Informasi

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

 

2nd Floor, Faculty of Computer Science and Information Technology
Jl. Panajam Kampus Gn. Kelua Universitas Mulawarman Samarinda-Kalimantan Timur 75123
Phone: +62 813 31112002 (Haviluddin), +62 852 46436015 (Putut), +62 812 35436766 (Hario), +62 811 8207777 (Reza)
E-Mail: jurnal.sakti.fkti@gmail.com; sakti@unmul.ac.id

Creative Commons License
Sains, Aplikasi, Komputasi dan Teknologi Informasi by http://e-journals.unmul.ac.id/index.php/jsakti eISSN: 2684-8473 is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.