Perbandingan Algoritma Stemming Porter dengan Arifin Setiono untuk Menentukan Tingkat Ketepatan Kata Dasar

Dian Novitasari(1*)

(1) Universitas Indraprasta PGRI
(*) Corresponding Author

Abstract


Information Retrieval (IR) adalah sebuah proses yang digunakan untuk menemukan kembali informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis yang didasarkan pada suatu query (inputan user). Meningkatnya jumlah dokumen teks yang dapat diakses di internet dan diikuti dengan meningkatnya kebutuhan pengguna akan perangkat pencarian informasi yang efektif dan efisien. Efektif berarti pengguna mendapatkan dokumen yang relevan dengan query yang diinputkan. Efisien berarti waktu dalam pencarian yang singkat. Salah satu aplikasi umum dari IR adalah search-engine atau mesin pencarian yang terdapat pada jaringan internet yang dapat digunakan oleh pengguna untuk mencari halaman-halaman Web yang dibutuhkannya. Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa Information Retrieval dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke bentuk kata dasarnya. Kata dasar tersebut akan disimpan sebagai index. Dalam Bahasa Indonesia banyak metode stemming yang sudah ada, salah satunya yaitu Porter dan Arifin Setiono. Penelitian inimembandingkan dua stemmers Indonesia, yaitu Porter dan Arifin Setiono. Hasil yang dicapai dalam penelitian ini adalah untuk mengetahui stemmer mana yang lebih efektif dalam menentukan kata dasar dari perbandingan algoritma tersebut.

Keywords


Stemming Bahasa Indonesia, Algoritma Porter, Algoritma Arifin Setiono, Presisi (%)

Full Text:

PDF (Indonesian)

References


Adriani, M., Nazief, B., Asian, J., & Williams, H. E. (1996). Stemming Indonesia A Confixs Stripping Approach. ACMTransactions on Asian Language Information Processing, Vol. 6, No. 4 , 13.

Agusta, L.(2009). Comparasi Algoritma Stemming Porter dengan Algoritma Nazief dan Andriani untuk Stemming Dokumen Teks Bahasa Indonesia. Konfrensi Nasional Sistem dan Informatika. Bali.

Arifin, A. Z., & Setiono, A. N. (2002). Klasifikasi Dokumen Berita Kejadian Berbahasa Indonesia dengan Algoritma Single Pass Clustering. www.its.ac.id.

Asian, J., & Williams, H. E. (2005). Stemming Indonesia. Australia Computer Science Conference.

Garfield, E. (1997). A Tribute To Calvin N. Mooers, A Pioneer Of Information Retrieval. The Scientist.

Kurniawan, E., Fransiska, M., Tinaliah, Rachmansyah. (2014). Penerapan Algoritma K-Means untuk Clustering Dokumen E-Jurnal STMIK GI MDP.

Malem, J. M., & Abidin, T. F. (2011). Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia. Seminar Nasional dan Expo Teknik Elektro. Banda Aceh.

Mandala, R., & Munir, R. (1993). Sistem Stemming Otomatis untuk kata dalam Bahasa Indonesia. Seminar Nasional Aplikasi Teknologi Informasi. Yogyakarta.




DOI: http://dx.doi.org/10.30998/string.v1i2.1031

Refbacks

  • There are currently no refbacks.


Copyright (c) 2017 STRING (Satuan Tulisan Riset dan Inovasi Teknologi)

 

STRING (Satuan Tulisan Riset dan Inovasi Teknologi) indexed by:



Lisensi Creative Commons
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi 4.0 Internasional.
View My Stats

Flag Counter