Klasifikasi Kategori Berita Bahasa Indonesia Menggunakan Algoritma Latent Semantic Analysis (LSA)
Author (Penulis)
Haisyam
Universitas Nusantara PGRI Kediri
Author Identity (NPM)
13.1.03.02.0331
Abstract
Permasalahan dari penelitian ini adalah (1) Bagaimana mengklasifikasi kategori berita yang jelas agar berita yang akan disebarkan mudah dicari? (2) Bagaimana merancang suatu sistem yang dapat melakukan klasifikasi kategori berita yang baik? (3) Bagaimana penggunaan algoritma latent semantic analysis (LSA) untuk proses klasifikasi kategori berita?.
Tujuan yang ingin dicapai pada skripsi ini yaitu mengklasifikasi kategori berita Bahasa Indonesia dan dengan adanya sistem ini diharapkan mampu membantu pengguna dalam menentukan kategori berita dengan tepat. Pemilihan kategori berita ini didasarkan pada kata-kata dalam berita yang relevan dengan kata kunci dari tiap kategori.
Pemanfaatan penambangan teks (text mining) menggunakan algoritma latent semantic analysis merupakan salah satu alternatif pilihan yang berkenaan dengan masalah klasifikasi kategori berita.
Penggunaan latent semantic analysis (LSA) menjadi alternatif pilihan karena mampu menyeleksi kategori berita berdasarkan kata kunci yang telah ditentukan tiap kategori. Hasil dari sistem klasifikasi kategori berita ini adalah untuk membantu pengguna dalam menentukan kategori dari berita yang akan disebarluaskan kemudian.
Pengujian sistem klasifikasi kategori berita Bahasa Indonesia menggunakan algoritma latent semantic analysis (LSA) menghasilkan tingkat akurasi dari sistem sebesar 80% dan waktu yang diperlukan sekitar 1 menit. Hasil yang diperoleh dari sistem berupa sebuah kategori berita yang sesuai dan sistem harus melakukan setiap tahapan secara berurutan.