Sistem Pendeteksi Plagiasi Pada Artikel Menggunakan Algoritma Rabin-Karp Di CV. Digimedia Corpindo


Author (Penulis)

Ibnu Ngaulansyah
Universitas Nusantara PGRI Kediri

Author Identity (NPM)

11.1.03.02.0156

Abstract

Sistem pendeteksi plagiasi pada artikel yang dilakukan di CV. Digimedia Corpindo ini merupakan penelitian yang dilatar belakangi oleh berkembangnya internet di kalangan masyarakat sehingga banyak bermunculan website-website yang menyediakan informasi kurang akurat sampai dengan berisi dengan hal-hal yang berbau plagiasi. Menghindari plagiasi di beberapa website CV. Digimedia Corpindo, penelitian ini dilakukan guna mencari calon content writer baru yang lebih kompeten. Permasalahan yang dialami dalam penelitian ini adalah (1) Bagaimana menerapkan algoritma Rabin-Karp untuk mendeteksi sebuah tingkat kemiripan artikel yang dibual oleh calon content writer dengan sumber yang diberikan? (2) Bagaimana menentukan presentase tingkat kemiripan artikel yang dibuat oleh pelamar? Sistem pendeteksi plagiasi pada artikel ini nantinya akan dibandingkan dengan beberapa artikel sumber yang telah dimasukkan oleh admin ke dalam sistem kemudian dibandingkan dengan artikel yang diinputkan oleh pelamar. Dengan menggunakan algoritma Rabin-Karp yang sudah terbukti mampu melakukan pencocokan string dalam jumlah banyak. Secara garis besar artikel terlebih dahulu akan diparsing dalam bentuk k-grams kemudian dihitung nilai hashing sampai menentukan tingkat similatrity pada artikel yang dibuat oleh pelamar tersebut. Kesimpulan dari penelitian ini adalah (1) Algoritma Rabin-Karp mampu digunakan untuk mendeteksi tingkat kemiripan (similarity) artikel yang dibuat oleh calon content writer dibandingkan dengan artikel sumber yang dimasukkan oleh penguji. Caranya yakni dimulai dengan text preprocessing, parsing k-grams, kemudian dilakukan perhitungan hashing dan string mathing sehingga menghasilkan nilai similarity. (2) Dalam penentuan tingkat similarity, banyaknya kata, karakter dan ada atau tidaknya spasi dalam pengujian turut mempengaruhi nilai similarity dan juga jumlah parsing k-grams juga berpengaruh dalam tingkat similarity. Berkaca dari kesimpulan hasil penelitian tersebut, maka disarankan agar lebih melengkapi di bagian text preprocessing, dimana bagian tersebut lebih ditekankan di bagian stemming agar waktu proses yang berjalan semakin cepat.

Keyword

a

Reference


PUBLISHED

2018-02-15

JOURNAL

Simki-Techsain

ISSN

2599-3011

ISSUE

Vol. 02 No. 04 Tahun 2018

Download PDF

Lembaga Penelitian dan Pengabdian Kepada Masyarakat UN PGRI Kediri.

Jl. KH. Ahmad Dahlan 76 Mojoroto Kota Kediri

Designed by BootstrapMade
LPPM Server - Powered by BSI