Source retrieval pada deteksi plagiarisme berdasarkan biword fingerprint dengan model ruang vektor

Authors

  • Surya Agustian Teknik Informatika UIN Sultan Syarif Kasim Riau
  • Agung Sucipto

Abstract

Kasus plagiarisme dokumen berkembang semakin banyak seiring dengan pertambahan sumber digital yang pesat yang tersimpan di jaringan internet. Kesulitan ditemui saat harus menguji apakah suatu karya mengandung plagiarisme, dan di mana menemukan sumber aslinya (source retrieval) dari jutaan artikel dan dokumen yang ada tersebut. Penelitian ini bertujuan untuk melakukan pendeteksian kasus plagiarisme dari banyak dokumen sumber. Sistem pencarian sumber dokumennya menggunakan model ruang vektor, dengan kueri berbentuk frase word-n-gram, dengan n dari 3, 4 dan 5 (triword, quadword dan pentaword). Eksperimen dengan berbagai kombinasi, dilakukan dengan atau tanpa stemming, dan variasi pada frekuensi kata. Hasil yang diperoleh memberikan rekomendasi dokumen mana yang paling mirip dengan dokumen input dari sejumlah dokumen hasil pencarian awal. Hal ini sangat membantu manusia dalam menemukan dokumen sumber yang paling banyak diplagiasi.

Downloads

Published

2020-12-14

Issue

Section

Information Technology