Tips, Recipe, and Journey: Abstrak

ABSTRAK

FUAD DAVIRATMA HUSNI. Sistem Pendeteksi Plagiat Harfiah pada Dokumen Teks Berbahasa Indonesia dengan Memanfaatkan Mesin Pencari. Dibimbing oleh AHMAD RIDHA.

Mesin pencari dapat dimanfaatkan untuk mendeteksi plagiat karena mesin pencari adalah salah satu pintu gerbang untuk mendapatkan dokumen sumber plagiat. Penelitian ini bertujuan untuk membentuk korpus dokumen plagiat dan membuat sistem pendeteksi plagiat dengan memanfaatkan mesin pencari. Korpus dokumen plagiat dibuat dengan menyalin 1-3 dokumen sumber dan merestrukturisasi dokumen sumber dengan menerjemahkan bolak-balik menggunakan Google Translate. Korpus dokumen plagiat terdiri atas 100 dokumen. Teks diekstraksi menjadi segmen-segmen yang terdiri atas 4-20 kata. Segmen-segmen tersebut diboboti berdasarkan ada tidaknya kata dalam kamus dengan bobot lebih besar diberikan pada kata yang tidak ada dalam kamus. Penelitian ini berhasil mendeteksi 100% korpus dokumen plagiat dengan maksimal 31% segmen dokumen dan memanfaatkan mesin pencari Google, sedangkan dengan mesin pencari Bing, penggunaan hingga 40% segmen dokumen hanya berhasil mendeteksi 30% korpus dokumen plagiat. Hasil penelitian ini menunjukkan hasil deteksi plagiat tergantung pada kualitas hasil pencarian yang dilakukan mesin pencari.

Kata kunci: deteksi plagiat, mesin pencari, segmentasi

ABSTRACT

FUAD DAVIRATMA HUSNI. Literal Plagiarism Detection System for Indonesian Text Document Using Search Engine. Supervised by AHMAD RIDHA.

Search engines can be used to detect plagiarism because search engines are one of the gateways to get source documents. This research aims to establish a corpus of document plagiarism and develops a system that can detect plagiarism by utilizing search engines. The corpus is created by copying passages from 1-3 source documents and restructuring the source documents by translating back and forth with Google Translate. The corpus consists of 100 documents. The documents are extracted into segments consisting of 4-20 words. The segments will be weighted based on the words existence in Indonesian dictionary where words not found in dictionary are given higher weights. Using Google’s search engine, this study successfully detects 100% of the plagiarized documents using only a maximum of 31% segments. On the other hand, using Bing and 40% segment documents only detects 30% of the corpus. The results of this study show that the performance of online plagiarism detection depends on the quality of the search results provided by search engines.

Keywords: plagiarism detection, search engines, segmentation

Tips, Recipe, and Journey

Minggu, 20 Oktober 2013

Abstrak - SPDP

Tidak ada komentar:

Posting Komentar