PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

Andry Kurniawan, Firdaus Solihin, Fika Hastarita

Abstract


ABSTRAK

Banyak informasi beasiswa yang ada di internet, di satu sisi memunculkan kesulitan bagi para pencari beasiswa untuk mendapatkan informasi beasiswa. Konsep sistem pencarian berbasis information retrieval (IR), dapat digunakan untuk proses mencari informasi beasiswa melalui media internet. Pembangunan IR pada penelitian ini menggunakan konsep vector space model (VSM). Untuk pengumpulkan data informasi beasiswa menggunakan Web Crawler, hasil dari proses crawling akan disimpan ke dalam basis data. Aplikasi Web Crawler yang digunakan adalah Web Crawler Vietspider. Kesamaan data beasiswa yang akan diintegrasikan oleh cosine similarity. Dengan menggunakan cosine similarity untuk membentuk data beasiswa yang relevan satu sama lain yang dibutuhkan oleh user berdasarkan query yang dimasukkan. Berdasarkan hasil dari pengujian sistem, didapatkan nilai minimal cosine similarity paling baik adalah threshold 0,1. Dengan rata-rata presentase nilai f-measure atau tingkat efisiensi kinerja sistem ini mencapai 19,9 %.

Kata kunci : Beasiswa, Information Retrieval, Vector Space Model, Web Crawler, Cosine Similarity.


ABSTRACT

Many a scholarship information available in the internet, on the other hand that makes difficult for seeker to find scholarship information. The concept of search system based information retrieval (IR) can be used for the process of searching for scholarship information via internet. The development of IR in this study uses the concept of vector space model (VSM). For the collecting data of scholarship information is using Web Crawler, the results of crawling process are stored in the basis data. The applications that use a web crawler is a web crawler vietspider. The similarity of scholarship data is to be integrated by the cosine similarity to form a scholarship of data relevant to each other is needed by user based on the query entered. Based on the results of the testing system, the score of at least the most well cosine similarity threshold is 0.1. The average percentage value of the f-measure system performance or the level of efficiency reached 19.9%.

Keyword: Scholarship, Information Retrieval, Vector Space model, Web Crawler, Cosine Similarity.


References


Manning, Christopher, D., Raghavan,P., dan Schutze,H. An Introduction to Information retrieval. Cambridge : University Press; 2008.

Darmawan, H.A., Wurijanto, T., Masturi, A. Rancang Bangun Aplikasi Search Engine Tafsir Al-Qur'an Menggunakan Teknik Text Mining Dengan Algoritma VSM (Vector Space Model). Surabaya : Program Studi Sistem Informasi STIKOM ; 2010.

Fahmi, A. Rancangan Bangun Sistem Pencarian dan Hirarki pasal-pasal tentang lalu lintas dan angkutan jalan dengan menggunakan cosine similarity. Bangkalan : Skripsi Jurusan Teknik Informatika Fakultas Teknik, Universitas Trunojoyo Madura ; 2013.

Mastur, M. Perbandingan efektifitas antara penghapusan stoplist dengan penghapusan stoplist dan kata umum pada dokumen hasil klasifikasi pretopology. Bangkalan : Skripsi Jurusan Teknik Informatika Fakultas Teknik, Universitas Trunojoyo Madura ; 2012.




DOI: https://doi.org/10.21107/simantec.v4i2.1392

Refbacks

  • There are currently no refbacks.


Copyright (c) 1970 Andry Kurniawan, Firdaus Solihin, Fika Hastarita

Indexed By