Kajian Literatur Mengenai Klasifikasi Blog
Klasifikasi blog merupakan topik kajian baru. Teknik klasifikasi web tradisional tidak dapat diterapkan secara langsung terhadap blog karena sering terjadinya update terhadap isi dan variasi topik pada suatu situs blog. Komponen penyusun blog seperti judul, isi dan komentar, tag (label), penulis, hyperlink, permalink, outlink, tanggal dan jam termasuk obyek yang perlu dilibatkan dalam proses klasifikasi. Tulisan ini mencoba meninjau berbagai pendekatan klasifikasi blog yang hadir sejak 2009. Pada awal kemunculan blog, klasifikasi biner digunakan untuk membedakan blog dari halaman web biasa. Kami fokus pada bagaimana mengkategorikan suatu blog ke dalam daftar topik, genre dan opini (mood dan sentimen) yang telah didefinisikan sebelumnya.Pada klasifikasi topik dan genre, algoritma kNN, Naive Bayes, CFC, SVM dan pendekatan machine learning lainnnya banyak digunakan.Pemanfaatan ontologi topik dan tag dapat meningkatkan akurasi klasifikasi. Pada deteksi opini, pendekatan berbasis lexicon seperti ANEW cenderung lebih banyak digunakan. Opini dari suatu situs blog juga dapat diprediksi berdasarkan opini di sekitar inlink yang menuju situs tersebut. Kajian ini perlu diperluas dan diperdalam, seperti keterlibatan lebih lanjut dari tag, link dan analisis jejaring sosial.
Kata kunci: klasifikasi blog, analisis sentimen, blog mining
DOI: https://doi.org/10.21107/simantec.v8i2.7223
