RINGKASAN DOKUMEN ILMIAH BERBASIS REPRESENTASI DATA GRAPH MENGGUNAKAN UKURAN CENTRALITY

Mulaab Mulaab

Abstract


Saat ini, informasi banyak tersedia di internet, sangat diperlukan suatu teknik untuk  mendapatkan informasi dengan cepat dan paling efisien. Diantaranya terdapat sumber informasi ilmiah yang berasal dari teks yang tersedia sangat banyak di internet. Oleh karena itu diperlukan teknik dan mekanisme yang baik untuk mengekstrak informasi yang paling relevan darinya. Teknik peringkasan dokumen ilmiah adalah salah satu metode untuk mengkompresi  dari isi  dokumen yang besar menjadi  teks yang lebih pendek. Ringkasan teks yang dihasilkan mengandung pokok-pokok makna dan gagasan yang ada dalam dokumen asli. Ringkasan teks atau dokumen ilmiah berdasarkan ekstraksi adalah memilih sebagian kalimat yang memiliki relevansi tinggi (peringkat) dari dokumen berdasarkan fitur kata dan kalimat tersebut selanjutnya menggabungkan kalimat-kalimat yang dipilih untuk menghasilkan ringkasan dokumen. Pada makalah ini menggunakan model pemeringkatan kalimat penting  berdasarkan ukuran centrality yaitu pentingnya simpul-simpul pada data graph. Kalimat direpresentasikan sebagai data berbasis graph dengan simpul-simpul dari suatu graph.


References


M. Allahyari, S. Pouriyeh, M. Assefi, S. Safaei, E. D. Trippe, J. B. Gutierrez, et al., "Text summarization techniques: a brief survey," arXiv preprint arXiv:1707.02268, 2017.

J. K. Yogan, O. S. Goh, B. Halizah, H. C. Ngo, and C. Puspalata, "A review on automatic text summarization approaches," Journal of Computer Science, vol. 12, pp. 178-190, 2016.

N. Alami, M. Meknassi, and N. En-nahnahi, "Enhancing unsupervised neural networks based text summarization with word embedding and ensemble learning," Expert systems with applications, vol. 123, pp. 195-211, 2019.

M. Hong and H. Wang, "Research on customer opinion summarization using topic mining and deep neural network," Mathematics and Computers in Simulation, 2020.

P. Wu, X. Li, S. Shen, and D. He, "Social media opinion summarization using emotion cognition and convolutional neural networks," International Journal of Information Management, vol. 51, p. 101978, 2020.

A. Abdi, S. Hasan, S. M. Shamsuddin, N. Idris, and J. Piran, "A hybrid deep learning architecture for opinion-oriented multi-document summarization based on multi-feature fusion," Knowledge-Based Systems, p. 106658, 2020.

L. Page, S. Brin, R. Motwani, and T. Winograd, "The PageRank citation ranking: Bringing order to the web," Stanford InfoLab1999.

C.-Y. Lin, "Rouge: A package for automatic evaluation of summaries," in Text summarization branches out, 2004, pp. 74-81.




DOI: https://doi.org/10.21107/simantec.v9i1.9738

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Mulaab Mulaab

Indexed By