WAHID RIZQI AKBAR NURJAMAN, . (2023) ANALISIS ALGORITMA CLUSTER CONDITIONAL MARKOV RANDOM WALK DENGAN METODE EKSTRAKTIF DAN VARIASI FREKUENSI TF-IDF PADA PERINGKASAN MULTI-DOCUMENT BERBAHASA INDONESIA. Sarjana thesis, UNIVERSITAS NEGERI JAKARTA.
Text
COVER.pdf Download (655kB) |
|
Text
BAB I.pdf Download (254kB) |
|
Text
BAB II.pdf Restricted to Registered users only Download (635kB) | Request a copy |
|
Text
BAB III.pdf Restricted to Registered users only Download (534kB) | Request a copy |
|
Text
BAB IV.pdf Restricted to Registered users only Download (583kB) | Request a copy |
|
Text
BAB V.pdf Restricted to Registered users only Download (125kB) | Request a copy |
|
Text
DAFTAR PUSTAKA.pdf Download (123kB) |
|
Text
LAMPIRAN.pdf Restricted to Registered users only Download (580kB) | Request a copy |
Abstract
Informasi merupakan salah satu bagian terpenting dalam sejarah kehidupan manusia. Dalam ranah ilmu pengetahuan, informasi yang berharga dan dapat dipertanggungjawabkan kebenarannya ditulis dalam bentuk jurnal ilmiah, artikel atau dokumen. Semakin terbiasanya masyarakat Indonesia menggunakan teknologi komputer maupun smartphone dan banyaknya informasi yang beredar di Internet, berhasil menyediakan kemudahan untuk mendapatkan pengetahuan yang mereka inginkan dengan sentuhan jari. Salah satu metode untuk memudahkan temu kembali informasi, diperlukan adanya peringkasan teks terlebih dahulu dan pengetahuan yang telah berkembang menghasilkan peringkasan teks otomatis dengan model tertentu. Penelitian ini bertujuan untuk menganalisa model algoritma Conditional Cluster-based Markov Random Walk dengan sudah diterapkan preprocessing dan teknik clustering K-Means untuk peringkasan teks otomatis. Dataset yang digunakan sudah disetujui oleh pakar Bahasa Indonesia dengan topik utama Natural Language Processing. Hasil model ini, dengan analisa ROGUE-1 menunjukkan performa terbaik untuk variasi TF-IDF standard dengan nilai presisi 0.495, recall 0.294 dan F-measure 0.370 pada 10 dokumen dan hasil ringkasan 20 kalimat. Sementara untuk hasil variasi TF-IDF dengan filter thesaurus Sinonim menunjukkan performa terbaik dengan nilai persisi 0.543, recall 0.282 dan F- measure 0.372 pada 10 dokumen dan hasil ringakasan 20 kalimat. ***** Information is one of the most important parts of the history of human life. In the realm of science, valuable and reliable information is written in the form of scientific journals, articles, or documents. The more accustomed Indonesian people are to using computer and smartphone technology and the amount of information circulating on the Internet, successfully providing the convenience of getting the knowledge they want at the touch of a finger. One of the methods to facilitate information retrieval, text summarization is needed first, and the knowledge that has developed results in automatic text summarization with certain models. This research aims to analyze the Conditional Cluster-based Markov Random Walk algorithm model with preprocessing and K-Means clustering techniques for automatic text summarization. The dataset used has been approved by Indonesian language experts with the main topic of Natural Language Processing. The results of this model, with ROGUE-1 analysis, show the best performance for standard TF- IDF variation with precision value 0.495, recall 0.294, and F-measure 0.370 on 10 documents and 20 sentences summary results. While for the result of the TF-IDF variation with the Synonym filter, shows the best performance with a precision value of 0.543, recall of 0.282, and F-measure 0.372 on 10 documents and 20 sentences summary results.
Item Type: | Thesis (Sarjana) |
---|---|
Additional Information: | 1). Dr. Widodo, M.Kom. ; 2). Irma Permata Sari, S.Pd., M.Eng. |
Subjects: | Teknologi dan Ilmu Terapan > Teknik Komputer |
Divisions: | FT > S1 Pendidikan Teknik Informatika Komputer |
Depositing User: | Users 19543 not found. |
Date Deposited: | 04 Sep 2023 04:43 |
Last Modified: | 04 Sep 2023 04:43 |
URI: | http://repository.unj.ac.id/id/eprint/40921 |
Actions (login required)
View Item |