TOHPATTI CRIPPA PRAHA, . (2023) PENERAPAN TRANSFER LEARNING TERHADAP PERBANDINGAN MODEL KLASIFIKASI BERITA HOAKS BERBAHASA INDONESIA MENGGUNAKAN CONVOLUTIONAL NEURAL NETWORK (CNN) DAN LONG SHORT-TERM MEMORY (LSTM). Sarjana thesis, UNIVERSITAS NEGERI JAKARTA.
Text
COVER.pdf Download (584kB) |
|
Text
BAB 1.pdf Download (142kB) |
|
Text
BAB 2.pdf Restricted to Registered users only Download (435kB) | Request a copy |
|
Text
BAB 3.pdf Restricted to Registered users only Download (176kB) | Request a copy |
|
Text
BAB 4.pdf Restricted to Registered users only Download (721kB) | Request a copy |
|
Text
BAB 5.pdf Restricted to Registered users only Download (108kB) | Request a copy |
|
Text
DAFTAR PUSTAKA.pdf Download (165kB) |
|
Text
LAMPIRAN.pdf Restricted to Registered users only Download (1MB) | Request a copy |
Abstract
Kemudahan dalam mengakses dan berbagi informasi di dunia maya membuat berita palsu menyebar begitu cepat dan sulit untuk diatasi. Untuk mendeteksi berita palsu dengan cepat dan akurat dibutuhkan metode yang tepat, salah satunya dengan menggunakan teknik deep learning. Berdasarkan beberapa penelitian relevan, Convolutional Neural Networks (CNN) dan Long Short Term-Memory (LSTM) menjadi arsitektur deep learning yang mampu memberikan kinerja yang baik dalam menangani tugas klasifikasi berita palsu termasuk berita palsu berbahasa Indonesia. Penelitian ini bertujuan untuk mengetahui perbandingan kinerja model CNN dan LSTM dalam menangani kasus klasifikasi berita palsu bahasa Indonesia. Data yang digunakan berupa teks berita nyata berjumlah 643 yang bersumber dari CNNIndonesia, Liputan6, dan Detik, serta teks berita palsu berjumlah 697 yang bersumber dari TurnBackHoax dengan total keseluruhan keduanya mencapai 1340 data teks berita. Selain itu, dalam penelitian ini juga dilakukan pengujian untuk membuktikan pengaruh teknik transfer learning yang dapat menangani permasalahan keterbatasan jumlah data yang sedikit dan mampu meningkatkan kinerja model. Penerapan teknik transfer learning dilakukan dengan mengkombinasikan pretrained language model IndoBERT terhadap model CNN dan LSTM. Berdasarkan hasil penelitian menunjukkan bahwa model CNN mampu memberikan akurasi terbaik mencapai 99,6269% dan justru mengalami penurunan kinerja ketika dikombinasikan dengan IndoBERT dengan akurasi hanya 96,6418%. Sedangkan model LSTM meskipun tidak mampu mengungguli kinerja model CNN dengan akurasi hanya mencapai 92,9104%, tapi ketika dikombinasikan dengan IndoBERT mampu mengalami peningkatan kinerja dengan akurasi mencapai 97,7612%. Sehingga, dapat dianggap bahwa model CNN tidak mampu untuk menangkap representasi yang dihasilkan oleh IndoBERT sebaik model LSTM. ***** The ease of accessing and sharing information in cyberspace makes fake news spread so fast and difficult to overcome. To detect fake news quickly and accurately, the right methods are needed, one of which is using deep learning techniques. Based on several relevant studies, Convolutional Neural Networks (CNN) and Long Short Term-Memory (LSTM) are deep learning architectures that can provide good performance in handling the task of classifying fake news, including fake news in Indonesian. This study aims to compare the performance of the CNN and LSTM models in handling cases of Indonesian fake news classification. The data used is in the form of 643 real news texts sourced from CNNIndonesia, Liputan6, and Detik, as well as 697 fake news texts sourced from TurnBackHoax with a total of 1340 news text data. In addition, this research also conducted tests to prove the effect of the transfer learning technique which can overcome the problem of limited number of small data and able to improve model performance. The transfer learning technique is applied by combining the IndoBERT pretrained language model with the CNN and LSTM models. Based on the results of the study, it shows that the CNN model can provide the best accuracy, reaching 99.6269% and experiences a decrease in performance when combined with IndoBERT with an accuracy of only 96.6418%. While the LSTM model, although not able to outperform the CNN model with an accuracy of only reaching 92.9104%, when combined with IndoBERT is able to experience increased performance with an accuracy of up to 97.7612%. So, it can be assumed that the CNN model is not able to capture the representation produced by IndoBERT as well as the LSTM model.
Item Type: | Thesis (Sarjana) |
---|---|
Additional Information: | 1). Dr. Widodo, S.Kom., M.Kom. ; 2). Murien Nugraheni, S.T., M.Cs. |
Subjects: | Teknologi dan Ilmu Terapan > Teknik Komputer |
Divisions: | FT > S1 Pendidikan Teknik Informatika Komputer |
Depositing User: | Users 18558 not found. |
Date Deposited: | 29 Aug 2023 06:01 |
Last Modified: | 29 Aug 2023 06:01 |
URI: | http://repository.unj.ac.id/id/eprint/39787 |
Actions (login required)
View Item |