RAZI AZIZ SYAHPUTRO, . (2017) PERBANDINGAN ALGORITMA K-NEAREST NEIGHBOR, NAÏVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE DALAM KLASIFIKASI JUDUL KARYA AKHIR MAHASISWA PROGRAM STUDI PTIK UNJ. Sarjana thesis, UNIVERSITAS NEGERI JAKARTA.
Text
Razi Aziz Syahputro - 5235131563 - skripsi.pdf Download (15MB) |
Abstract
Penelitian ini dilatarbelakangi dengan dibutuhkannya sistem pengklasifikasian untuk memudahkan pihak Jurusan Teknik Elektro khususnya Program Studi PTIK untuk mengklasifikasikan judul skripsi berdasarkan peminatan. Sebelum sistem dibuat diperlukan pertimbangan dari beberapa algoritma klasifikasi yang ada, maka dari itu penelitian ini memilih 3 algoritma dari 10 algoritma terbaik menurut ICDM tahun 2006. Klasifikasi terhadap dokumen teks pendek seperti judul skripsi mahasiswa memiliki kesulitan tersendiri daripada dokumen teks panjang karena semakin sedikit kata semakin sulit diklasifikasi. Sehingga tujuan dari penelitian ini adalah untuk mengetahui algoritma yang paling efisien untuk mengklasifikasi judul skripsi. Penelitian ini terdiri dari beberapa tahap yaitu pengumpulan data, pengelompokan data melalui angket oleh dosen ahli, pre-processing text, pembobotan kata menggunakan vector space model dan tf-idf, evaluasi dengan k�fold cross validation, klasifikasi menggunakan k-nearest neighbor, naïve bayes classifier, dan support vector machine, dan analisis dengan confusion matrix. Percobaan dilakukan dengan menggunakan 266 data judul skripsi mahasiswa PTIK UNJ dari angkatan 2010-2013, dengan data terakhir berasal dari sidang skripsi pada semester 105(semester ganjil 2016/2017). Hasil dari klasifikasi menggunakan algoritma tersebut didapatkan algoritma yang paling efisien yaitu support vector machine dengan akurasi 82% dari 10 kali percobaan. The background of this research is the need of classification system of facilitate the Departmenet of Electrical Engineering, especially the Study Program of PTIK to classify the title of the thesis based on specialization. Before the system was made, it was necessary to consider some of the existing classification algorithms so that the analysis choosed three algorithms from the best ten algorithms according to ICDM in 2006. The classification of short text documents using students’ thesis title has its own difficulties rather than the long one because fewer words are not easy. Therefore, the purpose of this research is to find out the most effective algorithm to classify the title of thesis. This research consists of several stages: data collection, data grouping by make a judgement by an expert, pre-processing text, weighting words using vector space model and tf-idf, evaluation with k-fold cross validation, classification using k-nearest neighbor, naïve bayes classifier, support vector machine, and analysis with confusion matrix. The experiment was conducted by using 266 data titled thesis of PTIK UNJ students from force 2010-2013, with the current data coming from the thesis trial in semester 105 (odd semester 2016/2017). The result of the classification using the algorithm obtained the most effective algorithm that is support vector machine with an accuracy of 82% of 10 experiments.
Item Type: | Thesis (Sarjana) |
---|---|
Additional Information: | 1) Widodo, M. Kom 2) Hamidillah Ajie, S.Si., M.T |
Subjects: | Teknologi dan Ilmu Terapan > Teknik Komputer |
Divisions: | FT > S1 Pendidikan Teknik Informatika Komputer |
Depositing User: | sawung yudo |
Date Deposited: | 27 Apr 2022 03:11 |
Last Modified: | 27 Apr 2022 03:11 |
URI: | http://repository.unj.ac.id/id/eprint/28314 |
Actions (login required)
View Item |