OPTIMASI CLUSTER DENGAN ALGORITMA K-MEANS++ BERBASIS TEKNIK REDUKSI PRINCIPAL COMPONENT ANALYSIS

NURLAELA, . (2017) OPTIMASI CLUSTER DENGAN ALGORITMA K-MEANS++ BERBASIS TEKNIK REDUKSI PRINCIPAL COMPONENT ANALYSIS. Sarjana thesis, UNIVERSITAS NEGERI JAKARTA.

[img] Text
Skripsi_Nurlaela_3125121995.pdf

Download (65MB)
[img] Other
Skripsi_Nurlaela_3125121995.pdf

Download (0B)

Abstract

Clustering atau pengelompokkan merupakan bagian dari fungsi data mining yang bertujuan untuk mengelompokkan sejumlah data atau objek yang memiliki kesamaan sifat. K-Means adalah suatu metode clustering tidak hierarki yang mengelompokkan objek menggunakan titik pusat atau centroid. Terdapat beberapa masalah mengenai metode K-Means ini yaitu k buah centroid yang dipilih secara acak mengakibatkan hasil clustering yang kurang optimal serta variabel atau atribut yang banyak (data berdimensi tinggi) mengakibatkan masalah yang disebut curse of dimensionality. Upaya dalam mencegah terjadinya masalah tersebut adalah dengan reduksi dimensi menggunakan Principal Component Analysis (PCA) serta menggunakan metode KMeans++ untuk proses inisialisasi centroid pada clustering. Metode tersebut dapat diaplikasikan ke dalam studi kasus yang dievaluasi menggunakan koefisien Silhouette yang menunjukkan bahwa penggunaan metode reduksi dimensi PCA dan K-Means++ menghasilkan cluster yang lebih optimal dibandingkan K-Means++ atau K-Means itu sendiri. Clustering is the part of data mining function which aimed to group amount of data or objects which have similarity in character. K-Means is non hierarchy clustering method which using centers or centroids for grouping. There are some problem that appear in K-Means, such as k centroids which selected randomly. It causes the bad result of clustering and high dimensional data causes the process stuck by the curse of dimentionality. Principal Component Analysis (PCA) is one of solution for high dimensional data clustering by dimension reduction and K-Means++ algorithm for centroid initialization of clustering process. These methods can be applied to the case which evaluated by silhouette coefficient. The result shows that the usage of PCA and K-Means++ produce better cluster than K-Means++ and K-Means itself.

Item Type: Thesis (Sarjana)
Additional Information: 1) Ratna Widyati, S. Si, M. Kom 2) Med Irzal, M.Kom
Subjects: Sains > Matematika
Divisions: FMIPA > S1 Matematika
Depositing User: sawung yudo
Date Deposited: 13 Apr 2022 02:08
Last Modified: 13 Apr 2022 02:08
URI: http://repository.unj.ac.id/id/eprint/26409

Actions (login required)

View Item View Item