KLASIFIKASI DATA KATEGORIK DENGAN MISSING VALUE MENGGUNAKAN ALGORITMA CHAID (Chi-square Automatic Interaction Detection)

TRI ASIH KUSUMASTUTI, . (2011) KLASIFIKASI DATA KATEGORIK DENGAN MISSING VALUE MENGGUNAKAN ALGORITMA CHAID (Chi-square Automatic Interaction Detection). Sarjana thesis, UNIVERSITAS NEGERI JAKARTA.

[img] Text
tri asih kusumastuti .pdf

Download (1MB)

Abstract

Analisis diskriminan dan analisis kelompok merupakan metode pengklasifikasian yang telah banyak digunakan. Pada analisis diskriminan dan analisis kelompok diperlukan beberapa asumsi yang harus dipenuhi, antara lain: data berdistribusi normal dan peubah bebasnya berskala interval. Pada kenyataannya tidak se�mua data berskala interval. CHAID (Chi-square Automatic Interaction Detec�tion) merupakan metode klasifikasi dari decision tree yang dapat digunakan un�tuk data yang peubah bebasnya kategorik dan tidak memerlukan asumsi dis�tribusi normal. Selain itu CHAID juga dapat digunakan pada data yang mem�punyai missing value. CHAID memperlakukan missing value sebagai satu kate�gori tunggal dan menghasilkan diagram pohon dengan kelas-kelas yang homogen sehingga dapat digunakan sebagai kelas imputasi untuk kategori missing value. CHAID menggunakan uji chi-square sebagai uji signifikan dan koreksi bonferroni digunakan bila terjadi pengkategorian ulang. Ilustrasi pada skripsi ini meng�gunakan data yang diperoleh dari UCI repository of machine learning database (http://archive.ics.uci.edu/ml/data sets/Mushroom). Tujuan dari penelitian ini adalah mengklasifikasikan jamur dari genus Agaricus dan Lepiota ke dalam kate�gori dapat dimakan atau beracun. Discriminant and cluster analysis are familiar clasification method. Discriminant and cluster analysis need assumptions: norm distribution and interval indepen�dent variabels. In fact, independent variabels might be categorical. CHAID (chi square automatic interaction detection) is used for clasifiying data with categorical dependent variabel and does not need norm assumption. CHAID is available to data which has missing values. It is treated as single category and results homogen classes in tree chart which is used as imputation class. CHAID uses chi-square as significant test and bonferroni correction while the category reduced. Ilustration in this thesis uses data taken from UCI repository of machine learning database (http://archive.ics.uci.edu/ml/datasets/Mushroom). The purpose is clasifiying mushroom genus Agaricus and Lepiota to edible or poissonous mushroom.

Item Type: Thesis (Sarjana)
Additional Information: 1) Dra.Widyanti Rahayu, M.Si 2) Ratna Widyati, S.Si, M.Kom
Subjects: Sains > Matematika
Divisions: FMIPA > S1 Matematika
Depositing User: sawung yudo
Date Deposited: 28 Jun 2022 19:00
Last Modified: 28 Jun 2022 19:00
URI: http://repository.unj.ac.id/id/eprint/30929

Actions (login required)

View Item View Item