RAMADHAN AMANNU, . (2025) PENERAPAN MODEL KLASIFIKASI DAN VISUALISASI DATA AIR SUMUR DI DKI JAKARTA. Sarjana thesis, UNIVERSITAS NEGERI JAKARTA.
![]() |
Text
COVER.pdf Download (958kB) |
![]() |
Text
BAB I.pdf Download (212kB) |
![]() |
Text
BAB II.pdf Restricted to Registered users only Download (871kB) | Request a copy |
![]() |
Text
BAB III.pdf Restricted to Registered users only Download (513kB) | Request a copy |
![]() |
Text
BAB IV.pdf Restricted to Registered users only Download (2MB) | Request a copy |
![]() |
Text
BAB V.pdf Restricted to Registered users only Download (192kB) | Request a copy |
![]() |
Text
DAFTAR PUSTAKA.pdf Download (323kB) |
![]() |
Text
LAMPIRAN.pdf Restricted to Registered users only Download (4MB) | Request a copy |
Abstract
Air merupakan kebutuhan pokok bagi manusia. Salah satu sumber mata air yang digunakan adalah air sumur. Di DKI Jakarta, 35% penduduknya mengandalkan air sumur untuk pemenuhan air baku. Penelitian ini bertujuan untuk mengklasifikasikan kualitas air sumur di DKI Jakarta tahun 2023 menggunakan algoritma K-Nearest Neighbors (KNN). Penelitian ini dilakukan dengan metodologi Knowledge Discovery in Database (KDD), yang mencakup Data Selection, Preprocessing, Transformation, Data Mining, serta Interpretation & Evaluation. Proses seleksi fitur menggunakan metode analisis Chi-Square untuk data kategorikal dan Spearman Rho untuk data numerikal. Kemudian untuk memperbaiki keseimbangan data, digunakan SMOTE (Synthetic Minority Over-sampling Technique), sehingga data memiliki distribusi kelas data target yang seimbang dimana masing-masing berjumlah 248 baris. Data akan dibagi menjadi dua bagian dengan proporsi 80% (908 baris) untuk data latih dan dan 20% (228 baris) untuk data uji. Hasil dari pelatihan model dengan data latih dibantu dengan 5-Fold Cross Validation menghasilkan nilai rata-rata akurasi sebesar 96%. Model yang telah dilatih, selanjutnya akan di evaluasi dengan data uji dan dihasilkan nilai akurasi 95%, presisi 95%, recall 95%, f1-score 95%, balance accuracy 96% serta AUC-ROC 95% yang dihitung secara Macro average. Hasil penelitian dari penelitian ini kemudian di interpretasikan dalam bentuk visualisasi data yang dapat diakses secara publik. ***** Water is essential for life, and in DKI Jakarta, 35% of the population depends on ground water. This study aimed to classify the quality of ground water in the area using the K-Nearest Neighbors (KNN) algorithm. The research followed the Knowledge Discovery in Database (KDD) methodology, which includes steps like Data Selection, Preprocessing, Transformation, Data Mining, and Interpretation & Evaluation. For feature selection, Chi-Square analysis was used for categorical data and Spearman Rho for numerical data. To improve data balance, SMOTE (Synthetic Minority Over-sampling Technique) was used, resulting in a balanced class distribution with 248 rows each. The dataset was split into 80% training data (908 rows) and 20% test data (228 rows). The model, trained with 5-Fold Cross Validation, achieved an average accuracy of 96%. When evaluated with test data, the model showed an accuracy of 95%, precision of 95%, recall of 96%, F1-score of 95%, balance accuracy of 96%, and an AUC-ROC of 95%, all calculated as macro averages. The findings were then presented through publicly accessible data visualizations.
Item Type: | Thesis (Sarjana) |
---|---|
Additional Information: | 1). Murien Nugraheni, S.T., M.Cs. 2). Lipur Sugiyanta, Ph.D. |
Subjects: | Karya Umum > Karya Tulis Perguruan TInggi Sains > Matematika > Ilmu Komputer Sains > Geologi Sains > Statistika Teknologi dan Ilmu Terapan > Teknik Komputer |
Divisions: | FT > S1 Sistem dan Teknologi Informasi |
Depositing User: | Ramadhan Amannu . |
Date Deposited: | 12 Feb 2025 05:01 |
Last Modified: | 12 Feb 2025 05:01 |
URI: | http://repository.unj.ac.id/id/eprint/52736 |
Actions (login required)
![]() |
View Item |