PENERAPAN MODEL KLASIFIKASI DAN VISUALISASI DATA AIR SUMUR DI DKI JAKARTA

RAMADHAN AMANNU, . (2025) PENERAPAN MODEL KLASIFIKASI DAN VISUALISASI DATA AIR SUMUR DI DKI JAKARTA. Sarjana thesis, UNIVERSITAS NEGERI JAKARTA.

[img] Text
COVER.pdf

Download (958kB)
[img] Text
BAB I.pdf

Download (212kB)
[img] Text
BAB II.pdf
Restricted to Registered users only

Download (871kB) | Request a copy
[img] Text
BAB III.pdf
Restricted to Registered users only

Download (513kB) | Request a copy
[img] Text
BAB IV.pdf
Restricted to Registered users only

Download (2MB) | Request a copy
[img] Text
BAB V.pdf
Restricted to Registered users only

Download (192kB) | Request a copy
[img] Text
DAFTAR PUSTAKA.pdf

Download (323kB)
[img] Text
LAMPIRAN.pdf
Restricted to Registered users only

Download (4MB) | Request a copy

Abstract

Air merupakan kebutuhan pokok bagi manusia. Salah satu sumber mata air yang digunakan adalah air sumur. Di DKI Jakarta, 35% penduduknya mengandalkan air sumur untuk pemenuhan air baku. Penelitian ini bertujuan untuk mengklasifikasikan kualitas air sumur di DKI Jakarta tahun 2023 menggunakan algoritma K-Nearest Neighbors (KNN). Penelitian ini dilakukan dengan metodologi Knowledge Discovery in Database (KDD), yang mencakup Data Selection, Preprocessing, Transformation, Data Mining, serta Interpretation & Evaluation. Proses seleksi fitur menggunakan metode analisis Chi-Square untuk data kategorikal dan Spearman Rho untuk data numerikal. Kemudian untuk memperbaiki keseimbangan data, digunakan SMOTE (Synthetic Minority Over-sampling Technique), sehingga data memiliki distribusi kelas data target yang seimbang dimana masing-masing berjumlah 248 baris. Data akan dibagi menjadi dua bagian dengan proporsi 80% (908 baris) untuk data latih dan dan 20% (228 baris) untuk data uji. Hasil dari pelatihan model dengan data latih dibantu dengan 5-Fold Cross Validation menghasilkan nilai rata-rata akurasi sebesar 96%. Model yang telah dilatih, selanjutnya akan di evaluasi dengan data uji dan dihasilkan nilai akurasi 95%, presisi 95%, recall 95%, f1-score 95%, balance accuracy 96% serta AUC-ROC 95% yang dihitung secara Macro average. Hasil penelitian dari penelitian ini kemudian di interpretasikan dalam bentuk visualisasi data yang dapat diakses secara publik. ***** Water is essential for life, and in DKI Jakarta, 35% of the population depends on ground water. This study aimed to classify the quality of ground water in the area using the K-Nearest Neighbors (KNN) algorithm. The research followed the Knowledge Discovery in Database (KDD) methodology, which includes steps like Data Selection, Preprocessing, Transformation, Data Mining, and Interpretation & Evaluation. For feature selection, Chi-Square analysis was used for categorical data and Spearman Rho for numerical data. To improve data balance, SMOTE (Synthetic Minority Over-sampling Technique) was used, resulting in a balanced class distribution with 248 rows each. The dataset was split into 80% training data (908 rows) and 20% test data (228 rows). The model, trained with 5-Fold Cross Validation, achieved an average accuracy of 96%. When evaluated with test data, the model showed an accuracy of 95%, precision of 95%, recall of 96%, F1-score of 95%, balance accuracy of 96%, and an AUC-ROC of 95%, all calculated as macro averages. The findings were then presented through publicly accessible data visualizations.

Item Type: Thesis (Sarjana)
Additional Information: 1). Murien Nugraheni, S.T., M.Cs. 2). Lipur Sugiyanta, Ph.D.
Subjects: Karya Umum > Karya Tulis Perguruan TInggi
Sains > Matematika > Ilmu Komputer
Sains > Geologi
Sains > Statistika
Teknologi dan Ilmu Terapan > Teknik Komputer
Divisions: FT > S1 Sistem dan Teknologi Informasi
Depositing User: Ramadhan Amannu .
Date Deposited: 12 Feb 2025 05:01
Last Modified: 12 Feb 2025 05:01
URI: http://repository.unj.ac.id/id/eprint/52736

Actions (login required)

View Item View Item