Perbandingan Teknik Pembagian Data untuk Klasifikasi Sarana Akses Air pada Algoritma K-Nearest Neighbor dan Naïve Bayes Classifier

Said Thaufik Rizaldi, Mustakim Mustakim

Abstract


Indonesia menduduki peringkat keempat pertumbuhan penduduk terbesar di dunia. Namun, pertumbuhan penduduk tersebut tidak diikuti dengan pertumbuhan infrastruktur. Sehingga, terjadi fenomena excess demand khususnya sarana akses air. Akses air menjadi prioritas pembangunan strategis pada Rencana Pembangunan Jangka Menengah Nasional (RPJMN) 2020-2024. Menurut WHO tahun 2019 indikator rekomendasi sarana akses air yakni pelayanan dasar, pelayanan terbatas, dan tidak ada akses. Penelitian ini mengklasifikasikan data sarana akses air menggunakan studi kasus di tingkat sekolah untuk mengetahui indikator kelayakan dalam menentukan rekomendasi akses air. Penelitian ini membandingkan teknik pembagian data K-Means Clustering, K-Medoid dan Hold-out pada algoritma klasifikasi K-Nearest Neighbor dan Naïve Bayes Classifier menghasilkan K-Medoid sebagai pemodelan pembagian data terbaik  dengan nilai akurasi 89,39% pada algoritma K-Nearest Neighbor dengan parameter K = 10 pada penelitian ini.


Full Text:

PDF

References


D. Duijster, B. Monse, J. Dimaisip-Nabuab, P. Djuharnoko, R. Heinrich-Weltzien, M. Hobdell, K. Kromeyer-Hauschild, Y. Kunthearith, M. C. Mijares-Majini, N. Siegmund, P. Soukhanouvong, dan H. Benzian, “‘Fit for school’ - a school-based water, sanitation and hygiene programme to improve child health: Results from a longitudinal study in Cambodia, Indonesia and Lao PDR,” BMC Public Health, vol. 17, no. 1, hal. 1–15, 2017.

E. W. Purwanto, “Pembangunan Akses Air Bersih Pasca Krisis Covid-19,” J. Perenc. Pembang. Indones. J. Dev. Plan., vol. 4, no. 2, hal. 207–214, 2020.

Kemendikbud, Profil Sanitasi Sekolah. Kemedikbud, 2017.

Y. Cheng, K. Chen, H. Sun, Y. Zhang, dan F. Tao, “Data and knowledge mining with big data towards smart production,” J. Ind. Inf. Integr., vol. 9, no. October, hal. 1–13, 2018.

W. I. Sabilla dan T. E. Putri, “Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes Classifier ( Studi Kasus Prodi D3 Sistem Informasi Universitas Airlangga ),” J. Komput. Terap., vol. 3, no. 2, hal. 233–240, 2017.

F. Tempola, M. Muhammad, dan A. Khairan, “Perbandingan Klasifikasi Antara KNN dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross Validation,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 5, hal. 577, 2018.

Mustakim, “Effectiveness of K-means clustering to distribute training data and testing data on K-nearest neighbor classification,” J. Theor. Appl. Inf. Technol., vol. 95, no. 21, hal. 5693–5700, 2017.

Mustakim, S. Syahidatul Helma, U. Ramadhani, G. S. Achmad Daengs, R. Novita, Nuryanti, dan S. R. Fitriatien, “Data Sharing Technique Modeling for Naive Bayes Classifier for Eligibility Classification of Recipient Students in the Smart Indonesia Program,” J. Phys. Conf. Ser., vol. 1424, no. 1, 2019.

A. P. U. Sembiring dan M. Ginting, “Analisis faktor-faktor yang mempengaruhi pengunduran diri mahasiswa dengan aplikasi data mining add-ins – studi kasus pada STMIK Mikroskil,” JSM STMIK Mikroskil, vol. 14, no. 2, hal. 139–146, 2013.

D. K. Sharma, S. K. Dhurandher, D. Agarwal, dan K. Arora, “kROp: k-Means clustering based routing protocol for opportunistic networks,” J. Ambient Intell. Humaniz. Comput., vol. 10, no. 4, hal. 1289–1306, 2019.

I. Kamila, U. Khairunnisa, dan M. Mustakim, “Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokan Data Transaksi Bongkar Muat di Provinsi Riau,” J. Ilm. Rekayasa dan Manaj. Sist. Inf., vol. 5, no. 1, hal. 119, 2019.

D. Listiyanti, Y. A. Syahbana, dan S. R. Henim, “Perancangan dan Implementasi Aplikasi Android Penentu Salient Area pada Video dengan Algoritma K-Medoids,” vol. 2, no. 1, hal. 96–101, 2016.

X. Jin dan J. Han, “K-Medoids Clustering,” Encycl. Mach. Learn. Data Min., hal. 697–700, 2017.

A. Ghazvini, J. Awwalu, dan A. Abu Bakar, “Comparative Analysis of Algorithms in Supervised Classification: A Case study of Bank Notes Dataset,” Int. J. Comput. Trends Technol., vol. 17, no. 1, hal. 39–43, 2014.

G. Guo, H. Wang, D. Bell, Y. Bi, dan K. Greer, “An kNN model-based approach and its application in text categorization,” Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), vol. 2945, hal. 559–570, 2004.

Okfalisa, I. Gazalba, Mustakim, dan N. G. I. Reza, “Comparative analysis of k-nearest neighbor and modified k-nearest neighbor algorithm for data classification,” Proc. - 2017 2nd Int. Conf. Inf. Technol. Inf. Syst. Electr. Eng. ICITISEE 2017, vol. 2018–Janua, no. October 2019, hal. 294–298, 2018.

S. D. Jadhav dan H. P. Channe, “Comparative Study of K-NN, Naive Bayes and Decision Tree Classification Techniques,” Int. J. Sci. Res., vol. 5, no. 1, hal. 1842–1845, 2016.

M. S. Pervez dan D. M. Farid, “Feature selection and intrusion classification in NSL-KDD cup 99 dataset employing SVMs,” Ski. 2014 - 8th Int. Conf. Software, Knowledge, Inf. Manag. Appl., 2014.

S. Dewi, “Komparasi 5 Metode Algoritma Klasifikasi Data Mining Pada Prediksi Keberhasilan Pemasaran Produk Layanan Perbankan,” None, vol. 13, no. 1, hal. 60–66, 2016.

I. Gede, “Texture Analysis on Image Motif of Endek Bali using K-Nearest Neighbor Classification Method,” Int. J. Adv. Comput. Sci. Appl., vol. 6, no. 9, hal. 205–211, 2015


Refbacks

  • There are currently no refbacks.


FAKULTAS SAINS DAN TEKNOLOGI
UIN SUSKA RIAU

Kampus Raja Ali Haji
Gedung Fakultas Sains & Teknologi UIN Suska Riau
Jl.H.R.Soebrantas No.155 KM 18 Simpang Baru Panam, Pekanbaru 28293
Email: sntiki@uin-suska.ac.id