Algorithm Comparison of Hierarchical and Non-Hierarchical Clustering Method in Grouping Regional Poverty Variables

Farhan Maulana, Arie Wahyu Wijayanto

Abstract


One of the objectives of the main Sustainable Development Goals (SDGs) is to end poverty in all forms. Although West Sumatera Province occupies ranking seventh lowest national in poverty, there is an increase amounting to 0.11 percent in September 2022 compared to March 2022. This shows the complexity of the poverty problem in the region. The Provincial Government needs to understand the poverty situation by grouping it based on characteristics in each region. This is a strategic step so that poverty reduction policies can be developed on target and efficiently according to the conditions of each region. This study aims to investigate Clustering methods, namely a non-hierarchical method represented by K-means, Fuzzy C-means, and K-medoids also the hierarchical method, represented by Divisive Analysis (DIANA) and Agglomerative Nesting (AGNES) with complete linkage, average linkage, single linkage, and Ward’s method, to group regencies/cities and compare the performance of the Clustering methods used, to get the best method using Davies Bouldin Index and Dunn index. The results of this research indicate that the divisive analysis method and agglomerative nesting, especially in complete linkage, single linkage, and Ward’s method is the best Clustering method. This method works optimally when the number of clusters is equal to 3. It is hoped that our findings can support policies that are right on target and efficient in efforts to overcome poverty in West Sumatera.

Keywords


Clustering Algorithms; Comparison; Data Mining; Hierarchical Clustering; Poverty Grouping

Full Text:

PDF

References


Badan Pusat Statistik. [Online]. Available: https://www.bps.go.id/subject/23/kemiskinan-dan-ketimpangan.html

United Nations. Sustainable Development Goals. [Online]. Available: https://www.un.org/sustainabledevelopment/poverty/

Badan Pusat Statistik, “Berita Resmi Statistik” Berita Resmi Statistik No.07/01/Th. XXVI, Januari 2023.

Portal Resmi Provinsi Sumatera Barat. (2022, 10). Tindak Lanjuti Arahan Presiden untuk nol Kemiskinan Ekstrim 2024, Gubernur Sumbar Buka Rakor Penanggulangan Kemiskinan Tahun 2022. [Online]. Available : https://sumbarprov.go.id/home/news/22102-tindak-lanjuti-arahan-presiden-untuk-nol-kemiskinan-ekstrim-2024-gubernur-sumbar-buka-rakor-penanggulangan-kemiskinan-tahun-2022

Johnson, R. A., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis (6th ed.). Pearson, Prentice Hall.

Afira, N., & Wijayanto, A. W. (2021). Analisis Cluster dengan Metode Partitioning dan Hierarki pada Data Informasi Kemiskinan Provinsi di Indonesia Tahun 2019. Komputika : Jurnal Sistem Komputer, 10(2), 101–109. https://doi.org/10.34010/komputika.v10i2.4317

Wahyuni, S., & Jatmiko, Y. A. (2018). Pengelompokan Kabupaten/Kota Di Pulau Jawa Berdasarkan Faktor-Faktor Kemiskinan Dengan Pendekatan Average linkage Hierarchical Clustering. Jurnal Aplikasi Statistika Dan Komputasi Statistik.

Munandar, Tb. A. (2022). Penerapan Algoritma Clustering Untuk Pengelompokan Tingkat Kemiskinan Provinsi Banten. JSiI (Jurnal Sistem Informasi), 9(2), 109–114. https://doi.org/10.30656/jsii.v9i2.5099

Widodo, E., Ermayani, P., Laila, L. N., & Madani, A. T. (2021). Pengelompokkan Provinsi di Indonesia Berdasarkan Tingkat Kemiskinan Menggunakan Analisis Hierarchical Agglomerative Clustering (Indonesian Province Grouping Based on Poverty Level Using Hierarchical Agglomerative Clustering Analysis). Prosiding Seminar Nasional Official Statistics.

Simatupang, M. D., & Wijayanto, A. W. (2021). Analisis Klaster Berdasarkan Tindakan Kriminalitas Di Indonesia Tahun 2019. Jurnal Statistika Industri Dan Komputasi, 6(1), 10–19.

Puspitasari, Dewi. (2018). Faktor-faktor Yang memengaruhi Kemiskinan di Jawa Tengah Tahun 2012-2016: Regresi Data Panel Spasial. [Skripsi]. Jakarta: Politeknik Statistika STIS.

Nasution, Taupiq H. T. (2022). Faktor-faktor Yang Memengaruhi Kedalaman Dan Keparahan Kemiskinan Kabupaten/kota di Kti Tahun 2020. [Skripsi]. Jakarta: Politeknik Statistika STIS.

Rabbani, H. M. (2022). Analisis Faktor-faktor Yang Memengaruhi Kemiskinan Ekstrem Menurut Provinsi Di Kawasan Timur Indonesia Tahun 2010-2021. [Skripsi]. Jakarta: Politeknik Statistika STIS.

Ardian, D., & Rizqi Destanto, M. (2021). Pengaruh Faktor Sosial Ekonomi terhadap Kemiskinan di Provinsi Jawa Barat (The Effect of Socio-Economic Factor on Poverty Level in West Java Province). Prosiding Seminar Nasional Official Statistics, 377–384.

Saputra, Danu A. (2021). Penerapan Algoritma Machine Learning untuk Pengelompokan Kesejahteraan Sosial (Studi Kasus : Kawasan Timur Indonesia Tahun 2019). [Skripsi]. Jakarta: Politeknik Statistika STIS.

Kusumaningtyas, C. A. (2018). Analisis Cluster Untuk Pengelompokan Kabupaten/Kota Di Provinsi Papua Berdasarkan Indikator Indeks Pembangunan Manusia Tahun 2017. [Skripsi]. Jakarta: Politeknik Statistika STIS.

Palanu, H. (2017). Analisis Pengelompokan Karakteristik Konsumen Penggunawarnet Dengan Metode Ward’s (Studi Kasus : Warnet Turbo Net). [Skripsi]. Yogyakarta: Universitas Islam Indonesia.

Ningrat, D. R., Maruddani, D. A. I. dan Wuryandari, T. (2016). Analisis Cluster Dengan Algoritma K-means Dan Fuzzy C-Means Clustering Untuk Pengelompokan data Obligasi Korporasi. Jurnal Gaussian, 5(4), 641-650.

Eldo, H. (2020). Penentuan Cluster Terbaik K-means Menggunakan Algoritma Silhouette. [Tesis]. Medan: Universitas Sumatera Utara.

Zulfa, F. (2019). Pengelompokan Provinsi Di Indonesia Berdasarkan Indikator Pendidikan Menggunakan K-means Dan K-Medoids. [Skripsi]. Semarang: Universitas Muhammadiyah Semarang.

R. Xu and D. Wunsch, “Clustering”, John Wiley & Sons, vol. 10., 2008.

Gan, G., Ma, C., and Wu, J., Data Clustering: Theory, Algorithms, and Applications, ASA SIAM series on Statistics and Applied Probability, Philadelphia, 2007.

Patnaik, A. K., Bhuyan, P. K., & Krishna Rao, K. V. (2016). Divisive analysis (DIANA) of Hierarchical Clustering and GPS data for level of service criteria of urban streets. Alexandria Engineering Journal, 55(1), 407–418. https://doi.org/10.1016/j.aej.2015.11.003

Prasetyo, E., “Data Mining: Konsep dan Aplikasi Menggunakan Matlab”, Yogyakarta: Andi Offset, 2012.

T. S. Jaya, “Sistem Pemilihan Perumahan dengan Metode Kombinasi Fuzzy CMeans Clustering dan Simple Additive Weighting,” J. Sist. Inf. Bisnis, vol. 1, no. December, pp. 153–158, 2018, doi: 10.21456/vol1iss3pp153-158.

Yohannes, “Analisis Perbandingan Algoritma Fuzzy C-Means,” in Annual research Seminar, 2016, vol. 2, no. 1, pp. 151–155.

Bezdek, J. C., Enrlich, R., dan Full, W., “FCM : The Fuzzy C-Means Clustering Algortihm,” Computer & Geosciences, 10(2-3), 191-203, 1984.

Kaur, Noor K., Kaur, Usvir., & Singh, Dr. Dheerendra., 2014. K-Medoids Clustering Algorithm –A Review. International Journal of Computer Application and Technology (IJCAT). ISSN. 2349-1841 Vol. 1, Issue 1. April 2014.

Riyanto, B. (2019). Penerapan Algoritma K-Medoids Clustering Untuk Pengelompokkan Penyebaran Diare Di Kota Medan (Studi Kasus: Kantor Dinas Kesehatan Kota Medan). KOMIK (Konferensi Nasional Teknologi Informasi Dan Komputer),3(1). https://doi.org/10.30865/komik.v3i1.1659

Dewi, D. A. I. C., dan Pramita, D. A. K. (2019). Analisis Perbandingan Metode Elbow Dan Silhouette Pada Algoritma Clustering K-Medoids Dalam Pengelompokan Produksi Kerajinan Bali. Matrix : Jurnal Manajemen Teknologi dan Informatika, 9(3), 102-109

Sarjanako, R. J. (2016). Penerapan Fuzzy C-Means Clustering Untuk Mengoptimalkan Penentuan Media Promosi. Jurnal Ilmiah Teknologi dan Informasi (SNATi), 1-6.

Satoso, B. D., Khotimah, B. K. dan Muhammad, A. (2015). Pengelompokan Tingkat Kesehatan Masyarakat Menggunakan Shelf Organizing Maps Dengan Cluster Validation Idb dan I-Dunn. Seminar Nasional Aplikasi Teknologi Informasi (SNATi), 1-6.

Schabenberger O, Gotway CA. 2005. Statistical Methods for Spatial Data Analysis. Chapman & Hall/CRC.

Thamrin, N,, & Wijayanto, A. W. (2021). Comparison of Soft and Hard Clustering: A Case Study on Welfare Level in Cities on Java Island: Analisis cluster dengan menggunakan hard clustering dan soft clustering untuk pengelompokkan tingkat kesejahteraan kabupaten/kota di pulau Jawa. Indonesian Journal of Statistics and Its Applications, 5(1), 141-160.

Damayanti, A. R., & Wijayanto, A. W. (2021). Comparison of Hierarchical and Non-Hierarchical Methods in Clustering Cities in Java Island using the Human Development Index Indicators year 2018. Eigen Mathematics Journal, 4(1).

Suraya, G. R., & Wijayanto, A. W. (2022). Comparison of Hierarchical Clustering, K-Means, K-Medoids, and Fuzzy C-Means Methods in Grouping Provinces in Indonesia according to the Special Index for Handling Stunting. Indonesian Journal of Statistics and Its Applications, 6(2).

Sigit Nugroho, P. (2008). Statistika Multivariat Terapan. Bengkulu: UNIB Press.




DOI: http://dx.doi.org/10.24014/ijaidm.v8i1.29393

Refbacks

  • There are currently no refbacks.


Office and Secretariat:

Big Data Research Centre
Puzzle Research Data Technology (Predatech)
Laboratory Building 1st Floor of Faculty of Science and Technology
UIN Sultan Syarif Kasim Riau

Jl. HR. Soebrantas KM. 18.5 No. 155 Pekanbaru Riau – 28293
Website: http://predatech.uin-suska.ac.id/ijaidm
Email: ijaidm@uin-suska.ac.id
e-Journal: http://ejournal.uin-suska.ac.id/index.php/ijaidm
Phone: 085275359942

Click Here for Information


Journal Indexing:

Google Scholar | ROAD | PKP Index | BASE | ESJI | General Impact Factor | Garuda | Moraref | One Search | Cite Factor | Crossref | WorldCat | Neliti  | SINTA | Dimensions | ICI Index Copernicus 

IJAIDM Stats