Prediksi Angka Harapan Hidup Menggunakan Regresi Linear Berganda, Lasso, Ridge, Elastic Net, dan Kuantil Lasso

Muhammad Daryl Fauzan, Mohamad Khoirun Najib, Sri Nurdiati, Nazwa Khoerunnisa, Syammira Dhifa Maulia, Raden Roro Carissa Triwulandari, Muhammad Farhan Aziz

Abstract


Angka harapan hidup mejadi salah satu indikator penting dalam mengevaluasi kesejahteraan dan kualitas hidup suatu populasi atau negara. Metode yang biasa digunakan untuk memprediksi adalah regresi linear berganda. Terdapat banyak perkembangan model regresi linear berganda, seperti regresi lasso, ridge, elastic net, kuantil, serta kuantil lasso. Untuk melihat kontribusi setiap variabel independen pada model, digunakan metode Mean Absolute Shapley Values (MASV). Oleh karena itu, tujuan dari penelitian ini adalah membandingkan model regresi linear berganda, lasso, ridge, elastic net, kuantil, serta kuantil lasso dalam memprediksi nilai angka harapan hidup. Penelitian diawali dengan melakukan eksplorasi data. Selanjutnya, model-model regresi tersebut dilatih. Pelatihan model tersebut juga dilakukan berulang kali dengan mengacak data pada pembagian data latih dan data uji. Terakhir, kontribusi setiap variabel independen diukur. Performa model regresi linear berganda pada iterasi pertama cukup baik dengan nilai r-square lebih besar dari 85% baik pada data latih dan data uji. Namun, Performa model lasso, ridge, elastic net, kuantil, dan kuantil lasso tidak jauh berbeda dengan performa model regresi linear berganda. Ketika dilakukan pengacakan data latih dan data uji.  Model regresi kuantil lasso memiliki performa yang lebih konsisten dalam memprediksi nilai angka harapan hidup dibandingkan model lainnya. Pada setiap model regresi, tingkat kelahiran dan tingkat kematian bayi merupakan variabel yang memiliki kontribusi terbesar dalam memprediksi nilai angka harapan hidup, sedangkan persentase orang yang mengikuti sekolah formal dan persentase populasi yang tinggal di perkotaan bukan variabel independen yang cukup baik untuk memprediksi angka harapan hidup.

 

Kata Kunci:  angka harapan hidup, model regresi, data latih, data uji.


References


U. Nation, “By Location | Pivot Table | Data Portal,” Population Division Data Portal, 2022. https://population.un.org/dataportal/data/indicators/61/locations/360/start/1950/end/2023/table/pivotbylocation?df=d4c5d59b-bb22-4c62-b010-cfe63f0c5c37 (accessed Jul. 02, 2024).

S. Rath, A. Tripathy, and A. R. Tripathy, “Prediction of new active cases of coronavirus disease (COVID-19) pandemic using multiple linear regression model,” Diabetes Metab. Syndr. Clin. Res. Rev., vol. 14, no. 5, pp. 1467–1474, 2020, doi: 10.1016/j.dsx.2020.07.045.

L. E. Melkumova and S. Y. Shatskikh, “Comparing Ridge and LASSO estimators for data analysis,” in Procedia Engineering, 2017, vol. 201, pp. 746–755. doi: 10.1016/j.proeng.2017.09.615.

C. Hans, “Elastic Net Regression Modeling With the Orthant Normal Prior,” J. Am. Stat. Assoc., vol. 106, p. 1383, 2011.

Y. Sun, K. L. Teow, B. H. Heng, C. K. Ooi, and S. Y. Tay, “Real-time prediction of waiting time in the emergency department, using quantile regression,” Ann. Emerg. Med., vol. 60, no. 3, pp. 299–308, 2012, doi: 10.1016/j.annemergmed.2012.03.011.

D. Santri and Y. Hanike, “Pemodelan Statistical Downscaling Regresi Kuantil Lasso dan Analisis Komponen Utama untuk Pendugaan Curah Hujan Ekstrim,” Math. Appl. J., pp. 47–57, 2020.

S. Setyadi, A. Kustanto, and A. Widiastuti, “Life Expectancy in Indonesia: The Role of Health Infrastructure, Political, and Socioeconomic Status,” Iran. Econ. Rev., vol. 27, no. 3, pp. 965–1005, 2023, doi: 10.22059/ier.2023.329904.1007259.

F. Mariani, A. Pérez-Barahona, and N. Raffin, “Life expectancy and the environment,” J. Econ. Dyn. Control, vol. 34, no. 4, pp. 798–815, 2010, doi: 10.1016/j.jedc.2009.11.007.

S. H. Woolf and H. Schoomaker, “Life Expectancy and Mortality Rates in the United States, 1959-2017,” JAMA - J. Am. Med. Assoc., vol. 322, no. 20, pp. 1996–2016, 2019, doi: 10.1001/jama.2019.16932.

N. Shahira Pisal, S. Abdul-Rahman, M. Hanafiah, and S. I. Kamarudin, “Prediction of Life Expectancy for Asian Population Using Machine Learning Algorithms,” Malaysian J. Comput., vol. 7, no. 2, pp. 1150–1161, 2022.

M. Smith and F. Alvarez, “Identifying mortality factors from Machine Learning using Shapley values – a case of COVID19,” Expert Syst. Appl., vol. 176, 2021, doi: 10.1016/j.eswa.2021.114832.

M. Esmaeili, M. Osanloo, F. Rashidinejad, A. Aghajani Bazzazi, and M. Taji, “Multiple regression, ANN and ANFIS models for prediction of backbreak in the open pit blasting,” Eng. Comput., vol. 30, no. 4, pp. 549–558, 2014, doi: 10.1007/s00366-012-0298-2.

S. Chatterjee and A. S. Hadi, Regression Analysis by Example, 5th ed., vol. 95, no. 452. New Jersey: John Wiley & Sons, Inc., 2012. doi: 10.2307/2669806.

D. M. McNeish, “Using Lasso for Predictor Selection and to Assuage Overfitting: A Method Long Overlooked in Behavioral Sciences,” Multivariate Behav. Res., vol. 50, no. 5, pp. 471–484, 2015, doi: 10.1080/00273171.2015.1036965.

S. Altelbany, “Evaluation of Ridge, Elastic Net and Lasso Regression Methods in Precedence of Multicollinearity Problem: A Simulation Study,” J. Appl. Econ. Bus. Stud., vol. 5, no. 1, pp. 131–142, 2021, doi: 10.34260/jaebs.517.

M. Maciak, “Quantile LASSO in arbitrage-free option markets,” Econom. Stat., vol. 18, pp. 106–116, 2021, doi: 10.1016/j.ecosta.2020.05.006.

A. Messalas, Y. Kanellopoulos, and C. Makris, “Model-Agnostic Interpretability with Shapley Values,” in 10th International Conference on Information, Intelligence, Systems and Applications, IISA 2019, 2019. doi: 10.1109/IISA.2019.8900669.

S. Garcia, J. Luengo, and F. Herrera, Data Preprocessing and Data Mining. Warsaw: Polish Academy of Scieces, 2015.

D. C. Montgomery, E. A. Peck, and G. G. Vinning, Introduction to Linear Regression Analysis, 5th ed. New Jersey: John Wiley & Sons, Inc., 2012.

P. Roffia, A. Bucciol, and S. Hashlamoun, “Determinants of life expectancy at birth: a longitudinal study on OECD countries,” Int. J. Heal. Econ. Manag., vol. 23, no. 2, pp. 189–212, 2023, doi: 10.1007/s10754-022-09338-5.

M. M. Rahman, R. Rana, and R. Khanam, “Determinants of life expectancy in most polluted countries: Exploring the effect of environmental degradation,” PLoS One, vol. 17, no. 1 January, 2022, doi: 10.1371/journal.pone.0262802.




DOI: http://dx.doi.org/10.24014/jsms.v10i2.27916

Refbacks

  • There are currently no refbacks.


Jurnal JSMS

p-ISSN     : 2460-4542 (print)
e-ISSN     : 2615-8663 (online)
Alamat   : Program Studi Matematika
                   Fakultas Sains dan Teknologi, UIN Suska Riau
                   Jl. H.R Soebrantas, No. 155, Tampan, Pekanbaru.
Website : http://ejournal.uin-suska.ac.id/index.php/JSMS
e-mail    :
jsmsfst@uin-suska.ac.id