Linear Regression Analysis to Predict the Percentage of Smoking in the Population Age 15 Years and Over
DOI:
https://doi.org/10.58777/ise.v2i2.328Keywords:
Smoking, Prediction, Linear Regression, RapidMinerAbstract
Smoking is a serious public health problem in many countries, including Indonesia, as it can cause diseases such as lung cancer, heart disease and respiratory disorders. According to data from the Ministry of Health of the Republic of Indonesia, the prevalence of smoking among the population aged 15 years and above is still high. This study uses secondary data from the Central Bureau of Statistics (BPS) that records the percentage of smoking in the population aged 15 years and above by age group from 2019 to 2023. With this data, a linear regression algorithm was applied using RapidMiner to predict the percentage of smoking in 2024. The analysis showed that out of 11 age groups, 6 age groups experienced an increase in smoking percentage from the previous year: 15-19, 20-24, 25-29, 30-34, 55-59, and 60-64. Meanwhile, the other 5 age groups experienced a decrease: 35-39, 40-44, 45-49, 50-54, and 65+. Evaluation of the prediction model using root mean squared error (RMSE) resulted in a value of 0.4 +/- 0.000. This RMSE value indicates that the model has a low error rate, making it reliable for predicting the percentage of smoking by age group in Indonesia.
Merokok adalah masalah kesehatan masyarakat yang serius di banyak negara, termasuk Indonesia, karena dapat menyebabkan penyakit seperti kanker paru-paru, penyakit jantung, dan gangguan pernapasan. Menurut data Kementerian Kesehatan Republik Indonesia, prevalensi merokok di kalangan penduduk usia 15 tahun ke atas masih tinggi. Penelitian ini menggunakan data sekunder dari Badan Pusat Statistik (BPS) yang mencatat persentase merokok penduduk usia 15 tahun ke atas berdasarkan kelompok umur dari tahun 2019 hingga 2023. Dengan data ini, algoritma regresi linear diterapkan menggunakan RapidMiner untuk memprediksi persentase merokok pada tahun 2024. Hasil analisis menunjukkan bahwa dari 11 kelompok umur, terdapat 6 kelompok umur yang mengalami peningkatan persentase merokok dari tahun sebelumnya: 15-19, 20-24, 25-29, 30-34, 55-59, dan 60-64. Sementara itu, 5 kelompok umur lainnya mengalami penurunan: 35-39, 40-44, 45-49, 50-54, dan 65+. Evaluasi model prediksi menggunakan root mean squared error (RMSE) menghasilkan nilai 0.884 +/- 0.000. Nilai RMSE ini menunjukkan bahwa model memiliki tingkat kesalahan yang rendah, sehingga dapat diandalkan untuk memprediksi persentase merokok berdasarkan kelompok umur di Indonesia.
References
Anis, P., Sekar, D., & Kharisudin, I. (2022). Analisis Peramalan dengan Long Short Term Memory pada Data Kasus Covid-19 di Provinsi Jawa Tengah. 5, 752–758.
Aqsho Ramadhan, Y., Faqih, A. ., & Dwilestari, G. . (2023). Prediksi Penjualan Handphone di Toko X menggunakan Algoritma Regresi Linear. Jurnal Informatika Terpadu, 9(1), 40–44. https://doi.org/10.54914/jit.v9i1.692
Dahlia, & Andri. (2020). Implementasi Data Mining untuk Prediksi Persediaan Obat pada Puskesmas Kertapati menggunakan Regresi Linier Berganda. Jurnal Sistem Dan Informatika, 95–103. https://doi.org/10.30864/jsi.v15i2.331
Gita Kanya Paramitha, & Stephani Raihana Hamdan. (2022). Pengaruh Self-Control terhadap Perilaku Merokok Mahasiswa selama Pandemi COVID-19. Jurnal Riset Psikologi, 1(2), 132–139. https://doi.org/10.29313/jrp.v1i2.559
Maharadja, A. N., Maulana, I., & Dermawan, B. A. (2021). Penerapan Metode Regresi Linear Berganda untuk Prediksi Kerugian Negara Berdasarkan Kasus Tindak Pidana Korupsi. Journal of Applied Informatics and Computing, 5(1), 95–102. https://doi.org/10.30871/jaic.v5i1.3184
Marianti, A., & Prayitno, B. (2020). Analisis Pengaruh Faktor Sosial Ekonomi, Pendapatan dan Harga Rokok Terhadap Konsumsi Rokok di Indonesia. Economie: Jurnal Ilmu Ekonomi, 1(2), 93. https://doi.org/10.30742/economie.v1i2.1126
Maulana, A., Martanto, M., & Ali, I. (2024). Prediksi Hasil Produksi Panen Bawang Merah Menggunakan Metode Regresi Linier Sederhana. JATI (Jurnal Mahasiswa Teknik Informatika), 7(4), 2884–2888. https://doi.org/10.36040/jati.v7i4.7281
Muhartini, A. A., Sahroni, O., Rahmawati, S. D., Febrianti, T., & Mahuda, I. (2021). Analisis Peramalan Jumlah Penerimaan Mahasiswa Baru Dengan Menggunakan Metode Regresi Linear Sederhana. Jurnal Bayesian : Jurnal Ilmiah Statistika Dan Ekonometrika, 1(1), 17–23. https://doi.org/10.46306/bay.v1i1.2
Novianty, D., Palasara, N. D., & Qomaruddin, M. (2021). Algoritma Regresi Linear pada Prediksi Permohonan Paten yang Terdaftar di Indonesia. Jurnal Sistem Dan Teknologi Informasi (Justin), 9(2), 81. https://doi.org/10.26418/justin.v9i2.43664
Nurmanto, R., & Islami, H. Al. (2024). Pemberangkatan Unit Luar Pulau Untuk Memprediksi Jangka Waktu Penerimaan Unit Ac. 3(4), 850–864.
Trianggana, D. A. (2020). a Peramalan Jumlah Siswa-Siswi Melalui Pendekatan Metode Regresi Linear. Jurnal Media Infotama, 16(2), 115–120. https://doi.org/10.37676/jmi.v16i2.1149
Utomo, D. P., & Mesran, M. (2020). Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung. Jurnal Media Informatika Budidarma, 4(2), 437. https://doi.org/10.30865/mib.v4i2.2080
Downloads
Published
How to Cite
Issue
Section
Copyright (c) 2024 Muhammad Alfata Riziq Shihab, Musriatun Napiah
This work is licensed under a CC Attribution-ShareAlike 4.0

