Linear Regression Analysis to Predict the Percentage of Smoking in the Population Age 15 Years and Over

Authors

  • Muhammad Alfata Riziq Shihab Universitas Bina Sarana Informatika
  • Musriatun Napiah Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.58777/ise.v2i2.328

Keywords:

Smoking, Prediction, Linear Regression, RapidMiner

Abstract

Smoking is a serious public health problem in many countries, including Indonesia, as it can cause diseases such as lung cancer, heart disease and respiratory disorders. According to data from the Ministry of Health of the Republic of Indonesia, the prevalence of smoking among the population aged 15 years and above is still high. This study uses secondary data from the Central Bureau of Statistics (BPS) that records the percentage of smoking in the population aged 15 years and above by age group from 2019 to 2023. With this data, a linear regression algorithm was applied using RapidMiner to predict the percentage of smoking in 2024. The analysis showed that out of 11 age groups, 6 age groups experienced an increase in smoking percentage from the previous year: 15-19, 20-24, 25-29, 30-34, 55-59, and 60-64. Meanwhile, the other 5 age groups experienced a decrease: 35-39, 40-44, 45-49, 50-54, and 65+. Evaluation of the prediction model using root mean squared error (RMSE) resulted in a value of 0.4 +/- 0.000. This RMSE value indicates that the model has a low error rate, making it reliable for predicting the percentage of smoking by age group in Indonesia.

 

Merokok adalah masalah kesehatan masyarakat yang serius di banyak negara, termasuk Indonesia, karena dapat menyebabkan penyakit seperti kanker paru-paru, penyakit jantung, dan gangguan pernapasan. Menurut data Kementerian Kesehatan Republik Indonesia, prevalensi merokok di kalangan penduduk usia 15 tahun ke atas masih tinggi. Penelitian ini menggunakan data sekunder dari Badan Pusat Statistik (BPS) yang mencatat persentase merokok penduduk usia 15 tahun ke atas berdasarkan kelompok umur dari tahun 2019 hingga 2023. Dengan data ini, algoritma regresi linear diterapkan menggunakan RapidMiner untuk memprediksi persentase merokok pada tahun 2024. Hasil analisis menunjukkan bahwa dari 11 kelompok umur, terdapat 6 kelompok umur yang mengalami peningkatan persentase merokok dari tahun sebelumnya: 15-19, 20-24, 25-29, 30-34, 55-59, dan 60-64. Sementara itu, 5 kelompok umur lainnya mengalami penurunan: 35-39, 40-44, 45-49, 50-54, dan 65+. Evaluasi model prediksi menggunakan root mean squared error (RMSE) menghasilkan nilai 0.884 +/- 0.000. Nilai RMSE ini menunjukkan bahwa model memiliki tingkat kesalahan yang rendah, sehingga dapat diandalkan untuk memprediksi persentase merokok berdasarkan kelompok umur di Indonesia.

References

Anis, P., Sekar, D., & Kharisudin, I. (2022). Analisis Peramalan dengan Long Short Term Memory pada Data Kasus Covid-19 di Provinsi Jawa Tengah. 5, 752–758.

Aqsho Ramadhan, Y., Faqih, A. ., & Dwilestari, G. . (2023). Prediksi Penjualan Handphone di Toko X menggunakan Algoritma Regresi Linear. Jurnal Informatika Terpadu, 9(1), 40–44. https://doi.org/10.54914/jit.v9i1.692

Dahlia, & Andri. (2020). Implementasi Data Mining untuk Prediksi Persediaan Obat pada Puskesmas Kertapati menggunakan Regresi Linier Berganda. Jurnal Sistem Dan Informatika, 95–103. https://doi.org/10.30864/jsi.v15i2.331

Gita Kanya Paramitha, & Stephani Raihana Hamdan. (2022). Pengaruh Self-Control terhadap Perilaku Merokok Mahasiswa selama Pandemi COVID-19. Jurnal Riset Psikologi, 1(2), 132–139. https://doi.org/10.29313/jrp.v1i2.559

Maharadja, A. N., Maulana, I., & Dermawan, B. A. (2021). Penerapan Metode Regresi Linear Berganda untuk Prediksi Kerugian Negara Berdasarkan Kasus Tindak Pidana Korupsi. Journal of Applied Informatics and Computing, 5(1), 95–102. https://doi.org/10.30871/jaic.v5i1.3184

Marianti, A., & Prayitno, B. (2020). Analisis Pengaruh Faktor Sosial Ekonomi, Pendapatan dan Harga Rokok Terhadap Konsumsi Rokok di Indonesia. Economie: Jurnal Ilmu Ekonomi, 1(2), 93. https://doi.org/10.30742/economie.v1i2.1126

Maulana, A., Martanto, M., & Ali, I. (2024). Prediksi Hasil Produksi Panen Bawang Merah Menggunakan Metode Regresi Linier Sederhana. JATI (Jurnal Mahasiswa Teknik Informatika), 7(4), 2884–2888. https://doi.org/10.36040/jati.v7i4.7281

Muhartini, A. A., Sahroni, O., Rahmawati, S. D., Febrianti, T., & Mahuda, I. (2021). Analisis Peramalan Jumlah Penerimaan Mahasiswa Baru Dengan Menggunakan Metode Regresi Linear Sederhana. Jurnal Bayesian : Jurnal Ilmiah Statistika Dan Ekonometrika, 1(1), 17–23. https://doi.org/10.46306/bay.v1i1.2

Novianty, D., Palasara, N. D., & Qomaruddin, M. (2021). Algoritma Regresi Linear pada Prediksi Permohonan Paten yang Terdaftar di Indonesia. Jurnal Sistem Dan Teknologi Informasi (Justin), 9(2), 81. https://doi.org/10.26418/justin.v9i2.43664

Nurmanto, R., & Islami, H. Al. (2024). Pemberangkatan Unit Luar Pulau Untuk Memprediksi Jangka Waktu Penerimaan Unit Ac. 3(4), 850–864.

Trianggana, D. A. (2020). a Peramalan Jumlah Siswa-Siswi Melalui Pendekatan Metode Regresi Linear. Jurnal Media Infotama, 16(2), 115–120. https://doi.org/10.37676/jmi.v16i2.1149

Utomo, D. P., & Mesran, M. (2020). Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung. Jurnal Media Informatika Budidarma, 4(2), 437. https://doi.org/10.30865/mib.v4i2.2080

Downloads

Published

2024-11-13

How to Cite

Riziq Shihab, M. A. ., & Napiah, M. (2024). Linear Regression Analysis to Predict the Percentage of Smoking in the Population Age 15 Years and Over . Informatics and Software Engineering, 2(2), 76–88. https://doi.org/10.58777/ise.v2i2.328
image host Views: 73 | image host Downloaded: 9