ANALISIS FAKTOR RISIKO HIPERTENSI PADA REMAJA PERKOTAAN MENGGUNAKAN METODE DATA MINING DECISION TREE C4.5

Penulis

  • Nur’ain Manasai Universitas Negeri Gorontalo
  • Laksmyn Kadir Universitas Negeri Gorontalo
  • Ramly Abudi Universitas Negeri Gorontalo

Kata Kunci:

Hipertensi Remaja, Faktor Risiko, Data Mining, Rapidminer, Decision Tree C4.5

Abstrak

Hipertensi pada remaja menjadi masalah kesehatan yang meningkat akibat perubahan gaya hidup. Penelitian ini bertujuan mengidentifikasi faktor risiko hipertensi pada remaja perkotaan menggunakan metode data mining dengan algoritma Decision Tree C4.5 pada RapidMiner. Penelitian kuantitatif ini melibatkan 130 remaja usia 15–19 tahun di wilayah kerja Puskesmas Dumbo Raya Kota Gorontalo. Variabel yang dianalisis meliputi faktor genetik, obesitas, stres, merokok, konsumsi garam berlebih, konsumsi kopi, durasi tidur, dan status hipertensi. Data diolah melalui tahap preprocessing, pembentukan model Decision Tree C4.5, serta evaluasi menggunakan confusion matrix dengan pembagian data training dan testing 80:20. Hasil penelitian menunjukkan bahwa durasi tidur merupakan faktor paling dominan, diikuti konsumsi kopi, faktor genetik, obesitas, konsumsi garam berlebih, merokok, dan stres. Model menghasilkan akurasi 88,46% dan mampu membentuk aturan klasifikasi yang mudah dipahami. Algoritma Decision Tree C4.5 efektif digunakan untuk mendukung deteksi dini hipertensi pada remaja.

Hypertension among adolescents has become an increasing health problem due to lifestyle changes. This study aims to identify hypertension risk factors among urban adolescents using data mining with the C4.5 decision tree algorithm in RapidMiner. This quantitative study involves 130 adolescents aged 15-19 years in the working area of Dumbo Raya Public Health Center, Gorontalo City. The variables analyzed include genetic factors, obesity, stress, smoking, excessive salt consumption, coffee consumption, sleep duration, and hypertension status. The data are preprocessed, a C4.5 Decision Tree model is developed, and evaluation is performed using a confusion matrix with an 80:20 training-testing split. The results show that sleep duration is the most dominant factor, followed by coffee consumption, genetic factors, obesity, excessive salt consumption, smoking, and stress. The model achieves an accuracy of 88.46% and can generate easily understandable classification rules. The C4.5 decision tree algorithm is effective in supporting the early detection of hypertension among adolescents.

Unduhan

Diterbitkan

2026-06-29