EFEKTIVITAS ALGORITMA MACHINE LEARNING DALAM KLASIFIKASI PENYAKIT HIPERTENSI DENGAN MENGGUNAKAN EDA (STUDI KASUS DINAS KESEHATAN MUSI RAWAS)
Kata Kunci:
Machine Learning, Klasifikasi, Hipertensi, Puskesmas Mangunharjo, Exploratory Data Analysis (EDA)Abstrak
Penelitian ini bertujuan untuk menganalisis efektivitas algoritma machine learning dalam klasifikasi penyakit hipertensi di Puskesmas Mangunharjo, Kabupaten Musi Rawas. Data yang digunakan mencakup 1.733 data pasien dari periode Januari hingga Desember 2023, di mana 550 di antaranya terdiagnosis hipertensi. Metode pengumpulan data meliputi data primer dari registrasi pasien dan data sekunder yang relevan. Proses analisis dimulai dengan tahap preprocessing untuk menangani missing values, standarisasi, dan normalisasi data. Penelitian ini menerapkan beberapa algoritma klasifikasi, termasuk Random Forest, Logistic Regression, SVM, Naïve Bayes, dan ANN. Evaluasi dilakukan menggunakan teknik Cross-Validation k-fold 10, Confusion Matrix, dan grafik ROC-AUC. Hasil menunjukkan bahwa algoritma ANN mencapai akurasi tertinggi sebesar 95%, diikuti oleh LR dan NB dengan akurasi 91%. Klasifikasi ini berhasil mengidentifikasi 1.998 pasien hipertensi dan 283 pasien non-hipertensi. Dari analisis yang telah dilakukan, diketahui bahwa penerapan machine learning dan teknik EDA efektif dalam meningkatkan akurasi diagnosis hipertensi. Penelitian ini memberikan wawasan penting bagi pengembangan sistem pendukung keputusan di bidang kesehatan, serta menekankan perlunya penerapan teknologi dalam pengelolaan kesehatan masyarakat.
This research aims to analyze the effectiveness of machine learning algorithms in classifying hypertension at the Mangunharjo Community Health Center, Musi Rawas Regency. The data used includes 1,733 patient records from January to December 2023, of which 550 were diagnosed with hypertension. Data collection methods include primary data from patient registration and relevant secondary data. The analysis process begins with the preprocessing stage to handle missing values, standardization, and normalization of the data. This study applies several classification algorithms, including Random Forest, Logistic Regression, SVM, Naïve Bayes, and AN). Evaluation was conducted using the Cross-Validation k-fold 10 technique, Confusion Matrix, and ROC-AUC graphs. The results show that the ANN algorithm achieved the highest accuracy of 95%, followed by Logistic Regression and Naïve Bayes with 91% accuracy. This classification successfully identified 1,998 hypertensive patients and 283 non- hypertensive patients. From the analysis, it can be concluded that the application of machine learning and EDA techniques is effective in increasing the accuracy of hypertension diagnosis. This research provides important insights for the development of decision support systems in the health sector and emphasizes the need to apply technology in public health management.



