ANALISIS KLASIFIKASI DATA MAHASISWA DALAM MENENTUKAN KELULUSAN TEPAT WAKTU MENGGUNAKAN METODE DECISION TREE
Kata Kunci:
Data Mining, Decision Tree, ETL, Kelulusan Mahasiswa, KlasifikasiAbstrak
Ketepatan waktu kelulusan mahasiswa merupakan indikator penting dalam menilai efektivitas proses akademik di perguruan tinggi. Penelitian ini bertujuan untuk menganalisis dan memprediksi kelulusan mahasiswa tepat waktu menggunakan metode Decision Tree berbasis data mining. Dataset yang digunakan berjumlah 100.000 data mahasiswa dalam format CSV dengan 10 atribut, terdiri dari 4 atribut numerik utama akademik (IPK, IPS rata-rata, IPS semester akhir, IPS tren), 4 atribut numerik pendukung (jumlah mata kuliah tidak lulus, jumlah cuti akademik, jumlah semester, status kelulusan), serta 2 atribut kategorikal (pekerjaan sambil kuliah dan kategori kehadiran). Hasil analisis statistik deskriptif menunjukkan bahwa nilai IPK rata-rata mahasiswa sebesar 2,99 dengan rentang 2,00–4,00, sementara rata-rata jumlah semester sebesar 10,5 semester. Proporsi mahasiswa yang lulus tepat waktu dan tidak tepat waktu relatif seimbang, masing-masing sekitar 49,96% dan 50,04%. Model Decision Tree yang dibangun menghasilkan akurasi sebesar 75,32%, dengan nilai recall kelas lulus tepat waktu mencapai 77%. Atribut IPK, jumlah semester, dan jumlah mata kuliah tidak lulus menjadi faktor paling dominan dalam proses klasifikasi. Hasil penelitian ini menunjukkan bahwa Decision Tree mampu memberikan interpretasi yang jelas terhadap pola kelulusan mahasiswa dan dapat digunakan sebagai alat bantu evaluasi akademik.
The punctuality of student graduation is a crucial indicator in assessing the effectiveness of the academic process in higher education. This study aims to analyze and predict on-time student graduation using a data mining-based Decision Tree method. The dataset used comprises 100,000 student data in CSV format with 10 attributes: four primary academic numeric attributes (GPA, average GPA, final semester GPA, GPA trend), four supporting numeric attributes (number of failed courses, number of academic leaves, number of semesters, graduation status), and two categorical attributes (employment while studying and attendance category). The descriptive statistical analysis results show that the average student GPA is 2.99 with a range of 2.00–4.00, while the average number of semesters is 10.5 semesters. The proportions of students graduating on time and not on time are relatively balanced, approximately 49.96% and 50.04%, respectively. The Decision Tree model produced an accuracy of 75.32%, with a recall rate of 77% for on-time graduates. The attributes of GPA, number of semesters, and number of failed courses are the most dominant factors in the classification process. The results of this study indicate that Decision Trees are capable of providing a clear interpretation of student graduation patterns and can be used as an academic evaluation tool.


