PENERAPAN DATA MINING UNTUK ANALISIS DATA AKADEMIK PADA FAKTOR-FAKTOR YANG MEMPENGARUHI IPK MAHASISWA STUDI KASUS : PROGRAM STUDI SISTEM INFORMASI UNIVERSITAS MAHAKARYA ASIA

Penulis

  • Muhammad Rizqi Universitas Mahakarya Asia
  • Ahmad Budi trisnawan Universitas Mahakarya Asia

Kata Kunci:

Data Mining, C4.5, IPK Mahasiswa, CRISP-DM

Abstrak

Indeks Prestasi Kumulatif (IPK) merupakan indikator utama dalam menilai keberhasilan akademik mahasiswa di perguruan tinggi. Program Studi Sistem Informasi Universitas Mahakarya Asia memiliki volume data akademik yang besar, namun pemanfaatannya sebagai dasar pengambilan keputusan akademik masih belum optimal. Penelitian ini bertujuan untuk menganalisis faktor-faktor yang mempengaruhi IPK mahasiswa dengan menerapkan teknik data mining menggunakan algoritma C4.5. Metodologi penelitian mengikuti kerangka kerja Cross-Industry Standard Process for Data Mining (CRISP-DM) yang meliputi tahap pemahaman bisnis, pemahaman data, persiapan data, pemodelan, evaluasi, dan deployment. Dataset yang digunakan terdiri dari 500 data mahasiswa, yang setelah melalui proses preprocessing menjadi 420 data valid dengan delapan atribut independen dan satu atribut target berupa klasifikasi IPK. Hasil perhitungan entropy, gain, dan gain ratio menunjukkan bahwa atribut IP Semester 2 memiliki nilai gain ratio tertinggi sehingga terpilih sebagai simpul akar dalam pembentukan pohon keputusan. Faktor lain yang berpengaruh sebagai simpul cabang antara lain IP Semester 1, status pekerjaan, dan jalur masuk mahasiswa. Evaluasi model menggunakan confusion matrix menghasilkan nilai akurasi sebesar 88,30%, presisi 89,52%, dan recall 87,24%, yang menunjukkan bahwa model memiliki tingkat keandalan yang sangat baik. Hasil penelitian ini membuktikan bahwa algoritma C4.5 efektif digunakan untuk mengidentifikasi faktor dominan yang mempengaruhi IPK mahasiswa. Temuan ini diharapkan dapat menjadi dasar bagi pihak program studi dalam merancang kebijakan akademik serta sistem peringatan dini untuk meningkatkan kualitas dan keberhasilan studi mahasiswa

Grade Point Average (GPA) is a primary indicator used to measure students’ academic achievement in higher education. The Information Systems Study Program at Universitas Mahakarya Asia stores a large amount of academic data; however, its utilization for strategic academic decision-making remains limited. This study aims to analyze the factors influencing students’ GPA by applying data mining techniques using the C4.5 algorithm. The research methodology adopts the Cross-Industry Standard Process for Data Mining (CRISP-DM), which consists of business understanding, data understanding, data preparation, modeling, evaluation, and deployment stages. The dataset comprises 500 student records, which were reduced to 420 valid records after preprocessing, involving eight independent attributes and one dependent attribute in the form of GPA classification. The results of entropy, gain, and gain ratio calculations indicate that Semester 2 GPA has the highest gain ratio, making it the root node in the decision tree model. Other influential attributes identified as branch nodes include Semester 1 GPA, employment status, and admission pathway. Model evaluation using a confusion matrix yielded an accuracy of 88.30%, precision of 89.52%, and recall of 87.24%, demonstrating that the proposed model has a high level of reliability. These findings confirm that the C4.5 algorithm is effective in identifying dominant factors affecting students’ academic performance. The results are expected to serve as a reference for academic management in developing data-driven policies and early warning systems to improve students’ academic success and educational quality.

Unduhan

Diterbitkan

2026-01-31