Abstract:
Penelitian ini bertujuan untuk menganalisis dan memprediksi prestasi siswa menggunakan
teknik data mining dengan metode C4.5 dan Naive Bayes. Data yang digunakan meliputi
berbagai faktor yang mempengaruhi prestasi akademik siswa, seperti nilai sebelumnya,
kehadiran, dan penghasilan orang tua. Metode C4.5, yang merupakan algoritma pohon
keputusan, digunakan untuk mengidentifikasi pola-pola dalam data dan membuat
keputusan berbasis aturan. Sementara itu, Naive Bayes, yang merupakan teknik klasifikasi
probabilistik, digunakan untuk menghitung kemungkinan prestasi berdasarkan distribusi
fitur yang ada. Model algoritma C4.5 menunjukkan performa yang sangat baik dalam
mengklasifikasikan siswa ke dalam kategori "Kurang Berprestasi" dan "Berprestasi,"
dengan akurasi dan F1-Score yang sempurna untuk kedua kelas. Di sisi lain, model Naive
Bayes menunjukkan hasil yang kurang optimal, terutama dalam mengenali siswa
"Berprestasi." Meskipun model Naive Bayes berhasil memprediksi semua siswa "Kurang
Berprestasi" dengan benar, model tersebut gagal sepenuhnya dalam mendeteksi siswa
"Berprestasi," yang terlihat dari F1-Score yang nol untuk kelas tersebut.