Abstract:
Penyakit gagal jantung merupakan salah satu penyebab utama kematian di seluruh
dunia. Deteksi dini terhadap risiko gagal jantung menjadi krusial untuk
meminimalisir dampak serius yang dapat ditimbulkan. Penelitian ini bertujuan
untuk membandingkan performa dua algoritma machine learning, yaitu Logistic
Regression dan K-Nearest Neighbor (KNN) dalam memprediksi gagal jantung
menggunakan dataset dari platform Kaggle. Tahapan penelitian meliputi
preprocessing data, normalisasi, pembagian data latih dan uji, serta implementasi
model dan evaluasi menggunakan confusion matrix. Evaluasi dilakukan
berdasarkan metrik akurasi, presisi, recall, dan f1-score. Hasil penelitian
menunjukkan bahwa Logistic Regression memiliki akurasi sebesar 88,04% dan
waktu eksekusi 0,022 detik, sedangkan KNN memperoleh akurasi sebesar 85,51%
dan waktu eksekusi 0,158 detik. Logistic Regression unggul dalam recall dan f1
score, menjadikannya lebih efektif untuk deteksi dini gagal jantung. Dengan
demikian, algoritma Logistic Regression dinilai lebih optimal dibandingkan KNN
dalam konteks penelitian ini. Tetapi algoritma Logistic Regression tidak selalu
lebih unggul dari K-Nearest Neighbor, karena hasil prediksi sangat bergantung
pada karakteristik studi kasus.