Abstract:
Banjir merupakan salah satu bencana hidrometeorologi yang paling sering terjadi
di Indonesia dan menimbulkan dampak signifikan terhadap aktivitas sosial,
ekonomi, serta infrastruktur. Kecamatan Medan Marelan termasuk wilayah
dengan tingkat kerawanan banjir yang tinggi akibat curah hujan ekstrem dan
keterbatasan sistem drainase. Oleh karena itu, diperlukan pendekatan prediktif
berbasis data untuk mendukung upaya mitigasi bencana. Penelitian ini bertujuan
mengembangkan model prediksi risiko banjir menggunakan algoritma Logistic
Regression dengan memanfaatkan variabel meteorologi, yaitu curah hujan, suhu
udara, kelembapan, tekanan udara, dan kecepatan angin. Data penelitian diperoleh
dari BMKG Medan dan BPBD Kota Medan dengan total lebih dari 1.000 catatan
harian selama periode Mei 2022–Mei 2025. Prosedur penelitian meliputi tahap
pengumpulan data, pra-pemrosesan, pembagian dataset menjadi data latih dan data
uji, pelatihan model, hyperparameter tuning, serta evaluasi performa. Kinerja
model diuji menggunakan metrik accuracy, precision, recall, F1-score, dan AUC
ROC. Hasil evaluasi menunjukkan bahwa Logistic Regression mampu
memberikan prediksi dengan akurasi 64%, precision 0,99, recall 0,64, F1-score
0,78, dan nilai AUC sebesar 0,60. Model ini dinilai cukup efektif dalam mengenali
potensi kejadian banjir, meskipun masih terkendala oleh ketidakseimbangan
distribusi data. Dengan demikian, penerapan Logistic Regression terbukti
memiliki potensi sebagai metode prediksi risiko banjir yang sederhana,
interpretatif, dan adaptif. Temuan penelitian ini diharapkan dapat berkontribusi
pada pengembangan sistem peringatan dini serta menjadi dasar perumusan
kebijakan mitigasi banjir di tingkat lokal