Abstract:
Industri telekomunikasi menghadapi tantangan besar terkait customer churn, di
mana biaya akuisisi pelanggan baru jauh lebih tinggi dibandingkan biaya
mempertahankan pelanggan yang sudah ada. Penelitian ini bertujuan untuk
membangun model prediksi customer churn yang optimal menggunakan algoritma
XGBoost untuk mendukung strategi retensi pelanggan. Metodologi yang digunakan
adalah Cross-Industry Standard Process for Data Mining (CRISP-DM) dengan
memanfaatkan dataset sekunder dari Kaggle yang mencakup 7.043 data pelanggan.
Tantangan ketidakseimbangan data diatasi dengan teknik Synthetic Minority Over
sampling Technique (SMOTE) pada data latih untuk meningkatkan kemampuan
deteksi kelas minoritas. Hasil evaluasi menggunakan Stratified 5-Fold Cross
Validation menunjukkan performa model yang sangat handal dengan tingkat
akurasi mencapai 87,4% dan nilai recall sebesar 82,1%. Model ini kemudian
diimplementasikan ke dalam sistem informasi berbasis web menggunakan
framework FastAPI dan Neon Database. Sistem ini mampu melakukan klasifikasi
tingkat risiko pelanggan (Low, Medium, High) secara real-time serta
mengintegrasikan teknologi Generative AI (Gemini API) untuk memberikan
rekomendasi strategi retensi yang dipersonalisasi dan komunikatif bagi agen
layanan pelanggan .