Abstract:
Tingginya variasi tuition fee dan living cost antar perguruan tinggi di berbagai
negara menjadikan proses pengambilan keputusan bagi calon mahasiswa
internasional semakin kompleks. Penelitian ini menggunakan dataset dari Kaggle
dengan total 1.408 data. Tahapan penelitian meliputi pengumpulan data,
preprocessing dengan normalisasi Z-Score, penentuan jumlah klaster optimal
menggunakan kriteria Bayesian Information Criterion (BIC) dan Akaike
Information Criterion (AIC), serta estimasi parameter melalui algoritma
Expectation-Maximization (EM). Penerapan metode GMM didasarkan pada
karakteristiknya yang mampu memodelkan distribusi data yang kompleks dan
multivariat melalui pendekatan probabilistik. Hasil penelitian menunjukkan bahwa
model GMM dengan K=7, cukup efektif dalam mengidentifikasi tujuh kelompok
perguruan tinggi dengan profil biaya yang berbeda dan bermakna, dengan model
mencapai konvergensi pada iterasi ke-139. Temuan ini menunjukkan bahwa
pendekatan soft clustering berbasis GMM cukup memadai dalam menemukan pola
tersembunyi pada data biaya mahasiswa internasional yang bersifat right-skewed
dan tidak simetris.