Abstract:
Perkembangan teknologi digital yang begitu pesat telah membuat aplikasi
e-commerce, termasuk Shopee sebagai salah satu platform terkemuka dengan
jutaan pengguna aktif, semakin banyak digunakan di Indonesia. Review pengguna
pada Google Play Store adalah sumber data yang sangat berharga untuk
mengevaluasi kualitas pelayanan sekaligus menganalisis sentimen konsumen.
Namun, tingginya volume data serta kerumitan bahasa yang digunakan dalam
ulasan mengharuskan adanya pendekatan analisis yang tepat dan efisien. Studi ini
dirancang untuk mengevaluasi dan membandingkan efektivitas dua algoritma
klasifikasi yang berbeda, yaitu Random Forest dan XGBoost dalam
mengidentifikasi sentimen dari ulasan pengguna Shopee. Akuisisi data tekstual
ulasan dilakukan secara terprogram melalui proses scraping lewat Play Store,
proses lanjutan menerapkan workflow NLP standar yang mencakup: annotasi label,
case normalization, data cleansing, tokenization, stopword elimination, dan
morphological stemming. Tahap berikutnya melibatkan ekstraksi fitur dengan
menerapkan skema TF-IDF, dilanjutkan dengan partisi korpus data dipartisi ke
dalam dua kelompok terpisah, yakni subset pelatihan (training) dan subset validasi
(testing). Kerangka klasifikasi kemudian dikonstruksi menggunakan algoritma
Random Forest dan XGBoost, yang selanjutnya dinilai kinerjanya melalui
serangkaian indikator evaluasi meliputi akurasi, presisi, recall, dan F1-score.
Temuan dari studi ini diharapkan mampu menawarkan rekomendasi tentang
algoritma yang memiliki efektivitas tertinggi dalam penilaian sentimen untuk
platform e-commerce, serta memberikan kontribusi bagi peningkatan kualitas
layanan dan penelitian lanjutan di bidang data mining dan pemrosesan bahasa
alami.