Abstract:
Perkembangan teknologi digital yang begitu pesat telah membuat aplikasi 
e-commerce, termasuk Shopee sebagai salah satu platform terkemuka dengan 
jutaan pengguna aktif, semakin banyak digunakan di Indonesia. Review pengguna 
pada Google Play Store adalah sumber data yang sangat berharga untuk 
mengevaluasi kualitas pelayanan sekaligus menganalisis sentimen konsumen. 
Namun, tingginya volume data serta kerumitan bahasa yang digunakan dalam 
ulasan mengharuskan adanya pendekatan analisis yang tepat dan efisien. Studi ini 
dirancang untuk mengevaluasi dan membandingkan efektivitas dua algoritma 
klasifikasi yang berbeda, yaitu Random Forest dan XGBoost dalam 
mengidentifikasi sentimen dari ulasan pengguna Shopee. Akuisisi data tekstual 
ulasan dilakukan secara terprogram melalui proses scraping lewat Play Store, 
proses lanjutan menerapkan workflow NLP standar yang mencakup: annotasi label, 
case normalization, data cleansing, tokenization, stopword elimination, dan 
morphological stemming. Tahap berikutnya melibatkan ekstraksi fitur dengan 
menerapkan skema TF-IDF, dilanjutkan dengan partisi korpus data dipartisi ke 
dalam dua kelompok terpisah, yakni subset pelatihan (training) dan subset validasi 
(testing). Kerangka klasifikasi kemudian dikonstruksi menggunakan algoritma 
Random Forest dan XGBoost, yang selanjutnya dinilai kinerjanya melalui 
serangkaian indikator evaluasi meliputi akurasi, presisi, recall, dan F1-score. 
Temuan dari studi ini diharapkan mampu menawarkan rekomendasi tentang 
algoritma yang memiliki efektivitas tertinggi dalam penilaian sentimen untuk 
platform e-commerce, serta memberikan kontribusi bagi peningkatan kualitas 
layanan dan penelitian lanjutan di bidang data mining dan pemrosesan bahasa 
alami.