Abstract:
Penelitian ini bertujuan untuk membandingkan performa dua metode klasifikasi,
yaitu Logistic Regression dan Random Forest, dalam menganalisis sentimen publik
terhadap film Agak Laen berdasarkan komentar di media sosial Instagram. Data
yang digunakan berjumlah 1.000 komentar yang telah melalui proses praproses
teks, seperti pembersihan data, normalisasi, stopword removal, dan stemming.
Setiap komentar diberi label sentimen secara manual ke dalam tiga kategori:
negatif, netral, dan positif. Setelah dilakukan proses ekstraksi fitur menggunakan
metode TF-IDF, data dibagi menjadi data latih dan data uji dengan rasio 90:10.
Model kemudian dilatih dan dievaluasi menggunakan metrik evaluasi seperti
akurasi dan f1-score. Hasil evaluasi menunjukkan bahwa metode Random Forest
memiliki akurasi lebih tinggi sebesar 98% dan f1-score sebesar 0,975,
dibandingkan dengan Logistic Regression yang menghasilkan akurasi 96% dan f1
score sebesar 0,94. Berdasarkan hasil tersebut, Random Forest dinilai lebih unggul
dalam mengklasifikasikan komentar sentimen terhadap film Agak Laen. Penelitian
ini
menunjukkan bahwa pemilihan metode klasifikasi yang tepat sangat
berpengaruh dalam analisis sentimen publik, terutama pada data yang memiliki
distribusi kelas tidak seimbang.