| dc.description.abstract |
lagiarisme kode program merupakan permasalahan yang sering terjadi
dalam dunia pendidikan dan pengembangan perangkat lunak, yang sulit dideteksi
secara akurat menggunakan pendekatan berbasis teks. Metode konvensional seperti
Term Frequency–Inverse Document Frequency (TF-IDF) dan cosine similarity
cenderung hanya memperhatikan kesamaan token, sehingga kurang efektif dalam
menangani perubahan struktur kode. Oleh karena itu, penelitian ini bertujuan untuk
mengembangkan sistem deteksi plagiarisme kode program berbasis struktur
menggunakan Abstract Syntax Tree (AST) dan Graph Neural Network (GNN).
Metode yang digunakan melibatkan proses parsing kode program menjadi AST,
kemudian direpresentasikan dalam bentuk graph dan diproses menggunakan model
GNN dalam skema pairwise. Selain itu, dilakukan perbandingan dengan metode
baseline berbasis TF-IDF dan cosine similarity untuk mengevaluasi kinerja model.
Dataset yang digunakan terdiri dari data rekayasa dan data nyata yang dibagi
menjadi data pelatihan dan pengujian. Hasil penelitian menunjukkan bahwa model
GNN memiliki performa yang sangat baik dengan nilai accuracy sebesar 0.9946,
precision sebesar 0.9949, recall sebesar 0.9974, dan F1-score sebesar 0.9962,
sedangkan metode baseline hanya mencapai accuracy sebesar 0.7392 dan recall
sebesar 0.6343. Hal ini menunjukkan bahwa model GNN mampu mendeteksi
plagiarisme secara lebih efektif, terutama dalam menangani perubahan struktur
kode. Dengan demikian, dapat disimpulkan bahwa pendekatan berbasis struktur
menggunakan AST dan GNN lebih unggul dibandingkan pendekatan berbasis teks
dalam mendeteksi plagiarisme kode program. |
en_US |