Abstract:
Metode jarak Manhattan dan Euclidean adalah dua metode jarak yang memiliki
kemampuan yang luar biasa dan cukup populer dikalangan peneliti, kedua metode
ini cendrung digunakan oleh peneliti untuk memperoleh hasil pengklasteran dari
data yang diolah dengan tujuan agar mengetahui pola tertentu dan dapat
menghasilkan penafsiran-penafsiran tertentu, namun dari dua metode tersebut perlu
dicari tahu metode yang mana yang paling baik performanya. Pada penelitian ini,
peneliti akan melakukan pengujian metode jarak Manhattan dan Euclidean dengan
menggunakan algoritma K-means Clustering terhadap data rasio Gini di Sumatera
Utara mulai dari tahun 2000-2023 dengan menggunakan library Pandas,
Matplotlib, dan Seaborn. Dalam proses penelitian ini, peneliti melakukan
perhitungan hasil nilai performa yang terdiri dari Dunn Index dan jumlah iterasi
pada dataset rasio gini pada setiap metode jarak. Berdasarkan hasil pengujian,
didapatkan performa pada metode K-Means Clustering yang menggunakan
Manhattan Distance bernilai Dunn Index sebesar 0.2860941592407533 dengan
jumlah iterasi sebanyak 3 iterasi, sedangkan pada metode K-Means Clustering yang
menggunakan Euclidean Distance bernilai Dunn Index sebesar
0.28572673870340515 dengan jumlah iterasi sebanyak 3 iterasi. Performa metode
jarak dalam proses K-means Clustering terbaik pada dataset rasio Gini yaitu metode
Manhattan Distance.