Makalah ini mengevaluasi metode klastering hirarki agglomerative untuk mengelompokkan situs pemantauan lalu lintas menjadi kelompok musiman berdasarkan kesamaan data lalu lintas tahunan mereka. Penelitian ini menemukan bahwa metode McQuitty ini melakukan pekerjaan terbaik dalam pengelompokan situs berdasarkan lokasi mereka, bukan kelas jalan atau tren tahun ke tahun
1. Critical Review Evaluation Of Agglomerative Hierarchical Clustering Method
1. Pendahuluan
Tulisan ini adalah critical review untuk penelitian pustaka tentang Eval-
uation Of Agglomerative Hierarchical Clustering Method Min-Tang Li, Ph.D
, sebagai tugas mata kuliah Data Mining yang disusun oleh Agus Herawan (
G651130714). Penelitian pustaka mengambil latar belakang mengenai usulan
pengelompokan berdasarkan clustering pada data time series
2. Ringkasan
Makalah ini menjelaskan temuan dari evaluasi kinerja metode klastering
hirarki agglomerative untuk menentukan kelompok faktor musiman. Kelom-
pok faktor musiman biasanya ditentukan dengan analisis klaster tradisional
yang didasarkan pada berbagai tindakan kesamaan. Metode hirarki agglom-
erative menggabungkan situs pemantauan lalu lintas telemetri (TTMSs) men-
jadi kelompok-kelompok sesuai dengan kesamaan mereka. Berbagai tindakan
kesamaan dapat digunakan dalam analisis cluster. Penelitian ini mengeval-
uasi total delapan metode agglomerative clustering: metode rata-rata linkage,
metode centroid, metode EML, metode eksibel-beta, metode analisis kesamaan
McQuitty ini, metode median, metode single linkage, dan metode minimum-
variance Ward. Data Multi-tahun dikumpulkan antara tahun 1997 dan 2000
dari 21 TTMSs di Florida Departemen Perhubungan (FDOT) Distrik 4 yang
digunakan dalam penelitian ini. The Pseudo F (PSF) statistik dipekerjakan
sebagai kriteria untuk menentukan jumlah cluster. Keterkaitan, massa, dan
metode single linkage rata-rata yang ditemukan lebih kuat untuk outlier dari-
pada metode lain. Penelitian ini juga menemukan bahwa metode McQuitty
ini (MCQ) dilakukan lebih baik daripada metode lain pengelompokan TTMSs
setelah outlier dihilangkan. Ketika metode MCQ diterapkan untuk menganali-
sis data historis yang dikumpulkan antara tahun 1997 dan 1999, TTMSs tidak
konsisten ditugaskan untuk kelompok cluster yang sama di tahun. Jalan kelas
fungsional ditemukan tidak signikan dalam menentukan kelompok musiman,
sementara lokasi spasial merupakan faktor yang lebih signikan karena TTMS
cenderung mengelompok dengan orang-orang dalam kedekatannya. Makalah ini
telah menggariskan prosedur yang memungkinkan praktisi untuk membangun
kelompok faktor musiman dari situs TTMS. Berdasarkan data dari FDOT Dis-
trik 4, statistik PSF ditemukan menjadi ukuran yang baik untuk menentukan
jumlah cluster setelah mungkin outlier dikeluarkan. Outliers perlu dipelajari
lebih lanjut untuk menyelidiki kemungkinan penyebab / pola lalu lintas mereka
unik bulanan mingguan. Perlu dicatat bahwa kesimpulan dari penelitian ini
tidak bisa digeneralisasi untuk semua daaerah lain di Florida atau negara-negara
lain karena mereka ditarik hanya didasarkan pada kondisi arus lalu lintas dari
kawasan tertentu di Florida. Penelitian serupa dapat dilakukan di daerah lain
untuk menentukan kekokohan prosedur evaluasi yang telah digunakan dalam
penelitian ini.
3. Kritik
Dalam makalah ini, penulis telah memberikan penjelasana bagaimana teknik
yang dipakai dalam mengklasterkan data trac di Florida. Latar belakang yang
diangkatpun pada dasarnya baik dan mudah dipahami, sehingga pembaca akan
1
2. mudah mengikuti alur yang telah dibuat oleh penyusun walaupun, ada sedikit
kekurangan yakni tidak adanya keterangan mengenai data set sehingga pembaca
tidak bisa membayangkan bagaimana penerapannya ke tema yang akan dikem-
bangkan.. Secara garis besar tidak ada masalah dalam sistematika penulisan
karena, pada dasarnya penyusun mampu menyajikannya dengan baik.
4. Kesimpulan
Secara keseluruhan, dapat diambil beberapa simpulan dari tulisan tersebut.
Pertama, tujuan penulis baik terhadap pembaca sudah dikemukakan. Kedua,
penulis belum mengemukakan beberap pendekatan dan teknik data mining di
dalam paper ini.
2