SlideShare a Scribd company logo
1 of 13
Similarity and
Disimilarity
Irwansyah Saputra, S.Kom., M.Kom., MTA
Founder of Multinity Indonesia
Tentang Saya
• Irwansyah Saputra
• Dosen Ilmu Komputer
• Mahasiswa S3 Ilmu Komputer IPB University
• Bidang Kajian: Computational Intelligence &
Optimization (Data mining, machine
learning, artificial intelligence)
Halo semuanya, saya suka belajar tentang
segala hal dan suka berbagi pengetahuan. Saya
juga sering menjadi pembicara di berbagai
seminar.
Kontak yang bisa dihubungi:
WhatsApp: 0895323302241
Instagram: @irwansight_
Web: https://irw.one
Disclaimer
Materi ini digunakan sebagai bahan ajar Program Data Mining di
Multinity.id
Silakan gunakan, mohon untuk tidak mengubah template.
Jika Anda memiliki kesulitan dalam memahami materi pada slide
ini, silakan belajar di Multinity.id
Referensi
1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Third
Edition, Elsevier, 2012
2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning
Tools and Techniques 3rd Edition, Elsevier, 2011
3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and
Business Analytics Applications, CRC Press Taylor & Francis Group, 2014
4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining,
John Wiley & Sons, 2005
5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press, 2014
6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer,
2011
7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook
Second Edition, Springer, 2010
8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining
of Enterprise Data: Algorithms and Applications, World Scientific, 2007
9. Suyanto, DATA MINING: Untuk klasifikasi dan klasterisasi data, Penerbit
Informatika, 2017
Euclidian Distance
• Teknik pengukuran jarak Euclidian Distance merupakan teknik yang
sangat populer digunakan untuk atribut dengan tipe data numerik.
• Rumus:
𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 =
𝑖=1
𝑛
𝑝𝑖 − 𝑞𝑖
2
= 𝑝1 − 𝑞1
2 + 𝑝2 − 𝑞2
2 + ⋯ + 𝑝𝑛 − 𝑞𝑛
2
Keterangan:
P, Q : Tupel dari tiap atribut yang akan dihitung
Euclidian Distance
• Teknik euclidian distance memiliki cara kerja dengan mencari jarak
terpendek antar dua objek tanpa melihat rintangan pada jalur yang
dilaluinya.
• Euclidian distance tidak dapat memberi informasi jarak terpendek
dalam dunia penerbangan karena (dunia penerbangan) mengikuti
kelengkungan bumi.
Manhattan Distance
• Teknik ini sedikit kalah populer dengan euclidian distance, namun penting
untuk dibahas karena memiliki pendekatan yang berbeda.
• Secara fungsi, manhattan distance juga dapat digunakan untuk tugas
klasifikasi, klaster, pengolahan citra dan kasus lainnya.
• Cara kerja manhattan berbeda dengan teknik sebelumnya, karena ia berjalan
pada grid, tidak menerobos rintangan seperti euclidian.
• Rumusnya
𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 = 𝑝𝑖 − 𝑞𝑖
2
Keterangan:
P, Q : Tupel dari tiap atribut yang akan dihitung
Manhattan Distance
• Manhattan lebih cepat dalam proses komputasi dan dapat digunakan untuk
menghitung jarak antar lokasi titik pada peta, karena jalan raya memiliki
jalurnya tersendiri dan terdapat penghalang seperti gedung atau objek lain.
• Sehingga, sangat tidak mungkin jika perhitungan jarak antar lokasi nyata ini
menggunakan euclidian distance.
Chebyshev Distance
• Berbeda dengan kedua teknik pengukuran jarak sebelumnya, Chebyshev
distance didefinisikan sebagai perbedaan terbesar antara dua vektor di
sepanjang dimensi koordinat apa pun.
• Maksudnya, teknik ini hanyalah jarak maksimum dari suatu sumbu.
𝑑 𝑃, 𝑄 = max 𝑃 − 𝑄 = 𝑚𝑎𝑥 𝑝𝑖 − 𝑞𝑖
• Pada rumus tersebut kita bisa melihat bahwa cara kerja Chebyshev distance
adalah mencari selisih maksimum di antara kedua vektor.
• Selisih tersebut kemudian diabsolutkan untuk mencegah terjadinya minus.
Karena tidak mungkin ada jarak yang minus dalam kehidupan nyata.
Chebyshev Distance
• Agar lebih memahami tentang ini, kita bisa
gunakan gerakan raja pada permainan catur.
• Misalnya raja ingin berjalan mencapai titik
lingkaran.
• Ada berbagai kemungkinan cara
melangkahnya, namun di sini kita gunakan dua
pilihan saja agar lebih mudah dipahami, yaitu
jalur kanan dan jalur kiri.
• Jika kita melihat dengan baik, jalur kanan
memiliki langkah lebih cepat dari yang kiri
karena hanya 4 langkah saja, raja sudah
sampai tujuan.
• Berbeda dengan yang kiri, raja membutuhkan
6 langkah untuk menuju ke tujuan.
4
2
Cosine Similarity
• Teknik cosine similarity biasanya digunakan untuk mengatasi data yang
berdimensi tinggi seperti data teks.
• cosine similarity mengabaikan nilai dari suatu vektor, yang akan dihitung
adalah arahnya saja.
• Misalnya pada kata “baik” dan “jahat”. Kedua kata tersebut akan dinilai 1 oleh
cosine similarity.
• Rumus:
𝐷 𝑥, 𝑦 = cos 𝜃 =
𝑥. 𝑦
𝑥 𝑦
Cosine Similarity
• Untuk memahami lebih dalam terkait teknik cosine similarity, kita akan
menggunakan contoh dua dokumen sebagai berikut:
• D1 : “Kerja Kerja Kerja Typus”
• D2 : “Typus Typus Kerja Kerja”
• Kita anggap “Kerja” menjadi sumbu x, sedangkan “Typus” menjadi sumbu y. Maka
kita akan mendapatkan vektor A (3,1), vektor B (2,2). Langkah perhitungannya
menjadi:
cos 𝜃 =
𝑥. 𝑦
𝑥 𝑦
=
𝑥1𝑦1 + 𝑥2𝑦2
𝑥1
2
+ 𝑥2
2
. 𝑦1
2
+ 𝑦2
2
=
3.2 + 1.2
32 + 12 . 22 + 22
=
8
10 . 8
= 0.894
Cosine Similarity
• Berdasarkan hasil tersebut berarti dokumen A dan dokumen B memiliki
kemiripan yang dekat.
• Namun nilai tersebut tidak bisa kita ubah ke dalam persen, misalnya menjadi
89,4% dan mengatakan bahwa kemiripan dua dokumen tersebut adalah
sebesar 89,4%.
• Jika kita ingin melihat seberapa dekat kedua dokumen tersebut dalam bentuk
visual, maka ubah saja hasil 0,894 ke bentuk sudut cosinus, maka akan
didapatkan sudut sebesar 26.619729544329°. Hasilnya:
A
B
26°

More Related Content

What's hot

Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
Data mining 7   klasifikasi k nearest neighbor and pseudo k nnData mining 7   klasifikasi k nearest neighbor and pseudo k nn
Data mining 7 klasifikasi k nearest neighbor and pseudo k nnIrwansyahSaputra1
 
Data mining 5 klasifikasi decision tree dan random forest
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forestIrwansyahSaputra1
 
Data mining 2 exploratory data analysis
Data mining 2   exploratory data analysisData mining 2   exploratory data analysis
Data mining 2 exploratory data analysisIrwansyahSaputra1
 
Representasi Pengetahuan
Representasi PengetahuanRepresentasi Pengetahuan
Representasi PengetahuanSherly Uda
 
Metode pencarian heuristik
Metode pencarian heuristikMetode pencarian heuristik
Metode pencarian heuristikBaguss Chandrass
 
5. Doubly Linked List (Struktur Data)
5. Doubly Linked List (Struktur Data)5. Doubly Linked List (Struktur Data)
5. Doubly Linked List (Struktur Data)Kelinci Coklat
 
Bab 10 pemampatan citra
Bab 10 pemampatan citraBab 10 pemampatan citra
Bab 10 pemampatan citraSyafrizal
 
Dasar pemrograman pascal
Dasar pemrograman pascalDasar pemrograman pascal
Dasar pemrograman pascalSimon Patabang
 
Matematika Diskrit - 07 teori bilangan - 02
Matematika Diskrit - 07 teori bilangan - 02Matematika Diskrit - 07 teori bilangan - 02
Matematika Diskrit - 07 teori bilangan - 02KuliahKita
 
Pertemuan 4-5-6 Metode Pelacakan dan Pencarian
Pertemuan 4-5-6 Metode Pelacakan dan PencarianPertemuan 4-5-6 Metode Pelacakan dan Pencarian
Pertemuan 4-5-6 Metode Pelacakan dan PencarianEndang Retnoningsih
 
Forward Backward Chaining
Forward Backward ChainingForward Backward Chaining
Forward Backward ChainingHerman Tolle
 
Matematika Diskrit - 05 rekursi dan relasi rekurens - 01
Matematika Diskrit - 05 rekursi dan relasi rekurens - 01Matematika Diskrit - 05 rekursi dan relasi rekurens - 01
Matematika Diskrit - 05 rekursi dan relasi rekurens - 01KuliahKita
 
Bab 7 integrasi numerik
Bab 7 integrasi numerikBab 7 integrasi numerik
Bab 7 integrasi numerikKelinci Coklat
 
5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar Kriptografi5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar KriptografiRoziq Bahtiar
 
Modul 4 representasi pengetahuan
Modul 4   representasi pengetahuanModul 4   representasi pengetahuan
Modul 4 representasi pengetahuanahmad haidaroh
 
Pertemuan 05 Teknik Pencarian (Search) -lanjutan
Pertemuan 05 Teknik Pencarian (Search) -lanjutanPertemuan 05 Teknik Pencarian (Search) -lanjutan
Pertemuan 05 Teknik Pencarian (Search) -lanjutanEndang Retnoningsih
 
Pertemuan 04 Teknik Pencarian (Search)
Pertemuan 04 Teknik Pencarian (Search)Pertemuan 04 Teknik Pencarian (Search)
Pertemuan 04 Teknik Pencarian (Search)Endang Retnoningsih
 

What's hot (20)

Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
Data mining 7   klasifikasi k nearest neighbor and pseudo k nnData mining 7   klasifikasi k nearest neighbor and pseudo k nn
Data mining 7 klasifikasi k nearest neighbor and pseudo k nn
 
Data mining 5 klasifikasi decision tree dan random forest
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forest
 
Perceptron
PerceptronPerceptron
Perceptron
 
Data mining 2 exploratory data analysis
Data mining 2   exploratory data analysisData mining 2   exploratory data analysis
Data mining 2 exploratory data analysis
 
Representasi Pengetahuan
Representasi PengetahuanRepresentasi Pengetahuan
Representasi Pengetahuan
 
Metode pencarian heuristik
Metode pencarian heuristikMetode pencarian heuristik
Metode pencarian heuristik
 
5. Doubly Linked List (Struktur Data)
5. Doubly Linked List (Struktur Data)5. Doubly Linked List (Struktur Data)
5. Doubly Linked List (Struktur Data)
 
Bab 10 pemampatan citra
Bab 10 pemampatan citraBab 10 pemampatan citra
Bab 10 pemampatan citra
 
Dasar pemrograman pascal
Dasar pemrograman pascalDasar pemrograman pascal
Dasar pemrograman pascal
 
Matematika Diskrit - 07 teori bilangan - 02
Matematika Diskrit - 07 teori bilangan - 02Matematika Diskrit - 07 teori bilangan - 02
Matematika Diskrit - 07 teori bilangan - 02
 
Pertemuan 4-5-6 Metode Pelacakan dan Pencarian
Pertemuan 4-5-6 Metode Pelacakan dan PencarianPertemuan 4-5-6 Metode Pelacakan dan Pencarian
Pertemuan 4-5-6 Metode Pelacakan dan Pencarian
 
Forward Backward Chaining
Forward Backward ChainingForward Backward Chaining
Forward Backward Chaining
 
Matematika Diskrit - 05 rekursi dan relasi rekurens - 01
Matematika Diskrit - 05 rekursi dan relasi rekurens - 01Matematika Diskrit - 05 rekursi dan relasi rekurens - 01
Matematika Diskrit - 05 rekursi dan relasi rekurens - 01
 
Bab 7 integrasi numerik
Bab 7 integrasi numerikBab 7 integrasi numerik
Bab 7 integrasi numerik
 
5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar Kriptografi5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar Kriptografi
 
Kisi kisi sbp
Kisi kisi sbpKisi kisi sbp
Kisi kisi sbp
 
Modul 4 representasi pengetahuan
Modul 4   representasi pengetahuanModul 4   representasi pengetahuan
Modul 4 representasi pengetahuan
 
Image processing
Image processingImage processing
Image processing
 
Pertemuan 05 Teknik Pencarian (Search) -lanjutan
Pertemuan 05 Teknik Pencarian (Search) -lanjutanPertemuan 05 Teknik Pencarian (Search) -lanjutan
Pertemuan 05 Teknik Pencarian (Search) -lanjutan
 
Pertemuan 04 Teknik Pencarian (Search)
Pertemuan 04 Teknik Pencarian (Search)Pertemuan 04 Teknik Pencarian (Search)
Pertemuan 04 Teknik Pencarian (Search)
 

Similar to Data mining 3 similarity and disimilarity

Use Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On SocietyUse Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On SocietyJennifer Perry
 
Additional mathematics project 2014
Additional mathematics project 2014Additional mathematics project 2014
Additional mathematics project 2014Nabila Syuhada
 
Tda presentation
Tda presentationTda presentation
Tda presentationHJ van Veen
 
Search problems in Artificial Intelligence
Search problems in Artificial IntelligenceSearch problems in Artificial Intelligence
Search problems in Artificial Intelligenceananth
 
Engineering mathematics presentation
Engineering mathematics presentationEngineering mathematics presentation
Engineering mathematics presentationAfzal Hossen
 
Kinematics-linear-motion.ppt
Kinematics-linear-motion.pptKinematics-linear-motion.ppt
Kinematics-linear-motion.pptJeminaBuagas1
 
1.1 1.4-introduction
1.1 1.4-introduction1.1 1.4-introduction
1.1 1.4-introductionatulg0213
 
Data mining 8 estimasi linear regression
Data mining 8   estimasi linear regressionData mining 8   estimasi linear regression
Data mining 8 estimasi linear regressionIrwansyahSaputra1
 
Practical Digital Image Processing 3
 Practical Digital Image Processing 3 Practical Digital Image Processing 3
Practical Digital Image Processing 3Aly Abdelkareem
 
ODSC India 2018: Topological space creation & Clustering at BigData scale
ODSC India 2018: Topological space creation & Clustering at BigData scaleODSC India 2018: Topological space creation & Clustering at BigData scale
ODSC India 2018: Topological space creation & Clustering at BigData scaleKuldeep Jiwani
 
Introduction to machine learning
Introduction to machine learningIntroduction to machine learning
Introduction to machine learningKnoldus Inc.
 
Application of Trigonometry in Data Science and AI
Application of Trigonometry in Data Science and AIApplication of Trigonometry in Data Science and AI
Application of Trigonometry in Data Science and AIabhishekgup2003
 
Search algorithms master
Search algorithms masterSearch algorithms master
Search algorithms masterHossam Hassan
 

Similar to Data mining 3 similarity and disimilarity (20)

Use Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On SocietyUse Of Bearings And Its Impact On Society
Use Of Bearings And Its Impact On Society
 
Additional mathematics project 2014
Additional mathematics project 2014Additional mathematics project 2014
Additional mathematics project 2014
 
DAA Notes.pdf
DAA Notes.pdfDAA Notes.pdf
DAA Notes.pdf
 
Tda presentation
Tda presentationTda presentation
Tda presentation
 
Search problems in Artificial Intelligence
Search problems in Artificial IntelligenceSearch problems in Artificial Intelligence
Search problems in Artificial Intelligence
 
Dimensions
DimensionsDimensions
Dimensions
 
chapter3part1.ppt
chapter3part1.pptchapter3part1.ppt
chapter3part1.ppt
 
Engineering mathematics presentation
Engineering mathematics presentationEngineering mathematics presentation
Engineering mathematics presentation
 
Kinematics-linear-motion.ppt
Kinematics-linear-motion.pptKinematics-linear-motion.ppt
Kinematics-linear-motion.ppt
 
Kinematics-linear-motion.ppt
Kinematics-linear-motion.pptKinematics-linear-motion.ppt
Kinematics-linear-motion.ppt
 
Kinematics-linear-motion.ppt
Kinematics-linear-motion.pptKinematics-linear-motion.ppt
Kinematics-linear-motion.ppt
 
1.1 1.4-introduction
1.1 1.4-introduction1.1 1.4-introduction
1.1 1.4-introduction
 
Data mining 8 estimasi linear regression
Data mining 8   estimasi linear regressionData mining 8   estimasi linear regression
Data mining 8 estimasi linear regression
 
Practical Digital Image Processing 3
 Practical Digital Image Processing 3 Practical Digital Image Processing 3
Practical Digital Image Processing 3
 
ODSC India 2018: Topological space creation & Clustering at BigData scale
ODSC India 2018: Topological space creation & Clustering at BigData scaleODSC India 2018: Topological space creation & Clustering at BigData scale
ODSC India 2018: Topological space creation & Clustering at BigData scale
 
Introduction to machine learning
Introduction to machine learningIntroduction to machine learning
Introduction to machine learning
 
How people use maths
How people use mathsHow people use maths
How people use maths
 
artifical intelligence final paper
artifical intelligence final paperartifical intelligence final paper
artifical intelligence final paper
 
Application of Trigonometry in Data Science and AI
Application of Trigonometry in Data Science and AIApplication of Trigonometry in Data Science and AI
Application of Trigonometry in Data Science and AI
 
Search algorithms master
Search algorithms masterSearch algorithms master
Search algorithms master
 

Recently uploaded

VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130Suhani Kapoor
 
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAl Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAroojKhan71
 
Unveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data AnalystUnveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data AnalystSamantha Rae Coolbeth
 
BigBuy dropshipping via API with DroFx.pptx
BigBuy dropshipping via API with DroFx.pptxBigBuy dropshipping via API with DroFx.pptx
BigBuy dropshipping via API with DroFx.pptxolyaivanovalion
 
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...Suhani Kapoor
 
Ukraine War presentation: KNOW THE BASICS
Ukraine War presentation: KNOW THE BASICSUkraine War presentation: KNOW THE BASICS
Ukraine War presentation: KNOW THE BASICSAishani27
 
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptxEMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptxthyngster
 
Log Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptxLog Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptxJohnnyPlasten
 
Invezz.com - Grow your wealth with trading signals
Invezz.com - Grow your wealth with trading signalsInvezz.com - Grow your wealth with trading signals
Invezz.com - Grow your wealth with trading signalsInvezz1
 
100-Concepts-of-AI by Anupama Kate .pptx
100-Concepts-of-AI by Anupama Kate .pptx100-Concepts-of-AI by Anupama Kate .pptx
100-Concepts-of-AI by Anupama Kate .pptxAnupama Kate
 
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Serviceranjana rawat
 
Ravak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptxRavak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptxolyaivanovalion
 
꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Call
꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Call꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Call
꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Callshivangimorya083
 
Schema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfSchema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfLars Albertsson
 
Week-01-2.ppt BBB human Computer interaction
Week-01-2.ppt BBB human Computer interactionWeek-01-2.ppt BBB human Computer interaction
Week-01-2.ppt BBB human Computer interactionfulawalesam
 
FESE Capital Markets Fact Sheet 2024 Q1.pdf
FESE Capital Markets Fact Sheet 2024 Q1.pdfFESE Capital Markets Fact Sheet 2024 Q1.pdf
FESE Capital Markets Fact Sheet 2024 Q1.pdfMarinCaroMartnezBerg
 
Mature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxMature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxolyaivanovalion
 
Smarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxSmarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxolyaivanovalion
 
CebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptxCebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptxolyaivanovalion
 

Recently uploaded (20)

VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
 
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al BarshaAl Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
Al Barsha Escorts $#$ O565212860 $#$ Escort Service In Al Barsha
 
Unveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data AnalystUnveiling Insights: The Role of a Data Analyst
Unveiling Insights: The Role of a Data Analyst
 
BigBuy dropshipping via API with DroFx.pptx
BigBuy dropshipping via API with DroFx.pptxBigBuy dropshipping via API with DroFx.pptx
BigBuy dropshipping via API with DroFx.pptx
 
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
 
Ukraine War presentation: KNOW THE BASICS
Ukraine War presentation: KNOW THE BASICSUkraine War presentation: KNOW THE BASICS
Ukraine War presentation: KNOW THE BASICS
 
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptxEMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptx
 
Log Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptxLog Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptx
 
Invezz.com - Grow your wealth with trading signals
Invezz.com - Grow your wealth with trading signalsInvezz.com - Grow your wealth with trading signals
Invezz.com - Grow your wealth with trading signals
 
100-Concepts-of-AI by Anupama Kate .pptx
100-Concepts-of-AI by Anupama Kate .pptx100-Concepts-of-AI by Anupama Kate .pptx
100-Concepts-of-AI by Anupama Kate .pptx
 
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
(PARI) Call Girls Wanowrie ( 7001035870 ) HI-Fi Pune Escorts Service
 
Ravak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptxRavak dropshipping via API with DroFx.pptx
Ravak dropshipping via API with DroFx.pptx
 
꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Call
꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Call꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Call
꧁❤ Greater Noida Call Girls Delhi ❤꧂ 9711199171 ☎️ Hard And Sexy Vip Call
 
Schema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfSchema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdf
 
Week-01-2.ppt BBB human Computer interaction
Week-01-2.ppt BBB human Computer interactionWeek-01-2.ppt BBB human Computer interaction
Week-01-2.ppt BBB human Computer interaction
 
Delhi 99530 vip 56974 Genuine Escort Service Call Girls in Kishangarh
Delhi 99530 vip 56974 Genuine Escort Service Call Girls in  KishangarhDelhi 99530 vip 56974 Genuine Escort Service Call Girls in  Kishangarh
Delhi 99530 vip 56974 Genuine Escort Service Call Girls in Kishangarh
 
FESE Capital Markets Fact Sheet 2024 Q1.pdf
FESE Capital Markets Fact Sheet 2024 Q1.pdfFESE Capital Markets Fact Sheet 2024 Q1.pdf
FESE Capital Markets Fact Sheet 2024 Q1.pdf
 
Mature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptxMature dropshipping via API with DroFx.pptx
Mature dropshipping via API with DroFx.pptx
 
Smarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptxSmarteg dropshipping via API with DroFx.pptx
Smarteg dropshipping via API with DroFx.pptx
 
CebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptxCebaBaby dropshipping via API with DroFX.pptx
CebaBaby dropshipping via API with DroFX.pptx
 

Data mining 3 similarity and disimilarity

  • 1. Similarity and Disimilarity Irwansyah Saputra, S.Kom., M.Kom., MTA Founder of Multinity Indonesia
  • 2. Tentang Saya • Irwansyah Saputra • Dosen Ilmu Komputer • Mahasiswa S3 Ilmu Komputer IPB University • Bidang Kajian: Computational Intelligence & Optimization (Data mining, machine learning, artificial intelligence) Halo semuanya, saya suka belajar tentang segala hal dan suka berbagi pengetahuan. Saya juga sering menjadi pembicara di berbagai seminar. Kontak yang bisa dihubungi: WhatsApp: 0895323302241 Instagram: @irwansight_ Web: https://irw.one
  • 3. Disclaimer Materi ini digunakan sebagai bahan ajar Program Data Mining di Multinity.id Silakan gunakan, mohon untuk tidak mengubah template. Jika Anda memiliki kesulitan dalam memahami materi pada slide ini, silakan belajar di Multinity.id
  • 4. Referensi 1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques Third Edition, Elsevier, 2012 2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine Learning Tools and Techniques 3rd Edition, Elsevier, 2011 3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and Business Analytics Applications, CRC Press Taylor & Francis Group, 2014 4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data Mining, John Wiley & Sons, 2005 5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press, 2014 6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques, Springer, 2011 7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery Handbook Second Edition, Springer, 2010 8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data Mining of Enterprise Data: Algorithms and Applications, World Scientific, 2007 9. Suyanto, DATA MINING: Untuk klasifikasi dan klasterisasi data, Penerbit Informatika, 2017
  • 5. Euclidian Distance • Teknik pengukuran jarak Euclidian Distance merupakan teknik yang sangat populer digunakan untuk atribut dengan tipe data numerik. • Rumus: 𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 = 𝑖=1 𝑛 𝑝𝑖 − 𝑞𝑖 2 = 𝑝1 − 𝑞1 2 + 𝑝2 − 𝑞2 2 + ⋯ + 𝑝𝑛 − 𝑞𝑛 2 Keterangan: P, Q : Tupel dari tiap atribut yang akan dihitung
  • 6. Euclidian Distance • Teknik euclidian distance memiliki cara kerja dengan mencari jarak terpendek antar dua objek tanpa melihat rintangan pada jalur yang dilaluinya. • Euclidian distance tidak dapat memberi informasi jarak terpendek dalam dunia penerbangan karena (dunia penerbangan) mengikuti kelengkungan bumi.
  • 7. Manhattan Distance • Teknik ini sedikit kalah populer dengan euclidian distance, namun penting untuk dibahas karena memiliki pendekatan yang berbeda. • Secara fungsi, manhattan distance juga dapat digunakan untuk tugas klasifikasi, klaster, pengolahan citra dan kasus lainnya. • Cara kerja manhattan berbeda dengan teknik sebelumnya, karena ia berjalan pada grid, tidak menerobos rintangan seperti euclidian. • Rumusnya 𝑑 𝑃, 𝑄 = 𝑃𝑖 − 𝑄𝑖 0 = 𝑝𝑖 − 𝑞𝑖 2 Keterangan: P, Q : Tupel dari tiap atribut yang akan dihitung
  • 8. Manhattan Distance • Manhattan lebih cepat dalam proses komputasi dan dapat digunakan untuk menghitung jarak antar lokasi titik pada peta, karena jalan raya memiliki jalurnya tersendiri dan terdapat penghalang seperti gedung atau objek lain. • Sehingga, sangat tidak mungkin jika perhitungan jarak antar lokasi nyata ini menggunakan euclidian distance.
  • 9. Chebyshev Distance • Berbeda dengan kedua teknik pengukuran jarak sebelumnya, Chebyshev distance didefinisikan sebagai perbedaan terbesar antara dua vektor di sepanjang dimensi koordinat apa pun. • Maksudnya, teknik ini hanyalah jarak maksimum dari suatu sumbu. 𝑑 𝑃, 𝑄 = max 𝑃 − 𝑄 = 𝑚𝑎𝑥 𝑝𝑖 − 𝑞𝑖 • Pada rumus tersebut kita bisa melihat bahwa cara kerja Chebyshev distance adalah mencari selisih maksimum di antara kedua vektor. • Selisih tersebut kemudian diabsolutkan untuk mencegah terjadinya minus. Karena tidak mungkin ada jarak yang minus dalam kehidupan nyata.
  • 10. Chebyshev Distance • Agar lebih memahami tentang ini, kita bisa gunakan gerakan raja pada permainan catur. • Misalnya raja ingin berjalan mencapai titik lingkaran. • Ada berbagai kemungkinan cara melangkahnya, namun di sini kita gunakan dua pilihan saja agar lebih mudah dipahami, yaitu jalur kanan dan jalur kiri. • Jika kita melihat dengan baik, jalur kanan memiliki langkah lebih cepat dari yang kiri karena hanya 4 langkah saja, raja sudah sampai tujuan. • Berbeda dengan yang kiri, raja membutuhkan 6 langkah untuk menuju ke tujuan. 4 2
  • 11. Cosine Similarity • Teknik cosine similarity biasanya digunakan untuk mengatasi data yang berdimensi tinggi seperti data teks. • cosine similarity mengabaikan nilai dari suatu vektor, yang akan dihitung adalah arahnya saja. • Misalnya pada kata “baik” dan “jahat”. Kedua kata tersebut akan dinilai 1 oleh cosine similarity. • Rumus: 𝐷 𝑥, 𝑦 = cos 𝜃 = 𝑥. 𝑦 𝑥 𝑦
  • 12. Cosine Similarity • Untuk memahami lebih dalam terkait teknik cosine similarity, kita akan menggunakan contoh dua dokumen sebagai berikut: • D1 : “Kerja Kerja Kerja Typus” • D2 : “Typus Typus Kerja Kerja” • Kita anggap “Kerja” menjadi sumbu x, sedangkan “Typus” menjadi sumbu y. Maka kita akan mendapatkan vektor A (3,1), vektor B (2,2). Langkah perhitungannya menjadi: cos 𝜃 = 𝑥. 𝑦 𝑥 𝑦 = 𝑥1𝑦1 + 𝑥2𝑦2 𝑥1 2 + 𝑥2 2 . 𝑦1 2 + 𝑦2 2 = 3.2 + 1.2 32 + 12 . 22 + 22 = 8 10 . 8 = 0.894
  • 13. Cosine Similarity • Berdasarkan hasil tersebut berarti dokumen A dan dokumen B memiliki kemiripan yang dekat. • Namun nilai tersebut tidak bisa kita ubah ke dalam persen, misalnya menjadi 89,4% dan mengatakan bahwa kemiripan dua dokumen tersebut adalah sebesar 89,4%. • Jika kita ingin melihat seberapa dekat kedua dokumen tersebut dalam bentuk visual, maka ubah saja hasil 0,894 ke bentuk sudut cosinus, maka akan didapatkan sudut sebesar 26.619729544329°. Hasilnya: A B 26°