1. SVM adalah algoritme pembelajaran terbimbing yang bertujuan memprediksi hiperlapan pemisah optimal dengan margin maksimum antara dua kelas data.
2. Proses pembelajaran SVM meminimalkan kompleksitas model dengan memetakan data ke ruang dimensi tinggi guna mendapatkan hiperlapan pemisah linear.
3. Support vector merupakan data yang terletak pada garis margin hiperlapan pemisah optimal dan sangat penting karena berpengaruh terhadap posisi hiper
1. Studi ini membandingkan akurasi hasil pengelompokan antara metode Fuzzy C-Means Clustering (FCM) dan Latent Class Clustering Analysis (LCCA) terhadap data simulasi dan riil kabupaten/kota di Jawa-Bali berdasarkan 13 indikator pembangunan.
2. Hasilnya menunjukkan LCCA mampu mencapai akurasi 89%-99% sedangkan FCM hanya 50%, menandakan kinerja LCCA lebih baik. Korelasi antar variabel juga tid
02. PPT MTK (Wajib) XII - www.ilmuguru.org.pptxAyuDinaAdniaty
Bab ini membahas tentang ukuran pemusatan dan penyebaran data berkelompok, meliputi pengertian rata-rata, modus, statistik lima serangkai, dan ukuran letak data seperti jangkauan dan jangkauan antarkuartil. Metode penentuan nilai-nilai tersebut dijelaskan beserta contoh soal latihannya.
Makalah membahas tentang Kohohenen pada DAta mining
Clustering merupakan suatu proses untuk mengelompokkan kumpulan objek-objek fisik atau objek-objek abstrak ke dalam kelas-kelas objek yang similar (mirip). Cluster adalah kumpulan dari objek atau data yang mempunyai kemiripan satu dengan yang lain dalam cluster yang sama dan tidak mirip dengan objek dalam cluster yang berbeda. Secara prinsip cluster merupakan kumpulan dari objek data yang mempunyai kemiripan berdasarkan karakteristik tertentu (karakteristik disini bisa kombinasi dari atribut tertentu tergantung user) kemudian melakukan pengelompokan jika dianggap mirip. Suatu cluster dari objek data dapat diperlakukan secara kolektif sebagai satu group dalam berbagai aplikasi.
Terdapat beberapa algoritma yang digunakan didalam mengumpulkan atau mengelompokan suatu data sehingga didalam setiap object dalam satu kelompok data mirip akan tetapi tidak mirip dengan kelompok yang lainnya. Algoritma clustering yang meliputi K-Means, K-Medoids, DBSCAN dan lainnya yang digunakan didalam menyelesaikan permaslahan pengelompokan data
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif
SVMlight adalah program klasifikasi teks berbasis mesin vektor dukungan. Terdiri dari dua program yaitu SVM-learn untuk melatih model dan SVM_classify untuk klasifikasi teks. Menggunakan tiga komponen yaitu label, fitur, dan nilai fitur untuk melatih dan memprediksi kelas teks.
Ringkasan dokumen tersebut adalah:
Matlab digunakan untuk komputasi numerik dan visualisasi data, serta analisis dan desain kontrol. Tutorial ini menjelaskan konsep-konsep dasar Matlab seperti vektor, fungsi, plot, matriks, dan integral-diferensial. Pengguna dapat mempelajari cara menggunakan perintah-perintah dasar Matlab.
Ringkasan dokumen tersebut adalah:
Matlab digunakan untuk komputasi numerik dan visualisasi data, serta analisis dan desain kontrol. Tutorial ini menjelaskan konsep-konsep dasar Matlab seperti vektor, fungsi, plot, matriks, dan integral-diferensial. Pengguna dapat mempelajari cara menggunakan perintah-perintah dasar Matlab untuk manipulasi data dan visualisasi.
1. Studi ini membandingkan akurasi hasil pengelompokan antara metode Fuzzy C-Means Clustering (FCM) dan Latent Class Clustering Analysis (LCCA) terhadap data simulasi dan riil kabupaten/kota di Jawa-Bali berdasarkan 13 indikator pembangunan.
2. Hasilnya menunjukkan LCCA mampu mencapai akurasi 89%-99% sedangkan FCM hanya 50%, menandakan kinerja LCCA lebih baik. Korelasi antar variabel juga tid
02. PPT MTK (Wajib) XII - www.ilmuguru.org.pptxAyuDinaAdniaty
Bab ini membahas tentang ukuran pemusatan dan penyebaran data berkelompok, meliputi pengertian rata-rata, modus, statistik lima serangkai, dan ukuran letak data seperti jangkauan dan jangkauan antarkuartil. Metode penentuan nilai-nilai tersebut dijelaskan beserta contoh soal latihannya.
Makalah membahas tentang Kohohenen pada DAta mining
Clustering merupakan suatu proses untuk mengelompokkan kumpulan objek-objek fisik atau objek-objek abstrak ke dalam kelas-kelas objek yang similar (mirip). Cluster adalah kumpulan dari objek atau data yang mempunyai kemiripan satu dengan yang lain dalam cluster yang sama dan tidak mirip dengan objek dalam cluster yang berbeda. Secara prinsip cluster merupakan kumpulan dari objek data yang mempunyai kemiripan berdasarkan karakteristik tertentu (karakteristik disini bisa kombinasi dari atribut tertentu tergantung user) kemudian melakukan pengelompokan jika dianggap mirip. Suatu cluster dari objek data dapat diperlakukan secara kolektif sebagai satu group dalam berbagai aplikasi.
Terdapat beberapa algoritma yang digunakan didalam mengumpulkan atau mengelompokan suatu data sehingga didalam setiap object dalam satu kelompok data mirip akan tetapi tidak mirip dengan kelompok yang lainnya. Algoritma clustering yang meliputi K-Means, K-Medoids, DBSCAN dan lainnya yang digunakan didalam menyelesaikan permaslahan pengelompokan data
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif dan bersifat unsupervised. Sistem secara otomatis dapatmelakukan pengelompokan atau klasifikasi tanpamenggunakan pembelajaran dengan pasangan dataterlebih dahulu.Secara umum, pembaruan nilai bobot adalahberdasar nilai jarak terkecil dari bobot terhadap nilai datamasukan. Pembaruan dilakukan hanya pada bobot yang berhubungan dengan node yang terdekat
Kohonen adalah merupakan algoritma jaringan pcerdas dengan kategori pembelajaran secara kompetitif
SVMlight adalah program klasifikasi teks berbasis mesin vektor dukungan. Terdiri dari dua program yaitu SVM-learn untuk melatih model dan SVM_classify untuk klasifikasi teks. Menggunakan tiga komponen yaitu label, fitur, dan nilai fitur untuk melatih dan memprediksi kelas teks.
Ringkasan dokumen tersebut adalah:
Matlab digunakan untuk komputasi numerik dan visualisasi data, serta analisis dan desain kontrol. Tutorial ini menjelaskan konsep-konsep dasar Matlab seperti vektor, fungsi, plot, matriks, dan integral-diferensial. Pengguna dapat mempelajari cara menggunakan perintah-perintah dasar Matlab.
Ringkasan dokumen tersebut adalah:
Matlab digunakan untuk komputasi numerik dan visualisasi data, serta analisis dan desain kontrol. Tutorial ini menjelaskan konsep-konsep dasar Matlab seperti vektor, fungsi, plot, matriks, dan integral-diferensial. Pengguna dapat mempelajari cara menggunakan perintah-perintah dasar Matlab untuk manipulasi data dan visualisasi.
Sistem pertidaksamaanlinear dan model matematikaWina Ariyani
Dokumen tersebut membahas tentang model matematika program linear. Diberikan penjelasan tentang langkah-langkah membuat model matematika yaitu membuat pemisalan, tabel, fungsi kendala, dan fungsi objektif. Kemudian diberikan contoh soal dan penyelesaiannya untuk membuat model matematika dari masalah program linear tentang penumpang pesawat dengan berbagai keterbatasan.
Modul ini membahas tentang Sistem Persamaan Linear Dua Variabel (SPLDV) yang mencakup definisi, metode penyelesaian, dan contoh soal. Pembahasan dimulai dari pengertian PLSV, PLDV, dan SPLDV beserta contohnya, kemudian metode penyelesaian SPLDV menggunakan subtitusi beserta langkah-langkahnya, dan diakhiri dengan beberapa contoh soal beserta pembahasannya."
Dokumen tersebut membahas tentang statistika dan penyajian data, termasuk definisi statistika, jenis-jenis statistika, data dan datum, sampel dan populasi, serta berbagai diagram dan pola penyajian data seperti diagram batang, diagram garis, diagram lingkaran, histogram, dan poligon frekuensi.
Bab 1 membahas metode numerik secara umum dan perbandingannya dengan metode analitik. Metode analitik hanya dapat menyelesaikan persoalan matematika tertentu secara tepat, sedangkan metode numerik dapat menyelesaikan berbagai persoalan dengan menghasilkan solusi hampiran. Metode numerik digunakan bila persoalan tidak dapat diselesaikan secara analitik.
Chapter 3 maximum likelihood and bayesian estimation-fixjelli123
Dokumen tersebut membahas dua metode estimasi parameter yaitu Maximum Likelihood Estimation dan Bayesian Estimation untuk masalah klasifikasi pola. Metode Maximum Likelihood berusaha memaksimalkan peluang mendapatkan sampel yang diamati, sedangkan Bayesian mempertimbangkan parameter menjadi variabel acak dan memperbarui distribusi posterior berdasarkan data."
1. Penelitian ini membandingkan metode Learning Vector Quantization (LVQ) dan Fuzzy C-Means (FCM) dalam sistem analisis butir soal.
2. Hasil pengujian menunjukkan sistem FCM memiliki tingkat akurasi 70% sedangkan sistem LVQ hanya 66%, sehingga metode FCM lebih baik untuk analisis butir soal.
3. Kedua metode tersebut merupakan pendekatan dalam data mining yang masing-masing memiliki kelebihan dan kekurangan tertentu
Secara umum logika fuzzy sugeno adalah suatu logika yang digunakan untuk menghasilkan keputusan tunggal/crisp saat defuzzyfikasi, penggunaannya tergantung dari domain masalah yang terjadi
Sistem pertidaksamaanlinear dan model matematikaWina Ariyani
Dokumen tersebut membahas tentang model matematika program linear. Diberikan penjelasan tentang langkah-langkah membuat model matematika yaitu membuat pemisalan, tabel, fungsi kendala, dan fungsi objektif. Kemudian diberikan contoh soal dan penyelesaiannya untuk membuat model matematika dari masalah program linear tentang penumpang pesawat dengan berbagai keterbatasan.
Modul ini membahas tentang Sistem Persamaan Linear Dua Variabel (SPLDV) yang mencakup definisi, metode penyelesaian, dan contoh soal. Pembahasan dimulai dari pengertian PLSV, PLDV, dan SPLDV beserta contohnya, kemudian metode penyelesaian SPLDV menggunakan subtitusi beserta langkah-langkahnya, dan diakhiri dengan beberapa contoh soal beserta pembahasannya."
Dokumen tersebut membahas tentang statistika dan penyajian data, termasuk definisi statistika, jenis-jenis statistika, data dan datum, sampel dan populasi, serta berbagai diagram dan pola penyajian data seperti diagram batang, diagram garis, diagram lingkaran, histogram, dan poligon frekuensi.
Bab 1 membahas metode numerik secara umum dan perbandingannya dengan metode analitik. Metode analitik hanya dapat menyelesaikan persoalan matematika tertentu secara tepat, sedangkan metode numerik dapat menyelesaikan berbagai persoalan dengan menghasilkan solusi hampiran. Metode numerik digunakan bila persoalan tidak dapat diselesaikan secara analitik.
Chapter 3 maximum likelihood and bayesian estimation-fixjelli123
Dokumen tersebut membahas dua metode estimasi parameter yaitu Maximum Likelihood Estimation dan Bayesian Estimation untuk masalah klasifikasi pola. Metode Maximum Likelihood berusaha memaksimalkan peluang mendapatkan sampel yang diamati, sedangkan Bayesian mempertimbangkan parameter menjadi variabel acak dan memperbarui distribusi posterior berdasarkan data."
1. Penelitian ini membandingkan metode Learning Vector Quantization (LVQ) dan Fuzzy C-Means (FCM) dalam sistem analisis butir soal.
2. Hasil pengujian menunjukkan sistem FCM memiliki tingkat akurasi 70% sedangkan sistem LVQ hanya 66%, sehingga metode FCM lebih baik untuk analisis butir soal.
3. Kedua metode tersebut merupakan pendekatan dalam data mining yang masing-masing memiliki kelebihan dan kekurangan tertentu
Secara umum logika fuzzy sugeno adalah suatu logika yang digunakan untuk menghasilkan keputusan tunggal/crisp saat defuzzyfikasi, penggunaannya tergantung dari domain masalah yang terjadi
Estetika Humanisme Diskusi Modul Part Ke-7.pdfHendroGunawan8
Anger management adalah belajar mengenali tanda-tanda pada diri saat marah dan mengambil tindakan yang “sehat” dalam meluapkan kemarahan.
Secara sederhana, dapat diartikan bahwa anger management adalah mengendalikan rasa marah, bukan mencegah atau menahan rasa marah.
Estetika Humanisme Diskusi Video Sesi Ke-7.pdfHendroGunawan8
Anger Management adalah suatu kemampuan atau teknik untuk melakukan tindakan mengatur pikiran, perasaan, nafsu amarah dengan cara yang tepat dan posistif serta dapat diterima di lingkungan, sehingga dapat mencegah sesuatu yang buruk atau merugikan diri sendiri dan orang lain.
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdfHendroGunawan8
Cisco Unified Communications (UC) adalah sistem komunikasi berbasis IP yang mengintegrasikan produk dan aplikasi suara, video, data, dan mobilitas. Ini memungkinkan komunikasi yang lebih efektif dan aman dan dapat mengubah cara kita berkomunikasi
Di dalam pengolahan citra, sebuah citra sering dilakukan proses penapisan (image filtering) untuk memperoleh citra sesuai dengan tujuan yang diinginkan.
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdfHendroGunawan8
Metode Fuzzy Mamdani merupakan salah satu bagian dari Fuzzy Inference System yang berguna untuk penarikan kesimpulan atau suatu keputusan terbaik dalam permasalahan yang tidak pasti
Mindfulness adalah sikap berkesadaran penuh akan peristiwa yang sedang dijalani saat ini, dengan penuh perhatian, memiliki tujuan yang jelas, dan tanpa menghakimi.
Logika Fuzzy pertama kali dikembangkan oleh Lotfi A. Zadeh pada tahun 1965. Teori ini banyak diterapkan di berbagai bidang, antara lain representasi pikiran manusia ke dalam suatu sistem. Banyak alasan mengapa penggunaan logika Fuzzy ini sering dipergunakan antara lain, konsep logika Fuzzy yang mirip dengan konsep berpikir manusia. Sistem Fuzzy dapat merepresentasikan pengetahuan manusia ke dalam bentuk matematis dengan lebih menyerupai cara berpikir manusia ke dalam bentuk matematis. Selain itu, informasi berupa pengetahuan dan pengalaman mempunyai peranan penting dalam mengenali perilaku sistem di dunia nyata.
Kecerdasan emosional (Emotional Intelligence ) merupakan konsep baru yang dikembangkan oleh Daniel Goleman dalam karyanya pada tahun 1995 berjudul “Emotional Intelligence”.
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdfHendroGunawan8
Simple Naïve Bayesian Classifier merupakan salah satu metode pengklasifikasi berpeluang sederhana yang berdasarkan pada penerapan Teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen).
Modul Ajar Bahasa Indonesia Kelas 7 Fase D Kurikulum Merdeka - [abdiera.com]Fathan Emran
Modul Ajar Bahasa Indonesia Kelas 7 SMP/MTs Fase D Kurikulum Merdeka - abdiera.com. Modul Ajar Bahasa Indonesia Kelas 7 SMP/MTs Fase D Kurikulum Merdeka. Modul Ajar Bahasa Indonesia Kelas 7 SMP/MTs Fase D Kurikulum Merdeka. Modul Ajar Bahasa Indonesia Kelas 7 SMP/MTs Fase D Kurikulum Merdeka. Modul Ajar Bahasa Indonesia Kelas 7 SMP/MTs Fase D Kurikulum Merdeka. Modul Ajar Bahasa Indonesia Kelas 7 SMP/MTs Fase D Kurikulum Merdeka.
Universitas Negeri Jakarta banyak melahirkan tokoh pendidikan yang memiliki pengaruh didunia pendidikan. Beberapa diantaranya ada didalam file presentasi
Teori Fungsionalisme Kulturalisasi Talcott Parsons (Dosen Pengampu : Khoirin ...nasrudienaulia
Dalam teori fungsionalisme kulturalisasi Talcott Parsons, konsep struktur sosial sangat erat hubungannya dengan kulturalisasi. Struktur sosial merujuk pada pola-pola hubungan sosial yang terorganisir dalam masyarakat, termasuk hierarki, peran, dan institusi yang mengatur interaksi antara individu. Hubungan antara konsep struktur sosial dan kulturalisasi dapat dijelaskan sebagai berikut:
1. Pola Interaksi Sosial: Struktur sosial menentukan pola interaksi sosial antara individu dalam masyarakat. Pola-pola ini dipengaruhi oleh norma-norma budaya yang diinternalisasi oleh anggota masyarakat melalui proses sosialisasi. Dengan demikian, struktur sosial dan kulturalisasi saling memengaruhi dalam membentuk cara individu berinteraksi dan berperilaku.
2. Distribusi Kekuasaan dan Otoritas: Struktur sosial menentukan distribusi kekuasaan dan otoritas dalam masyarakat. Nilai-nilai budaya yang dianut oleh masyarakat juga memengaruhi bagaimana kekuasaan dan otoritas didistribusikan dalam struktur sosial. Kulturalisasi memainkan peran dalam melegitimasi sistem kekuasaan yang ada melalui nilai-nilai yang dianut oleh masyarakat.
3. Fungsi Sosial: Struktur sosial dan kulturalisasi saling terkait dalam menjalankan fungsi-fungsi sosial dalam masyarakat. Nilai-nilai budaya dan norma-norma yang terinternalisasi membentuk dasar bagi pelaksanaan fungsi-fungsi sosial yang diperlukan untuk menjaga keseimbangan dan stabilitas dalam masyarakat.
Dengan demikian, konsep struktur sosial dalam teori fungsionalisme kulturalisasi Parsons tidak dapat dipisahkan dari kulturalisasi karena keduanya saling berinteraksi dan saling memengaruhi dalam membentuk pola-pola hubungan sosial, distribusi kekuasaan, dan pelaksanaan fungsi-fungsi sosial dalam masyarakat.
Modul Ajar Bahasa Inggris Kelas 10 Fase E Kurikulum MerdekaFathan Emran
Modul Ajar Bahasa Inggris Kelas 10 SMA/MA Fase E Kurikulum Merdeka - abdiera.com. Modul Ajar Bahasa Inggris Kelas 10 SMA/MA Fase E Kurikulum Merdeka. Modul Ajar Bahasa Inggris Kelas 10 SMA/MA Fase E Kurikulum Merdeka.
Paper ini bertujuan untuk menganalisis pencemaran udara akibat pabrik aspal. Analisis ini akan fokus pada emisi udara yang dihasilkan oleh pabrik aspal, dampak kesehatan dan lingkungan dari emisi tersebut, dan upaya yang dapat dilakukan untuk mengurangi pencemaran udara
1. 1
Machine Learning
Pertemuan 7
Supervised Learning: SVM (Support Vector
Machine)
Gambar 1. Algoritma Support Vector machine
Sejarah
Dalam pembelajaran mesin, Support Vector Machine (SVM) juga mendukung jaringan vektor
adalah model pembelajaran yang diawasi dengan algoritma pembelajarann terkait yang
menganalisis data untuk klasifikasi dan analisis regresi. Dikembangkan di AT & T Bell
Laboratories oleh Vladimir Vapnik dengan rekan (Boser et al. , 1993, Cortes dan Vapnik, 1995,
Vapnik at al., 1997. SVM adalah salah satu metode prediksi yang paling kuat, yang didasarkan
pada kerangka kerja pembelajaran statistik atau teori VC diusulkan oleh Vapnik (1982, 1995)
dan Shervonenkis (1974). Mengingat satu set contoh penelitian, masing-masing ditandai
sebagai milik salah satu dari dua kategori, algoritma pelatihan SVM membangun model yang
memberikan contoh baru ke satu kategori atau yang lain, menjadikannya pengklasifikasi linear
biner non-probalistik (meskipun metode seperti penskalaan Platt ada untuk mengunakan SVM
dalam lpengaturan klasifikasi probabilistik). SVM memetakkan contoh pelatihan ke titik-titik
dalam ruang angkasa untuk memaksimalkan lebar kesenjangan antara dua kategori. Contoh-
contoh baru kemudian dipetakkan ke dalam ruang yang sama dan diprediksi termasuk dalam
kategori berdasarkan sisi celah mana mereka jatuh.
Selain melakukan klasifikasi linear, SVM dapat secara evisien melakukan klasifikasi non-linear
menggunakan apa yang disebut trik kernel, secara implisit memetakkan input mereka ke dalam
ruang fitur dimensi tinggi.
Algoritma pengelompokan vektor dukungan, yang dibuat oleh Hava Siegelmann dan Vladimir
Vapnik, menerapkan statistik vektor dukungan, yang dikembangkan dalam algoritma mesin
vektor dukungan, untuk mengkategorikan data yang tidak berlabel. Kumpulan data ini
memerlukan pendekatan pembelajaran tanpa pengawasan, yang mencoba menemukan
pengelompokan alami data ke kelompok dan kemudian untuk memetakkan data baru sesuai
dengan kelompok ini.
• SVM adalah algoritme supervised learning yang dikembangkan oleh Vladimir Vapnik dan
diperkenalkan pertama kali pada tahun 1992 oleh Vapnik, Boser dan Guyon pada
Computational Learning Theory (COLT) 1992.
(dikatakan Vladimir Vapnik telah mengemukakan idenya pada tahun 1979 di salah satu
papernya, tetapi mulai berkembang pada tahun 90-an)
2. 2
Pengertian
Permasalahan klasifikasi dengan SVM dapat dirumuskan sebagai berikut. Jika diberikan satu
himpunan data S = {(𝑥𝑖, 𝑡𝑖)} dimana setiap sampel (𝑥𝑖,𝑡𝑖) terdiri dari variabel data 𝑥𝑖 yang
dipresentasikan dengan m buah fitur (𝑥1𝑖, 𝑥2𝑖,… ,𝑥𝑚𝑖,), dan variabel target 𝑥𝑡𝑖, merupakan data
kategorikal. Untuk menyederhanakan, ruang lingkup penjelasan di dalam sub-bab ini dibatasi
kepada: (i) klasifikasi bersifat biner yaitu data terbagi ke dalam dua kategori dengan nilai
variabel target 𝑡𝑖, ∈ {-1, 1}, dan (ii) data bersifat linearly separable sehingga bisa dibuat sebuah
hyperplane untuk memisahkan kedua kategori data tersebut.
Model linear SVM adalah model klasifikasi yang dapat direpresentasikan dengan persamaan:
y(𝒙𝒊 ) = 𝒘𝒕
+ 𝒘𝟎
dimana y(𝑥𝑖 ) berfungsi sebagai prediksi dari 𝒕𝒊, w adalah vektor weight (parameter model),
𝒙𝒊 adalah variabel data, dan 𝒘𝟎 adalah bias.
Gambar 2. Geometri dari Hyperplane di dalam Ruang Dua Dimensi
Berdasarkan geometri vektor (lihat gambar 2), model SVM di atas merupakan sebuah
hyperplane dimana:
1) w = (
𝑤1
.
.
.
𝑤𝑚
) =
(
𝜕𝑦(𝑥𝑖)
𝑥1𝑖,
.
.
.
𝜕𝑦(𝑥𝑖)
𝑥𝑚𝑖, )
merupakan normal atau vektor yang bersifat ortogonal (tegak lurus)
terhadap hyperplane y(𝒙𝒊 ),
2)
𝒘𝟎
||𝒘||
adalah jarak tegak lurus hyperplane terhadap titik awal.
Nilai y(x) untuk setiap data x adalah sebagai berikut:
1) y(x) = 0, jika data x terletak pada hyperplane,
2) y(x) ≥ 1, jika data x memiliki variabel target 𝒕𝒊 = 1,
𝑥1
𝑥2
𝑅1
𝑅1
y > 0
y = 0
y < 0
w
x1
𝑦(𝑥)
||𝑤||
−𝑤0
||𝑤||
x
(1)
3. 3
3) y(x) ≤ 1, jika data x memiliki variabel target 𝒕𝒊 = -1
Dengan demikian untuk setiap data x berlaku:
(𝒕𝒊 y(x)) – 1 ≥ 0
Model SVM bertujuan untuk memprediksi sebuah hyperplane di dalam ruang dimensi m untuk
mengklasifikasikan data di dalam ruang di mana data berada. Secara umum, sebuah hyperplane
adalah sub-ruang berdimensi m – 1 dari ruang berdimensi m. Sebagai contoh, di dalam sebuah
bidang dua dimensi: sebuah hyperplane merupakan sebuah garis. Demikian pula, di dalam
sebuah ruang tiga dimensi: sebuah hyperplane merupakan sebuah bidang. Alasan digunakan
margin maksimum adalah agar generalization error model SVM lebih kecil dibandingkan
generalization error model SVM yang menggunakan margin yang lebih kecil (Raschka, 2015).
Model SVM untuk klasifikasi biner dapat dijelaskan secara sederhana menggunakan data di
dalam ruang dua dimensi. Sebagai contoh data yang akan diklasifikasikan berupa sebuah
himpunan terdiri dari 12 data. Setiap data x direpresentasikan sebagai vektor dari dua variabel
atau x = (𝑥1,𝑥2) dan setiap data diberi label 𝑡𝑖: 1 atau -1. Dari gambar 3. (a), terlihat sejumlah
alternatif hyperplane yang dapat dibuat sebagai pemisah kedua kategori data tersebut. Setiap
hyperplane dapat dinyatakan dengan persamaan:
y(x) = 𝒘𝟏𝒙𝟏 + 𝒘𝟐𝒙𝟐 + 𝒘𝟎
Dengan notasi vektor, persamaan di atas dapat dinyatakan sebagai:
y(x) = (𝒘𝟏𝒘𝟐) (𝒙𝟏
𝒙𝟐
) + 𝒘𝟎
atau:
y(x) = 𝒘𝑻
x + 𝒘𝟎
Selanjutnya akan diuraikan bagaimana proses pembelajaran model SVM untuk memilih sebuah
hyperplane dengan margin maksimum sebagai pemisah kedua kategori data. Di dalam gambar
3(b), data yang terletak pada garis margin dari optimal hyperplane disebut sebagai support
vector. Support vector sangat penting karena apabila data ini berubah atau dihilangkan maka
garis margin model SVM dapat berubah.
Garis margin yang berada disebelah kanan hyperplane (hyperplane positif) sebagai pembatas
data 𝑥𝑝𝑜𝑠 yaitu data dengan label 1 dapat dinyatakan dengan persamaan:
𝒘𝟎 + 𝒘𝑻
𝒙𝒑𝒐𝒔 = 1
Gambar 3.
+
+
+
+
+
+
o
o
o
o
o
o 𝑥1
𝑥2
+
𝑥1
𝑥2
+
+
+
+
+
o
o
o
o
o o
Margin
w
Support vectors
“positive
hyperplane”
𝒘𝑻
x = 1
“positive
hyperplane”
𝒘𝑻
x = -1
Decision boundary
𝒘𝑻
x = 0
Which hyperplane? SVM: Maximize the margin
(a) (b)
(2)
(3)
(4)
(5)
(6)
4. 4
Garis margin di sebelah kiri hyperplane (hyperplane negatif) sebagai pembatas data 𝒙𝒏𝒆𝒈 yaitu
data dengan label -1 dapat dinyatakan dengan persamaan:
𝒘𝟎 + 𝒘𝑻
𝒙𝒏𝒆𝒈 = -1
Pengurangan persamaan (6) dan persamaan (7) menjadi:
𝒘𝑻
(𝒙𝒑𝒐𝒔−𝒙𝒏𝒆𝒈) = 2
Hasil bagi dengan ||w|| diperoleh hasil:
𝒘𝑻 (𝒙𝒑𝒐𝒔−𝒙𝒏𝒆𝒈)
||𝒘||
=
𝟐
||𝒘||
Suku
𝒘𝑻 (𝒙𝒑𝒐𝒔−𝒙𝒏𝒆𝒈)
||𝒘||
di sebelah kiri persamaan () adalah margin atau jarak dari hyperplane
negatif yang akan dimaksimumkan. Dengan demikian, tujuan optimasi dari SVM adalah
memaksimumkan margin
𝟐
||𝒘||
atau meminimumkan:
1
2
||𝑤||2
dengan kendala: (𝑡𝑖 y(x)) – 1 ≥
0. Sehingga masalah optimisasi margin yang maksimum dari sebuah hyperplane dapat
direpresentasikan sebagai optimisasi:
Meminimumkan:
1
2
||𝑤||2
Kendala: 𝑡𝑖(𝒘𝑻
x + 𝒘𝟎) – 1 ≥ 0 untuk seluruh i.
Salah satu solusi dari masalah optimisasi di atas dapat diperoleh menggunakan teknik Lagrange
Multiplier untuk meminimisasi Primal Form dari problem optimisasi sebagai berikut:
𝑳𝒑 =
𝟏
𝟐
||𝒘||𝟐
- ∑ 𝒂𝒊
𝒏
𝒊=𝟏 [𝒕𝒊(𝒘𝑻
x + 𝒘𝟎) -1]
=
𝟏
𝟐
||𝒘||𝟐
- ∑ 𝒂𝒊
𝒏
𝒊=𝟏 [𝒕𝒊(𝒘𝑻
x + 𝒘𝟎) ] - ∑ 𝑵𝒂𝒊
𝒏
𝒊=𝟏
𝝏𝑳𝒑
𝝏𝒘
= w - ∑ 𝒂𝒊
𝒏
𝒊=𝟏 𝒕𝒊𝒙𝒊 = 0
𝝏𝑳𝒑
𝝏𝒘
= ∑ 𝒂𝒊
𝒏
𝒊=𝟏 𝒕𝒊𝒙𝒊 = 0
Mensubtitusi persamaan (14) dan (15) ke dalam persamaan (13) menghasilkan persamaan Dual
Form sebagai target maksimisasi sebagai berikut:
𝐿𝐷 = ∑ 𝑎𝑖
𝑛
𝑖=1 -
1
2
∑ 𝑎𝑖𝑎𝑗𝑡𝑖𝑡𝑗
𝑛
𝑖,𝑗 (𝑥𝑖. 𝑥𝑗)
Dengan konstrain:
𝑎𝑖 ≥ 0 untuk seluruh I dan ∑ 𝑎𝑖𝑡𝑖
𝑛
𝑖=1 = 0.
Menggunakan teknik quadratic optimization diperoleh solusi sebagai berikut:
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
(18)
5. 5
Y(X) = sign (∑ 𝑎𝑖𝑡𝑖
𝑛
𝑖=1 (𝑥𝑖. 𝑥𝑖)
Penjelasan mengenai proses optimisasi di atas diuraikan secara detail di dalam (Buges, 1998)
dan (Bishop, 2006).
Motivasi
• Bertahun-tahun metode Neural Network (NN) menjadi ultimate champion untuk
memecahkan permasalahan klasifikasi. NN adalah algoritme learning yang paling efektif ->
sampai kemudian hadir SVM!
• SVM jauh lebih evektif dari NN. SVM mampu melakukan generalisasi dengan baik dan
mudah dalam pelatihannya (training)’
• SVM juga tidak pernah menghasilkan local optima, salah satu permasalahan yang dimiliki
oleh NN yaitu memungkinkan memiliki banyak local optima dan memerlukan waktu yang
lama untuk terjadinya konvergensi.
Pendekatan dengan Machine Learning: Terminologi Dasar
• Training set: N data { 𝑥1, …. , 𝑥𝑛}
- Digunakan untuk tuning parameter dari model
- Kategori dari data training set telah diketahui sebelumnya
• Target vector: vektor unik t untuk tiap target
- Merepresentasikan identitas dari data yang bersesuaian
• Learned function: y(x)
- Training phase (learning phase) -> proses untuk menentukan y(X) berdasarkan training
data.
• Test set: data yang tidak terdapat pada training set
- Setelah model selesai dilatih, model dapat menentukan kategori dari data baru
- Kemampuan untuk mengkategorikan dengan benar data baru yang berbeda dengan data
yang digunakan pada training set -> GENERALISASI
Implementasi SVM pada Dunia Nyata
• SVM telah berhasil diterapkan di berbagai aplikasi pada masalah-masalah yang kompleks di
dunia nyata, seperti klasifikasi teks dan citra, pengenalan tulisan tangan, data mining,
bioinformatika, analisis farmakologi dan biosequence, dan lain-lain.
• Pada banyak aplikasi SVM menjadi pilihan terbaik.
Definisi Masalah
- Diberikan sekumpulan n titik (vektor):
𝑥1, 𝑥2,……….𝑥𝑛 di mana 𝑥𝑖 adalah vektor dengan panjang m dan masing-masing adalah
anggota salah satu dari dua kelas yang memiliki label +1 dan -1.
- Maka training set nya adalah:
(𝒙𝟏, 𝒚𝟏), (𝒙𝟐, 𝒚𝟐),….(𝒙𝒏, 𝒚𝒏)
∀𝒊 𝒙𝒊 ∈ 𝑹𝒎
, 𝒚𝒊 ∈ {+1, -1}
- Diinginkan untuk menemukan hyperplane w . x + b = 0
Yang memisahkan titik-titik tersebut ke dalam dua kelas “Positif” (kelas +1) dan “Negatif”
(kelas -1).
(Diasumsikan titik-titik tersebut dapat dipisahkan secara linear)
Fungsi keputusannya
berupa
f(x) = sign (w.x +b)
6. 6
Hyperplane Pemisah
Gambar 4. Hyperplane pemisah
Gambar 5. Hyperplane pemisah mana yang dipilih?
Memilih Hyperplane Pemisah
▪ Misalkan dipilih hyperplane yang dekat dengan sample 𝑥𝑖
▪ Selanjutnya misal terdapat titik baru 𝑥′
yang merupakan kelas -1 dan dekat dengan 𝑥𝑖.
Dengan menggunakan fungsi klasifikasi f (x) titik 𝑥′
misclasified!
Gambar 6. Generalisasi yang buruk
▪ Hyperplane seharusnya sejauh mungkin dari titik sampel.
▪ Dengan demikian data baru yang dekat dengan sampel data akan diklasifikasikan dengan
benar.
7. 7
Gambar 7. Generalisasi yang baik
▪ Ide dasar dari SVM adalah memaksimalkan distance (jarak) antara hyperplane dan
titik sample terdekat.
Gambar 8. Memaksimalkan distance (jarak)
▪ Tujuan SVM adalah memaksimalkan margin yang besarnya dua kali jarak “d” antara
hyperplane pemisah dan sampel terdekat.
Gambar 9. Margin
8. 8
Gambar 10. Hyperplane dan margin dapat dipersempit atau diperlebar
Gambar 11. Hyperplane dan margin dapat dipersempit atau diperlebar
9. 9
Gambar 12. Hyperplane dan margin dapat dipersempit atau diperlebar
Gambar 13. Mendapatkan hyperplane dengan margin yang maksimal
10. 10
Gambar 14. Hyperplane dengan persamaan 𝒘𝑻
x + b = 0
Gambar 15. Vektor normal w menentukan orientasi dari hyperplane
11. 11
Gambar 16. Vektor normal w menentukan orientasi dari hyperplane
Gambar 17. Vektor normal w menentukan orientasi dari hyperplane
12. 12
Gambar 18. Vektor normal w menentukan orientasi dari hyperplane
Gambar 19. Vektor normal w menentukan orientasi dari hyperplane
13. 13
Gambar 20. Vektor normal w menentukan orientasi dari hyperplane
Gambar 21. Bias b menetukan pergeseran dari titik asal/pusat (origin)
14. 14
Gambar 22. Bias b menetukan pergeseran dari titik asal/pusat (origin)
Gambar 23. Bias b menetukan pergeseran dari titik asal/pusat (origin)
15. 15
Gambar 24. Bias b menetukan pergeseran dari titik asal/pusat (origin)
Gambar 25. Bias b menetukan pergeseran dari titik asal/pusat (origin)
16. 16
Gambar 26. Bias b menetukan pergeseran dari titik asal/pusat (origin)
Gambar 27. Bias b menetukan pergeseran dari titik asal/pusat (origin)
17. 17
Gambar 28. Bias b menetukan pergeseran dari titik asal/pusat (origin)
Gambar 29. Bias b menetukan pergeseran dari titik asal/pusat (origin)
18. 18
Gambar 30. Dengan mengubah sudut dari vektor normal w, margin dapat diorientasikan
Gambar 31. Dengan mengubah sudut dari vektor normal w, margin dapat diorientasikan
19. 19
Gambar 32. Jika ingin mwnggeser margin, dapat dilakukan dengan memperbesar atau
memperkecil bias b
Gambar 33. Jika ingin mwnggeser margin, dapat dilakukan dengan memperbesar atau
memperkecil bias b
20. 20
Gambar 34. Jika ingin mwnggeser margin, dapat dilakukan dengan memperbesar atau
memperkecil bias b
Gambar 35. Jika ingin mwnggeser margin, dapat dilakukan dengan memperbesar atau
memperkecil bias b
21. 21
Gambar 36. Margin (m) sama dengan 2 dibagi dengan panjang vektor normalnya
Gambar 37. Margin (m) sama dengan 2 dibagi dengan panjang vektor normalnya
22. 22
Gambar 38. Makin besar/panjang vektor normalnya makin sempit marginnya
Gambar 39. Makin besar/panjang vektor normalnya makin sempit marginnya
23. 23
Gambar 40. Makin kecil panjang vektor normalnya, makin lebar marginnya (m)
Gambar 41. Makin kecil panjang vektor normalnya, makin lebar marginnya (m)
24. 24
Referensi
Syahid Abdullah, S. M. (2023). Machine Learning. Dalam S. M. Syahid Abdullah, Supervised Learning:
SVM (Support Vector Machine) (hal. 1 - 50). Jakarta: Informatika UNSIA.
Wahyono, T. (2021). FUNDAMENTAL OF PYTHON FOR MACHINE LEARNING. Yogyakarta: Gava
Media.
Website: https://www.slideshare.net/HendroGunawan8/machine-learning-diskusi-7pdf