”IMPLEMENTASI
ALJABAR LINEAR
DALAM TEKNOLOGI
DATA MINING”
DISUSUN OLEH :
Andi Siti Nur Aisyah (171510061)
Rino Mandala (171510086)
DATA MINING
PENGELOMPOKKAN DATA
MINING
1. Deskripsi 2. Estimasi 3. Prediksi
4. Klasifikasi
5.
Pengklusteran
6. Asosiasi
PENGELOMPOKKAN DATA
MINING
1. Deskripsi
Terkadang peneliti dan analis secara sederhana
ingin mencoba mencari cara untuk
menggambarkan pola dan kecenderungan yang
terdapat dalam data. Sebagai contoh petugas
pengumpulan suara mungkin tidak dapat
mengumpulkan keterangan atau fakta bahwa
siapa yang tidak cukup professional akan sedikit
didukung dalam pemilihan pressiden, deskripsi
dari pola kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau
kecendrungan.
PENGELOMPOKKAN DATA
MINING
2. Estimasi Estimasi hampir sama dengan klasifikasi, kecuali
variabel target estimasi lebih ke arah numerik daripada
ke arah kategori. Model dibangun dengan record
lengkap yang menyediakan nilai dari variabel target
sebagai nilai prediksi. Sebagai contoh akan dilakukan
estimasi tekanan darah sistolik pada pasien rumah sakit
berdasarkan umur pasien, jenis kelamin, indeks berat
badan dan level sodium darah. Hubungan antara tekanan
darah sistolik dan nilai variabel prediksi dalam proses
pembelajaran akan menghasilkan model estimasi. Model
estimasi yang dihasilkan dapat digunakan untuk kasus
baru lainnya.
PENGELOMPOKKAN DATA
MINING
3. Prediksi Prediksi hampir sama dengan klasifikasi dan
estimasi, kecuali bahwa dalam prediksi nilai dari hasil
akan ada dimasa mendatang.
Contoh prediksi dalam bisnis dan penelitian adalah:
a. Prediksi harga beras dalam tiga bulan yang akan
datang.
b. Prediksi presentase kenaikan kecelakaan lalu lintas
tahun depan jika batas bawah dinaikan.
Beberapa metode dan teknik yang digunakan
dalam klasifikasi dan estimasi dapat pula digunakan
(untuk keadaan yang tepat) untuk prediksi.
PENGELOMPOKKAN DATA
MINING
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori,
sebagai contoh penggolongan pendapatan dapat
dipisahkan dalam tiga kategori yaitu: pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian
adalah:
a.Menentukan apakah sutau transaksi kartu kredit
merupakan transaksi yang curang atau bukan.
b.Memperkirakan apakah suatu pengajuan hipotek
nasabah merupakan suatu kredit yang baik atau buruk.
c.Mendiagnosis penyakit seorang pasien untuk
mendapatkan termasuk kategori penyakit apa.
5. Pengklusteran
PENGELOMPOKKAN DATA
MINING
Pengklusteran merupakan pengelompokkan record,
pengamatan, atau memperhatikan dan membentuk kelas
objek-objek yang memiliki kemiripan. Kluster adalah
kumpulan record yang memiliki kemiripan satu dengan
yang lainnya dan tidak memiliki kemiripan dengan record-
record dalam kluster lain. Pengklusteran berbeda dengan
klasifikasi yaitu tidak adanya variabel target dalam
pengklusteran, pengklusteran tidak mencoba untuk
melakukan klasifikasi, mengestimasi, atau memprediski
nilai dari variabel target. Untuk tujuan audit akuntansi,
yaitu melakukan pemisahan terhadap perilaku finansial
dalam baik maupun mencurigakan.
Melakukan pengklusteran terhadap ekspresi dari en, untuk
mendapatkan kemiripan perilaku dari gen dalam jumlah
besar.
6. Asosiasi
PENGELOMPOKKAN DATA
MINING
Tugas asosiasi dalam data mining adalah
menemukan atribut yang muncul dalam satu
waktu. Dalam dunia bisnis lebih umum disebut
analisis keranjangan pasar.
Contoh asosisasi dalam bisnis dan penelitian
adalah:
Meneliti jumlah pelanggan dan perusahaan
telekomunikasi seluler yang diharapkan untuk
memberikan respon positif terhadap penawaran
upgrade layanan yang diberikan.
Menemukan barang dalam supermarket yang
dibeli secara bersamaan dan barang yang tidak
pernah dibeli secara bersamaan.
Clustering
Metode penganalisaan data, yang sering
dimasukkan sebagai salah satu metode Data
Mining, yang tujuannya adalah untuk
mengelompokkan data dengan karakteristik
yang sama ke suatu 'wilayah' yang sama dan
data dengan karakteristik yang berbeda ke
'wilayah' yang lain.
K-MEANS
Salah satu metode yang berusaha
mempartisi data yang ada dalam
bentuk satu atau lebih Cluster.
Secara umum metode k-means ini melakukan proses
pengelompokan dengan prosedur sebagai berikut
(Maimon et al, 2010):
Tentukan jumlah cluster.
Alokasikan data secara random ke cluster
yang ada.
Hitung rata-rata setiap cluster dari data yang
tergabung di dalamnya.
Alokasikan kembali semua data ke cluster
terdekat.
Ulang proses nomor 3, sampai tidak ada
perubahan atau perubahan yang terjadi masih
sudah di bawah treshold.
Mixture modelling
Metode pengelompokan data yang mirip dengan k-means dengan kelebihan
penggunaan distribusi statistik dalam mendefinisikan setiap cluster yang ditemukan.
Dibandingkan dengan k-means yang hanya menggunakan cluster center,
penggunaan distribusi statistik ini mengijinkan kita untuk :
Memodel data yang kita miliki dengan setting karakteristik yang berbeda-beda .
Jumlah cluster yang sesuai dengan keadaan data bisa ditemukan seiring dengan
proses pemodelan karakteristik dari masing-masing cluster .
Hasil pemodelan clustering yang dilaksanakan bisa diuji tingkat keakuratannya.
Kita Akan Masuk Ke Contoh
Kasus :
Berikut penyajian data penjualan pada sebuah Supermarket
THE END

Tm aljabar linear matriks

  • 1.
    ”IMPLEMENTASI ALJABAR LINEAR DALAM TEKNOLOGI DATAMINING” DISUSUN OLEH : Andi Siti Nur Aisyah (171510061) Rino Mandala (171510086)
  • 3.
  • 4.
    PENGELOMPOKKAN DATA MINING 1. Deskripsi2. Estimasi 3. Prediksi 4. Klasifikasi 5. Pengklusteran 6. Asosiasi
  • 5.
    PENGELOMPOKKAN DATA MINING 1. Deskripsi Terkadangpeneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh petugas pengumpulan suara mungkin tidak dapat mengumpulkan keterangan atau fakta bahwa siapa yang tidak cukup professional akan sedikit didukung dalam pemilihan pressiden, deskripsi dari pola kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecendrungan.
  • 6.
    PENGELOMPOKKAN DATA MINING 2. EstimasiEstimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun dengan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Sebagai contoh akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
  • 7.
    PENGELOMPOKKAN DATA MINING 3. PrediksiPrediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah: a. Prediksi harga beras dalam tiga bulan yang akan datang. b. Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
  • 8.
    PENGELOMPOKKAN DATA MINING 4. Klasifikasi Dalamklasifikasi, terdapat target variabel kategori, sebagai contoh penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam bisnis dan penelitian adalah: a.Menentukan apakah sutau transaksi kartu kredit merupakan transaksi yang curang atau bukan. b.Memperkirakan apakah suatu pengajuan hipotek nasabah merupakan suatu kredit yang baik atau buruk. c.Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa.
  • 9.
    5. Pengklusteran PENGELOMPOKKAN DATA MINING Pengklusteranmerupakan pengelompokkan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan tidak memiliki kemiripan dengan record- record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran, pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediski nilai dari variabel target. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik maupun mencurigakan. Melakukan pengklusteran terhadap ekspresi dari en, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar.
  • 10.
    6. Asosiasi PENGELOMPOKKAN DATA MINING Tugasasosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjangan pasar. Contoh asosisasi dalam bisnis dan penelitian adalah: Meneliti jumlah pelanggan dan perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.
  • 11.
    Clustering Metode penganalisaan data,yang sering dimasukkan sebagai salah satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data dengan karakteristik yang sama ke suatu 'wilayah' yang sama dan data dengan karakteristik yang berbeda ke 'wilayah' yang lain.
  • 12.
    K-MEANS Salah satu metodeyang berusaha mempartisi data yang ada dalam bentuk satu atau lebih Cluster.
  • 13.
    Secara umum metodek-means ini melakukan proses pengelompokan dengan prosedur sebagai berikut (Maimon et al, 2010): Tentukan jumlah cluster. Alokasikan data secara random ke cluster yang ada. Hitung rata-rata setiap cluster dari data yang tergabung di dalamnya. Alokasikan kembali semua data ke cluster terdekat. Ulang proses nomor 3, sampai tidak ada perubahan atau perubahan yang terjadi masih sudah di bawah treshold.
  • 14.
    Mixture modelling Metode pengelompokandata yang mirip dengan k-means dengan kelebihan penggunaan distribusi statistik dalam mendefinisikan setiap cluster yang ditemukan. Dibandingkan dengan k-means yang hanya menggunakan cluster center, penggunaan distribusi statistik ini mengijinkan kita untuk : Memodel data yang kita miliki dengan setting karakteristik yang berbeda-beda . Jumlah cluster yang sesuai dengan keadaan data bisa ditemukan seiring dengan proses pemodelan karakteristik dari masing-masing cluster . Hasil pemodelan clustering yang dilaksanakan bisa diuji tingkat keakuratannya.
  • 15.
    Kita Akan MasukKe Contoh Kasus : Berikut penyajian data penjualan pada sebuah Supermarket
  • 16.