SlideShare a Scribd company logo
TIPE DATA DAN EKSPLORASI
DATA MENGGUNAKAN WEKA
DAN R
Praktikum 3 Data Mining – 23 Februari 2016
1Eksplorasi data
Eksplorasi data merupakan langkah untuk
memahami data sebelum dilakukan praproses.
Dalam eksplorasi data, hal yang harus diperhatikan
yaitu tipe data
Tipe data terdiri dari nominal, ordinal, interval, rasio
2Eksplorasi data
2Eksplorasi data
3Eksplorasi data dengan Weka
Weka hanya dapat mengenali tipe data nominal dan
numerik. Gunakan data weather.arff yang telah
tersedia di weka
Gambar 3 Statistika ringkasan dari atribut outlook
4Eksplorasi data dengan Weka
Gambar 4 Statistika ringkasan dari atribut temperature
5Eksplorasi data dengan Weka
Gambar 5 Histogram atribut temperature terhadap kelas play
[Dekatkan kursor
ke grafik]
6Eksplorasi data dengan Weka
Gambar 6 Histogram atribut windy terhadap kelas play
7Eksplorasi data dengan Weka
Gambar 7 Scatter plot humidty terhadap temperature
8Eksplorasi data dengan Weka
Gambar 8 instance info [double klik tanda kross pada scatter
plot]
9Eksplorasi data dengan Weka
Latihan :
coba jelaskan hasil dari statistika ringkasan dan visualisasi data
dengan menggunakan data labor.arff yang terdapat di weka
10Eksplorasi data dengan R
Eksplorasi pada R tidak jauh berbeda dengan weka, hanya saja di R
memiliki tipe data dan visualisasi data yang lebih lengkap dibandingkan weka.
Untuk lebih jelasnya kita import data insurance.csv [Tersedia di
http://bit.ly/insurance_csv] dan simpan pada variabel data .
Untuk melihat tipe data tiap atribut ketikkan perintah :
11Eksplorasi data dengan R
Jika dibandingkan dengan Weka, R memiliki tipe data yang lebih lengkap
seperti int, Factor, num.
Untuk melihat statistika ringkasan (misal pada atribut age dan sex)
ketikkan perintah :
Jika dibandingkan dengan Weka, R memiliki hasil statistika ringkasan lebih
lengkap yaitu Min, Q1, Median, Mean, Q3, dan Max.
12Eksplorasi data dengan R
Beberapa visualisasi yang tersedia pada R yaitu histogram, pie chart, line
chart, boxplot, scatter plot.
Untuk membuat boxplot ketiikan perintah :
13Eksplorasi data dengan R
Untuk membuat histogram ketikkan perintah :
14Eksplorasi data dengan R
Untuk membuat scatter plot ketikkan perintah :
15Eksplorasi data dengan R
Latihan : coba jelaskan hasil dari statistika ringkasan dan visualisasi
data dengan menggunakan data usedcars.csv [Tersedia di
http://bit.ly/1SZ0FPW] dengan menggunakan R
16Eksplorasi data
Terdapat tiga jenis analisa yang dapat dilakukan dengan menggunakan
scatter plot:
1 Scatter plot dapat menunjukkan hubungan (korelasi) antara dua
variabel/atribut dan juga dapat digunakan untuk mendeteksi hubungan non linier
antar dua variabel/atribut.
2 Ketika label dari kelas tersedia scatter plot dapat digunakan untuk menyelidiki
derajat kedua atribut dalam memisahkan kelas
3 Menganalisa pencilan/outlier.
17Eksplorasi data
Berikut perbedaan secara general terkait eksplorasi data dengan
menggunakan Weka dan R
R Weka
Statistika
Ringkasan
Min, Max,
Q1,Median,Q3,Me
an
Min, Max,
StdDev, Mean
Visualisasi Data Histogram, Scatter
plot, pie chart, line
chart, box plot
Scatter plot,
Histogram
9
 [Tugas LKP Tersedia di LMS] 

More Related Content

What's hot

Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
aiiniR
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
dedidarwis
 
Visualisasi Data.pptx
Visualisasi Data.pptxVisualisasi Data.pptx
Visualisasi Data.pptx
MichelleWalakandou1
 
Algoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendekAlgoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendek
Laili Wahyunita
 
STATISTIKA-Regresi dan korelasi
STATISTIKA-Regresi dan korelasiSTATISTIKA-Regresi dan korelasi
STATISTIKA-Regresi dan korelasi
Yousuf Kurniawan
 
Uji kruskal wallis
Uji kruskal wallisUji kruskal wallis
Uji kruskal wallis
Munaji Aji
 
Presentasi fuzzy logic (Logika Fuzzy)
Presentasi fuzzy logic (Logika Fuzzy)Presentasi fuzzy logic (Logika Fuzzy)
Presentasi fuzzy logic (Logika Fuzzy)
radar radius
 
Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
Jordan Drummer
 
Arsitektur produk
Arsitektur produkArsitektur produk
Arsitektur produk
tijar22
 
Identifikasi proyek
Identifikasi proyekIdentifikasi proyek
Identifikasi proyek
titiwerdhy
 
Model Simulasi MONTE CARLO (DISTRIBUSI)
Model Simulasi MONTE CARLO (DISTRIBUSI)Model Simulasi MONTE CARLO (DISTRIBUSI)
Model Simulasi MONTE CARLO (DISTRIBUSI)
Endang Retnoningsih
 
Modul 03 Dasar Pemodelan
Modul 03 Dasar PemodelanModul 03 Dasar Pemodelan
Modul 03 Dasar Pemodelan
Arif Rahman
 
Etika engineering meet 5
Etika engineering meet 5Etika engineering meet 5
Etika engineering meet 5
putri rachmawati
 
Systemic Layout Planning
Systemic Layout PlanningSystemic Layout Planning
Systemic Layout Planning
Wisnu Dewobroto
 
Sejarah statistik
Sejarah statistikSejarah statistik
Sejarah statistik
nurwa ningsih
 
Teknik sampling
Teknik samplingTeknik sampling
Teknik sampling
Muhammad Luthfan
 
Latihan soal beberapa distribusi peluang diskrit
Latihan soal beberapa distribusi peluang diskritLatihan soal beberapa distribusi peluang diskrit
Latihan soal beberapa distribusi peluang diskrit
Siti Yuliati
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
IrwansyahSaputra1
 
Teori pendugaan statistik presentasi
Teori pendugaan statistik presentasiTeori pendugaan statistik presentasi
Teori pendugaan statistik presentasi
Perum Perumnas
 
Sistem pakar
Sistem pakarSistem pakar
Sistem pakar
Universitas Kuningan
 

What's hot (20)

Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
 
Visualisasi Data.pptx
Visualisasi Data.pptxVisualisasi Data.pptx
Visualisasi Data.pptx
 
Algoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendekAlgoritma pencarian lintasan jalur terpendek
Algoritma pencarian lintasan jalur terpendek
 
STATISTIKA-Regresi dan korelasi
STATISTIKA-Regresi dan korelasiSTATISTIKA-Regresi dan korelasi
STATISTIKA-Regresi dan korelasi
 
Uji kruskal wallis
Uji kruskal wallisUji kruskal wallis
Uji kruskal wallis
 
Presentasi fuzzy logic (Logika Fuzzy)
Presentasi fuzzy logic (Logika Fuzzy)Presentasi fuzzy logic (Logika Fuzzy)
Presentasi fuzzy logic (Logika Fuzzy)
 
Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
 
Arsitektur produk
Arsitektur produkArsitektur produk
Arsitektur produk
 
Identifikasi proyek
Identifikasi proyekIdentifikasi proyek
Identifikasi proyek
 
Model Simulasi MONTE CARLO (DISTRIBUSI)
Model Simulasi MONTE CARLO (DISTRIBUSI)Model Simulasi MONTE CARLO (DISTRIBUSI)
Model Simulasi MONTE CARLO (DISTRIBUSI)
 
Modul 03 Dasar Pemodelan
Modul 03 Dasar PemodelanModul 03 Dasar Pemodelan
Modul 03 Dasar Pemodelan
 
Etika engineering meet 5
Etika engineering meet 5Etika engineering meet 5
Etika engineering meet 5
 
Systemic Layout Planning
Systemic Layout PlanningSystemic Layout Planning
Systemic Layout Planning
 
Sejarah statistik
Sejarah statistikSejarah statistik
Sejarah statistik
 
Teknik sampling
Teknik samplingTeknik sampling
Teknik sampling
 
Latihan soal beberapa distribusi peluang diskrit
Latihan soal beberapa distribusi peluang diskritLatihan soal beberapa distribusi peluang diskrit
Latihan soal beberapa distribusi peluang diskrit
 
Data mining 6 klasifikasi naive bayes classifier
Data mining 6   klasifikasi naive bayes classifierData mining 6   klasifikasi naive bayes classifier
Data mining 6 klasifikasi naive bayes classifier
 
Teori pendugaan statistik presentasi
Teori pendugaan statistik presentasiTeori pendugaan statistik presentasi
Teori pendugaan statistik presentasi
 
Sistem pakar
Sistem pakarSistem pakar
Sistem pakar
 

Similar to Tipe Data dan Eksplorasi Data Menggunakan Weka dan R

PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx
PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptxPPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx
PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx
WaOdeSaidatulAulia
 
Pengantar R3
Pengantar R3Pengantar R3
Pengantar R3
Raden Maulana
 
Bab v
Bab vBab v
tugas matematika
tugas matematikatugas matematika
tugas matematika
muazis febrianto
 
Program semester-matematika-kelas-xi-ipa-semester-1
Program semester-matematika-kelas-xi-ipa-semester-1Program semester-matematika-kelas-xi-ipa-semester-1
Program semester-matematika-kelas-xi-ipa-semester-1
Rendy Zulnovri
 
Laporan 1 penngantar program r
Laporan 1 penngantar program rLaporan 1 penngantar program r
Laporan 1 penngantar program r
Khair Norrasid
 
Tutorial use tibco spotfire
Tutorial use tibco spotfireTutorial use tibco spotfire
Tutorial use tibco spotfire
Avita Tri Utami
 
P4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan GrafikP4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan Grafik
M. Jainuri, S.Pd., M.Pd
 
Bab 1
Bab 1Bab 1
[ESPA4123] INISIASI 2.ppt
[ESPA4123] INISIASI 2.ppt[ESPA4123] INISIASI 2.ppt
[ESPA4123] INISIASI 2.ppt
MarliLusi
 
Dasar Pemrograman materi kuliah
Dasar Pemrograman materi kuliahDasar Pemrograman materi kuliah
Dasar Pemrograman materi kuliah
Braga Rezpect
 
Pengantar statistik [compatibility mode]
Pengantar statistik [compatibility mode]Pengantar statistik [compatibility mode]
Pengantar statistik [compatibility mode]
Angga Debby Frayudha
 
Statiska
StatiskaStatiska
Statiska
StatiskaStatiska
Statiska
Scott Cracer
 
Introduction to Data Mining with Rstudio
Introduction to Data Mining with RstudioIntroduction to Data Mining with Rstudio
Introduction to Data Mining with Rstudio
yapannizam
 
P4 penyajian data diagram dan grafik
P4 penyajian data diagram dan grafikP4 penyajian data diagram dan grafik
P4 penyajian data diagram dan grafik
M. Jainuri, S.Pd., M.Pd
 
Teknik Penyajian Data pada penuisan laporan praktek lapang
Teknik Penyajian Data pada penuisan laporan praktek lapangTeknik Penyajian Data pada penuisan laporan praktek lapang
Teknik Penyajian Data pada penuisan laporan praktek lapang
polteksidoarjo1
 
Analisa spasial -_vektor
Analisa spasial -_vektorAnalisa spasial -_vektor
Analisa spasial -_vektor
Irma Wahyuni
 
Ppt statistik smp kelas ix
Ppt statistik smp kelas ixPpt statistik smp kelas ix
Ppt statistik smp kelas ixadhaidul
 

Similar to Tipe Data dan Eksplorasi Data Menggunakan Weka dan R (20)

PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx
PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptxPPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx
PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx
 
Pengantar R3
Pengantar R3Pengantar R3
Pengantar R3
 
Bab v
Bab vBab v
Bab v
 
tugas matematika
tugas matematikatugas matematika
tugas matematika
 
Program semester-matematika-kelas-xi-ipa-semester-1
Program semester-matematika-kelas-xi-ipa-semester-1Program semester-matematika-kelas-xi-ipa-semester-1
Program semester-matematika-kelas-xi-ipa-semester-1
 
Laporan 1 penngantar program r
Laporan 1 penngantar program rLaporan 1 penngantar program r
Laporan 1 penngantar program r
 
Tutorial use tibco spotfire
Tutorial use tibco spotfireTutorial use tibco spotfire
Tutorial use tibco spotfire
 
R1
R1R1
R1
 
P4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan GrafikP4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan Grafik
 
Bab 1
Bab 1Bab 1
Bab 1
 
[ESPA4123] INISIASI 2.ppt
[ESPA4123] INISIASI 2.ppt[ESPA4123] INISIASI 2.ppt
[ESPA4123] INISIASI 2.ppt
 
Dasar Pemrograman materi kuliah
Dasar Pemrograman materi kuliahDasar Pemrograman materi kuliah
Dasar Pemrograman materi kuliah
 
Pengantar statistik [compatibility mode]
Pengantar statistik [compatibility mode]Pengantar statistik [compatibility mode]
Pengantar statistik [compatibility mode]
 
Statiska
StatiskaStatiska
Statiska
 
Statiska
StatiskaStatiska
Statiska
 
Introduction to Data Mining with Rstudio
Introduction to Data Mining with RstudioIntroduction to Data Mining with Rstudio
Introduction to Data Mining with Rstudio
 
P4 penyajian data diagram dan grafik
P4 penyajian data diagram dan grafikP4 penyajian data diagram dan grafik
P4 penyajian data diagram dan grafik
 
Teknik Penyajian Data pada penuisan laporan praktek lapang
Teknik Penyajian Data pada penuisan laporan praktek lapangTeknik Penyajian Data pada penuisan laporan praktek lapang
Teknik Penyajian Data pada penuisan laporan praktek lapang
 
Analisa spasial -_vektor
Analisa spasial -_vektorAnalisa spasial -_vektor
Analisa spasial -_vektor
 
Ppt statistik smp kelas ix
Ppt statistik smp kelas ixPpt statistik smp kelas ix
Ppt statistik smp kelas ix
 

Recently uploaded

Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptxBahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
dwiagus41
 
Uji Akurasi klasifikasi - Confusion Matrix.pptx
Uji Akurasi klasifikasi - Confusion Matrix.pptxUji Akurasi klasifikasi - Confusion Matrix.pptx
Uji Akurasi klasifikasi - Confusion Matrix.pptx
NurlinaAbdullah1
 
pemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdfpemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdf
fuji226200
 
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.pptPPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
WewikAyuPrimaDewi
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
WagKuza
 
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptxTugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
SunakonSulistya
 
template undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docxtemplate undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docx
ansproduction72
 
Materi pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipaMateri pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipa
sarahshintia630
 
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
TeguhWinarno6
 
PPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahirPPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahir
yardsport
 
MINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdfMINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdf
AlmaDani8
 
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay..."Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
Muhammad Nur Hadi
 

Recently uploaded (12)

Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptxBahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
Bahan_Ajar_Pelatihan Inda SKLNP_Tahunan_2024-1.pptx
 
Uji Akurasi klasifikasi - Confusion Matrix.pptx
Uji Akurasi klasifikasi - Confusion Matrix.pptxUji Akurasi klasifikasi - Confusion Matrix.pptx
Uji Akurasi klasifikasi - Confusion Matrix.pptx
 
pemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdfpemenuhan SKP dokter 552024 surabaya.pdf
pemenuhan SKP dokter 552024 surabaya.pdf
 
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.pptPPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
PPT PERTEMUAN VALIDASI DAN EVALUASI USIA PRODUKTIF DAN LANSIA.ppt
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
 
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptxTugas DIT Supervisor K3 - Sidik Permana Putra.pptx
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
 
template undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docxtemplate undangan Walimatul Khitan 2 seri.docx
template undangan Walimatul Khitan 2 seri.docx
 
Materi pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipaMateri pokok dan media pembelajaran ekosistem ipa
Materi pokok dan media pembelajaran ekosistem ipa
 
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
JAWABAN PMM. guru kemendikbud tahun pelajaran 2024
 
PPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahirPPT TAP KEL 3.pptx model pembelajaran ahir
PPT TAP KEL 3.pptx model pembelajaran ahir
 
MINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdfMINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdf
 
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay..."Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...
 

Tipe Data dan Eksplorasi Data Menggunakan Weka dan R

  • 1. TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R Praktikum 3 Data Mining – 23 Februari 2016
  • 2. 1Eksplorasi data Eksplorasi data merupakan langkah untuk memahami data sebelum dilakukan praproses. Dalam eksplorasi data, hal yang harus diperhatikan yaitu tipe data Tipe data terdiri dari nominal, ordinal, interval, rasio
  • 5. 3Eksplorasi data dengan Weka Weka hanya dapat mengenali tipe data nominal dan numerik. Gunakan data weather.arff yang telah tersedia di weka Gambar 3 Statistika ringkasan dari atribut outlook
  • 6. 4Eksplorasi data dengan Weka Gambar 4 Statistika ringkasan dari atribut temperature
  • 7. 5Eksplorasi data dengan Weka Gambar 5 Histogram atribut temperature terhadap kelas play [Dekatkan kursor ke grafik]
  • 8. 6Eksplorasi data dengan Weka Gambar 6 Histogram atribut windy terhadap kelas play
  • 9. 7Eksplorasi data dengan Weka Gambar 7 Scatter plot humidty terhadap temperature
  • 10. 8Eksplorasi data dengan Weka Gambar 8 instance info [double klik tanda kross pada scatter plot]
  • 11. 9Eksplorasi data dengan Weka Latihan : coba jelaskan hasil dari statistika ringkasan dan visualisasi data dengan menggunakan data labor.arff yang terdapat di weka
  • 12. 10Eksplorasi data dengan R Eksplorasi pada R tidak jauh berbeda dengan weka, hanya saja di R memiliki tipe data dan visualisasi data yang lebih lengkap dibandingkan weka. Untuk lebih jelasnya kita import data insurance.csv [Tersedia di http://bit.ly/insurance_csv] dan simpan pada variabel data . Untuk melihat tipe data tiap atribut ketikkan perintah :
  • 13. 11Eksplorasi data dengan R Jika dibandingkan dengan Weka, R memiliki tipe data yang lebih lengkap seperti int, Factor, num. Untuk melihat statistika ringkasan (misal pada atribut age dan sex) ketikkan perintah : Jika dibandingkan dengan Weka, R memiliki hasil statistika ringkasan lebih lengkap yaitu Min, Q1, Median, Mean, Q3, dan Max.
  • 14. 12Eksplorasi data dengan R Beberapa visualisasi yang tersedia pada R yaitu histogram, pie chart, line chart, boxplot, scatter plot. Untuk membuat boxplot ketiikan perintah :
  • 15. 13Eksplorasi data dengan R Untuk membuat histogram ketikkan perintah :
  • 16. 14Eksplorasi data dengan R Untuk membuat scatter plot ketikkan perintah :
  • 17. 15Eksplorasi data dengan R Latihan : coba jelaskan hasil dari statistika ringkasan dan visualisasi data dengan menggunakan data usedcars.csv [Tersedia di http://bit.ly/1SZ0FPW] dengan menggunakan R
  • 18. 16Eksplorasi data Terdapat tiga jenis analisa yang dapat dilakukan dengan menggunakan scatter plot: 1 Scatter plot dapat menunjukkan hubungan (korelasi) antara dua variabel/atribut dan juga dapat digunakan untuk mendeteksi hubungan non linier antar dua variabel/atribut. 2 Ketika label dari kelas tersedia scatter plot dapat digunakan untuk menyelidiki derajat kedua atribut dalam memisahkan kelas 3 Menganalisa pencilan/outlier.
  • 19. 17Eksplorasi data Berikut perbedaan secara general terkait eksplorasi data dengan menggunakan Weka dan R R Weka Statistika Ringkasan Min, Max, Q1,Median,Q3,Me an Min, Max, StdDev, Mean Visualisasi Data Histogram, Scatter plot, pie chart, line chart, box plot Scatter plot, Histogram
  • 20. 9  [Tugas LKP Tersedia di LMS] 