Modul ini membahas pengolahan dan analisis data hasil penelitian. Terdapat dua jenis data berdasarkan sumbernya, yaitu data primer yang dikumpulkan secara langsung dan data sekunder dari sumber yang telah ada. Data dibedakan pula berdasarkan bentuknya menjadi kualitatif dan kuantitatif, dengan kuantitatif terdiri atas diskrit, kontinum, nominal, ordinal, interval, dan rasio. Modul ini menjelaskan pengertian dan contoh set
Dokumen tersebut membahas tentang pengenalan pola, data mining, dan machine learning. Termasuk perbedaan antara supervised learning dan unsupervised learning serta contohnya. Juga dibahas mengenai klasifikasi, regresi, dan transformasi data.
Dokumen tersebut merangkum tentang machine learning dan data mining. Machine learning adalah ilmu yang mempelajari cara memberikan kemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user, sedangkan data mining adalah proses ekstraksi pengetahuan dari database besar menggunakan teknik statistik dan machine learning. Dokumen ini juga membahas perbedaan antara supervised learning dan unsupervised learning serta beberapa algoritma machine learning seperti klasifikasi, regresi, kl
Dokumen tersebut membahas tentang data mining dan pengajaran desain pembelajaran. Secara singkat, dokumen tersebut menjelaskan tentang konsep-konsep dasar data mining, algoritma yang digunakan dalam data mining seperti estimasi, prediksi, klasifikasi, dan klastering, serta tahapan proses data mining mulai dari input data hingga evaluasi hasilnya.
Krm 3043 pengurusan data tugasan 1(norlia bt ismail) d20102043530Nor Lia
Unit ini membincangkan konsep-konsep asas sukatan kecenderungan memusat dalam statistik seperti min, median dan mod. Ia juga menjelaskan definisi dan kaedah pengiraan ketiga-tiga sukatan ini bagi data tak terkumpul dan terkumpul.
Data Mining digunakan untuk mengekstrak pola dan pengetahuan dari data besar yang kompleks untuk memecahkan masalah bisnis. Teknik utama Data Mining meliputi estimasi, prediksi, klasifikasi, klastering dan asosiasi. Metode pembelajaran terdiri dari pembelajaran terbimbing, tidak terbimbing dan semi terbimbing.
Modul ini membahas pengolahan dan analisis data hasil penelitian. Terdapat dua jenis data berdasarkan sumbernya, yaitu data primer yang dikumpulkan secara langsung dan data sekunder dari sumber yang telah ada. Data dibedakan pula berdasarkan bentuknya menjadi kualitatif dan kuantitatif, dengan kuantitatif terdiri atas diskrit, kontinum, nominal, ordinal, interval, dan rasio. Modul ini menjelaskan pengertian dan contoh set
Dokumen tersebut membahas tentang pengenalan pola, data mining, dan machine learning. Termasuk perbedaan antara supervised learning dan unsupervised learning serta contohnya. Juga dibahas mengenai klasifikasi, regresi, dan transformasi data.
Dokumen tersebut merangkum tentang machine learning dan data mining. Machine learning adalah ilmu yang mempelajari cara memberikan kemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user, sedangkan data mining adalah proses ekstraksi pengetahuan dari database besar menggunakan teknik statistik dan machine learning. Dokumen ini juga membahas perbedaan antara supervised learning dan unsupervised learning serta beberapa algoritma machine learning seperti klasifikasi, regresi, kl
Dokumen tersebut membahas tentang data mining dan pengajaran desain pembelajaran. Secara singkat, dokumen tersebut menjelaskan tentang konsep-konsep dasar data mining, algoritma yang digunakan dalam data mining seperti estimasi, prediksi, klasifikasi, dan klastering, serta tahapan proses data mining mulai dari input data hingga evaluasi hasilnya.
Krm 3043 pengurusan data tugasan 1(norlia bt ismail) d20102043530Nor Lia
Unit ini membincangkan konsep-konsep asas sukatan kecenderungan memusat dalam statistik seperti min, median dan mod. Ia juga menjelaskan definisi dan kaedah pengiraan ketiga-tiga sukatan ini bagi data tak terkumpul dan terkumpul.
Data Mining digunakan untuk mengekstrak pola dan pengetahuan dari data besar yang kompleks untuk memecahkan masalah bisnis. Teknik utama Data Mining meliputi estimasi, prediksi, klasifikasi, klastering dan asosiasi. Metode pembelajaran terdiri dari pembelajaran terbimbing, tidak terbimbing dan semi terbimbing.
Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...Koltiva
Sistem Informasi Manajemen Rumah Sakit (SIMRS) secara umum telah digunakan oleh para staf rumah sakit untuk mendukung operasional sehari-hari. Sebagian besar informasi yang didapat pada operasional SIMRS berasal dari pengolahan transactional database. Sedangkan untuk mendukung pengambilan keputusan ditingkat manajerial, diperlukan akses ke database dalam ukuran besar dan dimensi yang lebih kompleks, sehingga diperlukan teknik data mining. Pendekatan data mining biasa dilakukan untuk menggali informasi, pengetahuan, pola-pola baru dan tren dengan menganalisis database dalam ukuran besar, menggunakan teknologi pengenalan pola, teknik statistik dan matematik.
Salahsatu potensi yang dapat dimanfaatkan pada penerapan data mining di rumah sakit adalah mengidentifikasi atribut-atribut penentu biaya pasien rawat inap. Dengan mengetahui atribut penentu biaya rawat, diharapkan pihak manajemen rumah sakit dapat melakukan kontrol terhadap biaya, sehingga ongkos perawatan pasien dapat ditekan tanpa mengurangi kualitas pelayanan.
Untuk mengidentifikasi atribut penentu biaya pasien rawat inap, digunakan data kunjungan pasien rawat inap RSUP Dr. Cipto Mangunkusumo dengan jaminan Jamkesmas periode 1 Januari 2009 s/d 30 September 2010 dari database SIMRS sebanyak 2022 kunjungan (jumlah sebelum dilakukan data cleaning 8383). Dengan teknik analisa Atttibute Importance (AI) didapatkan atribut-atribut penentu biaya dengan urutan sebagai berikut: prosedur medis 1 (AI=0,16), prosedur medis 4 (AI=0,15), prosedur medis 3 (AI=0,14), LOS (AI=0,13), prosedur medis 2 (AI=0,13), organisasi (AI=0.10), diagnosa utama (AI=0,08), jenis kelamin (AI=0.02) dan status kawin (AI=0.01). Hasil klasifikasi dengan teknik Algoritma Naive Bayes menunjukkan model yang dibuat memiliki predictive confidence sebesar 50,41%.
Ppt singkat Pengantar Statistika kelompok 4Maysy Maysy
Statistika adalah cabang matematika terapan yang mempelajari pengumpulan, penyajian, dan analisis data untuk menarik kesimpulan. Terdiri atas statistika deskriptif untuk mendeskripsikan objek dan statistika inferensial untuk penarikan kesimpulan. Data dibedakan menurut cara memperolehnya menjadi data primer dan sekunder. Diagram sering digunakan untuk penyajian data. Ukuran tengah data meliputi rata-rata, median, dan
Klasifikasi adalah proses menemukan pola yang menjelaskan atau membedakan konsep atau kelas data untuk memprediksi kelas objek baru. Model klasifikasi dibangun dengan melatih algoritma pada data pelatihan untuk memetakan atribut ke label kelas, lalu model diuji keakuratannya pada data uji. Pohon keputusan sering digunakan karena mudah diinterpretasi.
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
Tahapan data mining terdiri dari pembersihan data, integrasi data, transformasi data, teknik data mining, evaluasi pola, dan presentasi pengetahuan. Proses ini bersifat interaktif dengan pengguna untuk menemukan pola dan informasi menarik dari data.
Dokumen ini membahas tiga algoritma utama pencarian data dalam array: sequential search, binary search, dan interpolation search. Sequential search membandingkan data secara berurut dari awal hingga akhir array. Binary search membagi ruang pencarian menjadi setengah pada setiap iterasi. Interpolation search mencari posisi estimasi berikutnya tempat data dicari berada. Dokumen ini juga berisi contoh kode dan penjelasan alur kerja dari ketiga algoritma tersebut.
Kelompok 6 terdiri dari 3 anggota yaitu Aisyah Turidho, Dhiah Masyitoh, dan Tania Tri Septiani. Dokumen ini membahas tentang statistika termasuk pengumpulan data, penyajian data, ukuran pemusatan data seperti mean, modus, median, dan kuartil.
Sistem Ekstraksi Informasi Web Menggunakan Metode Pencarian Pola Otomatis Ber...Sigit Dewanto
Tugas akhir ini membahas sistem ekstraksi informasi web menggunakan metode pencarian pola otomatis berbasis pencocokan pohon. Sistem ini dirancang untuk mengekstrak data terstruktur dari halaman web secara otomatis tanpa pembelajaran manual terlebih dahulu. Sistem ini mengimplementasikan algoritma pencarian pola otomatis berbasis pencocokan pohon untuk mendeteksi pola penyajian data pada halaman web dan mengekstrak datanya.
Dokumen tersebut membahas pengembangan perangkat lunak diagnosa penyakit diabetes melitus tipe 2 berbasis teknik klasifikasi data. Perangkat lunak ini dapat membantu dokter dalam proses diagnosis dengan cara menganalisis data rekam medis pasien untuk menemukan pola dan mengeluarkan rules diagnosis. Algoritma C4.5 digunakan untuk membangun model klasifikasi berupa pohon keputusan yang mampu memprediksi diagnosis penyakit dengan tingkat akurasi 95
Statistik pendidikan membahas konsep statistik dasar, distribusi frekuensi, rata-rata, penyebaran data, korelasi, dan uji hipotesis yang diterapkan dalam bidang pendidikan. Mata kuliah ini bertujuan agar mahasiswa memahami konsep-konsep statistik dan mampu menerapkannya dalam penelitian pendidikan.
Dokumen ini membahas tentang klasifikasi dataset mobil menggunakan metode decision tree di Weka. Dataset mobil diubah formatnya menjadi ARFF dan diklasifikasi menggunakan ID3 dan J48. Hasilnya menunjukkan ID3 memberikan akurasi yang lebih baik dari J48 berdasarkan nilai presisi, recall, dan F-measure.
Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...Koltiva
Sistem Informasi Manajemen Rumah Sakit (SIMRS) secara umum telah digunakan oleh para staf rumah sakit untuk mendukung operasional sehari-hari. Sebagian besar informasi yang didapat pada operasional SIMRS berasal dari pengolahan transactional database. Sedangkan untuk mendukung pengambilan keputusan ditingkat manajerial, diperlukan akses ke database dalam ukuran besar dan dimensi yang lebih kompleks, sehingga diperlukan teknik data mining. Pendekatan data mining biasa dilakukan untuk menggali informasi, pengetahuan, pola-pola baru dan tren dengan menganalisis database dalam ukuran besar, menggunakan teknologi pengenalan pola, teknik statistik dan matematik.
Salahsatu potensi yang dapat dimanfaatkan pada penerapan data mining di rumah sakit adalah mengidentifikasi atribut-atribut penentu biaya pasien rawat inap. Dengan mengetahui atribut penentu biaya rawat, diharapkan pihak manajemen rumah sakit dapat melakukan kontrol terhadap biaya, sehingga ongkos perawatan pasien dapat ditekan tanpa mengurangi kualitas pelayanan.
Untuk mengidentifikasi atribut penentu biaya pasien rawat inap, digunakan data kunjungan pasien rawat inap RSUP Dr. Cipto Mangunkusumo dengan jaminan Jamkesmas periode 1 Januari 2009 s/d 30 September 2010 dari database SIMRS sebanyak 2022 kunjungan (jumlah sebelum dilakukan data cleaning 8383). Dengan teknik analisa Atttibute Importance (AI) didapatkan atribut-atribut penentu biaya dengan urutan sebagai berikut: prosedur medis 1 (AI=0,16), prosedur medis 4 (AI=0,15), prosedur medis 3 (AI=0,14), LOS (AI=0,13), prosedur medis 2 (AI=0,13), organisasi (AI=0.10), diagnosa utama (AI=0,08), jenis kelamin (AI=0.02) dan status kawin (AI=0.01). Hasil klasifikasi dengan teknik Algoritma Naive Bayes menunjukkan model yang dibuat memiliki predictive confidence sebesar 50,41%.
Ppt singkat Pengantar Statistika kelompok 4Maysy Maysy
Statistika adalah cabang matematika terapan yang mempelajari pengumpulan, penyajian, dan analisis data untuk menarik kesimpulan. Terdiri atas statistika deskriptif untuk mendeskripsikan objek dan statistika inferensial untuk penarikan kesimpulan. Data dibedakan menurut cara memperolehnya menjadi data primer dan sekunder. Diagram sering digunakan untuk penyajian data. Ukuran tengah data meliputi rata-rata, median, dan
Klasifikasi adalah proses menemukan pola yang menjelaskan atau membedakan konsep atau kelas data untuk memprediksi kelas objek baru. Model klasifikasi dibangun dengan melatih algoritma pada data pelatihan untuk memetakan atribut ke label kelas, lalu model diuji keakuratannya pada data uji. Pohon keputusan sering digunakan karena mudah diinterpretasi.
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
Tahapan data mining terdiri dari pembersihan data, integrasi data, transformasi data, teknik data mining, evaluasi pola, dan presentasi pengetahuan. Proses ini bersifat interaktif dengan pengguna untuk menemukan pola dan informasi menarik dari data.
Dokumen ini membahas tiga algoritma utama pencarian data dalam array: sequential search, binary search, dan interpolation search. Sequential search membandingkan data secara berurut dari awal hingga akhir array. Binary search membagi ruang pencarian menjadi setengah pada setiap iterasi. Interpolation search mencari posisi estimasi berikutnya tempat data dicari berada. Dokumen ini juga berisi contoh kode dan penjelasan alur kerja dari ketiga algoritma tersebut.
Kelompok 6 terdiri dari 3 anggota yaitu Aisyah Turidho, Dhiah Masyitoh, dan Tania Tri Septiani. Dokumen ini membahas tentang statistika termasuk pengumpulan data, penyajian data, ukuran pemusatan data seperti mean, modus, median, dan kuartil.
Sistem Ekstraksi Informasi Web Menggunakan Metode Pencarian Pola Otomatis Ber...Sigit Dewanto
Tugas akhir ini membahas sistem ekstraksi informasi web menggunakan metode pencarian pola otomatis berbasis pencocokan pohon. Sistem ini dirancang untuk mengekstrak data terstruktur dari halaman web secara otomatis tanpa pembelajaran manual terlebih dahulu. Sistem ini mengimplementasikan algoritma pencarian pola otomatis berbasis pencocokan pohon untuk mendeteksi pola penyajian data pada halaman web dan mengekstrak datanya.
Dokumen tersebut membahas pengembangan perangkat lunak diagnosa penyakit diabetes melitus tipe 2 berbasis teknik klasifikasi data. Perangkat lunak ini dapat membantu dokter dalam proses diagnosis dengan cara menganalisis data rekam medis pasien untuk menemukan pola dan mengeluarkan rules diagnosis. Algoritma C4.5 digunakan untuk membangun model klasifikasi berupa pohon keputusan yang mampu memprediksi diagnosis penyakit dengan tingkat akurasi 95
Statistik pendidikan membahas konsep statistik dasar, distribusi frekuensi, rata-rata, penyebaran data, korelasi, dan uji hipotesis yang diterapkan dalam bidang pendidikan. Mata kuliah ini bertujuan agar mahasiswa memahami konsep-konsep statistik dan mampu menerapkannya dalam penelitian pendidikan.
Dokumen ini membahas tentang klasifikasi dataset mobil menggunakan metode decision tree di Weka. Dataset mobil diubah formatnya menjadi ARFF dan diklasifikasi menggunakan ID3 dan J48. Hasilnya menunjukkan ID3 memberikan akurasi yang lebih baik dari J48 berdasarkan nilai presisi, recall, dan F-measure.
Algoritma C4.5 digunakan untuk membangun model klasifikasi berbasis pohon keputusan dari sekumpulan data latih. Algoritma ini memilih atribut mana yang paling berguna untuk membedakan kelas target dengan mengukur besarnya pengurangan entropi. Atribut dengan pengurangan entropi terbesar akan menjadi node akar, kemudian proses ini diulang rekursif hingga terbentuk pohon keputusan lengkap. Contoh penerapannya adalah
Lecture 4 Decision Trees (2): Entropy, Information Gain, Gain RatioMarina Santini
attribute selection, constructing decision trees, decision trees, divide and conquer, entropy, gain ratio, information gain, machine leaning, pruning, rules, suprisal
Dokumen tersebut membahas tentang teknik pengolahan dan analisis data. Secara garis besar, dokumen menjelaskan tentang pengertian pengolahan dan analisis data, fungsi dan metode pengolahan serta analisis data, serta langkah-langkah dalam melakukan kedua proses tersebut. Dokumen ini memberikan panduan umum tentang cara mengolah dan menganalisis data secara sistematis dan terstruktur.
Ringkasan dokumen proposal tugas akhir perancangan sistem informasi nilai akademik SMK IPIEMS Surabaya berbasis web adalah sebagai berikut:
Proposal ini membahas perancangan sistem informasi nilai akademik berbasis web untuk mengatasi masalah sistem manual yang ada, dengan tujuan merancang sistem informasi nilai siswa yang mudah diakses dan menghemat waktu. Rancangan sistem akan menganalisis sistem lama, merancang input, output, proses, database dan ant
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...ym.ygrex@comp
Dokumen tersebut membahas tentang penerapan metode clustering dengan algoritma Fuzzy C-Means untuk merekomendasikan mahasiswa memilih bidang keahlian di Program Studi Teknik Informatika berdasarkan nilai mata kuliah prasyarat. Algoritma Fuzzy C-Means digunakan untuk mengelompokkan mahasiswa ke dalam beberapa kluster sesuai kemampuan mereka agar mendapat rekomendasi bidang keahlian yang tepat.
SISTEM INFORMASI AKADEMIK (SIA) SEKOLAH MENENGAH
KEJURUAN (SMK) CENDANA PADANG PANJANG DENGAN
MENGGUNAKAN BAHASA PEMROGRAMAN YANG BERBASISKAN
OBJECT ORIENTED PROGRAMMING (OOP)
Makalah ini membahas tentang peranan statistika dan perkembangannya dalam teknik informatika. Statistika berperan penting dalam pembuatan perangkat lunak, pembuatan website statistik, penggunaan software statistika, survei pasar, penelitian pendidikan, pembangunan nasional, dan berbagai survei bank. Statistika juga berkembang dari ilmu pengumpulan angka menjadi ilmu analisis data untuk pengambilan keputusan.
Artikel ini membahas penggunaan algoritma Apriori dan FP-Growth untuk menganalisis data penjualan laptop berdasarkan merk yang populer di kalangan konsumen di Indocomputer Payakumbuh. Kedua algoritma digunakan untuk menemukan aturan asosiasi dan mengelompokkan data penjualan laptop berdasarkan merk agar dapat digunakan sebagai pertimbangan dalam strategi pemasaran dan persediaan stok laptop."
Teks tersebut merangkum teknik analisis data kualitatif dan kuantitatif. Secara singkat, teknik analisis data kualitatif melibatkan reduksi data, penyajian data, dan penarikan kesimpulan berdasarkan deskripsi, sedangkan teknik kuantitatif melibatkan analisis deskriptif, inferensial, dan diskriminan menggunakan statistik.
Dokumen tersebut membahas tentang tugas statistika pendidikan yang dilakukan oleh kelompok 2. Dokumen tersebut menjelaskan tentang pengukuran data, pengumpulan data, penyajian data, dan pengolahan data dalam suatu penelitian statistika pendidikan.
Analisis data kualitatif melibatkan reduksi data, penyajian data, dan penarikan kesimpulan. Reduksi data meminimalkan dan menyederhanakan data agar lebih mudah dipahami. Penyajian data menyusun data secara sistematis dalam bentuk teks, matriks, grafik atau bagan. Langkah terakhir adalah menarik kesimpulan dan melakukan verifikasi berdasarkan hasil reduksi dan penyajian data.
Teks tersebut membahas tentang pengertian dan jenis-jenis statistika serta langkah-langkah pengolahan data statistik. Statistika dibedakan menjadi statistika deskriptif yang digunakan untuk mendeskripsikan data dan statistika inferensial yang digunakan untuk menganalisis data. Pengolahan data melibatkan penyusunan, klasifikasi, pengolahan, dan interpretasi hasil berdasarkan data yang dikumpulkan.
K-means clustering digunakan untuk mengelompokkan mahasiswa berdasarkan karakteristiknya seperti jurusan dan kota asal. Data mahasiswa dikelompokkan menjadi tiga cluster. Hasil analisis menunjukkan karakteristik masing-masing cluster, seperti cluster 1 didominasi mahasiswa DKI Jakarta dan Jawa Barat jurusan Teknologi Informasi dan Pemasaran, cluster 2 didominasi mahasiswa DKI Jakarta dan Jawa Barat jurusan Akuntansi dan Bisnis Internas
ANALISIS PENGARUH INDUSTRI BATU BARA TERHADAP PENCEMARAN UDARA.pdfnarayafiryal8
Industri batu bara telah menjadi salah satu penyumbang utama pencemaran udara global. Proses ekstraksi batu bara, baik melalui penambangan terbuka maupun penambangan bawah tanah, menghasilkan debu dan gas beracun yang dilepaskan ke atmosfer. Gas-gas tersebut termasuk sulfur dioksida (SO2), nitrogen oksida (NOx), dan partikel-partikel halus (PM2.5) yang berbahaya bagi kesehatan manusia dan lingkungan. Selain itu, pembakaran batu bara di pembangkit listrik dan industri menyebabkan emisi karbon dioksida (CO2), yang merupakan penyebab utama perubahan iklim global dan pemanasan global.
Pencemaran udara yang disebabkan oleh industri batu bara juga memiliki dampak lokal yang signifikan. Di sekitar area penambangan, debu batu bara yang dihasilkan dapat mengganggu kesehatan masyarakat dan ekosistem lokal. Paparan terus-menerus terhadap debu batu bara dapat menyebabkan masalah pernapasan seperti asma dan bronkitis, serta berkontribusi pada penyakit paru-paru yang lebih serius. Selain itu, hujan asam yang disebabkan oleh emisi sulfur dioksida dapat merusak tanaman, air tanah, dan ekosistem sungai, mengancam keberlanjutan lingkungan di sekitar lokasi industri batu bara.
1. Kumpulan Makalah Seminar Semirata 2013
Fakultas MIPA Universitas Lampung
PROSES DATA MINING DALAM MENINGKATKAN
Hal 209
SISTEM PEMBELAJARAN PADA PENDIDIKAN
SEKOLAH MENENGAH PERTAMA
Fatayat1 , Joko Risanto2
FMIPA Matematika - Universitas Riau
E-mail : fatayat79@gmail.com
Abstrak. Dunia Pendidikan memiliki data yang berlimpah dan berkesinambungan
mengenai sistem Pembelajaran dan Pendidikan, siswa yang di bina dan alumni yang
dihasilkan. Hal ini membuka peluang diterapkannya data mining untuk mengolah
Pendidikan lebih baik. Kumpulan dari data tersebut dapat diproses lebih lanjut dengan
data mining, untuk memperoleh pola baru yang dapat digunakan untuk meningkatkan
efektifitas dalam proses pembelajaran, semua data yang dikelola pada bagian
Administrasi merupakan sebuah sumber informasi yang bisa diekstrak kembali untuk
mendapatkan suatu pengetahuan yang bisa digunakan untuk meningkatkan mutu dunia
Pendidikan pada umumnya dan disekolah khususnya. Metode yang digunakan dalam
penelitian ini adalah menggunakan metode Decision Tree. Dalam proses pembelajaran
selama jangka waktu tertentu, maka akan terkumpul sejumlah data yang bisa dikelola
disekolah untuk proses data mining .
Kata Kunci : Data Mining, sistem pembelajaran pada Pendidikan Sekolah menengah
Pertama
PENDAHULUAN
Dalam proses pembelajaran selama
jangka waktu tertentu, maka akan
terkumpul sejumlah besar data. Kumpulan
data tersebut dapat diproses lebih lanjut
dengan data mining untuk memperoleh
pola baru yang dapat digunakan untuk
meningkatkan efektifitas dalam proses
pembelajaran.. Hal ini tentu saja sangat
berpengaruh pada peningkatan mutu
siswa yang dihasilkan oleh sekolah, dan
pada sekala yang lebih besar lagi akan
meningkatkan kecerdasan dan intelektual
bangsa. Aspek-aspek yang bisa digunakan
untuk data mining adalah latar belakang
siswa antara lain, Pekerjaan orang tua,
pendidikan orang tua, lingkungan tempat
tinggal,jarak tempat tinggal, jumlah
saudara, nilai siswa dan lain-lain. Hal
tersebuat bisa dijadikan sebagai suatu
kelompok data yang bisa diolah dan
diekstrak kembali untuk mendapat suatu
informasi tersembunyi dengan algoritma
data mining.
Banyak data yang bisa dikelola
disekolah untuk proses data mining maka
diperlukan batasan masalah agar
penelitian ini bisa lebih terfokus dan tidak
mengambang, adapun yang menjadi
pembatasan masalah adalah proses nilai-nilai
siswa yang meliputi nilai kognitif,
psikomotorik, afektif, kehadiran dan
remedi. Data-data yang diambil dari nilai
siswa yang ada disekolah yang diambil
dari beberapa kelas dan metode yang
digunakan adalah Decision Tree.
Data Mining
Data mining mengacu pada proses
untuk menambang (mining) pengetahuan
dari sekumpulan data yang sangat besat [
Jiawei, 2001]. Sebenarnya data mining
merupakan suatu langkah dalam
knowlegde discovery in database (KDD).
Knowledge discovery sebagai suatu
proses terdidri atas pembersihan data
(data cleaning), integrasi data ( data
integration), pemilihan data ( data
selection ), transformasi data (data
2. FatayatDan Joko Risanto: Proses Data Mining Dalam Meningkatkan Sistem
Pembelajaran Pada Pendidikan Sekolah Menengah Pertama
transformation), data mining,evaluasi pola
(pattern evaluation) dan penyajian
pengetahuan (knowledge presentation).
Kerangka proses data mining yang akan
dibahas tersusun atas tiga tahapan, yaitu
pengumpulan data (data collection),
transformasi data (data
transformation),dan analisis data (data
analysis) [ Nilakant].
Proses tersebut diwakili dengan
preprocessing yang terdidri atas
pengumpulan data untuk menghasilkan
data mentah (raw data) yang dibutuhkan
oleh data mining, yang kemudian
dilanjutkan dengan transformasi data
untuk mengubah data mentah menjadi
format yang dapat diproses oleh data
mining, misalnya melalui filtrasi atau
agregasi. Hasil transformasi data akan
digunakan oleh analisis data untuk
membangkitkan pengetahuan dengan
menggunakan teknik seperti analisis
statistik, machine learning, dan visualisasi
informasi seperti terlihat pada gambar 2.1
Pohon Keputusan
Gambar 2.2 Pohon keputusan adalah
model prediksi menggunakan struktur
pohon atau struktur berhirarki. Contoh
dari pohon keputusan dapat dilihat di
Gambar 2.2. Disini setiap percabangan
menyatakan kondisi yang harus dipenuhi
dan tiap ujung pohon menyatakan kelas
data. Contoh di Gambar 2.2 adalah
identifikasi pembeli komputer, dari pohon
keputusan tersebut diketahui bahwa salah
satu kelompok yang potensial membeli
komputer adalah orang yang berusia
dibawah 30 tahun dan juga pelajar.
Hal 210
Gambar 2.2 Pohon Keputusan
Pohon keputusan merupakan metode
klasifikasi metode klasifikasi dan prediksi
yang sangat kuwat dan terkenal. Metode
pohon keputusan mengubah fakta yang
sangat besar menjadi pohon keputusan
yang mempersentasikan aturan. Pohon
keputusan juga berguna untuk
mengeksplorasi data, menemukan
hubungan tersembunyi antara jumlah
calon variabel input dengan variabel
target. Pohon keputusan adalah sebuah
struktur yang dapat digunakan untuk
membagi kumpulan data yang besar
menjadi himpunan-himpunan record yang
lebih kecil dengan menerapkan
serangkaian aturan keputusan. Dengan
masing-masing rangkaian pembagian,
anggota himpunan hasil mirip satu dengan
yang lain ( Berry dan Linoff, 2004)
METODE PENELITIAN
Salah satu Algoritma induksi
keputusan yaitu ID3 (Iterative
Dichotomister 3). ID3 dikembangkan oleh
J. Ross Quinlan. Dalam prosedur
algoritma ID3, input berupa sampel
training, label training dan atribut.
Algoritma C4.5 merupakan
perkembangan dari ID3. Sedangkan pada
perangkat lunak open source WEKA
mempunyai versi sendiri C4.5 yang
dikenal sebagai J48.
Pohon dibangun dengan cara membagi
data secara rekursif hingga tiap bagian
terdiri dari data yang berasal dari kelas
yang sama. Bentuk pemecahan (split)
3. Kumpulan Makalah Seminar Semirata 2013
Fakultas MIPA Universitas Lampung
Hal 211
yang digunakan untuk membagi data
tergantung dari jenis atribut yang
digunakan dalam split. Algoritma C4.5
dapat menangani data numerik (kontinyu)
dan diskret. Split untuk atribut numerik
yaitu mengurutkan contoh berdasarkan
atribut kontiyu A, kemudian membentuk
minimum permulaan (threshold) M dari
contoh-contoh yang ada dari kelas
mayoritas pada setiap partisi yang
bersebelahan, lalu menggabungkan
partisi-partisi yang bersebelahan tersebut
dengan kelas mayoritas yang sama. Split
untuk atribut disket A mempunyai bentuk
value
ε X dimana X ⊂ domain(A).
Untuk melakukan pemisahan obyek
(split) dilakukan tes terhadap atribut
dengan mengukur tingkat ketidakmurnian
pada sebuah simpul (node). Pada
algoritma C4.5 menggunakan rasio
perolehan (gain ratio). Sebelum
menghitung rasio perolehan, perlu
menghitung dulu nilai informasi dalam
satuan bits dari suatu kumpulan objek.
Cara menghitungnya dilakukan dengan
menggunakan konsep entropi
E (S) = -P+ log2 P+ - P-log2 P-S
adalah ruang (data) sampel yang
digunakan untuk pelatihan, p+ adalah
jumlah yang bersolusi positif atau
mendukung pada data sampel untuk
kriteria tertentu dan p- adalah jumlah
yang bersolusi negatif atau tidak
mendukung pada data sampel untuk
kriteria tertentu. Entropi(S) sama dengan
0, jika sama contoh pada S berada dalam
kelas yamg sama. Entropi(S) sama dengan
1, jika jumlah contoh positf sama negative
dalam S tidak sama [Mitchell,1997].
Entropi split yang membagi S dengan n
record memjadi himpunan-himpunan S1
dengan n l baris dan S2 dengan n2 baris
adalah :
Entropi split yang membagi S dengan n
record memjadi himpunan-himpunan S1
dengan n l baris dan S2 dengan n2 baris
adalah :
Kemudian menghitung perolehan
informasi dari output data atau variabel
dependent y yang dikelompokkan
berdasarkan atribut A, dinotasikan dengan
gain (S,A). Perolehan informasi, gain
(S,A), dari atribut A relative terhadap
output data S adalah:
Dengan:
S :Himpunan Kasus
A :Atribut
n :Jumlah partisi atribut A
IsiI :Jumlah kasus pada partisi ke i
ISI :Jumlah kasus dalam S
Nilai (A) adalah semua nilai yang
mungkin dari atribut A, dan Si adalah
subset dari S dimana A mempunyai nilai
i. Term pertama dalam persamaan diatas
adalah entropy total S dan term kedua
adalah entropy sesudah dilakukan
pemisahan data berdasarkan atribut A.
Untuk menghitung rasio perolehan perlu
diketahui suatu term baru yang disebut
pemisahan informasi (Split
Info).Pemisahan info dihitung dengan
cara:
Bahwa S1 sampai Sc adalah n subset
yang dihasilkan dari pemecahan S dengan
menggunakan atribut A yang mempunyai
sebanyak n nilai. Selanjutnya rasio
perolehan (gaain ratio) dihitung dengan
cara:
Metode Penelitian
Dalam penelitian ini digunakan data
hasil evaluasi Siswa,sofware WEKA,Nilai
Kognitif, Nilai Psikomotorik,N ilai
Afektif, Kehadiran dan Remedi.
Bahan/Materi Penelitian
Buku textbook yang terkait dengan
analisa dan perancangan dengan
mengunakan software weka dan Buku
4. FatayatDan Joko Risanto: Proses Data Mining Dalam Meningkatkan Sistem
Pembelajaran Pada Pendidikan Sekolah Menengah Pertama
manual tool yang digunakan dalam
pengembangan perangkat lunak.sistem
data mining yang mengumpulkan semua
data hasil evaluasi belajar siswa dan di
ekstrak
Uji Coba
Penelitian dan pengujian yang
dilakukan pada metode sarana pendukung
yaitu berupa peralatan yang sangat
berperan dalam menunjang penggunaan
aplikasi dalam mengolah data. Pengujian
apalikasi ada dua, yaitu lingkungan
perangkat keras komputer dn perangkat
lunak komputer.
Hardware:
1. Laptop Tosiba Intel Pentium –
Hal 212
Core Processor T3400.
2. Harddisk 160 GB.
3. Memori 512 MB DDR2
Software:
1. Microsoft Excel 2007.
2. WEKA
3. Sistem Operasi Windows XP
ProfesionalService Pack 2.
HASIL DAN PEMBAHASAN
Hasil Pengujian Metode Algoritma
a. Decision Tree
Data awal yang digunakan pada tahap
pengujian dengan menggunakan aplikasi
WEKA disimpan dalam file Microsoft
Excel simpan dengan format CVS (
Comman Separated Value),kemudian
buka di Notepad, kemudian ambil
Replace pada menu edit, ganti titik koma
dengan koma lalu tekan Replace All dan
kemudian simpan fail tersebut.
Data Hasil Evaluasi
DATA HASIL EVALUASI SISWA
NAMA KOGNITIF PSIKOMOTORIK AFEKTIF KEHADIRAN REMEDI NAIK
Andi Firmasari 43 47 Baik Kurang Hadir Tidak
Budi Setiawan 53 90 Baik Kurang Hadir Tidak
Cicilia Dewita 63 40 Buruk Kurang Tidak Tidak
Diky Ramadan 86 69 Baik Kurang Tidak Tidak
Fatmawati 40 62 Buruk Sedang Hadir Ya
Linda 51 52 Baik Sedang Hadir Ya
Mawar Rianai 66 44 Baik Sedang Hadir Tidak
Rini Angraini 73 58 Baik Kurang Hadir Ya
Yosi Amoliya 77 64 Buruk Kurang Tidak Ya
Asril 78 87 Baik Sedang Tidak Ya
Analisa Data Mining Metode C$.5
Sistem yang dirancang adalah untuk
menentukan kenaikan siswa ketingkat
yang lebih tinggi. Data awal baik
numberik atau non numberik akan dibagi
perkelas supaya memudahkan dalam
proses analisa selanjutnya. Setelah semua
data yang akan dimasukan dibagi
perkelas, maka akan dilakukan proses
klasifikasi untuk kenaikan siswa dengan
membuat sebuah pohon keputusan untuk
menghasilkan output.
Proses pengambilan keputusan dalam
klasifikasi kenaikan siswa dibagi menjadi
beberapa kriteria penilaian yaitu:
1. Nilai Kognitif
2. Nilai Psikomotorik
3. Nilai Efektif
4. Kehadiran
5. Remedi
Melakukan Pra-Proses
Dari tabel Diagram Alir Data Level 1
kita bisa mengetahui bahwa data-data
yang akan dijadikan sebagai input untuk
proses adalah Nilai Kognitif, Nilai
Psikomotorik, nilai Afektif, Kehadiran
dan Remedi. Setelah data dalam format
diatas, kemudian dilakukan pra- proses
mengelompokkan data-data kedalam klas
(K) dengan Stugers ( DRs.Riduwan
M.B.A) dengan menggunkan rumus.
Jumlah Kelas ( K) = 1+ 3.3 log n
Dimana : n = Jumlah data
K = 1 + 3.3 log (50)
K= 1 + 3.3 (1,69897)
K= 1 + 5.606601
5. Kumpulan Makalah Seminar Semirata 2013
Fakultas MIPA Universitas Lampung
Hal 213
K= 6.606601
Dengan jumlah data 50 kelas yang
didapat 7 kelas, tapi yang memakai 7
kelas ini adalah data-data yang berupa
nilai angka yaitu nilai Kognitif, nilai
Psikometrik. Nilai-nilai tersebut
dikelompokkan berdasarkan atribut
sebagai berikut:
Mengelompokan Nilai Kognitif
Mengelompokkan Nilai Kognitif,
pengelomokan nilai berdasarkan dari hasil
ujian yang didapat oleh siswa. Dan nilai
tersebut dikelompokkan kedalam 7 kelas
pada Tabel 1.1
Tabel 1.1 Klasifikasi Nilai Kognitif
Nilai Kongnitif Klasifikasi
0-13 1
14-27 2
28-41 3
42-55 4
56-79 5
80-93 6
>94 7
Tabel 1.2 Klasifikasi Nilai Psikomotorik
Nilai Psikomotorik Klasifikasi
0-13 1
14-27 2
28-41 3
42-55 4
56-79 5
80-93 6
>94 7
Mengelompokan nilai Psikomotorik
berdasarkan hasil ujian Praktek atau pun
karya yang dibuat dan nilai tersebut
dikelompokan kedalam 7 kelas seperti
terlihat pada tabel 1.2
Mengelompokan Nilai efektif
berdasarkan tingkah laku, kesopanan,
kerajinan, dan lain-lain. Nilai efektif
tersebut dikelompokan kedalam 3 kelas
seperti terlihat pada Tabel 1.3
Tabel 1.3 Klasifikasi Nilai Afektif
NilEfektif
Baik
Cukup
Buruk
Mengelompokan Nilai kehadiran
berdasarkan persentase kehadiran siswa.
Nilai kehadiran tersebut dikelompokan
kedalam 3 kelas seperti terlihat pada tabel
1.4
Tabel 1.4 Klasifikasi Nilai kehadiran
Kehadiran
Tinggi
Sedang
Kurang
Mengelompokan Nilai Remedi atau
nilai perbaikan berdasarkan hadir tidak
hadirnya siswa pada saat remedi . Nilai
remedi tersebut dikelompokan kedalam 2
kelas seperti terlihat pada Tabel 1.5
Tabel 1.5 Klasifikasi Nilai Remedi
Nilai Remedi
Hadir
Tidak Hadir
Mengelompokan atribut Kenaikan
berdasarkan atribut-atribut sebelumnya
yang berfungsi sebagai input . Kenaikan
merupakan atribut tujuan yang dihasilkan
dari proses klasifikasi. Kenaikan
dikelompokan kedalam 2 kelas seperti
terlihat pada Tabel 1.6
Tabel 1.6 Klasifikasi Nilai Remedi
Nilai Kenaikan
Ya
Tidak
Tabel 1.7 Format data akhir setelah dilakukan pra-proses
Kognitif Psikomotorik Afektif Kehadiran Remedi Kenaikan
3 5 Baik Kurang Hadir Tidak
3 5 Baik Kurang Tidak Tidak
3 5 Baik Kurang Tidak Tidak
4 4 Baik Tinggi Hadir Ya
4 6 Baik Tinggi Hadir Ya
4 6 Baik Tinggi Hadir Ya
4 4 Baik Sedang Hadir Ya
4 5 Baik Sedang Hadir Ya
4 5 Baik Sedang Hadir Ya
4 7 Baik Sedang Hadir Ya
6. FatayatDan Joko Risanto: Proses Data Mining Dalam Meningkatkan Sistem
Pembelajaran Pada Pendidikan Sekolah Menengah Pertama
Pohon Keputusan
Dari format data akhir kenaikan siswa
maka akan dilakukan klasifikasi data
algoritma C4.5 dengan membuat pohon
keputusan. Seperti yang telah dijelaskan
sebelumnya, algoritma C4.5 untuk
membangun pohon keputusan adalah
sebagai berikut;
1. Pilih atribut sebagai akar.
2. Buat cabang untuk tiap-tiap nilai.
3. Bagi kasus dalam cabang.
Ulangi proses untuk setiap cabang
sampai semau kasus pada cabang
memeiliki kelas yang sama.Dalam kasus
yang tertera pada tabel diatas, akan dibuat
pohon keputusan untuk menentukan
klsaifikasi kenaikan sisiwa baru (ya dan
tidak) dengan melihat Nilai Kognitif,
Nilai Psikometrik, Nilai Efektif,
Kehadiran dan kenaikan.Untuk memilih
atribut sebagai akar, didasarkan pada nilai
Gain tertinggi dari atribut-atribut yang
ada. Untuk menghitung Gain digunakan
rumus.
Perhitungan Gain dan Entrophy
Keterangan :
S : Himpunan Kasus
A : Atribut
N : Jumlah partisi atribut A
ISiI : Jumlah kasus pada partisi ke-i
ISI : Jumlah kasus dalam S
Sedangkan untuk menghitung nilai
entrophy dapat dilihat pada rumus
Hal 214
Dengan menggunakan data dua
persamaan diatas maka akan didapatkan
entrophy dan Gain yang digunakan
sebagai akar dalam membuat pohon
keputusan.
Menghitung jumlah kasus, jumlah
k sus untuk keputus n “Y ”, juml h
kasus untk keputus n “Tid k”, d n k sus
yang dibagi berdasarkan atribut Nilai
Kognitif, Nilai Psikomotorik, Nilai
Afektif, Kehadiran dan Kenaikan. Setelah
itu, lakukan perhitungan Gain untuk
setiap atribut.
Perhitungan Node
Dengan menghitung nilai entrophy dari
atribut yang tersisa setelah dihitung
entrophy, kemudian menghitung Gain
untuk tiap-tiap atribut.
Nilai Entrophy Total
Merupakan Nilai Entrophy yang
mewakili dari seluruh jumlah total
Variabel atribut yang ada. Dengan
Rumus:
= ( 7 X log2 ( 7 )) + ( 3 log2(3 ))
10 10 10 10
= 0,881290899
Tabel 1.8 Tabel Hasil Perhitungan
KENAIKAN
Atribut Jumlah Ya Tidak Entrophy Gain Total
Kognitif
1 0 0 0 0 0,78419584
2 0 0 0 0
3 0 0 0 0
4 5 3 2 0,970950594
5 1 1 0 0
6 1 0 1 0
7 3 3 0 0
Psikomotorik
1 0 0 0 0
2 0 0 0 0
7. Kumpulan Makalah Seminar Semirata 2013
Fakultas MIPA Universitas Lampung
Hal 215
3 1 1 0 0
4 8 6 2 0,8112778124
5 0 0 0 0
6 0 0 0 0
7 1 0 1 0
Afektif
Baik 6 4 2 0,918295834 0,706193149
Cukup 4 3 1 0,811278124
Kehadiran
Tinggi 7 7 0 0
Sedang 3 0 3 0
Remedi
Hadir 0 0 0 0 0,705032719
Tidak Hadir 10 7 3 0,881290899
Total 10 7 3 0,881290899
Dari tabel di atas dapat kita ketahui
bahwa atribut yang memiliki Gain paling
besar adalah atribut Kognitif, yaitu
sebesar 0,78419584. Dengan demikian,
atribut Kognitifi bisa menjadi node 4. Ada
3 atribut dari Kognetif yaitu: 5,6,7 Atribut
5 dan 7 sudah mengklasifikasikan kasus
menjadi 1 dengan keputusan Tidak naik,
sedangkan 6 sudah mengklasifikasikan
kasus menjadi 1 dengan keputusan Naik
sehingga tidak perlu dilakukan
perhitungan lebih lanjut, tetapi untuk nilai
atribut lain masih perlu dilakukan
perhitungan lain. Dari hasil perhitungan
tersebut dapat digambarkan pohon
keputusan sementara tampak pada gambar
2.3
KESIMPULAN
Dari penelitian yang penulis lakukan
dapat disimpulkan bahwa proses yang
dilakukan secara manual dapat juga
memberikan keputusan yang diharapkan,
tetapi dengan rentang waktu yang lebih
lama dalam proses penggalian
informasinya dan kapasitas data yang bisa
dihitung sangat kecil. Dengan
menggunakan metode algoritma
Decision Tree dengan bantuan software
WEKA proses pengalian informasi bisa
lebih cepat dan bisa dengan kapasitas data
yang besar dan pengambilan keputusan
lebih optimal dan kesalahan dalam
mengambil keputusan dapat dioptimalkan.
DAFTAR PUSTAKA
H n Ji wei “ D t Minig Concept nd
Technique‟, Presnt tion
http://www.ilmukomputer.com
Iko Pramudiono. 2003. Pengantar Data
Mining : Menambang Permata
Pengetahuan di Gunung Data.
www.ilmukomputer.com
Kusri & Emh T ufq Luthfi (2009), “
Algoritm D t Mining”,
Andi Yogyakarta, Yogyakarta
Kadarsiah Suryadi, DR dan Ali Ramdhani
, M.t, “ Sistem pendukung keputus n”,
PT Remaja Rosdakarya, Bandung,
2002
Sani Susanto, Ph.D dan Dedy Suryadi, S,
T, M.S (2010), “Peng nt r D t
Mining”, Andi Yog k rt .