Decision tree digunakan untuk mengubah data menjadi pohon keputusan dan aturan keputusan. Metode ini sering diterapkan untuk diagnosa penyakit, pemilihan produk, pegawai teladan, dan deteksi gangguan komputer. Data disajikan dalam tabel dengan atribut dan contoh. Salah satu atribut adalah target. Pohon dibangun dengan memilih node awal berdasarkan entropy terendah. Pohon kemudian diubah menjadi aturan dan disederhanakan.
2. KONSEP DECISION TREE
Mengubah data menjadi pohon keputusan (decision
tree) dan aturan-aturan keputusan.
DATA
DECISION
TREE RULE
3. CONTOH PENGGUNAAN DECISION
TREE
Diagnosa penyakit: hipertensi, kanker, stroke dll.
Pemilihan produk: kendaraan, komputer dll
Pemilihan pegawai teladan atau mahasiswa
berprestasi.
Deteksi gangguan pada komputer
Dan lain sebagainya
4. KONSEP DATA DECISION TREE
Data dinyatakan dalam betuk tabel dengan atribut dan
record.
Atribut menyatakan suatu parameter yang dibuat
sebagai kriteria dalam pembentukan tree.
Salah satu atribut merupakan atribut yang
menyatakan data solusi per item data yang disebut
target atribut.
Atribut memiliki nilai-nilai yang dinamakan dengan
instance.
5. KONSEP DATA DECISION TREE
Nama Cuaca Angin Temperatur Main
Ali Cerah Keras Panas Tidak
Budi Cerah Lambat Panas Ya
Heri Berawan Keras Sedang Tidak
Irma Hujan Keras Dingin Tidak
Diman Cerah Lambat Dingin Ya
Sample/
Identity
Atribut Target
Atribut
6. PROSES DALAM DECISION TREE
Mengubah data (tabel) menjadi tree
Mengubah tree menjadi rule
Menyederhanakan Rule (Pruning)
8. Entropy
S adalah ruang (data) sample yang digunakan untuk
training.
P+ adalah jumlah yang bersolusi positif (mendukung)
pada data sample untuk kriteria tertentu.
P- adalah jumlah yang bersolusi negatif (tidak
mendukung) pada sata sample untuk kriteria tertentu.
Besarnya nilai Entropy pada ruang sample (S)
diddefinisikan dengan:
Entropy(S) = (-P+ log2 P+) – (P- log2 P-)
11. CONTOH KASUS:
Penentuan penderita hipertensi menggunakan
Decision Tree.
Data terdiri dari 8 sampel, dengan asumsi faktor yang
mempengaruhi seseorang menderita hipertensi
berdasarkan usia, berat badan dan jenis kelamin.
Kategori (instance):
usia: muda dan tua
berat: underweight, average, overweight
kelamin: pria dan wanita
12. Langkah mengubah data menjadi tree:
Menentukan node terpilih
Menyusun tree
13. Menentukan Node terpilih
Mencari nilai entropy dari setiap kriteria dengan data
sample yang ditentukan
Node terpilih adalah kriteria dengan nilai entropy
terkecil
18. Penyusunan Tree
Leaf node usia dan kelamin
memiliki entropy yang sama, tisak
ada cara lain selain menggunakan
pengetahuan pakar atau memilih
pada hasil acak
22. Menyederhanakan dan Menguji
Rule
Membuat table distribusi terpadu dengan menyatakan
semua nilai kejadian pada setiap rule.
Menghitung tingkat independensi antara kriteria pada
suatu rule, yaitu antara atribut dan target atribut.
Mengeliminasi kriteria yang tidak perlu, yaitu yang
tingkat independensinya tinggi.