ESTIMASI BIAYA PEMELIHARAAN BANGUNAN BERDASARKAN PEDOMAN PEMELIHARAAN DAN.pptx
Jurnal biaya pasien rawat inap penyakit jantung
1. KLASIFIKASI BIAYA PASIEN RAWAT INAP PENYAKIT JANTUNG MENGGUNAKAN
TEKNIK DATA MINING ATTRIBUTE IMPORTANCE (AI) DAN ALGORITMA NAIVE BAYES
Andi Murtanto
Email : andymurtanto@gmail.com
Abstrak
Sistem Informasi Manajemen Rumah Sakit (SIMRS) secara umum telah digunakan oleh para staf
rumah sakit untuk mendukung operasional sehari-hari. Sebagian besar informasi yang didapat pada
operasional SIMRS berasal dari pengolahan transactional database. Sedangkan untuk mendukung pengambilan
keputusan ditingkat manajerial, diperlukan akses ke database dalam ukuran besar dan dimensi yang lebih
kompleks, sehingga diperlukan teknik data mining. Pendekatan data mining biasa dilakukan untuk menggali
informasi, pengetahuan, pola-pola baru dan tren dengan menganalisis database dalam ukuran besar,
menggunakan teknologi pengenalan pola, teknik statistik dan matematik. Salah satu potensi yang dapat
dimanfaatkan pada penerapan data mining di rumah sakit adalah mengidentifikasi atribut-atribut penentu biaya
pasien rawat inap penyakit jantung. Dengan mengetahui atribut penentu biaya rawat, diharapkan pihak
manajemen rumah sakit dapat melakukan kontrol terhadap biaya, sehingga ongkos perawatan pasien
dapat ditekan tanpa mengurangi kualitas pelayanan. Untuk mengidentifikasi atributpenentu biaya pasien
rawat inap, digunakan data kunjungan pasien rawat inap RSUP Abu Nawas dengan jaminan Jamkesmas
periode 1 Januari 2012 s/d 30 September 2013 dari database SIMRS sebanyak 40 kunjungan (jumlah sebelum
dilakukan data cleaning 102). Dengan teknik analisa Atttibute Importance (AI) didapatkan atribut-atribut
penentu biaya dengan urutan sebagai berikut: pasien (A1), penyakit (A2), tipe_kelas (A3).
Keyword : penyakit jantung, biaya rawat inap
I. Pendahuluan
Perkembangan teknologi informasi yang
pesat terutama disektor kesehatan memungkinkan
data dalam jumlah besar terakumulasi dengan
cepat. Saat ini berbagai rumah sakit sudah mulai
menerapkan sistem informasi rumah sakit
berbasis computer untuk mendukung manajemen
keuangan (khususnya billing systems) [1]. Untuk
rumah sakit yang sudah mapan sistem
informasinya bahkan mulai memperluas
kebutuhannya untuk membangun sistem
informasi klinik.
Pertumbuhan yang pesat dari akumulasi
data itu telah menciptakan kondisi yang sering
disebut sebagai “rich of data but poor of
knowledge”, karena data yang terkumpul itu
hanya digunakan untuk kebutuhan operasional
saja, bahkan tidak jarang kumpulan data itu
dibiarkan begitu saja seakan-akan menjadi
“kuburan data” (data tombs).
Untuk melakukan analisa data dalam jumlah
besar yang tersimpan pada database, biasanya
digunakan teknik data mining. Meski telah
umum digunakan pada industri keuangan dan
telekomunikasi, teknik data mining mulai
diterapkan secara intensif di sektor kesehatan.
Sebagai contoh, Mayo Clinic bekerja sama
dengan IBM menerapkan teknik data mining
pada pasien dengan kesamaan jenis kelamin, usia
dan riwayat kesehatan untuk mengetahui respon
terhadap pengobatan tertentu .[2]
Menurut Friedman[3] ada beberapa definisi
dari data mining. Dikumpulkan dari berbagai
literatur data mining antara lain sebagai berikut:
Data mining adalah proses ekstraksi
sebelumnya tidak dikenal dan dipahami dari
data base berukuran besar dan digunakan untuk
membuat keputusan bisnis yang penting. -
Zekulin.
Data mining adalah serangkaian metode yang
digunakan dalam proses penemuan
pengetahuan untuk membedakan yang
sebelumnya tidak diketahui baik hubungan dan
pola dalam data. - Ferruzza.
Data mining adalah proses pendukung
keputusan yang digali dari basis data
berukuran besaruntuk mengetahui pola yang
tidak diketahui dan tak terduga sebelumnya
pada data. – Parsaye.
2. Potensi data mining dalam bidang kesehatan
sudah diakui secara luas. Banyak studi yang
diakukan menggunakan teknik data mining
modern, antara lain classification dan predictive
yang diterapkan pada rekam medis elektronis.
Beberapa dari studi tersebut antara lainadalah
sebagai berikut:
Teknik Classification Naïve Bayes yang
diterapkan untuk masalah seleksi embrio [4]
Teknik Decision Tree untuk
mengembangkan dan memvalidasi ukuran
resiko stratifikasi mortalitas di rumah sakit
karena dekomposisi akut gagal jantung
(ADHF) [5]
Neural Network untuk memprediksi pasien
tertentu yang akan mengalami kegagalan
dialysis peritoneal [6]
Support Vector Machines (SVM) untuk
memprediksi sumber pendarahan dan
mengidentifikasi kohort pada pasien dengan
pendarahan akut gastrointestinal (GIB) yang
memerlukan intervensi mendesak, termasuk
endoskopi [7]
Association digunakan untuk
mengkonfirmasi aturan yang akan
digunakan oleh sistem pakar yang
membantu dalam diagnosis penyakit
jantung dan untuk menemukan aturan-
aturan baru untuk memperkaya pengetahuan
sistem pakar [8]
Text Mininguntuk mengidentifikasi luka
yang terkait dengan luka jatuh pada orang
tua [9]
Penggunan data miningdiharapkan dapat
membantu para pengambil keputusan
mendapatkan informasi yang lebih akurat dan
bermakna sebagai salah satu sarana untuk
meningkatkan pelayanan kesehatan kepada
masyarakat.
II. Bahan dan Data
2.1 Proses data mining
Pada bagian ini akan dijelaskan proses data
mining yang terdiri dari beberapa tahap yang
diilustrasikan digambar 1[10]:
1.Pembersihan data (data cleaning), untuk
membersihkan noise dan data yang tidak
konsisten. Dalam kasus ini membersihkan
data – data pasien yang sudah dihapusdan
identitas yang tidak lengkap (misal: umur,
status marital, pendidikan, diagnosa, dan
sebagainya);
2. Integrasi data, penggabungan data dari
berbagai sumber;
3. Transformasi data, data diubah menjadi
bentuk yang sesuai untuk dimining;
4. Aplikasi teknik data mining, proses inti
dimana teknik data mining diterapkan
untuk mengekstrak pola - pola tertentu
pada data;
5. Evaluasi pola yang ditemukan;
6. Presentasi pengetahuan, menggunakan
teknik visualisasi untuk menampilkan
hasil data mining kepada pengguna
(user).
Gambar1.Tahapan dalam proses data
mining
2.2 Data
Untuk mengidentifikasi atribut -
atribut penentubiaya pasien rawat inap,
digunakan data kunjungan pasien rawat
inap RSUP Abu Nawas dengan jaminan
Jamkesmas periode 1 Januari 2012 s/d 30
September 2013 yang diambil dari
database SIMRS sebanyak 102
kunjungan pasien. Setelah dilakukan data
cleaning, didapatkan 40 kunjungan pasien
yang layak untuk dianalisa.
III. Metode
Attribute Importance (AI) member peringkat
atribut dengan menghilangkan atribut yang
berulang,tidak relevan,atau tidak informative dan
mengidentifika siatribut yang mungkin memiliki
pengaruh yang paling tinggi dalam membuat
prediksi.
3. Gambar 2. Ilustrasi Atrribut Importance
AI menggunakan algoritma Minimum
Description Length (MDL). Algoritma MDL
mempertimbangkan setiap atribut sebagai
model prediktif sederhana dari kelas target.
Teknik AI digunakan untuk
mengoptimalkan analisa model classification
dengan mengurangi atribut yang digunakan dan
akan meningkatkan kecepatan dan akurasi saat
membangun model.
3.1. Naive Bayes Algoritma (Classification)
Classifikasi adalah proses untuk
menentukan model atau fungsi yang
menjelaskan atau membedakan konsep atau
kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang
labelnya tidak diketahui. Model itu sendiri bisa
berupa aturan “jika - maka”. Dalam teknik
classifikasi terdapat beberapa algoritma yang
bisa digunakan antara lain decision tree, naive
bayes, adaptive naive bayes, logistitic
reggression dan support vektor machine.
Bayesian Classification didasarkan pada
Teorema Bayesian. Konsep dasar teori bayes
itu pada dasarnya adalah peluang bersyarat P
(H/X). Dimana dalam Bayesian H adalah
posterior dan X adalah prior. Priora dalah
pengetahuan kita tentang kara kteristik suatu
parameter (bias dibaca sebagai pengalaman di
masa lalu atas suatu parameter atau juga bias
berdasarkan teori), sedangkan posterior adalah
karakteristik yang akan kita duga pada
kejadian yang akan datang.
Teorema Bayesian berguna untuk
melakukan kalkulasi probabilitas posterior,
P(H|X), dari P(H), P(X) dan P(X|H). Teori
Bayes adalah sebagai berikut:
P(H|X)=P(X|H)+P(H)
Dimana :
X : Data dengan class yang belum
diketahui
H : Hipotesis data X merupakan
suatu class spesifik
P(H/X) : Probabilitas hipotesis H
berdasar kondisi X (prosterior
probability)
P(H) : Probabilitas hipotesis H (prior
Probabitity)
P(X/H) : Probabititas X berdasarkan
kondisi pada hipotesis H
P(X) : Probabilitas X
Rumus diatas dapat dituliskan juga sebagai
berikut :
Posterior = prior + evidance
Nilai Evidence selalu tetap untuk setiap
kelas pada satu sampel. Nilai dari posterior
tersebut nantinya akan dibandingkan dengan nilai
nilai posterior kelas lainnya untuk menentukan
ke kelas apa suatu sampel akan diklasifikasikan.
Adapun alur dari metode Naive Bayes adalah
sebagai berikut :
1. Baca data training
2. Hitung Jumlah dan probabilitas, namun apabila
datanumerik maka:
a. Cari nilai mean dan standar deviasi dari
masing masing parameter yang merupakan
datanumerik.
b. Cari nilai probabilistik dengan cara
menghitung jumlah data yang sesuai dari
kategori yang sama dibagi dengan jumlah
data pada kategori tersebut
3. Mendapatkan nilai dalam tabel mean, standart
deviasi dan probabilitas
Proses classification biasanya dibagi
menjadi dua fase: learning dan test. Pada fase
learning, sebagian data yang telah diketahui kelas
datanya diumpankan untuk membentuk model
perkiraan. Kemudian pada fase test model yang
sudah terbentuk diuji dengan sebagian data
lainnya untuk mengetahui akurasi dari model
tersebut. Bila akurasinya mencukupi model ini
dapat dipakai untuk prediksi kelas data yang
belum diketahui.[10]
Gambar 3. Ilustrasi pemodelan teknik Classification
untuk mengukur akurasi
4. 3.2. Data Scoring
Setelah model dibuat dengan aplikasi data
mining, model tersebut bisa digunakan untuk
membuat prediksi dari data baru yang dalam
hal ini diterapkan untuk memprediksi pola
biaya data pasien rawat inap penyakit jantung.
Model biasanya dibuat dengan menggunakan
data historis dari kunjungan pasien
sebelumnya. Proses secara umum
diilustrasikan sebagai berikut :
a. Ilustrasi Pembuatan Model
Gambar 4.Ilustrasi Pembuatan Model
b. Ilustrasi Sistem Scoring
Gambar 5. Ilustrasi Sistem Scoring
c. Entity Relationship Diagram (ERD)
Gambar 6. Entity Relationship Diagram
IV. Perancangan Basis Data
a. Desain Tabel Penyakit
Tabel ini digunakan untuk menyimpan data
jenis – jenis penyakit jantung
Tabel 1. Variable Jenis Penyakit
Dari tabel diatas adalah tabel data penyakit
yang memiliki atribut id penyakit, nama
penyakit, dan harga obat, serta harga
pemeriksaan.
b. Desain Tabel Pasien
Tabel ini digunakan untuk menyimpan data
pasien penderita penyakit jantung
Tabel 3. Variabel Pasien
Dari tabel diatas adalah tabel pasien yang
memiliki atribut id pasien, nama pasien, alamat,
jenis kelamin, umur, dan termasuk tipe kelas
yang saling berhubungan.
c. Desain Tabel Pemeriksaan
Tabel ini digunakan untuk mengetahui biaya
total yang harus dibayar berdasarkan penderita
penyakit jantung.
Tabel 3. Varabel Pemeriksaan
Dari tabel diatas adalah tabel pemeriksaan
yang memiliki atribut id pasien, id penyakit,
umur, harga kelas, nama penyakit, harga obat,
dan harga pemeriksaan yang saling
berhubungan.
d. Implementasi dengan perhitungan Naïve
Bayes
Model statistik merupakan salah satu model
yang efisien sebagai pendukung pengambilan
keputusan. Konsep probabilistik merupakan salah
satu bentuk model statistik. Salah satu metode
yang menggunakan konsep probabilistik adalah
Naive Bayes. Algoritma Naive Bayes adalah salah
satu algoritma dalam teknik klasifikasi yang
mudah diimplementasikan dan cepat prosesnya.
Pada metode ini, semua atribut akan memberikan
kontribusinya dalam pengambilan keputusan,
dengan bobot atibut yang sama penting dan
setiap atribut saling bebas satu sama lain.
Data
History
Sistem
Data
Mining
Model
Data
History
Scoring
Engine
Model
Data
Prediksi
5. Tahap awal cara kerja dari proses perhitungan
Naïve Bayes adalah dengan melakukan
pengambilan data training dari data pasien
penyakit jantung. Adapun variabel penentu
yang digunakan dalam mengklasifikasikan data
pasien penyakit jantungyaitu :
1. Nama Pasien
Merupakan atribut nama pasien yang
dijadikan data primer.
2. Tipe kelas
Merupakan atribut kelas ruangan yang
dikelompokkan dalam empat kategori yaitu
VIP, Kelas 1, Kelas 2, dan Kelas 3.
3. Nama Penyakit
Merupakan atribut penyakit yang
dikelompokkan dalam delapan kategori yaitu
Aterosklerosis/serangan, Infark Miokard
Akut (AMI), Kardiomiopati, Arritmia, Gagal
Jantung Kongestif, Fibrilasi Atrial, Inflamasi
Jantung, dan Penyakit Jantung Rematik.
4. Harga Obat
Merupakan atribut harga obat yang terdiri
dari berbagai macam obat beserta harga
jumlah keseluruhan.
5. Harga Pemeriksaan
Merupakan atribut pemeriksaan yang
merupakan jumlah keseluruhan dari tiap tiap
kelas ruangan.
Tabel 4. Pelatihan
Berdasarkan Berdasarkan tabel diatas dapat
dihitung klasifikasi id pasien apabila diberikan
input berupa harga obat, harga pemeriksaan
yang didalamnya terdapat harga kelas
menggunakan algoritma Naive Bayes sebagai
berikut:
1. Menghitung jumlah biaya pemeriksaan
saudara Komang dengan penyakit
Aterosklerosis :
P (Biaya sdr Komang)
= P (harga kelas) + P (harga obat) +
P (harga pemeriksaan)
= 110.000 + 4.259.200 + 394.000
= 4.763.200
2. Menghitung jumlah biaya pemeriksaan
saudara Angelina dengan penyakit Infark
Miokard Akut (AMI) :
P (Biaya sdr Angelina) =
= P (harga kelas) + P (harga obat) +
P (harga pemeriksaan)
= 60.000 + 4.259.200 + 394.000
= 4.713.200
3. Menghitung jumlah biaya pemeriksaan
saudara Salis Saputri dengan penyakit Gagal
Jantung :
P (Biaya sdr Salis Saputri) =
= P (harga kelas) + P (harga obat) +
P (harga pemeriksaan)
= 80.000 + 107.315 + 389.000
= 576.315
Proses diatas adalah proses data mining
secara manual dengan menggunakan data
pelatihan untuk Rumah Sakit Abu Nawas.
Dari data yang ada setelah dilakukan mining
dengan menggunakan XAMPP versi 1.7.1 dan
NetBeans IDE 8.0
V. Pengujian
Kegiatan uji coba dengan cara memasukan data
sample kedalam system dan memperhatikan output
output yang dihasilkan. Adapun tahapan yang
dilakukan adalah :
1. Melakukan penginputan data pribadi pasien
agar diketahui keluarga dan pengunjung.
Gambar 7. Tampilan data pasien
menggunakan program NetBeans IDE 8.0
2. Melakukan penginputan pasien terhadap jenis
penyakit yang dideritanya.
Gambar 8. Tampilan data penyakit
menggunakan program NetBeans IDE 8.0
6. 3. Melakukan pemeriksaan pasien terhadap jumlah
biaya yang harus dibayar
Gambar 9. Tampilan data pemeriksaan
menggunakan program NetBeans IDE 8.0
VI. Kesimpulan
Pada paper ini telah dilakukan studi dengan
menggunakan teknik Attribute Importance (AI)
untuk mengetahui peringkat atribut yang
berpengaruh terhadap pola biaya yang harus
dibayar pasien terhadap penyakit yang dialaminya
dengan membuat model menggunakan teknik
classification dengan Algoritma Naive Bayes
yang kemudian digunakan untuk memprediksi
pola biaya pada data kunjungan pasien yang akan
datang (scoring data). Dengan model prediksi
biaya tersebut, dapat diperkirakan biaya pasien
rawat inap pada saat awal kunjungan. Informasi
perkiraan biaya tersebut bermanfaat bagi pihak
pasien, karena dapat mempersiapkan pembiyaan
dan pihak rumah sakit karena dapat mengetahui
perkiraan biaya dan sumberdaya yang harus
disiapkan untuk merawat pasien.
VII. Daftar pustaka
[1]. Fuad, A. 2005. Teknologi Informasi untuk
Keselamatan Pasien. http:/ /www.
desentralisasi kesehatan.net/. 04 Juni 2014
14:10.
[2]. N. Wartz, “IBM, Mayo Clinic to Mine Data”,
The information Management Journal,
volume 3, issue 6, November /December
2004,p.8
[3]. Friedman JH: Data Mining and Statistics:
What's the Connection? Dept. of Statistics
and Stanford Linear Accelerator Center,
Stanford University, Stanford,
CA,http://stat.stanford.edu/~jhf/ftp/dm-stat.ps
[4]. Morales, D. A., Bengoetxea, E. et al. 2008.
Selection of human embryos for transfer by
Bayesian classifiers. Computers in Biology
and Medicine 38(11–12):1177–1186.
[5]. Fonarow, G. C., Adams, K. F., Jr. et al. 2005.
Risk stratification for in-hospital mortality
in acutely decompensated heart failure:
classification and regression tree analysis.
JAMA 293(5):572–580.
[6]. Tangri, N., Ansell, D. et al. 2008.
Predicting technique survival in peritoneal
dialysis patients: comparing artificial neural
networks and logistic regression.
Nephrology Dialysis Transplantation
23(9):29722981.
[7]. Chu, A., Ahn, H. et al. 2008. A decision
support system to facilitate management of
patients with acute gastrointestinal bleeding.
Artificial Intelligence in Medicine
42(3):247–259.
[8]. Ordonez, C., Santana, C. A. et al. 2000.
Discovering interesting association rules in
medical data. In ACM SIGMOD Workshop
on Research Issues on Data Mining and
Knowledge Discovery.
[9]. Tremblay, M. C., Berndt, D. et al. 2005.
Utilizingtext mining techniques to identify fall
related injuries. In Proceedings of the 11th
Americas Conference on Information
Systems (AMCIS 2005), Omaha, NE
[10]. J. Hanand M. Kamber. Data Mining:
Conceptsand Techniques. Morgan
Kaufmann, 2001.8