2. I. Medicina kao znanost podataka
U posljednjih nekoliko desetljeća, život znanost, biomedicina i zdravstvo sve više pretvara u podacima
intenzivna znanost. Ovo je povezano sa širenjem dostupnih elektroničkih podataka, uključujući:
digitalizacija elektroničke zdravstvene evidencije (EHR), nakupljanje istraživačkih podataka u bazama podataka u
farmaceutske industrije, oslobađanje pohranjenih podataka o bolesniku vlade za istraživanje
svrhe (npr pacijenti zdravstvenog osiguranja potraživanja), agregacija istraživačkih podataka iz kliničkih ispitivanja,
epidemiološka i biomedicinska istraživanja, izvanredno je high tech medicine (Omics-medicina)
i početka pacijenta self-praćenje i daljinski nadzor pomoću mobilnih uređaja i Biosenzori.
Često navođeno definicija medicinske informatike je da Shortliffe i Perrault (1990): je „...
brzo napredovanje znanstvenog polja koja se bavi pohranu, dohvat i optimalno korištenje biomedicinskih
Informacije, podaci i znanja za rješavanje problema i donošenje odluka”. Iz ove definicije, to je
jasno da je ključna uloga medicinske informatike je podržati liječnicima u donošenju odluka.
U novije vrijeme, razlika je između medicinsku informatiku i biomedicinske
Informatika. Dok su ciljevi interesa za medicinsku informatiku uključuju stanovništva, pojedinci,
organa i tkiva, Biomedicinski informatika, kao ciljevima, također ima mikroskopske razine tjelesne
organizacija, uključujući stanice i molekule.
Medicina (Biomedical) Informatika je znanost podataka u kliničkoj medicini (biomedicini). Ovaj podatak
ima neke posebne karakteristike, kao što su:
• Različiti izvori podataka
• Povećava veličina (volumena)
• Povećanje raznolikosti
• Višedimenzionalan (različitog značenja, podklase)
• Vrlo složen (primjer je mikroskopski struktura proteina kvasca mreža) (Sl. 1)
• Često slabo strukturirana (kao i tekst u evidenciju pacijenata, signali iz fizioloških senzora)
• Šumovi (nestalih i nedosljedan)
Te osobine su razlozi da postoji rastuća potreba za ovu integraciju podataka i
modeliranje, koristeći različite metode računalo za analizu podataka. Ove metode su sadržaj
Medicina (Biomedical) informatika.
3. Sl. 1. s pomoću računala vizualizaciju proteina kvasca mreže
Kao što je vidljivo na sl. 1, veliki je izazov kako pronaći nepoznate strukture (strukturne homologije)
u enormno velikom broju karkaterizirani podataka. Primjenom posebnog vizualizacije
metoda, te strukture postaju vidljivi, što omogućuje liječnicima da shvate ovih
Podaci lakše.
Povećanje volumena i raznolikosti podataka u biomedicinskoj praksi i znanosti, u posljednjih nekoliko desetljeća, ima
dobio zajednički pojam „Big Data”. Big podataka pruža nam priliku da steknu uvid u
Značenje podataka, izvođenje novih znanja i poticati otkrića dalje, da se očekuje da će poboljšati
ishoda bolesnika, smanjiti troškove i ubrzati biomedicinske napredak.
Neki primjeri kako Big podataka može se koristiti za poboljšanje medicinske prakse:
• Kako bi poboljšao primjenjivost kliničkih istraživanja u stvarnom svijetu situacijama u kojima stanovništvo heterogenost je prepreka, a
time i promjenu paradigme: od pretpostavke prešao na upravljanim podacima medicine (Sl. 2).
• Poticanje ekstrakcije i učinkovita i inovativna upotreba znanja skrivenog u ogromnim količinama podataka,
• Da biste omogućili identifikaciju pacijenata koji su pod rizikom za nepovoljne zdravstvene ishode (bolest, smrt, bolnica (ponovno) za prijem),
• Da bi se omogućilo učinkovito i precizno lijek kroz pacijenta rizika stratifikacije (ključni zadatak prema personalizirane zdravstvene
zaštite),
• Da biste omogućili predicitive analitike u personaliziranu zdravstvu
4. Sl. 2. Big podataka i paradigmu promjene u biomedicinske znanosti: Hipoteza-driven vs podataka-driven medicine (Doktorska disertacija
autora)
Klinička istraživanja zadataka treba odrediti metode istraživanja. To je suprotno onome što je danas,
gdje klinička projekti ispunjavaju kriterije utvrđene metode istraživanja.
Paradigma mijenja znači prekidač s opisnom (izlječiva) na prediktivni,
spriječiti i proaktivna, sudjelovanja (uz aktivno sudjelovanje pacijenta) lijek (P4 lijek ili
personalizirana medicina).
Sve veća uloga personalizirane medicine, u biomedicinske znanosti u praksi, razvija zajedno
uz dva glavna tehnološki napredak, uključujući: 1) Omics temeljen medicini i 2), kompjutorski
na temelju metode za analizu podataka (Medicinska i biomedicinske informatike).
Omics-based medicine uključuje novu generaciju sekvenciranje DNA, koja je u kombinaciji s
nove metode molekularne biologije: transkriptomika, proteomika i metabolomics. Ovi novi
tehnologije omogućile su razvoj nove znanstvene discipline, sustavi biologije, koja
znači integrativni analizu podataka različitih razina tjelesne organizacije. Ova nova disciplina
omogućuje povezivanje fenotipa i molekularnih patways (sl. 3), i identifikacija novih
ciljevi za personalizirane tretmane.
5. Sl. 3. challlenge sustava biologije u stvaranju molekularnih putova i mreže
P4 medicina: Personalizirano, Prediktivni, preventivnu i sudjelovanja lijek. Ključne prednosti P4 medicine uključuju
mogućnost da:
- otkrivanje bolesti u ranoj fazi, kada je lakše i jeftinije da se učinkovito liječiti
- uslojiti pacijenata u grupama koje omogućuju izbor optimalnu terapiju (Sl. 4)
- smanjiti nuspojave učinkovitijim ranoj procjeni individualnih odgovora na lijekove
- poboljšati izbor novih biokemijskih ciljeva za otkrivanje lijekova
- smanjiti vrijeme, trošak i neuspjeh stopa kliničkim ispitivanjima za nove terapije
- pomiču naglasak u medicini iz reakcije i iz prevenciju bolesti wellness
Sl. 4. Stratifikacija pacijenata u skupine da se omogući odabiranje optimalnu terapiju
Tu su i neke prepreke za učinkovito korištenje Big podataka za praktične svrhe. Te prepreke nositi
sa sljedećim problemima:
6. • Problem heterogene podataka (Biomedicinskih podataka koriste se iz raznih izvora i pokazuju različite strukturne dimenzije, kojeProblem heterogene podataka (Biomedicinskih podataka koriste se iz raznih izvora i pokazuju različite strukturne dimenzije, koje
variraju od mikroskopskih (Omics-podataka) u makroskopskom svijetu (npr podataka o prevalenciji bolesti u statistiku stanovništva)
• Problem dijeljenje podataka i raspodjelu između različitih pružatelja usluga i odjela
• Često glasan, nedostaje, nedosljedna i ne-standardiziranih podataka
Tu je i jaz između raspoloživih podataka i podataka koji vrijede za praktične svrhe. To je razlog zašto je obrada
podataka je važan korak u procesu otkrivanja znanja iz podataka.
Otkrivanje znanja u bazama podataka (KDD) je postupak koji uključuje nekoliko koraka: odabir podataka, podaci predobrada,
transformaciju podataka, rudarstvo podataka (smatraju kao Proces analize podataka) i rezultati tumačenje (Sl. 5).
Sl. 5. korak u procesu KDD
Izazov KDD Big Data je: ekstrakt smislene informacije iz podataka, steći nova
znanje, otkriti do sada nepoznate spoznaje, pronaći obrasce i smisla podataka. Mnogi
različiti pristupi su razvijeni od KDD Big Data, uključujući: novo matematički i
grafički postupci, rudarenje podataka (DM) i strojnog učenja (ml) metode (uglavnom koristi metode u
prošlost).
Data mining je pojam koji ima dvojno značenje. To se može smatrati kao ključni korak u procesu KDD
(Termin se koristi: otkrivanje znanja i Data Mining, KDD, a kao računska
Proces otkrivanja prethodno nepoznatih, važeće obrasce i odnose u velikim skupovima podataka, koji
mogu se koristiti za predviđanje, klasifikacija i klastera svrhe.
7. rudarenje podataka, kada se smatra računalo-based metode A, sastoji se od kombinacije
sofisticirane metode, uključujući: statistički modeli, matematički algoritmi i ML metode (algoritmi
koji automatski poboljšati svoje performanse kroz iskustvo).
Primjena Data Mining tehnika i metoda u zdravstvu domeni dovela je do:
• developmnet inteligentnih sustava i sustava za podršku odlučivanju (na temelju pravila ekspertni sustavi)
• poboljšanje predviđanja nepovoljnih zdravstvenih ishoda i dijagnoza
• Poboljšana klasifikacija bolesti
• otkriće odnosa između patoloških podataka i kliničkih podataka i između pacijenata karakteristike i lijekovi
učinkovitosti
• Postupak odabir kandidata za medicinske testove i postupke
Jedan novi koncept je razvijen u suradnji s KDD. To je koncept ljudskom
Interakcija računala (HCI). Interakcija je glavna tema u ovom konceptu (Sl. 6). U ovom kontekstu:
• KDD je postupak u rasponu od fizičkog strane podataka ljudskog stranu znanja (definiran kao kognitivni proces).
• Izazov je u tome da znanje da bi bio upotrebljiv od strane krajnjih korisnika (čineći osjećaj podataka).
• Dodana u KDD postupak INTERAKCIJA (KOMUNIKACIJA) s ljudskom krajnjeg korisnika (medicinski stručni).Dodana u KDD postupak INTERAKCIJA (KOMUNIKACIJA) s ljudskom krajnjeg korisnika (medicinski stručni).Dodana u KDD postupak INTERAKCIJA (KOMUNIKACIJA) s ljudskom krajnjeg korisnika (medicinski stručni).
• To je ljudska krajnji korisnik (nije stroj) koji posjeduju rješavanje problema inteligenciju, dakle, mogućnost da postavljaju
pametna pitanja o podacima.
• Ljudska (medicinski stručnjak) može riješiti složene probleme ponekad intuitivno (odnosno, bez potrebe da se opisuju
točne pravila ili procesa koji se koriste u analizi problema).
Slika 6. Vizualna prezentacija koncepta HCl (izvor: Medicinski fakultet Sveučilišta u Grazu, grupa za HCl).
8. Ili, prema riječima Albert Einstein (SAD / njemački rođen fizičar, 1879-1955): Računala
su nevjerojatno brzo, precizno i glupo. Ljudska bića su nevjerojatno sporo, neprecizne i
sjajan. Zajedno su moćni izvan mašte.