POSLOVANJE
Aktuelno
26 BB-INFORMATOR / AVGUST 2015. / 243
AUTOR: IGOR LAZAREVIĆ, AVENTIN PARTNERS
Big Data analitika
Poslovna
primena
1
Ibrahim; Targio Hashem, Abaker; Yaqoob, Ibrar; Badrul Anuar, Nor; Mokhtar, Salimah; Gani, Abdullah; Ullah Khan, Samee (2015), The Rise of “Big Data” on Cloud Computing: Review and
Open Research Issues, Information Systems, Vol. 47, str. 98-115
MOGUĆNOSTI PRIMENE BIG DATA ANALITIKE SU OGROMNE. BIG DATA ANALITIKA IMA PO-
TENCIJAL DA UNAPREDI SVAKODNEVNI ŽIVOT I POSLOVANJE DO TE MERE DA SE DANAS SVE
VIŠE GOVORI O FUTURISTIČKIM KONCEPTIMA KAO ŠTO SU PREDVIĐANJE ZEMLJOTRESA ILI
BOLESTI SA 100% SIGURNOSTI. NA OVOM MESTU BIĆE ISTAKNUTE SAMO NEKE OD MO-
GUĆNOSTI POSLOVNE PRIMENE BIG DATA ANALITIKE.
Značaj Big Data analitike
Svet u kom živimo je svet savremenih in-
formaciono-komunikacionih tehnologi-
ja. Pored toga što su doprinele da komuni-
kacija među ljudima poprimi sasvim no-
vu dimenziju, savremene informaciono-ko-
munikacione tehnologije su dovele do
„eksplozije podataka“ koja se događa u po-
slednjih 20-tak godina. Danas se u roku od
samo par dana generiše količina podata-
ka koja je bila generisana u celokupnoj ljud-
skoj istoriji, a svake dve godine ta količina
podataka se udvostručuje. I ovaj proces se
ne zaustavlja, već se ubrzava.
Logično pitanje koje se nameće je ka-
ko upravljati ovim podacima? Jasno je da
tradicionalni metodi obrade podataka ko-
ji su bazirani na manuelnim operacijama
ne mogu da zadovolje rastuće potrebe za
njihovomsveobuhvatnomanalizom.Zarad
sa ovakvim podacima potrebni su novi pri-
stupi i nove tehnologije. Big Data analiti-
ka predstavlja skup tehnika i tehnologija
koje su bazirane na novim formama inte-
gracije velikih količina složenih i raznovr-
snih podataka, a koje imaju kapacitet da ot-
kriju skrivene vrednosti koje su sadržane
u tim podacima1. Za razliku od tradiciona-
lne analitike, koja je bila deskriptivna i ba-
zirana na manuelnoj obradi malih serija po-
dataka, Big Data analitika je prediktivna i
bazirana je na automatskoj obradi velikih
serija podataka.
Moždanajboljinačindaseilustrujuulo-
ga i značaj Big Data analitike predstavlja Ve-
nov dijagram nauke o podacima (Data
Science Venn Diagram). Venov dijagram po-
vezuje tri osnovna elementa sistema
upravljanja podacima – podatke, tehnike
i tehnologije. Tako imamo nekoliko mogu-
ćih situacija. Ukoliko se tradicionalne teh-
nike istraživanja primene na postojeće
podatke, tada se govori o tradicionalnim
istraživanjima.Ukolikosetradicionalneteh-
nologije istraživanja primene na postoje-
U intervjuu koji je dao Džonu B. Kenediju 1926. godine, Ni-
kola Tesla je rekao: „Kada se bežična tehnologija proširi cela
Zemlja će se pretvoriti u jedan ’veliki mozak’, što u biti ona i
jeste. Moći ćemo komunicirati međusobno kad god to pože-
limo, bez obzira na udaljenost. I ne samo to, već ćemo po-
moću televizije i telefona moći videti i čuti jedni druge savr-
šeno, kao da se nalazimo jedni pored drugih, bez obzira na
udaljenost koja može biti čak i nekoliko hiljada kilometara.
Instrumenti koji će nam to omogućiti biće jako jednostavni u
poređenju sa današnjim telefonima. Čovek će telefon moći
nositi u džepu“..
će podatke, tada se govori o tradicionalnim
softverima. Ukoliko se tradicionalne
tehnike istraživanja spoje sa tradicio-
nalnimtehnologijamaistraživanja,
tada se govori o mašinskom
učenju (Machine Learning). Ko-
načno, ukoliko se postojeći
podaci obrađuju kombinova-
nom primenom tradiciona-
lnih istraživanja, tradiciona-
lnih softvera i metodama ma-
šinskog učenja, tada se govo-
ri o savremenoj Big Data ana-
litici.
Kako ustvari funkcioniše Big
Data analitika? Pre svega, Big Data
analitika najbolje funkcioniše u ana-
lizi velikih serija podataka koji se mere ve-
ličinom gigabajta, terabajta i više, te zbog
svoje veličine i kompleksnosti prevazilaze
kapacitete standardnih softvera za njiho-
vu analizu. Zatim, Big Data analitika podra-
zumeva primenu naprednih tehnika obra-
de podataka, kao što su napredne tehnike
regresione analize, analize vremenskih
serija, ekonometrijskih simulacija, ma-
šinskog učenja, genetičkih algoritama i dru-
ge tehnike. Pored toga, Big Data analitika
podrazumeva i primenu sofisticiranih
softvera za analizu podataka, koji imaju ka-
pacitet obrade velikih serija heterogenih
podataka. Na tržištu se najčešće pojavlju-
ju softverska rešenja koja integrišu perfor-
manse informacionih tehnologija sa na-
prednim matematičkim i statističkim teh-
nikama analize podataka, kao što su Apac-
he Hadoop, MapReduce, MATLAB i drugi
softveri koji se mogu prilagoditi potreba-
ma korisnika. Konačno, Big Data analitika
je usko povezana sa naprednim formama
vizuelizacije podataka, za koju se često ka-
že da je „najbolji prijatelj“ Big Data anali-
tike. Zapravo, vizuelizacija podataka pred-
stavlja nezaobilazni element Big Data ana-
litike i njene primene u cilju unapređenja
poslovanja.
Primena Big Data analitike
Uobičajeno je mišljenje da se Big Data
analitika u najvećoj meri primenjuje u obla-
sti informacionih tehnologija. Međutim,
činjenica je da se Big Data analitika danas
primenjuje i u drugim oblastima, i to ne sa-
mo u oblasti poslovanja, nego i u oblasti
svakodne-
vnog života. Naravno, zbog razvoja koji se
događa veoma velikom brzinom, Big Da-
ta analitika svoju osnovnu primenu nala-
zi u oblasti rada sa informacionim tehno-
logijama, odnosno u oblasti obrade digi-
talnih podataka. Kao što je napomenuto u
prethodnom tekstu, digitalni svet predstav-
lja najdinamičniji deo poslovnog sveta
današnjice. U digitalnom svetu se svakog
trenutka generišu terabajti i terabajti po-
dataka, što kroz korišćenje Internet pretra-
živača, što kroz korišćenje društvenih
mreža i mreža za deljenje sadržaja, što kroz
poslovnu razmenu podataka. Važno je
znati da svaka kompanija, kao što su npr.
najveći svetski proizvođači lekova, pa i sva-
ki mali učesnik na farmaceutskom tržištu,
kao što su npr. apoteke, svakodnevnim ko-
rišćenjem Interneta ostavljaju trag u digi-
talnom svetu i generišu velike količine po-
dataka koji adekvatno mogu biti obrađe-
ni jedino upotrebom Big Data analitike. Pri-
mera radi, privatna apoteka može imati na-
loge na svim društvenim mrežama, može
imati svoj sajt koji ima određenu poseće-
nost, može na dnevnoj osnovi vršiti na sto-
tine upita na Google pretraživaču i može
imati aktivnu dnevnu E-mail komunikaci-
ju. Sve ove aktivnosti generišu velike seri-
je digitalnih podataka koji ne govore samo
o načinu upotrebe informacionih resursa
(količine poslatih podataka, vreme potre-
bno za realizaciju pojedinačnih aktivnosti,
logovi na računarima itd), nego i o karak-
teristikama osoba sa kojima se vrši in-
terakcija i karakteristikama samih
zaposlenih (socio-kulturne i psi-
hografske karakteristike potro-
šača, interesovanja zaposle-
nih, vremenska dinamika in-
terakcija na društvenim mre-
žama, zahtevi za pretraživa-
nja na Google pretraživaču
itd). Pritom, ovo što je ovde
napomenutojesamodelićin-
formatičkih potencijala za ge-
nerisanje velikih serija podata-
ka. Danas više nego ikad upotre-
ba informacionih tehnologija i
rad u digitalnom svetu otvaraju ne-
slućene mogućnosti analize podataka u
cilju unapređenja poslovanja i apoteka i far-
maceutskih kompanija i svih drugih uče-
snika na tržištu.
Prirodno, Big Data analitika nalazi
svoju veliku primenu i u oblasti telekomu-
nikacija, koje se često nazivaju „mlađom
sestrom“ informacionih tehnologija. Pored
toga što je informatički uvezan, svet dana-
šnjice je uvezan i telekomunikacijama.
Štaviše, danas se ne govori o ova dva sek-
tora pojedinačno, nego se sve češće kori-
sti izraz „informaciono-komunikacione
tehnologije“ (Information and Communi-
cation Technologies – ICT). Najvažniji
aspekt telekomunikacija su mobilne komu-
nikacije. Svakog dana operateri mobilnih
komunikacija generišu ogromne količine
podataka koji se odnose na telefonske
razgovore, SMS i MMS poruke, korišćenje
mobilnog Interneta, lokaciju korisnika
mobilne telefonije i njihovo kretanje (geo-
lokaciju), interkonekciju među operateri-
ma mobilne telefonije, korišćenje mobil-
nih telefona u inostranstvu (Roaming)
itd. Kao i kod informacionih tehnologija,
i telekomunikacije omogućavaju velikim
farmaceutskim kompanijama, ali i veledro-
gerijama, apotekama, ugovornim istraži-
vačkim organizacijama (CROs) i drugim
učesnicima na farmaceutskom tržištu da
prikupe i analiziraju velike serije podata-
ka vezanih za kupce i potrošače, za konku-
rente, za sopstvene zaposlene i za ostale
subjekte,itosamonaosnovuupotrebemo-
bilnih komunikacija. Naravno, i u ovom slu-
čaju, potrebni su kapaciteti Big Data ana-
BB-INFORMATOR / AVGUST 2015. / 243 27
Matematika i
statistika
Oblast poslovne primene
(npr. medicina)
Informacione
tehnologije
Tradicionalna
istraživanja
Tradicionalni
softveri
Mašinsko
učenje
Big Data
analitika
Nauka o podacima
TehnikeTehnologije
Podaci
litike da bi se ovi podaci pretvorili u upo-
trebljive poslovne informacije i preporu-
ke.
Big Data analitika veoma veliku upo-
trebu ima i u finansijskom sektoru. Obzi-
rom da su skoro sve finansijske transakci-
je danas automatizovane, podaci iz finansij-
skog sektora su veoma upotrebljivi u Big
Data analitici. Primera radi, samo u okvi-
ru jednog minuta se u svetu obavi preko
3.500 transkcija na berzama i nekoliko mi-
liona bankarskih transakcija. Svi ovi poda-
ci su itekako upotrebljivi za farmaceutske
kompanije i druge učesnike na farma-
ceutskom tržištu, uključujući i same apo-
teke. Ako ništa drugo, one mogu da pruže
okvir za sagledavanje dinamike tržišta i pro-
cesakojisedogađajuumakroekonomskom
okruženju. Međutim, to nije sve. Svaka fir-
ma, bilo da je ona veliki proizvođač leko-
va ili mala apoteka, dnevno najčešće gene-
riše na stotine finansijskih transakcija
prodajom i nabavkom robe i usluga i rea-
lizacijom plaćanja za razne namene. Big Da-
ta analitika svima njima omogućava da ove
podatke obradi u celosti, u najkraćem mo-
gućem roku i da na osnovu njih vizuelizu-
je dobijene rezultate koji se mogu koristi-
ti na dnevnoj osnovi za unapređenje poslo-
vanja.
Kada se govori o finansijskom sektoru,
prirodno se nameće pitanje sektora mar-
ketinga i prodaje, gde se otvara jedna sa-
svim nova dimenzija upotrebe Big Data
analitike. Mnogi smatraju da Big Data
analitika, posle ICT sektora, ima najveću pri-
menu u oblasti marketinga i prodaje.
Praktičnodanemaoblastimarketingaipro-
daje u kojoj se Big Data analitika ne može
primeniti. Pogledajmo, primera radi, oblast
oglašavanja, odnosno reklamiranja (Adver-
tising). Čak i obična promotivna poruka
apoteke koja je upućena preko par onlajn
i oflajn medija može da generiše veliku ko-
ličinu podataka, od profila ciljnih potroša-
ča, preko njihovih navika, kulturoloških
obrazaca i psihografskih karakteristika,
pa sve do penetracije na tržište i broja ostav-
ljenih utisaka na potencijalne potrošače. Ili
pogledajmo na primer oblast istraživa-
nja tržišta (Market Research). Savremena
istraživanja tržišta su otišla mnogo dalje
od običnih terenskih istraživanja. Danas
istraživači koriste digitalne tehnologije
na veoma velikim uzorcima i brojne psiho-
fizičke metode motivacionih (kvalitativnih)
istraživanja. Primena Big Data tehnologi-
ja je preduslov za analizu rezultata dobije-
nih istraživanjem i donošenja pravih po-
slovnih odluka na osnovu toga. Konačno,
što je svakako vidljivo svuda oko nas, sa-
mi procesi prodaje, naplate i upravljanja od-
nosima sa potrošačima generišu velike ko-
ličine Big Data podataka. Pomenuti proce-
se prodaje, nabavke, obrta kupaca, servisa
potrošača, rada u Call centrima itd. je sva-
kako nedovoljno da ilustruje u kojoj me-
ri procesi prodaje i brige o potrošačima (Cu-
stomer Care) mogu da pruže velike količi-
ne upotrebljivih podataka čak i za male tr-
žišne učesnike kao što su apoteke.
Naravno, Big Data analitika nalazi svo-
ju primenu i izvan poslovnog sveta. Možda
najvažnija njena primena, koja će imati sve
veći značaj u budućnosti jeste sektor bez-
bednosti. U sektoru bezbednosti svakod-
nevno se radi ne sa terabajtima, nego sa pe-
tabajtima podataka. Rad obaveštajnih i kon-
traobaveštajnih službi, rad vojske i polici-
je, rad bezbednosnih agencija prožet je
ogromnim količinama podataka vezanih
za dinamiku celokupne populacije jedne
zemlje. Prediktivna analitika omogućava
da se preventivni rad podigne na najviši
mogući nivo i da se pravovremeno identi-
fikuju bezbedonosne pretnje, kao što su
pretnje terorističkih napada. Procenjuje se
da samo sektor bezbednosti konzumira iz-
među 5% i 10% potencijala Big Data tržišta.
Međutim, Big Data analitika ima i veliku
upotrebu u razvoju fundamentalnih i
primenjenih nauka, od astronomije, astro-
fizike i kvantne fizike, preko biologije,
medicine i farmacije, pa sve do geologije,
klimatologije i seizmologije. Dovoljno je na-
vesti samo dva primera. Veliki hadronski
sudarač čestica (Large Hadron Collider –
LHC), najveći sudarač čestica na svetu ko-
ji je deo projekta Evropskog saveta za nu-
klearna istraživanja (Conseil Européen
pour la Recherche Nucléaire – CERN) nika-
da ne bi mogao da pruži odgovore na
fundamentalna pitanja fizike i univerzu-
ma da nije alata i tehnika Big Data analiti-
ke. Bilo bi suvišno govoriti o tome koja ko-
ličina podataka o partikularnim česticama
se generiše samo u okviru jednog ekspe-
rimenta u velikom hadronskom sudaraču
čestica, a kamoli o potencijalima Big Data
analitike u svemirskim istraživanjima.
Drugi primer su seizmologija i geologija.
Najsofisticiranije tehnike prediktivne ana-
litike danas mogu kao nikada pre da omo-
guće predviđanje prirodnih katastrofa kao
što su zemljotresi, erupcije vulkana ili po-
plave. Tehnike Big Data analitike se ne ko-
riste samo u predviđanju prirodnih kata-
strofa. One se danas koriste i u komercijal-
ne svrhe, kao što je npr. pronalaženje na-
ftnih bušotina na osnovu analize velikih
serija geoloških podataka (npr. prednosti
ove tehnologije koristi kompanija Shell). Big
28 BB-INFORMATOR / AVGUST 2015. / 243
POSLOVANJE
Aktuelno
Jedan od najboljih primera kako se prediktivna analitika u
kombinaciji sa informacionim tehnologijama može iskori-
stiti za razvoj inovacija je ADMS (Advanced Distribution Ma-
nagement System) softver, koji je razvila novosadska kom-
panija Schneider Electric DMS, na čelu sa profesorom
Draganom Popovićem. ADMS je već treću godinu zaredom
rangiran od strane konsultantske kuće Gartner (koja je poz-
nata po tome što je prva dala definiciju Big Data) kao najbolji
softver na svetu koji koristi pametne mreže (Smart Grids) za
daljinsko upravljanje elektroenergetskim distributivnim si-
stemima. ADMS softver je nastao upravo kao rezultat pri-
mene tehnika prediktivne analitike na veliki broj podataka
koji se generišu tokom proizvodnje i distribucije električne
energije.
Data analitika nalazi svoju primenu i u
sportuinutricionizmu. Ne samo što su ala-
ti i tehnike Big Data analitike omogućili da
se izvrši analiza velikih serija podataka ko-
ji se generišu na sportskim takmičenjima,
već su omogućile da se izvedu fundamen-
talne statistike i izvrše predviđanja rezul-
tata (verovatnoće događaja) određenih
sportskih manifestacija. Pored toga, nutri-
cionistički podaci i podaci koji se generi-
šu za veoma veliki broj namirnica koje se
koriste u ishrani omogućavaju bolje razu-
mevanje metaboličkih procesa i inače
unapređenje ličnog i javnog zdravlja.
Kao što se može videti, broj oblasti u
kojima se mogu koristiti potencijali predik-
tivne analitike je zaista velik. Elaboracija
mogućnosti upotrebe Big Data analitike u
svim oblastima bi oduzela dosta vremena,
ali je svakako od značaja ukazati na moguć-
nosti upotrebe Big Data analitike u oblasti
medicine i farmacije.
Big Data analitika
u medicini i farmaciji
Dok je u oblastima kao što su informa-
ciono-komunikacione tehnologije, finansi-
je i sistem bezbednosti Big Data analitika
značajno odmakla u pogledu korišćenja po-
tencijala, za oblast medicine se može reći
da je Big Data analitika tek zagrebala povr-
šinu, što govori o njenim neslućenim po-
tencijalima u ovoj oblasti. Kada se razmi-
šlja o potencijalima primene Big Data
analitike u medicini, često se razmišlja o
futurističkim konceptima kao što su raz-
voj 100% efikasnih bioloških lekova, 100%
tačno predviđanje bolesti, produženje ži-
votnog veka na preko 100 godina ili pot-
puna kontrola ljudskog genoma. Mnogi
predviđaju da budućnost Big Data analiti-
ke, pored informaciono-komunikacionih
tehnologija, leži upravo u oblasti medici-
ne.
Oblasti medicine i farmacije obilujuBig
Data podacima. Big Data podaci u medi-
cini i farmaciji dolaze iz internih i ekster-
nih izvora, u raznim formatima, sa različi-
tih lokacija i u različitim pojavnim oblici-
ma. Samo neki od podataka koji se gene-
rišu u oblasti medicine i farmacije su po-
daci sa senzora koji mere vitalne znake pa-
cijenata, biometrijski podaci, podaci veza-
ni za ljudski genom, podaci vezani za kli-
nička ispitivanja, podaci vezani za praće-
nje neželjenih reakcija, podaci vezani za re-
gistraciju lekova, epidemiološki podaci, la-
boratorijski podaci, administrativni poda-
ci, podaci vezani za digitalnu komunikaci-
ju i mnogi drugi. Prema nekim izveštajima,
zdravstveni sistem SAD je u 2014. godini
premašio iznos od 1 zetabajta podataka
(1021 bajtova), a u bliskoj budućnosti se oče-
kuje da će dostići nivo od nekoliko jotabaj-
ta podataka (1024 bajtova).
Danas se u oblasti medicine razvijaju
novi termini kao što su medicinska infor-
matika, bioinformatika i neuroinformati-
ka i pojavljuje se sve veći broj inicijativa
za obradu velikih količina podataka. Prime-
ra radi, na osnovu iskustava koje su dobi-
li u okviru Projekta ljudskog genoma (Hu-
man Genome Project – HGP), koji je trajao
od 1984. do 2003. godine, EU i SAD su za-
počele nove projekte bazičnih medicinskih
istraživanja sa velikim količinama podata-
ka. Tako je EU 2013. godine otpočela sa Pro-
jektom ljudskog mozga (Human Brain
Project – HBP), a iste godine SAD su otpo-
čele sa BRAIN inicijativom (Brain Research
through Advancing Innovative Neuro-
technologies), za koju je lično predsednik
SAD rekao da bi trebala da rezultira u ne-
koliko jotabajta podataka koji će biti obra-
đeni Big Data analitičkim metodama. Ta-
kođe, Nacionalni institut za zdravlje SAD
je 2012. godine otpočeo sa inicijativom Big
Data to Knowledge (BD2K), čiji je cilj una-
pređenje upotrebe Big Data analitike u me-
dicinskim istraživanjima. Ovome treba
dodati i Pitsburšku alijansu za zdravstve-
ne podatke (Pittsburgh Health Data Allian-
ce) koja ima za cilj da integriše podatke iz
velikog broja izvora (medicinski podaci, ge-
netski podaci, senzorski podaci itd) u cilju
profilisanja pojedinačnih pacijenata koji-
ma će biti ponuđene potpuno prilagođe-
ne terapije.
Oblasti primene Big Data analitike u
medicini i farmaciji su velike. Ukoliko se
posmatraju npr. istraživanja ljudskog ge-
noma, u okviru kojih se barata sa cifrom
od preko 240 miliona baznih parova ACTG
baze u okviru hromozoma, odnosno od ne-
BB-INFORMATOR / AVGUST 2015. / 243 29
Upotrebom tradicionalnih analitičkih metoda, dekodiranje
ljudskog genoma bi trajalo preko 10 godina. Upotrebom Big
Data analitike ljudski genom se može dekodirati za nešto
više od 7 dana, po ceni od nekoliko stotina dolara.
koliko milijardi kombinacija ACTG baze u
ljudskom genomu, lako se može zaključi-
ti da samo to proizvodi 2 terabajta sirovih
podataka, za čije dekodiranje je danas po-
trebno samo nekoliko dana. Pritom treba
imati u vidu da čak 98% ljudskog genoma
predstavlja tzv. „Junk DNA“, odnosno DNK
materijal koji nije funcionalno upotrebljiv,
ali koji može da pruži značajne informaci-
jezamedicinskaistraživanjainapredakme-
dicinke nauke. Big Data analitika ima ve-
liku mogućnost primene i u kliničkim
istraživanjima. Nije teško zamisliti na ko-
ji način Big Data analitika može da trans-
formiše podatke iz istraživanja nekoliko no-
vih hemijskih jedinjenja (New Chemical En-
tity – NCE) koja se sprovode policentrično
na nekoliko hiljada ljudi prateći pritom ne-
koliko stotina parametara za svaki mole-
kul i svakog pacijenta posebno. Među-
tim, to nije sve. Podaci koji se mogu dobi-
ti na osnovu analize velikih serija podata-
ka o populaciji i prevalenci bolesti u popu-
lacijimogudapomognudasekliničkaistra-
živanja usmere na one pacijente koji će po-
kazati najverodostojnije rezultate u klini-
čkim ispitivanjima lekova. Posebne moguć-
nosti primene Big Data analitike leže u ra-
du sa populacionim podacima. Preve-
lanca oboljenja, epidemiološki podaci o bo-
lestima, stopa oboljevanja, stopa smrtno-
sti, dužina trajanja lečenja, najčešće kori-
šćeni tretmani i podaci o osiguranicima u
okviru zdravstvenog sistema samo su ne-
ki od populacionih podataka koji se mogu
integrisati i obraditi uz pomoć Big Data ana-
litike. Naravno, na ovo se nadovezuje i vi-
soko-efikasno profilisanje pacijenata.
Praćenjem velikih serija podataka o poje-
dinačnim pacijentima zdravstvene vlasti
mogu obezbediti ne samo veću umreže-
nost, nego i bolji pristup adekvatnim tret-
manima za pacijente. Profilisanje pacijena-
ta između ostalog obuhvata i segmentaci-
ju pacijenata, psihografske i demograf-
ske karakteristike pacijenata, psihološke ka-
rakteristike pacijenata, njihovu kompletnu
medicinsku dokumentaciju i istoriju bole-
sti i mnoge druge podatke koji mogu biti
od koristi u njihovom profilisanju. Nara-
vno, ovo su samo neke od oblasti u kojima
Big Data analitika ima svoju primenu. Ne
treba ispustiti iz vida da Big Data analiti-
ka ima svoju primenu i u brojnim drugi
oblastima medicine i farmacije kao što su
unapređenje rada zdravstvenog sistema,
unapređenje rada nacionalnih agencija
za lekove, unapređenje rada sistema zdrav-
stvenog osiguranja itd.
Postavlja se pitanje kako apoteke, bol-
nice i farmaceutske kompanije mogu prak-
tično da primene Big Data analitiku. Mo-
žda odgovor na ovo pitanje daje primer
mnogih bolnica koje su primenom Big Da-
ta softverskih rešenja omogućile integra-
ciju i obradu kompleksnih podataka iz
različitih izvora kao što su laboratorijski re-
zultati, dijagnostički podaci, istorijat bole-
sti pacijenata i članova njihovih porodica,
administrativni bolnički podaci o pacijen-
tima, podaci o tretmanima i ispitivanjima,
podaci o kapacitetima bolnica itd. Ili mo-
žda odgovor na ovo pitanje mogu da daju
pojedini lanci apoteka koji su uveli princip
praćenja svih relevantnih poslovnih poda-
taka (zalihe, potraživanja, cene, prodaja,
eksterni uslovi, zdravstveni sistem itd)
kroz napredne tehnike poslovne inteligen-
cije (Business Intelligence – BI). Praktično
svaki poslovni subjekt, bilo da je to farma-
ceutska kompanija, ugovorna istraživa-
čka organizacija, veledrogerija, apoteka
ili zdravstvena ustanova, može u manjoj ili
većoj meri da primeni principe Big Data
analitike na sve podatke koje njihovo po-
slovanje generiše i da na osnovu toga
ostvari dugoročnu konkurentsku pred-
nost na tržištu.
Izazovi budućeg razvoja
Big Data analitike u medicini
Nesumnjivo je da su potencijali primene
Big Data analitike u oblasti medicine i far-
macije ogromni. Zajedno sa potencijalima
idu i izazovi koje je potrebno savladati ka-
ko bi primena bila što efikasnija. Na ovom
mestu ukratko ukazujemo na osnovne
izazove. Prvi i osnovni izazov je integraci-
ja podataka. Naima, postavlja se pitanje ka-
ko integrisati veoma veliku količinu razno-
vrsnih podataka koji se generišu u oblasti
medicine i farmacije, koji su često ne-
strukturirani i koji se generišu veoma ve-
likom brzinom. Za razliku od primene
Big Data analitike u drugim oblastima, in-
tegrisati podatke u oblasti medicine je
posebna vrsta izazova na kojoj već rade
mnoge kompanije i institucije širom sve-
ta. Drugi izazov je kako obezbediti umre-
žavanje i kolaboraciju svih učesnika u
zdravstvenom sistemu jedne zemlje. Nai-
me, postavljaju se pitanja tehnika i princi-
pa umrežavanja zdravstvenih vlasti, zdrav-
stvenihustanova,istraživačkihiobrazovnih
ustanova, proizvođača lekova, trgovina
lekovima,pacijenata,stručnejavnostiiosta-
lih učesnika u sistemu zdravstva. Zbog to-
ga je od posebne važnosti razvijati e-
zdravstvo na svim njegovim nivoima. Tre-
ći izazov predstavlja primena informacio-
nih tehnologija u zdravstvu. Zdravstvo i
farmaceutska industrija su toliko veliki
kompleks institucija, kompanija, procesa
i pravila da je potrebno još vremena da bi
informacione tehnologije u okviru njih do-
vele u stanje potpune operativnosti za ši-
roku primenu Big Data analitike. I za to će
biti potrebno vreme. Posebnu vrstu izazo-
va predstavlja razvoj novih prediktivnih
modela specijalizovanih za oblast zaštite
zdravlja. Potreba za razvojem novih predik-
tivnih analitičkih modela proizilazi iz
kompleksnosti medicine kao nauke i veli-
ke količine raznovrsnih podataka koji se u
okviru nje pojavljuju. Ovo je posebno va-
žno imajući u vidu velike ciljeve kao što su
predikcija bolesti, predikcija populacio-
nih kretanja ili predikcija epidemioloških
kretanja. I konačno, izazov za budući raz-
voj Big Data analitike predstavlja i način na
koji će biti sprovedena personalizacija
zdravstvene zaštite. Koji podaci će biti in-
tegrisani, na koji način će biti obrađivani
i kako obezbediti učešće široke baze paci-
jenata za potrebe personalizacije su samo
neki od problema u ostvarivanju sna o per-
sonalizovanoj zdravstvenoj zaštiti.
30 BB-INFORMATOR / AVGUST 2015. / 243
POSLOVANJE
Aktuelno
Prikupljanje podataka više
nije izazov. Izazov je naći
skrivene obrasce u njima.

Big Data - poslovna primena

  • 1.
    POSLOVANJE Aktuelno 26 BB-INFORMATOR /AVGUST 2015. / 243 AUTOR: IGOR LAZAREVIĆ, AVENTIN PARTNERS Big Data analitika Poslovna primena 1 Ibrahim; Targio Hashem, Abaker; Yaqoob, Ibrar; Badrul Anuar, Nor; Mokhtar, Salimah; Gani, Abdullah; Ullah Khan, Samee (2015), The Rise of “Big Data” on Cloud Computing: Review and Open Research Issues, Information Systems, Vol. 47, str. 98-115 MOGUĆNOSTI PRIMENE BIG DATA ANALITIKE SU OGROMNE. BIG DATA ANALITIKA IMA PO- TENCIJAL DA UNAPREDI SVAKODNEVNI ŽIVOT I POSLOVANJE DO TE MERE DA SE DANAS SVE VIŠE GOVORI O FUTURISTIČKIM KONCEPTIMA KAO ŠTO SU PREDVIĐANJE ZEMLJOTRESA ILI BOLESTI SA 100% SIGURNOSTI. NA OVOM MESTU BIĆE ISTAKNUTE SAMO NEKE OD MO- GUĆNOSTI POSLOVNE PRIMENE BIG DATA ANALITIKE. Značaj Big Data analitike Svet u kom živimo je svet savremenih in- formaciono-komunikacionih tehnologi- ja. Pored toga što su doprinele da komuni- kacija među ljudima poprimi sasvim no- vu dimenziju, savremene informaciono-ko- munikacione tehnologije su dovele do „eksplozije podataka“ koja se događa u po- slednjih 20-tak godina. Danas se u roku od samo par dana generiše količina podata- ka koja je bila generisana u celokupnoj ljud- skoj istoriji, a svake dve godine ta količina podataka se udvostručuje. I ovaj proces se ne zaustavlja, već se ubrzava. Logično pitanje koje se nameće je ka- ko upravljati ovim podacima? Jasno je da tradicionalni metodi obrade podataka ko- ji su bazirani na manuelnim operacijama ne mogu da zadovolje rastuće potrebe za njihovomsveobuhvatnomanalizom.Zarad sa ovakvim podacima potrebni su novi pri- stupi i nove tehnologije. Big Data analiti- ka predstavlja skup tehnika i tehnologija koje su bazirane na novim formama inte- gracije velikih količina složenih i raznovr- snih podataka, a koje imaju kapacitet da ot- kriju skrivene vrednosti koje su sadržane u tim podacima1. Za razliku od tradiciona- lne analitike, koja je bila deskriptivna i ba- zirana na manuelnoj obradi malih serija po- dataka, Big Data analitika je prediktivna i bazirana je na automatskoj obradi velikih serija podataka. Moždanajboljinačindaseilustrujuulo- ga i značaj Big Data analitike predstavlja Ve- nov dijagram nauke o podacima (Data Science Venn Diagram). Venov dijagram po- vezuje tri osnovna elementa sistema upravljanja podacima – podatke, tehnike i tehnologije. Tako imamo nekoliko mogu- ćih situacija. Ukoliko se tradicionalne teh- nike istraživanja primene na postojeće podatke, tada se govori o tradicionalnim istraživanjima.Ukolikosetradicionalneteh- nologije istraživanja primene na postoje- U intervjuu koji je dao Džonu B. Kenediju 1926. godine, Ni- kola Tesla je rekao: „Kada se bežična tehnologija proširi cela Zemlja će se pretvoriti u jedan ’veliki mozak’, što u biti ona i jeste. Moći ćemo komunicirati međusobno kad god to pože- limo, bez obzira na udaljenost. I ne samo to, već ćemo po- moću televizije i telefona moći videti i čuti jedni druge savr- šeno, kao da se nalazimo jedni pored drugih, bez obzira na udaljenost koja može biti čak i nekoliko hiljada kilometara. Instrumenti koji će nam to omogućiti biće jako jednostavni u poređenju sa današnjim telefonima. Čovek će telefon moći nositi u džepu“..
  • 2.
    će podatke, tadase govori o tradicionalnim softverima. Ukoliko se tradicionalne tehnike istraživanja spoje sa tradicio- nalnimtehnologijamaistraživanja, tada se govori o mašinskom učenju (Machine Learning). Ko- načno, ukoliko se postojeći podaci obrađuju kombinova- nom primenom tradiciona- lnih istraživanja, tradiciona- lnih softvera i metodama ma- šinskog učenja, tada se govo- ri o savremenoj Big Data ana- litici. Kako ustvari funkcioniše Big Data analitika? Pre svega, Big Data analitika najbolje funkcioniše u ana- lizi velikih serija podataka koji se mere ve- ličinom gigabajta, terabajta i više, te zbog svoje veličine i kompleksnosti prevazilaze kapacitete standardnih softvera za njiho- vu analizu. Zatim, Big Data analitika podra- zumeva primenu naprednih tehnika obra- de podataka, kao što su napredne tehnike regresione analize, analize vremenskih serija, ekonometrijskih simulacija, ma- šinskog učenja, genetičkih algoritama i dru- ge tehnike. Pored toga, Big Data analitika podrazumeva i primenu sofisticiranih softvera za analizu podataka, koji imaju ka- pacitet obrade velikih serija heterogenih podataka. Na tržištu se najčešće pojavlju- ju softverska rešenja koja integrišu perfor- manse informacionih tehnologija sa na- prednim matematičkim i statističkim teh- nikama analize podataka, kao što su Apac- he Hadoop, MapReduce, MATLAB i drugi softveri koji se mogu prilagoditi potreba- ma korisnika. Konačno, Big Data analitika je usko povezana sa naprednim formama vizuelizacije podataka, za koju se često ka- že da je „najbolji prijatelj“ Big Data anali- tike. Zapravo, vizuelizacija podataka pred- stavlja nezaobilazni element Big Data ana- litike i njene primene u cilju unapređenja poslovanja. Primena Big Data analitike Uobičajeno je mišljenje da se Big Data analitika u najvećoj meri primenjuje u obla- sti informacionih tehnologija. Međutim, činjenica je da se Big Data analitika danas primenjuje i u drugim oblastima, i to ne sa- mo u oblasti poslovanja, nego i u oblasti svakodne- vnog života. Naravno, zbog razvoja koji se događa veoma velikom brzinom, Big Da- ta analitika svoju osnovnu primenu nala- zi u oblasti rada sa informacionim tehno- logijama, odnosno u oblasti obrade digi- talnih podataka. Kao što je napomenuto u prethodnom tekstu, digitalni svet predstav- lja najdinamičniji deo poslovnog sveta današnjice. U digitalnom svetu se svakog trenutka generišu terabajti i terabajti po- dataka, što kroz korišćenje Internet pretra- živača, što kroz korišćenje društvenih mreža i mreža za deljenje sadržaja, što kroz poslovnu razmenu podataka. Važno je znati da svaka kompanija, kao što su npr. najveći svetski proizvođači lekova, pa i sva- ki mali učesnik na farmaceutskom tržištu, kao što su npr. apoteke, svakodnevnim ko- rišćenjem Interneta ostavljaju trag u digi- talnom svetu i generišu velike količine po- dataka koji adekvatno mogu biti obrađe- ni jedino upotrebom Big Data analitike. Pri- mera radi, privatna apoteka može imati na- loge na svim društvenim mrežama, može imati svoj sajt koji ima određenu poseće- nost, može na dnevnoj osnovi vršiti na sto- tine upita na Google pretraživaču i može imati aktivnu dnevnu E-mail komunikaci- ju. Sve ove aktivnosti generišu velike seri- je digitalnih podataka koji ne govore samo o načinu upotrebe informacionih resursa (količine poslatih podataka, vreme potre- bno za realizaciju pojedinačnih aktivnosti, logovi na računarima itd), nego i o karak- teristikama osoba sa kojima se vrši in- terakcija i karakteristikama samih zaposlenih (socio-kulturne i psi- hografske karakteristike potro- šača, interesovanja zaposle- nih, vremenska dinamika in- terakcija na društvenim mre- žama, zahtevi za pretraživa- nja na Google pretraživaču itd). Pritom, ovo što je ovde napomenutojesamodelićin- formatičkih potencijala za ge- nerisanje velikih serija podata- ka. Danas više nego ikad upotre- ba informacionih tehnologija i rad u digitalnom svetu otvaraju ne- slućene mogućnosti analize podataka u cilju unapređenja poslovanja i apoteka i far- maceutskih kompanija i svih drugih uče- snika na tržištu. Prirodno, Big Data analitika nalazi svoju veliku primenu i u oblasti telekomu- nikacija, koje se često nazivaju „mlađom sestrom“ informacionih tehnologija. Pored toga što je informatički uvezan, svet dana- šnjice je uvezan i telekomunikacijama. Štaviše, danas se ne govori o ova dva sek- tora pojedinačno, nego se sve češće kori- sti izraz „informaciono-komunikacione tehnologije“ (Information and Communi- cation Technologies – ICT). Najvažniji aspekt telekomunikacija su mobilne komu- nikacije. Svakog dana operateri mobilnih komunikacija generišu ogromne količine podataka koji se odnose na telefonske razgovore, SMS i MMS poruke, korišćenje mobilnog Interneta, lokaciju korisnika mobilne telefonije i njihovo kretanje (geo- lokaciju), interkonekciju među operateri- ma mobilne telefonije, korišćenje mobil- nih telefona u inostranstvu (Roaming) itd. Kao i kod informacionih tehnologija, i telekomunikacije omogućavaju velikim farmaceutskim kompanijama, ali i veledro- gerijama, apotekama, ugovornim istraži- vačkim organizacijama (CROs) i drugim učesnicima na farmaceutskom tržištu da prikupe i analiziraju velike serije podata- ka vezanih za kupce i potrošače, za konku- rente, za sopstvene zaposlene i za ostale subjekte,itosamonaosnovuupotrebemo- bilnih komunikacija. Naravno, i u ovom slu- čaju, potrebni su kapaciteti Big Data ana- BB-INFORMATOR / AVGUST 2015. / 243 27 Matematika i statistika Oblast poslovne primene (npr. medicina) Informacione tehnologije Tradicionalna istraživanja Tradicionalni softveri Mašinsko učenje Big Data analitika Nauka o podacima TehnikeTehnologije Podaci
  • 3.
    litike da bise ovi podaci pretvorili u upo- trebljive poslovne informacije i preporu- ke. Big Data analitika veoma veliku upo- trebu ima i u finansijskom sektoru. Obzi- rom da su skoro sve finansijske transakci- je danas automatizovane, podaci iz finansij- skog sektora su veoma upotrebljivi u Big Data analitici. Primera radi, samo u okvi- ru jednog minuta se u svetu obavi preko 3.500 transkcija na berzama i nekoliko mi- liona bankarskih transakcija. Svi ovi poda- ci su itekako upotrebljivi za farmaceutske kompanije i druge učesnike na farma- ceutskom tržištu, uključujući i same apo- teke. Ako ništa drugo, one mogu da pruže okvir za sagledavanje dinamike tržišta i pro- cesakojisedogađajuumakroekonomskom okruženju. Međutim, to nije sve. Svaka fir- ma, bilo da je ona veliki proizvođač leko- va ili mala apoteka, dnevno najčešće gene- riše na stotine finansijskih transakcija prodajom i nabavkom robe i usluga i rea- lizacijom plaćanja za razne namene. Big Da- ta analitika svima njima omogućava da ove podatke obradi u celosti, u najkraćem mo- gućem roku i da na osnovu njih vizuelizu- je dobijene rezultate koji se mogu koristi- ti na dnevnoj osnovi za unapređenje poslo- vanja. Kada se govori o finansijskom sektoru, prirodno se nameće pitanje sektora mar- ketinga i prodaje, gde se otvara jedna sa- svim nova dimenzija upotrebe Big Data analitike. Mnogi smatraju da Big Data analitika, posle ICT sektora, ima najveću pri- menu u oblasti marketinga i prodaje. Praktičnodanemaoblastimarketingaipro- daje u kojoj se Big Data analitika ne može primeniti. Pogledajmo, primera radi, oblast oglašavanja, odnosno reklamiranja (Adver- tising). Čak i obična promotivna poruka apoteke koja je upućena preko par onlajn i oflajn medija može da generiše veliku ko- ličinu podataka, od profila ciljnih potroša- ča, preko njihovih navika, kulturoloških obrazaca i psihografskih karakteristika, pa sve do penetracije na tržište i broja ostav- ljenih utisaka na potencijalne potrošače. Ili pogledajmo na primer oblast istraživa- nja tržišta (Market Research). Savremena istraživanja tržišta su otišla mnogo dalje od običnih terenskih istraživanja. Danas istraživači koriste digitalne tehnologije na veoma velikim uzorcima i brojne psiho- fizičke metode motivacionih (kvalitativnih) istraživanja. Primena Big Data tehnologi- ja je preduslov za analizu rezultata dobije- nih istraživanjem i donošenja pravih po- slovnih odluka na osnovu toga. Konačno, što je svakako vidljivo svuda oko nas, sa- mi procesi prodaje, naplate i upravljanja od- nosima sa potrošačima generišu velike ko- ličine Big Data podataka. Pomenuti proce- se prodaje, nabavke, obrta kupaca, servisa potrošača, rada u Call centrima itd. je sva- kako nedovoljno da ilustruje u kojoj me- ri procesi prodaje i brige o potrošačima (Cu- stomer Care) mogu da pruže velike količi- ne upotrebljivih podataka čak i za male tr- žišne učesnike kao što su apoteke. Naravno, Big Data analitika nalazi svo- ju primenu i izvan poslovnog sveta. Možda najvažnija njena primena, koja će imati sve veći značaj u budućnosti jeste sektor bez- bednosti. U sektoru bezbednosti svakod- nevno se radi ne sa terabajtima, nego sa pe- tabajtima podataka. Rad obaveštajnih i kon- traobaveštajnih službi, rad vojske i polici- je, rad bezbednosnih agencija prožet je ogromnim količinama podataka vezanih za dinamiku celokupne populacije jedne zemlje. Prediktivna analitika omogućava da se preventivni rad podigne na najviši mogući nivo i da se pravovremeno identi- fikuju bezbedonosne pretnje, kao što su pretnje terorističkih napada. Procenjuje se da samo sektor bezbednosti konzumira iz- među 5% i 10% potencijala Big Data tržišta. Međutim, Big Data analitika ima i veliku upotrebu u razvoju fundamentalnih i primenjenih nauka, od astronomije, astro- fizike i kvantne fizike, preko biologije, medicine i farmacije, pa sve do geologije, klimatologije i seizmologije. Dovoljno je na- vesti samo dva primera. Veliki hadronski sudarač čestica (Large Hadron Collider – LHC), najveći sudarač čestica na svetu ko- ji je deo projekta Evropskog saveta za nu- klearna istraživanja (Conseil Européen pour la Recherche Nucléaire – CERN) nika- da ne bi mogao da pruži odgovore na fundamentalna pitanja fizike i univerzu- ma da nije alata i tehnika Big Data analiti- ke. Bilo bi suvišno govoriti o tome koja ko- ličina podataka o partikularnim česticama se generiše samo u okviru jednog ekspe- rimenta u velikom hadronskom sudaraču čestica, a kamoli o potencijalima Big Data analitike u svemirskim istraživanjima. Drugi primer su seizmologija i geologija. Najsofisticiranije tehnike prediktivne ana- litike danas mogu kao nikada pre da omo- guće predviđanje prirodnih katastrofa kao što su zemljotresi, erupcije vulkana ili po- plave. Tehnike Big Data analitike se ne ko- riste samo u predviđanju prirodnih kata- strofa. One se danas koriste i u komercijal- ne svrhe, kao što je npr. pronalaženje na- ftnih bušotina na osnovu analize velikih serija geoloških podataka (npr. prednosti ove tehnologije koristi kompanija Shell). Big 28 BB-INFORMATOR / AVGUST 2015. / 243 POSLOVANJE Aktuelno Jedan od najboljih primera kako se prediktivna analitika u kombinaciji sa informacionim tehnologijama može iskori- stiti za razvoj inovacija je ADMS (Advanced Distribution Ma- nagement System) softver, koji je razvila novosadska kom- panija Schneider Electric DMS, na čelu sa profesorom Draganom Popovićem. ADMS je već treću godinu zaredom rangiran od strane konsultantske kuće Gartner (koja je poz- nata po tome što je prva dala definiciju Big Data) kao najbolji softver na svetu koji koristi pametne mreže (Smart Grids) za daljinsko upravljanje elektroenergetskim distributivnim si- stemima. ADMS softver je nastao upravo kao rezultat pri- mene tehnika prediktivne analitike na veliki broj podataka koji se generišu tokom proizvodnje i distribucije električne energije.
  • 4.
    Data analitika nalazisvoju primenu i u sportuinutricionizmu. Ne samo što su ala- ti i tehnike Big Data analitike omogućili da se izvrši analiza velikih serija podataka ko- ji se generišu na sportskim takmičenjima, već su omogućile da se izvedu fundamen- talne statistike i izvrše predviđanja rezul- tata (verovatnoće događaja) određenih sportskih manifestacija. Pored toga, nutri- cionistički podaci i podaci koji se generi- šu za veoma veliki broj namirnica koje se koriste u ishrani omogućavaju bolje razu- mevanje metaboličkih procesa i inače unapređenje ličnog i javnog zdravlja. Kao što se može videti, broj oblasti u kojima se mogu koristiti potencijali predik- tivne analitike je zaista velik. Elaboracija mogućnosti upotrebe Big Data analitike u svim oblastima bi oduzela dosta vremena, ali je svakako od značaja ukazati na moguć- nosti upotrebe Big Data analitike u oblasti medicine i farmacije. Big Data analitika u medicini i farmaciji Dok je u oblastima kao što su informa- ciono-komunikacione tehnologije, finansi- je i sistem bezbednosti Big Data analitika značajno odmakla u pogledu korišćenja po- tencijala, za oblast medicine se može reći da je Big Data analitika tek zagrebala povr- šinu, što govori o njenim neslućenim po- tencijalima u ovoj oblasti. Kada se razmi- šlja o potencijalima primene Big Data analitike u medicini, često se razmišlja o futurističkim konceptima kao što su raz- voj 100% efikasnih bioloških lekova, 100% tačno predviđanje bolesti, produženje ži- votnog veka na preko 100 godina ili pot- puna kontrola ljudskog genoma. Mnogi predviđaju da budućnost Big Data analiti- ke, pored informaciono-komunikacionih tehnologija, leži upravo u oblasti medici- ne. Oblasti medicine i farmacije obilujuBig Data podacima. Big Data podaci u medi- cini i farmaciji dolaze iz internih i ekster- nih izvora, u raznim formatima, sa različi- tih lokacija i u različitim pojavnim oblici- ma. Samo neki od podataka koji se gene- rišu u oblasti medicine i farmacije su po- daci sa senzora koji mere vitalne znake pa- cijenata, biometrijski podaci, podaci veza- ni za ljudski genom, podaci vezani za kli- nička ispitivanja, podaci vezani za praće- nje neželjenih reakcija, podaci vezani za re- gistraciju lekova, epidemiološki podaci, la- boratorijski podaci, administrativni poda- ci, podaci vezani za digitalnu komunikaci- ju i mnogi drugi. Prema nekim izveštajima, zdravstveni sistem SAD je u 2014. godini premašio iznos od 1 zetabajta podataka (1021 bajtova), a u bliskoj budućnosti se oče- kuje da će dostići nivo od nekoliko jotabaj- ta podataka (1024 bajtova). Danas se u oblasti medicine razvijaju novi termini kao što su medicinska infor- matika, bioinformatika i neuroinformati- ka i pojavljuje se sve veći broj inicijativa za obradu velikih količina podataka. Prime- ra radi, na osnovu iskustava koje su dobi- li u okviru Projekta ljudskog genoma (Hu- man Genome Project – HGP), koji je trajao od 1984. do 2003. godine, EU i SAD su za- počele nove projekte bazičnih medicinskih istraživanja sa velikim količinama podata- ka. Tako je EU 2013. godine otpočela sa Pro- jektom ljudskog mozga (Human Brain Project – HBP), a iste godine SAD su otpo- čele sa BRAIN inicijativom (Brain Research through Advancing Innovative Neuro- technologies), za koju je lično predsednik SAD rekao da bi trebala da rezultira u ne- koliko jotabajta podataka koji će biti obra- đeni Big Data analitičkim metodama. Ta- kođe, Nacionalni institut za zdravlje SAD je 2012. godine otpočeo sa inicijativom Big Data to Knowledge (BD2K), čiji je cilj una- pređenje upotrebe Big Data analitike u me- dicinskim istraživanjima. Ovome treba dodati i Pitsburšku alijansu za zdravstve- ne podatke (Pittsburgh Health Data Allian- ce) koja ima za cilj da integriše podatke iz velikog broja izvora (medicinski podaci, ge- netski podaci, senzorski podaci itd) u cilju profilisanja pojedinačnih pacijenata koji- ma će biti ponuđene potpuno prilagođe- ne terapije. Oblasti primene Big Data analitike u medicini i farmaciji su velike. Ukoliko se posmatraju npr. istraživanja ljudskog ge- noma, u okviru kojih se barata sa cifrom od preko 240 miliona baznih parova ACTG baze u okviru hromozoma, odnosno od ne- BB-INFORMATOR / AVGUST 2015. / 243 29 Upotrebom tradicionalnih analitičkih metoda, dekodiranje ljudskog genoma bi trajalo preko 10 godina. Upotrebom Big Data analitike ljudski genom se može dekodirati za nešto više od 7 dana, po ceni od nekoliko stotina dolara.
  • 5.
    koliko milijardi kombinacijaACTG baze u ljudskom genomu, lako se može zaključi- ti da samo to proizvodi 2 terabajta sirovih podataka, za čije dekodiranje je danas po- trebno samo nekoliko dana. Pritom treba imati u vidu da čak 98% ljudskog genoma predstavlja tzv. „Junk DNA“, odnosno DNK materijal koji nije funcionalno upotrebljiv, ali koji može da pruži značajne informaci- jezamedicinskaistraživanjainapredakme- dicinke nauke. Big Data analitika ima ve- liku mogućnost primene i u kliničkim istraživanjima. Nije teško zamisliti na ko- ji način Big Data analitika može da trans- formiše podatke iz istraživanja nekoliko no- vih hemijskih jedinjenja (New Chemical En- tity – NCE) koja se sprovode policentrično na nekoliko hiljada ljudi prateći pritom ne- koliko stotina parametara za svaki mole- kul i svakog pacijenta posebno. Među- tim, to nije sve. Podaci koji se mogu dobi- ti na osnovu analize velikih serija podata- ka o populaciji i prevalenci bolesti u popu- lacijimogudapomognudasekliničkaistra- živanja usmere na one pacijente koji će po- kazati najverodostojnije rezultate u klini- čkim ispitivanjima lekova. Posebne moguć- nosti primene Big Data analitike leže u ra- du sa populacionim podacima. Preve- lanca oboljenja, epidemiološki podaci o bo- lestima, stopa oboljevanja, stopa smrtno- sti, dužina trajanja lečenja, najčešće kori- šćeni tretmani i podaci o osiguranicima u okviru zdravstvenog sistema samo su ne- ki od populacionih podataka koji se mogu integrisati i obraditi uz pomoć Big Data ana- litike. Naravno, na ovo se nadovezuje i vi- soko-efikasno profilisanje pacijenata. Praćenjem velikih serija podataka o poje- dinačnim pacijentima zdravstvene vlasti mogu obezbediti ne samo veću umreže- nost, nego i bolji pristup adekvatnim tret- manima za pacijente. Profilisanje pacijena- ta između ostalog obuhvata i segmentaci- ju pacijenata, psihografske i demograf- ske karakteristike pacijenata, psihološke ka- rakteristike pacijenata, njihovu kompletnu medicinsku dokumentaciju i istoriju bole- sti i mnoge druge podatke koji mogu biti od koristi u njihovom profilisanju. Nara- vno, ovo su samo neke od oblasti u kojima Big Data analitika ima svoju primenu. Ne treba ispustiti iz vida da Big Data analiti- ka ima svoju primenu i u brojnim drugi oblastima medicine i farmacije kao što su unapređenje rada zdravstvenog sistema, unapređenje rada nacionalnih agencija za lekove, unapređenje rada sistema zdrav- stvenog osiguranja itd. Postavlja se pitanje kako apoteke, bol- nice i farmaceutske kompanije mogu prak- tično da primene Big Data analitiku. Mo- žda odgovor na ovo pitanje daje primer mnogih bolnica koje su primenom Big Da- ta softverskih rešenja omogućile integra- ciju i obradu kompleksnih podataka iz različitih izvora kao što su laboratorijski re- zultati, dijagnostički podaci, istorijat bole- sti pacijenata i članova njihovih porodica, administrativni bolnički podaci o pacijen- tima, podaci o tretmanima i ispitivanjima, podaci o kapacitetima bolnica itd. Ili mo- žda odgovor na ovo pitanje mogu da daju pojedini lanci apoteka koji su uveli princip praćenja svih relevantnih poslovnih poda- taka (zalihe, potraživanja, cene, prodaja, eksterni uslovi, zdravstveni sistem itd) kroz napredne tehnike poslovne inteligen- cije (Business Intelligence – BI). Praktično svaki poslovni subjekt, bilo da je to farma- ceutska kompanija, ugovorna istraživa- čka organizacija, veledrogerija, apoteka ili zdravstvena ustanova, može u manjoj ili većoj meri da primeni principe Big Data analitike na sve podatke koje njihovo po- slovanje generiše i da na osnovu toga ostvari dugoročnu konkurentsku pred- nost na tržištu. Izazovi budućeg razvoja Big Data analitike u medicini Nesumnjivo je da su potencijali primene Big Data analitike u oblasti medicine i far- macije ogromni. Zajedno sa potencijalima idu i izazovi koje je potrebno savladati ka- ko bi primena bila što efikasnija. Na ovom mestu ukratko ukazujemo na osnovne izazove. Prvi i osnovni izazov je integraci- ja podataka. Naima, postavlja se pitanje ka- ko integrisati veoma veliku količinu razno- vrsnih podataka koji se generišu u oblasti medicine i farmacije, koji su često ne- strukturirani i koji se generišu veoma ve- likom brzinom. Za razliku od primene Big Data analitike u drugim oblastima, in- tegrisati podatke u oblasti medicine je posebna vrsta izazova na kojoj već rade mnoge kompanije i institucije širom sve- ta. Drugi izazov je kako obezbediti umre- žavanje i kolaboraciju svih učesnika u zdravstvenom sistemu jedne zemlje. Nai- me, postavljaju se pitanja tehnika i princi- pa umrežavanja zdravstvenih vlasti, zdrav- stvenihustanova,istraživačkihiobrazovnih ustanova, proizvođača lekova, trgovina lekovima,pacijenata,stručnejavnostiiosta- lih učesnika u sistemu zdravstva. Zbog to- ga je od posebne važnosti razvijati e- zdravstvo na svim njegovim nivoima. Tre- ći izazov predstavlja primena informacio- nih tehnologija u zdravstvu. Zdravstvo i farmaceutska industrija su toliko veliki kompleks institucija, kompanija, procesa i pravila da je potrebno još vremena da bi informacione tehnologije u okviru njih do- vele u stanje potpune operativnosti za ši- roku primenu Big Data analitike. I za to će biti potrebno vreme. Posebnu vrstu izazo- va predstavlja razvoj novih prediktivnih modela specijalizovanih za oblast zaštite zdravlja. Potreba za razvojem novih predik- tivnih analitičkih modela proizilazi iz kompleksnosti medicine kao nauke i veli- ke količine raznovrsnih podataka koji se u okviru nje pojavljuju. Ovo je posebno va- žno imajući u vidu velike ciljeve kao što su predikcija bolesti, predikcija populacio- nih kretanja ili predikcija epidemioloških kretanja. I konačno, izazov za budući raz- voj Big Data analitike predstavlja i način na koji će biti sprovedena personalizacija zdravstvene zaštite. Koji podaci će biti in- tegrisani, na koji način će biti obrađivani i kako obezbediti učešće široke baze paci- jenata za potrebe personalizacije su samo neki od problema u ostvarivanju sna o per- sonalizovanoj zdravstvenoj zaštiti. 30 BB-INFORMATOR / AVGUST 2015. / 243 POSLOVANJE Aktuelno Prikupljanje podataka više nije izazov. Izazov je naći skrivene obrasce u njima.