SlideShare a Scribd company logo
1 of 5
Download to read offline
Pojam Big Data
Dve osnovne karakteristike savreme-
nih uslova poslovanja u farmaciji su rastu-
ća dinamičnost i rastuća kompleksnost. Ra-
stuća dinamičnost se ogleda u procesu stal-
nih promena u okruženju, koje su duboke,
sveobuhvatne i vrlo intenzivne, dok se ra-
stuća kompleksnost ogleda u rastu broja
elemenata koji utiču na poslovanje, kao i
rastu njihovih međusobnih veza. Jedan od
faktora koji doprinose rastućoj komple-
ksnosti poslovanja jeste i eksponencijalni
rast količine dostupnih podataka, koji pre
svega predstavlja rezultat razvoja informa-
cionih tehnologija i Interneta, odnosno har-
dverskih (kapaciteti za skladištenje i obra-
du podataka) i softverskih kapaciteta (raz-
voj novih aplikacija). Prema rečima Erika
Šmita, predsednika kompanije Google,
od nastanka civilizacije do 2003. godine
kreirano je ukupno 5 egzabajta1 podataka,
što predstavlja količinu podataka koja se da-
nas kreira u roku od dva dana. Ovaj enorm-
ni rast dostupnih podataka karakterističan
je za skoro sve oblasti života i poslovanja,
od ishrane, sporta i razonode, preko trgo-
vine, finansija, medicine i telekomunika-
cija, pa sve do upravljanja bezbednosnim
sistemom i zaštite životne sredine. Ova hi-
perprodukcija podataka zahteva nove pri-
stupe u njihovoj obradi koji su bazirani na
upotrebi informacionih tehnologija – teh-
nologija koje prevazilaze ograničenja u po-
gledu analitičkih kapaciteta ljudi. To je do-
velo do razvoja potpuno nove dimenzije u
analizi podataka koja se naziva Big Data
Analytics ili „analitika velikih količina po-
dataka“.
Šta ustvari predstavlja pojam Big Da-
ta? Najkraće rečeno, Big Data predstavlja
onu količinu podataka koja prevazilazi
mogućnosti uobičajeno korišćenih računa-
rskih tehnika za njihovo skladištenje i
obradu. Ili jednostavno rečeno, Big Data
predstavlja sve ono što prevazilazi kapaci-
tete programa Excel i Access. Prema defi-
niciji kompanije META Group, Big Data
predstavlja informacioni resurs koji se
POSLOVANJE
Aktuelno
38 BB-INFORMATOR / JUL 2015. / 242
BIG DATA ANALITIKA PREDSTAVLJA POJAM KOJI SE ODNOSI NA PRIMENU NAPREDNIH TEHNIKA ANA-
LIZE VELIKIH KOLIČINA PODATAKA ČIJE GENERISANJE SE SVE VIŠE UBRZAVA. SVOJU PRIMENU NALAZI
U MNOGIM OBLASTIMA POSLOVANJA, A NAROČITO U OBLASTI MEDICINE. UKOLIKO SE PRAVILNO UPO-
TREBI, BIG DATA ANALITIKA MOŽE STVORITI USLOVE ZA IZGRADNJU ODRŽIVE KONKURENTSKE
PREDNOSTI NA TRŽIŠTU, ŠTO JE OD POSEBNOG ZNAČAJA ZA FARMACEUTSKE KOMPANIJE.
AUTOR: IGOR LAZAREVIĆ, AVENTIN PARTNERS
Big Data
u farmaciji
i medicini
1
Inače, merne jedinice za kapacitete skladištenja podataka obuhvataju bajt (B), kilobajt (kB), megabajt (MB), gigabajt (GB), terabajt (TB), petabajt (PB), egzabajt (EB), zetabajt (ZB) i
jotabajt (YB). O kolikim veličinama je ovde reč najbolje govori podatak da 1 egzabajt obuhvata 1 milijardu gigabajta, odnosno da je ukupna količina podataka na Internetu na kraju 2013.
godine iznosila 4 zetabajta, odnosno 4 miliona egzabajta, odnosno da ljudski rod još uvek nije dostigao iznos od 1 jotabajta skladištenih podataka na jednom mestu.
Prema podacima iz kompa-
nije Cisco Systems, počet-
kom 2015. godine u svetu je
bilo preko 25 milijardi elek-
tronskih uređaja koji se
mogu povezati na Internet,
što znači da je prosečan broj
uređaja po čoveku bio 3,5. To
otvara neslućene mogućno-
sti povezivanja i generisanja
novih podataka.
sastoji od podataka velike količine, velike
brzine i velike raznovrsnosti koji zahteva
nove i inovativne metode obrade i optimi-
zacije tih podataka, što rezultira u boljem
uvidu u sadržaj tih podataka i unapređe-
nju procesa donošenja odluka2. Prema
definiciji autora sa Bliskog Istoka, Big Da-
ta predstavlja skup tehnika i tehnologija ko-
je su bazirane na novim formama integra-
cije velikih količina složenih i raznovrsnih
podataka, a koje imaju kapacitet da otkri-
juskrivenevrednostikojesusadržaneutim
podacima3. Na osnovu toga, može se reći
da definicija Big Data obuhvata četiri
osnovna elementa: (1) kompleksnost po-
dataka, u smislu generisanja veoma veli-
kih količina raznovrsnih podataka koje se
vrši veoma velikom brzinom, (2) inovativ-
ne metode obrade podataka, u smislu po-
trebe primene inovativnih metoda skladiš-
tenja i obrade tako generisanih podataka,
koje su bazirane na upotrebi savremenih
informacionih tehnologija i naprednih
tehnika statistike, (3) pronalaženje skrive-
nih vrednosti na bazi upotrebe savreme-
nih informacionih tehnologija i naprednih
tehnika statistike, i (4) brže i bolje odluči-
vanje, koje je bazirano na otkrivanju skri-
venih vrednosti sadržanih u velikim seri-
jamakompleksnihpodataka.Kaoštojeuka-
zano u definiciji kompanije META Group,
koncept Big Data je baziran na tri osnovne
dimenzije, koje čine „3V koncept“ Big
Data. To su količina, brzina i raznovrsnost.
• Količina podataka (Volume ili „Data
at Rest“) predstavlja prvu i najvažniju di-
menziju Big Data koncepta. Prema poda-
cima iz kompanije IBM, 90% podataka ko-
ji danas postoje kreirano je u poslednje dve
godine. S druge strane, prema podacima
McKinsey Global Institute, očekuje se da će
količina generisanih podataka na global-
nom nivou da raste po prosečnoj godišnjoj
stopi od 41% i da će u periodu od 2008. do
2020. godine ta količina biti uvećana 44 pu-
ta, sa 0,8 zetabajta u 2008. godini na 35 ze-
tabajta u 2020. godini. O kojoj količini po-
dataka se govori najbolje govori podatak
da se dnevno na Fejsbuku generiše 10, a na
Tviteru 7 terabajta podataka.
• Brzina generisanja podataka (Veloci-
ty ili „Data in Motion“) predstavlja drugu
dimenziju Big Data koncepta. Primera ra-
di, u okviru jednog minuta u svetu se
obavi preko 3.500 transakcija na berzama,
potroši se preko 3 miliona dolara na onlajn
kupovinu, pošalje se preko 200 miliona
imejlova, obavi se preko 2 miliona pretra-
ga na Guglu (3,5 milijarde dnevno), posta-
vi se preko 700.000 novih sadržaja na Fejs-
buku i preko 400.000 na Tviteru, postavi
se preko 600 novih video sadržaja na Ju-
tjub, obavi se preko 400.000 minuta raz-
govara preko Skajpa i napiše se preko
1.500 blog postova.
• Raznovrsnost podataka (Variety ili
„Data in Many Form“) predstavlja treću di-
menziju Big Data koncepta. Preko 80% po-
dataka koji se danas generiše su nestruk-
turirani podaci. To su podaci koji su hete-
rogenog karaktera i sa kojima se ne mogu
vršiti klasične aritmetičke operacije. Pojav-
ljuju se u raznim formama, kao što su au-
dio fajlovi, video fajlovi, tekstualni fajlovi
itd. Oko 10% podataka koji se danas gene-
riše su polustrukturirani podaci. To su
uglavnom podaci koji se lako mogu trans-
formisati u formu pogodnu za vršenje
klasičnih aritmetičkih operacija, kao što su
npr. podaci koji se dobijaju putem Web ana-
litike. Konačno, samo 10% podataka pred-
stavljaju strukturirane podatke. To su po-
daci koji nastaju upotrebom raznih anali-
tičkih sredstava kao što su poslovne ana-
litike, baze podataka itd.
Pojedini autori na ove tri dimenzije do-
daju i druge dimenzije, čineći tako proši-
reni Big Data koncept. S jedne strane,
pojedini autori dodaju i dimenziju pouz-
danosti podataka (Veracity), čineći tako „4V
koncept“, dok s druge strane, pojedini au-
tori dodaju još i dimenzije vrednosti (Va-
lue) i delotvornosti (Viscosity), čineći tako
prošireni „6V koncept“.
Big Data i poslovna analitika
Važno je imati u vidu da pojam Big Da-
ta ne treba poistovećivati samo sa velikim
količinama raznovrsnih podataka, već i sa
tehnikama koje se koriste u obradi tih po-
dataka i načina donošenja zaključaka i
važnih poslovnih odluka na bazi toga.
Zbog toga se češće koristi pojam Big Data
Analytics ili „analitika velikih količina po-
dataka“, čija je svrha pronalaženje skrive-
nih obrazaca u podacima i generisanje in-
formacija za donošenje važnih poslovnih
odluka, što se postiže primenom napred-
nih tehnologija i naprednih statističkih teh-
nika.
Big Data je transformisao pojmove
analitike i poslovne inteligencije (Busi-
ness Intelligence). Analitika kakvu poznaj-
emo (Traditional Approach), koja je bila ba-
zirana na analizi parcijalnih podataka na
bazi upotrebe standardnih alata i tehnika
i koja se uglavnom vršila Ex-Post sa cilje-
BB-INFORMATOR / JUL 2015. / 242 39
2
Ovu definiciju je dao Daglas Lani u okviru istraživanja koje je 2001. godine sproveo u ime kompanije META Group (danas Gartner Inc). Izvor: Laney, Douglas (2001), Application Delivery
Strategies – 3D Data Management: Controlling Data Volume, Velocity and Variety, META Group
3
Ibrahim; Targio Hashem, Abaker; Yaqoob, Ibrar; Badrul Anuar, Nor; Mokhtar, Salimah; Gani, Abdullah; Ullah Khan, Samee (2015), The Rise of “Big Data” on Cloud Computing: Review and
Open Research Issues, Information Systems, Vol. 47, str. 98-115
Parametar Tradicionalna analitika Big Data analitika
Obuhvat podataka Analiza dela podataka (Partial Data) Analiza svih podataka (All Data)
Izvori podataka Mali broj homogenih izvora podataka Veliki broj heterogenih izvora podataka
Tehnike obrade podataka
Standardni alati i tehnike (klasični softveri,
klasične statističke tehnike )
Napredni alati i tehnike (napredni softveri, napredne
statističke tehnike)
Vreme obrade podataka Nakon generisanja podataka (Ex-Post) U toku generisanja podataka (Real-Time)
Intenzitet obrade podataka Povremena obrada podataka (Ad-Hoc) Kontinuirana obrada podataka
Ciljevi obrade podataka Dijagnoza i opis događaja Analiza ponašanja i predviđanje događaja
Vrste izveštaja Standardni jednoobrazni izveštaji Složeni kompleksni izveštaji
vima dijagnostikovanja i deskripcije, sve vi-
šeustupamestonaprednojanalitici(BigDa-
ta Approach), koja je bazirana na analizi ce-
lokupnih podataka na bazi upotrebe savre-
menih informacionih tehnologija i na-
prednih metoda statističke obrade poda-
taka, koja se vrši u realnom vremenu
(Real-Time) sa ciljem predviđanja budućih
događaja.
Može se reći da je koncept poslovne
analitike ili poslovne inteligencije evolui-
rao u četiri faze. U prvoj fazi, koja se nazi-
va fazom dijagnostičke analitike (Diagno-
stic Analytics) akcenat je na dijagnostiko-
vanju problema i pronalaženju naknadnih
načina za njihovo rešavanje. U drugoj fa-
zi, koja se naziva fazom deskriptivne
analitike (Descriptive Analytics) akcenat
je na dijagnostikovanju problema, ali i na
opisu uzroka i posledica nastalih proble-
ma, kao i iznalaženju načina za njihovo re-
šavanje. U trećoj fazi, koja se naziva fazom
prediktivne analitike (Predictive Analy-
tics) akcenat je na predviđanju budućih
problema na bazi prethodnih iskustava,
kao i na merama prevencije posledica. U
četvrtoj fazi, koja se naziva fazom preskrip-
tivne analitike (Prescriptive Analytics)
akcenat je na kompleksnoj analizi pona-
šanja koje dovodi do nastanka budućih
problema, te stoga i na razvoju metoda i
pristupa koji utiču na željeno ponašanje
ciljnih subjekata.
Prediktivna analitika (Predictive Ana-
lytics) inače predstavlja skup naprednih ala-
ta i tehnika koje se koriste u analizi velikih
serija sadašnjih i prošlih podataka kako bi
se predvideli budući događaji na bazi iden-
tifikovanih obrazaca ponašanja. U osnovi
prediktivne analitike, i inače Big Data ana-
litike, je upotreba savremenih informacio-
nih tehnologija, kao što su Hadoop i MAT-
LAB softverska rešenja, i naprednih tehni-
ka statistike, kao što su napredne tehnike
regresione analize i napredne tehnike ma-
šinskog učenja.
Ono što je važno znati je da je glavni po-
kretač Big Data analitike vrednost podata-
ka. Prema Piteru Sondergardu iz kompa-
nije Gartner Research, „informacija je na-
fta XXI veka, a analitika je parna mašina bu-
dućnosti“. Kompanije sve više prepoznaju
podatke kao resurs (Data as an Asset) ko-
ji im omogućava da primenjuju superior-
ne strategije i grade održivu konkurentsku
prednost na bazi upravljanja informacija-
ma. Zbog toga, dolazi do rapidnog rasta Big
Data tržišta u svetu. Prema podacima
McKinsey Global Institute, globalno Big Da-
ta tržište raste po prosečnoj stopi od 46%
godišnje. Ovo tržište je u 2011. godini vre-
delo 5,5 milijardi dolara, u 2012. godini 8,5
milijardi dolara, a u 2015. godini 25 milijar-
di dolara. Očekuje se da bi vrednost Big Da-
ta tržišta do 2020. godine mogla da izno-
si preko 200 milijardi dolara.
Big Data i vizualizacija podataka
Često se kaže da je vizualizacija poda-
taka (Data Visualization) „najbolji prijatelj“
Big Data analitike. Razlog je taj što su rezul-
tati analize velikih serija podataka najče-
40 BB-INFORMATOR / JUL 2015. / 242
Tradicionalna analitika Tradicionalna analitika
Napredna analitika Big Data analitika
Male serije podataka
Male serije podataka
Velike serije podataka
Velike serije podataka
Gigabajti Terabajti Petabajti Zetabajti
NiskaSrednjaVisoka
Brzina,kompleksnostitačnostpodataka
Veličina podataka
POSLOVANJE
Aktuelno
šće veoma kompleksni, te stoga zahteva-
ju primenu naprednih tehnika prezento-
vanja. Vizualizacija podataka omogućava
korisnicima brzo i lako razumevanje infor-
macija i međusobnih uzročno-posledičnih
veza. Vizualizacija podataka je i nauka i
umetnost. Nauka je zbog toga što je bazi-
rana tzv. „naučnom procesu obrade infor-
macija“ (Data Science Process), koji je ba-
ziran na prediktivnoj analitici i upotrebi na-
prednih informacionih i statističkih teh-
nika. Umetnost je zbog toga što je bazira-
na na kreativnosti i dizajnerskim sposob-
nostima analitičara koji konstantno izna-
laze nove „perceptivno prihvatljive“ nači-
ne za prezentovanje podataka. Obzirom da
je proces vizuelne percepcije povezan sa
moždanim aktivnostima i karakteristika-
ma ličnosti, vizualizacija podataka je usko
povezana sa psihologijom i neurologi-
jom.
Prema Stivenu Fjuu, postoji osam teh-
nika vizualizacije kvantitativnih podataka
koje se koriste u prediktivnoj analitici. To
su: (1) tehnike vremenskih serija, (2) tehni-
ke rangiranja, (3) tehnike upoređivanja
delova i celine, (4) tehnike devijacije, (5) teh-
nike distribucije frekvencije, (6) tehnike ko-
relacije, (7) tehnike nominalnog poređenja
i (8) tehnike geografskog ili geo-prostornog
poređenja. Kao rezultat primene ovih teh-
nika, rezultati analize velikih serija poda-
taka se najčešće prikazuju u formi stubo-
va (Bars), histograma (Histograms), dvodi-
menzionalnih i trodimenzionalnih tačka-
stih dijagrama (Scatterplots i 3D Scatter-
plots), mrežnih dijagrama (Networks), gra-
fikona tokova (Streamgraphs), mape gra-
nanja (Treemap), gantograma (Gantt
Charts), ali i u formi raznih infografika (In-
fographics), koji su sve popularniji u posle-
dnje vreme.
Big Data ekosistem
U stručnoj literaturi često se može
naići na termin „Big Data ekosistem“. Ovaj
termin se koristi da bi se fenomen Big Da-
ta opisao tako da obuhvati sve njegove ele-
mente i njegove najvažnije aspekte. Posto-
ji nekoliko načina za prikazivanje Big Da-
ta ekosistema, ali je najjednostavniji onaj
koji posmatra njegova tri osnovna „gradi-
vna bloka“ (Building Blocks), odnosno
podsistema proizvodnje, procesuiranja i
konzumiranja podataka.
• Proizvodnja podataka (Big Data Pro-
duction) obuhvata procese generisanja
velikih serija podataka u svakodnevnom
životu i poslovanju kroz upotrebu različi-
tih tehnoloških rešenja. Proizvodnja poda-
takajeproceskojijebazirannavelikombro-
ju heterogenih izvora podataka. Što se ti-
če izvora podataka, oni praktično obuhva-
taju sve oblasti života i poslovanja, među
kojima se posebno ističu informatika (po-
daci iz pretraživača, podaci sa društvenih
mreža, podaci o logovima, podaci sa serve-
ra, podaci sa Web sajtova i imejlova itd), te-
lekomunikacije (podaci o razgovorima,
podaci o SMS porukama, podaci o korišće-
nju Interneta itd), prodaja (podaci sa POS
terminala, podaci o reklamacijama itd),
marketing (baze podataka o potrošačima,
podaci o navikama potrošača itd), finansi-
je (podaci o novčanim transakcijama, po-
daci o berzanskim transakcijama, razni ak-
tuarski podaci itd), medicina (medicinska
istraživanja, medicinska dijagnostika, kli-
nička ispitivanja, istraživanja genoma itd),
sistem bezbednosti (podaci o uznemirava-
nju, podaci o terorizmu itd), geolokacijski
izvori (GPS podaci itd), senzorski izvori (po-
daci dobijeni iz senzorskih uređaja itd), raz-
ni inženjerski i naučni podaci (seizmolo-
ški podaci, hidrološki podaci, klimatski po-
daci, fizički podaci, astronomski podaci itd).
Što se tiče formata podataka, oni se pojav-
ljuju u video formatu, audio formatu, tek-
stualnom formatu, binarnom formatu i u
drugim formatima.
•Procesuiranjepodataka(BigDataPro-
cessing) obuhvata sve tehnike i tehnologi-
je uz pomoć kojih se vrši upravljanje dobi-
jenim podacima. Procesuiranje podataka
obuhvata dva osnovna elementa. Prvi ele-
ment je skladištenje podataka (Data Ware-
housing), koje obuhvata prikupljanje po-
dataka (Data Gathering), čuvanje podata-
ka (Data Storage), izvlačenje podataka (Da-
BB-INFORMATOR / JUL 2015. / 242 41
ta Mining) i bezbednost podataka (Data Se-
curity). Drugi element je obrada podataka
(Data Processing), koja je bazirana na pri-
meni savremenih metoda prediktivne
analitike.
• Konzumiranje podataka (Big Data
Consumption) obuhvata mehanizme pre-
zentovanjadobijenihrezultatainačinaupo-
trebe Big Data u cilju unapređenja poslo-
vanja. Konzumiranje podataka ima dva
osnovna elementa. Prvi element je način
prezentovanjapodatakaiodnosisenakom-
pleksne metode vizualizacije podataka.
Drugi element je upotreba podataka i od-
nosi se na upotrebu dobijenih informaci-
ja u svrhu unapređenja života i poslovanja.
Konzumenti Big Data analitike su brojni –
od kompanija, preko država i naučnih
ustanova, pa sve do pojedinaca.
Big Data tehnologije
Konačno, važno je ukazati i na značaj
Big Data tehnologija i tehnoloških rešenja,
koje predstavljaju osnovu savremene pre-
diktivne (Big Data) analitike. Kada se govo-
ri o Big Data tehnologijama važno je ima-
ti u vidu da one obuhvataju dva aspekta.
S jedne strane, to su „tehnologije“, koje se
odnose na razna softverska rešenja koja su
bazirana na savremenim informacionim
tehnologijama. S druge strane, to su „teh-
nike“, koje se odnose na kompleksne i na-
predne tehnike statističke i matematičke
obrade podataka. Praktično, Big Data teh-
nologije predstavljaju simbiozu „tehnolo-
gija“ (softvera) i „tehnika“ (statističkih ala-
ta) i na tržištu se pojavljuju u obliku zao-
kruženih softverskih rešenja koja integri-
šu ova dva parametra.
Što se tiče „tehnika“ (statistički alati),
najčešće se koriste tehnike napredne regre-
sione analize, tehnike mašinskog učenja
(Machine Learning), tehnike analize vre-
menskih serija (Time Series Analysis), teh-
nike genetičkih algoritama (Genetic Algo-
rithms), tehnike fuzije i integracije poda-
taka (Data Fusion and Integration), NLP teh-
nike, razne ekonometrijske simulacije
(npr. Monte-Carlo simulacija) itd.
Što se tiče „tehnologija“ (softvera), u po-
nudi postoji veliki broj softverskih rešenja
za Big Data analitiku. Sva ta rešenja se mo-
gu grupisati u tri osnovne kategorije. Pr-
va kategorija obuhvata Apache Hadoop
platformu, koja predstavlja Open-Source
rešenje koje se najčešće koristi u Big Data
analitici i koje je urađeno na Java platfor-
mi u cilju procesuiranja velikih količina po-
dataka putem tehnologije „kompjuter-
skih klastera“. Druga kategorija obuhvata
tzv. „Non-Hadoop“ platforme, među koji-
ma najveću upotrebu imaju platforme
kao što su MapReduce, MATLAB, Revolu-
tion R, Apache Mahout, Apache Hive, Kni-
me, Pentaho Data Integration i brojne
druge platforme. Treća kategorija obuhva-
ta tzv. „Cloud-Based Big Data Applica-
tions“, koji obuhvataju razne softvere ko-
ji koriste tehnologiju Cloud Computing-a
u svom radu.
Primena Big Data analitike
Big Data analitika ima primenu u sko-
ro svim oblastima života i poslovanja.
Međutim, najvažnije oblasti primene Big
Data analitike su u onim oblastima u ko-
jima se generišu velike količine podataka
čijom obradom se može doći do važnih po-
slovnih zaključaka. Imajući to u vidu, mo-
že se reći da Big Data analitika najveću pri-
menu ima u sledećim sektorima: (1) infor-
macione tehnologije, (2) telekomunikaci-
je, (3) finansijski sektor, (4) prodaja i mar-
keting, (5) medicina i farmacija, (6) sektor
bezbednosti, (7) zaštita životne sredine, (8)
geologija i seizmologija, (9) fizika i astro-
nomija itd.
U sledećem broju: „Primena Big Data
analitike u medicini“
42 BB-INFORMATOR / JUL 2015. / 242
POSLOVANJE
Aktuelno
Proizvodnja podataka
(Big Data Production)
Procesuiranje podataka
(Big Data Processing)
Konzumiranje podataka
(Big Data Consumption)
Skladištenje podataka
(Data Warehousing)
Prikupljanje podataka
(Data Gathering)
Iskopavanje podataka
(Data Mining)
Procesuiranje podataka
(Data Processing)
Vizualizacija podataka
(Data Visualization)
Poslovna primena
Marketing
Prodaja
Medicina
Informatika
Telekomunikacije
Bezbednost
Zaštita životne sredine
Izvori podataka:
Audio fajlovi
Video fajlovi
Tekstualni fajlovi
Internet pretraživači
Internet sajtovi
Društvene mreže
Podaci o logovima
Telekomunikacije
POS terminali
Baze potrošača
Novčane transakcije
Berzanske transakcije
Medicinska istraživanja
Medicinska dijagnostika
Fraud podaci
GPS podaci
Senzorski podaci
Seizmološki podaci
Klimatski podaci itd.
Bezbednost podataka
(Data Security)
Izvorni podaci Obrađeni podaci Komercijalizovani podaci

More Related Content

What's hot

Big data analytics with Apache Hadoop
Big data analytics with Apache  HadoopBig data analytics with Apache  Hadoop
Big data analytics with Apache HadoopSuman Saurabh
 
Gartner: Seven Building Blocks of Master Data Management
Gartner: Seven Building Blocks of Master Data ManagementGartner: Seven Building Blocks of Master Data Management
Gartner: Seven Building Blocks of Master Data ManagementGartner
 
Data strategy - The Business Game Changer
Data strategy - The Business Game ChangerData strategy - The Business Game Changer
Data strategy - The Business Game ChangerAmit Pishe
 
Smart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdfSmart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdfaminnezarat
 
Collibra - Forrester Presentation : Data Governance 2.0
Collibra - Forrester Presentation : Data Governance 2.0Collibra - Forrester Presentation : Data Governance 2.0
Collibra - Forrester Presentation : Data Governance 2.0Guillaume LE GALIARD
 
Data Governance for the Executive
Data Governance for the ExecutiveData Governance for the Executive
Data Governance for the ExecutiveDATAVERSITY
 
Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...
Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...
Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...Medicaps University
 
Istorijski razvoj interneta
Istorijski razvoj internetaIstorijski razvoj interneta
Istorijski razvoj internetaDarioNaharis
 
Chapter 4: Data Architecture Management
Chapter 4: Data Architecture ManagementChapter 4: Data Architecture Management
Chapter 4: Data Architecture ManagementAhmed Alorage
 
The Five Pillars of Data Governance 2.0 Success
The Five Pillars of Data Governance 2.0 SuccessThe Five Pillars of Data Governance 2.0 Success
The Five Pillars of Data Governance 2.0 SuccessDATAVERSITY
 
Essential Reference and Master Data Management
Essential Reference and Master Data ManagementEssential Reference and Master Data Management
Essential Reference and Master Data ManagementDATAVERSITY
 
3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatika
3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatika3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatika
3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatikaZoran Ilić
 
Driving Data Intelligence in the Supply Chain Through the Data Catalog at TJX
Driving Data Intelligence in the Supply Chain Through the Data Catalog at TJXDriving Data Intelligence in the Supply Chain Through the Data Catalog at TJX
Driving Data Intelligence in the Supply Chain Through the Data Catalog at TJXDATAVERSITY
 
Building an Effective & Extensible Data & Analytics Operating Model
Building an Effective & Extensible Data & Analytics Operating ModelBuilding an Effective & Extensible Data & Analytics Operating Model
Building an Effective & Extensible Data & Analytics Operating ModelCognizant
 
How to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityHow to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityDATAVERSITY
 
Data Architecture for Data Governance
Data Architecture for Data GovernanceData Architecture for Data Governance
Data Architecture for Data GovernanceDATAVERSITY
 

What's hot (20)

Big data analytics with Apache Hadoop
Big data analytics with Apache  HadoopBig data analytics with Apache  Hadoop
Big data analytics with Apache Hadoop
 
Gartner: Seven Building Blocks of Master Data Management
Gartner: Seven Building Blocks of Master Data ManagementGartner: Seven Building Blocks of Master Data Management
Gartner: Seven Building Blocks of Master Data Management
 
Informatika i informacije
Informatika i informacijeInformatika i informacije
Informatika i informacije
 
Training
TrainingTraining
Training
 
Data strategy - The Business Game Changer
Data strategy - The Business Game ChangerData strategy - The Business Game Changer
Data strategy - The Business Game Changer
 
Smart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdfSmart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdf
 
Collibra - Forrester Presentation : Data Governance 2.0
Collibra - Forrester Presentation : Data Governance 2.0Collibra - Forrester Presentation : Data Governance 2.0
Collibra - Forrester Presentation : Data Governance 2.0
 
Data Governance for the Executive
Data Governance for the ExecutiveData Governance for the Executive
Data Governance for the Executive
 
DMBOK and Data Governance
DMBOK and Data GovernanceDMBOK and Data Governance
DMBOK and Data Governance
 
Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...
Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...
Data Warehousing (Need,Application,Architecture,Benefits), Data Mart, Schema,...
 
Data
DataData
Data
 
Istorijski razvoj interneta
Istorijski razvoj internetaIstorijski razvoj interneta
Istorijski razvoj interneta
 
Chapter 4: Data Architecture Management
Chapter 4: Data Architecture ManagementChapter 4: Data Architecture Management
Chapter 4: Data Architecture Management
 
The Five Pillars of Data Governance 2.0 Success
The Five Pillars of Data Governance 2.0 SuccessThe Five Pillars of Data Governance 2.0 Success
The Five Pillars of Data Governance 2.0 Success
 
Essential Reference and Master Data Management
Essential Reference and Master Data ManagementEssential Reference and Master Data Management
Essential Reference and Master Data Management
 
3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatika
3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatika3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatika
3. Uvod u informatiku - Podatak i informacija. Računarstvo i informatika
 
Driving Data Intelligence in the Supply Chain Through the Data Catalog at TJX
Driving Data Intelligence in the Supply Chain Through the Data Catalog at TJXDriving Data Intelligence in the Supply Chain Through the Data Catalog at TJX
Driving Data Intelligence in the Supply Chain Through the Data Catalog at TJX
 
Building an Effective & Extensible Data & Analytics Operating Model
Building an Effective & Extensible Data & Analytics Operating ModelBuilding an Effective & Extensible Data & Analytics Operating Model
Building an Effective & Extensible Data & Analytics Operating Model
 
How to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data QualityHow to Strengthen Enterprise Data Governance with Data Quality
How to Strengthen Enterprise Data Governance with Data Quality
 
Data Architecture for Data Governance
Data Architecture for Data GovernanceData Architecture for Data Governance
Data Architecture for Data Governance
 

Similar to Big Data - pojam i značaj

BI Competence Center & Data Governance
BI Competence Center & Data GovernanceBI Competence Center & Data Governance
BI Competence Center & Data GovernanceAngelina Njegus
 
Nikola Polic, IBM
Nikola Polic, IBMNikola Polic, IBM
Nikola Polic, IBMjanasubotic
 
Baze podataka 2
Baze podataka 2Baze podataka 2
Baze podataka 2grujam
 
Domaći rad 1
Domaći rad 1Domaći rad 1
Domaći rad 1tanja_vs
 
Nasa skola 2011: Baze podataka - Stefan Nikolic -Silvana Ivkovic
Nasa skola 2011: Baze podataka - Stefan Nikolic -Silvana IvkovicNasa skola 2011: Baze podataka - Stefan Nikolic -Silvana Ivkovic
Nasa skola 2011: Baze podataka - Stefan Nikolic -Silvana IvkovicNašaŠkola.Net
 
Inteligentni transportni sistemi
Inteligentni transportni sistemi Inteligentni transportni sistemi
Inteligentni transportni sistemi eucimcorbs
 
dataLayer - istine i zablude i podaci u industriji merenja i marketingu
dataLayer - istine i zablude i podaci u industriji merenja i marketingudataLayer - istine i zablude i podaci u industriji merenja i marketingu
dataLayer - istine i zablude i podaci u industriji merenja i marketinguIvan Rečević
 
eCRM - elektronsko upravljanje odnosima sa klijentima
eCRM - elektronsko upravljanje odnosima sa klijentimaeCRM - elektronsko upravljanje odnosima sa klijentima
eCRM - elektronsko upravljanje odnosima sa klijentimaMilan Stošić
 
Arhitektura big data aplikacije (tarabica)
Arhitektura big data aplikacije (tarabica)Arhitektura big data aplikacije (tarabica)
Arhitektura big data aplikacije (tarabica)Darko Marjanovic
 
Konsalting digitalna transformacija radionica digitalni konsultanti
Konsalting digitalna transformacija radionica digitalni konsultantiKonsalting digitalna transformacija radionica digitalni konsultanti
Konsalting digitalna transformacija radionica digitalni konsultantiMiodrag Kostic, CMC
 
Business Intelligence Strategies and its role in corporate development
Business Intelligence Strategies and its role in corporate developmentBusiness Intelligence Strategies and its role in corporate development
Business Intelligence Strategies and its role in corporate developmentAngelina Njegus
 
09 Poslovni informacioni sistemi danas.pdf
09 Poslovni informacioni sistemi danas.pdf09 Poslovni informacioni sistemi danas.pdf
09 Poslovni informacioni sistemi danas.pdfssuser177bba
 
Digitalizacija proizvodnje unapredjenje proizvodnih procesa konsalting
Digitalizacija proizvodnje unapredjenje proizvodnih procesa konsaltingDigitalizacija proizvodnje unapredjenje proizvodnih procesa konsalting
Digitalizacija proizvodnje unapredjenje proizvodnih procesa konsaltingMiodrag Kostic, CMC
 
Definisanje odnosa privatnosti i sigurnosti
Definisanje odnosa privatnosti i sigurnosti Definisanje odnosa privatnosti i sigurnosti
Definisanje odnosa privatnosti i sigurnosti Limundo
 
Definisanje odnosa privatnosti i sigurnosti na internetu
Definisanje odnosa privatnosti i sigurnosti na internetuDefinisanje odnosa privatnosti i sigurnosti na internetu
Definisanje odnosa privatnosti i sigurnosti na internetuJovan Šikanja
 

Similar to Big Data - pojam i značaj (20)

BI Competence Center & Data Governance
BI Competence Center & Data GovernanceBI Competence Center & Data Governance
BI Competence Center & Data Governance
 
Nikola Polic, IBM
Nikola Polic, IBMNikola Polic, IBM
Nikola Polic, IBM
 
Baze podataka 2
Baze podataka 2Baze podataka 2
Baze podataka 2
 
Domaći rad 1
Domaći rad 1Domaći rad 1
Domaći rad 1
 
Nasa skola 2011: Baze podataka - Stefan Nikolic -Silvana Ivkovic
Nasa skola 2011: Baze podataka - Stefan Nikolic -Silvana IvkovicNasa skola 2011: Baze podataka - Stefan Nikolic -Silvana Ivkovic
Nasa skola 2011: Baze podataka - Stefan Nikolic -Silvana Ivkovic
 
IT trendovi u 2017-oj
IT trendovi u 2017-ojIT trendovi u 2017-oj
IT trendovi u 2017-oj
 
IT10-L3.pptx
IT10-L3.pptxIT10-L3.pptx
IT10-L3.pptx
 
IT10-L1.pptx
IT10-L1.pptxIT10-L1.pptx
IT10-L1.pptx
 
Inteligentni transportni sistemi
Inteligentni transportni sistemi Inteligentni transportni sistemi
Inteligentni transportni sistemi
 
dataLayer - istine i zablude i podaci u industriji merenja i marketingu
dataLayer - istine i zablude i podaci u industriji merenja i marketingudataLayer - istine i zablude i podaci u industriji merenja i marketingu
dataLayer - istine i zablude i podaci u industriji merenja i marketingu
 
eCRM - elektronsko upravljanje odnosima sa klijentima
eCRM - elektronsko upravljanje odnosima sa klijentimaeCRM - elektronsko upravljanje odnosima sa klijentima
eCRM - elektronsko upravljanje odnosima sa klijentima
 
Arhitektura big data aplikacije (tarabica)
Arhitektura big data aplikacije (tarabica)Arhitektura big data aplikacije (tarabica)
Arhitektura big data aplikacije (tarabica)
 
IT10-L2.pptx
IT10-L2.pptxIT10-L2.pptx
IT10-L2.pptx
 
Konsalting digitalna transformacija radionica digitalni konsultanti
Konsalting digitalna transformacija radionica digitalni konsultantiKonsalting digitalna transformacija radionica digitalni konsultanti
Konsalting digitalna transformacija radionica digitalni konsultanti
 
L1-2
L1-2L1-2
L1-2
 
Business Intelligence Strategies and its role in corporate development
Business Intelligence Strategies and its role in corporate developmentBusiness Intelligence Strategies and its role in corporate development
Business Intelligence Strategies and its role in corporate development
 
09 Poslovni informacioni sistemi danas.pdf
09 Poslovni informacioni sistemi danas.pdf09 Poslovni informacioni sistemi danas.pdf
09 Poslovni informacioni sistemi danas.pdf
 
Digitalizacija proizvodnje unapredjenje proizvodnih procesa konsalting
Digitalizacija proizvodnje unapredjenje proizvodnih procesa konsaltingDigitalizacija proizvodnje unapredjenje proizvodnih procesa konsalting
Digitalizacija proizvodnje unapredjenje proizvodnih procesa konsalting
 
Definisanje odnosa privatnosti i sigurnosti
Definisanje odnosa privatnosti i sigurnosti Definisanje odnosa privatnosti i sigurnosti
Definisanje odnosa privatnosti i sigurnosti
 
Definisanje odnosa privatnosti i sigurnosti na internetu
Definisanje odnosa privatnosti i sigurnosti na internetuDefinisanje odnosa privatnosti i sigurnosti na internetu
Definisanje odnosa privatnosti i sigurnosti na internetu
 

More from Igor Lazarevi?, MSc Economics

811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)
811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)
811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)Igor Lazarevi?, MSc Economics
 
811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)
811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)
811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)Igor Lazarevi?, MSc Economics
 
810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)
810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)
810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)Igor Lazarevi?, MSc Economics
 
806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)
806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)
806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)Igor Lazarevi?, MSc Economics
 
806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)
806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)
806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)Igor Lazarevi?, MSc Economics
 
809... Upravljanje kompetencijama zaposlenih u apotekama
809... Upravljanje kompetencijama zaposlenih u apotekama809... Upravljanje kompetencijama zaposlenih u apotekama
809... Upravljanje kompetencijama zaposlenih u apotekamaIgor Lazarevi?, MSc Economics
 
3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)
3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)
3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)Igor Lazarevi?, MSc Economics
 
3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)
3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)
3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)Igor Lazarevi?, MSc Economics
 
12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektive
12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektive12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektive
12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektiveIgor Lazarevi?, MSc Economics
 
15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)
15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)
15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)Igor Lazarevi?, MSc Economics
 
Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...
Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...
Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...Igor Lazarevi?, MSc Economics
 
Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)
Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)
Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)Igor Lazarevi?, MSc Economics
 

More from Igor Lazarevi?, MSc Economics (17)

811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)
811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)
811b... Upravljanje zalihama u apotekama (deo 2 - metode upravljanja zalihama)
 
811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)
811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)
811a... Upravljanje zalihama u apotekama (deo 1 - osnovni pojmovi)
 
810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)
810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)
810d... Evaluacija i nagrađivanje zaposlenih (deo 4 - izgradnja sistema)
 
806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)
806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)
806c... Upravljanje finansijama u farmaciji (deo 3 - finansijska analiza)
 
806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)
806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)
806b... Upravljanje finansijama u farmaciji (deo 2 - pravila finansiranja)
 
805b... Društvena odgovornost u farmaciji (deo 2)
805b... Društvena odgovornost u farmaciji (deo 2)805b... Društvena odgovornost u farmaciji (deo 2)
805b... Društvena odgovornost u farmaciji (deo 2)
 
805a... Društvena odgovornost u farmaciji (deo 1)
805a... Društvena odgovornost u farmaciji (deo 1)805a... Društvena odgovornost u farmaciji (deo 1)
805a... Društvena odgovornost u farmaciji (deo 1)
 
809... Upravljanje kompetencijama zaposlenih u apotekama
809... Upravljanje kompetencijama zaposlenih u apotekama809... Upravljanje kompetencijama zaposlenih u apotekama
809... Upravljanje kompetencijama zaposlenih u apotekama
 
800... Menadžment u farmaciji
800... Menadžment u farmaciji800... Menadžment u farmaciji
800... Menadžment u farmaciji
 
3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)
3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)
3b... Falsifikovanje lekova (deo 2 - borba protiv falsifikovanja)
 
3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)
3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)
3a... Falsifikovanje lekova (deo 1 - pojam, uticaj, zastupljenost)
 
10... Uloga i značaj farmakoekonomskih evaluacija
10... Uloga i značaj farmakoekonomskih evaluacija10... Uloga i značaj farmakoekonomskih evaluacija
10... Uloga i značaj farmakoekonomskih evaluacija
 
12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektive
12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektive12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektive
12... Upravljanje farmaceutskim otpadom u Srbiji - stanje i perspektive
 
15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)
15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)
15c... Finansiranje nabavke lekova (deo 3 - sistemi uslovnih nadoknada)
 
9... Konsolidacija farmaceutskog tržišta
9... Konsolidacija farmaceutskog tržišta9... Konsolidacija farmaceutskog tržišta
9... Konsolidacija farmaceutskog tržišta
 
Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...
Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...
Standardizacija u farmaceutskoj industriji (deo 2 - primena farmaceutskih sta...
 
Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)
Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)
Standardizacija u farmaceutskoj industriji (deo 1 - osnovni pojmovi)
 

Big Data - pojam i značaj

  • 1. Pojam Big Data Dve osnovne karakteristike savreme- nih uslova poslovanja u farmaciji su rastu- ća dinamičnost i rastuća kompleksnost. Ra- stuća dinamičnost se ogleda u procesu stal- nih promena u okruženju, koje su duboke, sveobuhvatne i vrlo intenzivne, dok se ra- stuća kompleksnost ogleda u rastu broja elemenata koji utiču na poslovanje, kao i rastu njihovih međusobnih veza. Jedan od faktora koji doprinose rastućoj komple- ksnosti poslovanja jeste i eksponencijalni rast količine dostupnih podataka, koji pre svega predstavlja rezultat razvoja informa- cionih tehnologija i Interneta, odnosno har- dverskih (kapaciteti za skladištenje i obra- du podataka) i softverskih kapaciteta (raz- voj novih aplikacija). Prema rečima Erika Šmita, predsednika kompanije Google, od nastanka civilizacije do 2003. godine kreirano je ukupno 5 egzabajta1 podataka, što predstavlja količinu podataka koja se da- nas kreira u roku od dva dana. Ovaj enorm- ni rast dostupnih podataka karakterističan je za skoro sve oblasti života i poslovanja, od ishrane, sporta i razonode, preko trgo- vine, finansija, medicine i telekomunika- cija, pa sve do upravljanja bezbednosnim sistemom i zaštite životne sredine. Ova hi- perprodukcija podataka zahteva nove pri- stupe u njihovoj obradi koji su bazirani na upotrebi informacionih tehnologija – teh- nologija koje prevazilaze ograničenja u po- gledu analitičkih kapaciteta ljudi. To je do- velo do razvoja potpuno nove dimenzije u analizi podataka koja se naziva Big Data Analytics ili „analitika velikih količina po- dataka“. Šta ustvari predstavlja pojam Big Da- ta? Najkraće rečeno, Big Data predstavlja onu količinu podataka koja prevazilazi mogućnosti uobičajeno korišćenih računa- rskih tehnika za njihovo skladištenje i obradu. Ili jednostavno rečeno, Big Data predstavlja sve ono što prevazilazi kapaci- tete programa Excel i Access. Prema defi- niciji kompanije META Group, Big Data predstavlja informacioni resurs koji se POSLOVANJE Aktuelno 38 BB-INFORMATOR / JUL 2015. / 242 BIG DATA ANALITIKA PREDSTAVLJA POJAM KOJI SE ODNOSI NA PRIMENU NAPREDNIH TEHNIKA ANA- LIZE VELIKIH KOLIČINA PODATAKA ČIJE GENERISANJE SE SVE VIŠE UBRZAVA. SVOJU PRIMENU NALAZI U MNOGIM OBLASTIMA POSLOVANJA, A NAROČITO U OBLASTI MEDICINE. UKOLIKO SE PRAVILNO UPO- TREBI, BIG DATA ANALITIKA MOŽE STVORITI USLOVE ZA IZGRADNJU ODRŽIVE KONKURENTSKE PREDNOSTI NA TRŽIŠTU, ŠTO JE OD POSEBNOG ZNAČAJA ZA FARMACEUTSKE KOMPANIJE. AUTOR: IGOR LAZAREVIĆ, AVENTIN PARTNERS Big Data u farmaciji i medicini 1 Inače, merne jedinice za kapacitete skladištenja podataka obuhvataju bajt (B), kilobajt (kB), megabajt (MB), gigabajt (GB), terabajt (TB), petabajt (PB), egzabajt (EB), zetabajt (ZB) i jotabajt (YB). O kolikim veličinama je ovde reč najbolje govori podatak da 1 egzabajt obuhvata 1 milijardu gigabajta, odnosno da je ukupna količina podataka na Internetu na kraju 2013. godine iznosila 4 zetabajta, odnosno 4 miliona egzabajta, odnosno da ljudski rod još uvek nije dostigao iznos od 1 jotabajta skladištenih podataka na jednom mestu. Prema podacima iz kompa- nije Cisco Systems, počet- kom 2015. godine u svetu je bilo preko 25 milijardi elek- tronskih uređaja koji se mogu povezati na Internet, što znači da je prosečan broj uređaja po čoveku bio 3,5. To otvara neslućene mogućno- sti povezivanja i generisanja novih podataka.
  • 2. sastoji od podataka velike količine, velike brzine i velike raznovrsnosti koji zahteva nove i inovativne metode obrade i optimi- zacije tih podataka, što rezultira u boljem uvidu u sadržaj tih podataka i unapređe- nju procesa donošenja odluka2. Prema definiciji autora sa Bliskog Istoka, Big Da- ta predstavlja skup tehnika i tehnologija ko- je su bazirane na novim formama integra- cije velikih količina složenih i raznovrsnih podataka, a koje imaju kapacitet da otkri- juskrivenevrednostikojesusadržaneutim podacima3. Na osnovu toga, može se reći da definicija Big Data obuhvata četiri osnovna elementa: (1) kompleksnost po- dataka, u smislu generisanja veoma veli- kih količina raznovrsnih podataka koje se vrši veoma velikom brzinom, (2) inovativ- ne metode obrade podataka, u smislu po- trebe primene inovativnih metoda skladiš- tenja i obrade tako generisanih podataka, koje su bazirane na upotrebi savremenih informacionih tehnologija i naprednih tehnika statistike, (3) pronalaženje skrive- nih vrednosti na bazi upotrebe savreme- nih informacionih tehnologija i naprednih tehnika statistike, i (4) brže i bolje odluči- vanje, koje je bazirano na otkrivanju skri- venih vrednosti sadržanih u velikim seri- jamakompleksnihpodataka.Kaoštojeuka- zano u definiciji kompanije META Group, koncept Big Data je baziran na tri osnovne dimenzije, koje čine „3V koncept“ Big Data. To su količina, brzina i raznovrsnost. • Količina podataka (Volume ili „Data at Rest“) predstavlja prvu i najvažniju di- menziju Big Data koncepta. Prema poda- cima iz kompanije IBM, 90% podataka ko- ji danas postoje kreirano je u poslednje dve godine. S druge strane, prema podacima McKinsey Global Institute, očekuje se da će količina generisanih podataka na global- nom nivou da raste po prosečnoj godišnjoj stopi od 41% i da će u periodu od 2008. do 2020. godine ta količina biti uvećana 44 pu- ta, sa 0,8 zetabajta u 2008. godini na 35 ze- tabajta u 2020. godini. O kojoj količini po- dataka se govori najbolje govori podatak da se dnevno na Fejsbuku generiše 10, a na Tviteru 7 terabajta podataka. • Brzina generisanja podataka (Veloci- ty ili „Data in Motion“) predstavlja drugu dimenziju Big Data koncepta. Primera ra- di, u okviru jednog minuta u svetu se obavi preko 3.500 transakcija na berzama, potroši se preko 3 miliona dolara na onlajn kupovinu, pošalje se preko 200 miliona imejlova, obavi se preko 2 miliona pretra- ga na Guglu (3,5 milijarde dnevno), posta- vi se preko 700.000 novih sadržaja na Fejs- buku i preko 400.000 na Tviteru, postavi se preko 600 novih video sadržaja na Ju- tjub, obavi se preko 400.000 minuta raz- govara preko Skajpa i napiše se preko 1.500 blog postova. • Raznovrsnost podataka (Variety ili „Data in Many Form“) predstavlja treću di- menziju Big Data koncepta. Preko 80% po- dataka koji se danas generiše su nestruk- turirani podaci. To su podaci koji su hete- rogenog karaktera i sa kojima se ne mogu vršiti klasične aritmetičke operacije. Pojav- ljuju se u raznim formama, kao što su au- dio fajlovi, video fajlovi, tekstualni fajlovi itd. Oko 10% podataka koji se danas gene- riše su polustrukturirani podaci. To su uglavnom podaci koji se lako mogu trans- formisati u formu pogodnu za vršenje klasičnih aritmetičkih operacija, kao što su npr. podaci koji se dobijaju putem Web ana- litike. Konačno, samo 10% podataka pred- stavljaju strukturirane podatke. To su po- daci koji nastaju upotrebom raznih anali- tičkih sredstava kao što su poslovne ana- litike, baze podataka itd. Pojedini autori na ove tri dimenzije do- daju i druge dimenzije, čineći tako proši- reni Big Data koncept. S jedne strane, pojedini autori dodaju i dimenziju pouz- danosti podataka (Veracity), čineći tako „4V koncept“, dok s druge strane, pojedini au- tori dodaju još i dimenzije vrednosti (Va- lue) i delotvornosti (Viscosity), čineći tako prošireni „6V koncept“. Big Data i poslovna analitika Važno je imati u vidu da pojam Big Da- ta ne treba poistovećivati samo sa velikim količinama raznovrsnih podataka, već i sa tehnikama koje se koriste u obradi tih po- dataka i načina donošenja zaključaka i važnih poslovnih odluka na bazi toga. Zbog toga se češće koristi pojam Big Data Analytics ili „analitika velikih količina po- dataka“, čija je svrha pronalaženje skrive- nih obrazaca u podacima i generisanje in- formacija za donošenje važnih poslovnih odluka, što se postiže primenom napred- nih tehnologija i naprednih statističkih teh- nika. Big Data je transformisao pojmove analitike i poslovne inteligencije (Busi- ness Intelligence). Analitika kakvu poznaj- emo (Traditional Approach), koja je bila ba- zirana na analizi parcijalnih podataka na bazi upotrebe standardnih alata i tehnika i koja se uglavnom vršila Ex-Post sa cilje- BB-INFORMATOR / JUL 2015. / 242 39 2 Ovu definiciju je dao Daglas Lani u okviru istraživanja koje je 2001. godine sproveo u ime kompanije META Group (danas Gartner Inc). Izvor: Laney, Douglas (2001), Application Delivery Strategies – 3D Data Management: Controlling Data Volume, Velocity and Variety, META Group 3 Ibrahim; Targio Hashem, Abaker; Yaqoob, Ibrar; Badrul Anuar, Nor; Mokhtar, Salimah; Gani, Abdullah; Ullah Khan, Samee (2015), The Rise of “Big Data” on Cloud Computing: Review and Open Research Issues, Information Systems, Vol. 47, str. 98-115 Parametar Tradicionalna analitika Big Data analitika Obuhvat podataka Analiza dela podataka (Partial Data) Analiza svih podataka (All Data) Izvori podataka Mali broj homogenih izvora podataka Veliki broj heterogenih izvora podataka Tehnike obrade podataka Standardni alati i tehnike (klasični softveri, klasične statističke tehnike ) Napredni alati i tehnike (napredni softveri, napredne statističke tehnike) Vreme obrade podataka Nakon generisanja podataka (Ex-Post) U toku generisanja podataka (Real-Time) Intenzitet obrade podataka Povremena obrada podataka (Ad-Hoc) Kontinuirana obrada podataka Ciljevi obrade podataka Dijagnoza i opis događaja Analiza ponašanja i predviđanje događaja Vrste izveštaja Standardni jednoobrazni izveštaji Složeni kompleksni izveštaji
  • 3. vima dijagnostikovanja i deskripcije, sve vi- šeustupamestonaprednojanalitici(BigDa- ta Approach), koja je bazirana na analizi ce- lokupnih podataka na bazi upotrebe savre- menih informacionih tehnologija i na- prednih metoda statističke obrade poda- taka, koja se vrši u realnom vremenu (Real-Time) sa ciljem predviđanja budućih događaja. Može se reći da je koncept poslovne analitike ili poslovne inteligencije evolui- rao u četiri faze. U prvoj fazi, koja se nazi- va fazom dijagnostičke analitike (Diagno- stic Analytics) akcenat je na dijagnostiko- vanju problema i pronalaženju naknadnih načina za njihovo rešavanje. U drugoj fa- zi, koja se naziva fazom deskriptivne analitike (Descriptive Analytics) akcenat je na dijagnostikovanju problema, ali i na opisu uzroka i posledica nastalih proble- ma, kao i iznalaženju načina za njihovo re- šavanje. U trećoj fazi, koja se naziva fazom prediktivne analitike (Predictive Analy- tics) akcenat je na predviđanju budućih problema na bazi prethodnih iskustava, kao i na merama prevencije posledica. U četvrtoj fazi, koja se naziva fazom preskrip- tivne analitike (Prescriptive Analytics) akcenat je na kompleksnoj analizi pona- šanja koje dovodi do nastanka budućih problema, te stoga i na razvoju metoda i pristupa koji utiču na željeno ponašanje ciljnih subjekata. Prediktivna analitika (Predictive Ana- lytics) inače predstavlja skup naprednih ala- ta i tehnika koje se koriste u analizi velikih serija sadašnjih i prošlih podataka kako bi se predvideli budući događaji na bazi iden- tifikovanih obrazaca ponašanja. U osnovi prediktivne analitike, i inače Big Data ana- litike, je upotreba savremenih informacio- nih tehnologija, kao što su Hadoop i MAT- LAB softverska rešenja, i naprednih tehni- ka statistike, kao što su napredne tehnike regresione analize i napredne tehnike ma- šinskog učenja. Ono što je važno znati je da je glavni po- kretač Big Data analitike vrednost podata- ka. Prema Piteru Sondergardu iz kompa- nije Gartner Research, „informacija je na- fta XXI veka, a analitika je parna mašina bu- dućnosti“. Kompanije sve više prepoznaju podatke kao resurs (Data as an Asset) ko- ji im omogućava da primenjuju superior- ne strategije i grade održivu konkurentsku prednost na bazi upravljanja informacija- ma. Zbog toga, dolazi do rapidnog rasta Big Data tržišta u svetu. Prema podacima McKinsey Global Institute, globalno Big Da- ta tržište raste po prosečnoj stopi od 46% godišnje. Ovo tržište je u 2011. godini vre- delo 5,5 milijardi dolara, u 2012. godini 8,5 milijardi dolara, a u 2015. godini 25 milijar- di dolara. Očekuje se da bi vrednost Big Da- ta tržišta do 2020. godine mogla da izno- si preko 200 milijardi dolara. Big Data i vizualizacija podataka Često se kaže da je vizualizacija poda- taka (Data Visualization) „najbolji prijatelj“ Big Data analitike. Razlog je taj što su rezul- tati analize velikih serija podataka najče- 40 BB-INFORMATOR / JUL 2015. / 242 Tradicionalna analitika Tradicionalna analitika Napredna analitika Big Data analitika Male serije podataka Male serije podataka Velike serije podataka Velike serije podataka Gigabajti Terabajti Petabajti Zetabajti NiskaSrednjaVisoka Brzina,kompleksnostitačnostpodataka Veličina podataka POSLOVANJE Aktuelno
  • 4. šće veoma kompleksni, te stoga zahteva- ju primenu naprednih tehnika prezento- vanja. Vizualizacija podataka omogućava korisnicima brzo i lako razumevanje infor- macija i međusobnih uzročno-posledičnih veza. Vizualizacija podataka je i nauka i umetnost. Nauka je zbog toga što je bazi- rana tzv. „naučnom procesu obrade infor- macija“ (Data Science Process), koji je ba- ziran na prediktivnoj analitici i upotrebi na- prednih informacionih i statističkih teh- nika. Umetnost je zbog toga što je bazira- na na kreativnosti i dizajnerskim sposob- nostima analitičara koji konstantno izna- laze nove „perceptivno prihvatljive“ nači- ne za prezentovanje podataka. Obzirom da je proces vizuelne percepcije povezan sa moždanim aktivnostima i karakteristika- ma ličnosti, vizualizacija podataka je usko povezana sa psihologijom i neurologi- jom. Prema Stivenu Fjuu, postoji osam teh- nika vizualizacije kvantitativnih podataka koje se koriste u prediktivnoj analitici. To su: (1) tehnike vremenskih serija, (2) tehni- ke rangiranja, (3) tehnike upoređivanja delova i celine, (4) tehnike devijacije, (5) teh- nike distribucije frekvencije, (6) tehnike ko- relacije, (7) tehnike nominalnog poređenja i (8) tehnike geografskog ili geo-prostornog poređenja. Kao rezultat primene ovih teh- nika, rezultati analize velikih serija poda- taka se najčešće prikazuju u formi stubo- va (Bars), histograma (Histograms), dvodi- menzionalnih i trodimenzionalnih tačka- stih dijagrama (Scatterplots i 3D Scatter- plots), mrežnih dijagrama (Networks), gra- fikona tokova (Streamgraphs), mape gra- nanja (Treemap), gantograma (Gantt Charts), ali i u formi raznih infografika (In- fographics), koji su sve popularniji u posle- dnje vreme. Big Data ekosistem U stručnoj literaturi često se može naići na termin „Big Data ekosistem“. Ovaj termin se koristi da bi se fenomen Big Da- ta opisao tako da obuhvati sve njegove ele- mente i njegove najvažnije aspekte. Posto- ji nekoliko načina za prikazivanje Big Da- ta ekosistema, ali je najjednostavniji onaj koji posmatra njegova tri osnovna „gradi- vna bloka“ (Building Blocks), odnosno podsistema proizvodnje, procesuiranja i konzumiranja podataka. • Proizvodnja podataka (Big Data Pro- duction) obuhvata procese generisanja velikih serija podataka u svakodnevnom životu i poslovanju kroz upotrebu različi- tih tehnoloških rešenja. Proizvodnja poda- takajeproceskojijebazirannavelikombro- ju heterogenih izvora podataka. Što se ti- če izvora podataka, oni praktično obuhva- taju sve oblasti života i poslovanja, među kojima se posebno ističu informatika (po- daci iz pretraživača, podaci sa društvenih mreža, podaci o logovima, podaci sa serve- ra, podaci sa Web sajtova i imejlova itd), te- lekomunikacije (podaci o razgovorima, podaci o SMS porukama, podaci o korišće- nju Interneta itd), prodaja (podaci sa POS terminala, podaci o reklamacijama itd), marketing (baze podataka o potrošačima, podaci o navikama potrošača itd), finansi- je (podaci o novčanim transakcijama, po- daci o berzanskim transakcijama, razni ak- tuarski podaci itd), medicina (medicinska istraživanja, medicinska dijagnostika, kli- nička ispitivanja, istraživanja genoma itd), sistem bezbednosti (podaci o uznemirava- nju, podaci o terorizmu itd), geolokacijski izvori (GPS podaci itd), senzorski izvori (po- daci dobijeni iz senzorskih uređaja itd), raz- ni inženjerski i naučni podaci (seizmolo- ški podaci, hidrološki podaci, klimatski po- daci, fizički podaci, astronomski podaci itd). Što se tiče formata podataka, oni se pojav- ljuju u video formatu, audio formatu, tek- stualnom formatu, binarnom formatu i u drugim formatima. •Procesuiranjepodataka(BigDataPro- cessing) obuhvata sve tehnike i tehnologi- je uz pomoć kojih se vrši upravljanje dobi- jenim podacima. Procesuiranje podataka obuhvata dva osnovna elementa. Prvi ele- ment je skladištenje podataka (Data Ware- housing), koje obuhvata prikupljanje po- dataka (Data Gathering), čuvanje podata- ka (Data Storage), izvlačenje podataka (Da- BB-INFORMATOR / JUL 2015. / 242 41
  • 5. ta Mining) i bezbednost podataka (Data Se- curity). Drugi element je obrada podataka (Data Processing), koja je bazirana na pri- meni savremenih metoda prediktivne analitike. • Konzumiranje podataka (Big Data Consumption) obuhvata mehanizme pre- zentovanjadobijenihrezultatainačinaupo- trebe Big Data u cilju unapređenja poslo- vanja. Konzumiranje podataka ima dva osnovna elementa. Prvi element je način prezentovanjapodatakaiodnosisenakom- pleksne metode vizualizacije podataka. Drugi element je upotreba podataka i od- nosi se na upotrebu dobijenih informaci- ja u svrhu unapređenja života i poslovanja. Konzumenti Big Data analitike su brojni – od kompanija, preko država i naučnih ustanova, pa sve do pojedinaca. Big Data tehnologije Konačno, važno je ukazati i na značaj Big Data tehnologija i tehnoloških rešenja, koje predstavljaju osnovu savremene pre- diktivne (Big Data) analitike. Kada se govo- ri o Big Data tehnologijama važno je ima- ti u vidu da one obuhvataju dva aspekta. S jedne strane, to su „tehnologije“, koje se odnose na razna softverska rešenja koja su bazirana na savremenim informacionim tehnologijama. S druge strane, to su „teh- nike“, koje se odnose na kompleksne i na- predne tehnike statističke i matematičke obrade podataka. Praktično, Big Data teh- nologije predstavljaju simbiozu „tehnolo- gija“ (softvera) i „tehnika“ (statističkih ala- ta) i na tržištu se pojavljuju u obliku zao- kruženih softverskih rešenja koja integri- šu ova dva parametra. Što se tiče „tehnika“ (statistički alati), najčešće se koriste tehnike napredne regre- sione analize, tehnike mašinskog učenja (Machine Learning), tehnike analize vre- menskih serija (Time Series Analysis), teh- nike genetičkih algoritama (Genetic Algo- rithms), tehnike fuzije i integracije poda- taka (Data Fusion and Integration), NLP teh- nike, razne ekonometrijske simulacije (npr. Monte-Carlo simulacija) itd. Što se tiče „tehnologija“ (softvera), u po- nudi postoji veliki broj softverskih rešenja za Big Data analitiku. Sva ta rešenja se mo- gu grupisati u tri osnovne kategorije. Pr- va kategorija obuhvata Apache Hadoop platformu, koja predstavlja Open-Source rešenje koje se najčešće koristi u Big Data analitici i koje je urađeno na Java platfor- mi u cilju procesuiranja velikih količina po- dataka putem tehnologije „kompjuter- skih klastera“. Druga kategorija obuhvata tzv. „Non-Hadoop“ platforme, među koji- ma najveću upotrebu imaju platforme kao što su MapReduce, MATLAB, Revolu- tion R, Apache Mahout, Apache Hive, Kni- me, Pentaho Data Integration i brojne druge platforme. Treća kategorija obuhva- ta tzv. „Cloud-Based Big Data Applica- tions“, koji obuhvataju razne softvere ko- ji koriste tehnologiju Cloud Computing-a u svom radu. Primena Big Data analitike Big Data analitika ima primenu u sko- ro svim oblastima života i poslovanja. Međutim, najvažnije oblasti primene Big Data analitike su u onim oblastima u ko- jima se generišu velike količine podataka čijom obradom se može doći do važnih po- slovnih zaključaka. Imajući to u vidu, mo- že se reći da Big Data analitika najveću pri- menu ima u sledećim sektorima: (1) infor- macione tehnologije, (2) telekomunikaci- je, (3) finansijski sektor, (4) prodaja i mar- keting, (5) medicina i farmacija, (6) sektor bezbednosti, (7) zaštita životne sredine, (8) geologija i seizmologija, (9) fizika i astro- nomija itd. U sledećem broju: „Primena Big Data analitike u medicini“ 42 BB-INFORMATOR / JUL 2015. / 242 POSLOVANJE Aktuelno Proizvodnja podataka (Big Data Production) Procesuiranje podataka (Big Data Processing) Konzumiranje podataka (Big Data Consumption) Skladištenje podataka (Data Warehousing) Prikupljanje podataka (Data Gathering) Iskopavanje podataka (Data Mining) Procesuiranje podataka (Data Processing) Vizualizacija podataka (Data Visualization) Poslovna primena Marketing Prodaja Medicina Informatika Telekomunikacije Bezbednost Zaštita životne sredine Izvori podataka: Audio fajlovi Video fajlovi Tekstualni fajlovi Internet pretraživači Internet sajtovi Društvene mreže Podaci o logovima Telekomunikacije POS terminali Baze potrošača Novčane transakcije Berzanske transakcije Medicinska istraživanja Medicinska dijagnostika Fraud podaci GPS podaci Senzorski podaci Seizmološki podaci Klimatski podaci itd. Bezbednost podataka (Data Security) Izvorni podaci Obrađeni podaci Komercijalizovani podaci