2. Sadržaj
Design science pristup
Bayesian v.s. frequentist
Pristup ekspertskoj elicitaciji parametra modela
Primjer doktorski rad v.s magistarki rad
3. Design science
Design-science se temelji na rješavanju problema. Koristeći design-science
pristup naučnom radu, autor nastoji stvoriti inovacije koje definiraju ideje, prakse,
tehničke mogućnosti i proizvode kroz koje analiza, dizajn, implementacija,
upravljanje i korištenje informacijskih sistema može biti ostvareno efikasno i
efektivno
Proces stvaranja artefakata nije izuzet od prirodnih zakona ili biheviorističkih
teorija. Upravo suprotno, njihovo stvaranje oslanja se na postojeće teorije koje
istraživač koristeći iskustvo, kreativnost, intuiciju i sposobnost rješavanja
problema, primjenjuje, testira, mijenja i proširuje
IS istraživanja mogu dati značajan doprinos, provođenjem komplementarnog
istraživačkog ciklusa, kombinujući dizajn-science i bihevioral-science pristup za
rješavanje temeljnih problema s kojima se suočavaju organizacije u produktivnoj
primjeni informacijskih tehnologija
4.
5.
6. Peffers i saradnici (2007) su identifikovali iterativni proces sa šest aktivnosti za
design-science istraživanja.
7. Procesi
izrada i evaluacija.
Artefakti se izrađuju u svrhu rješavanje dosad neriješenih problema i evaluiraju se s
obzirom na doprinos koji su donijeli u rješavanju tih problema.
konstrukti, modeli, metode i instance.
Razliku između rada na izradi sistema kao dijela svakodnevnih aktivnosti
organizacije i IS istraživanja koje koristi design-science metodologiju.
Naučni pristup koji uključuje evaluaciju, validaciju, procjenu doprinosa i strogost, čini
osnovu te razlike.
Formalizam, na kome se temelji naučni pristup, pomaže istraživačima da razviju
prezentaciju IS problema, rješenja problema, kao i procese rješavanja problema, koji
jasno izdvajaju znanje koje nastalo kao proizvod istraživanja.
Komponete Design-science istraživanja u IS
10. Prije nego počnemo o Bayesu riječ dvije o
Frequentistima
Uobičajneno pogled na vjerojatnoću je takozvani
frequentistički pristup:
P je vjerovatnoća neizvjesnog događaja A, P (A) definisana
frekvencijom tog događaja na temelju prethodnih opažanja.
Na primjer, u BiH 50,9% svih rođenih beba su djevojčice;
pretpostavimo da smo zainteresirani za događaj A: 'slučajno
odabrana beba je djevojčica'.
Prema frequentističkom pristupu P (A) = 0.509..
11. Pristup baziran Bayesovoj teoremi
Frequentistički pristup za definisanje vjerovatnoće neizvjesnog događaja je u redu, po
uslovom da smo mogli zabillježiti tačne informacije o velikom broju prošlih slučajeva
promatranog događaja. Međutim, ako takva povijesna baza podataka ne postoji,
moramo razmotriti drugačiji pristup.
Bayesova vjerojatnoća je formalizam koji nam omogućuje razmišljanje o uvjerenjima u
slučaju neizvjesnoti. Ako smo primijetili da se dogodio određeni događaj, kao što je da je
BiH 100-ta na tabeli primjene IT –a u svijetu u 2017. godine, tada nema nikakve
neizvjesnosti.
Međutim, pretpostavimo da je riječ o izjavi “BiH će na tabeli primjene IT –a u svijetu u
2020. godine zauzeti 58 mjesto !"
Budući da je to izjava o budućem događaju, nitko ne može sa sigurnošću reći je li to
istina. Različiti ljudi mogu imati različita uvjerenja u izjavi ovisno o njihovom specifičnom
znanju o faktorim koji bi mogli utjecati na njegovu vjerojatnost.
12. Pristup baziran Bayesovoj teoremi
Sljedbenici "tradicionalnog" statističkog razmišljanja insistiraju na tome da se
pravi ali nepoznati parametri distribucije mogu procijeniti na temelju dostupnih
podataka.
Naučnici koji slijede Bayesovu teoriju prihvataju određeni stepen subjektivnosti u
procjenjivanju parametara distribucije i iz njihove perspektive ne postoji bitna
razlika između varijabli koje se posmatraju i parametara statističkog modela, jer
svi oni se smatraju slučajnim.
Bayesova statistika omogućava kombinaciju empirijski prikupljenih podataka i
procjena stručnjaka za određivanje parametara modela (Carol, 2001).
13. Bayes Theorem
Posmatrajmo vjerovatnoću zajedničkog događanja događaja A iB P(A,B)
Možemo reći da je ona jednaka uslovnoj vjerovatnoće dešavanja događaja A nakon što
se desio događaj B P(A|B) pomnoženoj sa vjerovatnoćom dešavanja događaja B P(B)
P(A|B) P(B) = P(A,B)
ili ako se događaj A desio prvi
P(B|A) P(A) = P(A,B)
Izjedančavajući ove dvije jednačine
Dobijamo Bayesovu teoremu.
14. Proces primjene Bayesove teoreme
Prior
Probabilities
New
Information
Application of
Bayes’
Theorem
Posterior
Probabilities
15. Primjer
Pretpostavimo da smo zainteresovani za dijagnosticiranje raka kod pacijenata koji posjećuju kliniku
za plućne bolesti:
Neka A predstavlja događaj "Osoba ima rak"
Neka B predstavljaju događaj "Osoba je pušač"
Znamo da je vjerovatnoća prethodnog događaja P (A) = 0.1 na temelju prošlih podataka (10%
pacijenata koji ulaze u kliniku da ima rak). Želimo izračunati vjerovatnoću poslijedičnog ( posterior)
događaja P (A | B) –Pušač koji je ušao u kliniku ima rak.Do ovog podatka možemo doći ako znamo
P (B) s obzirom na postotak pacijenata koji puše - pretpostavimo da je P (B) = 0.5. Takođe na
osnovu ranijih istraživanje znamo P (B | A) – udio pušača među dijagnosticiranima. Pretpostavimo
da je P (B | A) = 0,8.
Sada možemo koristiti Bayesovo pravilo za izračun:
P (A | B) = (0,8 x 0,1) / 0,5 = 0,16
Dakle, u svjetlu dokaza da je osoba pušač, revidiramo našu predhodnu vjerojatnoću od 0,1 do
poslijedične vjerojatnoće od 0,16. Ovo je značajan porast, ali je još uvijek malo vjerojatno da osoba
ima rak.
16. Bayes u operativnim rizicima
Prihvaćanje subjektivnosti u modeliranju distribucije daje Bayesovoj statistici znatnu
prednost u mjerenju operativnih rizika. Glavni problemi sa podacima mogu se
riješiti bez gubljenja statističke strogosti:
Kvalitet podataka. Pravila filtriranja imaju direktne implikacije na parametre distribucije,
te odabir filtera unosi subjektivnost u rezultate bazirane na filtriranim podacima.
Nedostatak podataka. Kad podaci nisu dostupni u željenim količinama, strukturirane
radionice sa stručnjacima mogu se koristiti kao supstitucija.
Povijesnost podataka. Pošto se povijesni podaci o gubicima koriste za modeliranje, a nisu
dostupni podaci o gubicima kao posljedica neke značajne promjene u prošlosti, opet je
moguće koristiti ekspertsku ocjenu uticaja promjena.
Bayesova statistika posmatra proces statističke procjene, kao jedan kontinuiran
proces u kome se revidiraju subjektivna uvjerenja o stanju problema nakon što više
podataka postane dostupno
17. Primjeri korištenja u stvarnom svijetu
Watson Jeopardy
Dijagnostika
Pretraživanje prostora ( svemir, morsko dno, dešifriranje)
https://www.quora.com/What-are-some-specific-accomplishments-or-major-
results-of-Bayesian-statistics-that-arent-possible-with-a-frequentist-approach
18. Monty hall problem
https://www.youtube.com/watch?v=9vRUxbzJZ9Y
http://www.mathwarehouse.com/monty-hall-simulation-online/
20. Bayesove mreže
BBN su grafički modeli koji kombinuju teoriju grafova i teoriju vjerovatnoće. Svaki
BBN se sastoji od dva elementa: usmjereni aciklički grafovi (directed acyclic graph
-DAG), koji predstavljaju strukturu, i skup tabela uslovne vjerovatnoće
(conditional probability tables –CPT).
Čvorovi u strukturi korespondiraju sa varijablama koje se posmatraju,
Ivice se formalno interpretiraju kao statistička nezavisnost varijabli. Za mnoge
praktične aplikacije ivice predstavljaju direktni uzročni uticaj.
BBN mora sadržavati CPT za svaku varijablu. CPT kvantificira odnos između
varijable i njenih „roditelja“ u grafu
21. Prediktivni: Ako vjerujemo da se desio "Rast kursa dolara",
onda se povećava vjerovatnoća da ćemo imati nedovoljan
budžet za ulaganja.
Dijagnostički: Ako smo ustanovili da nemamo dovoljan budžet
za ulaganja onda se povećava vjerovatnoća da su se desili
porast kursa dolara i neoptimalno upravljanje nabavkama.
Objašnjavajući: Ako smo ustanovili da nemamo dovoljan
budžet za ulaganja onda je najvjerovatnije objašnjenje "Rast
kursa dolara“, a revidirana je vjerovatnoća za „optimalno
upravljanje nabavkama“ je i dalje niska. Međutim, ako
ustanovimo takođe da sistem nije raspoloživ, tada možemo
zaključiti da je „nedovoljan budžet za ulaganja“ najvjerovatnije
uzrokovan neoptimalnim upravljanjem nabavkama, a ne rastom
kursa dolara. Dakle " nedovoljan budžet za ulaganja " objašnjen
je preko opažanja da je „sistem neraspoloživ“ sa kojim nema
direktnu konekciju („away“)
https://download.bayesfusion.com/files.html?category=Acade
mia
23. Slučajevi za korištenje probabilističkih
grafova
koherentno i matematički potkrijepljeno upravljanje neizvjesnosti,
normativno odlučivanje,
automatska izgradnja i adaptacija modela na temelju podataka,
intuitivan i kompaktan prikaz uzročno-posljedičnih odnosa i (uvjetno) zavisnosti i
nezavisnosti odnosa,
efikasno rješenje upita na osnovu danih dokaza.
25. Kriteriji selekcije
Objavljene publikacije i dobiveni grantovi u području istraživanja
Citirani radovi
Akademske titule, nagrade, ili druge vrste priznanja
Preporuke i nominacije od ugledanih pojedinaca i stručnih tijela
Pozicije na kojima su zaposleni ili imenovani
Članstvo ili imenovanja u odborima, komisijama, itd.
26. Trening
Izbjegavanje pristranosti I heuristika
Pristranosti
Motivacijska nastaju zbog personalnih interesa i okolnosti u kojima se nalazi ekspert.
Spoznajne se dešavaju kada procjene eksperta ne slijede normativna, statistička ili
logička pravila, zbog načina na koji ljudska bića procesiraju informacije
Nedosljednost - kada ekspert postane nedosljedan u razmišljanju. Nedosljednost može
između ostalog nastati zbog umora prilikom popunjavanja velikih tabela uslovne
vjerovatnoće48 (Korb & Nicholson, 2011)
Dostupnost je heuristika s kojom stručnjak procjenjuje vjerovatnoću događaja po lakoći
kojom se prisjeti određene pojave.
Sidrenje - kada ekspert počinje sa procjenom na osnovu prvog dojma i ostaje pri toj procjeni
uz tek manje korekcije
27. Strukturiranje upitnika
Dokumentovati varijable i vrijednosti za koje će se tražiti mišljenje eksperata. U
slučaju grafičkih modela, kakav je BBN potrebno varijable su predstavljene
mrežom.
-Za svaku vjerovatnoću čija se procjena traži, potrebno je pripremiti pitanje koje
opisuje traženu vrijednost.
-Odabrati metodu za elicitaciju vjerovatnoća i format koji će biti korišten za
prikupljanje odgovora.
28. Prikupljanje i dokumentacija ocjena
eksperata
Mora da pomogne ekspertu u problemima koji se neizbježno javljaju s tumačenjem
pitanja, definicije varijabli i vrijednosti
Elicitator treba da zabilježi sve informacije koje navode eksperti, a koje se ne mogu
zabilježiti u predviđenom formatu odgovara, ali ipak mogu biti od koristi.
Može se ispostaviti da su određeni konteksti, za koje je potrebno procijeniti
vjerovatnoću pojedinih varijabli, nepotpuni ili da su nepotrebni. Za probabilističke
mreže, to znači da se moraju uraditi promjene u strukturi mreže i zbog toga je važno
da se ove informacije pažljivo zabilježe.
Za neke procjene vjerovatnoće elicitator može očekivati da se lako dese određene
predrasude te u toku elicitacije treba obezbjediti da su eksperti svjesni predrasuda
koje se mogu desiti u ovom procesu.
Elicitator treba da gledati u sat: elicitacije je napornija za eksperta nego za elicitatora i
zbog toga trajanje sesije ne treba da prelazi jedan sat.
29. Verifikacija
Verifikacija je proces provjere da li su vjerovatnoće koje su dobijene od eksperata
dobro kalibrisane (da li su u skladu sa posmatranim frekvencijama), da li poštuju
zakone vjerovatnoće (da su koherentni ) i pouzdani.
Provjera da li su procjene su u skladu "stvarnosti", često je nemoguća, jer se
događaji za koje se procjenjuju vjerovatnoću često ne mogu posmatrati ili na drugi
način mjeriti.
koherentnosti, moguće je provjeriti da li je suma svih procijenih vjerovatnoća
jednaka jedan i ovaj test je pogodan način provjere elicitacije.
Test-retest pouzdanosti provjerava da li se eksperti slažu sa svojim procjenama, to
jest, da li će ekspert pružiti iste procjene kada je ponovo upitan za iste
vjerovatnoće. Međutim, kada se radi o probabilističkih mrežama, broj
vjerovatnoća koje se ocjenjuju može biti tako veliki, da ih je nemoguće da
procijenit više od jednom. Umjesto testiranja pouzdanosti korištenjem odvojene
procjene, ekspertu se može dati na ocjenu cijela distribucija vjerovatnoće koja je
nastala u postupku elicitacije.