Istorija kljuc za okruzno takmicenje za 7. razred 2022. godine.doc
Učenje i viši kognitivni procesi 3. Odlučivanje, II deo
1. UČENJE I VIŠI KOGNITIVNI PROCESI
Prolećni semestar 2013.
Predavač: Goran S. Milovanović
Predavanje 2
ODLUČIVANJE – Deo II
2. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 2
Problem odlučivanja u uslovima rizika
• Večeras ima odličan koncert, ali i dobra pozorišna predstava.
• {KONCERT, POZORIŠTE} – skup odlučivanja, dva ishoda.
• Preferencije? Ostavljam to Vama...
• Ipak: ili KONCERT ≽ POZORIŠTE, ili POZORIŠTE ≽ KONCERT!
(razmislite zašto ovo tražim od vas)
• Verovatnoća
• Šanse da nabavimo karte za KONCERT su ¼
• Šanse da nabavimo karte za POZORIŠTE su ¾
• Šta ćemo da radimo? problem odlučivanja u uslovima rizika
Repetitorijum
3. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 3
Odlučivanje u uslovima rizika
• Šanse da nabavimo karte za KONCERT su ¼
• Šanse da nabavimo karte za POZORIŠTE su ¾
• Ako krenemo na koncert i nema karata propalo veče, predstava već počela.
• Vice versa, ako krenemo u pozorište i ne nađemo karte...
• Naša situacija odlučivanja je zapravo ovakva:
¼
Koncert
¾
Ništa
¾
Pozorište
¼
Ništa
?
Repetitorijum
4. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 4
Bernulijeva hipoteza očekivane korisnosti
Danijel Bernuli
∑ ⋅=
i
ii xxpLE )()(
Očekivana vrednost
∑ ⋅=
i
ii xuxpLU )()()(
Očekivana korisnost
Repetitorijum
5. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 5
Bernulijeva hipoteza očekivane korisnosti: 1738.
Uvođenjem konkavne funkcije korisnosti...
1. objašnjava opadajuću marginalnu vrednost novca,
2. objašnjava averziju prema riziku,
3. rešava Petrovgradski paradoks.
Danijel Bernuli
∑ ⋅=
i
ii xuxpLU )()()(
Očekivana korisnost
0
1
2
3
4
5
6
7
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Korisnost
Vrednost
Averzija
Repetitorijum
6. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 6
Stepena funkcija korisnosti i stavovi prema riziku
0
5
10
15
20
25
30
35
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Korisnost
Vrednost
Sklonost
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Korisnost
Vrednost
Neutralnost
Funkcije korisnosti koje opisuju averziju, neutralnost
i sklonost prema riziku.
Slika prikazuje tri stepene funkcije korisnost iz
familije oblika u(x) = xρ:
• konkavnu (averzija prema riziku, puna linija) sa
vrednošću eksponenta ρ < 1,
• konveksnu (sklonost ka riziku, isprekidana linija)
sa vrednošću eksponenta ρ > 1,
• i linearnu (neutralnost prema riziku, tačkasta
linija) sa vrednošću eksponenta ρ = 1.
u(x) = xρ
0
1
2
3
4
5
6
7
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Korisnost
Vrednost
Averzija
Repetitorijum
7. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 7
Teorija racionalnog izbora: aksiomatizacija
Džon fon Nojman (desno) i
Oskar Morgenštern (levo).
Repetitorijum
8. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 8
Paradoksi teorije racionalnog izbora
(A4) Nezavisnost. Za sve p, q, r i bilo koji broj α koji leži između 0 i 1: p ≽ q ako i samo
ako α∙p + (1- α) ∙r ≽ α∙q + (1- α) ∙r.
Ukoliko neka osoba više voli jabuke od breskvi, a nađe se u situaciji izbora u uslovima
rizika gde joj se nude opcije
(i) dobitka jabuke sa verovatnoćom α i kruške sa verovatnoćom 1- α, ili
(ii) breskve sa verovatnoćom α i kruške sa verovatnoćom 1- α,
ta osoba će uvek preferirati opciju (i) nad opcijom (ii), jer se one razlikuju
samo po tome da se sa istom verovatnoćom α osvoji jabuka ili breskva.
Rezon: pošto je već ustanovljeno da ta osoba ima preferenciju jabuke ≻
breskve, dodavanje jednoj i drugoj opciji podjednako verovatne
mogućnosti osvajanja kruške ne sme da utiče na ovu početnu preferenciju.
9. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 9
Paradoksi teorije racionalnog izbora: Aleov paradoks
Opcija A: sa sigurnošću (100%) dobitak od 100 miliona dolara.
Opcija B: sa 89% dobitak od 100 milion dolara, sa 10% dobitak od 500 miliona dolara, i sa
1% ništa (0 dolara).
Izaberite sada između opcija A1 i B1:
Opcija A1: sa 89% ništa (0 dolara) i sa 11% dobitak od 100 miliona dolara
Opcija B1: sa 90% ništa (0 dolara) i sa 10% dobitak od 500 miliona dolara
A (sigurni dobitak od 100 miliona dolara) je dominantan izbor između A i B,
dok je B1 (90% ništa i 10% dobitak od 500 miliona dolara) dominantan izbor između A1 i B1.
10. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 10
Paradoksi teorije racionalnog izbora: Aleov paradoks
Moris Ale
1% 10% 89%
A 100M $ 100M $ 100M $
B 0 500M $ 100M $
A1 100M$ 100M$ 0
B1 0 500M $ 0
11. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 11
Paradoksi teorije racionalnog izbora: paradoks zajedničke proporcije
Izaberite između A i B:
Opcija A: 6000 dolara sa verovatnoćom .45, u suprotnom ništa.
Opcija B: 3000 dolara sa verovatnoćom .90, u suprotnom ništa.
Izaberite sada između A1 i B1:
Opcija A1: 6000 dolara sa verovatnoćom .001, u suprotnom ništa.
Opcija B1: 3000 dolara sa verovatnoćom .002, u suprotnom ništa.
U prvom slučaju, većina ispitanika bira opciju B, koja nosi veću verovatnoću dobitka,
dok u drugom slučaju, većina ispitanika bira opciju A1, koja nosi višu vrednost.
12. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 12
Paradoksi teorije racionalnog izbora: paradoks zajedničke proporcije
Izaberite između A i B:
Opcija A: 4000 dolara sa verovatnoćom .80, ništa sa verovatnoćom .20.
Opcija B. Sigurnih 3000 dolara.
Izaberite sada između A1 i B1:
Opcija A1: 4000 dolara sa verovatnoćom .20, ništa sa verovatnoćom .80.
Opcija B1. 3000 dolara sa verovatnoćom .25, ništa sa verovatnoćom .75.
Većina ispitanika u ovakvom zadatku bira opciju B u prvom slučaju
i opciju A1 u drugom slučaju.
13. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 13
Paradoksi teorije racionalnog izbora: paradoks zajedničke proporcije
Opcija A: 4000 dolara sa verovatnoćom
.80, ništa sa verovatnoćom .20.
Opcija B. Sigurnih 3000 dolara.
Opcija A1: 4000 dolara sa verovatnoćom
.20, ništa sa verovatnoćom .80.
Opcija B1. 3000 dolara sa verovatnoćom
.25, ništa sa verovatnoćom .75.
14. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 14
Subjektivni tretman verovatnoća
Vrednost od 3000$ u džepu deluje kao bolji
izbor od neizvesnih 4000$, čak i sa visokom
verovatnoćom osvajanja od 80%, iz čega sledi
da je skok u šansama za osvajanje ishoda sa
80% na sigurnih 100% na neki način veoma
uticajan.
Slično, takođe se pokazuje empirijski, kao
psihološki uticajan otkriva se skok u
verovatnoći sa 0 na neku nisku verovatnoću,
npr. 10% ili 20%.
U takvim slučajevima, psihološki je značajan
prelaz iz nemogućnosti u mogućnost: nešto što
uopšte nije moglo da se ostvari (verovatnoća
nula) je postalo moguće (makar i sa nekom
malom verovatnoćom).
15. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 15
Subjektivni tretman verovatnoća
Opcija A: 6000 dolara sa verovatnoćom .45, u suprotnom ništa.
Opcija B: 3000 dolara sa verovatnoćom .90, u suprotnom ništa.
Opcija A1: 6000 dolara sa verovatnoćom .001, u suprotnom ništa.
Opcija B1: 3000 dolara sa verovatnoćom .002, u suprotnom ništa.
p(3000) : p(6000) = ½
Da li je odnos subjektivnih verovatnoća uvek ½?
Nemoguće. Uvek bi svi birali 3000$.
16. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 16
Subjektivni tretman verovatnoća
Neka neki donosila odluka prvo evaluira loz koji sa
5% donosi 100 evra, i sa 95% ne donosi ništa – i pokazuje sklonost ka riziku.
Prepostavimo sada da isti donosilac odluka evaluira loz koji sa
95% donosi 100 evra, i sa 5% ništa - i pokazuje averziju prema riziku.
Ako donosilac odluka u obe situacije ima istu funkciju korisnosti – što je standardna
pretpostavka teorije odlučivanja – kako objašnjavamo činjenicu da je on sklon ka
riziku u oceni prvog loza, i averzivan prema riziku u oceni drugog loza?
Poznat empirijski nalaz: četvoročlana struktura stavova prema riziku
za niske verovatnoće p dobitka x: sklonost ka riziku
za umerene i visoke verovatnoće p dobitka x: averzija prema riziku
za niske verovatnoće p gubitka x: averzija prema riziku
za umerene i visoke verovatnoće p gubitka x: sklonost ka riziku.
17. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 17
Subjektivni tretman verovatnoća
5% donosi 100 evra, i sa 95% ne donosi ništa –pokazuje sklonost ka riziku.
95% donosi 100 evra, i sa 5% ništa - pokazuje averziju prema riziku.
Ako donosilac odluka u obe situacije ima istu funkciju korisnosti – što je standardna
pretpostavka teorije odlučivanja – kako objašnjavamo činjenicu da je on sklon ka
riziku u oceni prvog loza, i averzivan prema riziku u oceni drugog loza?
Ako donosilac odluka tretira p = .05 u prvom lozu kao nešto višu nego što jeste...
ako donosilac odluka tretira p = .95 u drugom lozu kao nešto nižu nego što jeste...
...ovaj empirijski nalaz može da se objasni.
18. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 18-1
Subjektivni tretman verovatnoća
0 1
1
Objektivna P
Subjektivna P
19. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 18-2
Subjektivni tretman verovatnoća
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Objektivna verovatnoca
Ponderisana(opazena)verovatnoca
Funkcija ponderisanja verovatnoca za teoriju izgleda
potcenjivanje većih verovatnoća
precenjivanje manjih verovatnoća
izvesnost
nemogućnost
20. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 19
Različit tretman dobitaka i gubitaka: efekat refleksije
Plan A: primena plana A
sigurno spašava život 200
ljudi.
Plan B: primena plana B
garantuje sa verovatnoćom
od 1/3 da će preživeti svih
600 ljudi i sa verovatnoćom
od 2/3 da neće preživeti niko.
Plan C: primena plana C
dovodi do sigurnog gubitka
400 života.
Plan D: primena plana D
garantuje sa verovatnoćom
od 1/3 da niko neće umreti i
sa verovatnoćom od 2/3 da će
svih 600 ljudi umreti.
U nekoj zemlji izbila je epidemija nepoznate azijske bolesti. Pred nadležnim
organima se nalaze plan A i plan B (plan C i plan D). Koji od planova biste izabrali da
sprovedete (Tversky & Kahneman, 1987)?
Ispitanici koji biraju između A i B većinski biraju plan A, čime otkrivaju averziju prema riziku.
Ispitanici koji biraju između planova C i D većinski biraju plan D, čime otkrivaju sklonost ka riziku.
Jedina razlika između planova A i B, s jedne, i C i D, s druge strane, je ta što su planovi C i D formulisani u
terminima gubitaka, dok su planovi A i B formulisani u terminima dobitaka.
Ovakavi efekti se nazivaju efektima okvira ili formulacije (engl. framing effects).
21. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 20
Različit tretman dobitaka i gubitaka: efekat refleksije
-100 -80 -60 -40 -20 0 20 40 60 80 100
-100
-80
-60
-40
-20
0
20
40
60
80
100
Value (Vrednost)
Utility(Korisnost)
Funkcija korisnosti koja je
konkavna za dobitke i konveksna
za gubitke.
Ako držite ρ u funkciji
u(x) = xρ između 0 i 1,
dobijete ovakvu funkciju.
Averzija prema riziku za dobitke, sklonost ka riziku za gubitke?
To možemo da sredimo:
22. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 21-1
Različit tretman dobitaka i gubitaka: averzija prema gubicima
50% a 50% b 50% c 50% d λ
1 0 0 -25 61 2.44
2 0 0 -50 101 2.02
3 0 0 -100 202 2.02
4 0 0 -150 280 1.87
(prema Tversky & Kahneman, 1992)
23. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 21-2
Različit tretman dobitaka i gubitaka: averzija prema gubicima
Kahneman, Knetch & Thaler, 1991.
I grupa
Imaš šolju: po kojoj ceni bi je prodao?
II grupa
Nemaš šolju: koliko bi je platio?
7$ 12 centi 2$ 87 centi
24. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 21-3
Različit tretman dobitaka i gubitaka: averzija prema gubicima
Kahneman & Tversky, 1984.
Bacimo dukat, izađe glava: Bacimo dukat, izađe pismo:
Dobiješ 10$ Izgubiš 10$ NE!
Dobiješ 20$ ? NE!
25. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 22
Različit tretman dobitaka i gubitaka: averzija prema gubicima
-120 -100 -80 -60 -40 -20 0 20 40 60
-120
-100
-80
-60
-40
-20
0
20
40
60
Value Function
Value (Vrednost)
Utility(Korisnost)
Funkcija vrednosti:
u(x) =
u(x) = xρ, dobici
u(x) = λxρ, gubici
λ
x
2x
26. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 23
Teorija izgleda
(Kahneman & Tversky, 1979, Tversky & Kahneman, 1992)
Daniel Kahneman (desno) i
Amos Tversky (levo).
∑ ⋅=
i
ii xxpLE )()(
Očekivana vrednost
∑ ⋅=
i
ii xuxpLU )()()(
Očekivana korisnost
∑ ⋅=
i
ii xupwLV )()()(
Teorija izgleda
∑ ⋅⋅=
i
ii xupwLV )()()( λ
u(x) =
u(x) = xρ, dobici
u(x) = λxρ, gubici
27. Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 24
Teorija izgleda
(Kahneman & Tversky, 1979, Tversky & Kahneman, 1992)
Daniel Kahneman, 2002.
Amos Tversky,
1937-1996.
„... for having integrated
insights from psychological
research into economic
science, especially
concerning human
judgment and decision-
making under uncertainty."