Sadržaj:
- Teorija odluke
- 1. Koje su prednosti u odnosu na perspektive?
- 2. Korisne mjere preferencije
- 3. Donošenje stvarnih odluka
- 7. Zaključne napomene
- Bibliografija
- Akademske alate
- Ostali internetski resursi

Video: Teorija Odluke

2023 Autor: Noah Black | [email protected]. Zadnja promjena: 2023-11-26 16:08
Ulazna navigacija
- Sadržaj unosa
- Bibliografija
- Akademske alate
- Prijatelji PDF pregled
- Podaci o autoru i citiranju
- Povratak na vrh
Teorija odluke
Objavljeno u srijedu 16. prosinca 2015
Teorija odluka bavi se rezonovanjima na kojima se temelji agentov izbor, bilo da se radi o dnevnom izboru između izlaska autobusom ili taksijem ili dalekosežnijeg izbora o tome hoće li nastaviti zahtjevnu političku karijeru. (Imajte na umu da "agent" ovdje predstavlja entitet, obično pojedinačnu osobu, koji je sposoban za promišljanje i djelovanje.) Standardno razmišljanje je da ono što agent radi u bilo kojoj prilici u potpunosti određuje njezina uvjerenja i želje / vrijednosti, ali to nije sporno, kao što ćemo vidjeti u nastavku. U svakom slučaju, teorija odlučivanja jednako je teorija vjerovanja, želja i drugih relevantnih stavova koliko i teorija izbora; Ono što je važno jest kako se ti različiti stavovi (nazovimo ih „preferencijalni stavovi“) spajaju zajedno.
Fokus ovog unosa je teorija normativne odluke. To je, glavno pitanje koje zanima koje bi kriterije trebao ispunjavati agentov stav u bilo kojim općim okolnostima. To predstavlja minimalni račun racionalnosti, onaj koji postavlja značajnija pitanja o odgovarajućim vrijednostima i sklonostima, i razumna uvjerenja, s obzirom na situaciju. Ključno je pitanje u tom pogledu liječenje neizvjesnosti. Pravoslavna teorija normativne odluke, teorija očekivane korisnosti (EU), u biti kaže, da u situacijama nesigurnosti treba preferirati opciju s najvećom očekivanom poželjnošću ili vrijednošću. Ova jednostavna maksima bit će žarište velikog dijela naše rasprave.
Struktura ovog unosa je sljedeća: Poglavlje 1 govori o osnovnom pojmu „preferencije nad perspektivima“koji je u srcu teorije odlučivanja. U drugom dijelu opisan je razvoj normativne teorije odlučivanja u smislu sve snažnijih i fleksibilnijih mjera preferencija. Treće poglavlje govori o dvije najpoznatije verzije teorije EU. Odjeljak 4. razmatra širi značaj teorije EU-a za praktično djelovanje, zaključivanje i vrednovanje. Odjeljak 5. pretvara se u istaknute izazove teoriji EU-a, dok se u odjeljku 6. govori o uzastopnim odlukama i o tome kako se ova bogatija postavka temelji na raspravama o racionalnim preferencijama.
- 1. Koje su prednosti u odnosu na perspektive?
-
2. Korisne mjere preferencije
- 2.1 Obične komunalije
- 2.2 Uslužni program za kardinalizaciju
- 2.3 Teorem reprezentacije von Neumanna i Morgensterna (vNM)
-
3. Donošenje stvarnih odluka
- 3.1 Savageova teorija
- 3.2. Jeffreyjeva teorija
-
4. Širi značaj teorije očekivane korisnosti (EU)
- 4.1 Granice teorije EU
- 4.2. O racionalnom vjerovanju
- 4.3 O racionalnoj želji
-
5. Izazovi teorije EU
- 5.1 Uzročne anomalije
- 5.2 O odvojenosti: Rizik i žaljenje stavovi
- 5.3 Potpuno: Nejasna uvjerenja i želje
-
6. Sekvencijalne odluke
- 6.1 Je li Ulysses bio racionalan?
- 6.2 Aksiomi EU revidirani
- 7. Zaključne napomene
- Bibliografija
- Akademske alate
- Ostali internetski resursi
- Povezani unosi
1. Koje su prednosti u odnosu na perspektive?
Dva središnja koncepta u teoriji odlučivanja su preferencije i izgledi (ili slično, mogućnosti). Grubo govoreći, kažemo da agent "preferira" "opciju" (A) nad (B) za svaki slučaj, za predmetnog agenta je prvi poželjniji ili korisniji od izbora za drugi. Ta gruba definicija jasno daje do znanja da je prednost komparativnom stavu; to je jedna od usporedbi opcija s obzirom na to koliko su poželjne / izbora dostojne. Pored toga, postoji prostor za raspravu o tome što zapravo preferiraju opcije, ili drugim riječima, što se tiče agenta (možda i samog sebe) koji nas zabrinjava kada govorimo o njegovim sklonostima nad opcijama. U ovom su odjeljku razmotrena osnovna pitanja tumačenja koja postavljaju osnovu za uvođenje (u sljedećem odjeljku) tablica odluka i očekivanu korisnost pravila koja je za mnoge poznati predmet teorije odlučivanja. Daljnja tumačenja u vezi s preferencijama i izgledima bit će razmatrana naknadno, kako se pojave.
Ipak nastavimo prvo uvođenjem osnovnih svojstava kandidata (racionalne) sklonosti nad opcijama i tek nakon toga okrećući se pitanjima interpretacije. Kao što je gore spomenuto, prednost se odnosi na usporedbu opcija; to je odnos između opcija. Za domenu opcija govorimo o redoslijedu davanja agenta, a to je redoslijed opcija koje generira preferencija agenta između bilo koje dvije opcije u toj domeni.
U nastavku slijedi (precedq) odnos slabih preferencija, tj. Odnos „… nije preferiran od…“. Dakle, (A / prethodq B) predstavlja da agent za koji smo zainteresirani smatra da je opcija (B) barem preferirana kao opcija (A). Iz odnosa slabih preferencija možemo odrediti odnos striktne preferencije, (prec), kako slijedi: (A / prec B / lijeva glava A / prethodq B & / \ neg (B / prethodq A)), pri čemu (neg X) znači "to nije slučaj (X)". Odnos ravnodušnosti, (sim), definira se kao: (A / sim B / lijeva svjetlost A / prethodq B & / B / precedq A). To predstavlja da agent za koji smo zainteresirani smatra (A) i (B) jednako poželjnim.
Kažemo da (precedq) slabo naređuje skup (S) opcija kad god zadovoljava sljedeća dva uvjeta:
Aksiom 1 (cjelovitost)
Za bilo koji (A, B / u S): bilo (A / prethodq B) ili (B / precedq A).
Aksiom 2 (tranzitivnost)
Za bilo koji (A, B, C / u S): ako (A / precedq B) i (B / precedq C), tada (A / precedq C).
Navedeno se može uzeti kao preliminarna karakterizacija racionalne sklonosti opcijama. Međutim, čak je i ova ograničena karakterizacija sporna i ukazuje na različita tumačenja „preferencija nad perspektivama / mogućnostima“.
Započnite s aksiomom cjelovitosti, koji kaže da agent može usporediti, u odnosu na odnos slabih preferencija, sve parove opcija u (S). Je li cjelovitost uvjerljivo ograničenje racionalnosti ili ne, ovisi i o vrsti opcija koje se razmatraju i kako tumačimo preferencije nad tim opcijama. Ako skup opcija uključuje sve vrste stanja, tada kompletnost nije odmah uvjerljiva. Na primjer, upitno je bi li agent mogao biti u mogućnosti usporediti mogućnost da dvije dodatne osobe na svijetu budu pismene i mogućnost da dvije dodatne osobe dosegnu šezdeset godina. Ako su, s druge strane, sve opcije u setu prilično slične jedna drugoj, recimo, sve opcije su portfelj ulaganja, tada je Potpunost uvjerljivija. Ali čak i ako ne ograničavamo vrste opcija koje se razmatraju, pitanje da li cjelovitost treba ispuniti ili ne uključuje značenje preferencije. Na primjer, ako preferencije predstavljaju samo ponašanje izbora ili dispozicije, kao što to čine u skladu s "otkrivenom teorijom preferencija" popularnom među ekonomistima (vidi Sen 1973), tada se kompletnost automatski zadovoljava, uz pretpostavku da izbor mora neizbježno biti napravljen. Suprotno tome, ako se preferencije shvaćaju više kao mentalni stavovi, tj. Ako se prosuđuju o tome da li je opcija bolja ili poželjnija od druge, tada su sumnje o cjelovitosti na koje se gore govori, relevantne (za daljnju raspravu vidi Mandler 2001).pitanje da li cjelovitost treba zadovoljiti ili ne uključuje značenje sklonosti. Na primjer, ako preferencije predstavljaju samo ponašanje izbora ili dispozicije, kao što to čine u skladu s "otkrivenom teorijom preferencija" popularnom među ekonomistima (vidi Sen 1973), tada se kompletnost automatski zadovoljava, uz pretpostavku da izbor mora neizbježno biti napravljen. Suprotno tome, ako se preferencije shvaćaju više kao mentalni stavovi, tj. Ako se prosuđuju o tome da li je opcija bolja ili poželjnija od druge, tada su sumnje o cjelovitosti na koje se gore govori, relevantne (za daljnju raspravu vidi Mandler 2001).pitanje da li cjelovitost treba zadovoljiti ili ne uključuje značenje sklonosti. Na primjer, ako preferencije predstavljaju samo ponašanje izbora ili dispozicije, kao što to čine prema "otkrivenoj teoriji preferencija" popularnoj među ekonomistima (vidi Sen 1973), tada se kompletnost automatski zadovoljava, uz pretpostavku da izbor mora neizbježno biti napravljen. Suprotno tome, ako se preferencije shvate kao mentalni stavovi, tj. Ako se prosuđuju o tome da li je opcija bolja ili poželjnija od druge, tada su sumnje o cjelovitosti na koje se gore govori, relevantne (za daljnju raspravu vidi Mandler 2001).tada se kompletnost automatski zadovoljava, uz pretpostavku da se izbor neminovno mora učiniti. Suprotno tome, ako se preferencije shvaćaju više kao mentalni stavovi, tj. Ako se prosuđuju o tome da li je opcija bolja ili poželjnija od druge, tada su sumnje o cjelovitosti na koje se gore govori, relevantne (za daljnju raspravu vidi Mandler 2001).tada se kompletnost automatski zadovoljava, uz pretpostavku da se izbor neminovno mora učiniti. Suprotno tome, ako se preferencije shvaćaju više kao mentalni stavovi, tj. Ako se prosuđuju o tome da li je opcija bolja ili poželjnija od druge, tada su sumnje o cjelovitosti na koje se gore govori, relevantne (za daljnju raspravu vidi Mandler 2001).
Većina filozofa i teoretičara odluka pretplaćuje se na posljednje tumačenje preferencije kao vrste prosudbe koja objašnjava, za razliku od istovjetnosti s dispozicijama izbora i ponašanjem s rezultatima izbora (vidi, npr., Dietrich i List, 2015). Štoviše, mnogi smatraju da se kompletnost ne zahtijeva racionalno; da racionalnost postavlja zahtjeve samo za prosudbe kojih agent zapravo ima, ali ništa ne govori o tome mora li se presuda uopće održati. Ipak, slijedeći Richarda Jeffreyja (1983.), većina teoretičara odluka sugerira da racionalnost zahtijeva da preferencije budu koherentno proširive. To znači da, čak i ako vaše postavke nisu potpune, trebalo bi ih biti moguće ispuniti bez kršenja bilo kojeg od uvjeta koji se racionalno zahtijevaju, posebno tranzitivnosti.
To nas dovodi do aksioma tranzitivnosti, koji kaže da ako je opcija (B) barem poželjnija kao (A), a (C) je barem podjednaka kao (B), tada (A) se ne može strogo preferirati od (C). Nedavni izazov tranzitivnosti uključuje heterogene skupove opcija, prema gornjoj raspravi o kompletnosti. Ali ovdje se uspoređivanje opcija odnosi na različito tumačenje preferencija. Ideja je da preferencije, ili prosudbe o poželjnosti, mogu odgovarati uvjetu vidljivosti. Na primjer, pretpostavimo da je najistaknutija značajka kada se uspoređuju automobili (A) i (B) brzina kojom se mogu voziti, a (B) u tom pogledu nije lošija od (A), Ipak, najizražajnija značajka kada se uspoređuju automobili (B) i (C) je koliko su sigurni, i da (C) nije ništa lošiji od (B) u tom pogledu. Osim toga,pri uspoređivanju (A) i (C), najizražajnija karakteristika je njihova ljepota. U takvom slučaju, neki tvrde (npr. Temkin 2012) da ne postoji razlog zašto bi tranzitivnost bila zadovoljena u odnosu na sklonosti koji se odnose na (A), (B) i (C). Drugi (npr. Broome 1991a) tvrde da je tranzitivnost dio samog značenja odnosa boljitka (ili objektivne komparativne poželjnosti); ako je racionalna sklonost prosudbi boljeg ili poželjnog, o tranzitivnosti se ne može pregovarati. S obzirom na primjer automobila, Broome tvrdi da poželjnost potpuno određene opcije ne bi trebala varirati, naprosto s onim drugim opcijama s kojima se uspoređuje. Bilo koji kontekst izbora utječe na to kako agent vidi opciju koja postoji, u tom slučaju bi opis opcije trebao odražavati to,ili u suprotnom kontekst izbora ne utječe na opciju. Bilo kako bilo, tranzitivnost treba biti zadovoljena.
Izravnija je obrana tranzitivnosti u preferencijama; obrana koja ovisi o sigurnim gubicima koji mogu pretrpjeti svakoga tko prekrši aksiom. Ovo je takozvani argument pumpe novca (za nedavnu raspravu i reviziju te argumentacije, vidi Gustafsson 2010 & 2013). Temelji se na pretpostavci da ako smatrate da je (X) barem toliko poželjan kao (Y), tada biste trebali rado trgovati potonjim za prvo. Pretpostavimo da prekršite Transitivnost, tj. Za vas: (A / prethodq B), (B / precedq C), ali (C / prec A). Štoviše, pretpostavimo da trenutno imate (A). Tada biste trebali biti voljni trgovati (A) za (B). Isto vrijedi i za (B) i (C): trebali biste biti spremni trgovati (B) za (C). Strogo preferirate (A) do (C), pa biste trebali biti voljni trgovati s (C) plus nekom sumom ($ x) za (A). Ali sada ste u istoj situaciji kao i vi, s (A), ali niti (B) niti (C), osim što ste izgubili ($ x)! Tako se u nekoliko koraka, od kojih je svaki bio u skladu s vašim željama, nalazite u situaciji koja je očigledno lošija, po vašim vlastitim svjetlima, nego u vašoj izvornoj situaciji. Slika je dramatičnija ako zamislimo da bi se postupak mogao ponoviti, pretvarajući vas u “crpku novca”. Dakle, tvrdi se, postoji nešto (instrumentalno) iracionalno u vezi vaših neosjetljivih sklonosti. Ako su vaše postavke bile tranzitivne, ne biste bili ranjivi na odabir opcije s dominiranjem i posluživanju kao crpka novca. Stoga bi vaše postavke trebale biti prijelazne.od kojih je svaka bila u skladu s vašim željama, nalazite se u situaciji koja je očigledno lošija, po vašim vlastitim svjetlima, od vaše izvorne situacije. Slika je dramatičnija ako zamislimo da bi se postupak mogao ponoviti, pretvarajući vas u “crpku novca”. Dakle, tvrdi se, postoji nešto (instrumentalno) iracionalno u vezi vaših neosjetljivih sklonosti. Ako su vaše postavke bile tranzitivne, ne biste bili ranjivi na odabir opcije s dominiranjem i posluživanju kao crpka novca. Stoga bi vaše postavke trebale biti prijelazne.od kojih je svaka bila u skladu s vašim željama, nalazite se u situaciji koja je očigledno lošija, po vašim vlastitim svjetlima, od vaše izvorne situacije. Slika je dramatičnija ako zamislimo da bi se postupak mogao ponoviti, pretvarajući vas u “crpku novca”. Dakle, tvrdi se, postoji nešto (instrumentalno) iracionalno u vezi vaših neosjetljivih sklonosti. Ako su vaše postavke bile tranzitivne, ne biste bili ranjivi na odabir opcije s dominiranjem i posluživanju kao crpka novca. Stoga bi vaše postavke trebale biti prijelazne.postoji nešto (instrumentalno) neracionalno u pogledu vaših neosjetljivih sklonosti. Ako su vaše postavke bile tranzitivne, ne biste bili ranjivi na odabir opcije s dominiranjem i posluživanju kao crpka novca. Stoga bi vaše postavke trebale biti prijelazne.postoji nešto (instrumentalno) neracionalno u pogledu vaših neosjetljivih sklonosti. Ako su vaše postavke bile tranzitivne, ne biste bili ranjivi na odabir opcije s dominiranjem i posluživanju kao crpka novca. Stoga bi vaše postavke trebale biti prijelazne.
Premda gore navedene kontroverze nisu riješene, u ostatku ovog unosa bit će postavljene sljedeće pretpostavke: i) objekti preferiranja mogu biti heterogeni izgledi, koji uključuju bogatu i raznoliku domenu svojstava, ii) prednost između opcija je presuda iii komparativne poželjnosti ili vrijednosti, i iii) da preferencije zadovoljavaju i tranzitivnost i cjelovitost (iako će potonji uvjet biti preispitan u odjeljku 5). Pitanje koje se sada postavlja je da li postoje daljnja opća ograničenja racionalne preferencije nad opcijama.
2. Korisne mjere preferencije
U našoj kontinuiranoj istrazi racionalnih preferencija nad perspektivama, brojčani prikaz (ili mjerenje) redoslijeda preferencija postat će važan. Predmetne numeričke mjere poznate su kao uslužne funkcije. Dvije glavne vrste uslužne funkcije koje će igrati ulogu jesu redoslijed uslužne funkcije i više informacija (interventno) (ili kardinalno) korisna funkcija.
2.1 Obične komunalije
Ispada da je, sve dok je skup perspektiva / opcija, (S) konačan, svaki slabi redoslijed opcija u (S) može predstavljati funkcijom redovne korisnosti. Da budemo precizni, recimo da je (u) uslužna funkcija s domenom (S). Kažemo da funkcija (u) predstavlja prednost (precedq) između opcija u (S) za svaki slučaj:
) oznaka {1} tekst {za bilo koji} A, B / u S: u (A) leq u (B) lijeva glava A / prethodq B)
Drugi način je da se, kada gore navedeno, odnos preferencija može prikazati kao maksimizirajuća korisnost, jer uvijek favorizira opciju s najvišom korisnošću.
Jedini podatak sadržan u uobičajenom prikazu uslužnog programa je kako agent čiji preferencije budu predstavljene opcije naloga, od najmanje do najpoželjnijeg. To znači da ako je (u) redoslijedna uslužna funkcija koja predstavlja poredanje (precedq), tada je svaka uslužna funkcija (u ') redna transformacija (u) - tj. svaka transformacija (u) koja također zadovoljava dvokondicionalan u (1) -prestavlja (predeq) jednako kao i (u). Stoga kažemo da je funkcija ordinalne korisnosti jedinstvena samo do ordinalnih transformacija.
Gore navedeni rezultat može se sažeti na sljedeći način:
Teorem 1 (Ordinalna reprezentacija). Neka je (S) konačni skup, a (prethodq) slab preferencijalni odnos na (S). Zatim postoji funkcija redovne uslužne funkcije koja predstavlja (precedq) samo u slučaju da je (precedq) potpuna i tranzitivna.
Taj teorem ne bi trebao biti previše iznenađujući. Ako je (prethodq) cjelovit i prijelazan preko (S), tada se opcije u (S) mogu staviti u redoslijed, od najviše do najmanje poželjnog, gdje neke opcije mogu pasti na isto položaj (ako se smatraju jednako poželjnim), ali tamo gdje nema ciklusa ili petlji. Teorem 1 upravo kaže da opcijama možemo dodijeliti brojeve na (S) na način koji predstavlja ovaj redoslijed. (Za jednostavan dokaz teoreme 1, osim strogog, a ne slabog odnosa preferencija, savjetujte Peterson 2009: 95.)
Imajte na umu da uobičajeni alati nisu tako matematički „moćni“. Na primjer, nema smisla uspoređivati vjerojatna očekivanja različitih skupova redovnih alata. Na primjer, razmotrite sljedeća dva para perspektiva: elementima prvog para dodijeljeni su naredni uslužni programi 2 i 4, dok su onima iz drugog para dodijeljeni redni uslužni programi od 0 i 5. Navedimo "ravnu" distribuciju vjerojatnosti u svakom slučaju tako da svakom elementu u dva para odgovara vjerojatnost 0,5. U odnosu na ovaj raspored vjerojatnosti, očekivanje prvog para ordinalnih alata je 3, što je veće od 2,5, očekivanje drugog para. Ipak, kada transformiramo uobičajene uslužne programe na dopušteni način - na primjer, povećavajući najveću korisnost u drugom paru s 5 na 10 - redoslijed očekivanja se mijenja; sada je usporedba između 3 i 5. Značaj ove točke postat će jasniji u onome što slijedi kada se okrenemo komparativnom vrednovanju lutrija i rizičnim izborima. Funkcija korisnosti intervala ili kardinalna funkcija neophodna je za dosljedan procjenjivanje lutrija / rizičnih izgleda. Isto tako, da bi se konstruirala ili konceptualizirala kardinalna korisna funkcija, obično se apelira na povlastice pred lutrijama. Funkcija korisnosti intervala ili kardinalna funkcija neophodna je za dosljedan procjenjivanje lutrija / rizičnih izgleda. Isto tako, da bi se konstruirala ili konceptualizirala kardinalna korisna funkcija, obično se apelira na povlastice pred lutrijama. Funkcija korisnosti intervala ili kardinalna funkcija neophodna je za dosljedan procjenjivanje lutrija / rizičnih izgleda. Isto tako, da bi se konstruirala ili konceptualizirala kardinalna korisna funkcija, obično se apelira na povlastice pred lutrijama.
2.2 Uslužni program za kardinalizaciju
Da bismo dobili kardinalni (intervalni) uslužni prikaz preferenciranja redoslijeda - tj. Mjera koja predstavlja ne samo kako agent naređuje opcije, već i govori o poželjnoj "udaljenosti" između opcija - potrebna nam je bogatija postavka; skup opcija i odgovarajući redoslijed preferencija morat će imati više strukture nego za uobičajenu mjeru korisnosti. Jedan takav račun, zahvaljujući John von Neumannu i Oskaru Morgensternu (1944.), bit će prikazan u detaljima u nastavku. Za sada je korisno usredotočiti se na vrstu opcije koja je ključna za razumijevanje i izgradnju kardinalne korisne funkcije: lutrije. [1]
Prvo razmislite o narudžbi preko tri uobičajene opcije, npr. Tri destinacije za odmor Amsterdam, Bangkok i Cardiff, označene s (A), (B) i (C). Pretpostavimo da je vaše redoslijed preferiranja (A / prec B / prec C). Ove su informacije dovoljne da obično predstavljaju vašu prosudbu; podsjetite se da je tada bilo koji raspored uslužnih programa prihvatljiv sve dok (C) dobije veću vrijednost od (B) koja dobije veću vrijednost od (A). Ali možda želimo znati više nego što se iz takve uslužne funkcije može zaključiti - želimo znati koliko je (C) preferirano nad (B), u odnosu na to koliko je (B) preferirano nad (A). Na primjer, može se dogoditi da se Bangkok smatra gotovo poželjnim kao i Cardiff, ali Amsterdam je relativno zaostajao za Bangkokom. Ili je možda Bangkok samo neznatno bolji od Amsterdama,u odnosu na to koliko je Cardiff bolji od Bangkoka. Ova vrsta informacija o relativnoj udaljenosti između opcija, u pogledu snage preferiranja ili poželjnosti, upravo je ono što se daje uslužnom funkcijom intervala-vrijednosti. Problem je kako utvrditi ove podatke.
Da bi riješili taj problem, Ramsey (1926) i kasnije von Neumann i Morgenstern (u daljnjem tekstu vNM) dali su sljedeći prijedlog: konstruiramo novu opciju, lutriju, (L (L)), koja ima (A) i (C) kao moguće moguće nagrade, a mi utvrdimo koja je prilika lutrija da vam pruži (C) da biste bili ravnodušni između ove lutrije i odmora u Bangkoku. Osnovna ideja je da se vaša prosudba o Bangkoku, u odnosu na Cardiff s jedne strane i Amsterdamu s druge, može mjeriti rizikom lutrije (L) koja uključuje Cardiff i Amsterdam, a koju smatrate podjednako poželjnom kao i Bangkok. Na primjer, ako ste ravnodušni između Bangkoka i lutrije koja pruža vrlo male šanse za pobjedu na putovanju u Cardiff, onda očito ne smatrate da je Bangkok mnogo bolji od Amsterdama u odnosu na Cardiff; za tebe,čak je i mali napredak u Amsterdamu, tj. lutrija s malom šansom Cardiffa, a ne Amsterdama, dovoljna je da upoznam Bangkok.
Gornja analiza pretpostavlja da se lutrije ocjenjuju prema očekivanoj vrijednosti ili poželjnosti izbora. Odnosno, poželjnost lutrije je zapravo zbroj šansi za svaku nagradu pomnožene sa poželjnošću te nagrade. Razmotrite sljedeći primjer: Pretpostavimo da ste ravnodušni između lutrije, (L) i praznika u Bangkoku, (B), kada je šansa lutrije koja rezultira odmorom u Cardiffu (3/4). Nazovite ovu određenu lutriju (L '). Ideja je da Bangkok znači tri četvrtine puta prema ljestvici poželjnosti koja ima Amsterdam na dnu i Cardiff na vrhu. Ako odredimo da su (u (A) = 0) i (u (C) = 1), tada je (u (B) = u (L ') = 3/4). To odgovara očekivanoj poželjnosti - ili, kako se obično naziva, očekivanoj korisnosti - lutriji, budući da je (u (L ') = 1/4 / cdot 0 + 3/4 / cdot 1 = 3/4). To jest, vrijednost lutrije je zbroj komunalnih programa nagrada vjerovatno ponderiranih, gdje je težina svake nagrade određena vjerojatnošću da lutrija rezultira tom nagradom.
Stoga vidimo da se uvođenjem opcija lutrije može konstruirati intervalna vrijednost korisne mjere nad opcijama. Kao što ime sugerira, korisna mjera intervala prenosi informacije o relativnim veličinama intervala između opcija prema nekoj ljestvici poželjnosti. To jest, komunalije su jedinstvene nakon što smo fiksirali početnu točku našeg mjerenja i jediničnu ljestvicu poželjnosti. U gornjem primjeru mogli bismo, na primjer, dodijeliti vrijednost uslužnog programa od 1 do (A) i 5 do (C), u tom slučaju bismo morali dodijeliti vrijednost uslužnog programa od 4 do (B), budući da je 4 3/4 puta između 1 i 5. Drugim riječima, jednom kada dodijelimo korisne vrijednosti (A) i (C), korisnost (L ') te je time (B) određen. Nazovimo ovu drugu uslužnu funkciju (u '). Povezana je s našom izvornom funkcijom kako slijedi: (u '= 4 / cdot u +1). Taj se odnos uvijek održava između dvije takve funkcije: Ako je (u) uslužna funkcija intervala-vrijednosti koja predstavlja redoslijed preferencija, (prethodq), a (u ') je druga uslužna funkcija koja također predstavlja ovog poredanja, tada postoje konstante (a) i (b), pri čemu (a) mora biti pozitivna, takva da je (u '= a / cdot u + b). To znači da su internetske vrijednosti korisnih funkcija jedinstvene samo do pozitivne linearne transformacije.tada postoje konstante (a) i (b), pri čemu (a) mora biti pozitivna, takva da je (u '= a / cdot u + b). To znači da su internetske vrijednosti korisnih funkcija jedinstvene samo do pozitivne linearne transformacije.tada postoje konstante (a) i (b), pri čemu (a) mora biti pozitivna, takva da je (u '= a / cdot u + b). To znači da su internetske vrijednosti korisnih funkcija jedinstvene samo do pozitivne linearne transformacije.
Prije zaključenja ove rasprave o mjerenju korisnosti, potrebno je spomenuti dva povezana ograničenja u pogledu podataka koje takve mjere sadrže. Prvo, budući da se korisne mogućnosti opcija, bilo one redoslijedne ili intervalne vrijednosti, mogu odrediti samo u odnosu na druge opcije, ne postoji apsolutna korisnost opcije, barem ne bez daljnjih pretpostavki. [2]Drugo, istim rezonovanjem, niti mjere intervale vrijednosti i redovne korisne mjere, kao što je ovdje raspravljeno, nisu interpersonalno proporcionalne s obzirom na razine i jedinice korisnosti. Na brzinu, pretpostavimo da i vi i ja imamo gore opisano preferirano redoslijed opcija za praznike: (A / prec B / prec C). Pretpostavimo da smo, prema gore navedenom, obojica ravnodušni između (B) i lutrije (L ') koja ima (3/4) šansu za prinos (C) i a (1/4) vjerojatnost prinosa (A). Možemo li onda reći da bi odobravanje mene Cardiffa i vas Bangkoku značilo isti iznos "potpune poželjnosti" kao i davanje vama Cardiffu i meni Bangkoku? Mi nemamo pravo to reći. Naše zajedničko raspoređivanje preferencija je, na primjer,U skladu sa mnom, pronalazak odmora u Cardiffu ostvarenje snova, a vi samo smatrate da je to najbolje od lošeg. Štoviše, nemamo ni pravo reći da je razlika u poželjnosti između Bangkoka i Amsterdama za vas ista kao i meni. Prema meni, poželjnost tri mogućnosti može se kretati od živog pakla do ostvarenja sna, dok prema vama, od lošeg do sasvim lošeg; obje su ocjene u skladu s gornjim redoslijedom preferencija. Zapravo, isto bi moglo biti i za naše sklonosti prema svim mogućim opcijama, uključujući lutrije: čak i ako dijelimo isto redovno preferenciranje preferencija, možda je slučaj da ste samo negativni raspoloženje, a ne postoji velika mogućnost tako dugo, dok ja Izuzetno ekstremno smatram da su neke mogućnosti izvrsne, a druge potpuno mučenje. Dakle, korisne funkcije,bilo intervalno vrijednosti ili ordinalne, ne omogućuju smislene međuljudske usporedbe. (Elster i Roemer 1993. sadrži niz radova koji raspravljaju o tim pitanjima; vidi i upis SEP-a o teoriji društvenog izbora.)
2.3 Teorem reprezentacije von Neumanna i Morgensterna (vNM)
Posljednji odjeljak pružio je intervalno ocjenjeni korisni prikaz preferencija prema lutriji, uz pretpostavku da se lutrije ocjenjuju u smislu očekivane korisnosti. Neki će ovo možda malo brzo otkriti. Zašto pretpostavljamo da ljudi ocjenjuju lutrije u skladu s očekivanim uslugama? VNM teorem učinkovito nadoknađuje nedostatke u rezoniranju, preusmjeravanjem pozornosti prema odnosu preferencija. Osim tranzitivnosti i cjelovitosti, vNM uvodi daljnja načela koja upravljaju racionalnim preferencijama prema lutrijama, i pokazuju da se preferencije agenta mogu predstaviti kao maksimiziranje očekivane korisnosti kad god njezine sklonosti zadovoljavaju te principe.
Prvo definirajmo, formalno, očekivanu korisnost lutrije: Neka je (L_i) lutrija iz skupa (bL) lutrije i (O_ {ik}) rezultat, ili nagrada, lutrija (L_i) koja nastaje s vjerojatnošću (p_ {ik}). Očekivana korisnost (L_i) tada se definira kao:
VNM jednadžba
[EU (L_i) dot = / sum_k u (O_ {ik}) cdot p_ {ik})
Ranija pretpostavka sada se može službeno ustvrditi:
početak {jednadžba} tag {2} tekst {Za bilo koji} L_i, L_j / in / bL: L_i / prethodq L_j / Lijeva glava EU (L_i) leq EU (L_j) kraj {jednadžba}
Kad gore ostane, kažemo da postoji očekivana uslužna funkcija koja predstavlja preferencije agenta; drugim riječima, agent se može prikazati kao maksimiziranje očekivane korisnosti.
Pitanje na kojemu je vNM adresa: Kakve se postavke mogu tako predstavljati? Da bismo odgovorili na ovo pitanje, moramo se vratiti na odnos preferencija (precedq) nad nizom opcija, u ovom slučaju koji uključuju lutrije. VNM teorem zahtijeva skup (bL) lutrija prilično opsežan: zatvara se pod "mješavinom vjerojatnosti", to jest, ako je (L_i, L_j / in / bL), a zatim složene lutrije koje imaju (L_i) i (L_j) kao moguće nagrade također su u (bL). (Druga tehnička pretpostavka, o kojoj se neće detaljno govoriti, jest da se složene lutrije uvijek mogu svesti, u skladu sa zakonima vjerojatnosti, na jednostavne lutrije koje uključuju samo osnovne nagrade.)
Već je diskutovano o osnovnom ograničenju racionalnosti u odnosu preferencija - da on slabo naređuje opcije (tj. Da zadovoljava tranzitivnost i cjelovitost). Sljedeća će se oznaka upotrijebiti za uvođenje dvije dodatne vNM aksiome preferencije: ({pA, (1-p) B }) označava lutriju koja rezultira ili (A), s vjerojatnošću (p) ili (B), s vjerojatnošću (1-p).
Aksiom 3 (kontinuitet)
Pretpostavimo (A / prethodq B / prethodq C). Tada je (p / u [0,1]) takav:
) {pA, (1-p) C } sim B)
Aksiom 4 (neovisnost)
Pretpostavka (A / prethodq B). Tada za bilo koji (C) i bilo koji (p / u [0,1]):
) {pA, (1-p) C } predeq {pB, (1-p) C })
Kontinuitet podrazumijeva da nijedan ishod nije toliko loš da ne biste bili voljni da uzmete neke kockanje koje bi moglo rezultirati time da završite s tim ishodom, ali inače bi moglo rezultirati povoljnijim ishodom, prema trenutnim svjetlima, pod uslovom da šanse za bolji ishod su dovoljno dobre. Intuitivno, Kontinuitet jamči da su procjene lutrije agenta odgovarajuće osjetljive na vjerojatnost nagrada lutrije. Također osigurava, kao što ime sugerira, dovoljno bogata preferencija na lutrijama može biti predstavljena kontinuiranom kardinalnom funkcijom.
Neovisnost podrazumijeva da kada dvije alternative imaju jednaku vjerojatnost za neki određeni ishod, naša bi procjena dvije alternative trebala biti neovisna o našem mišljenju o tom određenom ishodu. Intuitivno, to znači da preferencijama između lutrija trebaju upravljati samo obilježja lutrija koje se razlikuju; trebalo bi učinkovito ignorirati zajedništvo između lutrija. Redoslijed preferenciranja mora zadovoljiti neku inačicu aksioma neovisnosti da bi se moglo prikazati kao maksimiziranje onoga što se naziva dodatnom odvojivom funkcijom; posebno, funkcija prema kojoj je vrijednost (tj. očekivana korisnost) opcije (vjerojatnost ponderirana) zbroj vrijednosti njegovih mogućih ishoda.
Neki smatraju da je aksiom kontinuiteta nerazumno ograničenje racionalne sklonosti. Postoji li vjerojatnost (p) takva da biste bili voljni prihvatiti kockanje koja ima takvu vjerojatnost da ćete izgubiti život i vjerojatnost ((1-p)) od osvajanja 10 $? Mnogi misle da nema. Međutim, vjerojatno bi isti oni ljudi prešli ulicu i uzeli novčanicu od 10 dolara koju su odbacili. Ali to je samo uzimanje kockara koji ima vrlo malu vjerojatnost da će ga automobil ubiti, ali i puno veću vjerojatnost da će dobiti 10 dolara! Općenito govoreći, iako ljudi to rijetko razmišljaju na ovaj način, oni stalno uzimaju igre na sreću koje imaju male šanse da dovedu do stalne smrti i, prema tome, vrlo visoke šanse za neku skromnu nagradu. Svaki put kad idemo u šetnju, vozimo se automobilom, letimo negdje i tako dalje,postoji vjerojatnost da ćemo imati fatalnu nesreću. No, kako je vjerojatnost ovih nesreća dovoljno mala, odlučujemo riskirati.
Neovisnost izgleda uvjerljiv zahtjev racionalnosti, ako se sagleda apstraktno. Ipak, postoje poznati primjeri gdje ljudi često krše neovisnost bez da izgledaju iracionalno. Ovi primjeri uključuju komplementarnost između mogućih rezultata lutrije. Posebno poznat takav primjer je takozvani Allais Paradox, koji je francuski ekonomist Maurice Allais (1953.) prvi put uveo početkom 1950-ih. Paradoks se uključuje uspoređivanjem preferencija ljudi prema dva para lutrija sličnih onima prikazanima u tablici 1. Lutrije su opisane nagradama koje su povezane s određenim brojevima ulaznica, gdje će jedna karta biti izvučena nasumično (na primjer, (L_1) donosi nagradu u iznosu od 2500 USD ako je jedna od ulaznica s brojem 2–34 izvučena).
1 | 2-34 | 35-100 | |
(L_1) | $ 0 | $ 2500 | $ 2400 |
(L_2) | $ 2400 | $ 2400 | $ 2400 |
1 | 2-34 | 35-100 | |
(L_3) | $ 0 | $ 2500 | $ 0 |
(L_4) | $ 2400 | $ 2400 | $ 0 |
Tablica 1. Allaisov paradoks
U ovoj situaciji mnogi ljudi preferiraju (L_2) nad (L_1), ali i (L_3) nad (L_4) (o čemu svjedoči njihovo odabrano ponašanje, kao i njihovo svjedočenje), par sklonosti koji će se nazivati Allaisovim preferencijama. [3] Uobičajeni način za racionaliziranje Allaisovih sklonosti je da u situaciji s prvim izborom rizik završiti s ničim kada bi čovjek mogao imati sigurno 2400 dolara ne opravdava povećanu šansu za veću nagradu. U drugoj situaciji, meutim, minimalni dobitak od 0 $ je bez obzira na izbor. Stoga u tom slučaju mnogi ljudi misle da je mali dodatni rizik od 0 dolara vrijedan šanse za bolju nagradu.
Iako se gore obrazloženje može činiti uvjerljivim, Alaisove sklonosti sukobljavaju se s aksiomom neovisnosti. Sljedeće vrijedi za obje situacije izbora: bez obzira na svoj izbor, dobit ćete istu nagradu ako je jedna od ulaznica u posljednjem stupcu izvučena. Stoga neovisnost podrazumijeva da i vaše postavke između (L_1) i (L_2) i vaše postavke između (L_3) i (L_4) ne bi trebale biti neovisne o nagradama u tom stupcu. Ali ako zanemarite posljednji stupac, (L_1) postaje identičan (L_3), a (L_2) do (L_4). Stoga, ako više volite (L_2) nad (L_1), ali (L_3) nad (L_4), čini se da postoji neskladnost u vašem redoslijedu preferiranja. I definitivno je kršenje neovisnosti. Kao rezultat, par postavki koji se raspravljaju ne može se prikazati kao maksimalizacija očekivane korisnosti. (Dakle, „paradoks“:mnogi misle da je neovisnost zahtjev racionalnosti, ali ipak žele tvrditi da u Allahovim preferencijama nema ničega neracionalnog.)
Teoretičari odluka na različite su načine reagovali na Allaisov paradoks. To će pitanje biti revidirano u odjeljku 5.2, kada će se raspravljati o izazovima teorije EU. Sadašnji je cilj jednostavno pokazati da kontinuitet i neovisnost čine snažna ograničenja racionalne sklonosti, iako ne bez posla. Dokazani rezultat vNM može se sažeti ovako:
Teorem 2 (von Neumann-Morgenstern)
Neka je (bO) konačni skup ishoda, (bL) skup odgovarajućih lutrija koji je zatvoren pod mješavinom vjerojatnosti i (precedq) slab odnos preferencija na (bL). Tada (precedq) zadovoljava aksiome 1–4 ako i samo ako postoji funkcija (u), iz (bO) u skup realnih brojeva, koja je jedinstvena do pozitivne linearne transformacije, i u odnosu na koji se (prethodq) može prikazati kao maksimiziranje očekivane korisnosti.
David Kreps (1988) daje pristupačnu ilustraciju dokaza ove teoreme. Dokaz se nastavlja u dva koraka: prvo se dokazuje postojanje intervala-vrijednost uslužne funkcije koja zadovoljava preferencijalne aksiome (ovo je uslužna funkcija koja ocjenjuje lutrije u smislu očekivane korisnosti, kao što je prethodno opisano). Tada se dokazuje jedinstvenost ove korisne mjere (do pozitivne linearne transformacije).
3. Donošenje stvarnih odluka
VNM teorema vrlo je važan rezultat za mjerenje snage sklonosti racionalnog agenta nad sigurnim opcijama (lutrije učinkovito omogućuju kardinalnu mjeru nad sigurnim opcijama). Ali to nas ne dovodi sve do donošenja racionalnih odluka u stvarnom svijetu; još uvijek nemamo teoriju odluka. Teorem je ograničen na ocjenjivanje opcija koje dolaze s objektivnom raspodjelom vjerojatnosti nad ishodima - teoretičari i ekonomisti odluke situacije često opisuju kao "izbor u riziku" (Knight 1921).
U većini običnih slučajeva izbora predmeti izbora, nad kojima moramo imati ili oblikovati postavke, nisu takvi. Umjesto toga, donositelji odluka moraju se savjetovati sa vlastitim uvjerenjima o vjerojatnosti da će jedan ili drugi ishod biti rezultat određene opcije. Odluke u takvim okolnostima često se opisuju kao "izbori pod neizvjesnošću" (Knight 1921). Na primjer, uzmite u obzir planinu planinara koji odlučuje hoće li ili neće pokušati opasan uspon na vrh, gdje je ključni faktor za to vrijeme. Ako bude imala sreće, možda će imati pristup opsežnim vremenskim statistikama u regiji. Ipak, vremenske statistike razlikuju se od rasporeda lutrije po tome što ne određuju vjerojatnost mogućih ishoda pokušaja, a ne pokušaja vrha određenog dana. Ne najmanje važno,planinar mora razmotriti koliko je sigurna u alt ="
Slika 1. Problem s odlukom Ulyssa
Rečeno nam je da bi prije ukrcaja Ulysses najradije slobodno čuo sirene i vratio se kući na Itaku. Problem je u tome što Ulysses predviđa da se njegovo buduće jastvo neće pokoriti: ako plovi nesputano, kasnije će ga zavesti sirene i zapravo neće nastaviti kući na Itaku, već će radije ostati na otoku u nedogled. Stoga Ulysses tvrdi da bi bilo bolje biti vezan za jarbol jer bi više volio sramotu i nelagodu biti vezan za jarbol i učiniti da kući ostanu zauvijek na otoku sirene.
Ne može se poreći da Ulysses donosi mudar izbor da bude vezan za jarbol. Neki smatraju, međutim, da Ulysses jedva izgleda kao uzorni agent - na kraju krajeva, on mora igrati protiv svog budućeg jastva koje će nenamjerno zavesti sirene. Iako je Ulysses racionalan prema standardima statičkih odluka, možemo ga smatrati neracionalnim standardima uzastopnih odluka. Da bi bio racionalan u sekvencijalnom ili dinamičkom smislu, Ulysses bi trebao pokazati kontinuiranu racionalnost kroz produženo vremensko razdoblje: morao bi, recimo, djelovati kao maksimalizator EU-a na svim izbornim mjestima i, osim toga, ne podvrći nikakvim naglim promjenama vjerovanje ili želja, tj. promjene koje nisu u skladu sa standardnim pravilom učenja bajezičke uvjetovanja (koje kaže da se, nakon učenja nekih prijedloga, uvjerenja ažuriraju na odgovarajuće uvjetne vjerojatnosti). Drugim riječima, moglo bi se smatrati da model sukcesivne odluke rješava pitanja racionalnosti s vremenom.
Iako racionalnost s vremenom može imati neki značaj (recimo, omogućavajući nam identificiranje serijskog ponašanja), ono što je zaista važno jest kako agent treba djelovati u bilo kojem trenutku vremena. U tu svrhu, model sekvencijalne odluke plodonosnije se promatra kao alat za određivanje racionalnog izbora u određeno vrijeme, baš kao i model statičke odluke. Stablo uzastopnih odluka učinkovito je način vizualizacije vremenskog niza izbora i događaja učenja za koje agent vjeruje da će se suočiti u budućnosti, ovisno o tome u kojem će se dijelu stabla odluka naći / naći. Ključno je pitanje dakle: kako agent treba birati između svojih početnih opcija u svjetlu svog / njenog projektiranog stabla? Ovo je pitanje stvorilo iznenađujuću količinu polemike. U literaturi su se pojavila tri glavna pristupa pregovaranju o stablima uzastopnih odluka. To su naivan ili kratkovidan pristup, sofisticirani pristup i odlučan pristup. O njima će se razgovarati zauzvrat, te će se sugerirati da sporovi možda nisu bitni, već upućuju na suptilne razlike u tumačenju uzastopnih modela odlučivanja.
Takozvani naivni pristup pregovaranju o uzastopnim odlukama služi kao korisna suprotnost druga dva pristupa. Naivni agent pretpostavlja da je mogući bilo koji put kroz stablo odluka, pa kreće onim onim koji je put optimalan, s obzirom na njegove sadašnje stavove. Na primjer, naivni Ulysses bi jednostavno pretpostavio da ima tri cjelovite strategije izbora: ili naređivanje posadi da ga vežu za jarbol, ili izdavanje takvog naređenja i kasnije zaustavljanje na otoku sirene, ili izdavanje takvog naloga i kasnije pridržavajući se svog puta. Ulysses preferira ishod povezan s potonjom kombinacijom, pa on inicira tu strategiju ne naređujući posadi da je obuzda. Tablica 5 prikazuje statički kontra naivnog Ulyssesovog problema s odlukom. Zapravo,ovaj model odluke ne uzima u obzir Ulyssesovo sadašnje znanje o njegovim budućim preferencijama, pa stoga savjetuje da istražuje mogućnost za koju se predviđa da je nemoguća.
čin | Ishod |
narediti vezanje za jarbol | doći do kuće, neko poniženje |
jedriti neograničeno, a onda ostati sirenama | život sa sirenama |
jedriti nesmetano onda kući do Itake | doći do kuće, bez poniženja |
Tablica 5. Problem naivnosti Ulyssa-a
Ne treba se truditi da je naivan pristup sekvencijalnom izboru primjereno imenovan. Suprotno tome, svojstvo sofisticiranog pristupa je njegovo naglašavanje unatrag planiranja: sofisticirani odabranik ne pretpostavlja da će biti mogući svi putevi kroz stablo odluka, ili drugim riječima, sve moguće kombinacije izbora na različitim čvorovima izbora, Agent razmisli, naime, o tome što će on / ona biti sklon izabrati kod kasnijih odabira kad dođu u predmetni vremenski položaj. Sofisticirani Ulysses uzeo bi na znanje činjenicu da će se, ako nesmetano stigne na otok sirena, tamo htjeti zaustaviti u nedogled, zbog transformativnog učinka pjesme sirene na njegove sklonosti. To se zatim odražava na statički prikaz problema odluke, kako je prikazano u Tablici 6. Države koje se ovdje tiču Ulyssesovih budućih sklonosti, kad jednom stigne na otok. Budući da drugo stanje ima nultu vjerojatnost, djela se odlučuju na temelju prvog stanja, pa Ulysses mudro bira da bude vezan za jarbol.
čin | kasnije odaberite sirene ((p = 1)) | kasnije odaberite Itaku ((p = 0)) |
narediti vezanje za jarbol | kući, neko poniženje | kući, neko poniženje |
jedriti neograničeno | život sa sirenama | kući, bez poniženja |
Tablica 6. Problem sofisticiranog Ulyssa-ovog rješenja
Odlučan izbor odstupa od sofisticiranog izbora samo pod određenim uvjetima koje Ulysses ne ispunjava, s obzirom na njegovu neobjašnjivu promjenu stavova. Branitelji odlučnog izbora obično brane teorije odluka koje krše princip aksioma neovisnosti / načelo sigurne stvari (osobito McClennen 1990. i Machina 1989.; vidi također Rabinowicz 1995. za raspravu) i apeliraju na odlučni izbor kako bi svoju teoriju odluka učinili ukusnijom u sekvencijalnom kontekstu, Prema odlučnom izboru, u odgovarajućim kontekstima (koji uključuju stabilnosti, ali koje krše neovisnost), agent bi trebao računati na jednostavno pridržavanje strategije koja se u početku smatrala najboljom u svim čvorovima budućeg izbora. Pitanje je ima li odlučan pristup smisla s obzirom na standardnu interpretaciju modela sekvencijalne odluke. Može li agent uistinu računati na to da odabere njezine sklonosti u određenom trenutku kako bi ispunio stari plan? To bi izgledao kao slučaj pada zbog pogrešne troškova. Naravno, agent može pridavati veliku važnost poštovanju prethodnih obveza. Svaka takva briga o integritetu, međutim, trebala bi se odražavati na stvarne sklonosti agenta, u to vrijeme. To se poprilično razlikuje od izbora izvan koraka sa nečijim stvarima koje se razmatraju u isto vrijeme.u dotično vrijeme. To se poprilično razlikuje od izbora izvan koraka sa nečijim stvarima koje se razmatraju u isto vrijeme.u dotično vrijeme. To se poprilično razlikuje od izbora izvan koraka sa nečijim stvarima koje se razmatraju u isto vrijeme.
Zacijelo, branitelji odlučnog izbora zapravo imaju na umu različitu interpretaciju uzastopnih modela odlučivanja, pri čemu buduće „točke izbora“nisu zapravo točke na kojima agent može slobodno birati prema svojim tadašnjim preferencijama. Ako je to točno, to znači promjenu pitanja ili problema interesa. U nastavku, pretpostavit će se standardna interpretacija uzastopnih modela odlučivanja, a osim toga pretpostavit će se da racionalni agenti razmišljaju o takvim odlukama na sofisticiran način (kao između ostalih, Levi 1991, Maher 1992, Seidenfeld 1994).
6.2 Aksiomi EU revidirani
Vidjeli smo da stabla uzastopnih odluka mogu pomoći agentu poput Ulyssesa da sagleda posljedice svog trenutnog izbora, tako da može bolje razmisliti o tome što učiniti sada. No, o sekvencijalnom odabiru primarno se radi o ambicioznijim pitanjima. Doista, sekvencijalna postavka učinkovito nudi nove načine „testiranja“teorija racionalne sklonosti, kao i racionalne promjene uvjerenja / želja. To su kontrolirani testovi za koje se pretpostavlja da agent predviđa stabilne sklonosti s vremenom, tj. Ne očekuje da će se njezino naređenje nad konačnim rezultatima promijeniti, osim na način koji je u skladu s njezinim pravilom za promjenu uvjerenja / želja. Strogo gledano, ono što se stavlja na test je čitav paket pravila o odluci plus pravila učenja. U praksi se to dvoje tretira odvojeno:različita pravila odlučivanja uspoređuju se pod pretpostavkom da je učenje bajezijskom uvjetovanjem, ili se drugačija pravila učenja uspoređuju pod pretpostavkom da agent maksimizira očekivanu korisnost. Pitanje je hoće li se pokazati da se agentova odluka ili pravilo učenja pobija (ili drugim riječima, dinamički nedosljedno), u nekom smislu, u sekvencijalnom postavljanju.
Prvo razmotrimo argument sekvencijalne odluke za učenje kao odgovor na nove dokaze Bayesovom kondicionalizacijom, jer on služi kao korisna usporedba za ostale sekvencijalne argumente. Skyrms (1993) iznosi takav argument; to je vjerojatno najsofisticiranija verzija takozvane „dijahroničke nizozemske knjige“, jer je uvjetovanje jedino racionalno pravilo učenja. Pretpostavlja se da je agent očekivani alat za povećanje maksimuma koji koristi sofisticiran (unatrag rezoniranje) pristup sekvencijalnim problemima s odlukama. Skyrms pokazuje da će svaki takav agent koji planira učiti na način koji ne odgovara kondicionalizaciji, donijeti samoobranjive odluke u nekim posebno osmišljenim sekvencijalnim situacijskim odlukama. Suprotno tome, dobro sredstvo za kondicioniranje nikada neće donositi izbore koji se na ovaj način samouništavaju. Ovdje se radi o vrstama "samopopravljivih izbora" koji predstavljaju siguran gubitak. Odnosno, agent odabere strategiju koja je zasigurno lošija, prema vlastitim svjetlima, nego neku drugu strategiju koju bi inače mogla odabrati, kad bi samo njezino pravilo učenja bilo takvo da bi odabralo drugačije u jednom ili više čvorova budućeg izbora.
Sličan argument može se koristiti za obranu preferencija EU-a. U ovom slučaju pretpostavljamo da je pravilo učenja agenta uvjetovanje; štoviše, pretpostavljamo, kao i prije, da agent ima stabilne sklonosti i ima sofisticiran pristup sekvencijalnim problemima s odlukama. Hammond (1976, 1977, 1988b, c) daje argument „dinamičke konzistentnosti“za teoriju EU koji je sličan onome navedenom za kondicionalizaciju; on pokazuje da su samo preferencije s EU strukturom takve da agent može planirati slijediti bilo koji put u stablu uzastopnih odluka koje agent smatra optimalnim iz čvora početnog izbora. Za razliku od drugih struktura preferencija (pravila odlučivanja), preferencije EU-a nikada ne dovode do "samopopravljivih izbora",u smislu da je agent prisiljen odabrati strategiju koja je lošija od strane vlastitih svjetala nego drugu strategiju koju bi inače mogla odabrati, ako su samo njezine sklonosti takve da bi na budućim čvorovima izbora birala drugačije.
Hammondove argumente za teoriju EU i pojam dinamičke dosljednosti koje priziva, kritizirali su iz različitih krajeva, kako oni koji brane teorije koje krše aksiom neovisnosti, ali zadržavaju aksiome cjelovitosti i tranzitivnosti (tj. Naručivanje) teorije EU, i one koji brane teorije koje potonju krše (za raspravu, vidi Steele 2010). Pristup koji su zauzeli neki branitelji teorija o kršenju neovisnosti (osobito Machina 1989. i McClennen 1990.) već je aludirao na: Oni odbacuju pretpostavku sofisticiranog izbora koji pokreće argumente dinamičke dosljednosti. Seidenfeld (1988a, b, 1994, 2000a, b) radije odbacuje Hammondovo shvaćanje dinamičke dosljednosti u korist suptilnijeg pojma koji diskriminira između teorija koje krše Redoslijed i onih koje same krše neovisnost; bivši,za razliku od potonjeg, proći Seidenfeldov test. I ovaj argument nije bez kritičara (vidjeti McClennen 1988, Hammond 1988a, Rabinowicz 2000). Imajte na umu da troškove svakog odstupanja od teorije EU dobro ističu Al-Najjar i Weinstein (2009) i Kadane i sur. (2008), posebno mogućnost odbojnosti prema slobodnim informacijama i odbojnosti prema mogućnostima za veći izbor u budućnosti.
7. Zaključne napomene
Zaključimo sažetom glavnih razloga zašto je teorija odlučivanja, kako je gore opisano, od filozofskog interesa. Prvo, teorija normativne odluke je očito (minimalna) teorija praktične racionalnosti. Cilj je okarakterizirati stavove agenata koji su praktički racionalni, a različiti (statički i sekvencijalni) argumenti obično se daju kako bi se pokazalo da određene praktične katastrofe pogađaju agente koji ne zadovoljavaju standardna teorijska ograničenja odluka. Drugo, mnoga od ovih ograničenja odnose se na uvjerenja agenata. Konkretno, normativna teorija odlučivanja zahtijeva da stupnjevi vjerovanja agenata udovoljavaju aksiomima vjerojatnosti i da na nove informacije odgovore uvjetovanjem. Stoga teorija odluka ima velike implikacije na rasprave u epistemologiji i filozofiji znanosti; to je,za teorije epiztemske racionalnosti.
Konačno, teorija odluka trebala bi biti od velike važnosti za filozofe uma i psihologije i ostale koje zanima kako ljudi mogu razumjeti ponašanje i namjere drugih; i općenito, kako možemo tumačiti ono što se događa u glavama drugih. Teoretičari odluka obično pretpostavljaju da se ponašanje osobe može u potpunosti objasniti u smislu njezinih uvjerenja i želja. Ali možda je još zanimljivije da će neki od najvažnijih rezultata teorije odluka - različite teoreme reprezentacije, o kojima su neke ovdje i raspravljale - sugerirati da ako osoba zadovoljava određene zahtjeve za racionalnošću, onda možemo čitati njezina uvjerenja i želje i koliko su jaki vjerovanja i želje su, prema njenom izboru, dispozicije (ili sklonosti). Koliko nam ove teoreme zaista govore, pitanje je rasprave, kako je gore raspravljeno. Ali, s optimističnim čitanjem ovih rezultata, uvjeravaju nas da možemo smisleno razgovarati o onome što se događa u glavama drugih bez mnogo dokaza koji prelaze informacije o njihovoj odluci.
Bibliografija
- Al-Najjar, Nabil I. i Jonathan Weinstein, 2009, "Literatura nejasnoća prema averziji: kritička procjena", ekonomija i filozofija, 25: 249–284. [al-Najjar i Weinstein 2009 dostupni na mreži (pdf)]
- Allais, Maurice, 1953., "Le Comportement de l'Homme Rationnel devant le Risque: Kritique of Postulats et Axiomes de l'Ecole Américaine", Econometrica, 21: 503–546.
- Anscombe, FJ, 1963, "Sekvencijalna medicinska ispitivanja", časopis Američkog statističkog udruženja, 58: 365–383.
- Anscombe, FJ i Robert J. Aumann, 1963, „Definicija subjektivne vjerojatnosti“, Anali matematičke statistike, 34: 199–204.
- Ben-Haim, Yakov, 2001, Teorija informacija o nedostacima: Odluke pod velikim nesigurnošću, London: Academic Press.
- Bermúdez, José Luis, 2009., Izazovi teoriji odluka, Oxford: Oxford University Press.
- Binmore, Ken, 2009., Racionalne odluke, Princeton, NJ: Princeton University Press.
- Bolker, Ethan D., 1966, „Funkcije koje nalikuju kvocijentima mjera“, Transakcije Američkog matematičkog društva, 124: 292-312.
- –––, 1967, „Istodobna aksiomatizacija korisnosti i subjektivne vjerojatnosti“, Filozofija znanosti, 34: 333–340.
- Bradley, Richard, 1998, „Teorema reprezentacije za teoriju odluke s uvjetovanjima“, Synthese, 116: 187–222
- –––, 2004., „Teorem Ramseyjevog predstavljanja“, Dialectica, 4: 484–497.
- –––, 2007, „Objedinjena bajezijska teorija odluka“, teorija i odluka, 63: 233–263.
- Bradley, Richard i H. Orri Stefánsson, 2016, "Suprotna stvarnost", Britanski časopis za filozofiju znanosti, u tisku.
- –––, 2016, „Želja, očekivanje i neskladnost“, Um, u tisku.
- Broome, John, 1991a., Vaganje robe: jednakost, nesigurnost i vrijeme, Oxford: Blackwell.
- –––, 1991b, „Struktura dobra: teorija odluke i etika“, u Temeljima teorije odlučivanja, Michael Bacharach i Susan Hurley (ur.), Oxford: Blackwell, str. 123–146.
- –––, 1991c, „Želja, vjerovanje i očekivanje“, um, 100: 265-267.
- –––, 1993, „Može li Humean biti umjeren?“, U vrijednosti, dobrobiti i moralu, GR Frey i Christopher W. Morris (ur.), Cambridge: Cambridge University Press. str. 51–73.
- Buchak, Lara, 2013., Rizik i racionalnost, Oxford: Oxford University Press.
- –––, u daljnjem tekstu „Teorija odluka“u Priručniku za vjerojatnost i filozofiju Oxforda, Christopher Hitchcock i Alan Hájek (ur.), Oxford: Oxford University Press.
- Byrne, Alex i Alan Hájek, 1997, „David Hume, David Lewis i teorija odluka“, Mind, 106: 411–728.
- Chang, Ruth, 2002, "Mogućnost pariteta", etika, 112: 659–688.
- Colyvan, Mark, Damian Cox i Katie Steele, 2010, „Modeliranje moralne dimenzije odluka“, Noûs, 44: 503–529.
- Dietrich, Franz i Christian List, 2013., „Teorija racionalnog izbora na temelju razloga“, Noûs, 47: 104–134.
- –––, 2015., „Ovisnost o izboru i kontekstu: ovisni okvir”, ekonomija i filozofija, u tisku.
- –––, 2015, „Mentalizam nasuprot biheviorizmu u ekonomiji: perspektiva filozofije znanosti“, ekonomija i filozofija, u tisku.
- Dreier, James, 1996, „Racionalna preferencija: Teorija odlučivanja kao teorija praktične racionalnosti“, teorija i odluka, 40: 249–276.
- Elster, Jon i John E. Roemer (ur.), 1993., Međuljudske usporedbe blagostanja, Cambridge: Cambridge University Press.
- Gärdenfors, Peter i Nils-Eric Sahlin, 1982., "Vjerojatnosti nepouzdanosti, preuzimanja rizika i donošenje odluka", tiskano u P. Gärdenfors i N.-E. Sahlin (ur.), 1988., odluka, vjerojatnost i korisnost, Cambridge: Cambridge University Press, 313–334.
- Gilboa, Itzhak i David Schmeidler, 1989., "Maxmin je očekivao korisnost s jedinstvenim prioritetom", časopis za matematičku ekonomiju, 18: 141–153.
- Good, IJ, 1967, „O načelu ukupnog dokaznog materijala“, Britanski časopis za filozofiju znanosti, 17: 319–321.
- Guala, Francesco, 2006., "Je li teorija igre odbijena?", Časopis za filozofiju, 103: 239–263.
- –––, 2008, „Paradigmatični eksperimenti: Ultimatum igra od ispitivanja do mjernih uređaja“, Filozofija znanosti, 75: 658–669.
- Gustafsson, Johan E., 2010, „Pumpica za novac za acikličke Intransitivne sklonosti“, Dialectica, 64: 251–257.
- –––, 2013, „Nerelevantnost dijahronog argumenta novčane pumpe za cikličnost“, časopis Philosophy, 110: 460–464.
- Hájek, Alan i Philip Pettit, 2004., "Želja izvan vjerovanja", Australski časopis za filozofiju, 82: 77–92.
- Halpern, Joseph Y., 2003., Obrazloženje nesigurnosti, Cambridge, MA: MIT Press.
- Hammond, Peter J., 1976, „Promjena ukusa i dosljedan dinamički izbor“, Pregled ekonomskih studija, 43: 159–173.
- –––, 1977, „Dinamička ograničenja metastatskog izbora“, Economica 44: 337–350.
- –––, 1988a, „Teorija uredne odluke: komentar profesora Seidenfelda“, ekonomija i filozofija, 4: 292-297.
- –––, 1988b, „Konsekucionalizam i aksiom neovisnosti“, u riziku, odluci i racionalnosti, BR Munier (ur.), Dordrecht: D. Reidel.
- –––, 1988c, „Konsekvencijalistički temelji za očekivanu teoriju korisnosti“, teorija i odluka, 25: 25–78.
- Hausman, Daniel M., 2011, “Pogreške u preferencijama u društvenim znanostima”, Filozofija društvenih znanosti, 41: 3–25.
- Heap, Shaun Hargreaves, Martin Hollis, Bruce Lyons, Robert Sugden i Albert Weale, 1992., Theory of Choice: A Critical Introduction, Oxford: Blackwell Publishers.
- Hill, Brian, 2013., „Povjerenje i odluka“, igre i ekonomsko ponašanje, 82: 675–692.
- Jackson, Frank i Michael Smith, 2006., "Apsolutističke moralne teorije i nesigurnost", časopis Filozofija, 103: 267–283.
- Jeffrey, Richard C., 1965, Logika odluke, New York: McGraw-Hill.
- –––, 1974, „Preferences Preferences“, časopis za filozofiju, 71: 377–391.
- –––, 1983., „Bayesianism with a ljudska face“, u Ispitivanju znanstvenih teorija, John Earman (ur.), Minneapolis: University of Minnesota Press, str. 133–156.
- Joyce, James M., 1998, „Ne-pragmatična potvrda vjerojatnosti“, Filozofija znanosti 65: 575–603.
- –––, 1999, Temelje teorije uzročne odluke, New York: Cambridge University Press.
- –––, 2002, „Levi o teoriji uzročne odluke i mogućnost predviđanja vlastitih radnji“, Filozofske studije, 110: 69–102.
- –––, 2010, „Obrana nepreciznih vjerovanja u zaključku i odlučivanju“, Filozofske perspektive, 24: 281–323.
- Kadane, Joseph B., Mark J. Schervish i Teddy Seidenfeld, 2008, "Je li neznanje blaženstvo?", Filozofski časopis, 105: 5–36.
- Keeney, Ralph L. i Howard Raiffa, 1993, Odluke s više ciljeva: sklonosti i vrijednosni preokreti, Cambridge: Cambridge University Press.
- Klibanoff, Peter, Massimo Marinacci i Sujoy Mukerji, 2005, "Glatki model odlučivanja pod dvosmislenošću", Econometrica, 73: 1849–1892.
- Knight, Frank, 1921., Rizik, Nesigurnost i profit, Boston, MA: Houghton Mifflin Company.
- Kreps, David M., 1988, Bilješke o teoriji izbora, Boulder, Colorado: Westview Press.
- Levi, Isaac, 1986., teški izbori: Donošenje odluka u neriješenom sukobu, Cambridge: Cambridge University Press.
- –––, 1991, „Konsekucionalizam i izbor sekvencija“, u Temeljima teorije odlučivanja, M. Bacharach i S. Hurley (ur.), Oxford: Basil Blackwell, str. 70–101.
- Lewis, David, 1988, „Želja kao vjerovanje“, um, 97: 323–332.
- –––, 1996, „Želja kao vjerovanje II“, um, 105: 303–313.
- Loomes, Graham i Robert Sugden, 1982., “Teorija žaljenja: Alternativna teorija racionalnog izbora pod nesigurnošću”, Ekonomski časopis, 92: 805–824.
- Machina, Mark J., 1989., "Dinamička konzistentnost i modeli neočekivanih korisnih modela izbora pod nesigurnošću", časopis za ekonomsku literaturu, 27: 1622–1668.
- Maher, Patrick, 1992., “Dijahronska racionalnost”, Filozofija znanosti, 59: 120–141.
- Mandler, Michael, 2001., “Težak izbor teorije preferencija: Racionalnost podrazumijeva cjelovitost ili tranzitivnost, ali ne i jedno i drugo”, u varijantama iz praktičnog razloga, Elijah Millgram (ur.), Cambridge, MA: MIT Press, str. 373–402.
- McClennen, Edward F., 1988., "Naručivanje i neovisnost: komentar profesora Seidenfelda", Ekonomija i filozofija, 4: 298–308.
- –––, 1990, racionalnost i dinamički izbor: temeljna istraživanja. Cambridge: Cambridge University Press.
- Peterson, Martin, 2009, Uvod u teoriju odluka, Cambridge: Cambridge University Press.
- Pettit, Philip, 1993, „Teorija odluka i narodna psihologija“, u Temeljima teorije odluka: Pitanja i napretci, Michael Bacharach i Susan Hurley (ur.), Oxford: Blackwell, str. 147–175.
- Rabinowicz, Wlodek, 1995., „Da bismo sebi pojeli kolač i pojeli ga, previše: uzastopni izbor i očekivana kršenja korisnosti“, časopis Filozofija, 92: 586–620.
- –––, 2000, „Stabilnost preferencije i supstitucija indiferentnih osoba: povezanost sa Seidenfeldom“, Teorija i odluka, 48: 311–318.
- –––, 2002, „Ispada li praktična rasprava od samopredviđanja?“, Erkenntnis, 57: 91–122.
- Ramsey, Frank P., 1926./1931., "Istina i vjerojatnost", u Temeljima matematike i drugim logičkim esejima, RB Braithwaite (ur.), London: Kegan, Paul, Trench, Trubner & Co., str. 156– 198.
- –––, 1990, „Težina vrijednosti znanja“, Britanski časopis za filozofiju znanosti, 41: 1–4.
- Resnik, Michael D., 1987., Izbori: Uvod u teoriju odluka, Minneapolis: University of Minnesota Press.
- Savage, Leonard J., 1954, The Foundation of Statistics, New York: John Wiley and Sons.
- Schervish, Mark J., Teddy Seidenfeld, Joseph B. Kadane i Isaac Levi, 2003, "Proširenja teorije očekivanih korisnosti i neka ograničenja usporednih usporedbi", Zbornik radova trećeg ISIPTA (JM), 496–510.
- Seidenfeld, Teddy, 1988a, „Teorija odluka bez„ neovisnosti “ili bez„ naređivanja ““, Ekonomija i filozofija, 4: 309–315.
- –––, 1988b, „Ispunjavajući [Hammond i McClennen]“, Ekonomija i filozofija, 4: 309–315.
- –––, 1994, „Kad se razlikuju odluke normalnog i opsežnog oblika“, Logika, metodologija i filozofija znanosti, IX: 451–463.
- –––, 2000a, „Zamjena indiferentnih opcija pri izbornim čvorovima i prihvatljivost: odgovor Rabinowiczu“, Teorija i odluka, 48: 305–310.
- –––, 2000b, „Postulat neovisnosti, hipotetička i pozvana djela: Daljnji odgovor Rabinowiczu“, Teorija i odluka, 48: 319–322.
- Sen, Amartya, 1973, „Ponašanje i koncept sklonosti“, Economica, 40: 241–259.
- –––, 1977, „Racionalne budale: Kritika temelja o ponašanju ekonomske teorije“, Filozofija i javni odnosi, 6: 317–344.
- Skyrms, Brian, 1993., "Pogreška u argumentima dinamičke koherentnosti?", Filozofija znanosti, 60: 320–328.
- Stalnaker, Robert C., 1987., Upit, Cambridge, MA: MIT Press.
- Steele, Katie S., 2010, „Koji su minimalni zahtjevi racionalnog izbora ?: Argumenti iz postavljanja sekvencijalne odluke“, teorija i odluka, 68: 463–487.
- Stefánsson, H. Orri, 2014, „Želje, vjerovanja i uvjetna poželjnost“, Synthese, 191: 4019–4035.
- Suppes, Patrick, 2002, Reprezentacija i invazija znanstvenih struktura, Stanford, Kalifornija: CSLI Publications.
- Temkin, Larry, 2012, Rethinking the Good: Moral Ideals and Nature of Practical Reasoning, Oxford: Oxford University Press.
- Tversky, Amos, 1975., „Kritika teorije očekivanih korisnosti: opisna i normativna razmatranja“, Erkenntnis, 9: 163–173.
- Villegas, C., 1964, "O kvalitativnoj vjerojatnosti (sigma) - Algebras", Anali matematičke statistike, 35: 1787–1796.
- von Neumann, John i Oskar Morgenstern, 1944., Teorija igara i ekonomsko ponašanje, Princeton: Princeton University Press.
- Walley, Peter, 1991, Statističko rasuđivanje s nepreciznim vjerojatnostima, New York: Chapman i Hall.
- Zynda, Lyle, 2000, "Teoreme reprezentacije i realizam o stupnjevima vjerovanja", Filozofija znanosti, 67: 45–69.
Akademske alate
![]() |
Kako navesti ovaj unos. |
![]() |
Pregledajte PDF verziju ovog unosa na Društvu prijatelja SEP-a. |
![]() |
Pogledajte ovu temu unosa na projektu Internet Filozofska ontologija (InPhO). |
![]() |
Poboljšana bibliografija za ovaj unos na PhilPapersu, s vezama na njegovu bazu podataka. |
Ostali internetski resursi
- Bradley, Richard, 2014., Teorija odluka: formalni filozofski uvod.
- Hansson, Sven Ove, 1994., Teorija odluka: Kratki uvod.
Preporučeno:
Teorija Uzročne Odluke

Ulazna navigacija Sadržaj unosa Bibliografija Akademske alate Prijatelji PDF pregled Podaci o autoru i citiranju Povratak na vrh Teorija uzročne odluke Prvo objavljeno u subotu, 25. listopada 2008.; suštinska revizija Utorak, 15.
Opisna Teorija Odluka

Ulazna navigacija Sadržaj unosa Bibliografija Akademske alate Prijatelji PDF pregled Podaci o autoru i citiranju Povratak na vrh Opisna teorija odluka Prvo objavljeno u utorak, 26. rujna 2017 Deskriptivna teorija odluka bavi se karakterizacijom i objašnjenjem pravilnosti izbora koje ljudi žele učiniti.
Descartesova Teorija Ideja

Ulazna navigacija Sadržaj unosa Bibliografija Akademske alate Prijatelji PDF pregled Podaci o autoru i citiranju Povratak na vrh Descartesova teorija ideja Prvo objavljeno u srijedu 14. ožujka 2007.; suštinska revizija Wed Jun 14, 2017 Ideje su među najvažnijim stavkama u Descartesovoj filozofiji.
Teorija I Bioetika

Ulazna navigacija Sadržaj unosa Bibliografija Akademske alate Prijatelji PDF pregled Podaci o autoru i citiranju Povratak na vrh Teorija i bioetika Objavljeno u utorak, 18. svibnja 2010 Kao vrsta praktične etike, bioetika pokazuje složen i osporavan odnos prema filozofskoj teoriji.
Narodna Psihologija Kao Teorija

Ulazna navigacija Sadržaj unosa Bibliografija Akademske alate Prijatelji PDF pregled Podaci o autoru i citiranju Povratak na vrh Narodna psihologija kao teorija Prvo objavljeno u ponedjeljak, 22. rujna 1997.; suštinska revizija Utorak, 16.