Spillteori Spillteori er et effektivt verktøy for å analyse av strategisk adferd. Spillteori baserer seg på at bevisste aktører forstår at de er i en situasjon der de gjensidig påvirker hverandre gjennom sine handlinger og strategier. Aktørene vet også at alle er klar over denne gjensidige avhengigheten, og alle vet at alle har den samme informasjonen og tenker på samme måte. Vi skal kun se på en verden bestående av to aktører og vi antar at begge aktørene handler rasjonelt og er profittmaksimerende av natur. I et spill får aktørene valg mellom to eller flere strategier, der hver strategikombinasjon gir et utbytte for aktørene. Vi skiller mellom statiske spill der valgene skjer samtidig (eller uten at aktørene vet om hverandre) og dynamiske spill der en aktør velger etter den andre. Aktørene vil tilpasse seg i Nash-likevekten(e). I en Nash-likevekt ønsker ingen av aktørene å endre sin egen strategi, gitt motspillernes strategi. Dvs at ingen spiller vil komme bedre ut ved å gjøre noe annet enn det de gjør (ingen angrer i etterkant). Dersom Nash-likevekten(e) er den løsningen som totalt sett gir det beste utfallet for begge parter, kalles likevekten paretooptimal. En aktør sies a ha en dominant strategi dersom aktøren kommer best ut ved å velge denne strategien uavhengig av hva den andre aktøren gjør. Vi snakker også om svakt dominerende og svakt dominerte strategier dersom det kan tenkes tilfeller der strategiene er like gode, men den dominerende aldri er dårligere. Dersom alle aktørene i spillet har en dominant strategi vil spillet ha en entydig Nash-likevekt.
Hva skal til for å lage en spillteoretisk modell? - En fast mengde spillere (aktører) - En fast mengde mulige handlinger for hver spiller, og en fast mengde mulige strategier. - En fast bestemt trekkrekkefølge - En fastlagt informasjonsstruktur (det skal være kjent hvem som vet hva) - Kjente sammenhenger mellom spillernes strategier og de forskjellige utfall. Altså, hvis A velger strategi α og B velger strategi β, så vet både A og B hvilke konsekvenser dette har. - Alle spillerne har preferanser over mulige utfall (f.eks. maksimere nytte eller profitt) - Alle spillerne kjenner til punktene 1,,6 og alle vet at de andre spillerne også kjenner til punktene 1,,6. Når alle punktene over er tilfredsstilt, har vi et spill. Hvordan ulike spill skal analyseres og presenteres avhenger av klassifiseringen: - Antall mulige deltakere (i) To deltakere (ii) Flere enn to deltakere - Grad av konflikt (i) Nullsumspill: Diamentralt motsatte preferanser (det den ene vinner, taper den andre) (ii) Variabelsumspill: Mer eller mindre sammenfallende preferanser - Grad av mulig samarbeid (i) Ikke-kooperative spill: beslutningen om strategivalg må skje uavhengig av hverandre (ii) kooperative spill: samarbeid er mulig - Tidsrekkefølge (i) Simultane trekk: Samtidige handlinger (ii) Sekvensielle trekk: Handlingene foregår i en bestemt rekkefølge
Fangens dilemma Fangenes dilemma er kanskje det mest kjente av alle spill. Bakgrunnen for spillet er en tenkt situasjon med to kriminelle som har samarbeidet om en kriminell handling, der begge blir tatt inn til separate avhør. Dersom bare en tilstår, vil han slippe fri, mens den som ikke tilstår vil få lang fengselsstraff. I dette spillet vil det være rasjonelt for begge fangene å tilstå (dominant strategi for begge parter å tilstå), selv om resultatet ville vært bedre om begge nektet. Spillets mulige utfall kan presenteres i form av en spillmatrise. Dette kalles ofte for spillet på normalform. Her blir spillet beskrevet ved å vise strategimulighetene og "payoff-muligheten" for den enkelte spiller. Antall år i fengsel hver fange får avhenger av om de tilstår eller ikke. Et mulig tilfelle kan eksempelvis være som i tabellen under, der tallet til venstre er "profitten" til fange 1, og tallet til høyre er "profitten" for fange 2. (-10,0) betyr for eksempel at fange 1 får 10 års fengsel, mens fange 1 får gå fri (0 år i fengsel). Fange 1 Fange 2 Tilstå (T) Ikke tilstå (IT) Tilstå (T) (-5, -5) (0, -10) Ikke tilstå (IT) (-10, 0) (-1, -1) Vi kan finne Nash-likevekten ved å undersøke hvilken strategi hver av aktørene vil velge avhengig av motpartens valg: - For fange 1: Hvis fange 2 velger T --> velg T (-5 er bedre enn -10) Hvis fange 2 velger IT --> velg T (0 er vedre enn -1) - For fange 2: Hvis fange 1 velger T --> velg T (-5 er bedre enn -10) Hvis fange 1 velger IT --> velg T (0 er bedre enn -1)
Vi ser at den eneste Nash-likevekten er kombinasjonen (-5, -5), dvs at begge tilstår. Dette er til tross for at begge ville kommet bedre ut dersom begge valgte å ikke tilstå (-1 er bedre enn -5). En slik løsning er derfor ikke pareto-optimal. Vi legger også merke til at det som er best å velge for fange 1, ikke avhenger av det fange 2 måtte velge. Fange 1 velger å tilstå uansett hva fange 2 velger å gjøre. Det samme gjelder for fange 2. Fange 1 og 2 har derfor begge dominante strategier. Det at begge aktører har dominante strategier og Nash-likevekten vi får er dårlig for begge parter, gjør dette til et fangens dilemma spill. Et spill der begge aktører har dominante strategier (slik som i eksempelet over) vil alltid gi Nash-likevekt. Nash-likevekt krever likevel ikke dominante strategier hos begge aktører. Vi kan tenke oss to produsenter som produserer samme vare. Anta at profitten de oppnår avhenger av om de samarbeider eller fører priskrig. Profitten for en bestemt aktør avhenger av om den andre velger å samarbeide eller ikke. Tabellen nedenfor viser payoff-mulighetene til begge aktører. Tallet til venstre er profitten for aktør A, og tallet til høyre er profitten for aktør B. Aktør A Aktør B Samarbeid Priskrig Samarbeid (40, 30) (10, 50) Priskrig (35, 15) (15, 20) I dette tilfellet eksisterer det ingen dominant strategi for aktør A. Aktør B har imidlertid en dominant strategi og vil alltid velge priskrig. Dersom A velger samarbeid, vil det beste for B være å velge priskrig (50 > 30). Dersom A velger priskrig, vil det beste for B være å velge priskrig igjen (20 > 15). Nash-likevekt oppnås ved at begge aktørene velger priskrig (15, 20). A vet at priskrig er en dominant strategi for B og vil derfor velge mellom å få 10 (samarbeid) eller 15 (priskrig). B velger derfor også priskrig siden 15 > 10. Nash-likevekt oppnås derfor ved (15, 20).
Gitt et vilkårlig spill, kan det være ingen Nash-likevekt, én entydig Nash-likevekt eller flere Nash-likevekter. Eksempler: Ingen Nash-likevekt én entydig Nash-likevekt To Nash-likevekter Nash-likevekten er (α2, β2) Nash-likevektene er (α2, β1) og (α1, β2) Dynamiske spill Vi har hittil kun sett på ikke-kooperative spill med simultane trekk og én periode. Vi skal nå se på eksempler på spill med sekvensielle trekk. Når vi snakker om spill som varer over flere perioder er det mer praktisk å presentere spillet på ekstensiv form, dvs. ved hjelp av et spilltre. Hensikten er å få synliggjort at eksemplet består av en sekvens av handlinger. Når vi har sekvensielle trekk (en aktør velger før den andre) kalles Nash-likevekten for delspillperfekt likevekt (dersom den er en Nash-likevekt i alle delspill). I denne likevekten vil ingen spiller komme bedre ut, sett fra spillets start, ved å endre sin strategi. Anta at vi har et spill mellom to aktører, A og B, som hver kan velge mellom to strategier. α1 og α2 for A, og β1 og β2 for B. På normalform kan spillet presenteres på følgende måte:
I tilfellet der A velger strategi først, får vi følgende spilltre (ekstensiv form): A α 1 α 2 B B β 1 β 2 β 1 β 2 (α 1,β 1) ) (α 1,β 2 ) (α 2,β 1 ) (α 2,β 2 ) Tiden går ovenfra og nedover, dvs at vi starter fra toppen. Først velger A mellom α1 og α2 før B velger mellom β1 og β2. Vi skal nå se på et spill uten dominante strategier og der det ikke eksisterer noen likevekter ved simultane trekk, mens en omgjøring til sekvensielle trekk fører til entydig delspillperfekt likevekt. Eksempel: Ingen av aktørene har dominante strategier og det eksisterer ingen Nash-likevekt. Dersom vi har sekvensielle trekk og antar at A trekker først vil spillet se slik ut:
Måten for å løse slike spill (finne alle delspillperfekte likevekter) kalles for baklengs induksjon. Før spiller A velger sin strategi må han/hun se på utfallene av spillet for så å bevege seg "bakover". Først av alt er det interessant for A å vite hva B kommer til å velge i de to mulige situasjonene. Dersom A velger α1, kan B få 5 ved å velge β1 eller 3 ved å velge β2. Vi ser at B får høyest gevinst ved å velge β1 og vet derfor at B vil velge β1 dersom A velger α1. Vi ser at denne strategien vil ha verdien 2 for A. Gjør vi det samme med strategi α2 ser vi at B foretrekker strategi β2 (4 > 2). Dette gir en verdi på 3 for A. Nå er A klar til å velge sin strategi og kan i realiteten velge mellom en gevinst på 2 (α1) eller 3 (α2). Spiller A velger derfor strategi α2 og spiller B vil velge β2 --> Delspillperfekt likevekt: (α2, β2) = (3, 4) Det kan vises at dersom B hadde fått lov til å velge først, ville likevekten blitt endret til (α1, β2) = (5, 3)