Litt om evolusjonær spillteori.

Like dokumenter
Løsningsforslag MAT 120B, høsten 2001

Løsningsforslag til utvalgte oppgaver i kapittel 10

UNIVERSITETET I OSLO

MA0002 Brukerkurs i matematikk B Vår 2014

Litt matematikk som er nyttig for teorien bak spillteorien.

3x + 2y 8, 2x + 4y 8.

LØSNINGSFORSLAG EKSAMEN I GRUNNKURS I ANALYSE I (MA1101/MA6101)

UNIVERSITETET I OSLO

MAT Prøveeksamen 29. mai - Løsningsforslag

Løsningsforslag til eksamen i MA0002, Brukerkurs i matematikk B

dg = ( g P0 u)ds = ( ) = 0

MA0002 Brukerkurs i matematikk B Vår 2013

MA0002 Brukerkurs i matematikk B Vår 2016

LØSNINGSFORSLAG EKSAMEN MA0002, V08

5.6 Diskrete dynamiske systemer

TMA4100 Matematikk 1, høst 2013

UiO MAT1012 Våren Ekstraoppgavesamling

UNIVERSITETET I BERGEN

Den deriverte og derivasjonsregler

HØGSKOLEN I BERGEN Avdeling for ingeniørutdanning

Løsningsforslag, eksamen i MA0002, Brukerkurs i matematikk B

ECON2200: Oppgaver til for plenumsregninger

LØSNINGSFORSLAG EKSAMEN MA0002, VÅR 09

Institutionen för Matematik, KTH

Løsningsforslag øving 7

Differensjalligninger av førsteorden

Løsningsforslag Eksamen M001 Våren 2002

UNIVERSITETET I BERGEN

Løysingsframlegg TFY 4305 Ikkjelineær dynamikk Haust 2011

MAT UiO mai Våren 2010 MAT 1012

differensiallikninger-oppsummering

Kap. 7 Symmetriske matriser og kvadratiske former

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse

Flere anvendelser av derivasjon

Prosjektoppgaver om diusjonsprosesser og diusjonstilnærmelse

Notat 05 for MAT Relasjoner, operasjoner, ringer. 5.1 Relasjoner

Løsningsforslag Prøveeksamen i MAT-INF 1100, Høsten 2003

MA0002 Brukerkurs i matematikk B Vår 2017

MA1102 Grunnkurs i analyse II Vår 2019

Løsningsforslag. Oppgave 1 Gitt matrisene ] [ og C = A = 4 1 B = 2 1 3

5.5 Komplekse egenverdier

SIF5030/75047 Optimeringsteori, 5 timer. Ingen hjelpemidler.

UNIVERSITETET I BERGEN Det matematisk-naturvitenskapelige fakultet. Eksamen i MAT111 Grunnkurs i matematikk I Løsningsforslag

MA0002 Brukerkurs i matematikk B Vår 2013

9 Lineærtransformasjoner TMA4110 høsten 2018

Løsningsforslag. e n. n=0. 3 n 2 2n 1. n=1

TMA4100: Repetisjon før midtsemesterprøven

Eksamen i emnet M117 - Matematiske metodar Onsdag 7. september 2001, kl Løysingsforslag:

Løsningsforslag eksamen i TMA4100 Matematikk desember Side 1 av 7

4.9 Anvendelser: Markovkjeder

Eksamen R2, Våren 2011 Løsning

TMA4100 Matematikk 1, 4. august 2014 Side 1 av 12. x 2 3x +2. x 2

7.1 forts. Schur triangularisering og spektralteoremet

SIF5025: Differensiallikninger og dynamiske systemer

Lineærtransformasjoner

Fasit til utvalgte oppgaver MAT1110, uka 11/5-15/5

Sammendrag R1. Sandnes VGS 19. august 2009

Løsningsforslag til eksamen i TMA4105 matematikk 2,

MAT 100a - LAB 3. Vi skal først illustrerere hvordan Newtons metode kan brukes til å approksimere n-te roten av et positivt tall.

NTNU. TMA4100 Matematikk 1 høsten Løsningsforslag - Øving 12. Avsnitt Ved Taylors formel (med a = 0) har vi at. 24 For x < 0 har vi at

, men det blir svært tungvindt her.) 3 xe3x 1 9 e3x C 1 9 e3x 3x 1 C

Eksamen S1, Høsten 2013

Deleksamen i MAT111 - Grunnkurs i Matematikk I

Eksamen i TMA4180 Optimeringsteori Løsningsforslag.

Litt om numerisk integrasjon og derivasjon og løsningsforslag til noen ekstraoppgaver MAT-INF 1100 uke 48 (22/11-26/11)

Optimal kontrollteori

a) Blir produktet av to vilkårlige oddetall et partall eller et oddetall? Bevis det.

MA0002 Brukerkurs i matematikk B Vår 2017

Løysingsframlegg TFY4305 Ikkjelineær dynamikk Haust 2012

Løsningsforslag. og B =

Ekstremverdier Mellomverdisatsen Forelesning i Matematikk 1 TMA4100

Notater nr 9: oppsummering for uke 45-46

EKSAMEN I MA1202 LINEÆR ALGEBRA MED ANVENDELSER

TMA4100 Matematikk1 Høst 2009

EKSAMEN I TMA4180 OPTIMERINGSTEORI

5.8 Iterative estimater på egenverdier

Repetisjon i Matematikk 1: Derivasjon 2,

UNIVERSITETET I BERGEN

d) Vi skal nne alle lsningene til dierensialligningen y 0 + y x = arctan x x pa intervallet (0; ). Den integrerende faktoren blir R x e dx = e ln x =

Eksamensoppgavehefte 1. MAT1012 Matematikk 2: Mer funksjonsteori i en og flere variabler

Eksamen STK2400, 6/ Løsningsforslag

MAT Grublegruppen Uke 36

Oppfriskningskurs Sommer 2019

Løsningsforslag. Prøve i Matematikk 1000 BYFE DAFE 1000 Dato: 29. mai 2017 Hjelpemiddel: Kalkulator og formelark. Oppgave 1 Gitt matrisene.

Fasit til utvalgte oppgaver MAT1110, uka 28/4-2/5

LØSNINGSFORSLAG TIL EKSAMEN I TMA4165 DIFFERENSIALLIGNINGER OG DYNAMISKE SYSTEMER

Egenverdier for 2 2 matriser

Anbefalte oppgaver - Løsningsforslag

MAT1120 Notat 2 Tillegg til avsnitt 5.4

6.4 Gram-Schmidt prosessen

MAT UiO. 10. mai Våren 2010 MAT 1012

Oppgave 1. e rt = 120e. = 240 e

4.4 Koordinatsystemer

Løsningsforslag til eksamen i MAT 1100, H06

UNIVERSITETET I OSLO

Øving 12, ST1301 A: B:

Differensiallikninger definisjoner, eksempler og litt om løsning

Eksamen i fag TFY 4305 Ikkelineær dynamikk Onsdag 30. november 2005 Tid:

Institutt for Samfunnsøkonomi. Utlevering: Kl. 09:00 Innlevering: Kl. 14:00

Transkript:

Litt om evolusjonær spillteori 1 ESS: Evolusjonært Stabile Strategier I klassisk spillteori har spillere strategier, i biologi har arter strategier (genotypiske varianter som arves, modulo mutasjoner, av individer Individene bruker nå strategiene når de spiller mot hverandre Antall individer i befolkningen antaes å være stort ( 1, og spillerene møtes parvis, der parene trekkes tilfeldig Individene spiller sin gitte strategi Etter et bestemt antall spill tenker man seg at de individer som har størst samlet gevinst får flest avkom, og avkommet arver foreldrenes strategier Samtidig vil de som er fattigst falle fra Etter mange generasjoner håper man at fordelingen av strategiene i befolkningen er konstant i tid Spørsmålet er om man kan si noe om denne (stabile strategifordelingen 11 ESS La π være et to-spiller spill på normalform Utbetalingsmatrisen til radspilleren er A = {a ij }, og utbetalingsmatrisen til kolonnespilleren er B = A T Vi kaller et slikt spill symmetrisk i utbetalinger hvis A er en n n matrise Vi tenker oss nå en stor befolkning av spillere som møtes parvis for å spille π Alle spillerne spiller rene strategier, og vi kaller en spiller for type i hvis spilleren bruker strategi nr i La p i være andelen av spillere av type i, mao, p i = Vi sier at befolkningens tilstand er antall av type i totalt antall spillere p = (p 1,, p n Merk at p er en sannsynlighetsvektor Forventet utbetaling til en spiller av type i når befolkningen er i tilstand p blir da π ip = a ij p j = ( Ap T i i=1 Hvis en spiller spiller en blandet strategi q når befolkningen har tilstand p så blir forventet utbetaling π qp = qap T Hvis vi ser på forventet utbetaling til en tilfeldig spiller så blir den π pp = pap T Anta nå at vi erstatter en liten del ɛ av spillerne med en mutasjon av type j Nå blir tilstanden r = (1 ɛ p + ɛe j Derfor blir forventet utbetaling til en tilfeldig ikke-mutant π pr = par = pa ((1 ɛ p + ɛe j = (1 ɛπ pp + ɛπ pj 1

2 Forventet utbetaling til en tilfeldig mutant blir π jr = e j Ar = e j A ((1 ɛ p + ɛe j = (1 ɛπ jp + ɛπ jj Vi sier at en mutasjon kan invadere befolkningen hvis p r og for tilstrekkelig små ɛ > 0 π jr π pr Denne ulikheten sier at en mutant har minst like store forventninger som resten av befolkningen Vi sier at p er en Evolusjonært Stabil Strategi (ESS hvis p ikke kan bli invadert av noen mutasjoner Det blir det samme (nesten om vi tenker oss at befolkningen alle spiller strategien p eller om p i er andelen av befolkningen som spiller den rene strategien e i 1: Vis at p er ESS hvis og bare hvis for enhver mutasjon q, og dersom π pp = π qp så har vi π pq > π qq π pp π qp, 2: Vis at en ESS likevekt er en Nash likevekt 3: Anta at A er en 2 2 matrise, vis at dersom a 11 a 21 og a 12 a 22 så har π en ESS 4: Vis at p er ESS hvis og bare hvis det fins en ɛ > 0 slik at π pq > π qq for alle q som er slik at p q < ɛ Dette medfører at p er en isolert Nash likevekt Alle Nash likevekter er ikke ESS Et eksempel på dette er spillet gitt ved 1 1 A = 1 2 Her er Nash likevektene (e 1, e 1 og (e 2, e 2 La q = (1 ɛe 1 + ɛe 2 Da er 1 ɛ π qe1 = (1 ɛ + ɛ = 1 og π qq = (1 ɛ, ɛa = 1 + ɛ ɛ 2 > 1 Derfor er ikke Nash likevekten (e 1, e 1 ESS, siden q vil gjøre det bedre mot de som spiller q enn e 1 vil gjøre det mot de som spiller q Altså er ESS et strengere begrep enn Nash likevekt

3 H D H (v w/2 v D 0 v/2 t Figur 1 Utbetalingsmatrise for hauk og due 12 Hauk og due (og borgerlig Anta at vi har en fuglebefolkning som sloss om territorium Fuglene har to forskjellige strategier, hauk (H eller due (D Haukestrategien er å fortsette å sloss til fuglen er skadet eller motstanderen gir seg Duestrategien er å opptre fiendtlig, men gi seg med en gang hvis motstanderen begynner å sloss Dersom v er verdien til territoriet, w omkostningene ved en skade, og t er omkostningene ved å opptre fiendtlig dersom to duer møtes, så vil utbetalingsmatrisen se ut som i figur 1 Dersom w > v så er (H, H ikke er en Nash likevekt, siden π 1 (H, H = π 2 (H, H = v w 2 < 0 = π 1 (D, H = π 2 (H, D Da er (H, H heller ikke ESS På samme måte er (D, D heller ikke Nash, siden π 1 (D, D = π 2 (D, D = v 2 t < v = p 1(H, D = π 2 (D, H Derfor leter vi etter en Nash likevekt av blandede strategier Hvis kolonnespilleren spiller p = αe 1 + (1 αe 2 så vil radspilleren se spillet (v w/2 v α α(v w/2 + v = 0 v/2 t 1 α (1 α(v/2 t Dersom det radspilleren skal spille en ekte blandet strategi må radene være like Altså α = v + 2t w + 2t Hvis w > v > 0 og t > 0 så vil 0 < α < 1 Hvis radspilleren nå spiller en mutasjonsstrategi q = βe 1 + (1 βe 2 og kolonnespilleren spiller p, så har vi Setter vi β = α så får vi π qp = qap T = ( β 1 β (v w/2 v α 0 v/2 t 1 α v w ( v = βα + βv + (1 β(1 α 2 2 t ( w ( v ( v = αβ 2 + t α 2 t + β 2 + t + v 2 t π pp = α 2 ( w 2 + t + 2αt + v 2 t

4 For ESS må vi ha π pp π qp og hvis dette er en likhet π pq > π qq Nå er ( w ( v π pp π qp = α(α β 2 + t + (α β 2 + t ( ( w = (α β α 2 + t + v 2 + t ( = (α β v + 2t ( w w + 2t 2 + t + v 2 + t = 0 Ved samme utregning har vi at π pq π qq = (β α ( ( w β 2 + t + v 2 + t Den siste faktoren er < 0 hvis β > α og > 0 hvis β < α Derfor er π pq > π qq hvis q p, og p blir ESS Setter vi inn tall, feks v = 2, w = 5 og t = 1 så får vi at α = 4 7 Her sier denne teorien at 4/7 av fuglene vil bruke den agressive haukestrategien, mens resten vil bruke den fredeligere duestrategien i kampen om de verdifulle beitemarkene Anta nå at det dukker opp en ny adferd borgerlig De borgerlige har en følelse for eiendomsretten, derfor bruker de borgerlige haukestrategien hvis de kommer først til et ledig territorium som skal forsvares, og duestrategien hvis de kommer til et territorium som allerede er opptatt Hvis en hauk møter en borgerlig så blir utbetalingen til hauken 1 2 v w + 1 } {{ 2 } 2 den borgerlige er først }{{} v = 3v 4 w 4 hauken er først På samme måte kan vi regne ut de andre utbetalingene, og vi får spillet i figur 2 Vi H D B H (v w/2 v 3v/4 w/4 D 0 v/2 t v/4 t/2 B (v w/4 3v/4 t/2 v/2 Figur 2 Utbetalingsmatrise for hauk, due og borgerlig vil undersøke hva som skal til for at B er ESS Vi har at π BB > π HB hvis og bare hvis v/2 > 3v/4 w/4 som er det samme som at w > v Videre er π HB = π BB og π BH > π HH hvis og bare hvis v = w og (v w/4 > (v w/2 Den siste ulikheten holder opplagt ikke dersom v = w Derfor kan ikke B bli invadert av H dersom w > v Vi må sjekke om B kan bli invadert av D Vi har at π BB = v/2 > v/4 t/2 = π DB for alle positive v og t Mao er B en ESS dersom w > v

13 Differensialligninger Et system av ordinære differensialligninger er en regel som gir hastigheten og retningen til punktene på en kurve i R n som en funksjon av punktene Dette kan da skrives dx (1 dt = f(x Her er x punktet i R n, x = x(t, der t R, og f er en tilsvarende funksjon fra R n R n Skriver vi dette komponentvis så får vi x 1 (t f 1 (x 1 (t,, x n (t d dt x 2 (t = f 2 (x 1 (t,, x n (t x n (t f n (x 1 (t,, x n (t For å få en løsning på dette problemet må vi spesifisere verdien av x for en bestemt t Det er vanlig å spesisifisere x(0 = x 0 Ordinære differensialligninger er emmnet for et eget kurs, her skal vi bare anta a vi det finnes en entydig løsning dersom x 0 er gitt 5: Finn alle løsninger på differensialligningen x (t = kx(t, der k er en konstant Finn grensene lim t x(t og lim t x(t 5 6: La x tilfredstille differensialligningen x 1 (t x = 2(t x2 (t x 1 (t Vis at x(t 2 er konstant Finn alle løsninger av denne ligningen En ordinær differensialligning kalles lineær hvis f er en lineær funksjon, dvs for alle konstanter a og b Det medfører at f(ax + by = af(x + bf(y, f(x = Ax for en n n matrise A Hvis en differensialligning er lineær, så vil en lineærkombinasjon av to løsninger bli en ny løsning, } y = Ay x (ax + by = ax + by = aax + bay = A(ax + by = Ax De konstante løsningene av en differensialligning er spesiellt interessante For at en konstant x = x 0 skal være en løsning, så må x (t = 0 og f (x 0 = 0 Hvis dette gjelder kalles x 0 et fikspunkt for differensialligningen Lineære differensialligninger har bare ett fikspunkt, nemlig x 0 = 0

6 Vi trenger litt notasjon, la B ɛ (x 0 = {x x x 0 ɛ}, betegne kula med sentrum i x 0 og radius ɛ Et fikspunkt kalles asymptotisk stabilt hvis det fins en ɛ > 0 slik at alle løsninger x(t som er slik at x(0 B ɛ (x 0 gjelder at lim x(t = x 0 t Mao det fins en kule rundt x 0 som er slik at hvis vi starter inne i kula, så vil vi gå mot x 0 når t Et fikspunkt som ikke er asymptotisk stabilt kalles nøytralt stabilt dersom det for alle δ > 0 fins en ɛ > 0 slik at en løsning med x(0 B ɛ (x 0 gjelder at x(t B δ (x 0 for alle t > 0 Hvis et fikspunkt verken er asymptotisk stabilt eller nøytralt stabilt, kalles det ustabilt For asymptotisk stabile fikspunkter vil banene gå inn mot fikspunktet, for ustabile fikspunkter vil banene gå ut ifra fikspunktet, og for nøytralt stabile fikspunkter vil de holde seg i nærheten Når man studerer stabilitetsegenskapene til fikspunkter, er det nyttig å se på oppførselen til det lineariserte systemet Hvis x 0 er et fikspunkt, sett y = x x 0, vi kan Taylorutvikle f rundt x 0, f(y = f(x 0 + df(x 0 (x x 0 + O (x x 0 2, der df betegner Jacobimatrisen f 1 f 1 f x 1 x 2 1 x n f 2 f 2 x df = 1 x n Så lenge y x 0 vil y nesten tilfredstille f n x 1 y (t = df (x 0 y Dette systemet kalles lineariseringen av (1 rundt x 0 Hvis alle egenverdiene til df(x 0 har realdel forskjellig fra null, så har det opprinnelige systemet, (1 og lineariseringen samme stabilitetsegenskaper Mer presist, Teorem 1 La λ 1,, λ n være egenverdiene til df(x 0 Hvis Re(λ i < 0 for alle i = 1,, n så er x 0 asymptotisk stabilt Hvis Re(λ i > 0 for minst en i, så er x 0 ustabilt Merk at dersom Re(λ i = 0 for en i, så sier dette teoremet ingenting om stabilitetsegenskapene til x 0 f n x n 7: La 3x1 2x f(x = 1 x 2 2x 1 x 2 Finn alle fikspunktene og bestem deres stabilitetsegenskaper

8: Vis at x 0 = 0 er et fikspunkt for differensialligningen i oppgave 6 Bestem stabilitetstypen til x 0 For n = 1 er det lett å finne stabilitetsegenskapene til alle fikspunktene for differensialligningen (1 I dette tilfellet kan vi tegne grafen til f Der f > 0 må x (t > 0, og vi beveger oss mot høyre, der f < 0 er x (t < 0 og vi beveger oss mot venstre Fikspunktene er gitt ved at grafen til f krysser x-aksen Nå kan vi tegne piler på x-aksen i bevegelsesretningen De fikspunktene som har piler inn mot seg i begge retninger er asymptotisk stabile, de andre er ustabile Se figur 3 7 Figur 3 Fikspunkter for en differensialligning I noen spesielle tilfelle kan vi løse et system av differensialligninger implisitt Dette vil si at vi kan finne en funksjon φ(x slik at φ er konstant langs banene til x Altså 0 = d dt φ(x(t = grad(φ(x(t x (t = grad(φ(x f(x Dette medfører at løsningen x(t vil tilfredstille φ(x(t = φ(x 0 I dette tilfellet vil løsningsbanene falle sammen med konturkurvene til φ Kritiske punkter for φ vil være fikspunkter for x Lokale maksima eller minima for φ vil være nøytrale fikspunkter, og sadelpunkter for φ vil være ustabile fikspunkter Et berømt eksempel på dette er Lotka-Volterra ligningene Disse er en enkel modell for en bestand av rovdyr og byttedyr Vi kan tenke på gjedde og karper i en innsjø La x 1 betegne antall karper, uten noen gjedder vil karpebestanden ha en konstant relativ vekstrate, og derfor tilfredstille differensialligningen x 1(t = kx 1 (t Men gjedder spiser karper, og hvis x 2 betegner antall gjedder så antar vi at antallet karper som blir spist av gjedder er proporsjonalt med x 1 x 2 Da får vi (2 x 1(t = kx 1 (t ax 1 (tx 2 (t Når det gjelder gjeddene, så antar vi at de dør ut med eksponensiell rate uten mat, og at gjeddebestanden vokser eksponensiellt med antall karper som blir spist, altså (3 x 2(t = lx 2 (t + bx 1 (tx 2 (t

8 Tilsammen gir dette differensialligningen x (t = f(x = kx1 ax 1 x 2 lx 2 + bx 1 x 2 La nå Vi har at og dermed φ(x 1, x 2 = bx 1 l log(x 1 + ax 2 k log(x 2 grad(φ(x = ( b l x 1 a k x 2, grad(φ(x f(x = ( b l x 1 a k x 2, kx 1 ax 1 x 2 lx 2 + bx 1 x 2 = bkx 1 kl abx 1 x 2 + alx 2 = 0 alx 2 + abx 1 x 2 + kl bkx 1 For å finne fikspunkter må vi finne ekstrempunkter for φ Vi ser at φ(x 1, x 2 = p(x 1 +q(x 2 Vi deriverer for å finne kritiske punkter for p, p (x 1 = b l x 1, som er null for x 1 = l/b Dette er et globalt minimum På samme måte ser vi at q har et globalt minimum for x 2 = k/a Derfor blir (x 1, x 2 = (l/b, k/a et globalt minimum for φ Mao er dette et nøytralt fikspunkt for systemet (2-(3 Vi kan imidlertid si litt mer Rundt et lokalt maksimum er alltid konturlinjene lukkede kurver, derfor er banene til systemet (2-(3 lukkede kurver Dette vil si at gjedde og karpebestandene vil variere periodisk med tiden 9: Anta at karpebestanden ikke kan vokse eksponensiellt, men at den har en øvre grense gitt ved at x 1 = 1 (enhetene kan være i millioner individer Forklar hvorfor karpebestanden nå vil tilfredstille ligningen (4 x 1 = kx 1 (1 x 1 ax 1 x 2 Finn alle fikspunktene til systemet (4-(3 Anta at a = 4, b = 1, k = 2 og l = 3 Finn stabilitetsegenskapene til det modifiserte systemet (4-(3

14 Replikatordynamikk Vi betrakter nå et evolusjonært spill med mange ( 1 spillere, og n rene strategier Spillet gjentas for t = t, 2 t, 3 t,, der t er et lite tall Alle spillerne spiller rene strategier, og vi lar p i (t betegne den andelen av spillere som spiller strategi nr i, og sett p = (p 1,, p n Den forventede utbetalingen til strategi i er π i (t = (Ap T i, der spillet er gitt ved matrisen A Anta at hver spiller med sannsynlighet α t i hver periode treffer en tilfeldig spiller og bytter strategi dersom den andre spillerens forventede utbetaling er større en hennes/hans egen Imidlertid er informasjonen ikke helt pålitelig, og sannsynligheten for et strategiskifte fra i til j er gitt ved { β(π j (t π i (t, hvis π j (t > π i (t, (5 ρ ij (t = 0 ellers, der β velges så liten at ρ ij 1 for alle utbetalingsforskjeller For en viss tid t er andelen spillere som bytter strategi fra i til j gitt ved Nå får vi at p i (t + t = p i (t α t α tp i (tp j (tρ ij (t p i (tp j (tρ ij (t } {{ } + α t De som forlater i p j (tp i (tρ ji (t } {{ } De som bytter til i = p i (t + αβ tp i (t p j (t (π i (t π j (t = p i (t + αβ tp i (t (π i (t π(t, der den gjennomsnittlige utbetalingen π(t er gitt ved π(t = p j (tπ j (t = p j (t(ap T j = pap T Vi får at p i (t + t p i (t = αβp i (t (π i (t π(t t Ved å ta grensen t 0 (6 p i(t = αβp i (t (π i (t π(t, for j = i,, n Ved å reskalere tiden t αβt, taper vi ikke generalitet ved å sette αβ = 1 Hvis A er en symmetrisk matrise, a ij = a ji så vil gjennomsnittlig utbetaling aldri avta Mer presist har vi at 9

10 Teorem 2 Dersom A = A T så har vi at π (t = 2 p i (π i (t π(t 2 0 i=1 Bevis Vi har at π i = a ij p j, og dermed blir π = p i a ij p j i=1 i=1 Vi deriverer og får π = p ia ij p j + p i a ij p j = = = 2 i=1 i=1 (π i π p i a ij p j + (π j π p i a ij p j (π i π p i a ij p j + (π i π p i a ji p j i=1 (π i π p i a ij p j Vi trenger at Nå har vi vist at p i (π i π = π π i i p i = 0 π = 2 ij (π i π p i a ij p j = 2 i (π i π p i π i = 2 i = 2 i (π i π p i π i π (π i π p i p i (π i π 2

141 Haukefluer og duefluer I et område lever mange døgnfluer De er alle hunner, og formerer seg ved kloning Det fins alltid N fluer i området, de leter etter mat hele dagen, og om kvelden finner de rederplasser De fins to typer av redeplasser, gode og dårlige På en dårlig redeplass får en flue u avkom pr natt, og på en god redeplass u+2 avkom Dessverre (? fins det bare N/2 gode redeplasser, og fluene må derfor kjempe om dem Disse kampene foregår parvis foran hver gode redeplass For å få en redeplass bruker fluene to strategier; hauk eller due Når en dueflue treffer en annen dueflue, så virrer de litt rundt, og slår mynt og kron om redeplassen Når en dueflue treffer en haukeflue, trekker duefluen seg umiddelbart Når to haukefluer møtes, vil de sloss til de blir så utslitte at det forventede antall avkom er en mindre enn om de hadde valgt en dårlig redeplass Utbetalingsmatrisen til dette spillet er vist i figur 4 La p betegne andelen haukefluer i befolkningen, vi antar H D H u 1 u + 2 D u u + 1 Figur 4 Utbetalingsmatrise for haukeflue og dueflue at N er så stor at vi kan regne p som en kontinuerlig funksjon av tiden, som her er målt i antall dager t = 1 dag I løpet av t så vil en dueflue få f d (p t = (pu + (1 p(u + 1 t = (u + 1 p t Neste morgen vil det derfor være duefluer På samme måte vil en haukeflue få N(1 p(1 + f d (p t avkom f h (p t = (p(u 1 + (1 p(u + 2 t = (u + 2(1 p p t avkom, og neste morgen vil det være haukefluer Definer Da får vi at Vi rearranger og får Np(1 + f h (p t f(p = (1 pf d (p + pf h (p p(t + t = Np(1 + f h(p t N(1 + f(p t p(t + t p(t t = p 1 + f h(p t 1 + f(p t = p(t f h(p f(p 1 + f(p t, og vi ender opp med at p (t = p(t (f h (p f(p Dette er replikatordynamikken, siden f(p er gjennomsnittlig utbetaling Vi regner ut f h (p f(p = (1 p(1 2p, 11

12 som gir at p = p(1 p(1 2p Derfor har vi fikspunkter for p = 0, p = 1/2 og p = 1 Av disse er det bare p = 1/2 som er stabilt De andre er ustabile Konklusjonen blir at fluebefolkningen vil bestå av halvparten duefluer og halvparten haukefluer 10: La A være en 2 2 matrise a b A = c d Betrakt et spill som er symmetrisk i utbetalinger med A som utbetalingsmatrise (Utbetalingsmatrisen til kolonnespilleren er A T Anta at a > c og b < d Finn Nash likevektene til spillet Vis at replikatordynamikken til spillet kan skrives som p = (b dp(1 p ( 1 p ( 1 + c a b d Finn alle likevektene til denne differensialligningen Hvilke av disse er stabile? Vis at likevekten gitt ved b d p = b d + c a ikke er en ESS Vis at dersom vi antar at a < c og at b > d, så blir denne likevekten en ESS Angående forholdet mellom Nash likevekter og ESS har vi følgende resultat Teorem 3 La replikatordynamikken til et evolusjonært spill bestemt av n n matrisen A være gitt ved p j(t = p j (t (π j (t π(t, j = 1,, n Da gjelder følgende (1 Hvis p er en Nash likevekt for 2 spiller spillet bestemt ved A, så er p et fikspunkt for replikatordynamikken (2 Hvis p er et stabilt fikspunkt for replikatordynamikken, så er p en Nash likevekt Bevis Anta p er en Nash likevekt Hvis p i = 0 for en i så kan vi fjerne rad og kolonne i i matrisen A Videre er p i = 0 dersom p i = 0 Derfor kan vi anta at p i > 0 for alle i I dette tilfellet vil radspilleren (som også er kolonnespiller! se spillet π 1 Ap = π n Dersom π j > π i for noen i og j, så kan ikke p være det beste svar på p, siden spilleren da vil få større utbetaling ved å bruke strategien q i = 0 og q j = p j + p i og q k = p k ellers Altså er π i = π for alle i, og vi har et fikspunkt for replikatordynamikken

Anta at p ikke er en Nash likevekt Da vil det finnes en i slik at π i (p > π(p Siden π i og π er kontinuerlige funksjoner av p, så kan vi finne en ɛ > 0 slik at Men da vil π i (p π(p > ɛ for p p < δ p i(t = p i (t (π i (p π(p > ɛp i (t > 0 nær p Dermed kan ikke p være et fikspunkt 13 Vi avslutter med det viktige resultatet at et asymptotisk stabilt fikspunkt er en ESS og omvendt For å vise dette trenger vi Jensens ulikhet Den sier at hvis f er en strengt konveks funksjon, så har vi for alle sannsynlighetsvektorer q = (q 1,, q n at ( (7 f q i x i q i f (x i i=1 i=1 Videre har vi likhet bare dersom x 1 = x 2 = = x n Teorem 4 p er et asymptotisk stabilt fikspunkt for replikatordynamikken hvis og bare hvis p er en ESS Bevis For å vise dette konstruerer vi en funksjon P (p som er slik at P vokser langs banene til replikatordynamikken hvis p er ESS, og som også er slik at p er ESS hvis P vokser langs banene Definér P (p = p p 1 1 p p 2 2 p p n n Vi har at f(y = log(y er en strengt konveks funksjon Sett x i = p i /p i og q i = p i og bruk Jensens ulikhet 0 = log(1 = log p i = log i i ( i p i log p p i i p i ( pi p i = i p i (log (p i log (p i Derfor blir p i log (p i i i p i log (p i,

14 med likhet bare dersom p i = p i for alle i Tar vi exp på begge sider så følger at P har et entydig maksimum i p Merk videre at siden P log(p er en stigende funksjon, så har også log(p (p et entydig maksimum i p La p = p(t være en løsning på replikatordynamikken, d dt log(p (p = i p i d dt log (p i = i = i p p i i p i p i (( Ap T i papt = p Ap T pap T = π p p π pp Denne ligningen gir oss det vi trenger, siden hvis p er asymptotisk stabil vil banene konvergere mot p i nærheten av p Da vil også d log(p (p > 0 dt langs slike baner Men da vil π p p > π pp for p tilstrekkelig nær p Dette er det samme som at p er en ESS Omvendt, hvis p er en ESS, så vil log(p (p vokse langs banene i nærheten av p, og da må banene konvergere mot et maksimum for p Dette impliserer at p er asymptotisk stabilt, siden p er det eneste maksimum for P For å summere opp forholdene mellom Nash, ESS og fikspunkter for replikatordynamikken, har vi at ESS Nash fikspunkt asymptotisk stabilt fikspunkt 15 En modifisert replikatordynamikk og asymmetriske spill Når vi estimerte sannsynligheten for at en spiller med strategi i byttet til strategi j tok vi ikke hensyn til enheter i ligning (5 En meningsfull enhet ved tiden t er π(t Derfor vil det i mange tilfelle være bedre å modellere sannsynligheten for å skifte strategi fra i til j ved (8 ρ ij = β max { 0, π j π π Dette vil lede til den modifiserte replikatordynamikken (9 p πi π i = p i π }

Dersom π > 0 (dette kan vi alltid få til ved å legge til et fast tall til alle utbetalinger, så vil (9 og (6 ha de samme løsningsbanene Dette er imidlertid ikke nødvendigvis slik i asymmetriske spill Et asymmetrisk evolusjonært spill er et vanlig to spiller spill med to matriser A og B Nå kan vi gjenta utledningene vi hadde før, men må holde rede på om vi har radspillere (per eller kolonnespillere (qer Resultatet blir to (systemer av differensialligninger π p A i = p i π A (10 i, i = 1,, m π ( A π B q j j π B (11 = q j, j = 1,, n, π B der vi bruker notasjonen π A i = (Aq T i, π A = paq T, π B j = (pb j, π B = pbq T Merk at i slike spill så konkurerer man mot spillere av sin egen type Altså, rever konkurerer mot andre rever om å spise haren, og harene konkurerer seg imellom om å unngå å bli spist 151 Familiespillet Anta at det er verdt 15 for hver av foreldrene å kunne få et avkom fram til voksen alder Kostnaden ved å oppdra et avkom er 20, denne kostnaden kan deles mellom foreldrene på forskjellige måter Hunnene kan være sjenerte eller løse, hannene kan være trofaste eller utro Sjenerte hunner insisterer på en lang forlovelsesperiode som koster 3 for begge parter Løse hunner insisterer ikke på noen forlovelsesperiode før parring Alle hunner vil ta vare på avkom, spørsmålet er hvilken del av byrdene hannene vil ta Trofaste hanner er villige til å godta en lang forlovelsesperiode, og er i tillegg villige til å dele byrdene med oppdragelsen, dette spillet resulter i utbetalingsmatrisen i figur 5 Moralen er: dersom hunnene er sjenerte så lønner det seg for hannene å være trofaste, 15 Hanner Hunner Sjenert Løs Trofast 2, 2 5, 5 Utro 0, 0 15, 5 Figur 5 Utbetalingsmatrise for familiespillet dersom hannene er trofaste så lønner det seg for hunnene å være løsaktige, dersom hunnene er løsaktige lønner det seg for hannene å være utro, dersom hannene er utro, så lønner det seg for hunnene å være sjenerte, dersom hunnene er sjenerte Vi kan altså vente oss syklisk oppførsel Her har vi A = 2 5 0 15 Dette spillet har en Nash likevekt gitt ved og B = x = 5 8, y = 5 6, 2 5 0 5

16 der x betegner andelen av trofaste hanner, og y andelen av sjenerte hunner, Den modifiserte replikatordynamikken blir x 12y 10 (12 = x(1 x x(5 3y + 15(1 x(1 y (13 y 5 8x = y(1 y 2xy + (1 y(10x 5 Denne differensialligningen er dessverre slik at nevneren i (13 kan bli null For å unngå dette, og for å stimulere til økt befolkningsvekst, bestemmer staten at alle deltagere i familiespillet skal få en kontantstøtte på 5 Dette gir matrisene 7 10 7 10 A = og B = 5 20 5 0 Likevektene blir de samme Dette gir dynamikken (14 x 12y 10 = x(1 x x(10 3y + (1 x(20 15y (15 y 5 8x = y(1 y (2x + 5y + 10x(1 y Hvis vi lineariserer om fikspunktet (5/8, 5/6 får vi dessverre at begge egenverdiene er null, (Gjør dette selv derfor kan vi ikke si noe om stabilitetstypen Vi kan simulere systemet numerisk og få omtrentlige løsninger Figure 151 viser en typisk løsningsbane i x y planet Det ser ut som om løsningen konvergerer mot en grensesykel, og at fikspunktet derfor er ustabilt Til høyre i figuren ser vi x og y som funksjoner av t

17 1 09 08 07 06 05 04 x 03 y 02 01 0 0 100 200 300 400 500 600 t Figur 6 En typisk løsning av (den modifiserte replikatordynamikken for familiespillet