3. Statiske spill

 

Fangens dilemma i kapittel en er et eksempel på noe vi kaller for et statisk spill (Gibbons 1992). Statiske spill kjennetegnes av at spillerne velger handlinger samtidig, eller uten å se hvilke handlinger de andre spillerne velger. Spillet er ferdig etter at hver spiller har utført ei handling (eller ett trekk). Slike spill er det vanligvis best å illustrere med tabeller, i alle fall når det bare er to spillere. Når et spill er illustrert med en tabell sier vi at spillet er i normalform, eller i strategisk form. Tabellen viser både hvilke strategier spillerne kan velge mellom, og hvilke resultat disse valgene vil føre til.


 


 

Bølla

 

 

 

Tilstå

Ikke tilstå

Slegga

Tilstå

-12 / -12

0 / -24

 

Ikke tilstå

-24 / 0

-1 / -1

Tabell 3.1  Fangens dilemma: Eksempel på et statisk spill i normalform

 

Vi så i kapittel en at resultatet av fangens dilemma er at begge fangene velger å tilstå. Grunnen til det er at uansett hva den ene gjør, er det best for den andre å tilstå. Å tilstå er det vi kaller for en dominant strategi, det vil si en strategi som alltid er bedre enn de andre. Å ikke tilstå blir dominert av å tilstå, og er derfor en dominert strategi. Når vi skal løse et spill, kan vi fjerne dominerte strategier fra tabellen: Spilleren kan alltid gjøre det bedre med å spille en annen strategi.

Et eksempel på hvordan eliminering av dominerte strategier kan brukes til å løse et spill, har vi i Gibbons(1992)[2]. Det er to spillere. Spiller 1 kan velge mellom strategiene "opp" og "ned", mens spiller to kan velge mellom strategiene "venstre", "i midten" og "høyre". Hva spillerne vil vinne er vist i tabellen nedenfor:                 

 

 

 

Spiller 2

 

 

 

Venstre

Midten

Høyre

Spiller 1

Opp

1 / 0

1 / 2

0 / 1

 

Ned

0 / 3

0 / 1

2 / 0

Tabell 3.2 I dette spillet domineres strategien «høyre» for spiller 2 av «midten» (Hentet fra Gibbons (1992))

 

Når spiller 1 sitter og lurer på hvilken strategi han skal velge, må han vurdere hva han tror spiller 2 vil gjøre. Han ser at uansett hva spiller 1 gjør, så vil det for spiller 2 alltid være bedre å spille "midten" enn "høyre". Det betyr at spiller 1 kan være helt sikker på at spiller 2 ikke vil spille høyre. Den strategien kan derfor elimineres fra tabellen:

           

 

 

 

Spiller 2

 

 

Venstre

Midten

Spiller 1

Opp

1 / 0

1 / 2

 

Ned

0 / 3

0 / 1

Tabell 3.3 Strengt dominerte strategier kan fjernes fra spillet: De vil aldri bli spilt.

 

Nå ser spiller 1 at han helt klart bør spille "opp". Da vil han være garantert et resultat på én. Spiller han derimot "ned", er det helt sikkert at han ikke får noe. Strategien "ned"  kan derfor også fjernes fra tabellen.

                       

 

 

 

Spiller 2

 

 

Venstre

Midten

Spiller 1

Opp

1 / 0

1 / 2

Tabell 3.4 Fjerning av dominerte strategier gir ei unik løsning i dette spillet.

 

Fordi spiller 2 er rasjonell, vet han at spiller 1 vil tenke slik. Han ser også at "venstre" nå blir dominert av "midten". "Venstre" kan derfor også elimineres fra spillet, og resultatet blir at spiller 1 spiller "opp", og spiller 2 spiller "midten".

I både fangens dilemma og i eksemplet ovenfor så vi at vi kom fram til ei unik løsning ved å eliminere dominerte strategier. Men dette vil ikke alltid være tilfelle. Noen ganger kan man bare fjerne noen av strategiene, mens det i andre tilfeller ikke er mulig å fjerne noen i det hele tatt.

Vi trenger derfor en annen løsningsmetode for å finne optimal strategi i enkelte spill. Her kommer Nash-likevekten inn i bildet. Nash-likevekt er en løsningsmetode som ble framsatt av John Nash (1950). Teorien går ut på at spillerne tilpasser seg optimalt til hva de tror den andre kommer til å gjøre. ("Opp", "Midten")  er ei Nash-likevekt fordi:

-Hvis spiller 2 har bestemt seg for å spille "midten", er det beste spiller 1 kan gjøre å spille "opp"

-Og hvis spiller 1 spiller "opp", er det best for spiller 2 å spille "midten"

Det er dette som er definisjonen på ei Nash-likevekt: Ei Nash-likevekt er de strategiene som er beste respons til hverandre.

Vi kan også se at ("Ned", "Høyre") ikke er ei Nash-likevekt fordi:

-Hvis spiller 2 spiller "høyre" er det best for spiller 1 å spille "ned"

-Men hvis spiller 1 velger strategien "ned", er det best for spiller 2 å velge "venstre"

 

Det neste eksemplet på et spill er også hentet fra Gibbons (1992):

 

 

 

 

Spiller 2

 

 

 

Venstre

Midten

Høyre

 

Opp

0 / 4

4 / 0

5 / 3

Spiller 1

Midten

4 / 0

0 / 4

5 / 3

 

Ned

3 / 5

3 / 5

6 / 6

Tabell 3.5 Dette spillet kan ikke løses ved å fjerne dominerte strategier(Hentet fra Gibbons (1992))

 

For å finne ut hva som er Nash-likevekt i dette spillet, kan vi velge en tilfeldig strategi for spiller 2 og stille følgende spørsmål: Hva bør spiller 1 gjøre hvis spiller 2 spiller denne strategien?

Hvis spiller 2 velger strategien "venstre", bør spiller 1 velge "midten". Men hvis spiller 1 velger "midten", så bør spiller 2 bytte strategi og heller spille "midten". Men dette fører igjen til at spiller 1 heller bør spille "opp", og videre til at spiller 2 igjen bør spille "venstre". Vi er derfor tilbake der vi startet uten å ha funnet noen likevekt. Men hvis vi for eksempel tar utgangspunkt i at spiller 2 vil spille "høyre", ser vi at da vil spiller 1 spille "ned". Når spiller 1 har valgt "ned" og spiller 2 har valgt "høyre", har ingen noe incitament til å bytte strategi. ("Ned", "Høyre") er derfor ei Nash-likevekt.

En bedre måte å finne Nash-likevekter på, er å ta utgangspunkt i at ei Nash-likevekt er der spillernes beste-respons funksjoner krysses. Vi kan ta for oss hver av spiller 2`s mulige strategier, og finne ut hva som er spiller 1`s beste respons til dem. I tabellen under er spiller 1 sin beste respons vist med strek under resultatet:

 

 

 

Spiller 2

 

 

 

Venstre

Midten

Høyre

 

Opp

0 / 4

4 / 0

5 / 3

Spiller 1

Midten

4 / 0

0 / 4

5 / 3

 

Ned

3 / 5

3 / 5

6 / 6

Tabell 3.6 I tabellen er spiller 1 sin beste respons til spiller 2`s ulike strategier markert

 

Vi kan nå gjøre det samme med spiller 2, og vi ser at kun i cellen ("Ned", "Høyre")  er begge strategiene beste respons til hverandre.

 

 

 

 

Spiller 2

 

 

 

Venstre

Midten

Høyre

 

Opp

0 / 4

4 / 0

5 / 3

Spiller 1

Midten

4 / 0

0 / 4

5 / 3

 

Ned

3 / 5

3 / 5

6 / 6

Tabell 3.7 Her er også spiller 2 sin beste respons til spiller 1 vist. Der to strategier er best respons til hverandre har vi ei Nash-likevekt.

 

 

Hvorfor bør du spille mot ei Nash-likevekt?

Tenk deg at du har vært så heldig å bli med i et TV-show. Du og en deltaker til blir plassert i hver deres lukkede boks. Dere får så presentert spillet i tabell 3.5, hvor tallene viser hvor mange hundre tusen kroner dere vil vinne. Hvorfor bør du spille mot Nash-likevekta? Hvis du er spiller 1, hvorfor bør du da spille "ned"?

Svaret på dette er at spiller 2 vil spille "høyre", og da er det beste du kan gjøre å spille "ned".

Men hvordan kan du vite at spiller 2 vil spille "høyre"? Igjen blir svaret at spiller 2 vet at du vil spille "ned", og det beste han da kan gjøre er å spille "høyre". Når begge spillerne har spilt Nash-likevekt strategien vil ingen senere angre på strategivalget.

 


[2] Her fjerner vi strategier som blir strengt dominert av en annen strategi, dvs. en strategi som alltid vil være bedre. Svakt dominerte strategier blir dominert av en strategi som er bedre eller like bra. Slike strategier kan ikke uten videre fjernes.