3. Statiske spill
Fangens dilemma i kapittel
en er et eksempel på noe vi kaller for et statisk spill (Gibbons 1992).
Statiske spill kjennetegnes av at spillerne velger handlinger samtidig, eller
uten å se hvilke handlinger de andre spillerne velger. Spillet er ferdig etter
at hver spiller har utført ei
handling (eller ett trekk). Slike spill er det vanligvis best å illustrere med
tabeller, i alle fall når det bare er to spillere. Når et spill er illustrert
med en tabell sier vi at spillet er i normalform, eller i strategisk form.
Tabellen viser både hvilke strategier spillerne kan velge mellom, og hvilke
resultat disse valgene vil føre til.
|
Bølla |
|
|
|
|
Tilstå |
Ikke tilstå |
Slegga |
Tilstå |
-12
/ -12 |
0
/ -24 |
|
Ikke tilstå |
-24
/ 0 |
-1
/ -1 |
Tabell
3.1 Fangens dilemma: Eksempel på et
statisk spill i normalform
Vi så i kapittel en at
resultatet av fangens dilemma er at begge fangene velger å tilstå. Grunnen til
det er at uansett hva den ene gjør, er det best for den andre å tilstå. Å
tilstå er det vi kaller for en dominant
strategi, det vil si en strategi som alltid er bedre enn de andre. Å ikke
tilstå blir dominert av å tilstå, og er derfor en dominert strategi. Når vi skal løse et spill, kan vi fjerne
dominerte strategier fra tabellen: Spilleren kan alltid gjøre det bedre med å
spille en annen strategi.
Et eksempel på hvordan
eliminering av dominerte strategier kan brukes til å løse et spill, har vi i
Gibbons(1992)[2]. Det er to
spillere. Spiller 1 kan velge mellom strategiene "opp" og
"ned", mens spiller to kan velge mellom strategiene
"venstre", "i midten" og "høyre". Hva spillerne
vil vinne er vist i tabellen nedenfor:
|
|
|
Spiller 2 |
|
|
|
Venstre |
Midten |
Høyre |
Spiller 1 |
Opp |
1
/ 0 |
1
/ 2 |
0
/ 1 |
|
Ned |
0
/ 3 |
0
/ 1 |
2
/ 0 |
Tabell
3.2 I dette spillet domineres strategien «høyre» for spiller 2 av «midten»
(Hentet fra Gibbons (1992))
Når spiller 1 sitter og
lurer på hvilken strategi han skal velge, må han vurdere hva han tror spiller 2
vil gjøre. Han ser at uansett hva spiller 1 gjør, så vil det for spiller 2
alltid være bedre å spille "midten" enn "høyre". Det betyr
at spiller 1 kan være helt sikker på at spiller 2 ikke vil spille høyre. Den
strategien kan derfor elimineres fra tabellen:
|
|
|
Spiller 2 |
|
|
Venstre |
Midten |
Spiller 1 |
Opp |
1
/ 0 |
1
/ 2 |
|
Ned |
0
/ 3 |
0
/ 1 |
Tabell
3.3 Strengt dominerte strategier kan fjernes fra spillet: De vil aldri bli
spilt.
Nå ser spiller 1 at han
helt klart bør spille "opp". Da vil han være garantert et resultat på
én. Spiller han derimot
"ned", er det helt sikkert at han ikke får noe. Strategien
"ned" kan derfor også fjernes
fra tabellen.
|
|
|
Spiller 2 |
|
|
Venstre |
Midten |
Spiller 1 |
Opp |
1
/ 0 |
1
/ 2 |
Tabell
3.4 Fjerning av dominerte strategier gir ei unik løsning i dette spillet.
Fordi spiller 2 er
rasjonell, vet han at spiller 1 vil tenke slik. Han ser også at
"venstre" nå blir dominert av "midten". "Venstre"
kan derfor også elimineres fra spillet, og resultatet blir at spiller 1 spiller
"opp", og spiller 2 spiller "midten".
I både fangens dilemma og i
eksemplet ovenfor så vi at vi kom fram til ei unik løsning ved å eliminere
dominerte strategier. Men dette vil ikke alltid være tilfelle. Noen ganger kan
man bare fjerne noen av strategiene, mens det i andre tilfeller ikke er mulig å
fjerne noen i det hele tatt.
Vi trenger derfor en annen
løsningsmetode for å finne optimal strategi i enkelte spill. Her kommer
Nash-likevekten inn i bildet. Nash-likevekt er en løsningsmetode som ble
framsatt av John Nash (1950). Teorien går ut på at spillerne tilpasser seg
optimalt til hva de tror den andre kommer til å gjøre. ("Opp", "Midten") er ei Nash-likevekt fordi:
-Hvis
spiller 2 har bestemt seg for å spille "midten", er det beste spiller
1 kan gjøre å spille "opp"
-Og
hvis spiller 1 spiller "opp", er det best for spiller 2 å spille
"midten"
Det er dette som er definisjonen
på ei Nash-likevekt: Ei Nash-likevekt er de strategiene som er beste respons
til hverandre.
Vi kan også se at ("Ned", "Høyre") ikke
er ei Nash-likevekt fordi:
-Hvis
spiller 2 spiller "høyre" er det best for spiller 1 å spille
"ned"
-Men
hvis spiller 1 velger strategien "ned", er det best for spiller 2 å
velge "venstre"
Det neste eksemplet på et
spill er også hentet fra Gibbons (1992):
|
|
|
Spiller 2 |
|
|
|
Venstre |
Midten |
Høyre |
|
Opp |
0
/ 4 |
4
/ 0 |
5
/ 3 |
Spiller 1 |
Midten |
4
/ 0 |
0
/ 4 |
5
/ 3 |
|
Ned |
3
/ 5 |
3
/ 5 |
6
/ 6 |
Tabell
3.5 Dette spillet kan ikke løses ved å fjerne dominerte strategier(Hentet fra
Gibbons (1992))
For å finne ut hva som er
Nash-likevekt i dette spillet, kan vi velge en tilfeldig strategi for spiller 2
og stille følgende spørsmål: Hva bør spiller 1 gjøre hvis spiller 2 spiller
denne strategien?
Hvis spiller 2 velger
strategien "venstre", bør spiller 1 velge "midten". Men
hvis spiller 1 velger "midten", så bør spiller 2 bytte strategi og
heller spille "midten". Men dette fører igjen til at spiller 1 heller
bør spille "opp", og videre til at spiller 2 igjen bør spille
"venstre". Vi er derfor tilbake der vi startet uten å ha funnet noen
likevekt. Men hvis vi for eksempel tar utgangspunkt i at spiller 2 vil spille
"høyre", ser vi at da vil spiller 1 spille "ned". Når
spiller 1 har valgt "ned" og spiller 2 har valgt "høyre",
har ingen noe incitament til å bytte strategi. ("Ned", "Høyre") er derfor ei Nash-likevekt.
En bedre måte å finne
Nash-likevekter på, er å ta utgangspunkt i at ei Nash-likevekt er der
spillernes beste-respons funksjoner
krysses. Vi kan ta for oss hver av spiller 2`s mulige strategier, og finne ut
hva som er spiller 1`s beste respons til dem. I tabellen under er spiller 1 sin
beste respons vist med strek under resultatet:
|
|
|
Spiller 2 |
|
|
|
Venstre |
Midten |
Høyre |
|
Opp |
0
/ 4 |
4
/ 0 |
5
/ 3 |
Spiller 1 |
Midten |
4
/ 0 |
0
/ 4 |
5
/ 3 |
|
Ned |
3
/ 5 |
3
/ 5 |
6
/ 6 |
Tabell
3.6 I tabellen er spiller 1 sin beste respons til spiller 2`s ulike strategier
markert
Vi kan nå gjøre det samme
med spiller 2, og vi ser at kun i cellen ("Ned",
"Høyre") er begge
strategiene beste respons til hverandre.
|
|
|
Spiller 2 |
|
|
|
Venstre |
Midten |
Høyre |
|
Opp |
0
/ 4 |
4
/ 0 |
5
/ 3 |
Spiller 1 |
Midten |
4
/ 0 |
0
/ 4 |
5
/ 3 |
|
Ned |
3
/ 5 |
3
/ 5 |
6
/ 6 |
Tabell
3.7 Her er også spiller 2 sin beste respons til spiller 1 vist. Der to
strategier er best respons til hverandre har vi ei Nash-likevekt.
Hvorfor bør du spille mot ei Nash-likevekt?
Tenk deg at du har vært så
heldig å bli med i et TV-show. Du og en deltaker til blir plassert i hver deres
lukkede boks. Dere får så presentert spillet i tabell 3.5, hvor tallene viser
hvor mange hundre tusen kroner dere vil vinne. Hvorfor bør du spille mot
Nash-likevekta? Hvis du er spiller 1, hvorfor bør du da spille "ned"?
Svaret på dette er at
spiller 2 vil spille "høyre",
og da er det beste du kan gjøre å spille "ned".
Men hvordan kan du vite at
spiller 2 vil spille "høyre"? Igjen blir svaret at spiller 2 vet at
du vil spille "ned", og det
beste han da kan gjøre er å spille "høyre".
Når begge spillerne har spilt Nash-likevekt strategien vil ingen senere angre
på strategivalget.
[2] Her fjerner vi strategier som blir strengt dominert av en annen strategi, dvs. en strategi som alltid vil være bedre. Svakt dominerte strategier blir dominert av en strategi som er bedre eller like bra. Slike strategier kan ikke uten videre fjernes.