játékelmélet
Kiejtés
- IPA: [ ˈjaːteːkɛlmeːlɛt]
Főnév
játékelmélet
- (matematika) A játékelmélet a matematika egyik, interdiszciplináris jellegű (tudományágak közé egyértelműen nehezen besorolható) ága, mely azzal a kérdéssel foglalkozik, hogy mi a racionális (észszerű) viselkedés olyan helyzetekben, ahol minden résztvevő döntéseinek eredményét befolyásolja a többiek lehetséges választása, vagyis a játékelmélet a stratégiai problémák elmélete. A játékelmélet alapjait Neumann János fektette le egy 1928-as munkájában, majd az Oskar Morgenstern neoklasszikus matematikus-közgazdásszal közösen írt „Játékelmélet és gazdasági viselkedés” című (The Theory of Games and Economic Behavior, 1944) művében. A matematika, a közgazdaságtan, a szociológia, a pszichológia, a biológia és a számítástechnika a játékelmélet által legérintettebb tudományok. A mesterségesintelligencia-kutatás is felhasználja eredményeit. 1994-ben Harsányi János magyar származású közgazdász, másokkal megosztva közgazdasági Nobel-emlékdíjat kapott játékelméleti kutatásaiért.
A játékelmélet a döntéshozatal és a stratégiai interakciók matematikai-elméleti vizsgálata. Játék alatt olyan helyzetet értünk, ahol több szereplő (játékos) döntései hatással vannak egymásra, így mindenki eredményét befolyásolja a többiek választása. A játékosok racionálisak (észszerűen cselekszenek saját céljaik elérésére törekedve), és általában azt feltételezzük, hogy ismerik a játék szabályait és lehetséges kimeneteleit. Az alábbi fejezetekben áttekintjük a játékelmélet főbb fogalmait és kategóriáit, közérthető módon, példákkal illusztrálva.
1. Alapfogalmak és játéktípusok
Ebben a fejezetben különböző alapvető játékelméleti fogalmakat és játéktípusokat ismertetünk. Ide tartoznak a játékok formái (normálforma, extenzív forma), az információval kapcsolatos fogalmak, valamint egyes speciális játékosztályok és jelenségek.
- Normálformájú játék (normal-form game): Más néven stratégiai forma; egy játék leírása, ahol minden játékos egyidejűleg választ stratégiát, és a kifizetések egy mátrix (vagy függvény) formájában vannak megadva. A normálforma tipikusan egy táblázattal szemléltethető, amely sorai és oszlopai a játékosok stratégiáit, cellái pedig a kifizetéseket tartalmazzák. Ez a forma jól használható szimultán (egyidejű) döntések elemzésére, például a Fogolydilemma kifizetésmátrixa is normálformában adható meg (lásd a 5. fejezetben).
- Extenzív formájú játék (extensive-form game): Olyan leírás, ahol a játék menetét játékfa mutatja be döntési csomópontokkal és ágakkal. Az egyes lépések sorrendben követik egymást – azaz szekvenciális játékok esetén használjuk ezt a formát. Az extenzív forma megadja a játékosok döntési sorrendjét, az egyes pontokon rendelkezésre álló akciókat, az információs halmazokat (mit tud a játékos a korábbi történésekről), valamint a játék végén a kifizetéseket. Az extenzív formát tipikusan olyan szituációkhoz alkalmazzuk, ahol a játékosok felváltva cselekszenek, és a korábbi lépések ismerete befolyásolja a következő lépéseket (például sakk vagy ultimátumjáték). Minden extenzív formájú játék átalakítható egy (potenciálisan sokkal nagyobb méretű) normálformájú játékká, bár egy normálforma többféle extenzív játékmenetnek is megfelelhet.
- Szimultán és szekvenciális játék: Ha a játékosok egyidejűleg döntenek, vagy legalábbis nem ismerik a másik döntését a saját választásuk pillanatában, akkor szimultán játékról beszélünk. Ilyen például a kő-papír-olló vagy a vak licit egy aukción. Ezzel szemben a szekvenciális játékokban a játékosok egymás után lépnek; a korábban cselekvő döntése ismert (legalább részben) a később cselekvő számára. A szekvenciális játékokat gyakran a fenti extenzív formával ábrázoljuk. Fontos megjegyezni, hogy a tökéletes információjú szekvenciális játékokban minden játékos minden korábbi lépést ismer (ilyen pl. a sakk vagy a dáma), míg tökéletlen információ esetén nem minden korábbi akció nyilvános (pl. egy kártyajáték, ahol a lapok rejtve vannak).
- Információs halmaz és tökéletes emlékezet: Az információs halmaz (információs állapot) az extenzív formájú játékokban azon csomópontok összessége, amelyeket a játékos a döntése pillanatában nem tud megkülönböztetni egymástól – azaz az ekkor rendelkezésére álló információ szerint ezek mind lehetségesek. Ha egy játékosnak tökéletes emlékezete (perfect recall) van, akkor sohasem felejti el a korábban megszerzett információt és a saját korábbi döntéseit. A tökéletes emlékezet biztosítja, hogy a stratégiák konzisztensen értelmezhetők a játék folyamán: a játékos nem kerülhet olyan információs halmazba, amelyben nem emlékszik, mit tett korábban.
- Kooperatív és nem-kooperatív játék: Kooperatív játékban a játékosok között kölcsönös együttműködés alakulhat ki – például koalíciókat alkotnak és közös stratégiákat, megállapodásokat hozhatnak létre. Ilyen helyzetekben a játékosok köthetnek egymással kötött megállapodásokat (szerződésszerűen betartandó egyezségeket). Ezzel szemben a nem kooperatív játékokban a játékosok versengenek, mindenki a saját érdekét követi és nincs külső kényszeríthető megállapodás közöttük. A játékelmélet klasszikus (nem-kooperatív) ága elsősorban azt vizsgálja, hogy racionális, önérdekkövető szereplők milyen stratégiákat választanak. A kooperatív játékelmélet ezzel szemben inkább az együttműködés révén elérhető közös haszon és annak megosztása (pl. a koalíciók és a Shapley-érték) felé fókuszál.
- Zéró összegű és nem zéró összegű játék: Zéró összegű egy játék, ha az egyik játékos nyeresége a másik vesztesége – a kifizetések összege zéró (illetve állandó). Két játékosnál ez azt jelenti, hogy ami az egyiknek pozitív nyereség, az a másiknak ugyanekkora veszteség; tipikus példák a sakk vagy a póker verseny két fő között. A nem zéró összegű játékokban lehetséges, hogy a játékosok mindannyian nyerjenek vagy veszítsenek valamit együttműködés révén. Ilyen például a fogolydilemma, ahol a kooperáció mindkét fél számára előnyösebb lehet a konfliktushoz képest, vagy bármely olyan szituáció, ahol létezik kölcsönösen előnyös kimenetel.
- Konvergencia (determinizmus) és megoldott játékok: Egy játék determinisztikus vagy determinisztikus kimenetelű (determined), ha tökéletes játék (optimális stratégiák) esetén előre meghatározott eredménye van – például egyik fél biztosan nyer, vagy döntetlen lesz, függetlenül a másik fél próbálkozásaitól. Zermelo tétele kimondja, hogy minden véges, két személyes, váltakozó lépésű, tökéletes információjú játékban igaz: vagy az első játékosnak van biztos nyerő stratégiája, vagy a másodiknak, vagy mindkettő tud döntetlent biztosítani. Ilyen értelemben az olyan játékok, mint a sakk, elvben determinisztikusak (bár a konkrét stratégiát nem ismerjük, elméletileg egyik vagy másik félnek nyerő stratégiája van, vagy döntetlenre lehet kényszeríteni a partit). Megoldott játéknak (solved game) nevezünk egy játékot akkor, ha ténylegesen sikerült meghatározni a játék kimenetelét minden lehetséges állásból tökéletes játék esetén. A tic-tac-toe (amőba) például megoldott: optimális játékkal mindig döntetlen az eredmény. A 21. században számítógépek segítségével oldották meg a dámajátékot (checkers) – kiderült, hogy két tökéletesen játszó fél mindig döntetlenre végez. Egyes játékoknál az első játékos győzelme biztosítható megoldás (pl. négy a nyerő játékban az első játékos mindig nyerni tud, ha jól játszik), míg másoknál döntetlen (sakk esetében a sejtések szerint döntetlen a tökéletes játék, de ez még nem bizonyított).
- Játékkomplexitás (game complexity): A játékok bonyolultsága több értelemben is vizsgálható. Egyrészt létezik állapottér-komplexitás, ami azt méri, hány lehetséges különböző állás vagy helyzet alakulhat ki a játék során. Például a sakkban ez a szám óriási (becslések szerint több, mint 10^40 különböző állás létezhet), míg egy egyszerűbb játékban, mint a tic-tac-toe, jóval kevesebb. Másrészt beszélhetünk játékfa-komplexitásról, ami a lehetséges játszmamenetek számát jelenti (a sakkban ez is hatalmas). Végül ott a számítási komplexitás, ami azt vizsgálja, milyen nehéz algoritmikusan kiszámítani egy optimális stratégiát vagy egyensúlyt egy játékban. Sok stratégiai játékban az optimális megoldás megtalálása NP-nehéz vagy még nehezebb feladat lehet. A komplexitás miatt sok valódi stratégiai helyzetben a játékosok heurisztikákra vagy közelítő stratégiákra szorulnak a tökéletes helyett.
- Tömör (succinct) játékok: Az algoritmikus játékelmélet bevezette a tömör játék fogalmát, ami olyan játékot jelöl, amelynek leírása sokkal rövidebb, tömörebb lehet, mint a kifizetési mátrix teljes explicit felsorolása. Például ha egy játéknak 100 játékosa van, mindegyiknek 2 stratégiája, akkor a normálforma leíráshoz számú kifizetési értéket kellene megadni, ami gyakorlatilag kezelhetetlenül nagy. Ezzel szemben sok esetben a játék struktúrája miatt létezik egyszerűbb, parametrikus leírás. A grafikus játékok is egy fajtája a tömör reprezentációnak: ilyenkor egy gráffal adjuk meg, mely játékosok hatnak közvetlenül egymásra, és a játékosok haszna csak a szomszédaik stratégiájától függ. A tömör leírású játékok lehetővé teszik nagy játékos-számú szituációk modellezését anélkül, hogy minden részletet explicit felsorolnánk. Ugyanakkor a tömörségért gyakran azzal “fizetünk”, hogy bizonyos egyensúlyi fogalmak vagy megoldások megtalálása számításilag bonyolult (akár NP-nehéz) lesz.
- Torlódási játék (congestion game): Olyan speciális játékforma, ahol a játékosok közös erőforrásokat használnak, és egy erőforrás (pl. útvonal, szerver, stb.) kihasználtsága – azaz hányan használják egyidejűleg – befolyásolja a játékosok kifizetését vagy költségét. Minden játékos választ egy erőforrás-kombinációt (például útvonalat a kezdeti ponttól a célba), és az adott erőforrás “telítettsége” (torlódása) határozza meg, mennyire jól jár a játékos. Természetesen minden játékos minimalizálni szeretné a saját költségét (pl. utazási idő), de mivel hatnak egymásra – ha túl sokan választják ugyanazt az utat, mindenkinek megnő a költsége – külső költség (externália) lép fel. Tipikus példa a városi közlekedési dugó: minden autós a leggyorsabb útvonalat keresi, de ha sokan döntenek ugyanúgy, mindannyian lassabban haladnak. Fontos eredmény, hogy minden torlódási játéknak létezik tiszta stratégiás Nash-egyensúlya, és minden torlódási játék egyben potenciáljáték is (ld. 4. fejezet).
- Preferencia és hasznosság: A játékosok preferenciái azt fejezik ki, hogy a lehetséges kimenetelek közül melyiket részesítik előnyben. A preferenciareláció általában rangsorol minden eredményt a játékos számára attól függően, mennyire kívánatos számára. A játékelmélet gyakran a hasznosság fogalmát használja a preferenciák számszerűsítésére: minden kimenetelhez egy hasznosságszámot rendelünk a játékos számára, ami nagyobb a jobban preferált kimenetelek esetén. A játékosok racionális döntéseit úgy modellezzük, hogy a magasabb hasznosságú kimeneteleket igyekeznek elérni. Például egy piaci alkuban egy vevő preferenciája lehet, hogy minél alacsonyabb árat fizessen, míg az eladóé, hogy minél magasabbat kapjon; ezek kifejezhetők megfelelő hasznossági függvényekkel, és a játék leírása tartalmazza mindkét fél preferenciáit.
- Hiedelemrendszer és a tudás hierarchiája: Bizonyos játékokban (különösen Bayes-játékokban, ld. 2. fejezet) a játékosoknak nincs tökéletes információja egymásról – például nem ismerik pontosan a másik preferenciáit vagy típusát. Ilyenkor minden játékosnak vannak hiedelmei a másik játékos jellemzőiről. E hiedelmek tovább bonyolódhatnak: lehetnek hiedelmeim arról, hogy a másiknak milyen hiedelmei vannak rólam, sőt arról is, hogy ő mit gondol arról, én mit gondolok róla, és így tovább. Így jön létre a hiedelmek hierarchiája: egy végtelen mélységű, egymásba ágyazott hitrendszer. Aumann közös tudás tétele szerint ha egy információ közös tudás (common knowledge) a játékosok között, az azt jelenti, hogy mindegyik tudja, tudja hogy a másik is tudja, és így tovább végtelenül. Hierarchia of beliefs (a hiedelmek hierarchiája) Harsányi János nyomán került be a játékelméletbe, aki megmutatta, hogy a hiányos információjú játékok modellezhetők úgy, hogy feltételezzük: minden játékosnak van egy típusa, és ezekre a típusokra vonatkozóan a többi játékosnak valószínűségi hitbeli eloszlásai vannak. E hiteloszlásokra is lehetnek másodrendű hitek, és így tovább – ez a végtelen hierarchia adja a játékos típusát egy univerzális konstrukcióban. Bár a teljes hiedelem-hierarchia komplex, a gyakorlatban gyakran feltesszük a közös prior feltételezését, miszerint a játékosok kiinduló (prior) valószínűségi feltételezései megegyeznek; Aumann megegyezés-tétele pedig kimondja, hogy ha a játékosok ugyanabból a priorból indulnak ki és racionális Bayes-frissítést végeznek, akkor nem lehetséges, hogy utólag egyetértésben “megállapodnak abban, hogy nem értenek egyet” – azaz nem maradhat tartós véleménykülönbség pusztán az információk aszimmetriája miatt (lásd 6. fejezet).
- Mechanizmustervezés (mechanism design): A mechanizmustervezés a játékelmélet azon ága, ahol nem adott játékszituációt elemzünk, hanem magát a játékot tervezzük meg bizonyos célok elérése érdekében. Gyakran fordított játékelméletnek is nevezik, mivel itt előbb megfogalmazzuk, milyen kimenetelt tartunk kívánatosnak, és utána olyan szabályrendszert (mechanizmust) próbálunk alkotni, amelyben ez a kimenetel lesz az egyensúly. A mechanizmustervezés során a tervező (akit gyakran principálnak hívunk) nincs tisztában a játékosok valódi preferenciáival vagy privát információival, de úgy alakítja ki az ösztönzőket (pl. adók, támogatások, árverési szabályok), hogy a racionális játékosok saját érdeküket követve is a kívánt eredményt hozzák létre. Például az aukciók elmélete a mechanizmustervezés egy gyakorlati alkalmazása: hogyan lehet olyan licitálási szabályokat kitalálni, amelyek mellett a tárgy valóban annak a kezébe kerül, aki a legtöbbre értékeli (és a többiek nem tudják manipulálni a folyamatot). A mechanizmustervezés központi fogalma a kinyilatkoztatási elv (revelation principle), mely szerint elegendő csak olyan mechanizmusokat vizsgálni, ahol a szereplők őszintén felfedik a privát információikat, mert bármely más mechanizmus eredménye is elérhető egy megfelelő, igazmondásra ösztönző mechanizmusban. A tervező feladata tehát leegyszerűsödik: ahelyett, hogy minden lehetséges bonyolult stratégiai kommunikációt végigelemezne, elég az igazmondásra beállított mechanizmusokra koncentrálnia. A mechanizmustervezés klasszikus alkalmazásai közé tartozik a közbeszerzési pályázatok, választási rendszerek, matching problémák (pl. orvosok kórházakhoz rendelése) tervezése, ahol a cél valamilyen társadalmilag optimális (pl. Pareto-hatékony, igazságos) kimenetel megvalósítása stratégiai szereplők között.
(Megjegyzés: A fenti lista nem teljes körű, de lefedi a legfontosabb alapfogalmakat. Következzenek az egyensúlyfogalmak.)
2. Egyensúlyfogalmak
Az egyensúly a játékelmélet központi fogalma: olyan állapot vagy stratégia-profil, ahol a játékosoknak nincs ösztönzésük egyoldalúan eltérni. Többféle egyensúlyfogalom létezik attól függően, milyen helyzetet és milyen követelményeket vizsgálunk. Itt áttekintjük a legfontosabb egyensúlytípusokat és kapcsolódó fogalmakat.
- Nash-egyensúly: A legalapvetőbb egyensúlyfogalom. Egy Nash-egyensúly az a stratégiakombináció, amelyben egyik játékos sem tudja saját helyzetét jobbra változtatni egyoldalú stratégiaváltással, feltéve hogy a többi játékos a saját stratégiáját változatlanul tartja. Másképpen: minden játékos stratégiája legjobb válasz a többiek stratégiájára. A Nash-egyensúly lehet tiszta stratégiás (amikor mindenki egy konkrét akciót választ) vagy kevert stratégiás (amikor valószínűségeloszlással választanak a stratégiák között). Nash híres tétele bizonyítja, hogy minden véges (véges játékosszámú és véges stratégiájú) játékban létezik legalább egy Nash-egyensúly (szükség esetén kevert stratégiában). A Nash-egyensúly fontos jellemzője, hogy stabil stratégiai helyzetet ír le, de nem feltétlenül jelent társadalmilag optimális vagy igazságos kimenetelt – például a fogolydilemma Nash-egyensúlya mindkét fél számára rosszabb, mint a kooperáció lenne.
- Bayes-i Nash-egyensúly: Ha a játéknak hiányos információs jellege van (azaz a játékosoknak privát információik vagy típusaik vannak, ld. 1. fejezet hierarchy of beliefs rész), akkor az egyensúly fogalmát ki kell terjesztenünk erre az esetre. A Bayes-i Nash-egyensúly olyan stratégiafüggvények összessége (minden lehetséges típus esetén stratégiát adva), amelyben minden típusú játékos – figyelembe véve a többiek típusairól alkotott hiedelmeit – a saját várható hasznát maximalizálja, és nincs ösztönzése eltérni. Tehát minden játékos a Bayes-szabály szerint, a rendelkezésére álló valószínűségi információ alapján választ optimális stratégiát. Ez a fogalom a Bayes-játékok (hiányos információjú játékok) megoldásának alapja.
- Tökéletes Bayes-i egyensúly (PBE): A Bayes-i Nash-egyensúly dinamikus, szekvenciális játékokra alkalmazott megerősítése. Egy tökéletes Bayes-i egyensúly olyan stratégia- és hitrendszer (a játékosoknak a játék minden információs állásánál van egy hiedelmük a másik típusáról vagy korábbi akcióiról) kombinációja, amely kielégíti két feltételt: (1) a stratégiák Bayes-Nash-egyensúlyt alkotnak, azaz minden típus a hitrendszerének megfelelően legjobban válaszol a többiek stratégiáira; (2) a hitrendszer konzisztens a stratégiákkal, értsd a Bayes-szabály szerint frissített (felújított) a játék során, ahol csak lehet. A tökéletes Bayes-i egyensúlyt gyakran használják dinamikus jelző és beavatási játékok elemzésére (pl. jelzési játékokban, lásd 4. fejezet), hogy kizárják azokat az egyensúlyokat, amelyek “irracionális” hiedelmekre épülnek bizonyos nem megfigyelt események után.
- Szekvenciális egyensúly: A szekvenciális egyensúly a tökéletes Bayes-i egyensúly egy formálisabb és szigorúbb változata (Kreps és Wilson definíciója). Követelménye, hogy a stratégia-hitrendszer pár (pl. egy dinamikus játékban) ne csak Bayes-konzisztens és helyben racionális legyen, hanem minden egyes lehetséges szubjátékban (a játék egy részjátékában) is egyensúlyt alkosson. A szekvenciális egyensúly tehát kiküszöböli azokat a Nash-egyensúlyokat, amelyek nem hihetőek (credible) bizonyos fenyegetések vagy ígéretek szempontjából. Minden szekvenciális egyensúly egyben tökéletes Bayes-i egyensúly is, de utóbbiaknál erősebb követelményeket ír elő a nem elérhető úton kialakuló hiedelmekre is. Például a Centipede-játék vagy az ultimátumjáték kimeneteleinek elemzésekor a szekvenciális egyensúly segít megérteni, miért reálisabb bizonyos stratégiák kizárása (mint a hihetetlen fenyegetések kiszűrése).
- Tökéletes szubjáték-egyensúly (subgame perfect equilibrium, SPE): Ez az egyensúlyfogalom szintén dinamikus játékokra vonatkozik. Egy stratégiahalmaz szubjáték-tökéletes, ha minden egyes részjátékban Nash-egyensúlyt alkot. Más szavakkal: nem csak a játék egészében nem éri meg senkinek eltérni, de a játék bármely pillanatától kezdve (bármilyen részjátéknál) sem éri meg. Ezzel kizárjuk az olyan Nash-egyensúlyokat, amelyek korai szakaszban hihetetlen fenyegetéseken vagy nem reális ígéreteken alapulnak. A szubjáték-tökéletes egyensúly tipikus alkalmazása a visszafelé indukció módszerével való megoldás (ld. 3. fejezet), például az ultimátumjáték egyetlen szubjáték-tökéletes egyensúlya az, ha a felajánló minimális összeget ajánl, a másik fél pedig elfogadja – mert ha irracionális módon elutasítaná, az ellentmondana a részjáték-optimalitásnak.
- Trembling-hand tökéletes egyensúly: Reinhard Selten vezette be ezt a finomítást. A lényege, hogy feltételezzük: előfordulhat, hogy a játékosok nagyon kis valószínűséggel “megbotlanak” (vagyis nem szándékos hibát vétenek) – innen a “remegő kéz” elnevezés. Egy stratégia-profil trembling-hand perfect (remegő kéz egyensúly), ha létezik olyan egyensúly-közelben lévő stratégiamódosulat (minden játékosnál olyan stratégiák, amelyek kis valószínűséggel eltérhetnek az eredetitől), amelyben a stratégia minden játékosnak optimális válasz, feltéve hogy a többiek is ilyen módosított stratégiát követnek. Informálisan: az egyensúly akkor is stabil marad, ha megengedünk elhanyagolható esélyű hibákat. Ez a fogalom kizár néhány érzékeny Nash-egyensúlyt, amelyek csak tökéletes játékkal tarthatók fenn, de a legkisebb hiba szétrombolná őket. A trembling-hand egyensúly minden szubjátékban is egyensúlyt jelent, és általában szigorúbb, mint a szubjáték-tökéletesség.
- Epsilon-egyensúly: Az -egyensúly egy megengedőbb egyensúlyfogalom. Egy stratégiaprofil -Nash-egyensúly, ha egyik játékos sem tud többet mint mértékben javítani a saját kifizetésén egyoldalú stratégiaváltással. Itt egy kis nemnegatív szám, ami megengedi, hogy az egyensúly “közelítsen” a pontos Nash-egyensúlyhoz. Gyakran használják nagy vagy bonyolult játékoknál, illetve akkor, amikor a játékosok hajlandóak egy kis haszonveszteséget elfogadni a stratégiájuk egyszerűsítéséért (pl. számítási korlátok miatt). -egyensúly például előfordulhat akkor, ha a játékosok kicsit “kerekítenek” a valószínűségeiken kevert stratégiában, de a kimenetel gyakorlatilag még közel optimális.
- Korrelált egyensúly: Robert Aumann által bevezetett fogalom. A korrelált egyensúly kiterjeszti a Nash-egyensúlyt azzal, hogy megengedi a játékosoknak, hogy egy külső jel alapján korrelálják (összehangolják) a stratégiáikat. Egy külső jeladó (például egy kommunikátor vagy egy nyilvános jelzés) minden játékosnak küldhet üzenetet a játék megkezdése előtt, és a játékosok a kapott jel függvényében választanak stratégiát. A korrelált egyensúly azt jelenti, hogy létezik olyan valószínűségi eloszlás az üzenetekre, amely mellett – ha mindenki követi a jel alapján javasolt stratégiát – egyik játékosnak sem érdemes eltérni még akkor sem, ha látja a saját jelét, de nem látja a többiekét. Ily módon a korrelált egyensúly lehetővé teszi a koordinációt anélkül, hogy a játékosok közvetlenül kommunikálnának vagy kötelező megállapodást kötnének. Érdekes módon minden Nash-egyensúly felfogható speciális korrelált egyensúlyként (ahol a jeladó független döntéseket ajánl mindenkinek), de létezhetnek korrelált egyensúlyok, amelyek nem Nash-egyensúlyok és jobb eredményre vezethetnek. Például a korreláció segítségével a vezető-követő szerepek kioszthatók egy koordinációs játékban, így elkerülhető egy rossz egyensúly.
- Bayes-korrelált egyensúly: A korrelált egyensúly fogalmának kiterjesztése hiányos információjú helyzetekre. Bayes-korrelált egyensúly esetén egy külső jel nemcsak a stratégiákat hangolja össze, hanem figyelembe veheti a játékosok privát információit is. Ez a koncepció a mechanizmustervezésben bukkan fel, különösen akkor, amikor az információ aszimmetrikus és szeretnénk az ügynököket koordinálni. Formálisan: létezik egy olyan valószínűségi eloszlás a játékosok típusaira és a korrelációs jelekre, hogy ha minden játékos a jel és saját típusa alapján játszik, akkor nem éri meg eltérnie. A Bayes-korrelált egyensúly bevezet egyfajta közös randomizációt, ami figyelembe veszi, hogy a játékosok mit tudnak egymásról.
- Koalíció-biztos (coalition-proof) Nash-egyensúly: Olyan Nash-egyensúly, amely nem bomlik fel akkor sem, ha több játékos együtt, koalíciót alkotva próbálna meg eltérni. A sima Nash-egyensúly csak arra nézve stabil, hogy egy-egy játékos önállóan ne tudjon jobban járni a többiek stratégiái mellett. A koalíció-biztos egyensúly ennél erősebb: nincs olyan játékoscsoport (koalíció), amelynek tagjai közösen, összehangolt stratégiaváltással mindannyian jobban járnának, feltéve hogy a koalíción kívüliek maradnak az eredeti stratégiájuknál. Ez a fogalom különösen a kooperatív és nem-kooperatív elméletek határán érdekes, hiszen figyelembe veszi a játékosok közti egyeztetést is. Koalíció-biztos egyensúly például a fogolydilemma ismételt változataiban jöhet szóba, ahol a játékosok megegyezhetnek a közös szankciókban az esetleges deviáns viselkedés ellen (lásd folk tétel).
- Berge-egyensúly: Kevésbé ismert, de érdekes megoldásfogalom. A Berge-egyensúly (Claude Berge-ről elnevezve) olyan helyzet, amelyben minden játékos a többiek számára legkedvezőbb stratégiát választja. Míg a Nash-egyensúlyban mindenki a saját hasznát maximalizálja (figyelembe véve a többiek döntéseit), addig a Berge-egyensúly altruista jellegű: minden játékos úgy játszik, hogy a többiek a lehető legmagasabb kifizetést kapják. Természetesen ez nem jön létre spontán versengő helyzetekben, de vannak szituációk (pl. családtagok döntései vagy erős szövetségesek), ahol inkább mások jóléte a fontos. A Berge-egyensúly érdekessége, hogy matematikailag létezik és elemezhető, de teljes önzetlenséget feltételez a játékosok részéről. Összehasonlításképp: a Nash-egyensúly a nem együttműködő, önérdekkövető, míg a Berge-egyensúly az együtt érző, altruista viselkedést formalizálja.
- Markov-tökéletes egyensúly (Markov perfect equilibrium, MPE): Egy dinamikus (többszakaszos vagy végtelen időhorizontú) játék egyensúlyának speciális esete. A Markov-stratégia olyan stratégia, ami csak a játék aktuális állapotától függ, a múltbeli történések közül csak annyit vesz figyelembe, amennyi az állapotban összegződik (Markov-tulajdonság). A Markov-tökéletes egyensúly pedig olyan szubjáték-tökéletes egyensúly, ahol minden játékos Markov-stratégiát követ. Azaz az egyensúlyi stratégia nem függ a teljes múltbeli játékmenettől, csak a releváns állapotváltozóktól. Ezt gyakran alkalmazzák például differenciáljátékokban vagy iparági verseny modellekben, ahol az állapot lehet pl. a vállalatok aktuális piaci részesedése vagy egy erőforrás szintje. Az MPE kiszűri az “emlékező” stratégiákból fakadó egyensúlyokat, így gyakran egyszerűbb és robosztusabb (kevesebb, jellemzően egyedi) egyensúlyt ad, de figyelmen kívül hagy bizonyos fenyegetéseket vagy múltbeli szankciókat, amelyeket a folk-tételek kihasználnának.
- Evolúciós stabil stratégia (ESS): Az evolúciós játékelmélet központi egyensúlyfogalma, John Maynard Smith és George R. Price nevéhez fűződik. Egy evolúciósan stabil stratégia egy olyan tiszta stratégia (vagy stratégia-keverék) egy populációban, amely képes ellenállni egy kis arányú mutáns stratégia inváziójának. Formálisan: stratégia evolúciósan stabil, ha (1) Nash-egyensúly önmagával szemben, és (2) ha van egy másik stratégia, amely szintén legjobban válaszol -re, akkor a saját populációjában jobb eredményt ér el -nél. Ennek intuitív jelentése, hogy ha egy populáció már -t játszik, akkor egy kis csoport új stratégiát alkalmazó “mutáns” nem tudja kiszorítani -t, mert jobban teljesít velük szemben. Az ESS fogalmát gyakran alkalmazzák biológiában (állatviselkedési stratégiák elemzésénél), de gazdasági vagy társadalmi helyzetekre is, ahol a tanulás vagy utánzás útján alakulnak ki a stratégiák. Klasszikus példa az ’Összetartás–Megfutamodás’ (Hawk-Dove) játékban egy bizonyos kevert stratégia ESS lehet, ami a konfliktus és engedés keverékét jelenti az állatpopulációkban.
- Mertens-féle stabil egyensúly: J.-F. Mertens által javasolt finomított egyensúlyfogalom, mely a nem-kooperatív játékok stabilitását próbálja megragadni. A Mertens-stabil egyensúly (gyakran csak stabil egyensúly) követelménye, hogy az egyensúly akkor is fennmaradjon, ha a játékot kicsit megváltoztatjuk (pl. a kifizetéseket vagy stratégiákat enyhén perturbáljuk). Ez rokon Selten tökéletes egyensúly koncepciójával, de még erősebb: nem elég a remegő kéz stabilitás, hanem egy kis strukturális változás esetén sem ugrik át az egyensúly egy egész más kimenetelbe. Az ilyen stabilitás garantálja, hogy az egyensúly robusztus a modellezési részletekre. A Mertens-féle stabilitás technikailag topológiai és refinements elméleti eszközökkel van definiálva, és biztosítja például, hogy egyensúly-halmazok bizonyos szép tulajdonságokkal bírjanak (pl. tartalmazzanak tökéletes egyensúlyt, legyenek reflexívek, stb.). Kezdő szinten elég annyit látni róla, hogy ez egy nagyon erős és absztrakt követelmény az egyensúlyra – a “legkisebb rezdülésre” se boruljon fel.
- Proper equilibrium: Myerson által bevezetett finomítás, a trembling-hand egyensúly tovább erősítése. Proper (helyes) egyensúly esetén a remegő kéz hibák valószínűségei között arányossági feltétel van: ha egy játékosnak egy rosszabb válasza van, annak relatív valószínűsége sokkal kisebb kell legyen, mint egy kevésbé rossz válaszé. Ez biztosítja, hogy ha a játékos téved is, inkább “kis rossz” hibát vétsen, mint nagyot. A proper equilibrium minden trembling-hand perfekt egyensúlyra jellemző, de kevesebb van belőle, tehát erősebb kritérium. Intuíciónak: egy proper egyensúlyban a játékosok nagyon valószínűtlenül választanak erősen dominált stratégiákat a véletlen hibák során, ezzel kizárva bizonyos kényes egyensúlyokat.
- Kvantális válasz egyensúly (quantal response equilibrium, QRE): Egy olyan kvantitatív egyensúlyfogalom, amely a korlátozott racionalitást modellezi. Feltesszük, hogy a játékosok nem mindig a legjobb választ választják, hanem valószínűbb választaniuk a jobb stratégiákat, de néha a rosszabbakat is megteszik kisebb valószínűséggel. Formálisan: minden játékos a stratégiákat egy logit (vagy más hasonló) függvénnyel választja, ahol a jobb (magasabb kifizetésű) stratégiák nagyobb valószínűséget kapnak, de nem nullát a gyengébbek sem. A kvantális válasz egyensúly pedig olyan valószínűség-eloszlások halmaza minden játékosra, amely önmagával konzisztens: az egyensúlyban lévő stratégiák pont azok a valószínűségek, amelyek a logit-válasz függvény szerint adódnak a többiek stratégiáira. Ez egy rugalmasabb egyensúlyfogalom, amit főleg kísérleti és viselkedési játékelméletben használnak, mert jobban illeszkedik az empirikus megfigyelésekhez (az emberek nem mindig játszanak tökéletesen, de gyakrabban játszanak jobb stratégiákat). A QRE gyakran Gibbs-egyensúly néven is ismert, utalva a statisztikus fizikai analógiára.
- Majdnem tökéletes (quasi-perfect) egyensúly: Egy finomítás Selten nyomán, amely a dinamikus játékokra vonatkozik. A kvázi-tökéletes egyensúly megköveteli, hogy a játékosok bármilyen kicsi, de pozitív valószínűségű hibák mellett is racionális stratégiát játsszanak minden helyzetben. Hasonló a trembling-hand egyensúlyhoz, de a kvázi-tökéletesség elsősorban arra összpontosít, hogy a kétszereplős, nulla összegű játékokban se maradjanak “zavaros” egyensúlyok. Egyszerűbben: a kvázi-tökéletes egyensúly figyel a második játékos legkisebb esélyű stratégiáira is, és kizárja az olyan egyensúlyt, ahol egy játékos csak azért tart fent egy hihetetlen fenyegetést, mert nullával valószínűnek tekinti, hogy arra a pontra eljut a játék.
- Önmagát megerősítő (self-confirming) egyensúly: Ez az egyensúlyfogalom laza értelmezésben azt jelenti, hogy minden játékos stratégiája helyesnek tűnik a saját, játék során szerzett tapasztalatai alapján, még ha objektíve nem is az. Önmagát megerősítő egyensúlyban minden játékos stratégiája optimális a többiek stratégiái által generált hitek fényében, és ezek a hitek megegyeznek a játék során megfigyelt eseményekkel. Azonban előfordulhat, hogy bizonyos nem megfigyelt szituációkról a játékosok téves elképzelésekkel bírnak – de mivel a játék során ezekre nem kerül sor, a tévedés sosem derül ki, így a stratégia “önmagát megerősíti”. Ezt a fogalmat dinamikus tanulási folyamatok és ismétlődő interakciók elemzésére vezették be, ahol a játékosok fokozatosan alakítják ki a hiedelmeiket a többiek viselkedéséről. Egy önmagát megerősítő egyensúly nem feltétlenül Nash-egyensúly, de a játékosok szubjektív nézetei szerint nincs okuk eltérni. Az eltérés abból adódhatna, ha valaha is kipróbálnának egy olyan utat, amit addig egyik fél sem lépett meg, de mivel nem próbálják, a téves hit fennmarad. Ez a koncepció rávilágít arra, hogy a tapasztalati tanulás és a korlátozott ismeret miként vezethet látszólag stabil, ám tökéletlen kimenetelekhez.
- Megelégedési egyensúly (satisfaction equilibrium): Egy viszonylag új keletű koncepció, ami eltér a klasszikus racionális optimumkereséstől. A megelégedési játékokban (satisfaction games) minden játékosnak van egy elvárási szintje vagy megelégedési küszöbértéke a kifizetésre. Egy stratégia-profil akkor megelégedési egyensúly, ha minden játékos elégedett a kapott eredményével (azaz eléri a küszöböt), és egyetlen játékos sem tud úgy stratégiát változtatni, hogy még mindig mindenki más elégedett maradjon, de ő maga javítson. Tehát itt nem a maximalizálás a lényeg, hanem egy mindenkinek kielégítő állapot fenntartása. Az ilyen egyensúly lényegében egyfajta kooperatív hangvételű megoldás hiányos információ mellett: a játékosok megelégednek egy bizonyos szinttel, és ha mindannyian elérik azt, nem kockáztatnak egyéni javítást, ami másokat esetleg elégedetlenné tenne. Példa: képzeljünk el egy erőforrás-felosztási helyzetet, ahol mindenki kap valamennyit; ha mindenki kapott legalább annyit, amennyit minimálisan szeretett volna, akkor nem reklamálnak vagy nem próbálnak többet szerezni. A megelégedési egyensúly nem feltétlen Pareto-hatékony, de stabil lehet, ha a játékosok a konfliktus helyett a kooperatív megelégedést preferálják.
- Pareto-hatékonyság: Bár nem konkrét egyensúlyfogalom, az allocációk (kimenetelek) fontos jellemzője. Egy kimenetel Pareto-hatékony, ha nincs olyan másik kimenetel, ami legalább az egyik játékosnak jobb, és a többieknek sem rosszabb. Magyarán: nem lehet senkit jobban járatni anélkül, hogy valaki mást ne hoznánk rosszabb helyzetbe. A Pareto-hatékonyság a társadalmi optimáltság egyszerű mércéje. Sok játékban a Nash-egyensúly nem Pareto-hatékony (klasszikus példa a fogolydilemma, ahol a Nash-kimenet nem Pareto-optimális, hisz mindkét játékos javulhatna a kooperációval). Az egyensúlyelemzés során gyakran megjegyezzük, ha egy egyensúly Pareto-optimális vagy sem, hiszen ez jelzi, van-e feszültség az egyéni racionalitás és a közös jólét között.
- Mag (Core): A mag fogalma a kooperatív játékelméletből származik, de fontos megemlíteni. Tegyük fel, hogy adott egy többszereplős kooperatív játék, ahol a játékosok koalíciókat alkothatnak és közösen szerezhetnek hasznokat, amelyeket valahogy fel kell osztani köztük. A mag azon leosztások (haszonelosztások) halmaza, amelyeknél egyik koalíció sem képes saját magának minden tagja számára jobbat biztosítani, mint amit a leosztás ad. Ha a leosztás a magban van, akkor nincs ösztönzés semelyik csoportnak kiválnia és külön megállapodnia, mert a koalíció tagjai együtt sem tudnának magasabb kifizetést elérni. A mag tehát a stabil együttműködési megállapodások gyűjteménye. Ha a magnak nincs eleme (üres), az azt jelenti, hogy bármilyen megállapodást is kötünk, lesz egy csoport, aki azt felrúghatja közös jobb alternatíva reményében – ilyenkor a nagy koalíció (az összes játékos együtt) instabil. A mag klasszikus alkalmazása például a piaci cserejátékokban vagy a közjavak játékában jelenik meg.
- Shapley-érték: A kooperatív játékok egyik megoldásfogalma, Lloyd Shapley nevéhez fűződik. A Shapley-érték megad egy fair elosztást a koalíciós játékokban: a közösen elért hasznot (vagy költséget) osztja fel a játékosok között oly módon, hogy mindenki annyit kapjon, amennyivel átlagosan hozzájárul a koalíciók sikeréhez. Elképzelhetjük, hogy a játékosok különböző sorrendekben csatlakoznak egy koalícióhoz; minden belépőnek lehet egy marginális hozzájárulása (mennyi pluszt hoz az addigi csapat eredményéhez). A Shapley-érték egyenlő az összes lehetséges belépési sorrend átlagos marginális hozzájárulásával. Számos kívánatos tulajdonsága van: megérdemli a szimmetriát (ha két játékos azonos módon járul hozzá minden koalícióhoz, ugyanannyit kapjanak), null játékos semmit se kapjon, és a hozzájárulások additivitását. Például képzeljünk el három munkást, akik együtt 100 egység profitot termelnek. Ha egyikük egyedül 30-at tudna, másik 20-at, harmadik 0-t, együtt pedig 100-at, akkor a Shapley-érték feloszthatja a 100-at úgy, hogy tükrözze: az első kettő nélkül a harmadik semmit nem ér el, de az első kettő együtt is csak 50-et, viszont a harmadik jelenléte 50 extra profitot generál. Ennek alapján a harmadik is kapna részesedést a 50-ből a Shapley-érték szerint (pontosan kiszámolható a formulával). A Shapley-érték előnye, hogy mindig létezik, egyértelmű, és sok helyzetben “jogosnak” érzett megoldást ad (pl. költségmegosztás, bevételmegosztás problémákban).
- Erős Nash-egyensúly: Az erős Nash az egyensúly fogalmának olyan erősítése, amely a koalíciós deviációkat is figyelembe veszi. Egy stratégia-profil erős Nash-egyensúly, ha nincs semmilyen játékoscsoport, amelynek tagjai egyszerre eltérve mindannyian jobban járnának, miközben a csoporton kívüliek stratégiái változatlanok. Tehát ez még szigorúbb, mint a korábban említett koalíció-biztos Nash: ott azt kértük, hogy ne legyen olyan koalíció, amelynek minden tagja jobban jár és a többiek nem rosszabbul. Az erős Nash-nél a csoporton kívülieket nem követeljük meg, hogy ne sérüljenek, csak a csoport minden tagja nyerjen. Az erős Nash ritka a gyakorlatban, mert nagyobb létszámú játékokban majdnem mindig lehet valamilyen kis csoport, aki együtt mozdulva javíthat a helyzetén. Ha azonban létezik erős Nash-egyensúly, az rendkívül stabil, hisz semmiféle összejátszás nem bontja meg. Példa: egy felosztási játékban (pl. osztozkodás) az egyenlő elosztás lehet erős Nash, mert ha bárki csoportba verődve másként próbál osztozni, valaki a csoportból biztos rosszabbul jár az egyenlőnél – így nincs ösztönzés az eltérésre.
3. Stratégiák
A játékosok stratégiái határozzák meg, hogyan játszanak a játékban. A stratégia lehet egy egyszeri lépés (egy akció választása), vagy összetett terv, ami minden lehetséges helyzetre megmondja, mit tesz a játékos. Ebben a fejezetben különféle stratégiatípusokat és taktikákat tekintünk át, amelyek a játékelméletben és a gyakorlatban is fontosak.
- Domináns stratégia: Egy stratégia domináns, ha minden lehetséges másik játékos-stratégia esetén jobb eredményt nyújt a játékosnak, mint bármely más stratégiája. Tehát a domináns stratégia “minden körülmények között” a legjobb. Ha egy játékosnak van domináns stratégiája, akkor racionálisan azt fogja választani, függetlenül attól, mit tesznek a többiek. Például a fogolydilemmában mindkét játékos számára domináns stratégiának tekinthető a vallomástétel (az “árulás”), mert bármelyik stratégiát is válassza a másik (hallgat vagy vall), ezzel jár jobban saját szempontjából. Domináns stratégiák megléte erősen leegyszerűsíti a játék megoldását, bár sok játékban nincs ilyen mindenki számára.
- Domninált stratégia: Ennek ellentéte, amikor egy stratégia dominált, azaz létezik egy másik stratégia, ami minden esetre jobban szerepel annál. A racionális játékos sosem választana dominált stratégiát (hisz mindig van jobb), és a racionális játékelemzés során gyakran kizárjuk a dominált stratégiákat (eliminációjuk iterált folyamata sok játékot megold vagy leegyszerűsít).
- Tiszta és kevert stratégia: Tiszta stratégia az, amikor a játékos konkrétan megnevezi, mit fog lépni (vagy a szekvenciális játék minden pontján mit lép). Ezzel szemben kevert stratégia esetén a játékos valószínűségi sorsolást alkalmaz a lehetséges lépései között. Például kő-papír-ollóban nincsen domináns tiszta stratégia, de kevert stratégiával – mondjuk mindhárom lehetőséget 1/3-1/3-1/3 eséllyel választva – biztosíthatja, hogy az ellenfél se tudjon kihasználni egy fix mintát. A kevert stratégia fogalma formalizálja a véletlenszerű választást (vagy populációs arányt evolúciós játékban). A Nash-egyensúly tétele is kevert stratégiákra garantál létezést. A gyakorlatban a kevert stratégiát néha vegyes stratégiának is hívjuk. Fontos: a keverés nem azt jelenti, hogy a játékos bizonytalan, mit akar – inkább tudatosan randomizál, hogy az ellenfelek ne tudják előre kiszámítani a lépését.
- Visszafelé indukció (backward induction): Ez nem egy stratégia, hanem egy megoldási módszer szekvenciális játékoknál, de fontos stratégiai gondolkodási eszköz. A visszafelé indukció során a játék végétől kezdve, lépésről lépésre visszafelé haladva határozzuk meg a racionális lépéseket. Az utolsó lépésnél nyilvánvaló, mit érdemes tenni (mert ott már nincsenek további következmények), majd feltételezve, hogy a későbbi lépésekben mindenki optimálisan fog cselekedni, az ezt megelőző lépésnél így tudjuk, mi a legjobb választás, és így tovább az elejéig. Ez a módszer adja a szubjáték-tökéletes egyensúlyt sok játékban. Például a centipede-játékban vagy az ultimátumjátékban a visszafelé indukcióval juthatunk arra a (meglepő) következtetésre, hogy a racionális játékos azonnal (vagy nagyon korán) megállítja a játékot ill. a legalacsonyabb összeget ajánlja, mert a végén álló játékos már biztosan nem utasít vissza egy minimális ajánlatot sem.
- Előre tekintő indukció (forward induction): Ez egy stratégiai gondolkodás, amikor a játékosok a korai lépésekből próbálnak következtetni a többiek típusára vagy szándékára, és ennek fényében választanak később stratégiát. Az előre indukció lényege, hogy “ha a másik ezt lépte korábban, abból arra következtetek, hogy neki valószínűleg ilyen stratégiája/típusa van, így az én későbbi legjobb válaszom ennek megfelelően alakul.” Ez különösen jelzési és szétválasztási egyensúlyoknál lényeges. Például egy licitáló árverésen, ha egy versenytárs nagyon agresszíven licitál az elején, abból a többiek feltételezhetik, hogy neki nagy értéke van a tárgyra – így előre indukcióval a többiek lehet, hogy ki is szállnak később, nem licitálnak ellene, mert “megértették a jelzést”. Az előre indukció sokkal informálisabb, mint a visszafelé indukció, de néha formális refinements is épülnek rá (például a közel tökéletes egyensúly egyik motivációja is ez).
- Stratégia-lopási érv (strategy-stealing argument): Ez egy matematikai argumentum, főleg a kombinatorikus játékokban (mint pl. Go vagy bizonyos matematikai játékok). A lényege: bizonyos kétjátékos, teljes információs játékokban azt lehet mondani, hogy az első játékosnak nem lehet rosszabb a helyzete, mint a másodiknak, mert ha volna egy stratégia a második játékos számára, amivel biztosan nyerne, akkor az első játékos “ellophatná” azt a stratégiát az első lépése után. Például sok absztrakt logikai játéknál (go-módszer, hex, stb.) használnak stratégia-lopási érvet annak bizonyítására, hogy az első játékos nem lehet alulmaradásra kényszerítve (tehát vagy nyer vagy döntetlen). Ennek tipikus formája: feltételezzük ellentmondásra, hogy a második játékosnak van nyerő stratégiája. Az első lépésénél az első játékos csinál egy önkényes lépést. Utána képzeljük, hogy a másodiknak volt nyerő stratégiája; most az első játékos “átveszi” ezt a szerepet és stratégiát, mintha ő lenne a második játékos a hátralévő játékban. Ha valamikor az első lépés, amit ő tett, útban lenne, akkor azt a lépést kihagyja (vagy csinál valami mást, részletektől függően) – de mivel az első lépés nem lehet része a második játékos eredeti stratégiájának, nem zavar be. Így az első játékos legalább döntetlenre jó lesz. Ezzel az ellentmondás feloldva, tehát a másodiknak nem lehet biztos nyerése. Ezt a fajta gondolatmenetet hívjuk stratégia-lopási érvnek. (Ez nem konkrétan egy játékos stratégiai lépése, inkább bizonyítási trükk, de a játékelméleti gondolkodás része.)
- Fenyegetés és ígéret (deterrence és appeasement): A stratégiai interakciókban gyakran nemcsak a konkrét lépések, hanem a jövőbeli reakciók ígérete vagy fenyegetése is fontos szerepet játszik. Fenyegetés (deterrence) alatt olyan stratégiát értünk, amelynek célja eltántorítani a másik felet valamitől. Például egy ország fenyegetheti a másikat megtorlással, ha az megtámadja – ez a fenyegetés hitelessége attól függ, hogy a fenyegető félnek érdekében áll-e ténylegesen végrehajtani a büntetést, még akkor is, ha költséges. A hiteles fenyegetés a dinamikus játékokban kulcsfontosságú: a szubjáték-tökéletesség lényegében megköveteli, hogy a fenyegetések (és ígéretek) hihetők legyenek, különben a másik fél nem veszi figyelembe őket. Ígéret (appeasement) ezzel ellentétes irányú stratégia: a játékos előrevetíti, hogy jutalmazni fogja a másikat, ha az bizonyos módon cselekszik. Például vállalhatja, hogy a jövőben együttműködik, vagy engedményt tesz. Az appeasement szó szerint békítés: a másik fél kiengesztelésére tett stratégiai lépés. Ilyen lehet egy versenyben az, ha az egyik cég megígéri, hogy nem csökkenti tovább az árait, ha a másik is abbahagyja a “árháborút”. Természetesen az ígéretnek is hihetőnek kell lennie (öndöntően végrehajthatónak), különben a másik fél nem fog bízni benne.
- Eszkaláció és de-eszkaláció: Az eszkaláció (kiterjesztés, fokozás) egy stratégiai lépés vagy folyamat, amely során a konfliktus vagy versengés erősödik. Például ártárborúban a cégek egyre lejjebb viszik az árakat, vagy fegyverkezési versenyben az országok mind több fegyvert halmoznak fel. Az eszkalációs csapda az a jelenség, amikor a játékosok a korábbi befektetéseik vagy elköteleződéseik miatt egyre tovább mennek egy veszteséges helyzetbe is – ezt hívják elköteleződés-eszkalációnak (escalation of commitment): nem akarják “feladni” a már beleölt erőforrásokat, ezért továbbiakat áldoznak fel, remélve a fordulatot. Ennek tipikus példája a dolláraukció (ld. 5. fejezet), ahol a licitálók végül többet fizetnek egy dollárért, mint amennyit ér, mert nem akarják a korábbi veszteségüket realizálni. A de-eszkaláció ennek ellentéte: a feszültség enyhítése, a konfliktus visszafogása. Stratégiailag egy konfliktusban az egyik fél dönthet úgy, hogy gesztusokat tesz a békülés felé – például részlegesen visszavonja csapatait egy határvitában, vagy a cég visszafogja a reklámhadjáratát a másik ellen. A de-eszkaláció célja a költséges versengés megfékezése és a bizalom építése, de kockázatos lehet, mert a másik fél esetleg gyengeségnek tarthatja. A játékelméletben az eszkaláció kérdése gyakran a nem zéró összegű szituációknál kerül elő, ahol mindkét fél veszíthet az eszkaláción (példa: csirkejáték esetén lásd később).
- Összejátszás (collusion): Amikor versengő felek titokban együttműködnek saját közös előnyükre egy harmadik fél vagy a piac kárára, azt összejátszásnak hívjuk. Például vállalatok megállapodhatnak, hogy nem mennek egy bizonyos ár alá (kartell), vagy felosztják egymás közt a piacot. Az összejátszás a játékelméletben a kooperáció egy speciális formája, amely tipikusan illegális vagy erkölcstelen keretek között zajlik (például az antitröszt törvények tiltják). Stratégiai szempontból azonban kezelhető: egy ismétlődő játékban a vállalatok fenntarthatják az összejátszást azzal, hogy büntető stratégiát alkalmaznak, ha valaki megszegi a megállapodást (ld. grim trigger alább). Tehát a kartell fenntartható például egy szuperjáték-egyensúly formájában, ha a jövőbeli profitokat eléggé értékelik (ld. folk-tétel).
- Olcsó beszéd (cheap talk): Az olcsó beszéd olyan kommunikáció a játékosok között, amely nem kötelező erejű és nincs közvetlen hatása a kifizetésekre. Vagyis a játékosok üzeneteket válthatnak a játék előtt vagy közben, de ezek az üzenetek nem befolyásolják közvetlenül a játék végkimenetelét – csak azáltal lehet hatásuk, hogy befolyásolják a másik játékos hiteit vagy stratégiáit. Mivel az üzenetek elküldése nem jár költséggel vagy formális következménnyel, bármilyen üzenetet lehet mondani, akár igaz, akár nem – innen az “olcsó” jelző. Játékelméleti kérdés, hogy lehet-e hasznos információt közölni olcsó beszéddel. A válasz: bizonyos esetekben igen, lehetséges olyan szétválasztó egyensúly olcsó beszéddel, ahol a különböző típusú játékosok különböző üzeneteket küldenek, és ezek hihetők (mert mindegyik típusnak más érdeke van a hazugságban). Máskor viszont a cheap talk csak üres fecsegés, és a racionális fél nem hisz a másik üzenetének. Példa: két cég azt kommunikálhatja a piacnyitás előtt, hogy ők magas árat fognak kérni a termékért. Ha mindketten hihetően elköteleznék magukat, mindketten jól járnának. De mivel az üzenet olcsó beszéd, a bejelentés nem kötelező, így a másik nem biztos hogy elhiszi. A cheap talk elemzése a jelzési játékok elméletéhez kapcsolódik (ahol a jelzésnek van költsége, ott már nem olcsó beszéd).
- Grim trigger (szigorú büntető stratégia): Az örökharag stratégia egy ismétlődő játékban alkalmazott taktika. Lényege: a játékos kezdetben együttműködő (barátságos), de ha a másik fél valaha is megszegi az együttműködést (pl. egyszer is csal vagy nem kooperál), akkor a stratégiát váltó játékos a végtelenségig a legszigorúbb büntetést alkalmazza ellene (pl. soha többé nem működik együtt, mindig a számára legrosszabbat okozó választ választja). Az elnevezés onnan jön, hogy a megtorlás egy apró “trigger” (ravasz) meghúzására örök időkre “kilő”. A grim trigger stratégia extrém: egyetlen botlás örök haragot von maga után. Ennek hatására viszont – ha elég fontos a jövő – a másik játékos inkább nem csal, mert tudja, hogy utána sosem kap többé együttműködést. Az örökharag-stratégia a folk-tételben is felbukkanó eszköz: segít fenntartani az együttműködést azáltal, hogy súlyos fenyegetéssel tartja sakkban a szereplőket. Viszont hátránya, hogy nem bocsát meg véletlen vagy apró kihágásokat sem, ezért a gyakorlatban durvának tekinthető. Enyhébb büntető stratégiák is léteznek (pl. periódusnyi büntetés aztán visszatérés az együttműködéshez, vagy a tit-for-tat alább), amelyek rugalmasabbak.
- Tit for tat (szemet szemért): Az ismétlődő fogolydilemma híres nyerő stratégiája Anatol Rapoport versenyében. A tit for tat lényege: kooperációval kezd, majd mindig megismétli a másik előző lépését. Tehát ha a másik együttműködött az előző körben, akkor én is együttműködöm a következőben; ha a másik becsapott (defectált), akkor én is defectálok vele szemben a következő alkalommal. Ez egy egyszerű és hatékony reciprokitás-elvű stratégia. Tulajdonságai: kedves (mert sosem kezd ellenségeskedéssel), provokálható (azonnal megbünteti a csalást), megbocsátó (ha a másik visszatér a kooperációhoz, ő is azonnal abbahagyja a büntetést) és nem irigy (nem próbál a másik fölé kerekedni). A tit for tat sok iterált játékban jól szerepel, mert elősegíti a kölcsönös együttműködést, de megvéd a kihasználástól is. Persze vannak helyzetek, amikor finomítani lehet rajta (pl. véletlen zaj esetén egy egyszeri árulást érdemes néha figyelmen kívül hagyni, különben félreértésből bosszúspirál indulhat). A tit-for-tat a közmondásos “ahogy te velem, úgy én veled” stratégiát testesíti meg, és a valós interakciókban az emberi viselkedésre is jellemző.
- Liciteljárások stratégiái (bid shading): Az aukciókban a licitálók stratégiája fontos lehet az optimális kimenetel szempontjából. Az árnyékolt licitálás (bid shading) azt a jelenséget jelenti, amikor egy licitáló szándékosan alacsonyabb ajánlatot tesz, mint amennyit a tárgy valójában ér neki, hogy jobb üzletet csináljon. Például egy második áras aukción (Vickrey-aukció) optimális az őszinte licit (mindenki a valódi értékét mondja), de egy első áras aukción a licitáló nem akarja a teljes értékét megadni, mert akkor nulla haszna marad, ezért árnyékol, azaz a maximum értékénél kevesebbet ajánl, bízva abban, hogy így is nyerhet és pozitív haszna marad. Az árnyékolás mértékét a verseny, a kockázatkerülés és más tényezők befolyásolják. Egy másik példája a stratégiáknak aukcióban a győztes átka elkerülése érdekében tett óvatos licit: mivel ha sokan becslik egy tárgy értékét, a legmagasabb licit nyertese lehet, hogy túlértékelte (ez a winner’s curse), így a licitálók csökkenthetik az ajánlataikat, figyelembe véve, hogy a nyertes várhatóan csalódik.
- Párosítási stratégia (pairing strategy): Bizonyos többjátékos szituációkban alkalmazott taktika, amikor a játékos vagy csoport két résztvevője összefog egy harmadik ellen, vagy párokat alakít ki. Például kerekasztal tárgyalásokon vagy versenyeken a résztvevők stratégiai párosításokkal befolyásolhatják a kimenetelt (pl. erős versenyzők megpróbálhatják elkerülni egymást a döntőig). A “pairing strategy” kifejezés konkrétan nem annyira sztenderd játékelméleti fogalom, inkább azt takarhatja, hogy valaki stratégiaként választ egy másik játékossal való együttműködést a harmadik ellen (divide and conquer). Ezt tetten érhetjük pl. a három ember dilemmájában, ahol két játékos összejátszhat a harmadik ellen ideiglenesen. A párosítási stratégia fontos lehet még koalíciós játékokban, ahol a megfelelő párok kialakítása (matching) dönti el az eredményt (pl. táncpartnerek kiválasztása, piacon vevő-eladó párosítások). Összességében a pairing strategy arra utalhat, hogy a játékos a stratégiáját egy partnerhez igazítva, párban mozgó döntést hoz.
Összefoglalva, a stratégiák vizsgálata megmutatja, hogy a játékosok nem pusztán egyszeri döntéseket hoznak, hanem gyakran tervet alkotnak, reagálnak a másik lépéseire, és komplex taktikai elemeket alkalmaznak. A jó stratégia az adott környezetben figyelembe veszi a játék szerkezetét, a többi játékos céljait és információit, valamint a saját hosszú távú érdekeit.
4. Játékkategóriák
A játékokat számos szempont szerint kategorizálhatjuk. Az alábbiakban áttekintünk néhány fontos játéktípust, amelyek külön fejezeteket alkotnak a játékelméletben, más-más matematikai eszközöket és intuitív megközelítést igényelve.
- Aukciók: Az aukció (licitálás) olyan játékforma, ahol a szereplők egy értékes tárgy vagy jog megszerzéséért versengenek ajánlatok (licit) tétele útján. Az aukciók számtalan formája létezik: angol aukció (nyílt, folyamatosan emelkedő licit, legmagasabb visz), holland aukció (csökkenő ár, első jelentkező nyer), első árú zárt aukció (mindenki egyszer, titkosan licitál, legmagasabb fizet amit ajánlott), második árú (Vickrey-) aukció (titkos ajánlatok, a legmagasabbat tevő nyer, de a második legmagasabb árat fizeti). A licitáló stratégiája függ attól, hogy saját értékét ismeri-e pontosan (privát érték aukció), illetve hogy a többiek értékeihez viszonyítva milyen az információ (közös érték esetén, pl. olajmező értéke). A játékelmélet megmutatja, hogy bizonyos aukciók ekvivalensek és hogy például a Vickrey-aukcióban domináns stratégia az érték pontos megadása, míg az első árú aukciónál bid shading célszerű. Aukciók tervezése (ld. mechanizmustervezés) is fontos: a cél lehet az eladó bevételének maximalizálása vagy a hatékonyság (hogy az kapja, aki a legjobban értékeli).
- Alkufolyamat (bargaining problem): Két vagy több fél tárgyaláson alapuló játéka, ahol egy közös nyereségen osztoznak megállapodás esetén. Az alkuprobléma klasszikus példája, amikor két félnek el kell osztania 1 egységnyi hasznot. Ha megegyeznek, bizonyos felosztást kapnak; ha nincs megállapodás, mindketten kapnak egy fenyegetési értéket (gyakran 0). Nash alkufeladata ennek a modellje, és a Nash-féle alkufeloldás az axiómák alapján alakban ad megoldást (maximalizálva a fenyegetési pont feletti hasznok szorzatát). Eredménye: ha mindkét fél 0-t kap megegyezés hiányában, akkor a fair megoldás a fele-fele osztozás. Az alkuprotokoll is lehet játék: pl. ultimátumjáték (ld. 5. fejezet), vagy Rubinstein-féle alternáló ajánlatos modell, ahol végtelenül felváltva tesznek ajánlatot és a türelmetlenség (diszkontálás) határozza meg a kimenetelt. Az alkufolyamatok játékelmélete segít megérteni, ki milyen erős pozícióban van (pl. akinek jobb az alternatívája vagy türelmesebb, az jobb alkut érhet el).
- Differenciáljáték: A differenciáljátékok a folytonos időbeli, dinamikus stratégiai interakciók modelljei, tipikusan differenciálegyenletekkel leírva. Képzeljünk el két autót egy úton, akik tempót választanak (folytonos kontroll), vagy ragadozó-préda modellt két populációval – ezek differenciálegyenletes viselkedést mutatnak. A differenciáljátékban a játékosok stratégiái időfüggő vezérlőfüggvények, és a játék végeredménye egy dinamikus rendszer pályája. Két híres példa: a pusztító verseny (pursuit-evasion game), ahol egy üldöző próbálja utolérni a menekülőt – itt a Isaacs-féle differenciáljáték segít optimalizálni (pl. rakétairányítás, autós üldözés); másik a halasztott fogyasztás gazdasági modellje (pl. szennyezés vs tisztítás dinamikus játéka). Az ilyen játékoknál a megoldásfogalom általában a Markov-tökéletes egyensúly differenciálegyenletek formájában, és alkalmazzák rá a Pontryagin-féle maximum elvet vagy a Hamilton–Jacobi–Bellman-egyenletet. Előrehaladott téma, de lényegében a kontinuum-időbeli döntések és kontrollfolyamatok játékos változata.
- Globális játék: A globális játékok a hiányos információjú játékok egy speciális osztályát jelentik, melyeket Carlsson és van Damme vezettek be bankpánikok és makroökonómiai koordinációs problémák elemzésére. A globális játékban tipikusan van egy valódi alap (pl. egy bank alapmutatója vagy egy valutaváltási árfolyam), ami a játékosok számára nem teljesen ismert, csak kicsit zajos jeleket kapnak róla. Így alakul ki egy hierarchia: a játékosoknak bizonytalanságuk van a fundamentumról és a többiek észleléséről is. A globális játékok érdekessége, hogy gyakran segítenek kiválasztani egy egyensúlyt olyan játékokban, ahol több Nash-egyensúly is lenne (például bankroham lehet vagy nem, attól függően hiszik-e, hogy mások rohannak). A zajos jel véletlenszerűsége “kihúz” egy egyensúlyt a sok közül, ezáltal egyértelműbb előrejelzést ad. A globális játékok elméletét alkalmazták valutaválságokra, tömegpánikra, támadások időzítésére stb., ahol a játékosok viselkedése attól függ, mit gondolnak a többiek valószínűsíthető lépéséről, ami pedig egy közös alapfüggő koordináció kérdése.
- Tranzitív és intranszitív játékok: A tranzitív kifejezés itt arra utal, hogy a játékosok stratégiái vagy preferenciái között van természetes sorrendiség. Intranszitív játék esetén nincs egyértelmű “erősségi sorrend” a stratégiák között, azaz előfordulhat, hogy stratégia legyőzi -t, legyőzi -t, de viszont legyőzi -t – körkörös dominancia alakul ki. Klasszikus példa a kő-papír-olló, ahol kő veri az ollót, olló veri a papírt, papír veri a követ – egyik sem abszolút legjobb. Az intranszitív játékok gyakran ciklikus stratégiai interakciókat eredményeznek, és nincs egy fix pont, ami dominál. A tranzitív játék ezzel szemben olyan, mint a sakk figurák erőhierarchiája (ha lenne ilyen) – de a sakkban sincs tiszta tranzitivitás, mert a helyzettől függ. Az intranszitivitás fontos még az evolúciós játékokban (pl. háromszínű lizard-spock kiterjesztése RPS-nek), ahol a populáció dinamikusan ciklusozhat. Játékelméleti értelemben a “transitive game” kevésbé használt kifejezés, de a transitive preferences (tranzitív preferenciák) alapfeltevés a racionalitásnál – itt azonban játék kategóriaként valószínűleg a stratégiák körkörös viszonyára utal.
- N-szereplős játék: A játékelmélet kezdetben sokat foglalkozott kétszemélyes (két játékosú) játékokkal, de természetesen léteznek n-személyes játékok, ahol . Ilyenkor a stratégiai elemzés bonyolódik: lehetnek koalíciók, többféle interakció. Két fő kategória: nem kooperatív n-személyes játékok, ahol mindenki saját maga játszik (pl. aukció, közjavak játéka, politikai választás több jelölttel), és kooperatív n-személyes játékok, ahol a hangsúly a koalíciókon és megállapodásokon van (pl. profitmegosztás több cég között). Az n-személyes játékok Nash-egyensúlya ugyanúgy definiált, de a stabilitás kérdése komplexebb (ld. erős Nash, core). Egyszerűen: n-player game annyit jelent, hogy több szereplő van, lehet akár sok száz is (pl. aukciókban). A játékelméleti modellek egy része kifejezetten határesetet is vizsgál (ld. következő pont, nagy játékok).
- Nagy játékok és Poisson-játékok: Amikor a játékosok száma nagyon nagy (pl. tömegjelenségek), a hagyományos Nash-egyensúly definíció alkalmazása és kiszámítása nehézkes lehet. Nagy játék alatt sokszor olyan modellt értünk, ahol hatalmas, sőt a folytonos közelítés hasznos. A mean-field game (átlagmező játék) elméletében a játékosok egy continuumot alkotnak, és mindenki csak a populációs átlag alapján hoz döntést, nem figyel minden egyes egyént. Ez analóg a fizikai átlagmező elmélettel. Poisson-játékok (Roger Myerson vezette be) esetén a játékosok száma maga is bizonytalan, véletlen – tipikusan Poisson-eloszlást követ, azaz a populáció létszáma nem fix, de átlagosan . A nagy Poisson-játék modell jól közelíti a helyzetet, amikor beléphetnek új játékosok, vagy egyedek születnek-halnak (pl. populációs evolúciós játékban), és senki nem számít nagynak (egy-egy játékos hatása elhanyagolható a tömeghez képest). Ilyen modellekben gyakran a szimmetrikus Nash-egyensúlyt vizsgáljuk az átlagos hatások figyelembevételével. A mean-field és Poisson megközelítések egyszerűsítik az egyensúly számítást, és gyakran vezetnek valamilyen differenciálegyenlethez (pl. replicator dynamics nagy populációban). Egy konkrét példa: nagy közjószág játék – sok adófizető dönt, befizeti-e az adót; egyénenként kicsi a hatás, de összességben lesz egy egyensúlyi befizetési arány.
- Potenciáljáték: Olyan speciális nem-kooperatív játék, amelyben létezik egy skálázható “potenciál” függvény, ami minden játékos ösztönzését leképezi. Egy potenciálfüggvény úgy működik, hogy ha bármely játékos egyoldalúan stratégiát vált és ezzel megváltoztatja a saját kifizetését, akkor a potenciálfüggvény értéke is arányosan (vagy monoton) változik. Így a játék egyensúlyai megfelelnek a potenciálfüggvény lokális (vagy globális) optimumainak. A torlódási játék (ld. korábban) tipikusan potenciáljáték: Robert Rosenthal megmutatta, hogy a közös erőforrásos játékoknak van egy potenciáljuk (lényegében a teljes utazási idő például). Másik példa a battle of the sexes átalakítható potenciáljátékká bizonyos paramétereknél. A potenciáljátékok fontosak, mert az egyensúlyra vezető tanulási folyamatok (pl. legjobb válasz dinamika) konvergenciája jobban garantálható – hiszen a potenciál olyan, mint egy “energia” ami csökken a javító lépésekkel. Sok koordinációs játék potenciáljáték. Ha létezik potenciálfüggvény, akkor legalább egy tiszta Nash-egyensúly is létezik (hiszen a véges potenciáljátékban a potenciálnak van maximuma). A potenciálfüggvény lehet pontos potenciál (ahol a saját haszon változása pontosan megegyezik a potenciál változásával), vagy csak általános (ordinal) potenciál, ahol csak irány szerint követi. De mindkettő elegendő a kulcstulajdonságokhoz.
- Ismétlődő játék (repeated game): Olyan játékkategória, ahol egy egyszerűbb alapjáték (stage game) többször megismétlődik egymás után. Az ismétlés lehet véges sokszor vagy végtelenszer (illetve ismeretlen hosszúsággal, ami gyakorlatilag a végtelen ismétlést közelíti, diszkont faktorral). Az iterált játékok a hosszú távú stratégiai interakciók modellezésére alkalmasak, ahol a játékosok reputációt építenek, és a jövőbeli következmények visszahatnak a jelen döntéseire. Az ismétlődő játékokban egészen új egyensúlyok jelenhetnek meg, amik az egyszeri játékban nem voltak lehetségesek. Ennek legismertebb tétele a Folk-tétel (lásd 6. fejezet), mely szerint ha a játékosok elég türelmesek, akkor majdnem bármilyen kifizetés elérhető egyensúlyként a végtelenített játékban, feltéve, hogy egyénileg racionális és megvalósítható. Példa: a fogolydilemma egyszeri játékban defekt-defekt (árul-árul) az egyetlen Nash, de ha sokszor ismételjük és a felek törődnek a jövővel, akkor lehetséges fenntartani a (kooperál, kooperál) kimenetelt is egyensúlyként olyan stratégiákkal, mint a tit for tat vagy grim trigger. Az ismétlődő játékok segítenek megmagyarázni a valós együttműködést, normakövetést, büntetések és jutalmak rendszerét a társadalomban.
- Szűrési játék (screening game): A screening a közgazdasági információs közegben azt jelenti, hogy az információhiányban szenvedő fél próbálja valamilyen mechanizmussal kiszűrni (kiszűrés = screening) a másik fél típusát vagy információját. Klasszikus példa a munkaadók és munkavállalók esete: a munkáltató nem tudja a munkás termelékenységét biztosan, ezért olyan ajánlatmenüt (pl. bér-kontraktusokat) kínál, amiből a különböző típusú munkások önszelekcióval felfedik magukat. A screening game tipikusan olyan főnök–ügynök (principal–agent) játék, ahol a főnök lép először és szerződéseket ajánl, az ügynök pedig választ (így felfedve a típusát a választás révén). A szűrési játék stratégiája a főnök részéről egy mechanizmus kitalálása (ld. mechanizmustervezés), az ügynök részéről pedig a választás. Ide tartozik például a biztosítási piacon a különböző önrész-díj kombinációk ajánlása, melyből az ügyfél kiválasztja a neki valót, és ezzel jelzi a kockázati típusát (magas kockázatú ügyfél inkább magas díj–alacsony önrészt választ, stb.). A screening arra utal, hogy az információs aszimmetriát a rosszabb helyzetben lévő fél kezdeményezésével próbálják enyhíteni.
- Jelzési játék (signaling game): A jelzés (signaling) játékelméleti modellben az információval rendelkező fél aktív lépést tesz, hogy közöljön valamit magáról, és ezzel befolyásolja a másik fél hiteit. A jelzési játék tipikusan kétlépéses: először az informált játékos (pl. álláskereső, aki tudja a saját képességeit) küld egy jelet (pl. iskolai diploma megszerzése), majd a nem informált játékos (pl. munkaadó) megfigyeli a jelet és dönt (pl. felveszi-e és mennyi bérrel). A jelzés költséges lehet, és ennek a költségnek a differenciáltsága biztosítja a szétválasztó egyensúly lehetőségét: ha a magas képességű egyénnek könnyebb diplomát szerezni, mint az alacsony képességűnek, akkor a diploma jelként működhet, amivel a jó típus megkülönbözteti magát (a gyenge nem éri meg neki hamisan jelzést adni). A jelzési játékok egyensúlyai lehetnek szétválasztóak (különböző típusok különböző jelet adnak) vagy meddők (pooling), amikor mindenki ugyanazt jelzi és a jel nem hordoz információt. A jelzési játékok elemzése a Bayes-féle tökéletes egyensúly keretében történik, figyelembe véve a hiedelmek frissítését a megfigyelt jel alapján. Példák: oktatás (jelzés a munkaerőpiacon), páva farktollának mérete (mint evolúciós biológiai jelzés az egészségről), start-up cég drága iroda vagy autó (jelzés a befektetők felé a bizalomról), stb.
- Strictly determined game (szigorúan determinált játék): Ez a kifejezés általában olyan kétszemélyes, zéró összegű játékokra utal, amelyekben van egy tiszta stratégiai Nash-egyensúly, azaz létezik egy cella a kifizetési mátrixban, ami mindkét fél számára egyensúly. Ezt a klasszikus játékelméletben néha úgy mondják, a játéknak van egy “nyeregpontja” (saddle point). “Strictly determined” annyit tesz, hogy a minimax (a sorok minimaximája és az oszlopok maximinkje) egy pontban találkozik, és ott van a játék értéke. Például egy kő-papír-olló nincs szigorúan determinálva (mert keverni kell), de egy egyszerű domináns stratégia esetén vagy egy olyan táblázatnál, ahol egy sor mindig jobb mint a többi és egy oszlop mindig rosszabb a többinél, ott van nyereg. A Zermelo-típusú játékok (pl. sakk) is determináltak, de ott gyakran kevert stratégiás optimum van csak (pl. sakkban valószínű döntetlen optimálisan). A “szigorúan determinált” kifejezést leggyakrabban régi szövegek használják a vegyes stratégiát nem igénylő zero-sum játékokra.
- Sztochasztikus játék: A sztochasztikus játék (vagy Markov-játék) olyan többlépéses játék, ahol a játék állapota valamilyen markov-lánc szerint változik, a játékosok döntéseinek és a véletlennek a hatására. Lényegében a Markov-döntési folyamatok (MDP) többjátékos megfelelője. Minden periódusban a játék valamely állapotban van; a játékosok egyidejűleg vagy felváltva akciókat választanak; ez meghatározza az állapotkövetkező eloszlását (a rendszer véletlen átmenetei), és a játékosok kifizetéseket kapnak. A játék végtelen ideig folytatódhat diszkontált kifizetésekkel, vagy véges számú lépés is lehet. A sztochasztikus játékok egyensúlyi fogalma tipikusan a Markov-tökéletes egyensúly (ld. előző fejezet), ami azt jelenti, hogy az egyensúlyi stratégia csak az aktuális állapottól függ. Ezek a modellek rendkívül fontosak olyan területeken, mint a gazdasági versengések időben (pl. dinamikus oligopólium, ahol a cég piaci részesedés az állapot), biológiai versengés (állatpopulációk harca területért generációkon át), vagy reinforcement learning többügynökös környezetben. A sztochasztikus játékokra a megoldás gyakran a dinamikus programozás és fixpont-keresés kombinációja. A Zermelo-féle játékok kibővítése is felfogható sztochasztikus játékként, ahol a véletlen lépések a kockadobások.
- Szimmetrikus játék: Egy játék szimmetrikus, ha a játékosok lényegében azonos pozícióban vannak – azaz a kifizetési függvények a játékosok permutációjára szimmetrikusak. Egyszerűbben: mindenki számára ugyanaz a “játék” van, csak éppen más szerepben. Példa: a fogolydilemma szimmetrikus, mert mindkét játékosnak ugyanaz a kifizetési struktúrája (csak felcserélődnek a szerepek, de strukturálisan azonos). Ugyanígy a koordinációs játékok tipikusan szimmetrikusak, vagy a Battle of the Sexes már nem szimmetrikus (ott különböző preferenciáik vannak). A szimmetrikus egyensúly pedig olyan egyensúly, ahol minden játékos ugyanazt a stratégiát játssza (ez nyilván csak szimmetrikus játékban értelmezhető relevánsan). Sokszor a játékelméleti elemzések szimmetriát feltételeznek a játékosokról, mert ez leegyszerűsíti a számolást és gyakran indokolt (pl. azonos méretű cégek versenye, azonos stratégiakészletek). Az evolúciós játékelméletben tipikusan szimmetrikus játékokat vizsgálunk, hiszen a “fajon belüli” interakciók ilyenek. Fontos: a szimmetria nem feltétlen jelenti, hogy minden egyensúlyban ugyanazt is játsszák, de gyakori, hogy a fókusz az azonos stratégiájú profilokon van.
- Zéró összegű játék: Ezt már említettük feljebb a 1. fejezetben: olyan játék, ahol az egyik játékos nyeresége a másik vesztesége, így a kifizetések összege állandó (gyakran 0). A zéró összeg a konfliktusos játékok szélsőséges típusa, ide tartoznak a tiszta versenyhelyzetek, mint a sportok eredménye (ha csak nyerés/vesztés), a sakk, a póker (pénzügyi értelemben, ha egy nyer annyit a másik veszít), vagy katonai-stratégiai játékok. A zéró összegű játékok különösen jól kidolgozottak a játékelméletben, mivel John von Neumann 1928-as minimax tétele pont ezekről szólt: minden véges kétszemélyes zéró összegű játékban van egy vegyes stratégiás Nash-egyensúly, és a felek egyensúlyban lévő várható kifizetése a “játék értéke” (az egyiknek , a másiknak ). Az ilyen játékok megoldása visszavezethető egy lineáris programozási feladatra (a minimax tétel miatt). Bár a valós helyzetek ritkán tisztán zéró összegűek, sokszor a versenyt leegyszerűsítve így modellezik először, majd később figyelembe veszik a nem nulla összeget is. A zéró összegű játékban a felek érdekei teljesen ellentétesek, így nincs lehetőség együttműködésre a közös haszon növelésére – az egyetlen kérdés, hogy ki hogyan maximalizálja a sajátját a másik rovására. Emiatt a stratégiai egyensúly is “éles”: a másik fél várható kifizetésének csökkentése egyenlő a saját növelésével.
5. Klasszikus példajátékok
Ebben a fejezetben áttekintünk néhány híres és tanulságos játékmodellt. Ezek a játékok gyakran leegyszerűsített szituációk, amelyek mégis rámutatnak fontos stratégiai dilemmákra vagy jelenségekre. A példa-játékok segítenek a fogalmak megértésében is.
- Fogolydilemma: Két bűnözőt külön kihallgatnak, és mindkettejüknek felajánlják: ha vall a társára (és az nem vall), akkor ő szabadul (jutalom), a másik hosszú börtönt kap (balek helyzet). Ha mindketten vallanak, közepes büntetést kapnak; ha egyik sem vall, kis büntetéssel megússzák. A klasszikus kifizetésstruktúra (évekre ítélve, negatív számokkal) például: ha egyik sem vall: év; ha A vall, B hallgat: ; ha A hallgat, B vall: ; ha mindkettő vall: . A fenti táblázatban (temptation) jelenti a csábítást a vallomásra, (reward) a kölcsönös együttműködés “jutalmát”, (penalty) a kölcsönös árulás büntetését, (sucker) pedig a baleknak járó legrosszabb kimenetelt. A fogolydilemma lényege: mindkét félnek domináns stratégiája a vallomástétel (árulás), mert ezzel minden esetben kevesebbet ül, függetlenül a másiktól. Így a Nash-egyensúly a (vall, vall) kimenet, ami éveket jelent mindkettőnek. Ez paradox módon rosszabb mindkettőjüknek, mint ha együtt hallgattak volna (csak idejű büntetés). A játék megmutatja a kooperáció nehézségét: az egyéni racionalitás kollektív irracionalitáshoz vezet. A fogolydilemma számtalan helyzet metaforája a közgazdaságtanban és a társadalomtudományban: pl. fegyverkezési verseny (két ország is jobban járna, ha egyik sem fegyverkezik, de mindkettőnek a fegyverkezés domináns), kartell széthullása (mindegyik cégnek csábító csalni és többet termelni), környezetszennyezés (minden ország inkább kibocsát, mint visszafog, bár összességében rossz). Az ismétlődő fogolydilemma (ld. 4. fejezet) azonban lehetőséget ad az együttműködés fenntartására megfelelő stratégiákkal (mint a tit for tat). A fogolydilemma népszerűsége miatt a köznyelvben is használják bármilyen helyzetre, ahol két fél rövid távú önérdekkövetése hosszú távon mindkettőnek káros.
- Koordinációs játék: Olyan játék, ahol a játékosok érdeke részben egybeesik: a lényeg megtalálni egy közös, összehangolt cselekvést. A koordinációs játékoknak gyakran több egyensúlya van, és a kihívás az, hogy a játékosok “összhangba kerüljenek” ugyanazzal az egyensúllyal. Egyszerű példa: két embernek külön kell választania, hogy az utcán jobb oldalon vagy bal oldalon menjen. Mindkettőnek az a legjobb, ha ugyanazt választják (különben összeütköznek). Két egyensúly van: mindketten balra tartanak, vagy mindketten jobbra – bármelyik jó, de valahogy ki kell választani. Komolyabb példa a Battle of the Sexes: egy pár estére programot választ, a fiú a focimeccset kedveli, a lány a balettet. Ha külön válnak, az mindkettőnek rossz; ha együtt mennek, az jobb, de mindkettő a saját preferenciáját preferálja. Két Nash-egyensúly van: mindketten a meccsre mennek, vagy mindketten a balettre – mindkét eset koordinált, de egyik az egyiknek jobb, a másik a másiknak. Itt a stratégiai dilemma az, hogy hogyan döntenek – lehetséges megoldás pl. hogy valamelyikük enged, vagy valamilyen randomizáció (kevert egyensúly is van, de az ex-ante). Koordinációs játék a Stag Hunt (Szarvasvadászat) is: két vadász dönt, hogy együtt vadásszanak szarvasra (ami nagy zsákmány, de csak együtt sikerülhet) vagy külön-külön megelégedjenek egy nyúllal (kisebb zsákmány, egyénileg is lehet). Két egyensúly: mindketten a szarvasra mennek (magas kifizetés mindkettőnek), vagy mindkettő nyulazik (alacsonyabb kifizetés, de biztosabb). Ez a játék azt modellezi, hogy a bizalom és kockázat hogyan hat a kooperációra: a szarvas-egyensúly Pareto-jobb lenne, de ha nem bízik meg a másikban az ember, lehet a nyúl-egyensúlyban ragadnak, ami biztonságosabb. A koordinációs játékok gyakoriak: technológiai szabványok (mindenki ugyanazt a rendszert használja-e), nyelvválasztás, közlekedési szabályok – mind koordináció kérdése.
- Chicken (Gyáva nyúl játék): Két autó száguld egymás felé az úton (csirke játék néven is ismert). Aki félrerántja a kormányt, az a “gyáva nyúl”, a másik nyerőnek érzi magát; ha egyik sem rántja félre, frontális ütközés – a lehető legrosszabb mindkettőnek. Kifizetésileg: ha A kitér, B nem: A számára nagyon rossz (gyávaság szégyene), B-nek nagyon jó (nyertes), és fordítva; ha mindkettő kitér: mindkettőnek közepes (nem nyer, de nincs halál); ha egyik sem: mindkettőnek szörnyű. Ez a játék a konfliktus és blöff modellezésére szolgál. Két aszimmetrikus Nash-egyensúly van: az egyik fél kitér, a másik nem (bármelyik lehet a nyertes). Tehát a játékosoknak nem érdekük egyszerre menőzni (az katasztrófa), sem egyszerre meghátrálni (az lehetne jobb, de akkor egyikük javíthatna a helyzetén ha a másik hátrál csak). A Chicken játék a hidegháborús nukleáris patthelyzet tipikus modellje: egyik ország sem akar engedni (kitérni), de ha mindketten végigviszik a fenyegetést, abból katasztrófa (nukleáris háború) lesz. Így a stratégia sokszor az volt, hogy megpróbáltak minél elszántabbnak látszani, sőt elkötelezni magukat (pl. nyilvánvalóvá tenni, hogy nem rántják el a kormányt – ezáltal a másikat kényszerítik kitérésre). A chicken játékban fellép a veszélyes koordináció: az ideális kimenet egy aszimmetrikus koordináció (egyik kitér, másik nem), de ki legyen az? Tárgyalásokban, versengésekben sokszor hasonló helyzet: ki engedjen? A “gyáva nyúl” kifejezés is utal, hogy senki sem akar gyávának tűnni. A valóságban a randomizált vegyes egyensúly (bizonyos eséllyel kitérni) nem reális; helyette a felek megpróbálják meggyőzni a másikat, hogy ők biztos nem térnek ki (ld. fenyegetés hitelessége).
- Centipede játék: Ez egy többlépéses játék, amelyben két játékos felváltva dönt egy növekvő nyereményhalom kapcsán. A játék pl. úgy néz ki, hogy van egy asztalon lévő pénzösszeg, ami minden körben növekszik. Az aktuális játékos dönthet: elveszi a nagyobbik részt a halomból, a maradékot hagyva a másiknak és ezzel vége a játéknak; vagy továbbadja a lehetőséget a másiknak (nem vesz el semmit most), ezáltal a halom tovább nő, és a másik kap döntési helyzetet. A játék előre rögzített lépésszámú (vagy valószínűséggel véget ér), például 4 kör után automatikusan véget ér és mindkettő kap valami kis összeget. A centipede (százlábú) játék azért híres, mert a visszafelé indukció azt sugallja, hogy az első lépésben érdemes leállítani a játékot (felvenni a pénzt), hiszen a legvégén mindenképp az utolsó játékos felvenné, tehát az előző lépésben a másik ezt belátva inkább ő venné fel, és így vissza az elejéig – tehát a szubjáték-tökéletes egyensúlyban az első játékos azonnal véget vet. Viszont ez az egyensúly nem Pareto-hatékony: mindkét játékos sokkal többet szerezne, ha mondjuk egészen a majdnem végéig együttműködve továbbadogatnának, és csak a legvégén vennék ki. Kísérletekben az emberek gyakran tovább játszanak egy ideig, nem azonnal csapják le – ami arra utal, hogy a valós viselkedés nem felel meg a tiszta racionális visszafelé indukciónak (lehet benne reciprokitás, bizalom, vagy remény, hogy a másik is kooperál egy darabig). A centipede játék rávilágít a fedezeti gondolkodásra és a türelmetlenségre, illetve a stratégiai megbízhatóság problémájára: minél tovább játszod, annál nagyobb a nyereség ha a másik is folytatja, de annál nagyobb a kockázat, hogy a másik lecsapja előtted.
- Battle of the Sexes (Nemek harca): Már röviden érintettük a koordinációs játéknál. Két szereplő (hagyományosan egy pár: ő és ő) programot választ: koncert vagy mozi (vagy foci vs balett). Mindkettő jobban szeret együtt lenni, mint külön programon, de az egyik a koncertet preferálja, a másik a mozit. Kifizetés például: ha koncertre mennek: fiúnak 3, lánynak 2 (fiú kedvence); ha moziba: fiúnak 2, lánynak 3 (lány kedvence); ha külön válnak: 0,0. Itt két Nash-egyensúly van: (koncert, koncert) és (mozi, mozi). Az elsőnél a fiú boldogabb, a másodiknál a lány, de mindkettő jobb, mint a különválás. Van kevert egyensúly is, ahol valószínűségekkel választanak (találomra), de az ex-ante is rosszabb. A dilemma: hogyan egyezzenek meg? Valós pároknál általában kommunikációval rendeződik (pl. megbeszélik), de a játék elméleti formájában gyakran emlegetik, hogy a felek motivációi eltérőek lehetnek: mindkettő a saját preferált egyensúlyt preferálja, de inkább bármi közös, mint külön. Ez a játék megmutatja a koordináció és konfliktus keveredését: van közös érdeke a játékosoknak (együtt lenni), és van érdekellentétük (melyik program). Az ilyen szituációkban sokat számít a kommunikáció, kultúrális normák (pl. felváltva az egyik dönt, aztán a másik), vagy valamilyen fókuszpont (pl. hagyományosan lehet, hogy a férfi dönt? – nem feltétlen igazságos, de létezhet normaként). A “nemek harca” elnevezés persze csak példa; sok hasonló helyzet van: pl. két cégnek közös szabványt kéne választania (mindkettő másikat preferál, de mindenképp jobb egy szabvány, mint kettő külön).
- Stag Hunt (Szarvasvadászat): Szintén említettük: a két vadász dilemmája, kooperatív vs biztonsági opció. A Szarvasvadászat történet (Jean-Jacques Rousseau filozófiai példája) szerint két vadász megbeszéli, hogy együtt elejtenek egy szarvast (amit egyedül nem lehet, mert kell egymás segítsége). Ám jön egy nyúl, amit egyedül is el lehet kapni. Ha az egyik vadász a nyulat választja, ő biztosan szerez valami kis eledelt, de a másik hoppon marad, mert egyedül már nem tudja a szarvast becserkészni. Tehát a játék kifizetése: ha mindketten a szarvast próbálják és maradnak: nagy jutalom mindkettőnek; ha egyik elcsábul egy nyúlra, a másik üres kézzel marad, a nyulat fogó kap egy kisebb jutalmat; ha mindketten nyulat kergetnek, mindketten közepes jutalmat szereznek (két nyulat). Két egyensúly van: mindketten a “nagyratörő” stratégiát választják (szarvasra mennek – ez Pareto-optimális, de sérülékeny), vagy mindketten a biztonsági stratégiát választják (nyúlra mennek – kisebb, de biztos). Az érdekek itt teljesen egybeesnek (szimmetrikus, közös preferencia, hisz mindketten jobban járnának szarvassal), de a rizikó miatt nehéz lehet a kooperáció: ha nem bízom abban, hogy a másik kitart, akkor jobb nekem is a biztos nyúl. A szarvasvadászat a bizalmi együttműködés archetípusa: mindkét félnek az együttműködés a legjobb, de csak akkor, ha a másik is azt csinálja; a félelem, hogy a másik kihátrál (vagy csábítja a kis nyereség), meggátolhatja a nagyobb jó elérését. Modern példák: csapatprojektek – ha mindenki beleteszi a munkát, nagy siker lesz, de ha azt hiszed a többiek nem fognak dolgozni, lehet inkább te sem erőlteted, így egy középszerű eredmény lesz mindenkinek. A szarvasvadászatnál a “rossz” egyensúly a nyuszi-egyensúly stabil, de nem hatékony; a “jó” egyensúly a szarvas elejtése, ami kockázatos. A játékelmélet azt sugallja, hogy a kommunikáció, ismétlés vagy a harmadik fél garanciái segíthetnek a jobb egyensúly kiválasztásában.
- Ultimátumjáték: Kétszereplős alkufolyamat egyszerűsítve. Az ultimátumjátékban az egyik játékos (ajánlattevő) kap mondjuk 100 dollárt, és fel kell ajánlania belőle valamennyit a másik játékosnak (megtartva a többit). A másik játékos (elfogadó) dönt: elfogadja az ajánlatot, ez esetben a pénz a felosztott arányban megy, vagy elutasítja, ez esetben mindketten 0-t kapnak. Racionális, pénzmaximalizáló elfogadó bármilyen összeget elfogadna, hisz az jobb a nullánál; ezt tudva a racionális ajánlattevő a lehető legkevesebb pénzt adná (1 dollárt mondjuk). Tehát a szubjáték-tökéletes Nash-egyensúly a (99,1) felosztás (vagy 100,0, ha 0-val is megelégszik az elfogadó – de általában feltesszük 0-nál még visszautasít, mondjuk büszkeségből is). Kísérletekben viszont az emberek jellemzően nem így játszanak: a tipikus ajánlat 30-40% a másiknak, és az 20% alatti ajánlatokat gyakran elutasítják (még ha nekik is 0 lesz akkor). Ez a méltányosság és büntetés szerepét mutatja a valóságban. Az ultimátumjáték megmutatja, hogy az emberek törődnek a méltányos elosztással, és akár saját kárukra is megbüntetik a szerintük túl kapzsi partnert (elutasítják az alacsony ajánlatot, hogy a másik se kapjon semmit). Stratégiailag a játék csupán egyszeri lépésből áll, de rengeteg tanulságot ad: a tárgyalások során az alku erejét az adja, ki mennyire van rászorulva a megegyezésre; az ultimátumot adó kezében van a döntés, de az elfogadó “vétójoga” erős érv. Az is látszik, hogy kulturális különbségek vannak – különböző társadalmakban az átlagos ajánlat és elfogadási küszöb eltér. A játékelmélet kiterjesztései: pl. ha az ajánlattevő is tudja, hogy az elfogadó irracionálisan is megbüntethet, akkor előre többet fog ajánlani. Ez rokon a mindennapi alkukkal: nem mindig a teljes racionalitás dominál, a másik fél haragja vagy elégedettsége is faktorrá válik.
- Kő-papír-olló: Gyerekjáték, de a játékelméletben a ciklikus intranszitív stratégiai helyzet példája. Kő üti az ollót, olló vágja a papírt, papír csomagolja a követ. Egyik stratégia sem dominál, és nincs tiszta Nash-egyensúly (hiszen bármely tiszta választásra a másiknak van ellen-stratégiája, ami nyer). A játéknak egyensúlya kevert stratégiában van: mindhárom opció 1/3 valószínűséggel. Ez a vegyes egyensúly garantálja, hogy a várható nyereség 0 lesz (zéró összegű játék). A kő-papír-olló nem csak játék: sok versengés hasonlíthat ehhez, ahol stratégiák körkörösen ellenpontozzák egymást. Például a spock-lagarto kiegészítés (ahol 5 elemes kört alkotnak a választások) még bonyolultabb intranszitivitást ad, de alapvetően az is kevert stratégiát kíván. A kő-papír-olló fontos tanulsága: a randomizáció lehet optimális – ha kiszámítható vagy, a másik kihasznál; ha képes vagy véletlenszerűen játszani, akkor nem adsz fogást. Ezt használják a sportokban (pl. tizenegyes rúgásnál a játékos random dönt bal vagy jobb sarok mellett), pénzfeldobás-szerűen. Tehát a kő-papír-olló megmutatja a kevert Nash jelentőségét.
- Közjavak és közlegelők (Public Goods Game): A közjószág játék több szereplős szituáció, ahol mindenki dönt, hogy hozzájárul-e valamilyen közös erőforrás finanszírozásához, amiből mindenki profitál. Például 10 ember, mindegyiknek van 10 dollárja; dönthet, mennyit dob be a közös kasszába. A közös kassza összege megduplázódik és egyenlően oszlik szét. Az egyéni racionalitás azt diktálja, hogy ne fizess (free rider legyél), mert a többiek befizetéséből te is részesülsz, a sajátodból meg nem nyersz arányosan eleget. A közös optimum viszont az lenne, ha mindenki betenné mind a 10-et, így 100 lesz, duplázva 200, fejenként 20 jön vissza – mindenki megduplázta a pénzét. De ha valaki kibújik (0-t fizet, a többiek 10-et), akkor ő 10-et tart + kap 18-at a visszaosztásból = 28, míg a többiek 18-at. Így egy freerider jobban jár, de ha mindenki freerider, senki se fizet, akkor nincs közjavak, mindenki marad a 10-nél. Tehát a közjószág játék a fogolydilemma több szereplős analógja: együttműködés vs potyázás kérdése. A valós kísérletek azt mutatják, hogy kezdetben az emberek elég sokat hozzájárulnak, de idővel csökken, főleg ha látják, hogy mások potyáznak (büntetés nélkül). Viszont ha van mód büntetni a potyázókat (még költséggel is), a hozzájárulási szint magas maradhat. Ez a játék rendkívül fontos a közgazdaságtanban: adófizetés, kollektív cselekvés, klímavédelem – mind hasonló problémák. A “közlegelők tragédiája” (Tragedy of the Commons) egy rokona: közös legelőn mindenki ingyen legelteti a teheneit, de ha túl sokan teszik, lelegelik. Minden gazdának egy tehénnel több kicsit hasznos (neki plusz nyereség), a legelőromlás költsége pedig megoszlik – így mindenki hajt bele, míg tönkre nem megy a legelő. A megoldás: szabályozás, kvóták, közösségi megegyezés, stb. A játékelmélet felhívja a figyelmet a kollektív akció problémákra, és segít tervezni mechanizmusokat (ld. mechanizmustervezés), hogy ösztönözzék a hozzájárulást (pl. adórendszer, büntetések, morális ösztönzők).
- Dolláraukció: Különös játék, Martin Shubik alkotta meg az eszkaláció illusztrálására. Egy dollárt árverezünk el, de az aukció szabálya: a legmagasabb ajánlat nyer és fizeti az összegét, DE a második legmagasabb ajánlat tevője is fizeti az általa ajánlott összeget, cserébe nem kap semmit. Kezdetben mindenki szívesen licitál pár centet egy dollárért. Ám a licit vége felé mondjuk két játékos marad: egyik 80 centet, másik 81-et ajánlott. Az vezet 81-gyel, de a 80 centes tudja: ha veszít, 80 centet fizet és kap semmit, ha ráígér mondjuk 85 centre és nyer, akkor fizet 85-et, kap 100-at, nettó +15. Így ráígér. A másik se akar vesztes maradni, hisz ha 85 vs 81, a 81-es fizet 81-et és kap semmit, míg ha ráígér 90-re és nyer, fizet 90-et, kap 100-at, nettó +10, még mindig jobb mint -81. És így tovább. Végül könnyen 1 dollár fölé mehet a licit: pl. 1.10$ vs 1.05$ – a második se akar bukni 1.05$-t, inkább licitál 1.20$ hogy nyerjen, így “csak” 20 centet bukjon a 1.20 vs 1.00 dolláron. A vége lehet, hogy a dollárt 2 dollárért “nyeri” valaki, a másik fizet 1.99$-t második díjként. Ez a játék extrém példája az eszkalációs spirálnak: a résztvevők a korábbi befektetéseik védelmében egyre irracionálisabb további befektetéseket tesznek, hogy minimalizálják a veszteséget, de ezzel csak még jobban belesodródnak. Hasonló mechanizmus játszik szerepet pl. bizonyos aukcióknál (amikor licitálók túlmennek egy tárgy valós értékén), vagy hidegháború fegyverkezésben (nem lehet visszavonulni, mert az addigi erőfeszítés “kárba menne”), vagy akár egy drága pereskedés folytatásában. A dolláraukció is mutatja, hogy a versengés csapdába ejthet, és néha a legjobb lépés a kilépés lenne, de a játékszabályok ezt nehezítik (ld. nyilvános aukció: nem akarsz vesztes lenni, presztízs, stb.). Shubik ezzel illusztrálta a nem racionális eredményeket racionális lépések sorozatából.
- Háború és kopás (War of Attrition): Két fél verseng valamiért (pl. territórium, árverés, párkeresés), és a “licit” itt az idő vagy erőforrás feláldozása: mindketten kitartanak, míg egyik fel nem adja. A felőrlési háború modelljében mindkét játékos egy idő -ig bírja, utána feladja, akinek nagyobb -je volt (tovább bírta) nyer, de a költséget (mondjuk egység per idő) mindkettő fizeti a kitartásáért. Egy klasszikus példa az állatvilágból: két állat küzd egy területért, mindkettőnek a terület értéke . Ha egyik hamarabb megfutamodik, a másik nyer (kap , a vesztes 0). Ha mindketten ideig kitartanak, addig költséget viselnek (energia, sérülés kockázata). A játékelmélet azt mutatja, hogy egy vegyes stratégiai egyensúly lehet, ahol mindegyik egy eloszlás szerint határozza meg, meddig megy el (véletlenszerű feladás időpontja eloszlással). A felőrlési háború különösen érdekes, mert nagyon pazarló: a licit összköltsége tipikusan magasabb, mint . Csak relatív előny számít: ki bírja tovább. Ilyen helyzet emberi példában: két cég versenyez, ki bírja tovább veszteséggel tartani alacsonyan az árat, hogy a másik csődbe menjen (ld. árháború, piaci belépési korlát). Vagy hatalmi harcok: ki adja fel először. A war of attrition modell a James Dean-féle Chicken extrém változata, folyamatos idővel. A győzelem itt is arról szól, ki türelmesebb, kitartóbb, vagy kinek nagyobb a nyeremény értéke (ha az egyiknek nagyobb, ő tovább fogja húzni, mert megéri neki). Az egyensúlyi stratégia általában az, hogy a feladás időpontját bizonyos eloszlással választják, némiképp úgy, hogy a másik várható viselkedéséhez igazodik. Például ha azonos, akkor egy exponenciális eloszlásféle stratégiával mehetnek, aminek van egy elég érdekes tulajdonsága: a várható költség ugyanannyi, mint , így a nyereség 0 várhatóan – hasonlóan a dolláraukcióhoz, senki sem jár jól átlagban, de bármelyikük reménykedhet, hogy ő lesz a szerencsés, aki a másikat előbb felőrli. Ez a modellek tragédiája: a verseny költséges, olykor a kooperatív megállapodás (pl. felosztani a területet) mindkettőnek jobb lenne, de nem tudnak megegyezni, mert mindkettő nyerni akar.
- Go és sakk: A go és sakk klasszikus táblajátékok, amiket a játékelmélet is tanulmányoz mint két személyes, zéró összegű, tökéletes információjú kombinatorikus játékokat. Ezeknél a játékoknál a Zermelo-tétel alapján elméletileg igaz, hogy van meghatározott eredmény tökéletes játék esetén (első nyer, második nyer, vagy döntetlen – bár a go-ban nincs döntetlen szabályosan). A sakk komplexitása olyan nagy, hogy máig nem ismert, mi a játék “megoldása” (bár sokan sejtik, hogy döntetlen tökéletes játékkal). A dámajátékot (angol checkers) számítógéppel “megoldották” – kiderült, döntetlen, ha mindkét fél hibátlanul játszik. A go hatalmas állapottérrel bír (19x19-es tábla), azt ember felettien játsszák modern AI rendszerek, de megoldva (teljesen kiértékelve) nincs, és valószínű még sokáig nem lesz. Ezek a játékok jó példák a játékfa robbanására – bár elvileg visszafelé indukcióval megoldható lenne (Zermelo algoritmusa), gyakorlatban ez lehetetlen a méret miatt, ezért heurisztikák, stratégiák kellenek. Megoldott játék például a 4x4-es sakk vagy a tic-tac-toe (amőba) – utóbbinál könnyen igazolható, hogy döntetlen lesz, ha senki sem hibázik. A go-nak kisebb verzióit (pl. 5x5) talán megoldották. A játékkomplexitás (ld. 1. fejezet) tipikusan a sakk és go esetén: a sakk játékfa-komplexitása ~10^123, a go-é ~10^360, ami elképesztő. Komputációs játékelmélet foglalkozik pl. azzal, hogy a sakk-szerű játékok NP-nehéz problémák (sőt EXPTIME). Az utóbbi évek AI sikerei (AlphaZero) gyakorlati értelemben “megoldották” annyiban, hogy ember felett játszanak, de nem adtak bizonyítékot a játék elméleti kimenetelére. Játékelméleti szempontból a sakk és go determinált, véges, tökéletes információjú játék – tehát a Zermelo-elv érvényes rájuk. A sakkban van döntetlen lehetőség, tehát valószínűleg döntetlen az optimális. A go-ban nincs döntetlen, így ott vagy fekete vagy fehér nyer elvileg. A profi játékosok a játékelméleti fogalmakat (mint stratégia, dominancia, információ) implicit használják. A fészekrakó-elv (strategy-stealing argument) pont a go-nál van egy híres sejtés: az első lépés előnye van, és stratégia-lopási érvvel bizonyítható, hogy a második játékosnak nem lehet garantált nyerő stratégiája, ergo vagy döntetlen (ami go-ban nincs) vagy első nyer – tehát feltehetően fekete (első) mindig nyerhetne, ha tökéletesen játszik.
(Természetesen számos egyéb híres játékmodell létezik – pl. Matching pennies (fej vagy írás, tisztán antagonisztikus), Tragédia a közlegelőnél (közös erőforrás túlhasználása), Széptevő és kemény legény (Hawk-Dove variáns), stb. A fenti példák azonban a legismertebbek és jól szemléltetik a különböző jellegű szituációkat.)
6. Fontos tételek
A játékelmélet fejlődését számos alapvető tétel és elméleti eredmény jelzi, melyek biztosítanak bizonyos feltételek mellett létezést, jellegzetességeket, vagy épp korlátokat. Itt összefoglalunk néhány meghatározó tételt röviden:
- Nash-tétel (Nash-egyensúly létezése): John Forbes Nash 1950-ben bizonyította be, hogy minden véges játékban létezik legalább egy Nash-egyensúly, ha megengedjük a kevert stratégiákat. Ez a tétel a rögzítési pont tételek (Brouwer) alkalmazásán alapul: a legjobb válasz függvények kompaktra való folytonossága biztosít egy fixpontot. A tétel jelentősége óriási: még a bonyolult stratégiai helyzetekben is garantált, hogy van önmagát meg nem cáfoló (stabil) viselkedés-profil. Ugyanakkor a tétel nem garantálja, hogy az egyensúly egyedi vagy épp kívánatos – csak a puszta létezést. Mégis, ez a játékelmélet alaptétele, “a Nash-egyensúly létezik”.
- Minimax tétel: John von Neumann 1928-ban bizonyította a minimax tételet, ami kimondja, hogy minden véges, két személyes, zéró összegű játékban a maximális minimális nyereség egyenlő a minimális maximális veszteséggel. Egyszerűbben: létezik egy stratégiaprofil (kevert stratégiák), melyre igaz, hogy a játékos A számára biztosítható érték = játékos B számára biztosítható érték = (a játék értéke). Ez azt jelenti, hogy mindkét fél rendelkezik optimális vegyes stratégiával, és a játék kimenetele ellensúlyozható – nincs “második szereplő előnye”. A minimax tétel a lineáris programozás erős dualitásának speciális esete is. Ez a tétel megalapozta a modern döntéselméletet és játékelméletet, és utat nyitott a Nash-egyensúly általánosabb fogalmának (mert a zéró összegű játéknál a minimax egyensúly Nash-egyensúly is). Például a kő-papír-ollóban a minimax érték 0, és a stratégia (1/3,1/3,1/3) mindkét fél számára.
- Zermelo tétele: Ernst Zermelo 1913-ban (még a formális játékelmélet előtt) bizonyított egy tételt a sakkjáték analízisére, ami az első eredmények egyike a játékelméletben. Zermelo tétele kimondja, hogy bármely véges, kétszemélyes, teljes információjú, váltakozó lépésű, nem döntetlennel végződő játékban igaz: vagy az első játékosnak van olyan stratégiája, amivel biztosan nyer, vagy a másodiknak van olyan stratégiája, amivel biztosan nyer, vagy (ha megengedjük a döntetlent) mindkettő legalább döntetlenre kényszerítheti a játékot. Magyarul: az ilyen játékokban az egyik félnek nyerő stratégiája van vagy mindkettőnek döntetlenre jó stratégiája (harmadik eset csak döntetlen engedésénél). Ez determinációt jelent: nincs olyan, hogy mindketten “hibázhatnak”, optimális játék mellett az eredmény előre eldöntött. Ez a tétel a sakkra alkalmazva: vagy a fehér nyerhet mindig, vagy a fekete, vagy döntetlen érhető el mindkét oldalról (utóbbi a legvalószínűbb). Zermelo algoritmust is adott (visszafelé indukcióval) a győztes meghatározására – természetesen a gyakorlatban sakkban ezt végigvinni nem lehet a hatalmas állapottér miatt, de kisebb játékoknál, pl. tic-tac-toe, működik. Zermelo tétele megalapozta a kombinatorikus játékok elméletét és a visszafelé indukció használatát.
- Folk tétel: Az úgynevezett “népi tételek” a végtelen ismétlésű játékok (szuperjátékok) Nash-egyensúlyainak lehetséges kimeneteiről szólnak. A legismertebb folk tétel kimondja: ha a játékosok eléggé türelmesek (diszkont faktor közel 1), akkor bármely kifizetés-kombináció, ami az egyéni racionálitási küszöböt meghaladja (azaz mindenkinek jobb, mint amit egyoldalúan minimum elérhetne, pl. fogolydilemmában ez a szuckerkifizetés felett van) és megvalósítható (valamilyen kevert stratégiás kimenetelként elérhető a stage game-ben) – nos, bármely ilyen kifizetés megvalósítható egy szubjáték-tökéletes Nash-egyensúly keretében az ismétlődő játékban. Azaz: rengeteg egyensúly lehetséges, gyakorlatilag “tetszőleges” pont a lehetőséghalmaz belsejében elérhető, ha elég türelmesek a felek. Ez magyarázza, hogy miért tartható fenn együttműködés olyan játékban, mint a fogolydilemma végtelenül ismételve – mert a jutalmazó/büntető stratégiák (grim trigger, tit for tat) biztosítják, hogy a kooperatív kimenet is egyensúly legyen. A folk tétel informálisan “népi” azért, mert már a 1950-es években “közszájon forgott” az eredmény, de formális bizonyítást csak később publikáltak (Friedman 1971 klasszikus hivatkozás). Vannak továbbá módosított folk-tételek privát megfigyelés vagy véges (de ismeretlen) játszmahossz esetére, stb.
- Árverési ekvivalencia tétel (Revenue Equivalence): Ez egy mechanizmustervezési eredmény, kimondva, hogy bizonyos széles feltételek mellett minden “normális” aukciós formátum ugyanazt a várható bevételt eredményezi az eladónak, feltéve, hogy a szereplők racionálisak és független privát értékkel bírnak. Például egy tárgyra a második árú aukció és az első árú aukció (megfelelően beállított tartalékárral) várhatóan ugyanakkora bevételt ad, ha a résztvevők azonos eloszlásból merítik értékeiket. A bevételek ekvivalenciája egy sor aukcióra kiterjed: angol aukció, holland aukció, első ár, második ár – mind egyenlő várható bevételt hoz (bizonyos feltételekkel). Ez meglepő lehet, hiszen a licitálók stratégiái különböznek (pl. első ár esetén árnyékolnak), de az egyensúlyban kapott bevétel eloszlása megegyezik. Természetesen az előfeltételek fontosak: független privát érték, risk-neutral biddek, stb. Gyakorlatban kis eltérések (kockázatkerülés, összejátszás lehetősége, stb.) megbontják ezt az ekvivalenciát, de elméleti indulópontnak nagyon fontos.
- Revelation principle (Kinyilatkoztatási elv): A mechanizmustervezés alapvető tétele, ami kimondja: ha létezik bármilyen mechanizmus, amelyben a szereplők bizonyos stratégiákat követve elérnek egy adott kimenetelt (és egyensúlyban őszintén nem feltétlen fedik fel a privát információikat), akkor létezik egy olyan “direkt mechanizmus” is, ahol a játékosok egyszerűen bejelentik a privát információjukat (típusukat) és ez őszinte bejelentés* egyensúlyt alkot, ugyanezt a kimenetelt eredményezve. Vagyis: egy tervezőnek elég az “igazmondó” mechanizmusokat megvizsgálnia, mert ha valami bonyolult úton-oldalon megoldható, azt át lehet alakítani egy egyenes, truth-telling formába, ahol a játékos ösztönzése az igazat mondani. Ez hihetetlenül hasznos, mert a mechanizmusok tervezésénél leszűkíti a keresést: vizsgáljuk a incetive compatible* mechanizmusokat (ahol az őszinteség domináns strat), nem kell minden hazudozós taktikát külön elemezni. Ennek a feltétele, hogy a mechanizmus kiegyensúlyozott: a formális feltétel az ún. implementáció Bayes-Nash egyensúlyban, de a lényeg, hogy ha bármilyen egyensúly létezik, csinálhatunk belőle egy olyan mechanizmust, ami arra kényszerít, hogy egyensúlyban igazat mondjanak. Ez persze nem azt jelenti, hogy a mechanizmusba belekódoljuk a megoldást – csupán egy szimulációs argumentum, de igaz. Hurwicz, Maskin, Myerson dolgozták ki ezeket az eredményeket. Gyakorlati példája: ha van mód elérni hatékony erőforrás-allokációt bármilyen bonyolult licitálás mellett, akkor van olyan árverési forma, ahol az őszinte licit (valódi érték beadása) egyensúly és hatékony – pl. Vickrey-Clarke-Groves mechanizmusok.
- Aumann megegyezés tétele (Agreement Theorem): Robert Aumann 1976-ban bizonyította, hogy ha két fél közös tudással bírja egymás racionálisságát és ugyanazt a prior valószínűség-eloszlást (közös meggyőződés), akkor nem lehetséges, hogy tartósan eltérő poszterior véleményük legyen egy eseményről, ha ezek a poszteriorok közös tudássá válnak. Népszerűen: “racionális emberek nem tudnak megegyezni abban, hogy nem értenek egyet”, azaz nem létezhet “agree to disagree” helyzet, ha minden feltétele teljesül (közös priors, Bayes-racionalitás, common knowledge). Ez persze idealizált feltétel – a valóságban nyilván sokszor “agree to disagree” van, de ott megsérül valamely feltétel (különböző priors, irracionalitás, vélemények nem válnak közös tudássá). Az elv mégis fontos: ha mindketten teljesen racionalisták és tudják a másikról is, akkor pusztán a másik véleményének látványa közelíteni fogja az övét. Pl. ha látom, hogy ugyanazon információk alapján te 90% esélyt adsz valaminek, én meg 10%-ot, akkor ez a tudás – ha mindkettőnknek közös – addig kell revideáljuk a nézeteinket, amíg egyetértésbe nem jutunk valahol középen. Aumann tétele szépen kapcsolódik a közös tudás fogalmához (amit ő vezetett be), és hatása van pl. a tőzsdei árak elméletére (ha mindenki ugyanabból indul, nem lehet tartós eltérő vélemény -> senki nem kereskedne, ez az ún. no-trade theorem – mert ha van is különbség, maga a kereskedés ténye információ, és közelíti a beliefs-eket). Összességében, a megegyezés tétele megmutatja a Bayes-racionalitás egy erős következményét és határt szab annak, mennyire különbözhet vélemény homogén csoportban, ha mindenki tud mindenről.
(A fenti tételek csak szemelvények; számos további fontos eredmény van, pl. Arrow lehetetlenségi tétele a társadalmi választásban, Gibbard–Satterthwaite tétel a stratégiamentességről, Shapley–Bonde tétel a piacok magjáról, Brouwer-féle fixponttétel alapvető a Nash-bizonyításhoz, stb. Igyekeztünk a játékelmélet “magját” jelentő tételekre koncentrálni.)
7. Meghatározó személyek a játékelméletben
A játékelmélet interdisciplináris terület, számos matematikus, közgazdász és más társadalomtudós járult hozzá. Néhány kiemelkedő alak (ábécé sorrendben):
- Aumann, Robert – Izraeli-amerikai közgazdász, a korrelált egyensúly és a közös tudás fogalmainak megalkotója, 2005-ben Nobel-díjas az együttműködés matematikai elemzéséért.
- Harsányi János – Magyar származású közgazdász, a Bayes-játékok (hiányos infó) és a vegyes stratégia értelmezése terén úttörő, 1994-ben Nash-sel és Selténnel közösen Nobel-díjat kapott.
- Nash, John F. – Amerikai matematikus, a Nash-egyensúly fogalmának névadója és bizonyítója, 1994-ben Nobel-emlékdíjat kapott a játékelmélet egyensúlyfogalmaiért.
- Neumann János (John von Neumann) – Magyar származású matematikus, a modern játékelmélet megalapozója, a minimax tétel bizonyítója, 1944-ben Morgensternnel írt könyve elindította a játékelméletet.
- Schelling, Thomas – Közgazdász és stratégiai gondolkodó, a koordinációs játékok és a konfliktusok elemzésének mestere (pl. Schelling-pont, oltalmazott koordináció), 2005-ben Nobel-díjas.
- Selten, Reinhard – Német közgazdász, a tökéletes és proper egyensúly finomítások kidolgozója, kísérleti játékelmélet úttörője, 1994-ben Nash-sel és Harsányival Nobel-díjas.
- Shapley, Lloyd – Amerikai matematikus, a Shapley-érték és sok kooperatív fogalom atyja, valamint a magkeresés (core) terén is dolgozott, 2012-ben Nobel-díjas a stabil párosítás elméletéért (Gale-Shapley algoritmus).
- Shubik, Martin – Közgazdász, a játékelmélet közgazdasági alkalmazásainak pionírja, pl. dolláraukció játék kitalálója; a játékelmélet pénzelméleti és intézményi alkalmazásait fejlesztette.
- (És még sokan mások: pl. Oskar Morgenstern – Neumann társa; Herbert Gintis és Elinor Ostrom – közjavak és evolúciós játékok; Ken Binmore – kísérleti és alkufolyamatok; John Maynard Smith – evolúciós játékelmélet; David Blackwell – ismétlődő játékok; Jean-François Mertens – egyensúlyrefinements; Leonid Hurwicz – mechanizmustervezés, stb.)
Megjegyzés: A játékelmélet ma is aktív, fejlődő terület, újabb fogalmak (pl. algoritmikus és gépi tanulás alapú stratégiák, hálózati játékok, viselkedési játékelmélet) és újabb személyek (pl. 2007 és 2012 Nobel-díjasai: Hurwicz, Maskin, Myerson; Roth, Shapley) gazdagítják. A fentiek azonban a legtöbb alapfogalmat lefektették, és munkásságuk hatása máig alapvető az elméletben.
Fordítások
- angol: game theory (en)
- francia: théorie des jeux (fr)
- német: Spieltheorie (de)
- orosz: теория игр (ru) (teorija igr)
- játékelmélet - Értelmező szótár (MEK)
- játékelmélet - Etimológiai szótár (UMIL)
- játékelmélet - Szótár.net (hu-hu)
- játékelmélet - DeepL (hu-de)
- játékelmélet - Яндекс (hu-ru)
- játékelmélet - Google (hu-en)
- játékelmélet - Helyesírási szótár (MTA)
- játékelmélet - Wikidata
- játékelmélet - Wikipédia (magyar)