Nash-Gleichgewicht

Aus Wiwiwiki.net
Version vom 9. Dezember 2019, 06:09 Uhr von Bkygms (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springenZur Suche springen

Ein Nash-Gleichgewicht ist ein Lösungskonzept aus der Spieltheorie, das es ermöglicht, nichtkooperative Spiele zu lösen. Es gibt eine Strategiekombination vor, bei der die Spieler jeweils eine Strategie wählen, wobei für keinen Spieler ein Anreiz besteht, von dieser Gleichgewichtsstrategie abzuweichen. Das heißt also, dass kein Spieler seine Auszahlungsmenge erhöhen kann, wenn er als Einziger von seiner Strategie abweicht.

Das Konzept des Nash-Gleichgewichts wird allgemein als eines der wichtigsten Konzepte der nichtkooperativen Spieltheorie angesehen und bildet die Grundlage für weitere Lösungskonzepte.

Ausführliche Definition, Einordnung und alternative Perspektiven

Genauer formuliert ist Strategiekombination s* ein Nash-Gleichgewicht, falls für alle Spieler i

für alle

Das heißt, die Auszahlung an den Spieler i, für den Fall, dass er die Gleichgewichtsstrategie wählt, ist genauso groß oder größer wie seine Auszahlung, wenn er eine beliebige andere Strategie aus der Strategiemenge wählen würde.

Dieses Lösungskonzept geht zurück auf John Forbes Nash Jr., der das Gleichgewicht in seiner Dissertation definiert und seine Existenz mathematisch bewiesen hat, weshalb es dann auch nach ihm benannt wurde. Jedoch bildet die Grundlage für die von Nash konzipierte Lösungsstrategie die von Antoine-Augustin Cournot entwickelte Oligopoltheorie, die eine Lösung für modellhafte Marktsituationen mit zwei oder mehr Konkurrenten und der richtigen Angebotsmenge als zu findende Variable darstellt. Nash entwickelte dieses Konzept also durch eine Verallgemeinerung weiter und machte es somit auf eine Vielzahl von möglichen Szenarien anwendbar. (Holler, Illing und Napel, 2019)

Mit dem angesprochenen Beweis der Existenz eines solchen Gleichgewichts durch Nash ist unter anderem gemeint, dass bei einer Nutzung von gemischten Strategien für jedes Spiel mit endlich vielen Spielern und endlich vielen Strategien mindestens ein Nash-Gleichgewicht existiert. Das heißt also zum einen, dass für ein Spiel mehrere Nash-Gleichgewichte existieren können, aber vor allem heißt das auch, dass für Spiele bei der Wahl von reinen Strategien nicht immer ein Nash-Gleichgewicht existieren muss.

Auch, wenn ein Nash-Gleichgewicht nicht immer vorhanden sein muss, bzw. es grundsätzlich nur auf bestimmte Spiele anwendbar ist, sollte man dabei dennoch beachten, dass auf dessen Basis weitere Lösungskonzepte für andere Spiele entstanden sind, die es erlauben, auch komplexere Spiele oder Spiele mit anderen Bedingungen zu lösen (z.B. das teilspielperfekte Gleichgewicht bei sequentiellen Spielen).

Kritik

Jedoch ist das Nash-Gleichgewicht oft mit dem Kritikpunkt konfrontiert, dass die daraus resultierende Strategiekombination nicht unbedingt Pareto-optimal sein muss. Das heißt, dass es Fälle von Nash-Gleichgewichten gibt, bei denen es möglich ist, eine (Ziel-)Eigenschaft zu verbessern, ohne zugleich eine andere verschlechtern zu müssen. Das wohl prominenteste Beispiel eines solchen Falls stellt das Gefangenendilemma dar. Durch die Nash-Gleichgewichtslösung gelangen beide Spieler des Gefangenendilemmas zu einer Strategie, bei der die Auszahlungsmengen nicht die best-mögliche ist. Wenn sie eine andere Lösungsstrategie wählen würde, wäre es jeweils für beide Spieler möglich, zu einer besseren Auszahlungsmenge zu gelangen. Unter diesem Punkt kann man auch das Paradoxon der Rationalität erwähnen, das einen experimentellen Beleg für diesen angesprochenen Kritikpunkt darstellen kann. Dieses Paradoxon beschreibt die Beobachtung, dass Spieler, die irrationale oder unüberlegte Entscheidungen treffen, in real durchgeführten spieltheoretischen Spielen oft bessere Ergebnisse/Auszahlungsmengen erzielen, als Spielerpaare, die sich rational verhalten. Im Fall einer Nash-Gleichgewichtsstrategie heißt das, dass in der experimentellen Spieltheorie Spielerpaare, die sich (aus welchen Gründen auch immer) nicht an die durch das Nash-Gleichgewicht vorgegebene Strategie halten, besser abschneiden als Spielerpaare, die das tun.

Herleitung

Wenn es darum geht, wie man ein solches Nash-Gleichgewicht überhaupt finden kann, gibt es grundsätzlich zwei simple Wege:

  • Zum einen kann man die aus den jeweiligen Strategien resultierenden Auszahlungsmengen, die meist in einer Auszahlungsmatrix veranschaulicht werden, einzeln mit den Gleichgewichtsbedingungen des Nash-Gleichgewichts vergleichen. Die Auszahlungsmengen, die mit diesen definierten Bedingungen übereinstimmen, sind dann also für das Spiel die Nash-Gleichgewichte und die Strategieprofile, mit denen man auf diese Auszahlungsmengen kommt, die Nash-Gleichgewichtsstrategien.
  • Zum anderen kann man auf das Nash-Gleichgewicht kommen, indem man die Reaktionsfunktionen für beide Spieler herleitet und daraufhin die Schnittpunkte der beiden Funktionen berechnet. Eine solche Reaktionsfunktion wird grundsätzlich aus einer allgemeinen Funktion, die dem Spiel zugrunde liegt, hergeleitet (z.B. in einem Spiel mit zwei Verkäufern aus einer für beide geltenden Gewinnfunktion). Die Reaktionsfunktion des ersten Spielers wird damit durch seine Nutzenmaximierung bestimmt, in dem Fall, dass der zweite Spieler eine beliebige Auswahl (z.B. eine Verkaufsmenge) trifft. Analog wird die Reaktionsfunktion des zweiten Spielers bestimmt. Durch das Gleichsetzen beider Reaktionsfunktionen ergibt sich für beide Spieler eine Auswahl, die für beide optimal ist und damit das Nash-Gleichgewicht.

Herleitung des Nash-Gleichgewichts anhand eines einfachen Beispiels (Cournotsches Dyopol)

Um die am Ende des vorangehenden Gliederungspunktes kurz dargestellte allgemeine Herleitungsweise eines Nash-Gleichgewichts verständlicher zu machen und beispielhaft zu veranschaulichen, soll nun eine solche Herleitung auf den Fall eines Cournotschen Dyopols angewendet werden. Grundsätzlich ist zu diesem Begriff zu sagen, dass ein Dyopol einen Markt mit lediglich zwei Anbietern beschreibt und ein Cournot-Modell ein solches ist, das Mengenstrategien betrachtet.

Mineralwasserangebot zweier Quellenbesitzer

„Zwei Quellenbesitzer wählen die Angebotsmenge  ihres homogenen Mineralwassers aus der Strategiemenge ∞). Der Marktpreis p wird durch die Gesamtanliefermenge  bestimmt und beträgt , falls die Gesamtliefermenge kleiner als eins ist. Andernfalls ist der Preis gleich null. Die Produktion erfolgt ohne Fixkosten und mit konstanten Grenzkosten c, d.h.  ist die Kostenfunktion des i-ten Besitzers. Beide Besitzer versuchen ihren Gewinn , der ihre Auszahlung ist, zu maximieren. Das Nash-Gleichgewicht kann man berechnen, indem man die Reaktionsfunktionen (best-response function)  herleitet. Die Reaktionsfunktion des Quellenbesitzers 1 beschreibt seine gewinnmaximierende Produktionsmenge , wenn der Quellenbesitzer 2 irgendeine Menge  produziert.“ (Sieg 2010, 16f)

Um nun das Nash-Gleichgewicht für diesen Fall zu erhalten, benötigt man den Schnittpunkt der Reaktionsfunktionen von beiden Quellenbesitzern, da an diesem Punkt beide die gleiche Menge Mineralwasser gewinnmaximierend anbieten.

Für die Bestimmung der Reaktionsfunktion des Quellenbesitzers 1 wird zunächst eine beliebige Produktionsmenge  des Quellenbesitzers 2 angenommen und die gewinnmaximale Reaktion, also , des 1 auf diese Produktionsmenge bestimmt.

Es ergibt sich damit die Gewinnfunktion

,

die zu folgender Optimalitätsbedingung führt

.

Daraus ergibt sich die optimale Produktionsmenge bzw. Reaktionsfunktion des Quellenbesitzers 1

.

Analog lässt sich die optimale Produktionsmenge bzw. Reaktionsfunktion des Quellenbesitzers 2 berechnen, die lautet

 .

Wenn ein Spieler eine Nash-Gleichgewichtsstrategie , ist auch die Wahl einer solchen Strategie vom Gegenspieler zu erwarten, was in folgenden Angebotsmengen resultiert

und

Da jeder Schnittpunkt der Reaktionsfunktionen einem Nash-Gleichgewicht entspricht, kann man die Gleichgewichtsstrategiefunktion des einen Spielers in die Reaktionsfunktion des anderen Spielers einsetzen, um das endgültige Nash-Gleichgewicht zu erhalten. Die Gleichung sieht dann wie folgt aus:

Die Angebotsmenge  ist also der Schnittpunkt beider Reaktionsfunktionen und damit das Nash-Gleichgewicht für dieses Beispiel.

Kritik am Nash-Gleichgewicht am Beispiel des Gefangenendilemmas

Darstellung der Situation

Das Gefangenendilemma beschreibt eine Situation in der zwei Personen (Spieler A und Spieler B) beschuldigt werden, ein Verbrechen begangen zu haben. Sie werden dazu getrennt voneinander verhört und haben keine Möglichkeit sich abzusprechen oder zu erfahren, was der andere aussagt. Jeder der Gefangenen hat die beiden Optionen „gestehen“ und „leugnen“ und beide wissen über alle möglichen Resultate dieser Entscheidungen Bescheid. Die Entscheidung bzw. die Kombination der Entscheidungen von beiden bestimmt, wie lange sie jeweils ins Gefängnis müssen oder, ob sie freigelassen werden. Sie müssen diese Entscheidung simultan treffen und haben nur einmal die Möglichkeit zu einer solchen Aussage, das heißt, der Entscheidungsprozess wird nach der ersten Runde nicht wiederholt.

Wenn beide Spieler gestehen, müssen beide für 3 Jahre ins Gefängnis.

Wenn beide Spieler leugnen, müssen beide für 1 Jahr ins Gefängnis.

Wenn Spieler A leugnet und Spieler B gesteht, muss Spieler A für 6 Jahre ins Gefängnis und Spieler B kommt frei.

Wenn Spieler B leugnet und Spieler A gesteht, muss Spieler B für 6 Jahre ins Gefängnis und Spieler A kommt frei.

Spieler A Spieler B
Gestehen Leugnen
Gestehen (-3/-3) (0/-6)
Leugnen (-6/-0) (-1/-1)

Nash-Gleichgewicht vs. Pareto-Optimum

Wenn wir im Gefangenendilemma nach dem Nash-Gleichgewicht suchen, also nach der Entscheidungssituation, in der es für keinen Spieler vorteilhaft ist von seiner gewählten Entscheidung abzuweichen, kommen wir zu der Situation, in der beide gestehen, die Tat begangen zu haben. Man könnte geneigt sein zu glauben, dass das Nash-Gleichgewicht an dem Punkt liegt, in dem beide die Tat leugnen. Allerdings kann ein Spieler in der Situation, dass der andere Spieler gesteht, selbst die Tat leugnen und seine Gefängnisstrafe von 1 auf 0 reduzieren und damit dem Gegenspieler 6 Jahre Gefängnis einbringen. Da jedoch diese Schlussfolgerung für beide Spieler gilt und auch beide davon wissen, werden beide die Option zu gestehen wählen. Damit ist gesichert, dass der jeweilige Spieler aus seiner Sicht zu dem bestmöglichen Resultat kommt, unabhängig davon, ob der Gegenspieler gesteht oder leugnet.

Wenn man hingegen ein Lösungskonzept wählen würde (und eine Möglichkeit hätte, beide Spieler daran zu binden) das auf Pareto-Optimalität basiert, also der möglichen Verbesserung einer Zieleigenschaft ohne die Verschlechterung einer anderen Eigenschaft, wurde das Resultat zu einem besseren Ergebnis führen, als das Nash-Gleichgewicht vorgibt. In einem solchen Fall würden beide Spieler die Tat leugnen, womit beide für 2 Jahre weniger ins Gefängnis müssten.

Diese Überlegungen stellen einen bedeutenden Kritikpunkt am Nash-Gleichgewicht dar und verleiten dazu vom Nash-Gleichgewicht als Strategie zur Lösung eines Spiels abzusehen. Die angesprochene Zirkularität in der Entscheidungsfindung spricht hingegen für das Nash-Gleichgewicht.

Kategorisierung nach der JEL-Klassifikation

C Mathematical and Quantitative Methods

  • C7 Game Theory and Bargaining Theory
    • C720 Noncooperative Games

Literatur

Holler, Manfred J., Gerhard Illing und Stefan Napel. 2019. Einführung in die Spieltheorie. 8. Auflage. ISBN: 978-3-642-31962-4

Sieg, Gernot. 2010. Spieltheorie. 3. Auflage. ISBN 978-3-486-59657-1

Dixit, Avinash K., Susan Skeath und David Reiley. 2015. Games of strategy. 4. ed. New York: W. W. Norton & Co. ISBN: 978-0393919684

Dutta, Prajit K. 1999. Strategies and games: Theory and practice. Cambridge, Mass. MIT Press. https://b-ok.org/book/2640653/e56341. ISBN: 0-262-04169-3