Das Gefangenendilemma ist ein Paradoxon, das zentraler Bestandteil der Spieltheorie ist. Bei dem Dilemma handelt es sich um ein klassisches „Zwei-Personen-Nicht-Nullsummen-Spiel”, das in den 1950er Jahren von zwei Mitarbeitern der RAND Corporation formuliert wurde. Merrill Flood und Melvin Dresher beschrieben ein soziales Dilemma als Zwei-Personen-Spiel, das zeigt, wie individuell rationale Entscheidungen zu kollektiv schlechteren Ergebnissen führen können. Die Bezeichnung „Gefangenendilemma“ stammt von Albert Tucker von der Universität Princeton.
Paradox kann dieses Dilemma genannt werden, da die individuell vernünftigste Entscheidung der Gefangenen (gestehen) und die kollektiv vernünftigste Entscheidung (schweigen) auseinanderfallen. Eine eindeutige verbindliche Handlungsanweisung kann nicht ohne Weiteres angegeben werden.
In einer Auszahlungsmatrix eingetragen, ergibt sich folgendes Bild:
| B schweigt (kooperiert mit A) | B gesteht (verrät A) | |
| A schweigt (kooperiert mit B) | A:−2 / B:−2 | A:−5 / B:0 |
| A gesteht (verrät B) | A:0 / B:−5 | A:−4 / B:−4 |
Ergebnisse (hier):
Die existierenden vier Kombinationsmöglichkeiten hängen nicht nur von der eigenen, sondern auch von der Entscheidung des Komplizen ab (Interdependenz des Verhaltens).
Individuell scheint es für beide vorteilhafter zu sein, auszusagen. Der Gefangene denkt sich: Falls der andere gesteht, reduziere ich mit meiner Aussage meine Strafe von fünf auf vier Jahre; falls er aber schweigt, dann kann ich mit meiner Aussage meine Strafe von zwei Jahren auf Null reduzieren! Also sollte ich auf jeden Fall gestehen! Diese Entscheidung zur Aussage hängt nicht vom Verhalten des anderen ab, und es ist anscheinend immer vorteilhafter zu gestehen. Eine solche Strategie, die ungeachtet der gegnerischen gewählt wird, wird in der Spieltheorie als dominante Strategie bezeichnet.
Wie die Matrix zeigt, wären beide Gefangenen jedoch besser gestellt, entschieden sie sich beide zu schweigen. Dann erhielten beide nur 2 Jahre Gefängnis. Die Spielanlage verhindert aber gerade die Verständigung zwischen den Gefangenen und provoziert so einen einseitigen Verrat, durch den der Verräter das für ihn individuell bessere Resultat 'Freispruch' (falls der Mitgefangene schweigt) oder vier statt fünf Jahre (falls der Mitgefangene gesteht) zu erreichen hofft. Versuchen dies aber beide Gefangenen, so verschlimmern sie – auch individuell – ihre Lage, da sie nun je vier Jahre statt der zwei Jahre Gefängnis erhalten.
In diesem Auseinanderfallen der möglichen Strategien besteht das Dilemma der Gefangenen. Die vermeintlich rationale, schrittweise Analyse der Situation verleitet beide Gefangenen dazu zu gestehen, was zu einem schlechten Resultat führt (suboptimale Allokation). Das bessere Resultat wäre durch gemeinsame Kooperation erreichbar, die aber anfällig für einen Vertrauensbruch ist. Die rationalen Spieler treffen sich in einem Punkt, der in diesem Fall als pareto-ineffizientes Nash-Gleichgewicht bezeichnet wird.
Im Gefangenendilemma spielt die Frage von tatsächlicher Schuld oder Unschuld für das Resultat keine Rolle. Das wirkt sich so aus, dass auch der Unschuldige besser kommt, zu gestehen - in dem Fall etwas, was er nicht getan hat. Da moralische Bedenken und die Hoffnung auf Erweis der Unschuld den Unschuldigen davon abhalten, zu gestehen, was er nicht getan hat, muss er dann oft die schlechtere Stellung einnehmen, die sich aus dem Nichtgeständnis ergibt. Wenn die Strafe für Nichtgestehen sehr hoch ist, gestehen auch viele Unschuldige alles. Das Dilemma kommt insbesondere bei Schauprozessen zum Tragen.
Das Dilemma beruht stark darauf, dass kein Teilnehmer weiß, wie sich der andere Teilnehmer verhalten wird. Die optimale Strategie für beide zusammen wäre, wenn beide Mitspieler einander vertrauen und miteinander kooperieren. Das Vertrauen kann auf zweierlei Art erzielt werden: Zum Einen durch – nach den ursprünglichen Spielregeln nicht erlaubte – Kommunikation und entsprechende Vertrauensbeweise. Zum Anderen durch Strafe im Falle des Vertrauensbruches.
Der Ökonom und Spieletheoretiker Thomas Schelling geht in seinem Werk The Strategy of Conflict (deutsch: Die Strategie des Konflikts) auf solche Probleme unter den Bedingungen des Kalten Krieges ein (Gleichgewicht des Schreckens). Die Bestrafung für einseitigen Vertrauensbruch wäre so groß gewesen, dass sie sich nicht lohnte. Beim wiederholten Spiel des Gefangenendilemmas beruhen die meisten Strategien darauf, dass man Informationen aus vorhergehenden Schritten verwendet. Wenn der andere in einem Schritt kooperiert, vertraut die erfolgreiche Strategie Tit for Tat darauf, dass er es weiterhin tut und gibt ihrerseits einen Vertrauensbeweis. Im entgegengesetzten Fall bestraft sie, um zu verhindern, dass sie ausgenutzt wird.
Die Anzahl der Runden darf allerdings nicht vorgegeben werden, sondern muss unbestimmt sein. Andernfalls könnte es sich für eigentlich kooperierende Strategien lohnen, in der letzten Runde zu betrügen, weil dafür eine Vergeltung nicht mehr möglich ist. Somit wird aber die vorletzte Runde zur letzten, worauf sich wieder dieselbe Situation ergibt. Daraus ergibt sich wiederum eine suboptimale Lösung. Das Problem der letzten Runde entschärft sich, wenn das Spiel als – angeblich oder tatsächlich – unendliches Turnier gespielt wird. Wie gut eine bestimmte Strategie in einem solchen Turnier abschneidet, hängt immer von den konkurrierenden Strategien ab, auf die sie trifft, und kann nicht absolut angegeben werden.
Der amerikanische Politologe Robert Axelrod veranstaltete zum mehrmaligen Gefangenendilemma zu Beginn der 1980er Jahre ein Computerturnier, in dem er Computerprogramme mit verschiedenen Strategien gegeneinander antreten ließ. Die insgesamt erfolgreichste Strategie und gleichzeitig eine der einfachsten war besagte Tit-for-tat-Strategie, entwickelt von Anatol Rapoport. Sie kooperiert im ersten Schritt (freundliche Strategie) und den folgenden und „verzichtet auf den Verrat”, solange der andere ebenfalls kooperiert. Versucht der andere, sich einen Vorteil zu verschaffen („Verrat”), tut sie dies beim nächsten Mal ebenfalls (sie lässt sich nicht ausbeuten), kooperiert aber sofort wieder, wenn der andere kooperiert (sie ist nicht nachtragend).
Strategien, die zum Betrügen tendierten, erzielten hier zu Beginn relativ gute Resultate – solange sie auf andere Strategien stießen, die tendenziell eher kooperierten, also sich ausnutzen ließen. Sind betrügerische Strategien aber erfolgreich, so werden kooperative von Generation zu Generation seltener – die betrügerischen Strategien entziehen sich in ihrem Gelingen selbst die Erfolgsgrundlage. Treffen aber zwei betrügerische Strategien zusammen, so erzielen sie schlechtere Resultate als zwei kooperierende Strategien. Betrügerische Strategien können nur durch Ausbeutung von Mitspielern wachsen. Kooperierende Strategien wachsen dagegen am besten, wenn sie aufeinander stoßen. Eine Minderheit von miteinander kooperierenden Strategien wie z. B. Tit-for-tat kann sich so sogar in einer Mehrheit von betrügerischen Strategien behaupten und sogar zur Mehrheit anwachsen. Solche Strategien, die sich über Generationen hin etablieren können und auch gegen Invasionen durch andere Strategien resistent sind, nennt man evolutionär stabile Strategien.
Tit-for-tat konnte erst 2004 von einer neuartigen Strategie der Universität Southampton geschlagen werden, welche sich bei gegenseitigem Aufeinandertreffen nach einem Initial-Austausch in eine Ausbeuter- bzw. eine Opferrolle begibt, um dem Ausbeuter so eine Spitzenposition zu ermöglichen (master-and-servant). Nötig dazu ist aber eine gewisse kritische Mindestgröße, d. h. master-and-servant kann sich nicht aus einer kleinen Anfangspopulation etablieren. Da die Spielpartner über ihr anfängliches Spielverhalten codiert kommunizieren, besteht der Einwand, dass die Master-and-servant-Strategie die Spielregeln verletzt, wonach die Spielpartner isoliert voneinander befragt werden. Die Strategie erinnert an Insektenvölker, in denen Arbeiterinnen auf Fortpflanzung gänzlich verzichten und ihre Arbeitskraft für das Wohlergehen der fruchtbaren Königin aufwenden.
Notwendige Bedingungen für das Ausbreiten von kooperativen Strategien sind: a) dass mehrere Runden gespielt werden, b) sich die Spieler von Runde zu Runde einander wiedererkennen können, um nötigenfalls Vergeltung zu üben, und c) dass nicht bekannt ist, wann sich die Spieler zum letzten Mal begegnen.
Abhilfe kann dadurch geschaffen werden, dass nach zufälliger, d. h. für den Gegner nicht abschätzbarer Anzahl von Wiederholungen spontan einseitig Kooperation gespielt wird, um den Kreislauf der Konfrontation zu durchbrechen. Dadurch wird langfristig das beste Ergebnis für beide Seiten erreicht.
Ein anderes Beispiel bezieht sich auf Absprachen in Kartellen oder Oligopolen: Zwei Unternehmen vereinbaren eine Outputquote (z. B. bei der Ölförderung), aber individuell lohnt es sich, die eigene Quote gegenüber der vereinbarten zu erhöhen. Beide Unternehmen werden mehr produzieren. Das Kartell platzt. Die Unternehmen im Oligopol sind aufgrund der erhöhten Produktion gezwungen, die Preise zu senken, wodurch sich ihr Monopolgewinn schmälert.
Auch in der Wirtschaft finden sich Beispiele für das Gefangenendilemma. Konkurrieren mehrere Firmen auf einem Markt, erhöhen sich die Werbeausgaben immer weiter, da jeder die anderen ein wenig übertreffen möchte. Diese Theorie konnte 1971 in den USA bestätigt werden, als ein Gesetz zum Werbeverbot für Zigaretten im Fernsehen verabschiedet wurde. Es gab kaum Proteste aus den Reihen der Zigarettenhersteller. Das Gefangenendilemma, in das die Zigarettenindustrie geraten war, wurde durch dieses Gesetz gelöst.
Ein weiteres Beispiel ist ein Handlungsreisender, der seine Kunden bei Vorkasse (ggf. ungedeckte Schecks) mit guter Ware (kleinerer Profit, aber langfristig sicher) oder gar keiner Ware (hoher kurzzeitiger Profit) beliefern kann. Händler mit schlechtem Ruf verschwinden in solchen Szenarien vom Markt, da keiner mit ihnen Geschäfte macht, und sie ihre Fixkosten nicht decken können. Hier führt „tit-for-tat” zu einem Markt mit wenig „Betrug”. Ähnlich funktioniert das eBay Bewertungsschema: Händler, die trotz erhaltener Bezahlung die vereinbarte Ware nicht liefern, erhalten schlechte Bewertungen und verschwinden so vom Markt.
Beachtenswert ist das Anbieterdilemma, das zu einer Beeinflussung der Preise für angebotene Güter führt. Zwar profitieren Anbieter bei Vorliegen des Dilemmas nicht, jedoch kann sich die Wohlfahrt einer Volkswirtschaft insgesamt erhöhen, da der Nachfrager durch niedrige Preise profitiert. Durch staatlichen Eingriff in Form von Wettbewerbspolitik wird ein Anbieterdilemma häufig künstlich generiert, indem beispielsweise Absprachen zwischen Anbietern untersagt werden. Somit sorgen Institutionen für mehr Wettbewerb, um den Verbraucher zu schützen.
Auch die Versteigerung der UMTS-Lizenzen in Deutschland dient als Beispiel. Es wurden 12 Frequenzblöcke für UMTS versteigert, die entweder als 2er- oder 3er-Paket erworben werden konnten. Die sieben Bieter, E-Plus-Hutchison, Mannesmann, T-Mobile, Group 3G, debitel, mobilcom und VIAG, nahmen an der Versteigerung im August 2000 teil. Beachtenswert ist auch, dass – wie im theoretischen Original – Absprachen unter den Spielern, also der Mobilfunkanbieter, unterbunden wurden. Nach dem Ausscheiden von debitel nach der 126. Runde am 11. August 2000 waren 12 Lizenzen für 6 Mobilfunkanbieter vorhanden, also 2 für jeden. Die Summe aller Lizenzen hat zu diesem Zeitpunkt 57,6 Mrd. DM betragen. Durch das Spekulieren der Mobilfunkanbieter, auf ein Ausscheiden eines weiteren Anbieters, und der Möglichkeit 3 Lizenzen zu erwerben, ging die Bieterschlacht jedoch weiter. In der 173. Runde, am 17. August 2000, gingen je 2 Lizenzen an die 6 verbliebenen Mobilfunkanbieter – ein Ergebnis also, das auch schon in der 127. Runde hätte erreicht werden können. Die Summe, die die Mobilfunkanbieter für alle Lizenzen zahlten, lag nun bei 98,8 Mrd. DM. Gesamtvolkswirtschaftlich ist dieses Ergebnis nur auf Basis der kurzfristigen Gewinnmaximierung gut zu heißen. Langfristig fehlten Mittel für den Aufbau eines UMTS-Netzes bei den Mobilfunkanbietern. Die Group 3G, welche unter dem Namen Quam nur kurze Zeit Mobilfunkprodukte anbot, und mobilcom konnten nie UMTS anbieten. Die Sonderabschreibungen der Mobilfunkunternehmen auf die Lizenzen führten zudem zu hohen Steuerausfällen in den folgenden Jahren. Im gesamteuropäischen Vergleich führte dies zu einer verzögerten Einführung von UMTS in Deutschland.
Karl Homann geht in seiner Konzeption einer Wirtschaftsethik davon aus, dass es Aufgabe der Staaten bzw. des Gesetzgebers sei, in der Gestaltung der Rahmenordnung darauf hinzuwirken, dass erwünschte Dilemmasituationen aufrecht erhalten werden und dass unerwünschte Dilemmasituationen durch die Schaffung bzw. Veränderung von Institutionen überwunden werden. So können beispielsweise gesetzliche Mindeststandards bei der Sicherung von Konsumentenrechten (z.B. AGB-Gesetz) ein Misstrauen dem Verkäufer gegenüber (unerwünschte Dilemmasituation) ausräumen und so zu mehr Handel führen; gleichzeitig ist die Konkurrenz zwischen den jeweiligen Verkäufern und den jeweiligen Käufern als erwünschte Dilemmasituation aufrecht zu erhalten.
Paradoxon | Spieltheorie | Sozialpsychologie | Kooperation
Prisoner's dilemma | Dilema del prisionero | Vangin dilemma | Dilemme du prisonnier | דילמת האסיר | Fogolydilemma | Karcerano-dilemo | Dilemma del prigioniero | 囚人のジレンマ | Prisoner's dilemma | Iterowany dylemat więźnia | Dilema do prisioneiro | Dilema prizonierului | Дилемма заключённого | Fångarnas dilemma | Song đề tù nhân | 囚徒困境悖论
This article is licensed under the GNU Free Documentation License.
It uses material from the
"Gefangenendilemma".
Home Page • arts • business • computers • games • health • hospitals • home • kids & teens • news • physicians • recreation• reference • regional • science • shopping • society • sports • world