Está en la página 1de 8

Microeconoma Prof. Eiras Roel Alumno: Pablo DAlesio Reg: 178.

903

EL DILEMA DE LOS PRISIONEROS


(Criterio segunda mejor o mal menor, sin colusin, pero con ensilladura)
Alberto y Roberto fueron atrapados in fraganti robando un automvil. Como se trata de casos muy
claros, se les sentenciar a dos aos por su delito. En el curso de sus entrevistas con los dos prisioneros, el
fiscal de distrito empieza a sospechar que ha dado con dos personas responsables de un asalto
multimillonario a un banco, ocurrido algunos meses atrs. Sin embargo, el fiscal tambin sabe que se trata
de una sospecha. No tiene pruebas para condenarlos por ese delito mayor, a menos que logre que cada
uno confiese. Al fiscal se le ocurre la siguiente idea:
Coloca a los prisioneros en habitaciones separadas para que no se puedan comunicar. A cada
prisionero se le dice que es sospechoso del asalto a un banco y que si l y su cmplice confiesan ese
delito, recibirn una sentencia de tres aos. Tambin se informa a cada uno de que si slo uno de ellos
confiesa y el cmplice no, recibir una sentencia todava ms corta, de un ao, en tanto que el cmplice
ser sentenciado a diez aos de prisin. Los prisioneros saben que si ninguno confiesa, entonces slo
sern juzgados y condenados por el delito menos grave del robo del automvil, que tiene una pena de dos
aos de crcel. En qu forma responden los prisioneros al fiscal?
Primero, observe que el dilema de los prisioneros es un juego de dos jugadores. Cada jugador tiene
dos estrategias: confesar el asalto multimillonario al banco o negar la acusacin. Debido a que hay dos
estrategias, existen cuatro resultados posibles:

Ningn jugador confiesa


Ambos jugadores confiesan
Alberto confiesa, pero Roberto no
Roberto confiesa, pero Alberto no

Cada prisionero puede determinar qu pasar exactamente con l (su recompensa) en cada una de
estas cuatro situaciones. Podemos tabular las cuatro recompensas posibles para cada uno de los
prisioneros en lo que se llama matriz de recompensas de un juego.
Una matriz de recompensas es un tabla que muestra las recompensas de cada accin posible de un
jugador por cada accin posible del otro jugador.
El dilema aparece al considerar las consecuencias de confesar y no confesar. Cada prisionero sabe
que si l y su cmplice se quedan callados acerca del asalto al banco, se les condenar solamente a dos
aos de crcel por robar el automvil. Sin embargo, ninguno de ellos tiene forma de saber si su cmplice
se quedar callado y rehusar confesar. Cada uno sabe que si el otro confiesa y l niega la acusacin, el
otro recibir una condena de slo un ao, en tanto que el que la niegue recibir una condena de diez aos.
Cada uno se plantea la siguiente pregunta: Debo negar todo y confiar en que mi cmplice tambin lo
haga para que quizs slo nos condenen a dos aos? O debo confesar con la esperanza de recibir
solamente un ao (siempre y cuando mi cmplice niegue todo) pero sabiendo que si mi cmplice
confiesa,
ambos recibiremos tres aos de prisin? La solucin del dilema implica encontrar el equilibrio del juego.
El equilibrio de un juego se conoce como equilibrio de NASH, as llamado porque fue l quien lo
propuso primero. El equilibrio de Nash ocurre cuando el jugador A elige la mejor accin posible, dada la
accin del jugador B, y el jugador B elige la mejor accin posible, dada la accin del jugador A. En el
caso del dilema de los prisioneros, el equilibrio ocurre cuando Alberto hace su mejor eleccin, dada la
eleccin de Roberto y cuando Roberto hace su mejor eleccin, dada la eleccin de Alberto.
El dilema de los prisioneros es un juego que tiene una clase especial de equilibrio de NASH llamado
el equilibrio de la estrategia dominante. Una estrategia dominante es una estrategia que es la misma,
independientemente de lo que haga el otro jugador. En otras palabras, slo hay una accin que es la
mejor, sin importar lo que haga el otro. El equilibrio de estrategia dominante ocurre cuando existe una
estrategia dominante para cada jugador. En el dilema de los prisioneros, no importa lo que haga Roberto,
la mejor estrategia de Alberto es confesar; y sin importar lo que haga Alberto, la mejor estrategia de
Roberto es confesar. Entonces el equilibrio del dilema de los prisioneros es que cada jugador confiese..
Si cada prisionero participa en este juego pensando en lo que ms conviene a su inters propio, el
resultado del juego ser que cada uno confesar. Para entender por qu cada jugador confiesa,
consideremos de nuevo sus estrategias y las recompensas de los cursos de accin alternativos.
Contemplemos la situacin desde el punto de vista de Alberto. Alberto se da cuenta que su

resultado depende de las decisiones que Roberto tome. Si Roberto confiesa, a Alberto le conviene
confesar tambin, porque, en ese caso, se le condenar a tres aos en vez de diez aos. Pero si Roberto no
confiesa, a Alberto todava le conviene confesar porque, en ese caso, recibir un ao en lugar de dos aos.
Alberto razona que independientemente de lo que haga Roberto, lo mejor que l puede hacer es confesar.
El dilema, desde el punto de vista de Roberto, es idntico al de Alberto. Roberto sabe que si
Alberto confiesa, l recibir diez aos de no hacerlo tambin, o tres aos si lo hace. Por lo tanto, si
Alberto confiesa a Roberto le conviene confesar. De manera similar, si Alberto no confiesa, Roberto
recibir dos aos si tampoco lo hace y un ao si confiesa. Nuevamente a Roberto le conviene confesar.
Lo mejor que puede hacer Roberto, independientemente de lo que haga Alberto, es confesar.
Cada prisionero entiende que independientemente de lo que haga el otro, su mejor accin es
confesar. Ya que la mejor accin de cada jugador es confesar, cada uno lo hace y recibe una condena de
tres aos de crcel; y as el fiscal ha resuelto el asalto al banco. Ese es el equilibrio del juego.
Para los prisioneros, el equilibrio del juego, cuando cada uno confiesa, no es el mejor resultado. Si
ninguno de los dos confiesa, cada uno recibir solamente dos aos por el delito menor. Existe
algunaforma de obtener este mejor resultado? Parece que no, porque los jugadores no se pueden
comunicar.
Cada jugador se puede poner en el lugar del otro, y as cada jugador puede suponer que hay una estrategia
dominante para cada uno. Los prisioneros estn de verdad en un dilema. Cada uno sabe que puede pasar
dos aos en prisin solamente si confa en que el otro no confesar. Sin embargo, cada prisionero tambin
sabe que al otro le conviene confesar. As que cada prisionero sabe que tiene que confesar y, de esa
forma, ocasiona un mal resultado para ambos.
Extractado del libro MICROECONOMA de Michael Parkin

Los mercados no competitivos


La Teora de Juegos
En el oligopolio, los resultados que obtiene cada empresa dependen no slo de su decisin sino de las
decisiones de las competidoras. En el mundo real, tanto en las relaciones econmicas como en las
polticas o sociales, son muy frecuentes las situaciones cuyo resultado depende de la conjuncin de
decisiones de diferentes agentes. La tcnica para su anlisis fue puesta a punto por un matemtico, John
von Neumann, en colaboracin con el economista Oskar Morgenstern. El libro que publicaron en 1944,
"Theory of Games and Economic Behavior", abri un insospechadamente amplio campo de estudio en el
que actualmente trabajan miles de especialistas de todo el mundo.
Supongamos que dos empresas, Hipermercados Xauen y Almacenes Yuste, constituyen un duopolio
local en el sector de los grandes almacenes. Cuando llega la poca de las tradicionales rebajas de enero,
ambas empresas acostumbran a realizar inversiones en publicidad tan altas que suelen implicar la
prdida de todo el beneficio. Este ao se han puesto de acuerdo y han decidido no hacer publicidad por
lo que cada una, si cumple el acuerdo, puede obtener unos beneficios en la temporada de 50 millones.
Sin embargo una de ellas puede preparar en secreto su campaa publicitaria y lanzarla en el ltimo
momento con lo que conseguira atraer a todos los consumidores. Sus beneficios en ese caso seran de
75 millones mientras que la empresa competidora perdera 25 millones.
Los posibles resultados se pueden ordenar en una Matriz de Pagos como la mostrada en el cuadro de la
derecha. Cada almacn tiene que elegir entre dos estrategias: respetar el acuerdo Cooperar o hacer
publicidad Traicionar. Los beneficios o prdidas mostrados a la izquierda de cada casilla son los que
obtiene Xauen cuando elige la estrategia mostrada a la izquierda y Yuste la mostrada arriba. Los
resultados a la derecha en las casillas son los correspondientes para Yuste.
El que lo mximo que se puede obtener sea 75 M. o 85 M. no tiene mucha influencia sobre la decisin a
adoptar, lo nico que importa en realidad es la forma en que estn ordenados los resultados. Si
substituimos el valor concreto de los beneficios por el orden que ocupan en las preferencias de los
jugadores, la matriz queda como la mostrada en el cuadro. Las situaciones como las descritas en esta
matriz son muy frecuentes en la vida real y reciben el nombre de Dilema de los Presos.

DILEMA DE LOS PRESOS: MATRIZ DE PAGOS

COMPETENCIA DE MEDIAN PUBLICIDAD: MATRIZ DE PAGOS

Yuste

Cooperar

Yuste

Cooperar

Traicionar

2 , 2

4 , 1

Xauen

Cooperar

Traicionar

Cooperar

50 , 50

-25 , 75

Traicionar

75 , -25

0 , 0

Xauen

Traicionar

1 , 4

3 , 3

Veamos cul debe ser la decisin a adoptar por esos almacenes. El director de la divisin de estrategia
de Xauen pensar: "Si Yuste no hace publicidad, a nosotros lo que ms nos conviene es traicionar el
acuerdo, pero si ellos son los primeros en traicionar, a nosotros tambin nos convendr hacerlo. Sea cual
sea la estrategia adoptada por nuestros competidores, lo que ms nos conviene es traicionarles".
El director de la divisin de estrategia de Yuste har un razonamiento similar. Como consecuencia de
ello ambos se traicionarn entre s y obtendrn resultados peores que si hubieran mantenido el acuerdo.
La casilla de la matriz de pagos marcada con un asterisco es la nica solucin estable. Contrariamente a
las argumentaciones de Adam Smith, en las situaciones caracterizadas por el Dilema de los Presos si los
agentes actan buscando de forma racional su propio inters, una "mano invisible" les conducir a un
resultado socialmente indeseable.

Teora de la Incertidumbre:
El esquema de la utilidad N-M satisface varios principios de comportamiento lgico y coherente, o
axiomas cruciales: de orden completo, de la continuidad, de la independencia, de la probabilidad desigual
y de la complejidad. El individuo puede as obtener su funcin de "utilidad esperada", enfrentndose con
una serie de elecciones entre un gasto cierto por un lado y una combinacin probabilstica de dos gastos
inciertos por el otro.
La funcin de utilidad as obtenida es nica, incluyendo transformaciones lineales y proporciona un orden
de alternativas para estas situaciones que no implican riesto sino en este caso incertidumbre. Los
consumidores maximizan la utilidad esperada (UE) segn N-M; estas UE son cardinales, en el sentido
de que pueden conbinarle para calcular las utilidades esperadas y comparar las diferencias de utilidad.
No funciona aqu la regla minimax, maximim, etc. ya que no hay aqu oponente activo con intereses
contrarios; solo contingencias que pueden o no ocurrir segn la evolucin de la naturaleza o cosas.
Utilidad Cardinal Neumann- Morgestern.
Medida de utilidad cardinal para la clasificacin de situaciones que comportan riesgo.
Un billete de lotera puede calificarse con un ndice de utilidad, mediante el clculo N- M de la siguiente
manera. Si el individuo gana el premio el billete ofrece un premio A con una utilidad para el individuo de
U(A) y de perder, el premio B con utilidad U(B). Las probabilidades de ganar son P y las de perder 1-p.
De esta manera la utilidad del billete es,
U = P* U(A) + (1-P)* U(b).
Creando un billete de utilidad artificial que brinde como premio el bien que mas desee el individuo E y
que de perder, le asigne el bien d, con probabilidades p y (1-p) de ganar y perder, existir siempre un
valor de p mayor a 0 y menor a 1, para el cual el individuo se sienta indiferente entre el billete de lotera
artificial y el bien A. Calculando la utilidad esperada del billete artificial puede calcularse la de un bien A
cualquiera. El individuo, cuando se le presentan dos situaciones con riesgo y probabilidades, elegir la
opcin que le de mayor utilidad esperada siempre y cuando cumpla con algunos supuestos de conducta.

5 Axiomas:
1- Transitividad. Si el individuo se muestra indiferente entre dos premios a y b, entre b y c, entonces es
indiferente entre a y c.
2- Continuidad de las preferencias como una funcin de p. Es posible establecer un valor intermedio
de probabilidades para el cual el individuo sea indiferente entre el billete artificial y un bien a.
3- Independencia. Si el individuo se muestra indiferente entre un Ford y un Chevrolet, ser indiferente
entre dos billetes de lotera identicos en todos los sentidos, excepto que uno brinde como premio un ford
y el otro un chevrolet.
4- Deseo de grandes probabilidades de xito. Dados dos billetes de lotera idnticos el individuo
prefiere el que tenga mayores probabilidades de ganar.
5- Probabilidades compuestas. Si a la persona se le ofrece un billete de lotera cuyos premios son a la
vez, otros billetes de lotera, su actitud respecto a este billete de lotera compuesta ser la misma cual si
hubiese pasado por todos los clculos de probabilidades de ganar el premio final.
Validez de la prediccin.
Dado el billete de lotera que ofrece los premios A y B (A es preferido a B), con las probabilidades p de
ganar y 1-p de perder,
U(P, A, B) = PU (A) + (1-P) * U(B).
Por el axioma 2,
=P* U(Pa, E, D) + (1-P) *U(Pb, E, D).
Por el axioma 5,
= P* (Pa* U(E) + (1-Pa)* U(D)) + (1-P) (Pb* U(E) + (1-Pb)*U(D)).
= (P*Pa + (1- p)* Pb)* U(E) + (P* (1-Pa) +( 1-p)* (1-Pb))* U(D).
= (p*pa + (1-p)*pb) * U(E) + (1 P*Pa- (1-p)* Pb)* U(d).
= r* U(E) + (1-r)* U(D).

Teora de los Juegos.


Decisin bajo condiciones de conflicto
La Teora de los Juegos constituye un singular enfoque del problema de la toma de decisiones en
situaciones conflictivas y constituy una de las novedades ms atrayentes para la teora econmica y el
estudio de problemas empresariales especficos.
El objetivo general de la Teora de los juegos es la determinacin de patrones de comportamiento racional
en situaciones en las que los resultados dependen de las acciones de "jugadores" interdependientes.
La esencia de este tipo de decisin radica precisamente en el conflicto de intereses entre los oponentes.
Llamamos "juego" a cualquier situacin en la que intervienen dos o ms oponentes racionales como el
tenis, el pker, la ruleta rusa o los mercados duoplicos. A diferencia de los problemas de decisin que
slo involucran Estados Naturales , en los problemas de juegos, la eleccin de un curso de accin por
parte de uno de los competidores implica un anlisis previo de las posibles reacciones de los restantes
competidores. En un juego suponemos que cada uno de los jugadores conoce todos los cursos de accin
posibles. A cada curso de accin particular lo llamamos "estrategia" la cual, por definicin es una
especificacin completa de las acciones que ejecutar un jugador ante cualquier contingencia que pueda
presentarse en el desarrollo del juego, supuesto que se satisface en pocas situaciones del mundo real.
En algunos casos se requiere todava ms informacin. En una amplia variedad de juegos (aleatorios) no
se conoce con certeza el resultado, que depende de una variable aleatoria. En estos casos , cuando el azar
entra en juego, debemos suponer un conocimiento absoluto de la probabilidad de cada uno de los
resultados posibles, correspondientes a cada una de las combinaciones de estrategias posibles de los
jugadores . Pero hay juegos, como en el duopolio, en los que la probabilidad de que se conozcan estas
probabilidades es insignificante.
Los juegos se clasifican generalmente segn el nmero de participantes y el grado de oposicin de
intereses en :
JUEGOS DE SUMA CERO:

Son aquellos en los cuales el conflicto de intereses es total, de manera que lo que gana un participante es
perdido por los restantes.
Ejemplo: la competencia establecida en trminos de participacin en el mercado por varias firmas que son
las nicas que venden cierto producto. En este caso las ganancias de un jugados son exactamente las
prdidas del otro ( son estrictamente adversarios).
JUEGOS DE SUMA DISTINTA DE CERO:
Son aquellos en los cuales los intereses no son completamente opuestos. Ejemplo: Una campaa
publicitaria tiende a estimular tanto las propias ventas
prdidas del otro ( son estrictamente adversarios).
JUEGOS DE SUMA CERO CON DOS ADVERSARIOS
Se ejemplifica este caso a travs de una matriz de resultados que representa en sus filas, los 3 cursos de
accin alternativos de la empresa A para ganar participacin en el mercado y en sus columnas los cursos
de accin alternativos de la empresa B para ganar participacin en el mercado.
Estrategia Pura y Estrategia mixta:
La estrategia de un competidor es la regla de decisin que el mismo utiliza para elegir cal de las posibles
alternativas debe jugar en cada paso. Se dice que ha elegido una estrategia pura cuando se opta por
utilizar o jugar en forma permanente con la misma alternativa.
Se dice que se ha elegido una estrategia mixta cuando se juegan las distintas alternativas segn una
determinada distribucin de probabilidades. Es una asignacin de probabilidades a las estrategias puras
viables, de modo que la suma de las probabilidades es igual a la unidad para cada uno de los participantes.
Cabe entonces preguntarse como ha de escoger su estrategia la empresa A , teniendo en cuenta las
posibles reacciones de su adversario y las siguientes hiptesis planteadas por Von Neumann.
Los jugadores son inteligentes. Si un jugador supiera la estrategia a utilizar por su adversario, el
adoptara la mejor decisin posible.
Cada jugador conoce la matriz de resultados.
Cada jugador juega con la mayor seguridad posible, tratando de acotar el riesgo.
ESTRATEGIA PURA:
Esta actitud conservadora que plantea Von Neumann se traduce en la aplicacin del Criterio de Wald.
Por este criterio, los responsables de la empresa A haran el siguiente razonamiento:
Usando la estrategia A1 lo peor que le puede pasar es perder el 11%
Usando la estrategia A2, lo peor que le puede pasar es ganar solo el 1%
Usando la estrategia A3, lo peor que le puede pasar es perder el 5%
De acuerdo con el criterio Wald, la empresa debera escoger la mxima de estas compensaciones mnimas
(1%)correspondiente a la alternativa A2.
Pero hay que recordar que el adversario es racional y por lo tanto tambin se rige por el criterio Wald.
B1
B2
B3
B4 **Maximin de Empresa A
A1
6
-3
15
-11
-11
A2
7
1
9
5
-1
A3
-3
0
-5
8
-5
*Minimax de empresa B
7
1
15
8
* La empresa B querr minimizar su prdida mxima (minimax).
** La empresa A querr maximizar sus compensaciones mnimas (maximin)
Vemos que de este modo que la mejores decisiones por parte de ambos competidores son que la Empresa
A juegue
su estrategia pura A2 y la Empresa B juegue su estrategia pura B2, con lo cual el resultado ser un
aumento del 1% de la participacin en el mercado de A con la consecuente disminucin para B.
Sabiendo la A que B eligir B2 no le queda otra alternativa que elegir A2, con la cual puede obtener el
mejor resultado en eses caso. A su vez teniendo B conocimiento de que A eligir A2, no le queda mejor
opcin que elegir B2, alternativa que le provoca una menor prdida.
Por el contrario, si la empresa A tuviera informacin de que por alguna razn la empresa B no
seleccionar la alternativa B2 ( lo que se esperaba de ella), entonces podra determinar su estrategia

ptima de acuerdo con los criterios de decisin bajo riesgo, ajustndose a las probabilidades asociadas a
las estrategias competidoras (determinadas en base a la informacin que se disponga de B). Sin embargo,
en la medida que no se disponga de tal informacin o que esta no sea confiable, el criterio de decisin
ser el dado por el criterio de Wald.
Algunas definiciones:
Se llama "jugador maximizante" al jugador para el cual est construida la matriz de resultados, es
decir , al jugador para el cual los resultados positivos significan ganancias (Empresa A en este caso).
Se llama "jugador minimizante" al jugador para el cual los resultados positivos significan prdidas (
Empresa B en este caso).
Se llama "Valor de Juego Mximo" a los valores maximin o minimax de la matriz de juego
correspondientes a cada jugador. Por lo general se puede demostrar que se cumple la relacin
minimax > maximin que significa que lo que B espera perder jugando estrategias puras es mayor a lo
que A espera ganar. Sin embargo , en ciertos casos particulares, el valor del juego resulta ser el
mismo para ambos competidores.
En los casos como el mencionado en el prrafo anterior, donde el valor del juego es el mismo para
amboscompetidores, como en el problema que estamos analizando , decimos que nos encontramos en
una situacin de"Equilibrio Estable" (el valor maximin para la empresa A coincide con el valor
minimax para la empresa B).
Cuando en un juego se cumple la condicin descripta en el prrafo anterior, se dice que el juego
posee un"Punto de Ensilladura" por la forma que tiene la representacin grfica de esta situacin.
(maximax =minimin).
Dicho valor es el "Valor del juego" y representa tanto lo que el jugador A espera ganar como lo que el
jugador B espera perder. En este caso el valor del juego es 1%.

Matriz de pagos a A:

Empresa A

Radio
TV

Empresa B
Radio
TV
7
2
3
8

Comenzar por definir algunos conceptos de este juego en particular.

El jugador maximizante en este caso ser la empresa A, ya que es al que los resultados
positivos le significan una ganancia.

A su vez el jugador minimizante es la empresa B ya que para ella los resultados positivos
significan prdidas.
En nuestro caso, y siguiendo la teora de Wald podemos ir desarrollar un poco ms la tabla
original:

Empresa A
Wald B

Radio (p1)
TV (1-p)

Empresa B
Radio (q1)
TV (1-q)
7
2
3
8
7
8

Wald A
2
3

Estamos ante un caso de no equilibrio, debido a que si B escogiera Radio a la empresa A le


convendra elegir Radio en lugar de TV para asegurarse una ganancia de 7 y no de 3. Pero si A escoge
Radio a B le convendr mas elegir TV ya que sus prdidas se reduciran a 2, lo que nos hara pensar que

A cambiar nuevamente a TV para aumentar su ganancia a 8; por lo tanto podemos afirmar que el juego
NO SE ESTABILIZARA NUNCA.
Debido a lo expresado anteriormente los oponentes debern utilizar Estrategias Mixtas en
orden de solucionar este problema de inestabilidad.
En una estrategia mixta la eleccin es aleatoria basandose en un conjunto de probabilidades:
Analicemos primero a la empresa A:
Si escoge alternativas radio y TV con probabilidades p1 y 1-p1, su ganancia depender tambin
de la estrategia escogida por su adversario:
Si B juega como estrategia pura Radio tendremos:
VA (p1,Radio) = 7 . p1 + 3 . (1-p1) = 3 + 4p1
Si B juega como estrategia TV tendremos :
VA (p1, TV) = 2 . p1 + 8 . (1 p1) = 8 6p1
Igualando:
8 6p1 = 3 + 4p1
5 = 10p1
0,5 = p1
(1-p) = 0,5

O sea que el VA es el mismo, y no importa la alternativa que la empresa B elija, por lo tanto sta
es la estrategia ptima para la empresa A.
Si aplicamos lo mismo para la empresa B:
Si A juega como estrategia pura Radio tendremos:
VB (q1,Radio) = 7 . q1 + 2 . (1-q1) = 2 + 5q1
Si A juega como estrategia TV tendremos :
VB (q1, TV) = 3 . q1 + 8 . (1 q1) = 8 5q1
Igualando:
8 5q1 = 2 + 5q1
6 = 10q1
0,6 = q1
(1-q) = 0,4
El valor que se espera para B es entonces de 5 sin importar la alternativa de A, situacin por la
cual podemos decir que esta es la estrategia ptima de B.

Podemos concluir entonces que utilizando estrategias mixtas la empresa A jugara con sus
alternativas Radio y TV con una frecuencia del 50 % cada una y que la empresa B jugara estas
alternativas con frecuencia del 60 % Radio y 40 % TV. Los valores que esperan ambas empresas es el
mismo, en este caso 5 y le permite a la empresa A tener una tener una mejor situacin (con respecto a
una estrategia pura) ya que espera ganar 5 en lugar de 3 y la empresa B espera perder 5 en lugar de 7.

También podría gustarte