Estocasticos

TALLER UNIDAD 2
INTEGRANTES:
ANDRÉS CABARCAS
KEVIN ANAYA
DANIELA DELGADO
ANDERSON GIRONZA
UNIVERSIDAD DE CORDOBA FACULTA DE

INGENIERIAS - PROGRAMA DE INGENIERIA DE
SISTEMAS CURSO DE METODOS ESTOCASTICOS Y
SIMULACIÓN
Parte 1. Consulte las siguientes temáticas. Elabore un resumen de la temática de
análisis de decisiones, mostrando claramente los conceptos, ejemplos y modelos o
criterios de decisión.
¿en qué consiste una decisión?
Una decisión es una resolución o determinación en la que se toma respecto a algo. Se conoce como toma de decisiones al proceso que consiste en realizar una elección entre
diversas alternativas; La toma de decisiones puede aparecer en cualquier contexto de la vida cotidiana, ya sea a nivel profesional, sentimental, familiar, etc. El proceso, en esencia,
permite resolver los distintos desafíos a los que se debe enfrentar una persona o una organización.
A la hora de tomar una decisión, entran en juego diversos factores. En un caso ideal, se apela a la capacidad analítica (también llamada de razonamiento) para escoger el mejor
camino posible; cuando los resultados son positivos. Cualquier toma de decisiones debería incluir un amplio conocimiento del problema que se desea superar, ya que solo luego
del pertinente análisis es posible comprenderlo y dar con una solución adecuada. Sobra decir que ante cuestiones triviales (por ejemplo, decidir si tomar agua o zumo de naranja
en una comida), el nivel de razonamiento es mucho menos complejo y profundo, y se actúa de forma casi automática, dado que las consecuencias de una decisión equivocada no
tienen mayor importancia.
En cambio, ante decisiones verdaderamente trascendentales para la vida, se procede de una manera muy meticulosa, sopesando los
potenciales resultados, y el tiempo necesario es mucho mayor. A lo largo del desarrollo de una persona, independientemente de su
personalidad y de sus gustos, cada nuevo día trae consigo un número creciente de problemas a resolver, y poco a poco nos vamos
convirtiendo en auténticas máquinas especializadas en tomar decisiones.
A simple vista, se puede distinguir entre individuos seguros e inseguros de sí mismos. Los primeros suelen ser determinados, tener siempre
claros sus gustos y necesidades, lo cual les facilita la toma de decisiones; los otros, en cambio, carecen de la autoconfianza necesaria para
considerar válidas sus propias ideas, y eso repercute gravemente en los momentos críticos de la vida.
¿a qué se le denomina tomar una decisión?
En la toma de decisiones importa la elección de un camino a seguir, por lo que en un estado anterior deben evaluarse
alternativas de acción. Si estas últimas no están presentes, no existirá decisión. Para tomar una decisión, cual sea su
naturaleza, es necesario conocer, comprender y analizar un problema, para así poder darle una solución. En algunos casos,
por ser tan simples y cotidianos, este proceso se realiza de forma implícita y se soluciona muy rápidamente, pero existen
otros casos en los cuales las consecuencias de una mala o buena elección pueden tener repercusiones en la vida y si es en
un contexto laboral en el éxito o fracaso de la organización, para los cuales es necesario realizar un proceso más
estructurado que puede dar más seguridad e información para resolver el problema. Examina las posibles consecuencias de
cada una de las alternativas planteadas En otras palabras, planear una decisión es elegir las mejores alternativas posibles
para la realización de un proyecto o una actividad.
¿Cuáles son los criterios de decisión?
Toda decisión viene motivada en origen por la existencia de un problema que se ha detectado y que se pretende solucionar.
Decidir consiste en la elección de una posible solución entre varios recursos de acción alternativos. Por tanto, no se puede
hablar de toma de decisiones ante una situación problemática para lo que no existe más que una alternativa. Cuando existe
una solución posible del problema, no hay capacidad de elección y por tanto, no hay decisión.
Aun en el caso de contar con varias alternativas posibles, para poder hablar de decisión es necesario que el decisor esté
capacitado y dispuesto a dedicar cierto tiempo y recursos a analizar el problema y sus posibles soluciones.
La toma de decisiones está basada en cinco elementos básicos:
• Información.
• Conocimientos.
• Experiencia.
• Análisis.
• Juicio.
ANALISIS DE DECISIONES CON INFORMACIÓN MUESTRAL
Generalmente los que toman decisiones hacen una serie de evaluaciones preliminares o de cálculo de
probabilidad previo, para cada uno de los estados establecidos. Sin embargo, es posible que para tomar una
mejor decisión se requiera buscar información adicional. Esto con el fin de revisar o actualizar las
probabilidades anteriores, de modo que al decidir se base en probabilidades precisas. Esta información
adicional se obtiene a partir de experimentos diseñados para obtener información muestral.
como, por ejemplo, el muestreo de materias primas, las pruebas de productos y la investigación de
mercados. A las probabilidades resultantes de estos estudios se les denomina probabilidades posteriores.
Para tomar mejores decisiones, en este método se usan los arboles de decisiones, lo que permite una
secuencia lógica para la toma de decisiones y eventos aleatorios, estos árboles son los que permiten escoger
una estrategia de decisión la cual consiste en recorrer la secuencia del árbol de decisión de atrás hacia
adelante.
VALOR ESPERADO DE LA INFORMACION MUESTRAL:
se utiliza para determinar las estrategias de decisión más óptima para la investigación que se
está realizando.
El cálculo del valor esperado de la información muestral se realiza de la siguiente manera:
VEIM = VEcIM – VesIM
Donde:
VEIM: es el valor esperado de la información muestral
VEcIM: es el máximo rendimiento posible esperado con información muestral
VEsIM: es el máximo rendimiento posible esperado sin información muestral
Ejemplo: supongamos que la empresa kmp tiene establecido el VEcIM = $15.93 y el VEsIM =
$14.20 calcule el VEIM a partir de esta información
Respuesta:
VEIM = | $15.93 - $14.20 | = $1.73
Por lo tanto, el VEIM va ser igual a $1.73
DIAGRAMA DE INFLUENCIA APLICADO A LA TEORIA DE DECISIONES:
Un diagrama de influencia es una forma gráfica de modelar un sistema. Sirve para modelar sistemas en que la
variación o introducción de un elemento afecta sobre la cantidad o presencia de otro elemento, para la lógica de
este análisis se necesita identificar todos los componentes que ejercen alguna influencia en el funcionamiento del
sistema, además, identificar la manera en que interactúan estos componentes.
En este diagrama los nodos representan los elementos relevantes de la situación, y cada elemento se representa
con un nodo distinto, los nodos cuadrados representan las decisiones que se deben tomar para alcanzar un
objetivo final, los nodos circulares representan variables cuyo valor se desconocen, los nodos con doble contorno
o amarillos son nodos determinísticos, este diagrama nos permite identificar a simple vista las variables que están
fuera de nuestro control. La secuencia de estos nodos se determina por flechas, estas a su vez, determinan que
evento precede del otro.
Algunas de las ventajas de estos diagramas son: es una herramienta complementaria al árbol de decisión, permite
identificar para cada variable incierta, la fuente que puede proveernos la información necesaria para decidir,
permite representar una situación con varios factores involucrados sin que su tamaño aumente
considerablemente.
Ejemplo:
¿teorema de Bayes en la toma de decisiones?
El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo información de antemano sobre ese
suceso.
Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta característica que condiciona
su probabilidad. El teorema de Bayes entiende la probabilidad de forma inversa al teorema de la probabilidad total. El
teorema de la probabilidad total hace inferencia sobre un suceso B, a partir de los resultados de los sucesos A. Por su
parte, Bayes calcula la probabilidad de A condicionado a B.
El teorema de Bayes ha sido muy cuestionado. Lo cual se ha debido, principalmente, a su mala aplicación. Ya que,
mientras se cumplan los supuestos de sucesos disjuntos y exhaustivos, el teorema es totalmente válido.
Para calcular la probabilidad tal como la definió Bayes en este tipo de sucesos, necesitamos una fórmula. La fórmula se
define matemáticamente como:
Donde B es el suceso sobre el que tenemos información previa y A(n) son los distintos
sucesos condicionados. En la parte del numerador tenemos la probabilidad condicionada, y en
la parte de abajo la probabilidad total. En cualquier caso, aunque la fórmula parezca un poco
abstracta, es muy sencilla. Para demostrarlo, utilizaremos un ejemplo en el que en lugar de A
(1), A (2) y A (3), utilizaremos directamente A, B y C.
CRITERIO DE DECISION DE WALD:
Bajo este criterio se analizan los resultados que ofrecen cada una de las situaciones relacionadas con la
alternativa (estados de la naturaleza), de estas se escoge la peor condición. Esto se hace para todas las
alternativas y entre estas se escoge la alternativa que ofrece los mejores resultados entre los peores.
Este criterio no tiene en cuenta las probabilidades de los estados de la naturaleza, las probabilidades son
desconocidas o ignoradas.
Ejemplo:
Supongamos que el departamento de I+D de la empresa ficticia SHASHA de alimentación ha desarrollado un
nuevo paté Premium con sabores dulces incorporados (pasas, miel.). La dirección decide lanzarlo al
mercado lo antes posible, pues existe la duda de que al dejar la empresa el director de I+D, hay cierto temar
a que la competencia pueda adelantarse.
Las dudas de la empresa se centran en cuál deberá ser el precio de salida del producto: alto, medio o bajo. En
el primer caso se estiman unos beneficios por unidad de 9,00 euros si se adelanta a la competencia, de 5,40
euros si coinciden con la competencia en el lanzamiento de productos similares, y unas pérdidas de 1,80 euros
si lo hace primero la competencia.
Si se decide por el precio medio, las ganancias estimadas respectivamente serían: 6,30, 4,50 y 1,80 euros, y si
sale con el precio bajo los beneficios esperados, según que se adelante, coincida o se demore respecto a la
competencia, serían los siguientes: 2,70, 3,60 y 4,00 euros, respectivamente.
La matriz de decisión para el ejemplo aplicando este criterio es:
Una vez seleccionados los valores mínimos de cada una de las alternativas planteadas (alto, medio y bajo), nos
quedamos como alternativa final con el mayor de dichos valores (2,70).
Según el criterio pesimista, la alternativa más aconsejable sería lanzar el producto con un precio de salida bajo ya
que esta alternativa es la que proporciona el nivel de seguridad más alto.
CRITERIO DE SAVAGE:
Una vez tomada la decisión y producido el estado natural se obtiene un resultado; Savage argumenta que
después de conocer el resultado, el decisor puede arrepentirse de haber seleccionado una alternativa dada.
Savage sostiene que el decisor debe tratar de que ese arrepentimiento se reduzca al mínimo. El criterio es el
siguiente:
1.- Formar la matriz de arrepentimientos o de costo de oportunidad. A cada estado natural se determina el
mejor valor para ese estado natural. A cada estado natural le corresponde una columna en la matriz de
decisiones. En cada columna se determina el mejor valor para ese estado natural y se sustituye por un cero;
esto significa que si ocurre ese estado natural y escogimos la alternativa que le corresponde a ese valor
optimo, nuestro arrepentimiento será nulo. En sustitución de los valores del resto de la columna, se escribirá
la diferencia entre el resultado óptimo y los demás resultados; esta diferencia es el costo de oportunidad o
arrepentimiento por no haber escogido la alternativa que diera el valor óptimo. La matriz así formada se
conoce como: matriz de arrepentimientos, de costos de oportunidad o perdida de oportunidad.
2.- Una vez formada la matriz de perdida de oportunidad, Savage aconseja escoger la estrategia que
corresponde al mínimo de los arrepentimientos máximos, es decir, se aplica la regla minimax.
La alternativa seleccionada será aquella que minimiza el arrepentimiento. Este criterio tiene el inconveniente
de que el número de eventos considerados puede alterar la decisión. Además, la regla utilizada para
seleccionar el mínimo de los arrepentimientos máximos es similar al criterio de Wald, por lo tanto, tiene sus
inconvenientes.
Siguiendo con el ejemplo anterior, aplicaremos el criterio de Savage teniendo en cuenta su teoría.
Para poder calcular la matriz de decisión siguiendo el criterio de Savage es necesario calcular la matriz de
pérdidas relativas para cada columna de los posibles estados. Para ello restamos el mayor valor de cada
columna a cada uno de los valores de dicha columna. De tal forma tenemos que:
Máximo (Adelantarse) = 9,00
Máximo (Al mismo tiempo) = 5,40
Maximo (Retrasarse) = 4,00
Una vez seleccionados los valores máximos de las pérdidas relativas de cada una de las alternativas
planteadas (alto, medio y bajo), nos quedamos como alternativa final con el menor de dichos valores (2,70).
Según el criterio de Savage, la alternativa más aconsejable sería lanzar el producto con un precio de salida
medio ya que esta alternativa proporciona la menor de las mayores pérdidas relativas.
CRITERIO DE HURWICZ:
Este criterio distingue los resultados máximos y mínimos posibles de cada alternativa; hecho esto aplica el
factor de ponderación o llamado "índice de optimismo relativo", para llegar a la decisión mediante el cálculo de
utilidades esperadas. El criterio se aplica de la siguiente manera:
1. De la matriz de decisiones se seleccionan el mejor y el peor valor para cada alternativa, dando lugar a un
vector de óptimos y a otro de pésimos.
2. El vector de óptimos se afecta por un índice y el vector pesimista por otro, dicho índice varía entre cero y
uno
3. La suma de los vectores ya ponderados, da como resultado el vector de los valores esperados, la
alternativa seleccionada es aquella que corresponda al máximo valor esperado
Siguiendo con el ejemplo anterior, si aplicamos este criterio obtenemos:
La matriz de decisión, siguiendo el criterio de Hurwicz, se construye partiendo del coeficiente de optimismo y de
pesimismo. En nuestro ejemplo práctico, el coeficiente de optimismo es del 0,7 y de pesimismo del 0,3 por lo
que trabajaremos con los valores más altos y bajos de cada alternativa respectivamente. A continuación,
realizamos la media ponderada para cada alternativa:
P (alto) = -1,80 x 0,3 + 9,00 x 0,7 = 5,76
P (medio) = 1,80 x 0,3 + 6,30 x 0,7 = 4,95
P (bajo) = 2,70 x 0,3 + 4,00 x 0,7 = 3,61
Según el criterio de Hurwicz, la alternativa más aconsejable sería lanzar el producto con un precio de
salida alto ya que esta alternativa proporciona el mayor valor de las medias ponderadas.
3.1 CONCEPTUALIZACION PRELIMINAR. TEORIA DE JUEGOS CADA CONCEPTO DEBE
VISUALIZARSE AL MENOS CON DOS EJEMPLOS Y UN CASO APLICADO A LA VIDA REAL.
¿Qué es un juego?
Juego es toda actividad que realizan uno o más jugadores, empleando su imaginación o herramientas para crear una
situación con un número determinado de reglas, con el fin de proporcionar entretenimiento y diversión. Existen
juegos competitivos, donde los jugadores tienen que lograr un objetivo, y juegos no competitivos, donde los
jugadores buscan simplemente disfrutar del entretenimiento de la actividad y diversión. Los juegos normalmente se
diferencian de los trabajos por el objeto de su realización. Sin embargo, en muchos casos estos no tienen una
diferencia demasiado clara. Asimismo, el juego se utiliza como herramienta educativa, pues en la mayoría de los
casos funcionan estimulando habilidades prácticas psicológicas.
La primera discusión conocida de la teoría de juegos aparece en una carta escrita por James Waldegrave en 1713. En esta carta, Waldegrave
roporciona una solución mínima de estrategia mixta a una versión para dos personas del juego de cartas de Her. Sin embargo no se publicó un
análisis teórico de teoría de juegos en general hasta la publicación de Recherches sur les príncipes mathématiques de la théorie des richesses, de
Antoine Augustin Cournot en 1838. En este trabajo, Cournot considera un duopolio y presenta una solución que es una versión restringida del
equilibrio de Nash. Aunque el análisis de Cournot es más general que el de Waldegrave, la teoría de juegos realmente no existió como campo de
estudio aparte hasta que John von Neumann publicó una serie de artículos en 1928. Estos resultados fueron ampliados más tarde en su libro de
1944, The Theory of Games and Economic Behavior, escrito junto con Oskar Morgenstern. Este trabajo contiene un método para encontrar
soluciones óptimas para juegos de suma cero de dos personas. Durante este período, el trabajo sobre teoría de juegos se centró, sobre todo, en
teoría de juegos cooperativos. Este tipo de teoría de juegos analiza las estrategias óptimas para grupos de individuos, asumiendo que pueden
establecer acuerdos entre sí acerca de las estrategias más apropiadas. En 1950, aparecieron las primeras discusiones del dilema del prisionero, y se
emprendió un experimento acerca de este juego en la corporación RAND. Alrededor de esta misma época, John Nash desarrolló una definición de
una estrategia óptima para juegos de múltiples jugadores donde el óptimo no se había definido previamente, conocido como equilibrio de Nash. Este
equilibrio es suficientemente general, permitiendo el análisis de juegos no cooperativos además de los juegos cooperativos.
¿Cuál es la historia de la teoría de juegos?

La teoría de juegos experimentó una notable actividad en la década de 1950, momento en el cual los conceptos base, el juego de forma
extensiva, el juego ficticio, los juegos repetitivos, y el valor de Shapley fueron desarrollados. Además, en ese tiempo, aparecieron las primeras
aplicaciones de la teoría de juegos en la filosofía y las ciencias políticas.
En 1965, Reinhard Selten introdujo su concepto de solución de los equilibrios perfectos del subjuego, que más adelante refinó el equilibrio de
Nash. En 1967 John Harsanyi desarrolló los conceptos de la información completa y de los juegos bayesianos. Él, junto con John Nash y
Reinhard Selten, ganaron el Premio Nobel de Economía en 1994. En la década de 1970 la teoría de juegos se aplicó extensamente a la
biología, en gran
parte como resultado del trabajo de John Maynard Smith y su concepto estrategia estable evolutiva. Además, los conceptos del equilibrio
correlacionado, la perfección del temblor de la mano, y del conocimiento común fueron introducidos y analizados En 2005, los teóricos de
juegos Thomas Schelling y Robert Aumann ganaron el premio Nobel de Economía. Schelling trabajó en modelos dinámicos, los primeros
ejemplos de la
teoría de juegos evolutiva. Por su parte, Aumann contribuyó más a la escuela del equilibrio.
¿Cuál es la historia de la teoría de juegos?

John Von Neumann Oskar Morgenstern
John Forbes Nash Nicolas Bernoulli
Adam Smith
Personajes que han influido en la teoría de juegos

Jugador: Son las personas involucradas dentro de un juego, los cuales se caracterizan por tomar las decisiones dentro de la
interactividad del juego. El éxito de un jugador, o grado en el que alcanza sus objetivos en un juego depende del azar, de las
reglas del juego y del conjunto de acciones que sigue cada jugador individual, es decir: de sus estrategias. Una estrategia es
una decisión relativa a la acción que ha de emprender un jugador en cada estado posible del juego. La Teoría de Juegos
supone que todos los jugadores son racionales, inteligentes y están bien informados. En particular, se supone que cada
jugador conoce todo el conjunto de estrategias existentes, no solo para él sino también para sus rivales, y que cada jugador
conoce los resultados de todas las combinaciones posibles de las estrategias.
Pagos: se les denomina pagos a todas aquellas actividades donde el jugador uno,
pierde algún beneficio que gana el jugador dos. Es decir, los pagos se refieren a las
formas de ganancia que hay entre distintos caminos de decisión, dependiendo de que
tan eficientes son las alternativas escogidas por los jugadores.
A que se le denomina jugador y pagos.

Estrategia: Cuando un jugador tiene en cuenta las reacciones de otros jugadores para realizar su elección, se
dice que el jugador tiene una estrategia. Una estrategia es un plan de acciones completo que se lleva a cabo
cuando se juega el juego. Se explicita antes de que comience el juego, y prescribe cada decisión que los agentes
deben tomar durante el transcurso del juego, dada la información disponible para el agente. La estrategia puede
incluir movimientos aleatorios.
Resultados del juego: El resultado de un juego es una cierta asignación de

utilidades finales. Se denomina resultado de equilibrio si ningún jugador puede
mejorar su utilidad unilateralmente dado que los otros jugadores se mantienen en
sus estrategias. Un equilibrio estratégico es aquel que se obtiene cuando, dado que
cada jugador se mantiene en su estrategia, ningún jugador puede mejorar su utilidad
cambiando de estrategia. Alternativamente, un perfil de estrategias conforma un
equilibrio si las estrategias conforman la mejor respuesta a las otras.
A que se le denomina estrategia y resultados del juego

Juegos simétricos y asimétricos:
Un juego simétrico es un juego en el que las recompensas por jugar una estrategia en particular
dependen sólo de las estrategias que empleen los otros jugadores y no de quien las juegue. Si las
identidades de los jugadores pueden cambiarse sin que cambien las recompensas de las
estrategias, entonces el juego es simétrico. Muchos de los juegos 2×2 más estudiados son
simétricos. Las representaciones estándar del juego de la gallina, el dilema del prisionero y la caza
del ciervo son juegos simétricos.
Los juegos asimétricos más estudiados son los juegos donde no hay conjuntos de estrategias
idénticas para ambos jugadores. Por ejemplo, el juego del ultimátum y el juego del dictador tienen
diferentes estrategias para cada jugador; no obstante, puede haber juegos asimétricos con
estrategias idénticas para cada jugador. Por ejemplo, el juego mostrado a la derecha es asimétrico a
pesar de tener conjuntos de estrategias idénticos para ambos jugadores.
Clasificación de los juegos

Juegos de suma a cero:
En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada combinación de estrategias, siempre
suma cero (en otras palabras, un jugador se beneficia solamente a expensas de otros). El go, el ajedrez, el póker y el juego del
oso son ejemplos de juegos de suma cero, porque se gana exactamente la cantidad que pierde el oponente. Como curiosidad,
el fútbol dejó hace unos años de ser de suma cero, pues las victorias reportaban 2 puntos y el empate 1 (considérese que
ambos equipos parten inicialmente con 1 punto), mientras que en la actualidad las victorias reportan 3 puntos y el empate 1.
La mayoría de los ejemplos reales en negocios y política, al igual que el dilema del prisionero, son juegos de suma distinta de
cero, porque algunos desenlaces tienen resultados netos mayores o menores que cero. Es decir, la ganancia de un jugador no
necesariamente se corresponde con la pérdida de otro. Por ejemplo, un contrato de negocios involucra idealmente un
desenlace de suma positiva, donde cada oponente termina en una posición mejor que la que tendría si no se hubiera dado la
negociación.
Se puede analizar más fácilmente un juego de suma distinta de cero, y cualquier juego se puede transformar en un juego de
suma cero añadiendo un jugador "ficticio" adicional ("el tablero" o "la banca"), cuyas pérdidas compensen las ganancias netas
de los jugadores.
La matriz de pagos de un juego es una forma conveniente de representación. Por ejemplo, un juego de suma cero de dos
jugadores con la matriz que se muestra a la derecha

Juegos cooperativos:
Un juego cooperativo se caracteriza por un contrato que puede hacerse cumplir. La teoría de los
juegos cooperativos da justificaciones de contratos plausibles. La plausibilidad de un contrato está
muy relacionada con la estabilidad.
Dos jugadores negocian tanto quieren invertir en un contrato. La teoría de la negociación

axiomática nos muestra cuánta inversión es conveniente para nosotros. Por ejemplo, la solución
de Nash para la negociación demanda que la inversión sea justa y eficiente.
Juegos simultáneos y secuénciales:
Los juegos simultáneos son juegos en los que los jugadores mueven simultáneamente o en los
que éstos desconocen los movimientos anteriores de otros jugadores. Los juegos secuenciales (o
dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las
acciones previas. Este conocimiento no necesariamente tiene que ser perfecto; sólo debe
consistir en algo de información. Por ejemplo, un jugador1 puede conocer que un jugador2 no
realizó una acción determinada, pero no saber cuál de las otras acciones disponibles eligió.
La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones

discutidas previamente. La forma normal se usa para representar juegos simultáneos, y la
extensiva para representar juegos secuenciales.
Juegos de información perfecta:
Un subconjunto importante de los juegos secuenciales es el conjunto de los juegos de información perfecta.
Un juego es de información perfecta si todos los jugadores conocen los movimientos que han efectuado
previamente todos los otros jugadores; así que sólo los juegos secuenciales pueden ser juegos de
información perfecta, pues en los juegos simultáneos no todos los jugadores (a menudo ninguno) conocen
las acciones del resto. La mayoría de los juegos estudiados en la teoría de juegos son juegos de
información imperfecta, aunque algunos juegos interesantes son de información perfecta, incluyendo el
juego del ultimátum y el juego del ciempiés. También muchos juegos populares son de información
perfecta, incluyendo el ajedrez y el go.
La información perfecta se confunde a menudo con la información completa, que es un concepto similar. La
información completa requiere que cada jugador conozca las estrategias y recompensas del resto, pero no
necesariamente las acciones.
En los juegos de información completa cada jugador tiene la misma "información relevante al juego" que los
demás jugadores. El ajedrez y el dilema del prisionero ejemplifican juegos de información completa. Los
juegos de información completa ocurren raramente en el mundo real, y los teóricos de los juegos,
usualmente los ven sólo como aproximaciones al juego realmente jugado.

Juegos de longitud infinita:
Por razones obvias, los juegos estudiados por los economistas y los juegos del mundo real finalizan
generalmente tras un número finito de movimientos. Los juegos matemáticos puros no tienen estas
restricciones y la teoría de conjuntos estudia juegos de infinitos movimientos, donde el ganador no se
conoce hasta que todos los movimientos se conozcan.
El interés en dicha situación no suele ser decidir cuál es la mejor manera de jugar a un juego, sino
simplemente qué jugador tiene una estrategia ganadora (Se puede probar, usando el axioma de elección,
que hay juegos —incluso de información perfecta, y donde las únicas recompensas son "perder" y
"ganar"— para los que ningún jugador tiene una estrategia ganadora.) La existencia de tales estrategias
tiene consecuencias importantes en la teoría descriptiva de conjuntos.

Juegos combinatorios:
Los juegos en los que la dificultad de encontrar una estrategia óptima proviene de la multiplicidad de
movimientos posibles se denominan juegos combinatorios. Algunos ejemplos de estos juegos pueden
ser ajedrez y go. Los juegos que implican información imperfecta o incompleta también pueden tener
un fuerte carácter combinatorio, por ejemplo, el backgammon. No hay una teoría unificada que se
ocupa de los elementos combinatorios en los juegos. Hay, sin embargo, herramientas matemáticas que
pueden resolver problemas particulares y responder a preguntas generales.
Se han estudiado juegos de información perfecta en la teoría combinatoria de juegos, que ha

desarrollado nuevas representaciones, como por ejemplo los números surrealistas, así como métodos
de prueba combinatorios y algebraicos (y a veces no constructivos) para resolver juegos de ciertos
tipos, incluyendo juegos "loopy" que pueden dar lugar a secuencias de movimientos infinitamente
largas. Estos métodos se dirigen a juegos con mayor complejidad combinatoria que los normalmente
considerados en la teoría de juegos tradicional (o "económica"). Un juego típico que se ha resuelto de
esta manera es hexadecimal. Un campo relacionado de estudio, basado en la teoría de la complejidad
computacional, es la complejidad del juego, que se ocupa de estimar la dificultad computacional de
encontrar estrategias óptimas.

Juegos discretos y continuos:
Gran parte de la teoría de juegos se refiere a juegos finitos y discretos, que tienen un número finito de jugadores,
movimientos, eventos, resultados, etc. Sin embargo, muchos conceptos pueden extenderse. Los juegos continuos
permiten a los jugadores elegir una estrategia a partir de un conjunto de estrategias continuas. Por ejemplo, la
competición de Cournot se modela típicamente con las estrategias de los jugadores cualesquiera cantidades no
negativas, incluyendo cantidades fraccionarias.
Juegos diferenciales:
Los juegos diferenciales como el juego de búsqueda continua y evasión son juegos continuos donde la evolución de
las variables de estado de los jugadores se rige por ecuaciones diferenciales. El problema de encontrar una
estrategia óptima en un juego diferencial está estrechamente relacionado con la teoría del control óptimo. En
particular, existen dos tipos de estrategias: las estrategias de bucle abierto utilizan el principio de Pontryagin
máximo, mientras que las estrategias de bucle cerrado utilizan el método de programación dinámica de Bellman.
Un caso particular de juegos diferenciales son los juegos con un horizonte temporal aleatorio. En estos juegos, el
tiempo terminal es una variable aleatoria con una función de distribución de probabilidad dada. Por lo tanto, los
jugadores maximizar la expectativa matemática de la función de costo. Se demostró que el problema de
optimización modificado se puede reformular como un juego diferencial con descuento en un intervalo de tiempo
infinito.

Juegos de muchos jugadores y poblaciones:
Los juegos con un número arbitrario, pero finito, de jugadores a menudo se denominan juegos
de la n-persona. La teoría evolutiva de los juegos considera los juegos que involucran a una
población de tomadores de decisiones, donde la frecuencia con la que se toma una decisión
particular puede cambiar con el tiempo en respuesta a las decisiones tomadas por todos los
individuos de la población. En biología, esto se utiliza para modelar la evolución (biológica),
donde los organismos programados genéticamente pasan a lo largo algo de su programación
de la estrategia a su descendencia. En economía, la misma teoría está destinada a captar los
cambios de población porque las personas juegan el juego muchas veces dentro de su vida, y
conscientemente (y quizás racionalmente) cambiar las estrategias.

Existen dos formas de representar los juegos:
- Forma extensiva
- Forma estratégica o normal
Forma extensiva:
Un juego en forma extensiva es una especificación de un juego en la teoría de juegos, que permite (como su
nombre sugiere) la representación explícita de una serie de aspectos importantes, como la secuencia de
movimientos posibles de los jugadores, sus elecciones en cada punto de decisión, lo imperfecto de la
información que cada jugador tiene en algunos movimientos del otro jugador cuando él toma una decisión, y
sus ganancias para todos los resultados posibles del juego. Juegos en forma extensiva también permitir la
representación de la información incompleta en forma de casualidades codificados como " se mueve por
naturaleza".
Formas de representar los juegos

Forma estratégica o normal:
En la teoría de juegos, la forma estratégica (o forma normal) es una forma de describir un juego
usando una matriz. El juego se define poniendo a cada lado de la matriz de los diferentes actores
(en este caso los jugadores 1 y 2), cada una de las estrategias o de elecciones que pueden
tomar (en este caso las estrategias A y B) y los conjuntos de beneficios que cada uno recibirá
dada una de las estrategia (p1A, p2A ; p1A,p2B ; p1B,p2A ; p1B,p2B).
La forma estratégica nos permite analizar rápidamente cada posible resultado de un juego. Por
ejemplo, en la matriz adyacente, si el jugador 1 elige la estrategia A y el jugador 2 elige la
estrategia B, el conjunto de pagos sería p1A, p2B. Si el jugador 1 elige la estrategia B y el
jugador 2 elige la estrategia A, el conjunto de pagos sería p1B, p2A.
La forma estratégica es por lo general la descripción correcta para juegos simultáneos, donde
ambos jugadores eligen de forma simultánea. Por otro lado, para los juegos secuenciales es
mejor describir el juego usando la forma extensiva (o en forma de árbol). Vale la pena mencionar
que los juegos simultáneos implican que existe información completa e imperfecta, y las reglas
del juego, así como los pagos de cada jugador, son de conocimiento común.

Las estrategias dominantes son consideradas como mejores que otras estrategias, sin
importar lo que otros jugadores hagan. En la teoría de juegos, hay dos tipos de dominio
estratégico:
-una estrategia estrictamente dominante es la estrategia que siempre proporciona una

mayor utilidad a un jugador, independientemente de la estrategia del otro jugador;
-una estrategia débilmente dominante es la estrategia que proporciona al menos la misma

utilidad para todas las estrategias del otro jugador, y estrictamente superior para alguna
de sus estrategias.

La formulación de juegos se usa para determinar el comportamiento de un juego dependiendo
de la selección de una o varias alternativas de decisión. Para esto se utiliza la matriz de pago
la cual se encarga de almacenar las distintas combinaciones de alternativas de decisión y
estados de la naturaleza. Las entradas pueden expresar utilidad, costo, tiempo, u otra medida
de resultado apropiada según la situación.
Ejemplo:
Tenemos una matriz de pago de dos jugadores J1y J2 Donde aij: sera el pago que recibe J1, si elige la i-
enesima estrategia y J2 la j-enesima estrategia.
Y bij: sera el pago que recibe J2, si elige la j-enesima estrategia y J1 elige la i-esima estrategia.
¿En qué consiste la formulación de juegos?

Dos políticos, contendientes entre sí, se postularon para el Senado de Estados Unidos. En este
momento ellos están haciendo sus planes de campaña para los dos últimos días anteriores a las
elecciones; se espera que dichos días sean cruciales por ser tan próximos al final. Por esto, ambos
quieren emplearlos para hacer campaña en dos ciudades importantes: Bigtown y Megalopolis. Para
evitar pérdidas de tiempo, están planeando viajar en la noche y pasar un día completo en cada ciudad
o dos días en sólo una de las ciudades. Como deben hacer los arreglos necesarios por adelantado,
ninguno de los dos sabrá lo que su oponente tiene planeado hasta después de concretar sus propios
planes. Cada político tiene un jefe de campaña en cada ciudad para asesorarlo en cuanto al impacto
que tendrán (en términos de votos ganados o perdidos) las distintas combinaciones posibles de los
días dedicados a cada ciudad por ellos o por sus oponentes. Ellos quieren emplear esta información
para escoger su mejor estrategia para estos dos días.
Solución de juegos sencillos

FORMULACIÓN.
Para formular este problema como un juego de dos personas y suma cero, se deben identificar los dos
jugadores (obviamente los dos políticos), las estrategias de cada jugador y la matriz de pagos. Según la
forma en que se estableció el problema, cada jugador tiene tres estrategias:
Estrategia 1 = pasar un día en cada ciudad.

Estrategia 2 = pasar ambos días en Bigtown.
Estrategia 3 = pasar ambos días en Megalopolis.
Por el contrario, las estrategias serían más complicadas en una situación diferente en la que cada político
pudiera saber en dónde pasará su oponente el primer día antes de concluir sus propios planes para el
segundo día. En ese caso, una estrategia normal sería: pasar el primer día en Bigtown; si el oponente
también pasa el día en Bigtown, entonces quedarse el segundo día ahí; sin embargo, si el oponente pasa
el primer día en Megalopolis, entonces pasar el segundo día en dicho lugar. Habría ocho estrategias de
este tipo, una para cada combinación de las dos posibilidades para el primer día, las dos para el primer
día del oponente y las dos alternativas para el segundo día.

Cada elemento de la matriz de pagos para el jugador 1 representa la utilidad para ese jugador (o la
utilidad negativa para el jugador II) de los resultados obtenidos cuando los dos jugadores emplean las
estrategias correspondientes. Desde el punto de vista de los políticos, el objetivo es ganar votos y cada
voto adicional (antes de conocer el resultado de las elecciones) tiene el mismo valor para él. Entonces,
los elementos apropiados en la matriz de pagos se darán en términos del total neto de votos ganados
a su oponente (esto es, la suma de la cantidad neta de cambios de votos en las dos ciudades) como
resultado de estos dos días de campaña. En la siguiente tabla se resume esta formulación.

También debe hacerse notar que esta matriz de pagos no sería apropiada si se contara con
información adicional. En particular, si se conociera cuáles son los planes de votación de las masas
dos días antes de las elecciones, el único significado de los datos proporcionados en la tabla anterior
sería el de indicar cuál es el político que ganaría las elecciones con cada combinación de
estrategias. Como la meta final es ganar la elección y la consecuencia del tamaño de la mayoría es
relativa, los elementos de utilidad en la matriz deben ser constantes positivas (como + 1 cuando el
político 1 gana y -1 cuando pierde). Aun cuando sólo se pudiera determinar una probabilidad de
ganar, para cada combinación de estrategias, los elementos apropiados de la matriz serían la
probabilidad de ganar menos la probabilidad de perder, pues de esta forma representarían las
utilidades esperadas. Sin embargo, casi nunca se dispone de datos con la suficiente exactitud como
para hacer ese tipo de determinaciones. Con la forma que se usó en la tabla anterior, se darán tres
conjuntos de datos para la matriz de pagos, a fin de ilustrar cómo se resuelven tres tipos distintos de
juegos.

Variación I. Si la siguiente tabla representa la matriz de pagos para los políticos
(jugadores), la pregunta es: ¿cuál será la estrategia que deberá elegir cada uno?

Esta situación es bastante especial, en ella se puede obtener la respuesta con sólo aplicar el
concepto de estrategia dominada para eliminar una serie de estrategias inferiores hasta que
quede sólo una para elegir. Específicamente, se puede eliminar una estrategia cuando está
dominada por otra, es decir, si existe otra estrategia que siempre es al menos tan buena como
ésta, sin importar lo que hace el oponente. En principio, la tabla no incluye estrategias dominadas
para el jugador II; pero para el jugador 1, la estrategia 3 está dominada por la estrategia 1, ya que
tiene pagos más altos (1 > 0, 2 > 1, 4 > -1) independientemente de lo que haga el jugador II. Al
eliminar la estrategia 3, se obtiene la matriz de pagos reducida:

Como se supone que ambos jugadores son racionales, también el jugador II puede deducir que el jugador I
sólo dispone de estas dos estrategias. Entonces, ahora el jugador II tiene una estrategia dominada: la
estrategia 3, que está dominada tanto por la estrategia 1 como por la 2 puesto que siempre tienen menores
pérdidas (pagos al jugador I) en esta matriz de pagos reducida (para la estrategia 1: 1 < 4, 1 < 5; para la
estrategia 2: 2 < 4, 0 < 5). Al eliminar esta estrategia se obtiene

En este punto, la estrategia 2 del jugador I se convierte en dominada por la estrategia 1, ya que esta
última es mejor en la columna 2 (2 > 0) e igual en la columna 1 (1 > l). Si se elimina esta estrategia
dominada se llega a
En donde la estrategia 2 del jugador II está dominada por la estrategia 1 (1 < 2). En consecuencia, ambos
jugadores deberán elegir su estrategia 1. Con esta solución, el jugador 1 recibirá un pago de 1 por parte del jugador
II (esto es, el político 1 ganará 1000 votos al político II). En general, el pago para el jugador 1 cuando ambos
jugadores juegan de manera óptima recibe el nombre de valor del juego. Se dice que se trata de un juego justo
nada más cuando el juego tiene valor cero. El concepto de estrategia dominada es muy útil para reducir el tamaño
de la matriz de pagos en cuestión y en algunos casos raros como éste puede, de hecho, identificar la solución
óptima del juego.

Variación 2. Dadas las estrategias de filas dominantes, es fácil obtener un resultado esperado. Ahora se
presenta un caso en el que no existen filas dominantes por lo que el juego se desarrolla de otra manera.
Dada la siguiente matriz de pagos se deduce lo siguiente:
El enfoque conservador a la lección de la mejor estrategia es suponer lo peor y actuar de conformidad con ello.
Así según este enfoque y con referencia en la matriz de pagos. Si A decide sobre la estrategia a1, supondría
que B escogerá la estrategia b2, reduciendo con ello el pago a1 para A aun valor mínimo o de seguridad de –
11. Análogamente, los valores de seguridad para a2 y a3 son –8 y –13, respectivamente.

Obsérvese que los valores de seguridad para los distintos movimientos que puede hacer A son los mínimos de
filas. Dados estos valores mínimos, hará bien en emplear aquella estrategia que da el máximo de estos valores
de seguridad mínimos. En el ejemplo A debe adoptar a2 y aspira a un pago de –8 a B. Esta regla de decisión,
que conduce a la elección del mayor de los valores mínimos en que puede resultar cada estrategia, se llama
estrategia maximin.
Entonces, B según esta actitud conservadora, supondría que, por cada una de sus acciones, la respuesta de A será
tal que la ganancia de A en parte del mercado es la máxima posible. Por ejemplo, si B emplea la estrategia b1,
supondría que A adoptara la estrategia a3, la cual dará la peor perdida posible para B. Análogamente, los peores
pagos para b2 y b3 son –8 y –1, los máximos valores en las columnas 2 y 3, respectivamente. Así, vemos que el
máximo en cada columna es el peor pago por un movimiento correspondiente hecho por B. El mejor de estos
peores pagos es claramente el valor mínimo de estas cifras más altas. Esta cifra –8 en la columna 2,
correspondiente a la estrategia b2 y el movimiento contrario a2. Por tanto, la emisión optima, llamada estrategia
minimax de B, es b2.

Se puede observar según la regla maximin de A y la regla minimax de B el pago es –8. Esta cantidad se llama valor del juego. Si
es positivo, se dice que el juego es a favor de A, si es negativo, favorece a B; y, si es cero, se dice que el juego es equitativo. La
solución de nuestro problema da un pago de –8, que indica que el juego favorece a B porque B gana 8 por 100 del mercado a
expensas de A.
Punto de silla de montar:
Se ha alcanzado ahora un punto en el que si A adopta la estrategia maximin a2 su pago es exactamente igual al que B espera
que obtenga A sí B emplea la estrategia minimax b2. Lo interesante de este caso es que no importa si el jugador A tiene
información acerca de lo que va a hacer B, ya que esta solución a la que se ha llegado es la mejor solución que buscarán la
mejor estrategia que les haga perder lo mínimo posible. Entonces esta combinación ofrece a A y B una medida de seguridad
Esto es así porque el criterio de decisión maximin de A da a A la "máxima" parte del mercado que puede impedirse a B que
reduzca más, y que la regla minimax de B ofrece a B la "mínima" parte del mercado que puede impedirse a A que aumente más.
En otras palabras, las estrategias maximin y minimax conducen a los dos jugadores del juego a situaciones en las que ningún
jugador tiene razón o incentivo alguno para cambiar su posición. A no desea cambiar porque cuando B juega b2, él se encuentra
mejor jugando a2 que a1 o a3. B no desea cambiar porque cuando A juega a2 se encuentra mejor jugando b2 que b1 o b3.
Evidentemente, se ha alcanzado una situación de equilibrio.

Punto de silla de montar
El pago en tal punto de equilibrio es la solución minimax y se conoce como punto de silla de montar de la
matriz de pagos en el sentido de que es el mínimo de sus datos de columna. Considerémosla solución del par
de decisiones en nuestro ejemplo a2 y b2. Cuando A adopte a2 el pago se reduce de 9 a –8 y luego aumenta
de –8 a -6.
Cuando B escoge b2, su pago aumenta de –11 a –8 y luego disminuye de –8 a –10. El numero –8 en medio
forma un valle cuando es visto desde la segunda fila. Y forma una cordillera cuando es visto desde la segunda
columna. La solución minimax semeja exactamente una silla de montar: de ahí el nombre de "punto en silla de
montar", que es a la vez un mínimo, como un valle máximo, como una cordillera.

Variación 3.
Finalmente llegamos a la última de las variaciones interesantes que se encuentran en estos juegos de suma
cero para dos jugadores. En este caso se presenta la siguiente matriz de pagos: e se puede esperar si se supone
que ambos jugadores son seres racionales

Supóngase que ambos jugadores quieren aplicar el criterio mínimas, igual que en la variación 2. El jugador 1
puede garantizar que no perderá más de dos si no juega la estrategia 1. de la misma manera, el jugador 2 puede
asegurar que no perderá más de 2 si elige la estrategia 3. Sin embargo, vemos que el valor máximo (-2) y el
valor mínimo (2) no coinciden en este caso. El resultado es que no hay punto silla. Se puede observar que el
jugador 1 ganaría 2 al jugador 2. Pero, como este es racional puede prever el resultado con lo que concluiría que
puede actuar mejor si gana 2 en lugar de perder 2 al jugar la estrategia 2. Como el jugador 1 también es
racional, prevendría este cambio y concluiría que él también puede mejorar mucho, de –2 a 4, si cambia a la
estrategia 2. Al darse cuenta de esto, el jugador 2 tomaría en cuenta regresar a la estrategia 3 para convertir la
pérdida de 4 en una ganancia de 3. Este cambio posible causaría que el jugador 1 usara de nuevo la estrategia
1, después de lo cual volvería a comenzar todo el ciclo. En pocas palabras la solución sugerida en un principio
(usando el criterio minmax inicial) es una solución inestable.

Siempre que un juego no tenga punto silla, la teoría de juegos aconseja a cada jugador asignar una distribución
de probabilidad sobre su conjunto de estrategias. Para expresar esto matemáticamente, sea
Xi = probabilidad de que el jugador I use la estrategia i Yj = probabilidad de que el jugador II use la estrategia j
Donde (i = 1, 2, m) y donde (j = 1,2,...,n)
Donde m y n son el número de estrategia disponible. Así, el jugador I especificara su plan de juego asignando
valores a X1, X2, Xm. Como estos valores son probabilidades, tendrán que ser no negativos y sumar 1. De igual
manera, el plan para el jugador II se describe mediante los valores que asigne a sus variables de decisión Y1,
Y2,..., Yn. Por lo general se hace referencia a estos planes (X1, X2,..., Xm) y (Y1, Y2,... Yn) con el nombre de
estrategias mixtas, y entonces las estrategias originales se llaman estrategias puras.
Juegos con estrategias mixtas

En el momento de jugar, es necesario que cada participante use una de sus estrategias puras, pero esta
estrategia pura se elegirá mediante algún dispositivo aleatorio para obtener una observación aleatoria que siga
la distribución de probabilidad especificada por la estrategia mixta; esta observación indicara la estrategia pura
que se debe usar.
A manera de ilustración, supóngase que los jugadores I y II en la variación 3 del problema de la campaña
política eligen las estrategias mixtas (X1, X2, X3) = (½, ½, 0) y (Y1, Y2, Y3) = (0, ½, ½), respectivamente. Esta
selección indica que el jugador I está dando igual oportunidad (probabilidad ½ ) de elegir las estrategias puras
1 o 2, pero que está descartando por completo la estrategia 3. De manera análoga, el jugador II está eligiendo
al azar entre sus dos últimas estrategias puras. Para llevar a cabo la jugada, cada jugador podría tirar una
moneda al aire para determinar cuál de sus dos estrategias aceptables usara.

Aunque no se cuenta con una medida de desempeño satisfactoria para evaluar las estrategias mixtas, la matriz de
pago es una herramienta útil. Al aplicar la definición de valor esperado de la teoría de probabilidad, esta cantidad
es
Pago Esperado = PijXiYj
En donde pij es el pago si el jugador I usa la estrategia pura i y el jugador II usa la estrategia pura j. En el ejemplo
de estrategias mixtas que se acaba de dar existen cuatro pagos posibles (-2, 2, 4, 3), en donde cada uno ocurre
con una probabilidad de 1/4 , el pago esperado es ¼ (-2 + 2 + 4 + 3) = ¼. Así esta medida de desempeño no
revela nada sobre los riesgos inherentes al juego, pero indica a qué cantidad tiende el pago promedio si el juego
se efectuara muchas veces.

Al usar esta medida, la teoría de juegos puede extender el concepto del criterio minimax a juegos que no tienen punto silla y
que, por tanto, necesitan estrategias mixtas. En este contexto, el criterio minimax dice que un jugador debe elegir la
estrategia mixta que minimice la máxima perdida esperada para sí mismo. Si se analizan los pagos (jugador 1) en lugar de
las perdidas (jugador 2), este criterio es maximin, es decir, maximizar el pago esperado mínimo para el jugador. Así, la
estrategia mixta para el jugador 1 que, de acuerdo con este criterio, es óptima y es la que proporciona la garantía que es la
mejor. (El valor de esta mejor garantía es el valor maximin)
Recuérdese que cuando solo se utilizan estrategias puras, resulta que los juegos que no tienen punto silla son inestables.
La razón esencial es que el valor maximin es menor que el valor minimax, por lo que los jugadores quieren cambiar sus
estrategias para mejorar su posición. De manera parecida, en los juegos con estrategias mixtas es necesario que el valor
maximin sea igual al valor minimax para que la solución óptima sea estable.
Según el teorema minimax de la teoría de juegos esta condición siempre se cumple para estos juegos
Teorema Minimax. Si se permiten estrategias mixtas, el par de estrategias que es óptimo de acuerdo con el criterio minimax
proporciona una solución estable con valor maximin igual al valor minimax, igual al valor del juego: de manera que ninguno
de los dos jugadores puede mejorar cambiando unilateralmente su estrategia

Estáticos: Ningún jugador observa las acciones de ningún otro antes de tomar sus decisiones, y cada jugador
solo tiene un turno. Se puede dar en dos casos:
• Juegos simultáneos.
• Juegos secuénciales, pero sin posibilidad de monitoreo de acciones previas. (los turnos pueden no ser
simultáneos, pero cada jugador no puede observar las movidas de quienes deciden antes que él.
Información Completa: Cada jugador conoce la función objetivo de cada uno de sus contrincantes.
Note que, como ya mencionamos, la condición de estáticos implica que cada jugador solo tiene una
contingencia para decidir. Entonces las estrategias vienen a ser iguales a las acciones.
Juegos estáticos con información completa

Ejemplo:
Escogencia de precio por Cervecerías Bavaria vs. Leona: Un duopolio donde las firmas escogen entre tres
posibles precios tratando de maximizar su participación. Se queda con el mercado (10 unidades) el que cobre el
menor precio, se lo reparten por partes iguales si cobran el mismo precio.
Conceptos de Solución:
• Eliminación de las estrategias estrictamente dominadas:

Para un jugador “i”, una estrategia Si' es estrictamente dominada por otra Si # si, sin importar lo que los demás
jugadores escojan, al jugador i le conviene más jugar Si' que jugar Si #. Más formalmente:
• Dominación estricta: J s' es estrictamente dominada por s J * si para cualquier posible combinación de acciones
de sus contrincantes, J obtiene mayor utilidad con s J * que con J s’. O, de manera más concisa:

Denote s-J como la combinación de estrategias de los contrincantes de J (s-J = {s1,s2,…,sJ-1,sJ+1,…,sN})
entonces J s' es estrictamente dominada por s J * , si:
Lo importante para que una estrategia de un jugador sea estrictamente dominada por otra es que genere
estrictamente menor utilidad sin importar que estrategia(s) escoja(n) el (los) contrincante (s). Por ejemplo:
Note que en el dilema del prisionero (N) es estrictamente dominada por (C). ¿Ayuda esto a solucionar los
juegos? En el dilema del prisionero no parece lógico jugar (N) si me va a peor que con (C) sin importar qué
haga mi contrincante. Entonces uno esperaría que ninguno juegue (N) y la solución sea {C, C}. Tomemos
ahora un juego más complicado: el juego de Bavaria y Leona. ¿Hay alguna estrategia estrictamente
dominada para Leona?... No, pero sí para Bavaria: Precio alto es estrictamente dominada por precio bajo.
Entonces Leona sabe que Bavaria no jugaría Alto, por cuanto Leona sabe que en realidad se enfrenta al
juego:

Como vemos, Medio ahora es estrictamente dominado para Leona. Entonces Leona no jugaría Medio. Bavaria
sabe entonces que se enfrenta a:

Dado esto, Bavaria prefiere jugar Bajo. Este proceso (Bavaria sabe que Leona sabe que Bavaria no jugaría
Alto, entonces Bavaria saber que Leona no Jugaría Medio por cuanto Bavaria sólo jugaría Bajo) se conoce
como “eliminación iterativa de estrategias dominadas”. De manera más general, el proceso consiste en:
1. Comparar las estrategias de un jugador por pares, hasta hallar una que sea estrictamente dominada.
2. Eliminar la dominada.
3. Comparar de nuevo las estrategias de algún jugador en parejas en el juego modificado hasta que haya una
que sea estrictamente dominada.
4. Eliminarla. Y así sucesivamente…
El proceso en ocasiones lleva a una solución (combinación de estrategias). Cuando lo hace, la solución es
plausible. En el anterior ejemplo, la solución que arroja el proceso es: (Baja, Baja). El resultado asociado es
que cada firma pone un precio bajo y ambas obtienen utilidad de 5.

El proceso se basa en dos supuestos claves:
1. Nadie juega una estrategia estrictamente dominada: porque sin importar lo que otros hagan, le va a ir peor
que con otra estrategia.
2. Cada jugador confía en la racionalidad de los demás. Entonces confía en que no jugarán las estrategias
estrictamente dominadas.
Virtudes de este método de solución: Intuitivo y Plausible. Esta es una forma relativamente sencilla e intuitiva
de llegar a una solución. El método también es robusto en el sentido en que la respuesta no depende del orden
en que se desarrolle el proceso de eliminación.

Es, en la teoría de juegos, un “concepto de solución” para juegos con dos o más jugadores, el cual asume que:
• Cada jugador conoce y ha adoptado su mejor estrategia, y

• Todos conocen las estrategias de los otros.
Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan las suyas. Así,
cada jugador está ejecutando el mejor "movimiento" posible teniendo en cuenta los movimientos de los demás jugadores.
En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, y saben que lo
han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros. Consecuentemente, ningún jugador
tiene ningún incentivo para modificar individualmente su estrategia.
Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes,
sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Es perfectamente posible que el resultado
fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción.
En términos económicos, es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas
compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia.
Teorema de Nash
Ejemplo:
Quizás el mejor ejemplo de un equilibrio de Nash es la variación del conocido “dilema del
prisionero” modificado a fin de resaltar los efectos descritos. En esta versión hay varios jugadores
(más de tres). El resultado sería mejor para todos si todos cooperaran entre ellos y no declararan,
pero, dado que cada cual persigue su propio interés, y ninguno puede confiar en que nadie
declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación
(equilibrio) en la cual cada uno minimiza su posible pérdida.
Modificaciones adicionales permiten repetir el juego de forma indefinida (por ejemplo, con los
jugadores repartiendo un “botín”, etc.). En todas esas situaciones resulta que la estrategia de no
cooperar es la que minimiza el riesgo de pérdidas y otorga una ganancia media pero segura para
cada jugador individual, pero la cooperación maximizaría la ganancia tanto a nivel individual como
de grupo.
Teorema de Nash
3.2 SINTESIS DE LOS PRINCIPALES JUEGOS
Desarrolle una síntesis de cada uno de los siguientes juegos:
- Dilema de los prisioneros – Modelo de Cournot

- La caza del siervo
- La batalla de los sexos
- El juego del Gallina
- Juegos de votación (política)
• Juegos dinámicos con información completa
• El juego del tres pies
• El juego del cien pies
• Juego del ultimátum
• Juegos repetidos
• Juegos cooperativos.
dos prisioneros, sospechosos de robo, pasan a estar en custodia de la policía. Sin embargo, los policías no
tienen suficientes pruebas para condenarlos de ese crimen, sólo para condenarlos por el cargo de posesión de
bienes robados, que conlleva una pena mucho menor. Si ninguno de ellos confiesa (cooperan entre sí), ambos
serán sentenciados a la pena menor, un año de prisión cada uno. La policía los interrogará en salas de
interrogatorio diferentes, lo que significa que los dos prisioneros no pueden comunicarse entre ellos (por lo tanto
tendrán información imperfecta). La policía tratará de convencer a cada prisionero de que confiese el crimen,
ofreciéndoles salir libres de inmediato, mientras que el otro prisionero será condenado a una pena de diez años.
Si ambos prisioneros confiesan, cada preso será condenado a ocho años. A ambos prisioneros se les ofrece el
mismo trato, ambos conocen las consecuencias de cada acción (información completa) y son completamente
conscientes de que al otro prisionero se le ha ofrecido el mismo trato (por lo tanto la información es de
conocimiento común)
El dilema del prisionero

En teoría de juegos, la caza del ciervo es un juego que describe un conflicto entre seguridad y cooperación
social. Otros nombres para este juego o sus variantes son "juego de la seguridad", "juego de coordinación"
y "dilema de la credibilidad". Jean-Jacques Rousseau describió una situación en la que dos individuos van a
cazar. Cada uno elige cazar un ciervo o una liebre. Cada jugador debe elegir una acción sin conocer la del
otro. Si un individuo caza un ciervo, debe cooperar con su compañero para tener éxito. Un jugador
individual puede cazar una liebre por sí mismo, pero una liebre vale menos que un ciervo. Esta situación se
considera una analogía importante con la cooperación social.
Un ejemplo de la matriz de recompensas para la caza del ciervo sería:
La casa del siervo

• Dinámicos: Al menos un jugador observa cómo actúa al menos otro jugador antes de tomar su propia
decisión. Movidas secuenciales (al menos algunas).
• Información Completa: Cada jugador conoce la función objetivo de cada uno de sus contrincantes.
Con frecuencia la representación más útil de estos juegos es la representación extensiva, que
discutimos en el capítulo I. Recuerde también que una estrategia para un jugador i es un plan de acción
completo, es decir, especifica una acción para cada posible situación en que i es llamada a actuar.
Entonces en juegos dinámicos, una estrategia de i especifica una acción para cada posible secuencia de
movidas previas que pueden llevar a un nodo de decisión de i. Por lo anterior, en juegos dinámicos las
estrategias son distintas a las acciones.
Juegos dinámicos con información completa

Ejemplo:
El alcalde va a someter a votación del concejo el presupuesto para el año siguiente. Sabe que para que el
presupuesto pase necesita los votos de 3 concejales que tienen gran apoyo en el norte de la ciudad. Estos a su
vez, querrían presionar al alcalde para que antes de pasar el presupuesto haga un parque en su zona de la
ciudad. La matriz de pagos es la siguiente:

Suponga que queremos encontrar los Equilibrios de Nash, para lo que hacemos la representación normal.
Usaremos la notación (X, Y) para una estrategia de los concejales, donde la primera componente corresponde
a lo que harían si el alcalde no hiciera parque, y la segunda lo que haría si el parque se construyera. Usaremos
las abreviaciones NP=no parque, P=parque, N=no aprobar, A=aprobar.
Como usted puede comprobar, hay 3 Equilibrios de Nash: ((NP, (A, N)), (NP, (A, A)), (P, (N, N)), asociadas a los
resultados posibles "se hace el parque y los concejales no aprueban" y "no se hace el parque y los concejales
aprueban". La primera de estas opciones, sin embargo, no parece tener mucho sentido. En el árbol de juego es
claro que, si el alcalde no cede a la presión por hacer el parque, lo que más convendrá a los concejales es aprobar
el presupuesto, y esto maximizaría la utilidad del alcalde. Tiene sentido entonces pensar que el alcalde no hará el
parque. ¿Por qué hay entonces in Equilibrio de Nash que no captura esta predicción? Note que en el equilibrio (P,
(N, N)) la estrategia de los concejales es óptima dado que el alcalde hizo parque (lo que refleja el carácter de EN),
pero no todas las componentes de la estrategia son óptimas individualmente. En particular, la estrategia de éstos
les señala no aprobar si no hay parque, lo que no es óptimo para ellos. Si se reconociera este hecho, el alcalde no
jugaría P.

se caracteriza por ser un juego didáctico entre 2 personas, que se enfrentan a otros grupos de parejas de
personas. Participantes: Cada padre con su hijo.
Procedimiento:
Cada niño se coloca al costado de su papá, con las piernas semi abiertas, se atarán una pierna del niño con
una del padre. Se utilizará alguna cinta o soga que no lastime a los participantes, ya que al correr esta va
rozando con fuerza.
De esta manera correrán con "tres piernas", a una señal deberán correr hasta la meta. Se puede complicar el
juego, pidiéndoles a los corredores que busquen un objeto, lo traigan y que se lo entreguen al coordinador del
juego. Gana quien llegue primero con el objeto y con las "tres piernas".
Los participantes también pueden ser papá y mamá.
Se pueden realizar varias carreras por familias intercambiando las parejas, y se irán sumando puntos. Gana la
familia que más puntaje acumuló.
El juego del tres pies

El Juego del Ciempiés es un experimento que se fundamenta en una competición entre dos contrincantes,
estudiada por la Teoría de juegos introducida en 1981 por primera vez por Robert Rosental y que sirve para
ejemplificar juegos de información perfecta que no pueden ser representados por una Matriz de pagos pero
sí en Forma extensiva. Así como la excepción entre la representación del resultado teórico y del resultado
empírico.
El énfasis lo da la capacidad de cooperación y nuestra capacidad para representar las necesidades

personales sobre las del contrincante.
El juego del cien pies

Reglas del juego:
• Dos jugadores
• Dos montones de monedas, primer montón tiene 2 monedas, el segundo montón tiene 0
• Por turno cada jugador debe elegir entre:
1.- Quedarse con el monto más grande y dar el más pequeño, al contrario.
2.- Pasar ambos montones, al contrario.
• Cada vez que un jugador elige la opción 2, los montones crecen 1 moneda
• Si el juego llega a los 100 turnos y ninguno de los jugadores elige la opción 1, el juego termina y nadie gana
nada.
El juego del cien pies

El juego del ultimátum es un juego experimental dentro de la Teoría de Juegos, al igual que otros
conocidos juegos como el dilema del Prisionero o el juego del Dictador.
A un jugador [Oferente (Proposer, conocido en el lenguaje anglosajón)] se le propone que reparta una
determinada cantidad de dinero (generalmente 100$) con otro jugador
[Respondedor (Responder, conocido en el lenguaje anglosajón)], según le convenga, haciendo una
única y definitiva propuesta. El Respondedor, por su parte, podrá aceptar o no dicha propuesta. En
caso de no aceptar, ningún jugador ganaría nada. Por el contrario, si acepta se procede al reparto
según la propuesta realizada por el Oferente.
Juego del ultimátum

El juego del ultimátum se usa como evidencia contra las teorías del homo economicus pues muestra que
las elecciones sobre criterios de justicia y equidad priman sobre las de beneficio. En este sentido,
podemos decir que el homo economicus solo basa su utilidad en los pagos materiales, pero así
podemos demostrar que en la realidad hay otras cosas que importan al individuo.
Juego del ultimátum

En la teoría de juegos, los juegos repetidos, también conocidos como superjuegos, son los que se
juegan y otra vez por un período de tiempo, y por lo tanto generalmente se representan usando la
forma extensiva. A diferencia de los juegos de un solo turno, los juegos repetidos introducen una nueva
serie de incentivos: la posibilidad de cooperar entre jugadores para recibir unos pagos continuamente,
sabiendo que, si no mantenemos nuestra parte del trato, nuestro oponente puede decidir dejar de
cooperar. Nuestra oferta de cooperación o nuestra amenaza de dejar de cooperar tiene que ser creíble
para que nuestro oponente mantenga su parte del trato. Analizar si el acuerdo es creíble consiste
simplemente en analizar que tiene un valor superior: la recompensa que ganamos si rompemos
nuestro pacto en un momento dado, lo que conlleva una ganancia excepcional durante el turno en el
que se rompe el acuerdo, o continuar la cooperación con
rentabilidades inferiores, pero que se dan durante todos los turnos. Por lo tanto, cada jugador debe
tener en cuenta las posibles estrategias de castigo de su oponente.
Juegos repetidos
Esto significa que el universo de estrategias es mayor que en cualquier juego simultáneo o secuencial de una
sola jugada. Cada jugador va a determinar sus estrategias o movimientos teniendo en cuenta todos los
movimientos anteriores hasta ese momento. Además, dado que cada jugador tendrá en cuenta esta
información, van a jugar el juego basándose en el comportamiento del oponente, y por lo tanto deben tener en
cuenta también los posibles cambios en el comportamiento del oponente a la hora de tomar decisiones.
Los juegos repetidos proporcionan diferentes beneficios en cada repetición, dependiendo de la estrategia de
cada jugador. Dado que estos beneficios se dan en diferentes puntos en el tiempo, con el fin de analizar los
juegos repetidos, hay que comparar la suma de los pagos descontados de cada jugador, que para las
repeticiones infinitas y repeticiones finitas se calculan utilizando las siguientes fórmulas:
Dónde:
-P: suma descontada de pagos;
-t: número de la repetición en la que el juego está;
-n: número total de repeticiones (juegos repetidos finitos);
-pt: el pago en la repetición en la que el juego está;
-r: la tasa de descuento.
Juegos repetidos
EJEMPLO:
Dilema del prisionero repetido:

En el juego conocido como el dilema del prisionero, el equilibrio de Nash es confesar. Con el fin de ver lo qué equilibrio se
alcanza en un juego repetido de tipo dilema del prisionero, hay que analizar dos casos: cuando el juego se repite un
número finito de veces, y cuando el juego se repite un número infinito de veces.
Cuando los presos saben el número de repeticiones, es interesante operar una inducción hacia atrás para resolver el
juego. Hay que tener en cuenta las estrategias de cada jugador cuando se dan cuenta de que la próxima ronda va a ser la
última. Se comportan como si se tratara de un juego de una única repetición, por lo tanto, se aplica el equilibrio de Nash y
el equilibrio será confesar-confesar, al igual que en el juego de una sola repetición. Consideremos ahora la penúltima
ronda. Dado que cada jugador sabe que en la siguiente ronda (la última) ambos van a confesar, no hay ningún beneficio
al mentir (cooperar entre sí) en esta ronda tampoco. La misma lógica se aplica para las rondas anteriores. Por lo tanto,
confesar-confesar es el equilibrio de Nash para todas las rondas.
La situación con un número infinito de repeticiones es diferente. Puesto que no habrá última ronda, un razonamiento de
inducción hacia atrás no funciona aquí. En cada ronda, los dos prisioneros calculan que habrá otra ronda y por lo tanto
siempre hay beneficios derivados de la estrategia de cooperar (en la que ambos mienten). Sin embargo, los presos deben
tener en cuenta las estrategias de castigo, en caso de que el otro jugador confiese en cualquier ronda.
Juegos repetidos
Juego de la granja:
En este juego cooperativo no existe un número limitado de jugadores, ya que consiste en hacer dos
equipos y que uno de ellos gane imitando a animales y reuniendo a todos los que se elijan para formar la
que será nuestra granja. El juego consiste que todos los que participan se sienten, se extiendan sobre el
campo de juego, con los ojos cerrados, teniendo que imitar cada uno de ellos a un animal de granja. Es
bueno repasar los animales que se van a utilizar, así como sus sonidos antes de comenzar el juego.
Cuando el instructor comienza el juego, los participantes deben mantener los ojos cerrados y empezar a
gatear en busca de otros compañeros que estén haciendo el mismo sonido que ellos. El primer equipo en
reunir a todos sus animales es el equipo ganador.
Juegos cooperativos
3.3. Aplicaciones de la teoría de juegos a la vida diaria
la Teoría de los Juegos se aplica en diversos órdenes de investigación más provechosos

para el ser humano, desde la psicología a la biología de las especies y su selección
natural, o la filosofía. Y cómo no, a la economía, rama del conocimiento al que afectan
numerosísimos factores exógenos relacionados con el comportamiento individual.
El estudio y análisis de duopolios, oligopolios, estructuras de redes sociales y las

diferentes estrategias frente a cada una de esas estructuras están basadas en la
aplicación de la teoría que desarrolló el también matemático John Forbes Nash (Le
recordaréis por ser el protagonista de la película “Una mente maravillosa”) y que sin ser
economista ganó el Premio Nobel de economía en 1994.
PARTE 4. CADENAS DE MARKOV
La cadena de Markov, también conocida como modelo de Markov o proceso de Markov, es un concepto
desarrollado dentro de la teoría de la probabilidad y la estadística que establece una fuerte dependencia
entre un evento y otro suceso anterior. Su principal utilidad es el análisis del comportamiento de procesos
estocásticos.
Existen diferentes fenómenos, muchos de ellos en el campo social, que presentan una evolución
temporal tal que permite modelarlos según un proceso de Markov.
Un proceso de Markov es una serie de experimentos en que cada uno tiene m posibles resultados, E1,
E2.....Em, y la probabilidad de cada resultado depende exclusivamente del que se haya obtenido en
los experimentos previos.
Por ejemplo: si en el mercado hay tres marcas de detergentes, cada una de las cuales tiene una cierta
porción de dicho mercado en la semana 1, la semana siguiente la distribución puede cambiar
dependiendo de las decisiones del consumidor (seguir con la misma marca o cambiar por otra), y esta
decisión depende mucho de la última compra. Muchas otras situaciones presentan este patrón de
comportamiento: los valores de las acciones de la bolsa día a día, la distribución de la población entre
diferentes regiones año a año etc.
El proceso de Markov
Probabilidad absoluta: Es el promedio de una suma predeterminada y además consiste en saber cual
es el número o símbolo de mayor equivalencia. (ni) de una variable estadística Xi, es el número de
veces que este valor aparece en el estudio. A mayor tamaño de la muestra aumentará el tamaño de la
frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la
muestra estudiada (N).
En la teoría de los procesos estocásticos y, en particular, en la teoría de las cadenas de Markov, se

denomina probabilidad de transición, Py, a la probabilidad de que estando el sistema en
el estado E¡ en el momento n pase al estado E¡ en el momento n + 1.
¿Qué son las probabilidades absolutas y de transición?

Bibliografía
• https://financialred.com/como-aplicar-la-teoria-de-juegos-en-tu-vida-diaria/
• https://economipedia.com/definiciones/cadena-de-markov.html
• http://dinamica-de-sistemas.com/revista/0605h.htm
• http://pyezona52.blogspot.com/2014/10/315-probabilidad-absoluta.html
• PEREZ JOAQUIN, JIMENO JOSE LUIS Y CERDA EMILIO.TEORIA DE JUEGOS. ED

PRENTICE HALL. MADRID 2004.
• HILLER, FREDERICK. INTRODUCCION A LA INVESTIGACION DE OPERACIONES .

SEXTA EDICION. ED MC GRAW HILL.
Bibliografía
• https://www.bbc.com/mundo/noticias/2015/02/150220_teoria_de_jueg
os_que_es_finde_dv
• https://economipedia.com/definiciones/teorema-de-bayes.html
• https://www.ecured.cu/Criterio_de_Wald_o_Maximin
• https://es.slideshare.net/yojanntrejohuaman/tema-teoria-de-juegos

Estocasticos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estocasticos

Cargado por

Copyright:

Formatos disponibles

TALLER UNIDAD 2

UNIVERSIDAD DE CORDOBA FACULTA DE

¿en qué consiste una decisión?

La toma de decisiones está basada en cinco elementos básicos:

¿Cuál es la historia de la teoría de juegos?

¿Cuál es la historia de la teoría de juegos?

John Forbes Nash Nicolas Bernoulli

Personajes que han influido en la teoría de juegos

A que se le denomina jugador y pagos.

Resultados del juego: El resultado de un juego es una cierta asignación de

A que se le denomina estrategia y resultados del juego

Clasificación de los juegos

Clasificación de los juegos

Dos jugadores negocian tanto quieren invertir en un contrato. La teoría de la negociación

La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones

Clasificación de los juegos

Clasificación de los juegos

Se han estudiado juegos de información perfecta en la teoría combinatoria de juegos, que ha

Clasificación de los juegos

Clasificación de los juegos

Clasificación de los juegos

Formas de representar los juegos

Formas de representar los juegos

-una estrategia estrictamente dominante es la estrategia que siempre proporciona una

-una estrategia débilmente dominante es la estrategia que proporciona al menos la misma

Formas de representar los juegos

¿En qué consiste la formulación de juegos?

Solución de juegos sencillos

Estrategia 1 = pasar un día en cada ciudad.

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Punto de silla de montar:

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Solución de juegos sencillos

Donde (i = 1, 2, m) y donde (j = 1,2,...,n)

Juegos con estrategias mixtas

Juegos con estrategias mixtas

Pago Esperado = PijXiYj

Juegos con estrategias mixtas

Juegos con estrategias mixtas

Juegos estáticos con información completa

• Eliminación de las estrategias estrictamente dominadas:

Juegos estáticos con información completa

Juegos estáticos con información completa

Juegos estáticos con información completa

Juegos estáticos con información completa

Juegos estáticos con información completa

• Cada jugador conoce y ha adoptado su mejor estrategia, y

Desarrolle una síntesis de cada uno de los siguientes juegos:

- Dilema de los prisioneros – Modelo de Cournot

El dilema del prisionero

Un ejemplo de la matriz de recompensas para la caza del ciervo sería:

La casa del siervo

Juegos dinámicos con información completa

Juegos dinámicos con información completa