Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTEGRANTES:
ANDRÉS CABARCAS
KEVIN ANAYA
DANIELA DELGADO
ANDERSON GIRONZA
Una decisión es una resolución o determinación en la que se toma respecto a algo. Se conoce como toma de decisiones al proceso que consiste en realizar una elección entre
diversas alternativas; La toma de decisiones puede aparecer en cualquier contexto de la vida cotidiana, ya sea a nivel profesional, sentimental, familiar, etc. El proceso, en esencia,
permite resolver los distintos desafíos a los que se debe enfrentar una persona o una organización.
A la hora de tomar una decisión, entran en juego diversos factores. En un caso ideal, se apela a la capacidad analítica (también llamada de razonamiento) para escoger el mejor
camino posible; cuando los resultados son positivos. Cualquier toma de decisiones debería incluir un amplio conocimiento del problema que se desea superar, ya que solo luego
del pertinente análisis es posible comprenderlo y dar con una solución adecuada. Sobra decir que ante cuestiones triviales (por ejemplo, decidir si tomar agua o zumo de naranja
en una comida), el nivel de razonamiento es mucho menos complejo y profundo, y se actúa de forma casi automática, dado que las consecuencias de una decisión equivocada no
tienen mayor importancia.
En cambio, ante decisiones verdaderamente trascendentales para la vida, se procede de una manera muy meticulosa, sopesando los
potenciales resultados, y el tiempo necesario es mucho mayor. A lo largo del desarrollo de una persona, independientemente de su
personalidad y de sus gustos, cada nuevo día trae consigo un número creciente de problemas a resolver, y poco a poco nos vamos
convirtiendo en auténticas máquinas especializadas en tomar decisiones.
A simple vista, se puede distinguir entre individuos seguros e inseguros de sí mismos. Los primeros suelen ser determinados, tener siempre
claros sus gustos y necesidades, lo cual les facilita la toma de decisiones; los otros, en cambio, carecen de la autoconfianza necesaria para
considerar válidas sus propias ideas, y eso repercute gravemente en los momentos críticos de la vida.
¿a qué se le denomina tomar una decisión?
En la toma de decisiones importa la elección de un camino a seguir, por lo que en un estado anterior deben evaluarse
alternativas de acción. Si estas últimas no están presentes, no existirá decisión. Para tomar una decisión, cual sea su
naturaleza, es necesario conocer, comprender y analizar un problema, para así poder darle una solución. En algunos casos,
por ser tan simples y cotidianos, este proceso se realiza de forma implícita y se soluciona muy rápidamente, pero existen
otros casos en los cuales las consecuencias de una mala o buena elección pueden tener repercusiones en la vida y si es en
un contexto laboral en el éxito o fracaso de la organización, para los cuales es necesario realizar un proceso más
estructurado que puede dar más seguridad e información para resolver el problema. Examina las posibles consecuencias de
cada una de las alternativas planteadas En otras palabras, planear una decisión es elegir las mejores alternativas posibles
para la realización de un proyecto o una actividad.
¿Cuáles son los criterios de decisión?
Toda decisión viene motivada en origen por la existencia de un problema que se ha detectado y que se pretende solucionar.
Decidir consiste en la elección de una posible solución entre varios recursos de acción alternativos. Por tanto, no se puede
hablar de toma de decisiones ante una situación problemática para lo que no existe más que una alternativa. Cuando existe
una solución posible del problema, no hay capacidad de elección y por tanto, no hay decisión.
Aun en el caso de contar con varias alternativas posibles, para poder hablar de decisión es necesario que el decisor esté
capacitado y dispuesto a dedicar cierto tiempo y recursos a analizar el problema y sus posibles soluciones.
• Información.
• Conocimientos.
• Experiencia.
• Análisis.
• Juicio.
ANALISIS DE DECISIONES CON INFORMACIÓN MUESTRAL
Generalmente los que toman decisiones hacen una serie de evaluaciones preliminares o de cálculo de
probabilidad previo, para cada uno de los estados establecidos. Sin embargo, es posible que para tomar una
mejor decisión se requiera buscar información adicional. Esto con el fin de revisar o actualizar las
probabilidades anteriores, de modo que al decidir se base en probabilidades precisas. Esta información
adicional se obtiene a partir de experimentos diseñados para obtener información muestral.
como, por ejemplo, el muestreo de materias primas, las pruebas de productos y la investigación de
mercados. A las probabilidades resultantes de estos estudios se les denomina probabilidades posteriores.
Para tomar mejores decisiones, en este método se usan los arboles de decisiones, lo que permite una
secuencia lógica para la toma de decisiones y eventos aleatorios, estos árboles son los que permiten escoger
una estrategia de decisión la cual consiste en recorrer la secuencia del árbol de decisión de atrás hacia
adelante.
VALOR ESPERADO DE LA INFORMACION MUESTRAL:
se utiliza para determinar las estrategias de decisión más óptima para la investigación que se
está realizando.
El cálculo del valor esperado de la información muestral se realiza de la siguiente manera:
VEIM = VEcIM – VesIM
Donde:
VEIM: es el valor esperado de la información muestral
VEcIM: es el máximo rendimiento posible esperado con información muestral
VEsIM: es el máximo rendimiento posible esperado sin información muestral
Ejemplo: supongamos que la empresa kmp tiene establecido el VEcIM = $15.93 y el VEsIM =
$14.20 calcule el VEIM a partir de esta información
Respuesta:
VEIM = | $15.93 - $14.20 | = $1.73
Por lo tanto, el VEIM va ser igual a $1.73
DIAGRAMA DE INFLUENCIA APLICADO A LA TEORIA DE DECISIONES:
Un diagrama de influencia es una forma gráfica de modelar un sistema. Sirve para modelar sistemas en que la
variación o introducción de un elemento afecta sobre la cantidad o presencia de otro elemento, para la lógica de
este análisis se necesita identificar todos los componentes que ejercen alguna influencia en el funcionamiento del
sistema, además, identificar la manera en que interactúan estos componentes.
En este diagrama los nodos representan los elementos relevantes de la situación, y cada elemento se representa
con un nodo distinto, los nodos cuadrados representan las decisiones que se deben tomar para alcanzar un
objetivo final, los nodos circulares representan variables cuyo valor se desconocen, los nodos con doble contorno
o amarillos son nodos determinísticos, este diagrama nos permite identificar a simple vista las variables que están
fuera de nuestro control. La secuencia de estos nodos se determina por flechas, estas a su vez, determinan que
evento precede del otro.
Algunas de las ventajas de estos diagramas son: es una herramienta complementaria al árbol de decisión, permite
identificar para cada variable incierta, la fuente que puede proveernos la información necesaria para decidir,
permite representar una situación con varios factores involucrados sin que su tamaño aumente
considerablemente.
Ejemplo:
¿teorema de Bayes en la toma de decisiones?
El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo información de antemano sobre ese
suceso.
Podemos calcular la probabilidad de un suceso A, sabiendo además que ese A cumple cierta característica que condiciona
su probabilidad. El teorema de Bayes entiende la probabilidad de forma inversa al teorema de la probabilidad total. El
teorema de la probabilidad total hace inferencia sobre un suceso B, a partir de los resultados de los sucesos A. Por su
parte, Bayes calcula la probabilidad de A condicionado a B.
El teorema de Bayes ha sido muy cuestionado. Lo cual se ha debido, principalmente, a su mala aplicación. Ya que,
mientras se cumplan los supuestos de sucesos disjuntos y exhaustivos, el teorema es totalmente válido.
Para calcular la probabilidad tal como la definió Bayes en este tipo de sucesos, necesitamos una fórmula. La fórmula se
define matemáticamente como:
Donde B es el suceso sobre el que tenemos información previa y A(n) son los distintos
sucesos condicionados. En la parte del numerador tenemos la probabilidad condicionada, y en
la parte de abajo la probabilidad total. En cualquier caso, aunque la fórmula parezca un poco
abstracta, es muy sencilla. Para demostrarlo, utilizaremos un ejemplo en el que en lugar de A
(1), A (2) y A (3), utilizaremos directamente A, B y C.
CRITERIO DE DECISION DE WALD:
Bajo este criterio se analizan los resultados que ofrecen cada una de las situaciones relacionadas con la
alternativa (estados de la naturaleza), de estas se escoge la peor condición. Esto se hace para todas las
alternativas y entre estas se escoge la alternativa que ofrece los mejores resultados entre los peores.
Este criterio no tiene en cuenta las probabilidades de los estados de la naturaleza, las probabilidades son
desconocidas o ignoradas.
Ejemplo:
Supongamos que el departamento de I+D de la empresa ficticia SHASHA de alimentación ha desarrollado un
nuevo paté Premium con sabores dulces incorporados (pasas, miel.). La dirección decide lanzarlo al
mercado lo antes posible, pues existe la duda de que al dejar la empresa el director de I+D, hay cierto temar
a que la competencia pueda adelantarse.
Las dudas de la empresa se centran en cuál deberá ser el precio de salida del producto: alto, medio o bajo. En
el primer caso se estiman unos beneficios por unidad de 9,00 euros si se adelanta a la competencia, de 5,40
euros si coinciden con la competencia en el lanzamiento de productos similares, y unas pérdidas de 1,80 euros
si lo hace primero la competencia.
Si se decide por el precio medio, las ganancias estimadas respectivamente serían: 6,30, 4,50 y 1,80 euros, y si
sale con el precio bajo los beneficios esperados, según que se adelante, coincida o se demore respecto a la
competencia, serían los siguientes: 2,70, 3,60 y 4,00 euros, respectivamente.
La matriz de decisión para el ejemplo aplicando este criterio es:
Una vez seleccionados los valores mínimos de cada una de las alternativas planteadas (alto, medio y bajo), nos
quedamos como alternativa final con el mayor de dichos valores (2,70).
Según el criterio pesimista, la alternativa más aconsejable sería lanzar el producto con un precio de salida bajo ya
que esta alternativa es la que proporciona el nivel de seguridad más alto.
CRITERIO DE SAVAGE:
Una vez tomada la decisión y producido el estado natural se obtiene un resultado; Savage argumenta que
después de conocer el resultado, el decisor puede arrepentirse de haber seleccionado una alternativa dada.
Savage sostiene que el decisor debe tratar de que ese arrepentimiento se reduzca al mínimo. El criterio es el
siguiente:
1.- Formar la matriz de arrepentimientos o de costo de oportunidad. A cada estado natural se determina el
mejor valor para ese estado natural. A cada estado natural le corresponde una columna en la matriz de
decisiones. En cada columna se determina el mejor valor para ese estado natural y se sustituye por un cero;
esto significa que si ocurre ese estado natural y escogimos la alternativa que le corresponde a ese valor
optimo, nuestro arrepentimiento será nulo. En sustitución de los valores del resto de la columna, se escribirá
la diferencia entre el resultado óptimo y los demás resultados; esta diferencia es el costo de oportunidad o
arrepentimiento por no haber escogido la alternativa que diera el valor óptimo. La matriz así formada se
conoce como: matriz de arrepentimientos, de costos de oportunidad o perdida de oportunidad.
2.- Una vez formada la matriz de perdida de oportunidad, Savage aconseja escoger la estrategia que
corresponde al mínimo de los arrepentimientos máximos, es decir, se aplica la regla minimax.
La alternativa seleccionada será aquella que minimiza el arrepentimiento. Este criterio tiene el inconveniente
de que el número de eventos considerados puede alterar la decisión. Además, la regla utilizada para
seleccionar el mínimo de los arrepentimientos máximos es similar al criterio de Wald, por lo tanto, tiene sus
inconvenientes.
Siguiendo con el ejemplo anterior, aplicaremos el criterio de Savage teniendo en cuenta su teoría.
Para poder calcular la matriz de decisión siguiendo el criterio de Savage es necesario calcular la matriz de
pérdidas relativas para cada columna de los posibles estados. Para ello restamos el mayor valor de cada
columna a cada uno de los valores de dicha columna. De tal forma tenemos que:
Máximo (Adelantarse) = 9,00
Máximo (Al mismo tiempo) = 5,40
Maximo (Retrasarse) = 4,00
Una vez seleccionados los valores máximos de las pérdidas relativas de cada una de las alternativas
planteadas (alto, medio y bajo), nos quedamos como alternativa final con el menor de dichos valores (2,70).
Según el criterio de Savage, la alternativa más aconsejable sería lanzar el producto con un precio de salida
medio ya que esta alternativa proporciona la menor de las mayores pérdidas relativas.
CRITERIO DE HURWICZ:
Este criterio distingue los resultados máximos y mínimos posibles de cada alternativa; hecho esto aplica el
factor de ponderación o llamado "índice de optimismo relativo", para llegar a la decisión mediante el cálculo de
utilidades esperadas. El criterio se aplica de la siguiente manera:
1. De la matriz de decisiones se seleccionan el mejor y el peor valor para cada alternativa, dando lugar a un
vector de óptimos y a otro de pésimos.
2. El vector de óptimos se afecta por un índice y el vector pesimista por otro, dicho índice varía entre cero y
uno
3. La suma de los vectores ya ponderados, da como resultado el vector de los valores esperados, la
alternativa seleccionada es aquella que corresponda al máximo valor esperado
Siguiendo con el ejemplo anterior, si aplicamos este criterio obtenemos:
La matriz de decisión, siguiendo el criterio de Hurwicz, se construye partiendo del coeficiente de optimismo y de
pesimismo. En nuestro ejemplo práctico, el coeficiente de optimismo es del 0,7 y de pesimismo del 0,3 por lo
que trabajaremos con los valores más altos y bajos de cada alternativa respectivamente. A continuación,
realizamos la media ponderada para cada alternativa:
P (alto) = -1,80 x 0,3 + 9,00 x 0,7 = 5,76
P (medio) = 1,80 x 0,3 + 6,30 x 0,7 = 4,95
P (bajo) = 2,70 x 0,3 + 4,00 x 0,7 = 3,61
Según el criterio de Hurwicz, la alternativa más aconsejable sería lanzar el producto con un precio de
salida alto ya que esta alternativa proporciona el mayor valor de las medias ponderadas.
3.1 CONCEPTUALIZACION PRELIMINAR. TEORIA DE JUEGOS CADA CONCEPTO DEBE
VISUALIZARSE AL MENOS CON DOS EJEMPLOS Y UN CASO APLICADO A LA VIDA REAL.
¿Qué es un juego?
Juego es toda actividad que realizan uno o más jugadores, empleando su imaginación o herramientas para crear una
situación con un número determinado de reglas, con el fin de proporcionar entretenimiento y diversión. Existen
juegos competitivos, donde los jugadores tienen que lograr un objetivo, y juegos no competitivos, donde los
jugadores buscan simplemente disfrutar del entretenimiento de la actividad y diversión. Los juegos normalmente se
diferencian de los trabajos por el objeto de su realización. Sin embargo, en muchos casos estos no tienen una
diferencia demasiado clara. Asimismo, el juego se utiliza como herramienta educativa, pues en la mayoría de los
casos funcionan estimulando habilidades prácticas psicológicas.
La primera discusión conocida de la teoría de juegos aparece en una carta escrita por James Waldegrave en 1713. En esta carta, Waldegrave
roporciona una solución mínima de estrategia mixta a una versión para dos personas del juego de cartas de Her. Sin embargo no se publicó un
análisis teórico de teoría de juegos en general hasta la publicación de Recherches sur les príncipes mathématiques de la théorie des richesses, de
Antoine Augustin Cournot en 1838. En este trabajo, Cournot considera un duopolio y presenta una solución que es una versión restringida del
equilibrio de Nash. Aunque el análisis de Cournot es más general que el de Waldegrave, la teoría de juegos realmente no existió como campo de
estudio aparte hasta que John von Neumann publicó una serie de artículos en 1928. Estos resultados fueron ampliados más tarde en su libro de
1944, The Theory of Games and Economic Behavior, escrito junto con Oskar Morgenstern. Este trabajo contiene un método para encontrar
soluciones óptimas para juegos de suma cero de dos personas. Durante este período, el trabajo sobre teoría de juegos se centró, sobre todo, en
teoría de juegos cooperativos. Este tipo de teoría de juegos analiza las estrategias óptimas para grupos de individuos, asumiendo que pueden
establecer acuerdos entre sí acerca de las estrategias más apropiadas. En 1950, aparecieron las primeras discusiones del dilema del prisionero, y se
emprendió un experimento acerca de este juego en la corporación RAND. Alrededor de esta misma época, John Nash desarrolló una definición de
una estrategia óptima para juegos de múltiples jugadores donde el óptimo no se había definido previamente, conocido como equilibrio de Nash. Este
equilibrio es suficientemente general, permitiendo el análisis de juegos no cooperativos además de los juegos cooperativos.
En 1965, Reinhard Selten introdujo su concepto de solución de los equilibrios perfectos del subjuego, que más adelante refinó el equilibrio de
Nash. En 1967 John Harsanyi desarrolló los conceptos de la información completa y de los juegos bayesianos. Él, junto con John Nash y
Reinhard Selten, ganaron el Premio Nobel de Economía en 1994. En la década de 1970 la teoría de juegos se aplicó extensamente a la
biología, en gran
parte como resultado del trabajo de John Maynard Smith y su concepto estrategia estable evolutiva. Además, los conceptos del equilibrio
correlacionado, la perfección del temblor de la mano, y del conocimiento común fueron introducidos y analizados En 2005, los teóricos de
juegos Thomas Schelling y Robert Aumann ganaron el premio Nobel de Economía. Schelling trabajó en modelos dinámicos, los primeros
ejemplos de la
teoría de juegos evolutiva. Por su parte, Aumann contribuyó más a la escuela del equilibrio.
Adam Smith
Pagos: se les denomina pagos a todas aquellas actividades donde el jugador uno,
pierde algún beneficio que gana el jugador dos. Es decir, los pagos se refieren a las
formas de ganancia que hay entre distintos caminos de decisión, dependiendo de que
tan eficientes son las alternativas escogidas por los jugadores.
Un juego simétrico es un juego en el que las recompensas por jugar una estrategia en particular
dependen sólo de las estrategias que empleen los otros jugadores y no de quien las juegue. Si las
identidades de los jugadores pueden cambiarse sin que cambien las recompensas de las
estrategias, entonces el juego es simétrico. Muchos de los juegos 2×2 más estudiados son
simétricos. Las representaciones estándar del juego de la gallina, el dilema del prisionero y la caza
del ciervo son juegos simétricos.
Los juegos asimétricos más estudiados son los juegos donde no hay conjuntos de estrategias
idénticas para ambos jugadores. Por ejemplo, el juego del ultimátum y el juego del dictador tienen
diferentes estrategias para cada jugador; no obstante, puede haber juegos asimétricos con
estrategias idénticas para cada jugador. Por ejemplo, el juego mostrado a la derecha es asimétrico a
pesar de tener conjuntos de estrategias idénticos para ambos jugadores.
En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada combinación de estrategias, siempre
suma cero (en otras palabras, un jugador se beneficia solamente a expensas de otros). El go, el ajedrez, el póker y el juego del
oso son ejemplos de juegos de suma cero, porque se gana exactamente la cantidad que pierde el oponente. Como curiosidad,
el fútbol dejó hace unos años de ser de suma cero, pues las victorias reportaban 2 puntos y el empate 1 (considérese que
ambos equipos parten inicialmente con 1 punto), mientras que en la actualidad las victorias reportan 3 puntos y el empate 1.
La mayoría de los ejemplos reales en negocios y política, al igual que el dilema del prisionero, son juegos de suma distinta de
cero, porque algunos desenlaces tienen resultados netos mayores o menores que cero. Es decir, la ganancia de un jugador no
necesariamente se corresponde con la pérdida de otro. Por ejemplo, un contrato de negocios involucra idealmente un
desenlace de suma positiva, donde cada oponente termina en una posición mejor que la que tendría si no se hubiera dado la
negociación.
Se puede analizar más fácilmente un juego de suma distinta de cero, y cualquier juego se puede transformar en un juego de
suma cero añadiendo un jugador "ficticio" adicional ("el tablero" o "la banca"), cuyas pérdidas compensen las ganancias netas
de los jugadores.
La matriz de pagos de un juego es una forma conveniente de representación. Por ejemplo, un juego de suma cero de dos
jugadores con la matriz que se muestra a la derecha
Un juego cooperativo se caracteriza por un contrato que puede hacerse cumplir. La teoría de los
juegos cooperativos da justificaciones de contratos plausibles. La plausibilidad de un contrato está
muy relacionada con la estabilidad.
Los juegos simultáneos son juegos en los que los jugadores mueven simultáneamente o en los
que éstos desconocen los movimientos anteriores de otros jugadores. Los juegos secuenciales (o
dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las
acciones previas. Este conocimiento no necesariamente tiene que ser perfecto; sólo debe
consistir en algo de información. Por ejemplo, un jugador1 puede conocer que un jugador2 no
realizó una acción determinada, pero no saber cuál de las otras acciones disponibles eligió.
Un subconjunto importante de los juegos secuenciales es el conjunto de los juegos de información perfecta.
Un juego es de información perfecta si todos los jugadores conocen los movimientos que han efectuado
previamente todos los otros jugadores; así que sólo los juegos secuenciales pueden ser juegos de
información perfecta, pues en los juegos simultáneos no todos los jugadores (a menudo ninguno) conocen
las acciones del resto. La mayoría de los juegos estudiados en la teoría de juegos son juegos de
información imperfecta, aunque algunos juegos interesantes son de información perfecta, incluyendo el
juego del ultimátum y el juego del ciempiés. También muchos juegos populares son de información
perfecta, incluyendo el ajedrez y el go.
La información perfecta se confunde a menudo con la información completa, que es un concepto similar. La
información completa requiere que cada jugador conozca las estrategias y recompensas del resto, pero no
necesariamente las acciones.
En los juegos de información completa cada jugador tiene la misma "información relevante al juego" que los
demás jugadores. El ajedrez y el dilema del prisionero ejemplifican juegos de información completa. Los
juegos de información completa ocurren raramente en el mundo real, y los teóricos de los juegos,
usualmente los ven sólo como aproximaciones al juego realmente jugado.
Por razones obvias, los juegos estudiados por los economistas y los juegos del mundo real finalizan
generalmente tras un número finito de movimientos. Los juegos matemáticos puros no tienen estas
restricciones y la teoría de conjuntos estudia juegos de infinitos movimientos, donde el ganador no se
conoce hasta que todos los movimientos se conozcan.
El interés en dicha situación no suele ser decidir cuál es la mejor manera de jugar a un juego, sino
simplemente qué jugador tiene una estrategia ganadora (Se puede probar, usando el axioma de elección,
que hay juegos —incluso de información perfecta, y donde las únicas recompensas son "perder" y
"ganar"— para los que ningún jugador tiene una estrategia ganadora.) La existencia de tales estrategias
tiene consecuencias importantes en la teoría descriptiva de conjuntos.
Los juegos en los que la dificultad de encontrar una estrategia óptima proviene de la multiplicidad de
movimientos posibles se denominan juegos combinatorios. Algunos ejemplos de estos juegos pueden
ser ajedrez y go. Los juegos que implican información imperfecta o incompleta también pueden tener
un fuerte carácter combinatorio, por ejemplo, el backgammon. No hay una teoría unificada que se
ocupa de los elementos combinatorios en los juegos. Hay, sin embargo, herramientas matemáticas que
pueden resolver problemas particulares y responder a preguntas generales.
Gran parte de la teoría de juegos se refiere a juegos finitos y discretos, que tienen un número finito de jugadores,
movimientos, eventos, resultados, etc. Sin embargo, muchos conceptos pueden extenderse. Los juegos continuos
permiten a los jugadores elegir una estrategia a partir de un conjunto de estrategias continuas. Por ejemplo, la
competición de Cournot se modela típicamente con las estrategias de los jugadores cualesquiera cantidades no
negativas, incluyendo cantidades fraccionarias.
Juegos diferenciales:
Los juegos diferenciales como el juego de búsqueda continua y evasión son juegos continuos donde la evolución de
las variables de estado de los jugadores se rige por ecuaciones diferenciales. El problema de encontrar una
estrategia óptima en un juego diferencial está estrechamente relacionado con la teoría del control óptimo. En
particular, existen dos tipos de estrategias: las estrategias de bucle abierto utilizan el principio de Pontryagin
máximo, mientras que las estrategias de bucle cerrado utilizan el método de programación dinámica de Bellman.
Un caso particular de juegos diferenciales son los juegos con un horizonte temporal aleatorio. En estos juegos, el
tiempo terminal es una variable aleatoria con una función de distribución de probabilidad dada. Por lo tanto, los
jugadores maximizar la expectativa matemática de la función de costo. Se demostró que el problema de
optimización modificado se puede reformular como un juego diferencial con descuento en un intervalo de tiempo
infinito.
Los juegos con un número arbitrario, pero finito, de jugadores a menudo se denominan juegos
de la n-persona. La teoría evolutiva de los juegos considera los juegos que involucran a una
población de tomadores de decisiones, donde la frecuencia con la que se toma una decisión
particular puede cambiar con el tiempo en respuesta a las decisiones tomadas por todos los
individuos de la población. En biología, esto se utiliza para modelar la evolución (biológica),
donde los organismos programados genéticamente pasan a lo largo algo de su programación
de la estrategia a su descendencia. En economía, la misma teoría está destinada a captar los
cambios de población porque las personas juegan el juego muchas veces dentro de su vida, y
conscientemente (y quizás racionalmente) cambiar las estrategias.
- Forma extensiva
- Forma estratégica o normal
Forma extensiva:
Un juego en forma extensiva es una especificación de un juego en la teoría de juegos, que permite (como su
nombre sugiere) la representación explícita de una serie de aspectos importantes, como la secuencia de
movimientos posibles de los jugadores, sus elecciones en cada punto de decisión, lo imperfecto de la
información que cada jugador tiene en algunos movimientos del otro jugador cuando él toma una decisión, y
sus ganancias para todos los resultados posibles del juego. Juegos en forma extensiva también permitir la
representación de la información incompleta en forma de casualidades codificados como " se mueve por
naturaleza".
En la teoría de juegos, la forma estratégica (o forma normal) es una forma de describir un juego
usando una matriz. El juego se define poniendo a cada lado de la matriz de los diferentes actores
(en este caso los jugadores 1 y 2), cada una de las estrategias o de elecciones que pueden
tomar (en este caso las estrategias A y B) y los conjuntos de beneficios que cada uno recibirá
dada una de las estrategia (p1A, p2A ; p1A,p2B ; p1B,p2A ; p1B,p2B).
La forma estratégica nos permite analizar rápidamente cada posible resultado de un juego. Por
ejemplo, en la matriz adyacente, si el jugador 1 elige la estrategia A y el jugador 2 elige la
estrategia B, el conjunto de pagos sería p1A, p2B. Si el jugador 1 elige la estrategia B y el
jugador 2 elige la estrategia A, el conjunto de pagos sería p1B, p2A.
La forma estratégica es por lo general la descripción correcta para juegos simultáneos, donde
ambos jugadores eligen de forma simultánea. Por otro lado, para los juegos secuenciales es
mejor describir el juego usando la forma extensiva (o en forma de árbol). Vale la pena mencionar
que los juegos simultáneos implican que existe información completa e imperfecta, y las reglas
del juego, así como los pagos de cada jugador, son de conocimiento común.
Ejemplo:
Tenemos una matriz de pago de dos jugadores J1y J2 Donde aij: sera el pago que recibe J1, si elige la i-
enesima estrategia y J2 la j-enesima estrategia.
Y bij: sera el pago que recibe J2, si elige la j-enesima estrategia y J1 elige la i-esima estrategia.
Para formular este problema como un juego de dos personas y suma cero, se deben identificar los dos
jugadores (obviamente los dos políticos), las estrategias de cada jugador y la matriz de pagos. Según la
forma en que se estableció el problema, cada jugador tiene tres estrategias:
Por el contrario, las estrategias serían más complicadas en una situación diferente en la que cada político
pudiera saber en dónde pasará su oponente el primer día antes de concluir sus propios planes para el
segundo día. En ese caso, una estrategia normal sería: pasar el primer día en Bigtown; si el oponente
también pasa el día en Bigtown, entonces quedarse el segundo día ahí; sin embargo, si el oponente pasa
el primer día en Megalopolis, entonces pasar el segundo día en dicho lugar. Habría ocho estrategias de
este tipo, una para cada combinación de las dos posibilidades para el primer día, las dos para el primer
día del oponente y las dos alternativas para el segundo día.
En donde la estrategia 2 del jugador II está dominada por la estrategia 1 (1 < 2). En consecuencia, ambos
jugadores deberán elegir su estrategia 1. Con esta solución, el jugador 1 recibirá un pago de 1 por parte del jugador
II (esto es, el político 1 ganará 1000 votos al político II). En general, el pago para el jugador 1 cuando ambos
jugadores juegan de manera óptima recibe el nombre de valor del juego. Se dice que se trata de un juego justo
nada más cuando el juego tiene valor cero. El concepto de estrategia dominada es muy útil para reducir el tamaño
de la matriz de pagos en cuestión y en algunos casos raros como éste puede, de hecho, identificar la solución
óptima del juego.
El enfoque conservador a la lección de la mejor estrategia es suponer lo peor y actuar de conformidad con ello.
Así según este enfoque y con referencia en la matriz de pagos. Si A decide sobre la estrategia a1, supondría
que B escogerá la estrategia b2, reduciendo con ello el pago a1 para A aun valor mínimo o de seguridad de –
11. Análogamente, los valores de seguridad para a2 y a3 son –8 y –13, respectivamente.
Entonces, B según esta actitud conservadora, supondría que, por cada una de sus acciones, la respuesta de A será
tal que la ganancia de A en parte del mercado es la máxima posible. Por ejemplo, si B emplea la estrategia b1,
supondría que A adoptara la estrategia a3, la cual dará la peor perdida posible para B. Análogamente, los peores
pagos para b2 y b3 son –8 y –1, los máximos valores en las columnas 2 y 3, respectivamente. Así, vemos que el
máximo en cada columna es el peor pago por un movimiento correspondiente hecho por B. El mejor de estos
peores pagos es claramente el valor mínimo de estas cifras más altas. Esta cifra –8 en la columna 2,
correspondiente a la estrategia b2 y el movimiento contrario a2. Por tanto, la emisión optima, llamada estrategia
minimax de B, es b2.
Se ha alcanzado ahora un punto en el que si A adopta la estrategia maximin a2 su pago es exactamente igual al que B espera
que obtenga A sí B emplea la estrategia minimax b2. Lo interesante de este caso es que no importa si el jugador A tiene
información acerca de lo que va a hacer B, ya que esta solución a la que se ha llegado es la mejor solución que buscarán la
mejor estrategia que les haga perder lo mínimo posible. Entonces esta combinación ofrece a A y B una medida de seguridad
Esto es así porque el criterio de decisión maximin de A da a A la "máxima" parte del mercado que puede impedirse a B que
reduzca más, y que la regla minimax de B ofrece a B la "mínima" parte del mercado que puede impedirse a A que aumente más.
En otras palabras, las estrategias maximin y minimax conducen a los dos jugadores del juego a situaciones en las que ningún
jugador tiene razón o incentivo alguno para cambiar su posición. A no desea cambiar porque cuando B juega b2, él se encuentra
mejor jugando a2 que a1 o a3. B no desea cambiar porque cuando A juega a2 se encuentra mejor jugando b2 que b1 o b3.
Evidentemente, se ha alcanzado una situación de equilibrio.
El pago en tal punto de equilibrio es la solución minimax y se conoce como punto de silla de montar de la
matriz de pagos en el sentido de que es el mínimo de sus datos de columna. Considerémosla solución del par
de decisiones en nuestro ejemplo a2 y b2. Cuando A adopte a2 el pago se reduce de 9 a –8 y luego aumenta
de –8 a -6.
Cuando B escoge b2, su pago aumenta de –11 a –8 y luego disminuye de –8 a –10. El numero –8 en medio
forma un valle cuando es visto desde la segunda fila. Y forma una cordillera cuando es visto desde la segunda
columna. La solución minimax semeja exactamente una silla de montar: de ahí el nombre de "punto en silla de
montar", que es a la vez un mínimo, como un valle máximo, como una cordillera.
Finalmente llegamos a la última de las variaciones interesantes que se encuentran en estos juegos de suma
cero para dos jugadores. En este caso se presenta la siguiente matriz de pagos: e se puede esperar si se supone
que ambos jugadores son seres racionales
Xi = probabilidad de que el jugador I use la estrategia i Yj = probabilidad de que el jugador II use la estrategia j
Donde m y n son el número de estrategia disponible. Así, el jugador I especificara su plan de juego asignando
valores a X1, X2, Xm. Como estos valores son probabilidades, tendrán que ser no negativos y sumar 1. De igual
manera, el plan para el jugador II se describe mediante los valores que asigne a sus variables de decisión Y1,
Y2,..., Yn. Por lo general se hace referencia a estos planes (X1, X2,..., Xm) y (Y1, Y2,... Yn) con el nombre de
estrategias mixtas, y entonces las estrategias originales se llaman estrategias puras.
A manera de ilustración, supóngase que los jugadores I y II en la variación 3 del problema de la campaña
política eligen las estrategias mixtas (X1, X2, X3) = (½, ½, 0) y (Y1, Y2, Y3) = (0, ½, ½), respectivamente. Esta
selección indica que el jugador I está dando igual oportunidad (probabilidad ½ ) de elegir las estrategias puras
1 o 2, pero que está descartando por completo la estrategia 3. De manera análoga, el jugador II está eligiendo
al azar entre sus dos últimas estrategias puras. Para llevar a cabo la jugada, cada jugador podría tirar una
moneda al aire para determinar cuál de sus dos estrategias aceptables usara.
En donde pij es el pago si el jugador I usa la estrategia pura i y el jugador II usa la estrategia pura j. En el ejemplo
de estrategias mixtas que se acaba de dar existen cuatro pagos posibles (-2, 2, 4, 3), en donde cada uno ocurre
con una probabilidad de 1/4 , el pago esperado es ¼ (-2 + 2 + 4 + 3) = ¼. Así esta medida de desempeño no
revela nada sobre los riesgos inherentes al juego, pero indica a qué cantidad tiende el pago promedio si el juego
se efectuara muchas veces.
Recuérdese que cuando solo se utilizan estrategias puras, resulta que los juegos que no tienen punto silla son inestables.
La razón esencial es que el valor maximin es menor que el valor minimax, por lo que los jugadores quieren cambiar sus
estrategias para mejorar su posición. De manera parecida, en los juegos con estrategias mixtas es necesario que el valor
maximin sea igual al valor minimax para que la solución óptima sea estable.
Según el teorema minimax de la teoría de juegos esta condición siempre se cumple para estos juegos
Teorema Minimax. Si se permiten estrategias mixtas, el par de estrategias que es óptimo de acuerdo con el criterio minimax
proporciona una solución estable con valor maximin igual al valor minimax, igual al valor del juego: de manera que ninguno
de los dos jugadores puede mejorar cambiando unilateralmente su estrategia
• Juegos simultáneos.
• Juegos secuénciales, pero sin posibilidad de monitoreo de acciones previas. (los turnos pueden no ser
simultáneos, pero cada jugador no puede observar las movidas de quienes deciden antes que él.
Información Completa: Cada jugador conoce la función objetivo de cada uno de sus contrincantes.
Note que, como ya mencionamos, la condición de estáticos implica que cada jugador solo tiene una
contingencia para decidir. Entonces las estrategias vienen a ser iguales a las acciones.
Escogencia de precio por Cervecerías Bavaria vs. Leona: Un duopolio donde las firmas escogen entre tres
posibles precios tratando de maximizar su participación. Se queda con el mercado (10 unidades) el que cobre el
menor precio, se lo reparten por partes iguales si cobran el mismo precio.
Conceptos de Solución:
Lo importante para que una estrategia de un jugador sea estrictamente dominada por otra es que genere
estrictamente menor utilidad sin importar que estrategia(s) escoja(n) el (los) contrincante (s). Por ejemplo:
Note que en el dilema del prisionero (N) es estrictamente dominada por (C). ¿Ayuda esto a solucionar los
juegos? En el dilema del prisionero no parece lógico jugar (N) si me va a peor que con (C) sin importar qué
haga mi contrincante. Entonces uno esperaría que ninguno juegue (N) y la solución sea {C, C}. Tomemos
ahora un juego más complicado: el juego de Bavaria y Leona. ¿Hay alguna estrategia estrictamente
dominada para Leona?... No, pero sí para Bavaria: Precio alto es estrictamente dominada por precio bajo.
Entonces Leona sabe que Bavaria no jugaría Alto, por cuanto Leona sabe que en realidad se enfrenta al
juego:
1. Comparar las estrategias de un jugador por pares, hasta hallar una que sea estrictamente dominada.
2. Eliminar la dominada.
3. Comparar de nuevo las estrategias de algún jugador en parejas en el juego modificado hasta que haya una
que sea estrictamente dominada.
4. Eliminarla. Y así sucesivamente…
El proceso en ocasiones lleva a una solución (combinación de estrategias). Cuando lo hace, la solución es
plausible. En el anterior ejemplo, la solución que arroja el proceso es: (Baja, Baja). El resultado asociado es
que cada firma pone un precio bajo y ambas obtienen utilidad de 5.
1. Nadie juega una estrategia estrictamente dominada: porque sin importar lo que otros hagan, le va a ir peor
que con otra estrategia.
2. Cada jugador confía en la racionalidad de los demás. Entonces confía en que no jugarán las estrategias
estrictamente dominadas.
Virtudes de este método de solución: Intuitivo y Plausible. Esta es una forma relativamente sencilla e intuitiva
de llegar a una solución. El método también es robusto en el sentido en que la respuesta no depende del orden
en que se desarrolle el proceso de eliminación.
Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan las suyas. Así,
cada jugador está ejecutando el mejor "movimiento" posible teniendo en cuenta los movimientos de los demás jugadores.
En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, y saben que lo
han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros. Consecuentemente, ningún jugador
tiene ningún incentivo para modificar individualmente su estrategia.
Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para los participantes,
sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Es perfectamente posible que el resultado
fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción.
En términos económicos, es un tipo de equilibrio de competencia imperfecta que describe la situación de varias empresas
compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentar maximizar su ganancia.
Teorema de Nash
Ejemplo:
Quizás el mejor ejemplo de un equilibrio de Nash es la variación del conocido “dilema del
prisionero” modificado a fin de resaltar los efectos descritos. En esta versión hay varios jugadores
(más de tres). El resultado sería mejor para todos si todos cooperaran entre ellos y no declararan,
pero, dado que cada cual persigue su propio interés, y ninguno puede confiar en que nadie
declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación
(equilibrio) en la cual cada uno minimiza su posible pérdida.
Modificaciones adicionales permiten repetir el juego de forma indefinida (por ejemplo, con los
jugadores repartiendo un “botín”, etc.). En todas esas situaciones resulta que la estrategia de no
cooperar es la que minimiza el riesgo de pérdidas y otorga una ganancia media pero segura para
cada jugador individual, pero la cooperación maximizaría la ganancia tanto a nivel individual como
de grupo.
Teorema de Nash
3.2 SINTESIS DE LOS PRINCIPALES JUEGOS
• Información Completa: Cada jugador conoce la función objetivo de cada uno de sus contrincantes.
Con frecuencia la representación más útil de estos juegos es la representación extensiva, que
discutimos en el capítulo I. Recuerde también que una estrategia para un jugador i es un plan de acción
completo, es decir, especifica una acción para cada posible situación en que i es llamada a actuar.
Entonces en juegos dinámicos, una estrategia de i especifica una acción para cada posible secuencia de
movidas previas que pueden llevar a un nodo de decisión de i. Por lo anterior, en juegos dinámicos las
estrategias son distintas a las acciones.
El alcalde va a someter a votación del concejo el presupuesto para el año siguiente. Sabe que para que el
presupuesto pase necesita los votos de 3 concejales que tienen gran apoyo en el norte de la ciudad. Estos a su
vez, querrían presionar al alcalde para que antes de pasar el presupuesto haga un parque en su zona de la
ciudad. La matriz de pagos es la siguiente:
Como usted puede comprobar, hay 3 Equilibrios de Nash: ((NP, (A, N)), (NP, (A, A)), (P, (N, N)), asociadas a los
resultados posibles "se hace el parque y los concejales no aprueban" y "no se hace el parque y los concejales
aprueban". La primera de estas opciones, sin embargo, no parece tener mucho sentido. En el árbol de juego es
claro que, si el alcalde no cede a la presión por hacer el parque, lo que más convendrá a los concejales es aprobar
el presupuesto, y esto maximizaría la utilidad del alcalde. Tiene sentido entonces pensar que el alcalde no hará el
parque. ¿Por qué hay entonces in Equilibrio de Nash que no captura esta predicción? Note que en el equilibrio (P,
(N, N)) la estrategia de los concejales es óptima dado que el alcalde hizo parque (lo que refleja el carácter de EN),
pero no todas las componentes de la estrategia son óptimas individualmente. En particular, la estrategia de éstos
les señala no aprobar si no hay parque, lo que no es óptimo para ellos. Si se reconociera este hecho, el alcalde no
jugaría P.
Procedimiento:
Cada niño se coloca al costado de su papá, con las piernas semi abiertas, se atarán una pierna del niño con
una del padre. Se utilizará alguna cinta o soga que no lastime a los participantes, ya que al correr esta va
rozando con fuerza.
De esta manera correrán con "tres piernas", a una señal deberán correr hasta la meta. Se puede complicar el
juego, pidiéndoles a los corredores que busquen un objeto, lo traigan y que se lo entreguen al coordinador del
juego. Gana quien llegue primero con el objeto y con las "tres piernas".
Se pueden realizar varias carreras por familias intercambiando las parejas, y se irán sumando puntos. Gana la
familia que más puntaje acumuló.
1.- Quedarse con el monto más grande y dar el más pequeño, al contrario.
2.- Pasar ambos montones, al contrario.
• Cada vez que un jugador elige la opción 2, los montones crecen 1 moneda
• Si el juego llega a los 100 turnos y ninguno de los jugadores elige la opción 1, el juego termina y nadie gana
nada.
A un jugador [Oferente (Proposer, conocido en el lenguaje anglosajón)] se le propone que reparta una
determinada cantidad de dinero (generalmente 100$) con otro jugador
[Respondedor (Responder, conocido en el lenguaje anglosajón)], según le convenga, haciendo una
única y definitiva propuesta. El Respondedor, por su parte, podrá aceptar o no dicha propuesta. En
caso de no aceptar, ningún jugador ganaría nada. Por el contrario, si acepta se procede al reparto
según la propuesta realizada por el Oferente.
Juegos repetidos
Esto significa que el universo de estrategias es mayor que en cualquier juego simultáneo o secuencial de una
sola jugada. Cada jugador va a determinar sus estrategias o movimientos teniendo en cuenta todos los
movimientos anteriores hasta ese momento. Además, dado que cada jugador tendrá en cuenta esta
información, van a jugar el juego basándose en el comportamiento del oponente, y por lo tanto deben tener en
cuenta también los posibles cambios en el comportamiento del oponente a la hora de tomar decisiones.
Los juegos repetidos proporcionan diferentes beneficios en cada repetición, dependiendo de la estrategia de
cada jugador. Dado que estos beneficios se dan en diferentes puntos en el tiempo, con el fin de analizar los
juegos repetidos, hay que comparar la suma de los pagos descontados de cada jugador, que para las
repeticiones infinitas y repeticiones finitas se calculan utilizando las siguientes fórmulas:
Dónde:
-P: suma descontada de pagos;
-t: número de la repetición en la que el juego está;
-n: número total de repeticiones (juegos repetidos finitos);
-pt: el pago en la repetición en la que el juego está;
-r: la tasa de descuento.
Juegos repetidos
EJEMPLO:
Cuando los presos saben el número de repeticiones, es interesante operar una inducción hacia atrás para resolver el
juego. Hay que tener en cuenta las estrategias de cada jugador cuando se dan cuenta de que la próxima ronda va a ser la
última. Se comportan como si se tratara de un juego de una única repetición, por lo tanto, se aplica el equilibrio de Nash y
el equilibrio será confesar-confesar, al igual que en el juego de una sola repetición. Consideremos ahora la penúltima
ronda. Dado que cada jugador sabe que en la siguiente ronda (la última) ambos van a confesar, no hay ningún beneficio
al mentir (cooperar entre sí) en esta ronda tampoco. La misma lógica se aplica para las rondas anteriores. Por lo tanto,
confesar-confesar es el equilibrio de Nash para todas las rondas.
La situación con un número infinito de repeticiones es diferente. Puesto que no habrá última ronda, un razonamiento de
inducción hacia atrás no funciona aquí. En cada ronda, los dos prisioneros calculan que habrá otra ronda y por lo tanto
siempre hay beneficios derivados de la estrategia de cooperar (en la que ambos mienten). Sin embargo, los presos deben
tener en cuenta las estrategias de castigo, en caso de que el otro jugador confiese en cualquier ronda.
Juegos repetidos
Juego de la granja:
En este juego cooperativo no existe un número limitado de jugadores, ya que consiste en hacer dos
equipos y que uno de ellos gane imitando a animales y reuniendo a todos los que se elijan para formar la
que será nuestra granja. El juego consiste que todos los que participan se sienten, se extiendan sobre el
campo de juego, con los ojos cerrados, teniendo que imitar cada uno de ellos a un animal de granja. Es
bueno repasar los animales que se van a utilizar, así como sus sonidos antes de comenzar el juego.
Cuando el instructor comienza el juego, los participantes deben mantener los ojos cerrados y empezar a
gatear en busca de otros compañeros que estén haciendo el mismo sonido que ellos. El primer equipo en
reunir a todos sus animales es el equipo ganador.
Juegos cooperativos
3.3. Aplicaciones de la teoría de juegos a la vida diaria
La cadena de Markov, también conocida como modelo de Markov o proceso de Markov, es un concepto
desarrollado dentro de la teoría de la probabilidad y la estadística que establece una fuerte dependencia
entre un evento y otro suceso anterior. Su principal utilidad es el análisis del comportamiento de procesos
estocásticos.
Existen diferentes fenómenos, muchos de ellos en el campo social, que presentan una evolución
temporal tal que permite modelarlos según un proceso de Markov.
Un proceso de Markov es una serie de experimentos en que cada uno tiene m posibles resultados, E1,
E2.....Em, y la probabilidad de cada resultado depende exclusivamente del que se haya obtenido en
los experimentos previos.
Por ejemplo: si en el mercado hay tres marcas de detergentes, cada una de las cuales tiene una cierta
porción de dicho mercado en la semana 1, la semana siguiente la distribución puede cambiar
dependiendo de las decisiones del consumidor (seguir con la misma marca o cambiar por otra), y esta
decisión depende mucho de la última compra. Muchas otras situaciones presentan este patrón de
comportamiento: los valores de las acciones de la bolsa día a día, la distribución de la población entre
diferentes regiones año a año etc.
El proceso de Markov
Probabilidad absoluta: Es el promedio de una suma predeterminada y además consiste en saber cual
es el número o símbolo de mayor equivalencia. (ni) de una variable estadística Xi, es el número de
veces que este valor aparece en el estudio. A mayor tamaño de la muestra aumentará el tamaño de la
frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la
muestra estudiada (N).
• https://financialred.com/como-aplicar-la-teoria-de-juegos-en-tu-vida-diaria/
• https://economipedia.com/definiciones/cadena-de-markov.html
• http://dinamica-de-sistemas.com/revista/0605h.htm
• http://pyezona52.blogspot.com/2014/10/315-probabilidad-absoluta.html
• https://www.bbc.com/mundo/noticias/2015/02/150220_teoria_de_jueg
os_que_es_finde_dv
• https://economipedia.com/definiciones/teorema-de-bayes.html
• https://www.ecured.cu/Criterio_de_Wald_o_Maximin
• https://es.slideshare.net/yojanntrejohuaman/tema-teoria-de-juegos