Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Temas N.º 2
TEORÍA DE DECISIONES Y DE JUEGOS
INTRODUCCIÓN.
En todo sistema social, un grupo de individuos debe evaluar las alternativas que puede
seguir frente a diversos estados probables de ocurrencia de variables no controlables
para tomar decisiones.
Por ejemplo, determinar los bienes por producir para optimizar las utilidades, cumpliendo
las restricciones de materiales disponibles con la aplicación de un programa lineal, la
determinación de un lote económico para el mantenimiento de los inventarios o el período
óptimo de reemplazo para un equipo.
De esta forma, la decisión es un proceso mental que todo ser vivo o grupo social practica
con el objetivo de optar por la alternativa que mejor satisfaga a los intereses establecidos.
Ejemplo Tipo:
La Empresa comercial “INVOP” debe decidir cuánto pedir en mercadería para la venta
de la próxima semana. Los datos estadísticos y la experiencia de la demanda indica que
el comportamiento de las últimas tres semanas fue de: 15; 35 y 55 unidades. El precio
de venta actual es de $12 y el precio de compra unitario de $8. En caso de tener un
excedente no vendido el precio de liquidación del producto es de $6. Y el costo por
pérdida de imagen por faltante del producto se estima es $2. Los tres valores diferentes
de la demanda representan un estado de la naturaleza diferente y la cantidad de
mercadería por pedir representa la decisión por tomar.
La toma de decisiones es el proceso mediante el cual se realiza una elección entre las
alternativas o formas para resolver diferentes situaciones de la vida, estas se pueden
presentar en diferentes contextos: a nivel laboral, familiar, sentimental, empresarial, etc.,
es decir, en todo momento se toman decisiones, la diferencia entre cada una de estas es
el proceso o la forma en la cual se llega a ellas.
La toma de decisiones a nivel individual es caracterizada porque una persona haga uso
de su razonamiento y pensamiento para elegir una decisión a un problema que se le
32
Investigación de Operaciones M.Sc. Javier Beltrán S.
presente en la vida; es decir, si una persona tiene un problema, ésta deberá ser capaz
de resolverlo individualmente a través de tomar decisiones con ese especifico motivo.
FIGURA N.º 16
NIVELES DE DECISIÓN EN LA ORGANIZACIÓN
33
Investigación de Operaciones M.Sc. Javier Beltrán S.
Por tanto, la mayor parte de los programas para el desarrollo de gerentes pretenden
mejorar sus habilidades para tomar decisiones no programadas, por regla general
enseñándoles a analizar los problemas en forma sistemática y a tomar decisiones lógicas.
A medida que se baja en esta jerarquía, las tareas que se desempeñan son cada vez
más rutinarias, por lo que las decisiones en estos niveles serán más estructuradas,
porque se toman frecuentemente, es decir son repetitivas y se convierte en una rutina
tomarlas; como el tipo de problemas que resuelve y se presentan con cierta regularidad
ya que se tiene un método bien establecido de solución y por lo tanto ya se conocen los
pasos para abordar este tipo de problemas, por esta razón, también se las llama
decisiones programadas.
La persona que toma este tipo de decisión no tiene la necesidad de diseñar ninguna
solución, sino que simplemente se rige por la que se ha seguido anteriormente.
Marketing
Producción
Finanzas
Recursos Humanos
Logística
34
Investigación de Operaciones M.Sc. Javier Beltrán S.
TABLA N.° 1
FORMA GENERAL DE UNA TABLA DE DECISIÓN
Estados de la Naturaleza
e1 e2 ... en
Probabilidad
35
Investigación de Operaciones M.Sc. Javier Beltrán S.
TABLA N.° 2
TABLA DE PAGOS PARA LA CÍA. INVOP
Evento
Estados de la Naturaleza (Demanda)
Acción
Decisión de: Demanda débil (15) Demanda media (35) Demanda fuerte (55)
Pedir 15 60 20 -20
Pedir 35 20 140 100
Pedir 55 -20 100 220
Las entradas de esta tabla representan el flujo de efectivo neto asociado con cada
combinación de cantidad ordenada y cantidad solicitada, menos el costo por la pérdida
de la buena reputación comercial, cuando la cantidad ordenada no es suficiente para
satisfacer la demanda.
La separación del proceso en etapas puede ser tan resumida o tan extensa como se
desee, pero podemos identificar principalmente las siguientes:
36
Investigación de Operaciones M.Sc. Javier Beltrán S.
tomar para solucionar el problema, cuantas más alternativas se tengan va ser mucho más
probable encontrar una que resulte satisfactoria.
Consiste en hacer un estudio detallado de cada una de las posibles soluciones que se
generaron para el problema, es decir mirar sus ventajas y desventajas, de forma
individual con respecto a los criterios de decisión, y una con respecto a la otra,
asignándoles un valor ponderado.
Como se explicó antes según los contextos en los cuales se tome la decisión, esta
evaluación va a ser más o menos exacta.
En esta etapa del proceso es importante el análisis crítico como cualidad del tomador de
decisiones.
f) Implementación de la decisión
Poner en marcha la decisión tomada para así poder evaluar si la decisión fue o no
acertada. La implementación probablemente derive en la toma de nuevas decisiones, de
menor importancia.
37
Investigación de Operaciones M.Sc. Javier Beltrán S.
El nuevo proceso que se inicie en caso de que la solución haya sido errónea, contará con
más información y se tendrá conocimiento de los errores cometidos en el primer intento.
Además, se debe tener conciencia de que estos procesos de decisión están en continuo
cambio, es decir, las decisiones que se tomen continuamente van a tener que ser
modificadas, por la evolución que tenga el sistema o por la aparición de nuevas variables
que lo afecten.
La teoría de decisiones proporciona una manera útil de clasificar modelos para la toma
de decisiones. Se supondrá que se ha definido el problema, que se tienen todos los datos
y que se han identificado los cursos de acción alternativos.
38
Investigación de Operaciones M.Sc. Javier Beltrán S.
CUADRO N.° 2
CLASIFICACIÓN DE LA TOMA DE DECISIONES
Categorías Consecuencias
Certidumbre Deterministas
Riesgo Probabilísticas
Incertidumbre Desconocidas
Los que toman las decisiones deben hacerlo en cuatro tipos de ambientes o condiciones
que impone el entorno. En el análisis de decisiones debe usarse un proceso racional para
seleccionar la mejor de varias alternativas. La “bondad” de una alternativa seleccionada
depende de la calidad de los datos que se usen para describir el caso de la decisión.
Desde este punto de vista, un proceso de toma de decisión puede caer en una de las
siguientes tres categorías:
Algunos de los modelos o técnicas utilizados para manejar estas decisiones son:
39
Investigación de Operaciones M.Sc. Javier Beltrán S.
Bajo riesgo, las decisiones se caracterizan porque los datos se pueden describir con
distribuciones de probabilidades.
Esta categoría en síntesis incluye aquellas decisiones para las que las consecuencias de
una acción dada dependen de algún evento probabilista. Los modelos a estudiar incluyen:
40
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 17
LA TOMA DE DECISIONES Y SUS PRINCIPALES CARACTERÍSTICAS
• No
Programadas
Decisiones
• Programadas
Decisiones
41
Investigación de Operaciones M.Sc. Javier Beltrán S.
decisiones bajo incertidumbre, al igual que bajo riesgo, implica acciones alternativas
cuyas retribuciones dependen de los varios estados de la naturaleza.
Así Wald propone las siguientes relaciones tanto para beneficios y costos
respectivamente:
Su aplicación consiste en escoger por fila los mayores valores y de entre ellos, el
mayor en caso de beneficios e inversamente en caso de que la matriz sea de
costos:
42
Investigación de Operaciones M.Sc. Javier Beltrán S.
Para ello establece un equilibrio entre los anteriores criterios, es decir, entre el
optimista y el pesimista. Introdujo, el “coeficiente de optimismo” (CO) Alfa ( )
que es evaluado por el decisionista entre (0 y 1), considerando los pagos más
grandes y pequeños y los pesos de acuerdo con sus propios sentimientos de
optimismo y pesimismo, a través de la relación siguiente:
𝑛
1
𝐸𝑙𝑒𝑔𝑖𝑟𝑎𝑗 : 𝑀í𝑛𝑎𝑗 { ∑ 𝑓(𝑎𝑖 , 𝑒𝑗 )} 𝑠𝑖 𝑒𝑠 𝑐𝑜𝑠𝑡𝑜
𝑛
𝑒=1
El criterio de este autor requiere del desarrollo de una matriz de pesar o de pérdida
de oportunidad.
43
Investigación de Operaciones M.Sc. Javier Beltrán S.
Matriz de Pagos:
Demanda
Débil Media Fuerte
Pedir 15 60 20 -20
Oferta Pedir 35 20 140 100
Pedir 55 -20 100 220
0 120 240
40 0 120
80 40 0
60 140 220
FIGURA N.º 18
ENTRADA DE DATOS DE LA CÍA. INVOP A TRAVÉS DE POM
44
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 19
SOLUCIÓN DE LA CÍA. INVOP A TRAVÉS DE POM
Bajo condiciones de riesgo, los resultados finales asociados con cada alternativa de
decisión normalmente se describen mediante distribuciones de probabilidad. Se produce
el riesgo, siempre que no somos capaces de prever con certeza el resultado de alguna
alternativa, pero contamos con información como para prever la probabilidad que tenga
para alcanzar un estado deseado.
El valor esperado de una actividad, implica el promedio ponderado de los pagos de dicha
actividad, en donde, los pesos son las probabilidades de los eventos mutuamente
excluyentes que pueden ocurrir. Así el criterio del Valor Esperado implica:
1. Asignar una probabilidad a cada evento, de tal manera que las sumas de las
probabilidades den 1,
2. Calcular el valor esperado de cada acción multiplicando cada valor por su probabilidad
correspondiente y sumando estos productos, y
3. Elegir una acción, cuyo valor esperado sea el mejor, máximo (en casos de utilidad) o
mínimo (en casos de costos)
Este criterio de decisión es muy realista, debido a que es razonable suponer que la
persona responsable de tomar la decisión tiene alguna idea de la posibilidad de
ocurrencia de las actividades o eventos y, dicho conocimiento ayuda en la elección de un
curso de acción.
El valor esperado para el análisis de las alternativas de decisión se calcula a través de:
45
Investigación de Operaciones M.Sc. Javier Beltrán S.
Cuando se tiene la posibilidad de obtener información del valor esperado exacta sobre
cuál estado natural se daría el criterio de valor esperado se denomina criterio del valor
esperado de información perfecta, del cual también se hace un análisis.
La Cía. INVOP por estadísticas tiene ciertas probabilidades a priori con respecto a la
probable ocurrencia de los estados naturales, los cuáles se describen a continuación:
¿Cuál la mejor decisión para la Cía. INVOP? ¿Cuánto es lo más que debe estar dispuesta
a pagar la Cía. para saber la cantidad a pedir de mercadería, antes de decidir cuánto
pedir de mercadería?
El máximo valor esperado MVE para la Cía. INVOP es de $112; es decir, la elección de
la mejor alternativa es pedir 55 unidades y obtener una máxima ganancia.
El valor esperado con información perfecta implica conocer con certeza lo que sucederá,
que restado menos el MVE, se obtiene un valor de $36; que representa el máximo pago
por parte de la Cía. INVOP por pagar en la intención de obtener información perfecta o
adicional con respecto al contexto del problema
46
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 20
SOLUCIÓN DE LA CÍA. INVOP A TRAVÉS DE POM BAJO RIESGO
Al aplicar el enfoque del valor esperado, hemos mostrado cómo afecta la información de
probabilidad acerca de los estados de la naturaleza, los cálculos del valor esperado y,
por tanto, la recomendación de decisión. A menudo, los tomadores de decisiones tienen
evaluaciones preliminares o de probabilidad previa para los estados de la naturaleza que
son los mejores valores de probabilidad disponibles en ese momento. Sin embargo, para
tomar la mejor decisión posible, el tomador de decisiones puede desear buscar
información adicional sobre los estados de la naturaleza.
Esta nueva información puede emplearse para revisar o actualizar las probabilidades
previas de modo que la decisión final se base en probabilidades más precisas. Con
frecuencia, la información adicional se obtiene mediante experimentos diseñados para
dar información muestral acerca de los estados de la naturaleza. El muestreo de materias
primas, el examen de productos y los estudios de investigación de mercados son
ejemplos de experimentos (o estudios) que pueden permitir a la administración revisar o
actualizar las probabilidades de los estados de la naturaleza.
FÓRMULA DE BAYES
En los diagramas del árbol de probabilidades, son muy útiles para determinar
probabilidades posteriores. Para ejemplificar de mejor manera este aspecto se tiene el
siguiente ejemplo:
Ejemplo: una firma de seguridad para Bancos tiene 10 empleados de oficina, uno de los
cuales es desfalcador. Usted como jefe de seguridad, selecciona un empelado al azar y
le exige que se someta a una prueba de poligrafía. Suponga que el empleado escogido
47
Investigación de Operaciones M.Sc. Javier Beltrán S.
Ya que solamente uno de los 10 empleados está desfalcando. Éstas son sus
probabilidades anteriores. Son los mejores resultados estimados de E y Ec antes de
obtener evidencias empíricas adicionales, tales como resultados de la prueba poligráfica.
La confiabilidad de las pruebas de poligrafía varía de persona a persona. Basados en
experiencias pasadas, se estimó que el 5% de los que aun mintiendo pasa la prueba y el
1% de que quienes son honestos pueden fallar la prueba. Así se tienen las siguientes
probabilidades condicionales:
FIGURA N.º 21
ÁRBOL DE DECISIONES PARA EL BANCO
Tipo de empleado Resultado de la Probabilidades
Escogido Poligrafía Conjuntas
1.00
48
Investigación de Operaciones M.Sc. Javier Beltrán S.
Las dos ramas iniciales en el árbol anterior de decisiones indican que el empleado
seleccionado puede o no estar desfalcando, con las probabilidades correspondientes
dadas en cada rama.
Para obtener las probabilidades conjuntas, colocadas al final de las últimas ramas, se
aplica la ley de la multiplicación de probabilidades, así se tiene:
( ) ( )
P S y E c = P S E c = P( E c ) P( S / E c )
= (0.90) * (0.99) = 0.891
( ) ( )
P S c y E = P S c E = P( E ) P( S c / E )
= (0.10) * (0.95) = 0.095
( ) ( )
P S c y E c = P S c E c = P( E c ) P( S c / E c )
= (0.90) * (0.01) = 0.009
FIGURA N.º 22
SOLUCIÓN CON EL ÁRBOL DE DECISIONES
Resultado Resultado de Tipo de Empleados Probabilidades
Poligrafía Escogido Conjuntas
49
Investigación de Operaciones M.Sc. Javier Beltrán S.
= 0.005 + 0.891
= 0.896
= 0.095 + 0.009
= 0.104
P ( S E ) 0.005
P (E / S ) = = = 0.0056
P(S ) 0.896
P( S c E c ) 0.009
P(E / S ) =
c c
= = 0.0865
P(S c ) 0.104
Ejemplo…continuación
La Cía. INVOP puede realizar una investigación adicional para tener un mejor
conocimiento de la probable demanda de la mercadería. Esta investigación no tendrá un
costo adicional La unidad responsable de la Cía. anticipa que la investigación
proporcionará uno de los resultados siguientes:
50
Investigación de Operaciones M.Sc. Javier Beltrán S.
Dibuje un árbol de decisiones para este modelo. ¿Debe la empresa mandar a hacer la
investigación? ¿Cuál la mejor decisión?
1. Probabilidades Condicionales
Demanda
Débil Media Fuerte
Inf. Inv. Muy favorable 0.5 0.4 0.2
Oferta Inf. Inv. Favorable 0.4 0.3 0.3
Inf. Inv. Desfavorable 0.1 0.3 0.5
Probabilidades a priori 0.2 0.5 0.3
2. Probabilidades Conjuntas
51
Investigación de Operaciones M.Sc. Javier Beltrán S.
3. Probabilidades Marginales
0.36
0.32
0.32
Probabilidades marginales = probabilidades conjuntas
4. Probabilidades Posteriores
La decisión final para la Cía. INVOP en función del mayor valor esperado, es realizar una
investigación adicional por tener un mayor valor esperado de aproximadamente de $116
en relación con el valor esperado sin información muestral de $112.
52
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 23
RAMA DEL ÁRBOL DE DECISIONES DE LA CÍA. INVOP
SIN TOMAR EN CUENTA UN ESTUDIO ADICIONAL
0,5
Pedir 15 Demada media
20
0 16 0 20
0,3
Demada fuerte
-20
0 -20
0,2
Demanda débil
20
0 20
0,5
Sin Investigación Pedir 35 Demanda media
3 140
0 112 0 104 0 140
0,3
Demanda fuerte
100
0 100
0,2
Demanda débil
-20
0 -20
0,5
Pedir 55 Demanda media
100
0 112 0 100
0,3
Demanda fuerte
220
0 220
53
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 24
RAMA DEL ÁRBOL DE DECISIONES DE LA CÍA. INVOP
TOMANDO EN CUENTA UN ESTUDIO ADICIONAL
0,28
Demanda débil
60
0 60
0,55
Pedir 15 Demanda media
20
0 24,4 0 20
0,17
Demada fuerte
-20
0 -20
0,28
Demanda débil
20
0 20
0,36 0,55
Inv. muy favorable Pedir 35 Demanda media
2 2 140
116,752 0 99,6 0 99,6 0 140
0,17
Demanda fuerte
100
0 100
0,28
Demanda débil
-20
0 -20
0,55
Pedir 55 Demanda media
100
0 86,8 0 100
0,17
Deamda fuerte
220
0 220
0,25
Demanda débil
60
0 60
0,47
Pedir 15 Demanda media
20
0 18,8 0 20
0,28
Demanda fuerte
-20
0 -20
0,25
Demanda débil
20
0 20
0,32 0,47
Con Investigación Inv. favorable Pedir 35 Demanda media
3 140
0 116,752 0 103,6 0 98,8 0 140
0,28
Demanda fuerte
100
0 100
0,25
Demanda débil
-20
0 -20
0,47
Pedir 55 Demanda media
100
0 103,6 0 100
0,28
Demanda fuerte
220
0 220
0,06
Demanda débil
60
0 60
0,47
Pedir 15 Demanda media
20
0 3,6 0 20
0,47
Demanda fuerte
-20
0 -20
0,06
Demanda débil
20
0 20
0,32 0,47
Inv. desfavorable Pedir 35 Demanda media
3 140
0 149,2 0 114 0 140
0,47
Demanda fuerte
100
0 100
0,06
Demanda débil
-20
0 -20
0,47
Pedir 55 Demanda media
100
0 149,2 0 100
0,47
Demanda fuerte
220
0 220
54
Investigación de Operaciones M.Sc. Javier Beltrán S.
La empresa APIO debe decidir entre tres sistemas de producción que den como resultado
un costo mínimo en función de la posible demanda que se presente. Los costos fijos y
variables de los distintos sistemas de producción se muestran a continuación:
- El Sistema de Producción “A” tiene un costo variable de $5 por unidad y costos fijos de $5000
- El Sistema de Producción “B” tiene un costo variable de $4 por unidad y costos fijos de $5500
- El Sistema de Producción “C” tiene un costo variable de $6 por unidad y costos fijos de $4500
Dados las demandas si se da un: Demanda moderada Demanda Alta Demanda Máxima
Ambiente favorable 0.45 0.15 0.40
Ambiente regular 0.15 0.35 0.50
Ambiente desfavorable 0.55 0.25 0.20
55
Investigación de Operaciones M.Sc. Javier Beltrán S.
b)
c)
Matriz de Pagos:
CT = CV(x) + CF
Estados Naturales
E1: Demanda E2: Demanda alta E3: Demanda
Alternativas de decisión
moderada 500 uds. máxima de 1000
1000uds. uds.
A1 = Utilizar el sistema de producción “A” $5500 $7500 $10000
A2 = Utilizar el sistema de producción “B” $5900 $7500 $9500
A3 = Utilizar el sistema de producción “C” $5100 $7500 $10500
COSTOS DE OPORTUNIDAD
(Savage)
40 0 50
80 0 0
0 0 100
5100 7500 9500
56
Investigación de Operaciones M.Sc. Javier Beltrán S.
i)
j)
k)
VEIP = $240
l)
57
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 25
ÁRBOL DE DECISIONES DE LA CÍA. APIO
EMPRESA APIO
0,3
DM 7 5500
5500
7650 0,4
SP A 4 DA 8 7500
0 7500
0,3
DMAX 9 10000
10000
0,3
DM 10 5900
5900
0,3
DMAX 12 9500
9500
0,3
DM 13 5100
5100
7680 0,4
SP C 6 DA 14 7500
0 7500
0,3
DMAX 15 10500
10500
0,45
DM 28 5500
5500
7600 0,15
SP A 19 DA 29 7500
0 7500
0,4
DMAX 30 10000
10000
0,45
DM 31 5900
5900
0,4
DMAX 33 9500
9500
0,45
DM 34 5100
5100
7620 0,15
SP C 21 DA 35 7500
0 7500
0,4
DMAX 36 10500
10500
0,15
DM 37 5500
5500
8450 0,35
SP A 22 DA 38 7500
0 7500
0,5
DMAX 39 10000
10000
0,15
DM 40 5900
5900
0,5
DMAX 42 9500
9500
COSTO 250
0,15
DM 43 5100
5100
8640 0,35
SP C 24 DA 44 7500
0 7500
0,5
DMAX 45 10500
10500
0,55
DM 46 5500
5500
6900 0,25
SP A 25 DA 47 7500
0 7500
0,2
DMAX 48 10000
10000
0,55
DM 49 5900
5900
0,2
DMAX 51 9500
9500
0,55
DM 52 5100
5100
6780 0,25
SP C 27 DA 53 7500
0 7500
0,2
DMAX 54 10500
10500
58
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 26
SALIDA DE VALORES CON LA SOLUCIÓN EN LOS PROGRAMAS
EXCEL Y POM
59
Investigación de Operaciones M.Sc. Javier Beltrán S.
Este hecho fue considerado como un “juego de estrategia”, que dio origen a la batalla
del Mar de Bismark, en 1943. El general Kenney planteó dos cursos de acción; siendo
su misión encontrar y exponer un convoy a un máximo bombardeo. El comandante
japonés deseaba la exposición mínima al bombardeo.
Un juego es una interacción entre dos o más personas, es una situación en donde el
bienestar o utilidad depende no solo de uno sino de los demás, esta interacción es una
situación conflictiva donde cada persona busca lograr un determinado objetivo a costa
de los demás, la vida cotidiana muchas veces entra en este fenómeno matemático.
La Teoría de Juegos, estudia la toma racional de decisiones de las personas cuando los
resultados de las acciones seleccionadas por cada uno de ellos dependen, al menos en
parte, de las acciones seleccionadas por otros.
La pregunta que cada uno debe resolver es: ¿doy un paso más o disparo? Dar un paso
más y no disparar es riesgoso, pues si el otro dispara, puedo terminar muerto. Por otra
parte, disparar ahora hace menos probable apuntar que si puedo hacerlo habiendo dado
un paso adicional. Más aún, si disparo y no acierto, el otro caminará y estaré muerto.
60
Investigación de Operaciones M.Sc. Javier Beltrán S.
Como en el duelo, cuando una empresa como Paceña o Taquiña decide el precio que
cobrará, debe considerar que sus ventas dependen de cuánto cobren sus rivales, lo que
a su vez está afectado por cuanto cobre él. Así, una baja en el precio de la cerveza
Paceña puede inducir a una baja en el precio de los competidores, erosionándole la
buena parte de las ventas que buscaba Paceña al bajar sus precios.
La otra cara de la moneda es que una empresa establecida puede afectar la entrada de
otras a través de sus acciones o estrategias. Así, por ejemplo, la decisión de localización
geográfica, posicionamiento, mezcla comercial y de productos, innovación y política de
precios, afectan las decisiones de los entrantes, que deberán evaluar muy bien qué
efectos tienen esas políticas en su rentabilidad.
61
Investigación de Operaciones M.Sc. Javier Beltrán S.
La Teoría de Juegos fue creada por J. Von Neumann y Morgenstern en su libro clásico
The Theory of Games Behavior, publicado en 1944. Otros habían anticipado algunas
ideas. Los economistas Cournot y Edgeworth fueron particularmente innovadores en el
siglo XIX. Otras contribuciones posteriores mencionadas fueron hechas por los
matemáticos Borel y Zermelo.
En la actualidad ha existido una evolución con mucha rapidez, debido a que, en los
últimos veinte años, y éste y otros trabajos modernos sobre teoría de juegos ya no tienen
algunos de los presupuestos restrictivos que Von Neumann y Morgenstern consideraron
necesarios para progresar. Como resultado, lo que la teoría de juegos prometía en un
principio se está empezando a cumplir.
Lo que es mejor para un jugador depende de lo que los otros jugadores piensan hacer, y
esto, a su vez, depende de lo que ellos piensan del primer jugador que hará. Von
Neumann y Morgenstern resolvieron este problema en el caso particular de juegos con
dos jugadores, cuyos intereses son diametralmente opuestos. A estos juegos se les llama
estrictamente competitivos, o de suma cero, porque cualquier ganancia para un jugador
siempre se equilibra exactamente por una pérdida correspondiente para el otro jugador.
A principio de los años cincuenta, en una serie de artículos muy famosos el matemático
John Nash rompió dos de las barreras que Von Neumann y Morgenstern se había auto-
impuesto. En el frente no cooperativo, éstos parecen haber pensado que en estrategias
la idea de equilibrio, introducida por Cournot en 1832, no era en sí misma una noción
adecuada para construir sobre ella una teoría –de aquí que se restringieran a juegos de
suma cero-. Sin embargo, la formulación general de Nash, de la idea de equilibrio, hizo
ver claramente que una restricción así es innecesaria. Hoy día, la noción de equilibrio de
62
Investigación de Operaciones M.Sc. Javier Beltrán S.
Nash, la cual no es otra cosa que cuando la elección estratégica de cada jugador es la
respuesta óptima a las elecciones estratégicas de los otros jugadores.
La historia de la teoría de juegos, en los últimos veinte años, está demasiado repleta de
incidentes para ser contada. Lo que es más importante sobre los últimos veinte años de
teoría de juegos es que, los mayores progresos se han dado en la teoría no cooperativa.
La Teoría de Juegos es una teoría matemática que estudia las características generales
de las situaciones competitivas como éstas de manera formal y abstracta, dando una
importancia especial al proceso de toma de decisiones de los adversarios.
La teoría de juegos puede aplicarse en muchos campos de entorno actual, desde lo social
hasta lo económico. Por ejemplo:
63
Investigación de Operaciones M.Sc. Javier Beltrán S.
Las características en este tipo de juegos son que participan sólo dos adversarios o
jugadores, y de suma cero, porque un jugador gana lo que el otro pierde, de manera que
la suma de sus ganancias netas es cero.
EJEMPLO TIPO
EMPRESA VOPIN
b1 b2 b3 b4
a1 $50000 ($20000) $120000 ($50000)
EMPRESA INVOP a2 $60000 $20000 $70000 $70000
a3 ($20000) $0 ($40000) $75000
(Los valores entre paréntesis representan pérdidas para la Cía. INVOP)
EMPRESA VOPIN
b1 b2 b3 b4
INVOP gana 5 INVOP pierde 2 INVOP gana 12 INVOP pierde 5
a1 VOPIN pierde 5 VOPIN gana 2 VOPIN pierde 12 VOPIN gana 5
EMPRESA INVOP INVOP gana 6 INVOP gana 2 INVOP gana 7 INVOP gana 7
a2 VOPIN pierde 6 VOPIN pierde 2 VOPIN pierde 7 VOPIN pierde 7
INVOP pierde 2 Nadie gana o INVOP pierde 4 INVOP gana 7.5
a3 VOPIN gana 2 pierde VOPIN gana 4 VOPIN pierde 7.5
En este capítulo, se estudian los siguientes métodos de resolución de juegos suma cero.
a) PUNTO DE SILLA
64
Investigación de Operaciones M.Sc. Javier Beltrán S.
Cuando el jugador A, elige una estrategia, pretende maximizar sus mínimas ganancias
ain (renglón de la matriz de pagos) entonces el jugador B elegirá, una estrategia la cual
permita minimizar sus pérdidas máximas a jm (columnas de la matriz de pagos). De lo
anterior, el punto de silla consiste en localizar el mínimo valor de las filas al lado derecho
de cada fila y, el máximo de las columnas al pie de cada columna, luego se determina el
máximo de los mínimos y el mínimo de los máximos.
Si el valor del criterio maximin (jugador A) es igual al valor del criterio minimax (jugador
B), los cursos de acción de ambos jugadores formas las estrategias puras óptimas,
entonces el juego tiene un punto de silla, lo que conduce a la solución del juego, es decir,
el jugador A juega una estrategia pura óptima frente a la estrategia pura óptima del
jugador B.
Por tanto, si el máximo de los mínimos es igual al mínimo de los máximos, entonces se
ha encontrado el punto de silla que se convertirá automáticamente en el valor del juego.
Cuando se encuentra un punto de ensilladura, se dice también que el juego está
estrictamente determinado o el juego es puro; porque para cada jugador una estrategia
es óptima en ambos casos, tal como se muestra en el siguiente gráfico:
Jugador B Mínimo de
fila
Y1 Y2 Y3 …. Yn
X1 a11 a12 a13 …. a1n
X2 a21 a22 a23 …. a2n ajn
Jugador A X3 a31 a32 a33 …. a3n MÁXIMIN
…. …. ….. ….
Xm am1 am2 am3 …. amn
Máximo de ajm Estrategias
columna MINIMAX puras óptimas
Punto de Silla:
EMPRESA VOPIN
b1 b2 b3 b4 Máximin
a1 $50000 ($20000) $120000 ($50000) -50000
EMPRESA INVOP a2 $60000 $20000 $70000 $70000 20000
a3 ($20000) $0 ($40000) $75000 -40000
Minimax 60000 20000 120000 75000
65
Investigación de Operaciones M.Sc. Javier Beltrán S.
Como se observa, para cada jugador existe una estrategia óptima y pura (definida). La
Empresa INVOP escogerá lo mejor de lo peor, es decir, la estrategia a 2, porque
pretenderá ganar lo más posible (-50000, 20000, -40000) En tanto, que la Empresa
VOPIN escogerá siempre la estrategia b 2, porque pretende perder lo menos posible
(60000, 20000, 120000, 75000).
Conforme a lo anterior, el valor del juego es v = 20000, y las estrategias, tanto para INVOP
como para VOPIN son:
Ex = (0, 1, 0) Ey = (0, 0, 1, 0)
Las estrategias deben sumar siempre 1, las cuales se interpretan: INVOP juega
constantemente la fila 2, y VOPIN juega constantemente la columna 2.
Así se puede definir un juego matricial Z, una estrategia X para el jugador A, es una
estrategia óptima, una estrategia Y para el jugador B es una estrategia óptima, y un
número v es el valor del juego si x, y e v se relacionan entre sí, de la siguiente manera:
Demostrando se tiene:
i)
50000 −20000 120000 −50000
𝑥 ∗ 𝑍 = (0 1 0) ∗ ( 60000 20000 70000 20000 ) = (60000 20000 70000 20000 ) ≥ 𝑣 (20000)
−20000 0 −140000 −40000
ii)
50000 60000 −20000
𝑡
𝑦 ∗ 𝑍 = (0 1 −20000 20000 0
0 0) ∗ ( ) = (−20000 20000 0) ≤ 𝑣 (20000)
120000 70000 −140000
−50000 20000 −40000
En conclusión, el juego anterior tiene una estrategia pura, es decir que el valor del juego
es:
V = $20000
Al ser positivo el valor del juego significa que está a favor de la Empresa INVOP con una
ganancia máxima de $20000. Las estrategias de cada empresa se muestran y explican
a continuación:
66
Investigación de Operaciones M.Sc. Javier Beltrán S.
Estrategia de INVOP = (0, 1, 0); que significa que para asegurarse la máxima ganancia
la empresa INVOP debe elegir siempre la estrategia a2 y no así las otras estrategias.
Estrategia de VOPIN = (0, 1, 0, 0); que significa que para asegurarse la mínima perdida
la empresa VOPIN debe elegir siempre la estrategia b2 y no así las otras estrategias.
b) DOMINACIÓN
Ejemplo.
Encontrar las filas y/o columnas recesivas (dominadas) del siguiente juego:
Teniendo la matriz del problema se observa si alguna fila o columna es recesiva con otra,
así, tomando en cuenta a la empresa Coca Cola, se puede definir que la primera fila es
recesiva a la segunda, porque las entradas de ésta sones menores con relación a la
segunda:
PEPSI
PN PM PA
PN 0 -10 -32
COCA COLA PM 20 0 -5
PA 25 -5/2 0
Comparando sus estrategias, a la Empresa Coca Cola, le conviene asegurar un 20% del
mercado a tener 0%. En la segunda estrategia, a Coca Cola, le convendrá más quedar
con 0% del mercado (no ganar ni perder), a perder 10% del mercado con PEPSI. Y, por
último, sería preferible para la Coca Cola perder el 5% que el 32% del mercado a manos
de la PEPSI.
Cuando se presenta este caso, es posible para la Coca Cola desechar la primera
estrategia, obteniendo así, la siguiente matriz:
67
Investigación de Operaciones M.Sc. Javier Beltrán S.
PEPSI
PN PM PA
COCA COLA PM 20 0 -5
PA 25 -5/2 0
c) JUEGOS 2 * 2
a b
c d
ad − bc
v=
a+d −b−c
d −c a −b d −b a−c
x1 = x2 = y1 = y2 =
a + d −b−c a+d −b−c a + d −b−c a+d −b−c
68
Investigación de Operaciones M.Sc. Javier Beltrán S.
v=
(0)(0) − (− 5)(− 5 / 2) = − 5
(0) + (0) − (− 5) − (− 5 / 2) 3
Las estrategias para cada Empresa se calculan a continuación:
Coca Cola =
(0) − (− 5 / 2) = 1 Coca Cola =
(0) − (− 5) = 2
15 / 2 3 15 / 2 3
PEPSI =
(0) − (− 5) = 2 PEPSI =
(0) − (− 5 / 2) = 1
15 / 2 3 15 / 2 3
Las estrategias en cada caso suman siempre 1. Validando los datos a través de POM,
se tiene:
FIGURA N.º 27
SALIDA DE DATOS COCA COLA VS PEPSI EN POM
d) JUEGOS 2 * n y m * 2
69
Investigación de Operaciones M.Sc. Javier Beltrán S.
x2 = 1 – x1
Ejemplo.
Encuentre en el siguiente juego 2 * 4: a) El rango del valor del juego, b) El valor del juego
y c) Las estrategias de cada jugador:
Jugador B
Y1 Y2 Y3
X1 -2 3 -1
Jugador A
X2 4 1 2
Solución:
Jugador B
Y1 Y2 Y3
X1 -2 3 -1 -2
Jugador A
X2 4 1 2 1
4 3 2
El juego no tiene una estrategia pura, y por lo tanto el rango del juego estará comprendido
entre 1 ≤ v ≤ 2.
Las estrategias puras de B deben mezclarse, lo que permita obtener los pagos esperados
de A, con la relación dada, de la siguiente manera:
Una vez obtenidos los pagos esperados de A, se grafican las ecuaciones obtenidas,
haciendo que x toma valores de 0 y 1, obteniéndose así, la siguiente gráfica:
70
Investigación de Operaciones M.Sc. Javier Beltrán S.
2X1 + 1 = -3X1 + 2
X1 = 1/5
X2 = 1 – 1/5
X2 = 4/5
Jugador B
Y1 Y2 Y3
X1 -2 3 -1
Jugador A
X2 4 1 2
4Y1 – 1 = -Y1 + 2
Y1 = 3/5
Y2 = 1 – 3/5
Y2 = 2/5
71
Investigación de Operaciones M.Sc. Javier Beltrán S.
FIGURA N.º 28
SALIDA DE DATOS EN POM
Juegos m * 2
El juego no tiene una estrategia pura, y por lo tanto las estrategias puras de A deben
mezclarse, lo que permita obtener los pagos esperados de B, con la relación dada, de la
siguiente manera:
72
Investigación de Operaciones M.Sc. Javier Beltrán S.
Una vez obtenidos los pagos esperados de A, se grafican las ecuaciones obtenidas,
haciendo que x toma valores de 0 y 1, obteniéndose así, la siguiente gráfica:
Y1 + 2 = -2Y1 + 3
Y1 = 1/3
X2 = 1 – 1/3
X2 = 2/3
Jugador B
Y1 Y2
X1 -2 4
Jugador A X2 3 2
X3 1 3
73
Investigación de Operaciones M.Sc. Javier Beltrán S.
2X1 + 1 = -X1 + 3
X1 = 2/3
X2 = 1 – 2/3
X2 = 1/3
FIGURA N.º 29
SALIDA DE DATOS COMPLETO EN POM
74
Investigación de Operaciones M.Sc. Javier Beltrán S.
Ejemplo. Encontrar el valor del siguiente juego y las estrategias de cada jugador:
Jugador B
2 5 4
Jugador A 3 3 2
2 3 2
El primer paso consiste en determinar si el juego tiene o no, una estrategia pura, es decir,
si el juego tiene punto de silla:
Jugador B Maximin
2 5 4 2
Jugador A 3 3 2 2
2 3 2 2
Minimax 3 5 4
El juego no tiene una estrategia pura. De la matriz se identifica que el rango del valor del
juego estará entre 2 ≤ v ≤ 3. La matriz del juego tiene filas y columnas recesivas
(Compruébelo), pero se resolverá utilizando la PL (Método Simplex) para su resolución:
Planteando el problema:
MAX Z = X1 + X2 + X3
s.a.:
2X1 + 5X2 + 4X3 ≤ 1
3X1 + 3X2 + 2X3 ≤ 1
2X1 + 3X2 + 2X3 ≤ 1
Xi ≥ 0
75
Investigación de Operaciones M.Sc. Javier Beltrán S.
V.B. CJ DJ X1 X2 X3 X4 X5 X6
X4 0 1 2 5 4 1 0 0
X5 0 1 3 3 2 0 1 0
X6 0 1 2 3 2 0 0 1
ZJ - CJ 0 -1 ▲ -1 -1 0 0 0
X4 0 1/3 0 3 8/3 1 -2/3 0
X1 1 1/3 1 1 2/3 0 1/3 0
X6 0 1/3 0 1 2/3 0 -2/3 1
ZJ - CJ 1/3 0 0 -1/3 0 1/3 0
▲
X3 1 1/8 0 9/8 1 3/8 -1/4 0
X1 1 1/4 1 1/4 0 -1/4 1/2 0
X6 0 1/4 0 1/4 0 -1/4 -1/2 1
ZJ - CJ 3/8 0 3/8 0 1/8 1/4 0
V = 1/(3/8) = 8/3
E JA = (1/3; 2/3; 0)
E JB = (2/3; 0; 1/3)
76
Investigación de Operaciones M.Sc. Javier Beltrán S.
1 0 2
3 0 0
0 2 1
FIGURA N.º 30
SALIDA DE DATOS EN LA VENTANA DEL PROGRAMA TORA
77
Investigación de Operaciones M.Sc. Javier Beltrán S.
Asimismo, es necesario insertar la función suma, de manera que todas las probabilidades
que se obtengan sean siempre 1, por tanto se tiene:
78
Investigación de Operaciones M.Sc. Javier Beltrán S.
La celda que presentará el valor del juego ya está determinada, restando introducir las
celdas que cambiarán y las restricciones del problema, así:
Las restricciones son dos. La primera que como se está obteniendo el valor del juego y
las estrategias del jugador A, la restricción es >= y, obviamente, debe existir la restricción
de igualdad entre las probabilidades y su suma; que deben ser uno.
79
Investigación de Operaciones M.Sc. Javier Beltrán S.
Las restricciones serán del tipo menor o igual además de la igualdad. Luego el
procedimiento descrito es el mismo. Los resultados del mismo son:
Como se observa, el valor del juego es el mismo (como debe ser) y las estrategias
corresponden al jugador B.
80