Está en la página 1de 42

Análisis de Decisión y

Juegos
Investigación Operativa I

Informática de Gestión
Ambientes de Decisión
 Toma de decisiones en condiciones de
certeza: se conocen las datos en forma
determinística.
 Toma de decisiones bajo riesgo: los datos
se describen bajo funciones de
probabilidad.
 Toma de decisiones bajo incertidumbre: no
es posible asignar a los datos pesos
relativos que representen su grado de
relevancia. Informática de Gestión
Toma de decisiones bajo riesgo
 Los resultados finales asociados con cada
alternativa de decisión normalmente se
describen mediante funciones de
probabilidad.
 Se basa en el criterio de valor esperado,
en el que las alternativas de decisión se
comparan con base en la maximización de
la utilidad esperada o la minimización del
costo esperado.

Informática de Gestión
Ejemplo: criterio del valor esperado
 Ejemplo: Ud. desea invertir $10.000 en el mercado de
valores comprando acciones de una de dos compañías: A
y B.
 Las acciones de A representan riesgo pero podrían dar
un rendimiento del 50%. Si las condiciones de la bolsa
no son favorables podría perder 20% de su valor. La
compañía B proporciona inversiones seguras con 15% de
rendimiento en un mercado “a la alza” y sólo 5% con un
mercado “a la baja”.
 Las publicaciones predicen un 60% de posibilidades para
un mercado “a la alza” y un 40% para un mercado “a la
baja”

Informática de Gestión
Ejemplo: criterio del valor esperado
 El problema de decisión se resume así:

Rendimiento sobre la inversión en un año

Alternativa de decisión Mercado “a la alza” ($) Mercado “a la baja” ($)

Acciones de A 5000 -2000


Acciones de B 1500 500
Prob. Ocurrencia 0.6 0.4

Informática de Gestión
Ejemplo: criterio del valor esperado
 En la terminología de la teoría de decisiones, los mercados
“a la alza” y “a la baja” se denominan estados de la
naturaleza, cuyas oportunidades de ocurrencia son
probabilísticas.
 Se pueden incluir n estados de la naturaleza y m
alternativas. Si pj (>0) es la probabilidad para el estado de
la naturaleza j y aij es el resultado de la alternativa i dado el
estado de la naturaleza j (i=1,2…,m; j=1,2…,n) el resultado
esperado para la alternativa i se calcula como:
VEi=ai1p1+ai2p2+…+ainpn y p1+p2+…+pn=1
La mejor alternativa está asociada con el Vei*=maxi{EVi} o
Vei*=mini{Vei} dependiendo de si el resultado representa
una ganancia o una pérdida.

Informática de Gestión
Ejemplo: criterio del valor esperado

Rendimiento sobre la inversión en una año

Alternativa de decisión Mercado “a la Mercado “a la VEi


alza” ($) baja” ($)
Acciones de A 5000,00 -2000,00 2200

Acciones de B 1500,00 500,00 1100

Prob. Ocurrencia 0,60 0,40

Informática de Gestión
Teoría de Utilidad
 En el ejemplo aplicamos el criterio del valor
esperado sólo a situaciones donde el resultado
es dinero real. Hay casos donde se debe usar la
utilidad en el análisis.
 Diferentes individuos muestran distintas
actitudes frente al riesgo, un inversionista
conservador puede elegir invertir en las
acciones de B porque no quiere arriesgarse a
perder y otro inversionista puede aceptar el
riesgo de invertir en A porque tiene la
posibilidad de obtener ganancias mayores.

Informática de Gestión
Teoría de Utilidad
 La Teoría de Utilidad, o función de utilidad del
dinero es una manera de transformar los valores
monetarios a una escala apropiada que refleje
las preferencias del tomador de decisiones.

 U(M) es la utilidad para la cantidad de dinero M

Informática de Gestión
Teoría de Utilidad
 Índice de Utilidad NEUMANN-MORGENSTERN

Pasos

 Establecer un evento E con máximo beneficio y


probabilidad P
 Establecer un evento D con mínimo beneficio y
probabilidad ( 1 – P )
 Elegir un evento cualquiera A que esté entre E y D, su
utilidad puede calcularse:

U(A) = PA u [ E ] + (1 – PA) .u [ D ]

Informática de Gestión
Teoría de Utilidad
Características de las funciones de Utilidad

 Indiferencia ante el riesgo: Indica la inexistencia de una


actitud ante el riesgo, la función es lineal.

 Aversión al riesgo: Cuanto mayor sea el capital, menor


será la utilidad del dinero. (utilidad decreciente)

 Propensión al riesgo: La utilidad del dinero es menor con


relación a la indiferencia, valora poco lo que posee.

Informática de Gestión
Teoría de Utilidad
 Propiedad fundamental de las funciones de
Utilidad:
Bajo las suposiciones de la teoría de utilidad,
la función de utilidad para el dinero de un
tomador de decisiones tiene la propiedad de que
éste se muestra indiferente ante dos cursos de
acción alternativos si los dos tienen la misma
utilidad esperada.

 La determinación de la utilidad es subjetiva,


depende de la actitud del tomador de decisiones
hacia el riesgo.

Informática de Gestión
Teoría de Utilidad
Caso de X : Aversión
al riesgo
Utilidad Marginal
Decreciente para el
dinero
Caso de Y:
Indiferente o neutral
ante el riesgo
Caso de Z:
Propensión al riesgo
Utilidad Marginal
creciente para el
dinero

Informática de Gestión
Teoría de Utilidad
Un cambio positivo de
$10.000 o un cambio
negativo de $10.000
sobre el valor de $0,
provoca distintos
comportamientos para
los individuos X y Z.
Para X es mayor el
cambio de utilidad por
contraer una pérdida.
Para Z es mayor el
cambio de utilidad
ante una posible
ganancia.

Informática de Gestión
Teoría de Utilidad: Ejemplo 1
 Ejemplo 1

Contrato A con $ 200.000 de inversión y resultados


N1 = Ganar $ 400.000
N2 o N3 = Perder todo

Contrato B con $ 80.000 de inversión y resultados


N1 o N2= Ganar $ 140.000
N3 = perder todo

Opción de no invertir

Probabilidades,
P(N1) = 0.50 P(N2) = 0.10 P(N3) = 0.40

Informática de Gestión
Teoría de Utilidad: Ejemplo 1
N1 N2 N3 VE Orden
A 400000 -200000 -200000 100000 1
B 140000 140000 -80000 52000 2
C 0 0 0 0 3

VE( A ) = 400000 * 0.50 + (-200000) * 0.10 + (-200000) * 0.40 = 100000


VE( B ) = 140000 * .050 + 140000 * 0.10 + (-80000) * 0.40 = 52000
VE( C ) = 0 * 0.50 + 0 * 0.10 + 0 * 0.10 = 0

La persona encargada de tomar la decisión dice que prefiere B, C y A

Informática de Gestión
Teoría de Utilidad: Ejemplo 1
 Resolución, aplicando el método de Von Newmann para definir una función
de utilidad

1º) Establecer un orden completo sobre los resultados de la matriz


400.000 > 140.000 > 0 > -80.000 > -200.000
2º) Determinar los valores extremos (máximo y mínimo) arbitrarios
Máx = 600.000 Mín = -300.000
600.000 > 400.000 > 140.000 > 0 > -80.000 > -200.000> -300.000
3º) Determinar los valores de Pj que hacen equivalente los contratos de
referencia con cada activo equivalente cierto, y obtenemos la curva para
un tomador de decisiones indiferente al riesgo. Pj representa la utilidad
subjetiva que equilibra un juego entre dos valores extremos.

400.000 = 600.000 * (p) – 300.000 * (1-p)


//400.000 es el equivalente monetario cierto
400.000 = 600.000 * p – 300.000 + 300.000 * p
400.000 + 300.000 = 900.000 * p
700.000 / 900.000 = p
0.77 = p (400.000)
Informática de Gestión
Teoría de Utilidad: Ejemplo 1
 Continua calculando para todos los valores
p(400.000) = 0.77
p(140.000) = 0.48
p(0) = 0.33
p(-80.000) = 0.24
p(-200.000) = 0.11

 Consultado el tomador de decisiones le asigna a cada una de las


opciones:
p(400.000) = 0.95
p(140.000) = 0.85
p(0) = 0.73
p(-80.000) = 0.64
p(-200.000) = 0.41

 Comparando el valor obtenido para el juego equitativo con el


resultado de la evaluación subjetiva del juego se observa que el
decididor tiene aversión al riesgo, ya que 0.77 < 0.95 Informática de Gestión
Teoría de Utilidad: Ejemplo 1
Matriz de utilidades para el tomador de decisiones:

N1 N2 N3 VEi Orden

A 0.95 0.41 0.41 0.68 3

B 0.85 0.85 0.64 0.766 1

C 0.73 0.73 0.73 0.73 2

El orden determinado por la matriz es B, C y A. Coincide con la


elección del tomador de decisiones

Informática de Gestión
Teoría de Utilidad: Ejemplo 2
 Ejemplo 2

Una compañía tiene que decidir si moderniza o no su planta. Cada


acción conduce a un resultado diferente para el próximo año. Este
resultado depende de la demanda de los productos que fabrica. La
matriz de pagos y la probabilidad de la demanda es la siguiente:

Alta: 0.25 Media: 0.45 Baja: 0.30

Modernizar 100.000 80.000 -10.000

No Modernizar 80.000 60.000 10.000

Informática de Gestión
Teoría de Utilidad: Ejemplo 2
 Dado el limitado capital de la empresa, se da una
utilidad de 100 a ganar $ 100.000 y 0 a perder $ 10.000,
y se es indiferente entre los siguientes juegos:

 $ 80.000 ciertos y un 90% de obtener una ganancia de


$ 100.000 y el 10% de perder $ 10.000

 $ 60.000 ciertos y el 75% de ganar $ 100.000 y 25% de


perder $ 10.000

 $ 10.000 ciertos y 25% de ganar $ 100.000 y 75% de


perder $ 10.000

Informática de Gestión
Teoría de Utilidad: Ejemplo 2

Construcción de la matriz de utilidad

 Valores Máximo y Mínimo (en este caso se toman los del ejemplo)
u( $ 100.000 ) = 100
u( - $ 10.000 ) = 0

 La indiferencia entre las distintas acciones deja lo siguiente


u ( 80.000 ) = 0.90 * u ( 100.000 ) - 0.10 * u ( 10.000 ) = 90
u ( 60.000 ) = 0.75 * u ( 100.000 ) – 0.25 * u ( 10.000 ) = 75
u ( 10.000 ) = 0.25 * u ( 100.000 ) – 0.75 * u ( 10.000 ) = 25

Informática de Gestión
Teoría de Utilidad: Ejemplo 2
Reemplazando los resultados de su utilidad en la matriz
original, se obtiene la siguiente matriz de utilidad:

Alta: Media: Baja: Alta: Media: Baja:


0.25 0.45 0.30 0.25 0.45 0.30
Mod. 100.000 80.000 -10.000
Mod. 100 90 0

No Mod. 80.000 60.000 10.000 No Mod. 90 75 25

Para determinar que acción conviene, calculamos el valor esperado


para cada alternativa, quedándonos con la de mayor valor:

VE( Modernizar) = 100 * 0.25 + 90 * 0.45 + 0 * 0.30 = 65.5


VE( No Modernizar) = 90 * 0.25 + 75 * 0.45 + 25 * 0.30 = 63.75
Informática de Gestión
Teoría de Juegos
 La Teoría de los Juegos es una rama de la matemática que se
dedica al estudio de situaciones llamadas de conflicto.

 En ella dos o más partes o decididores deben tomar cada una


decisiones cuya efectividad depende de las decisiones tomadas por
las demás.

 El objetivo del estudio es encontrar la forma en que un decididor


pueda tomar las decisiones lo más efectivamente que sea posible.

 Se dirá entonces que cada decididor buscará maximizar el beneficio


de sus decisiones

Informática de Gestión
Teoría de Juegos
Definiciones elementales
 Juego: situación de conflicto en la que dos o más jugadores
intentan alcanzar un objetivo seleccionando cursos de acción de
entre todos los que sean permitidos por las reglas.

 Reglas: posibles cursos de acción que pueden ser elegidos.


Conocidas por todos los jugadores.

 Resultados: asociados a cada posible combinación de elecciones son


definidos por adelantado y conocidos por todos los jugadores.

 Movida: elección de un curso de acción en particular de entre un


conjunto de alternativas posibles.

 Partida: conjunto de secuencias de una o más movidas, una


secuencia por cada jugador y todas ellas con el mismo número de
movidas.
Informática de Gestión
Teoría de Juegos
Estrategia:

Método predeterminado que permita a un jugador elegir


cada una de las movidas que conforman a una partida,
ante el análisis de todas las movidas que pudieran haber
hecho todos los demás jugadores.
También se llamará estrategia a la secuencia de movidas
resultante.
 Estrategia pura a aquella en la cual cada una de las
movidas hechas por un jugador a lo largo de una partida
corresponde a una única opción o curso de acción.
 Estrategia mixta a aquella en la cual no siempre se opta
por el mismo curso de acción a lo largo de una partida.

Informática de Gestión
Teoría de Juegos
 Valor del juego: resultado de jugar una partida, cada jugador con su
estrategia. Indica cual es el beneficio o perjuicio que recibe cada
jugador.

 Solución del juego: conjunto de estrategias óptimas para cada


jugador y valor del juego resultante de la aplicación de esas
estrategias.

 Técnica: conjunto de reglas mediante las cuales se intenta hallar la


estrategia óptima para cada jugador.

 Criterio: conjunto de reglas mediante las cuales se intenta hallar la


estrategia óptima para un jugador que juega contra la Naturaleza
(de la cual no se puede decir que esté intentando maximizar su
beneficio)

Informática de Gestión
Teoría de Juegos
En Resumen:
 La teoría de juegos trata con situaciones de
decisión en las que dos oponentes inteligentes
tienen objetivos en conflicto.
 Dos oponentes, conocidos como jugadores,
tendrá cada uno un número de alternativas o
estrategias.
 Asociada con cada par de estrategias hay una
recompensa que un jugador paga al otro. Tales
juegos se llaman de suma cero entre 2
personas, porque la ganancia de un jugador es
igual a la pérdida de otra.

Informática de Gestión
Teoría de Juegos
 Representación mediante matrices de pago: si A usa la
estrategia i y B la estrategia j, el pago a A es aij, lo que
significa que el pago a B es –aij (es decir B paga a A)

A B B1 B2 … Bn

A1 a11 a12 … a1n

A2 a21 a22 … a2n

… … … … …

Am am1 am2 … amn

Informática de Gestión
Teoría de Juegos
Distintos Métodos para resolución de Juegos

 Submatrices
 Laplace
 Minimáx
 Hurwicks (optimismo)
 Savage
 Gráfico
 Iteración (Braun Robinson)

Informática de Gestión
Teoría de Juegos
Submatrices
Si la matriz de pagos es una matriz de tres por tres, puede
utilizarse el método de resolución por submatrices.

i. Se agrega una cuarta columna, C4 = C1 - C2.


ii. Se agrega una quinta columna, C5 = C2 - C3.
iii. Se agrega una cuarta fila, F4 = F1 - F2.
iv. Se agrega una quinta fila, F5 = F2 - F3.
v. Se evalúa para cada fila el valor absoluto del determinante de la
submatriz de dos por dos correspondiente a las otras dos filas,
escribiendo los resultados en una nueva columna.
vi. Se evalúa para cada columna el valor absoluto del determinante
de la submatriz de dos por dos correspondiente a las otras dos
columnas, escribiendo los resultados en una nueva fila.

Informática de Gestión
Teoría de Juegos
Si la suma de los resultados en la última fila es igual a la suma
de los resultados en la última columna, entonces el juego tiene
solución por este método. Si no debe buscarse un método
alternativo para resolverlo.

vii. Si el juego tiene solución,


Se divide cada elemento de la columna de resultados por el valor
de la suma de todos los elementos de esa columna, y luego se
repite el procedimiento para la fila de resultados.
Estos valores son las probabilidades de elegir cada opción en la
estrategia mixta correspondiente a cada jugador.
El valor del juego se calcula eligiendo una opción cualquiera de
uno de los dos jugadores y sumando para cada opción del otro
jugador el producto del pago de esa opción por la probabilidad
de que el otro jugador la elija.

Informática de Gestión
Teoría de Juegos
3 -4
17
A B B1 B2 B3 B1-B2 B2-B3 -1 7
A1 -1 2 1 -3 1
A2 1 -2 2 3 -4 -3 1
20
-1 7
A3 3 4 -3 -1 7
A1-A2 -2 4 -1 -3 1
A2-A3 -2 -6 5 9
3 -4

17+ 20 + 9 = 46
4 -1 -2 -1 -2 4
-6 5 -2 5 -2 -6

14 12 20 14+ 12 + 20 =46

Informática de Gestión
Teoría de Juegos
Como las sumas son iguales, entonces tiene solución, las estrategias
son las siguientes:

Sa = ( 17/46, 20/46, 9/46 ) Sb = ( 14/46, 12/46, 20/46 )

El valor del juego:

Se elige una alternativa cualquiera de cualquier jugador, (Ej: 1) del


jugador B, y se suman los productos de cada pago según la
alternativa de A por su probabilidad. Entonces:

Vj = (-1).17/46 + 1. 20/46 + 3.9/46 = 30/46

Informática de Gestión
Teoría de Juegos
 Laplace: todos los estados son igualmente probables

min  a1 j  a 2 j  a3 j  ...  a nj 


1  1 
máx a i1  ai 2  a i 3  ...  a in 
n  n 

A B B1 B2 B3 Promi

A1 7 9 11 9

A2 8 6 2 5.33

A3 4 10 6 6.66

Promj 6.33 8.33 6.33

Informática de Gestión
Teoría de Juegos
 Maximin: max {Ci} para A (matriz de ganancia) donde Ci=min aij
Asegura que para un comportamiento del contrincante que menos
convenga se obtenga la ganancia máxima
 Minimax: min {Dj} para B donde Dj=max aij
A B1 B2 B3 C
B
A1 7 9 11 7

A2 8 6 2 2

A3 4 10 6 4

D 8 10 11

Informática de Gestión
Teoría de Juegos
 Hurwicz (optimismo):  representa un rango de actitudes de la más
optimista a la más pesimista.

 = 0, 1 (índice de optimismo)
Hi =  . (máxj aij) + (1 - ) . (minj aij)
A B1 B2 B3
B
H1 = 0,1 . 11 + 0,9 . 7 = 7,4
A1 7 9 11
H2 = 0,1 . 8 + 0,9 . 2 = 2,6 A2 8 6 2

H3 = 0,1 . 10 + 0,9 . 4 = 4,6 A3 4 10 6

Nos quedamos con el máximo valor obtenido

Informática de Gestión
Teoría de Juegos
 Savage o criterio de arrepentimiento, reemplaza la matriz de resultados
con una matriz de pérdidas
A B B1 B2 B3 Para A:
R’ij = Máx. de Columna – Rij
A1 7 9 11
Aplicar Min i (máx j R’ij)
A2 8 6 2

A3 4 10 6
Para B:
R’ij = Rij - Min. de Columna
A B B1 B2 B3

A1 1 1 0 1
A2 0 4 9 9
A3 4 0 5 5

Informática de Gestión
Teoría de Juegos
 Cuando el valor del juego inferior es igual al valor del juego
superior, las estrategias de los jugadores A y B son estables, y a
dicho punto se lo denomina valor del juego.
 Las estrategias con las cuales se alcanza esta ganancia se
denominan estrategias puras óptimas, y su conjunto, solución de
juego. El juego se resuelve por estrategias puras.
 Existen estrategias mixtas: el jugador no aplica una sola estrategia
sino varias, combinándolas aleatoriamente con ciertas
probabilidades.
 En este caso SA=(p1,p2,…,pm) y SB=(q1,q2,…,qn), donde p1 es la
probabilidad de que el jugador A aplique la estrategia A1 y q1 es la
probabilidad de que el jugador B aplique la estrategia B1.
 Cualquier juego finito de suma cero entre dos personas , tiene por
lo menos una solución, o sea un par de estrategias óptimas, que
son en general mixtas (SA*, SB*) y un valor correspondiente al valor
del juego.

Informática de Gestión
Teoría de Juegos
 Método Gráfico y deducción analítica de
probabilidades asociadas.
 Método de Braun Robinson

Ejemplo:
A B B1 B2 B3

A1 7 2 9

A2 2 9 0

A3 9 0 11

Informática de Gestión
Teoría de Juegos
 K=nro. Iteración - i=estrategia de A - j=estrategia de B
 Vmin=ganancia mínima acumulada dividido k
 Vmax=ganancia máxima acumulada dividido k
 V*=(vmax+vmin)/2

k i B1 B2 B3 j A1 A2 A3 vmin Vmax v*
1 3 9 0 11 2 2 9 0 0 9 4.5
2 2 11 9 11 2 4 18 0 4.5 9 6.75
3 2 13 18 11 3 13 18 11 3.67 6 4.84
4 2 15 27 11 3 22 18 22 2.75 5.5 4.13
5 1 22 29 20 3 31 18 33 4 6.6 5.3
6 3 31 29 31 2 33 27 33 4.84 5.5 5.17
7 1 38 31 40 2 35 36 33 4.43 5.14 4.79

Informática de Gestión
Teoría de Juegos
 SA=(p1,p2,p3)
 SB=(q1,q2,q3)

 p1 es aproximadamente la cantidad de veces que A eligió la


estrategia 1 en k, entonces: p1= 2/7 = 0.28 (aproximadamente)
 p2 = 3/7 = 0.42 (aproximadamente)
 p3= 2/7= 0.28 (aproximadamente)
 De la misma forma calcular q1, q2 y q3 aproximados.
 Los valores exactos son obtenidos mediante la resolución de
problemas dobles de programación lineal y equivalen a p1=0.25,
p2=0.5 y p3=0.25. Si aumentan la cantidad de iteraciones de Braun
Robinson nos vamos acercando a los valores reales.

Informática de Gestión