Está en la página 1de 50

Contenido:

I. Repaso de Estadística y Probabilidades


Definiciones básicas de Estadística 1
Teorema de Bernoulli 1
Axiomas 2
Variables aleatorias 2
Función de probabilidad 2
Distribución de probabilidades 3
Esperanza matemática 3
Varianza y covarianza 4
Correlación y regresión 4
Fórmula de Bayes 5
Función de densidad o frecuencia normal 7
2. Problemas clásicos de decisión
Modelo para toma de decisiones 8
Criterio de Wald (maximin) 8
Criterio Maximax 9
Criterio de Hurwicz 9
Criterio de Savage 9
Toma de decisiones bajo riesgo 11
3. Toma de decisiones con variable continua
Toma de decisiones con variable continua bajo riesgo 12
Optimización con demanda aleatoria 13
4. Análisis en la toma de decisiones
Análisis de mercado. Valor esperado de la información de muestra 15
Cuanto pagar por la información de mercado 18
Árboles de decisión. Toma de decisión multinivel 19
Teoría de utilidades 29
Funciones de utilidad 31
Sensibilidad 32
Análisis de sensibilidad para las probabilidades condicionales 34
5. Teoría de Juegos
Definiciones 36
Juegos rectangulares 36
Hipótesis de von Neuman 37
Cómo elige el Jugador I el vector x 39
Planteo para el Jugador II 39
Estrategia mixta 41
Teoría de juegos y programación lineal 41
6. Equilibrio de Nash. Otras estrategias y Aplicaciones en Macroeconomía 44
El dilema de los presos 45
Duopolios y teoría de juegos 46
La guerra de los sexos 48
Modelos halcón – paloma 48
Decisiones y Juegos. 1

1. - Repaso: definiciones básicas de estadística y


probabilidades
Conjunto estadístico: Es el conjunto de elementos sometidos a la investigación estadística. No existe una
definición rigurosa, sino que solo se puede afirmar, dado un elemento cualquiera, que pertenece o no al
conjunto. Los elementos constitutivos pueden ser objetos, mediciones, acontecimientos enumerados. Cada
elemento puede ser en sí mismo un conjunto.

Frecuencias Absolutas: La frecuencia absoluta de un carácter o de una medición dentro de un conjunto


numerable, es el número de individuos a los cuales está ligado este carácter o esta medición.

Frecuencia Relativa: Es la razón entre la frecuencia absoluta y el total efectivo del conjunto, es decir, la
fracción del conjunto que presenta determinadas características

Acontecimiento: Es la ocurrencia de un hecho observable o fenómeno. El resultado de una prueba.

Prueba: El conjunto de todas las pruebas que son posibles dentro del mismo sistema de acontecimientos
que son ciertos o a los que hacemos ciertos.

Equivalencia: Dos acontecimientos son equivalentes si uno es la condición necesaria y suficiente del otro

Operaciones: Si A y B son dos acontecimientos,


(A y B) = (A∩B) Es el acontecimiento que consiste en la realización de A y de B. Intersección.
(A o B) = (A∪B) Es el acontecimiento que consiste en la realización de al menos uno de los
acontecimientos. Unión.

Probabilidad: Designa a la vez:


1. Un símbolo matemático sometido a reglas de cálculo particulares definido por axiomas de cálculo de
probabilidades
2. El valor numérico asignado a ese símbolo cuando el cálculo se emplea en aplicaciones prácticas.

En cada caso particular este valor se determina en función de la lógica del sistema axiomático. La
probabilidad de un acontecimiento A se escribe P(A) .

Según la definición clásica de Laplace, 1812, la probabilidad de un suceso es la razón entre el número de
casos favorables y el número de casos igualmente posibles. Como esta definición no es aplicable en
conjuntos cuyos elementos – casos posibles – sean infinitos, en vez de “número” se debería usar el
vocablo “medida” a efectos de poder calcular la razón.

Principio de las probabilidades totales: si dos sucesos A y B son incompatibles, la probabilidad de que
ocurra A o B es igual a la suma de la probabilidad de cada suceso:
P(A o B) = P(A) + P(B)

Principio de las probabilidades compuestas: si dos sucesos A y B son independientes entre sí, la
probabilidad de que ocurran A y B a la vez es igual al producto de las probabilidades de cada suceso:
P(A y B) = P(A) * P(B)

Frecuencia, probabilidad experimental o probabilidad estadística: los casos favorables son obtenidos
por la experiencia.

Teorema de Bernoulli: Sea P la probabilidad de un acontecimiento A y f es la frecuencia relativa de ese


acontecimiento en un conjunto de N pruebas idénticas e independientes. Si el número de pruebas crece
indefinidamente entonces la frecuencia converge hacia la probabilidad.

El teorema permite:
1. Una interpretación concreta de la noción de probabilidad
2. Obtener a partir de resultados experimentales la estimación de la probabilidad con un margen de error
predeterminado.
Decisiones y Juegos. 2

Es de uso constante en estadística matemática considerar al conjunto estadístico observado como muestra
perteneciente a un universo infinito, del cual forma parte. El universo de referencia puede ser expresado
en términos de un modelo probabilístico, lo que es caracterizado por funciones de reparto y de
distribución de probabilidad.

Axiomas

1. Espacio muestral (E) es el conjunto de todos los resultados posibles de un experimento.


Ejemplo, se tiran tres monedas para ver si caen cara (C) o cruz (*). El espacio muestral es el siguiente
conjunto:
{(C,C,C), (C,C,*), (C,*,C), (*,C,C), (C,*,*), (*,C,*), (*,*,C), (*,*,*)}
Experimento aleatorio: es un experimento que genera un espacio muestral.
2. P(A) ≥ 0
3. Si A y B son equivalentes, P(A) = P(B)
4. Si A es imposible P(A) = 0
5. Si A es cierto P(A) = 1
6. Si A, B, ... , L son mutuamente excluyentes P(A∪B∪...∪L) = P(A) + P(B) + ... + P(L)
7. Para el espacio muestral
P(E) = P(A1) + P(A2) + … + P(An) = 1
siempre que A1, A2, … An es un número finito de sucesos.
El espacio muestral E = A1 ∪ A2 ∪ … ∪ An

Variables aleatorias: son aquellas que provienen de un experimento aleatorio. A cada elemento de E
corresponde un número real.
EJEMPLO: Se realiza un experimento aleatorio arrojando dos monedas y verificando si sale cara o cruz.
Interesa solo saber el número de caras (C).
Espacio muestral:
(C,C) (C,*) (*,C) (*,*)
Se Define la función X = n° de caras. Los valores de X son:
X(C,C) = 2
X(C,*) = X(*,C) = 1
X(*,*) = 0
Por tanto existe un nuevo conjunto de números reales {(2), (1), (0)} con una probabilidad para cada uno:
P(2) = P(C,C) = ¼
P(1) = P(C,*) + P(*,C) = ¼ + ¼ = ½
P(0) = P(*,*) = ¼

Por tanto habrá una función de probabilidad que será f(x1) = P(X = x1)
La función de probabilidad del suceso x1 será a probabilidad de que los sucesos buscados X sean x1 y se
debe cumplir que ∑ f ( x ) = 1, y que f(x )≥ 0 ∀i
i
i i

Si lo buscado es la probabilidad de que X sea menor o igual que xk y los xi están ordenados de manera tal
que x1 ≤ x2 ≤ … ≤ xn, entonces se tendrá
n
F ( x h ) = P( X ≤ x h ) = ∑ f ( x w ) que es la función de distribución de probabilidad.
i =1
EJEMPLO
Se arrojan tres monedas y se analiza la variable aleatoria X = número de caras:
C,C,C C,C,* C,*,C *,C,C
C,*,* +,c,* *,*,C *,*,*
Como cada uno de los elementos tiene una probabilidad P = 1/8, los números de caras posibles son:
x1 = 0
x2 = 1
x3 = 2
x4 = 3
por tanto se tendrá:
Decisiones y Juegos. 3

X f(x) F(x)
0 1/8 1/8
1 3/8 1/8+3/8=1/2
2 3/8 ½+3/8=7/8
3 1/8 7/8+1/8=1

Distribución de probabilidades

Si se define
Función de distribución izquierda como P( x ≤ x ) = F ( x )
Función de distribución derecha como P( x ≥ x ) = G ( x )
Si la variable aleatoria es discreta: F + G > 1 dado que el punto tiene probabilidad distinta de cero.
Si es continua, F + G = 1 dado que, por convención, la probabilidad puntual es cero.

Se define función de densidad o frecuencia como


dF ( x )
f ( x) = = F '( x )
dx
si con los datos se construye la función de densidad se obtiene las siguientes formas generales:

En general las distribuciones normales se presentan cuando existe poca dispersión en los valores de x. Si
la variable x es, por ejemplo, salarios de empleados de una fábrica, entonces la dispersión es grande y
será una distribución asimétrica positiva.
En general alta asimetría es alta dispersión de la variable, lo que es medible a través de la varianza.
σ σ
El cociente: es la dispersión relativa o coeficiente de variación. Puede decirse que, si < 0,15, el
µ µ
modelo responde a una distribución normal.
σ
si 0,15 < < 0,25, el modelo puede ser o no normal.
µ
σ
si ≥ 0,25 el modelo responde a una distribución asimétrica.
µ

Esperanza matemática
Para una variable aleatoria finita X que toma los valores x1, x2, … , xn cuyas probabilidades son f(x1),
f(x2),…,f(xn), se denomina esperanza matemática o valor medio de la función G(x) de la variable
aleatoria X a la expresión
n n
E (G ( X )) = ∑ G ( xi ) f ( xi ) = ∑ G ( xi ) P( xi )
i =1 i =1
EJEMPLO
Sea X el número obtenido al lanzar un dado:
Decisiones y Juegos. 4

1 1 1 1 1 1
E( X ) = × 1 + × 2 + × 3 + × 4 + × 5 + × 6 = 3,5
6 6 6 6 6 6
1+ 2 + 3 + 4 + 5 + 6
E( X ) = = 3,5
6

Momentos de una variable aleatoria


Se denomina momento de orden k de la variable aleatoria finita X a la esperanza matemática de Xk.
n
α k = E ( X k ) = ∑ xtk f ( xt )
t =1
en particular, si k=1 se tiene la expresión del punto anterior, valor medio. Sobre esta definición, α1, se
construyen los momentos centrados:
n
µ k = E (( X − α 1 ) k ) = ∑ ( xt − α 1 ) k f ( xt )
t =1
Varianza: es el momento centrado de segundo orden:

Var ( X ) = σ 2 = σ 2 ( X ) = E (( X − α 1 ) 2 ) = ∑ ( xt − α 1 ) 2 f ( xt )

La raíz cuadrada de la varianza se llama desviación típica de la variable aleatoria X.

Covarianza: Si se tienen dos variables aleatorias, X e Y, cuyas medias son, respectivamente, α1 y β1, la
covarianza es:
cov( X , Y ) = E (( X − α 1 )(Y − β 1 )) = ∑ ( xt − α 1 )( y j − β 1 ) P( xt , y j )

Correlación: si las variables aleatoria X e Y son independientes, la cov(X,Y)=0. Esto significa que la
covarianza mide el grado de dependencia entre las dos variables. Si se conoce la desviación típica de cada
variable (σ(X) y σ(Y)), se llama coeficiente de correlación a:
cov( X , Y )
ρ= que es un número real que varía entre – 1 y + 1. Cuando ρ = 1 o ρ = -1 significa que
σ ( X )σ (Y )
entre X e Y existe una dependencia lineal. Si ρ = 0 las variables son independientes.

Regresión: Si para dos variables aleatorias X e Y se tiene que la probabilidad de encontrar un par x1, y1 es
P(x1, y1) , entonces
P ( x i , y j ) = P ( xi ) P ( y j xi )
para cada valor de X, por ejemplo X = x1 se tendrá la esperanza matemática de Y:
y i' = ∑ y j P( y j x1 ) que es una función cuyo dominio es el conjunto de valores de X y que se llama
j
regresión de Y sobre X.
Se aproxima esta función a una recta de forma y = ax + b de manera que al determinar las constantes a y
b la esperanza sea mínima, siendo tal esperanza:
E = ∑ (∑ y j P ( y j xi ) − a − bxi ) 2 P( xi )
i j

para minimizar hay que tener en cuenta que ∑f


i, j
ij = 1 y derivar respecto de a y de b. Así se obtienen

los coeficientes de la recta de regresión de Y sobre X. (b se denomina coeficiente de regresión)

cov( X , Y )
a = E (Y ) − E( X )
σ 2 (X )
cov( X , Y )
b=
σ 2 (X )
Decisiones y Juegos. 5

Fórmula de Bayes
Considérese un espacio muestral E que contenga todos los posibles resultados de una prueba. Si A y B son
dos acontecimientos de E, entonces la probabilidad condicional de A, dado que B ha ocurrido, y la
probabilidad condicional de B, dado que A ha ocurrido, están definidas por:

P( A∩ B ) = P( B ) * P( A|B ) = P( A) * P( B| A)

P( A|B ) P( B ) (1)
P( B| A) =
P( A)
en donde P(A) > 0. Esta ecuación se lee así: Siempre que haya ocurrido un evento A, la probabilidad del
evento B es la probabilidad de que los eventos A y B ocurran simultánea o sucesivamente dividido por la
probabilidad de A.

Se tienen tres urnas. Una de ellas con 3 fichas


rojas y 6 blancas, a la que se llama URNA 1.
Si de la URNA 1 se extrae una ficha roja hay
que extraer de la URNA 2 una ficha de entre
las 5 Azules y 4 Verdes que contiene. Si, en
cambio, se extrae una ficha blanca, hay que
extraer de la URNA 3 una ficha entre las 2
Naranjas y 7 Amarillas que contiene.

¿Que probabilidad hay de sacar una ficha


azul?

Solución

Primera extracción Segunda extracción: Condicional.


Si fue roja: Si fue blanca:

P(ROJA) = 3/9 = 0,333 P(AZUL|ROJA) = 5/9 = 0,556 P(AMARILLA|BLANCA) = 7/9 = 0,778


P(BLANCA) = 6/9 = 0,667 P(VERDE|ROJA) = 4/9 = 0,444 P(NARANJA|BLANCA) = 2/9 =
0,222
1,000 1,000 1,000
1
Resta resolver P(A|B) xP(B) = P(AZUL|ROJA) x P(ROJA) = 0,556 x 0,333 = 0,185

Si todos los resultados se tabulan se encuentra:

Evento Probabilidad Marginal Probabilidad condicional Probabilidad conjunta


P(B) P(A|B) P(B) x P(A|B)
Azul si fue roja P(R) = 0,333 P(AZ|R) = 0,556 0,185
Verde si fue roja P(R) = 0,333 P(V|R) = 0,444 0,148
Amarilla si fue blanca P(BL) = 0,667 P(AM|BL) = 0,778 0,519
Naranja si fue blanca P(BL) = 0,667 P (N|BL) = 0,222 0,148
1,000

1
En algunos textos encontrará P(B|A) x P(A) = P(BA)
Decisiones y Juegos. 6

Bayes evalúa la carga dado el efecto:


Si P(A|B) = P(A) y si P(B|A) = P(B),. Si A y B son independientes, entonces
P(A ∩ B) = P(A) * P(B)

En definitiva, el análisis Bayesiano es un procedimiento para estimar las probabilidades de situaciones en


las que se dispone de información muestral. La terminología usada es:

Estados de la natura (estados de la naturaleza): generalmente representa un acontecimiento o situación


posible en el futuro. Por ejemplo, un estado de la naturaleza para quien toma decisiones puede ser la
demanda esperada, las preferencias del consumidor, las condiciones económicas, un rango de
temperaturas, etc. Con Si se representan los i estados de la naturaleza, para i=1 hasta n.

Probabilidad inicial: representa la posibilidad de que un estado de la natura ocurra, sin tener
información. P(Si) es la probabilidad del estado de la naturaleza Si.

Información de muestra: usualmente es la información adicional que se obtiene cuando se realiza un


estudio o muestreo. Los datos obtenidos se representan con diferentes indicadores. Ij representa el
indicador j de la muestra obtenida para j = 1,...,m.

Probabilidad condicional: representa la posibilidad de que se dé un particular suceso si otro ha ocurrido.


En el análisis bayesiano usualmente se representa la probabilidad de un indicador de un muestreo si se dá
un determinado estado de la naturaleza. P(Ij/S) es la probabilidad condicional de Ij dado Si. La
probabilidad condicional puede ser un indicador del nivel de confianza de la información de muestra.

Probabilidad marginal: es la probabilidad general de un indicador muestral Ij.


P(Ij) = S P(Si) P(Ij/Si) para i =1 a n.

Probabilidad conjunta: es la probabilidad de que múltiples sucesos ocurran simultáneamente. La


probabilidad conjunta de que ocurran Ij y Si simultáneamente es P(Ij,Si) = P(Si) P(Ij/Si)

Probabilidad revisada: es la probabilidad condicional de que se de un estado de la naturaleza dado un


resultado muestral.

P(Si/Ij) = P(Ij,Si) / P(Ij)


Decisiones y Juegos. 7

Función de densidad o frecuencia normal


1  −1  x − µ  2 
f ( x) = exp    
σ 2π  2  σ  
x ∈ ( −∞, ∞)

los parámetros de la distribución son µ y σ:



µ = ∫ xf ( x )dx
−∞

σ 2 = ∫ x 2 f ( x )dx
−∞
y además

∫−∞
f ( x )dx = 1
Si se fija una media muestral x , interesa
hallar el área a la izquierda de esa media, es
decir:
∞ 1 ∞  −1  x − µ  2 
P( x ≤ x) = ∫ f ( x )dx = ∫−∞ exp 2  σ  dx
−∞ σ 2π  
se resuelve efectuando un cambio de variables
x−µ
z=
σ
x = µ + σz
dx = σdz
entonces
P( x ≤ x ) = F ( x ) = Φ( z)
z2
1 ∞ −
Φ( z ) =
2π ∫−∞
e 2
dz
esta integral depende de un solo dato, z, siendo que además los datos con z medio en cero están tabulados.

A1 = Φ( z ) = F ( x ) = P( x ≤ x )
Decisiones y Juegos. 8

2. Problemas clásicos de decisión


El problema de elegir una entre varias alternativas posibles constituye la base temática para la obtención
de modelos de optimización en teoría de la decisión. Los modelos actuales se construyen a partir de las
características de la información disponible:

Modelos para tomas de decisiones en función de la información


1. CERTEZA. Se parte de información cierta. Las técnicas dominantes son: programación lineal,
dinámica y matemática.
2. INCERTIDUMBRE. No se conoce la probabilidad de ocurrencia de los eventos asociados, sin
posibilidades de efectuar una asignación subjetiva de esa probabilidad.
n
3. RIESGO. Se conoce la probabilidad asociada a cada evento y se sabe que ∑ P( N ) = 1 siendo que
i =1
i

Ni son riesgos mutuamente excluyentes.

Los modelos ordenan la información en una matriz de resultados posibles, en donde Ai son las acciones o
alternativas a seguir y Ni son los distintos estados posibles o estados de la naturaleza. bij son los
resultados de tomar una acción para cada estado. Estos resultados, en términos económicos, suelen ser
beneficios asociados a cada par Ai ; Nj .
Ai N N1 N2 ... Nn
j
A1 b11 b12 b1n
A2 b21 b22 b2n
...
Am bm1 bm2 bmn

Ejemplo: Una empresa considera la posibilidad de incorporar una nueva caldera, sobre la base de tres posibilidades:
Grande (G), Mediana (M) o Chica (C). El éxito o fracaso de la inversión depende de las condiciones económicas de la
próxima temporada, que pueden ser: MUY BUENAS, BUENAS, REGULARES o MALAS.
Se establece la siguiente matriz de beneficios expresada en cientos de miles de um (unidades monetarias):

Ai Nj Muy Buenas Regular Malas


buenas
G 2,5 0 -2,5 -4,1
M 1,6 0,3 -1,2 -2,1
C 0,6 0,4 -0,3 -0,3
NADA -0,4 0 0 0

Como no son conocidas las probabilidades para cada Ni ni resulta oportuno inventar subjetivamente se
debe resolver con los modelos para condiciones de incertidumbre que se desarrollan a continuación.

Criterio de Wald (maximin), (pesimista)


Consiste en buscar el mínimo de cada acción y en recomendar la acción que tenga el máximo de esos
mínimos:
Ω = maxi (minj (bij))
MIN
G -4,1
M -2,1
C -0,3
NO -0,4

Como el máximo de estos mínimos es -0,3, corresponde comprar la más pequeña. Este método, en la
práctica, no se utiliza en acciones contra la naturaleza.
Decisiones y Juegos. 9

Criterio Maximax, (optimista)


Es el método opuesto al de Wald: se buscan los máximos y se recomienda el máximo de todos ellos:
Ω = maxi (maxj (bij))
MAX
G 2,5
M 1,6
C 0,6
NO 0
Por consiguiente se recomendará la acción asociada con 2,5: comprar la caldera grande.

Criterio de Hurwicz
Introduce un coeficiente de optimismo ω y se define, para cada acción un
Hi = ω MAX + (1 - ω) MIN
luego se selecciona el máximo de estos H.
Por ejemplo si se toma ω = 0,4,
H1 = 0,4 * 2,5 + (1 - 0,4) * - 4,1 = - 1,46
H2 = 0,4 * 1,6 + (1 - 0,4) * - 2,1 = - 0,62
H3 = 0,4 * 0,6 + (1 - 0,4) * - 0,3 = 0,06
H4 = 0,4 * 0 + (1 - 0,4) * - 0,4 = - 0,24
Ω = maxi Hj =0,06 (acción 3)

Criterio de Savage, (minimax)


Es el criterio de aplicación. Se basa en definir que es lo que interesa: ganar lo más posible. Pero cada
acción, al tener una aleatoriedad, cuando mayor es el beneficio en el éxito, tanto mayor será el costo en el
fracaso.
Savage descubre que lo que interesa es que después que todo pase, quien decide no tenga que lamentar,
para lo cual se define una función monetaria: el arrepentimiento.
En el problema: supóngase que se compró la caldera P y en la naturaleza se da MUY BUENA. Se ganó
0,6 pero lo mejor hubiera sido, para MUY BUENA, una caldera grande. Así se establece una diferencia:
Máximo beneficio - lo realmente ganado
A esa diferencia se la denomina arrepentimiento. Con cada una de ellas, se puede construir una matriz de
arrepentimientos:

Ai Nj Muy Buenas Regular Malas


buenas
G 0 0,4 2,3 4,1
M 0,9 0,1 1,2 2,1
C 1,9 0 0,3 0,3
NADA 2,9 0,4 0 0
y se procede a elegir el mínimo de los máximos arrepentimientos:

Ω = mini (maxj (Arrij))


MAX
Arr
G 4,1
M 2,1
C 1,9
NO 2,9
Corresponde a la acción 3, comprar la chica.

Este criterio es el que normalmente se utiliza en la práctica, a veces también si se disponen de


probabilidades (ver más adelante).
Decisiones y Juegos. 10

EJEMPLO
Se decide lanzar al mercado un producto que tiene un costo de 32 y se recibe por él 47. No se sabe nada sobre la
demanda, salvo que hay una demanda mínima de 200 unidades y además se sabe que la planta puede producir desde
ese mínimo de 200 unidades hasta un máximo de 2000. Las demandas insatisfechas no provocan pérdidas
La matriz a construir sería el beneficio correspondiente a cada unidad producida, desde 200 hasta 2000 y a cada
unidad demandada, desde 200 a 2000:
P X 200 201 ... 2000
200 3000 3000 3000
201 2965 3015 3015
...
2000 -54600 -54553 30000
por lo que conviene reescribir todo en forma de ecuación:
x≤P B = vx - cP
x>P B = (v - c) P

Se consideran dos situaciones: x≤ P y x > P y se tiene:

El punto 1 es el mejor acto cuando x = P


El punto 2 es la realidad de x < P, luego, ∆1 es el arrepentimiento para este caso
El punto 3 es el mejor acto.
El punto 4 es la realidad y ∆2 es el arrepentimiento de este caso
Fijado un arrepentimiento a la derecha y a la izquierda, se tiene

x≤P Ar1 = (v - c)x - (vx - cP) = c(P - x) ∆1


x>P Ar2 = (v - c)x - (v - c)P = (v - c)(x - P) ∆2

Se observa que hay arrepentimientos máximos en los extremos a y b.


Decisiones y Juegos. 11

Se van cambiando los valores de P entre a y b, y cuando el arrepentimiento por derecha es igual al arrepentimiento
por izquierda, se trata del óptimo.
c (P - a) = (v - c) (b - P)
Despejando P es el óptimo.

Toma de decisiones bajo riesgo


Se aplica cuando se conocen las probabilidades asociadas a cada estado de la naturaleza, el criterio
empleado es el de máximo beneficio esperado, consiste en calcular la esperanza matemática del beneficio
de cada acción y elegir aquella que lo maximiza.

Se plantea nuevamente la matriz inicial, a la que se agrega la columna de E(B) y las probabilidades P(xi):
P(xi) → 0,2 0,2 0,4 0,2
Ai ↓ \ Ni→ Muy buenas Buenas Regulares Malas E(B)
Grande G 2,5 0 −2,5 −4,1 −1,24
Mediana M 1,6 0,3 −1,2 −2,1 −0,52
Chica C 0,6 0,4 −0,3 −0,3 0,02
NADA −0,4 0 0 0 −0,08

n
E ( B ) = ∑ P( xi )bij
j

Ω = maxE ( Bij )
El máximo E(B) es 0,02, asociado con la compra de una caldera pequeña. Si se trabajara con
arrepentimientos se deben calcular los
E ( Arr ) = ∑ P( xi ) Arrij
Ω = minE ( Arrij )
Se analizará a continuación lo que ocurre si se cuenta con alguien con capacidad de pronosticar el futuro.
Obviamente la capacidad de predicción del futuro varía desde el extremo de la no predicción hasta la
predicción perfecta (o confiable). La predicción se perfecciona con investigación, por lo tanto aparece un
costo asociado a la predicción: este costo aumenta con el grado de perfección, pues aumenta la necesidad
de investigación asociada con ese grado de perfección.

Aparece ahora un Beneficio esperado con información perfecta (BEIP):


n
BEIP = ∑ P( xi ) max Bij
i
que aplicada al caso anterior brinda un BEIP = 0,58

Debe establecerse entonces la diferencia de beneficios obtenida antes con la que se obtendría con la
información perfecta:
BEIP - maxE(Bij) = VEIP
siendo este el valor esperado con información perfecta, siendo en este caso:
0,058 - 0,02 = 0,56
que es la diferencia entre lo que se obtiene con pronóstico y lo que se obtiene sin ese pronóstico: es el
máximo que puede pagarse por dicho pronóstico.
El VEIP es proporcional a σ.
Decisiones y Juegos. 12

3.- Toma de decisiones bajo riesgo con variable continua.


El criterio es el de máximo beneficio esperado. En este caso particular es necesario calcular la esperanza
matemática del beneficio para cada alternativa, trabajando bajo la hipótesis de que se conoce el modelo
probabilístico al que puede ser ajustado el sistema.

Ejemplo
Una empresa proveedora de tecnología ha establecido un negocio para la instalación de una planta procesadora de
leche, llave en mano, por un monto de $ 600000 con un plazo de entrega de 210 días.
La obra tiene un costo fijo de $ 330000 y un costo variable de 500 $/día. En el contrato se establece una penalización
de 2500 $/día de atraso y un premio de 1500 $/día de adelanto. Se ha establecido que el tiempo medio de duración es
µ = 195 días con σ = 25 días, siendo la variable aleatoria el tiempo de duración de la obra, con una distribución normal.
Calcular el beneficio esperado.
x = tiempo de duración de la obra
µ = tiempo medio de duración de la obra = 195 días
σ = 25 días
plazo de entrega = 210 días
Para x ≤ 210
B = 600000 330000 − 500x + 1500 (210 − x)
Para x > 210
B = 600000 − 330000 − 500x − 2500(x − 210)
que corresponde a
B = 585000 − 2000x para x ≤ 210
B = 795000 − 3000x para x > 210


∫ (585000 − 2000 x ) f ( x)dx + ∫ (795000 − 3000x) f ( x)dx
210
E ( B) =
−∞ 210
210 210 ∞ ∞
E ( B ) = 585000∫ f ( x )dx − 2000∫ xf ( x ) dx + 795000∫ f ( x )dx − 3000∫ xf ( x ) dx
−∞ −∞ 210 210
que puede ser escrita, reemplazando
x
∫ −∞
f ( x )dx = F ( x ) = Φ( z )
210 ∞
E ( B ) = 585000 F ( x ) − 2000∫ xf ( x ) dx + 795000G ( x ) − 3000∫ xf ( x ) dx
−∞ 210
que expresa la esperanza matemática del beneficio. Aparece aquí una novedad: existe una variable de corte en la
expresión funcional del beneficio, lo que da lugar a nuevas definiciones:
EXPECTATIVA PARCIAL IZQUIERDA
x

−∞
xf ( x )dx = H ( x )
EXPECTATIVA PARCIAL DERECHA

∫ xf ( x)dx = J ( x)
x
de manera tal que se cumple la condición

H ( x) + J ( x) = µ = ∫−∞
xf ( x )dx
Luego
x 1 ∞  1  x − µ 2
H ( x) = ∫ −∞
xf ( x )dx =
σ 2π ∫−∞ x exp −   dx
 2  σ  
Desarrollando la integral y efectuando cambio de variable:
x−µ
z=
σ
x = µ + σz
dx
dx = σdz ⇒ dz =
σ

resolviendo queda
Decisiones y Juegos. 13

σ −2z
2

H ( x ) = µΦ ( z ) − e

volviendo al cálculo de E(B)
E(B) = 585000 F(210) − 2000 H(210) + 795000 G(210) − 3000 J(210)
x − µ 210 − 195
z= = = 0,6
σ 25
Φ(0,6) = F (210) = 0,7257
−0 , 6 2
25
H ( x ) = H (210) = 195 × 0,7257 − × e 2 = 133,18

J (210) = µ − H (210) = 195 − 133,18 = 61,82
G (210) = 1 − F (210) = 1 − 0,7257 = 0,2743
E ( B ) = 190784

Optimización con demanda aleatoria


Debe conocerse el modelo de distribución de la variable aleatoria. En general para períodos cortos de
tratamiento la distribución puede ser gamma y para períodos largos normal.
Básicamente son necesarias dos tipos de informaciones:
1. INFORMACIÓN ECONÓMICA. Determinística.
c Costo unitario
v Precio de venta unitario
vR Valor residual de las unidades sobrantes
cs Costo de escasez de las unidades faltantes
2. INFORMACIÓN ESTADÍSTICA
Modelo de distribución
µ
σ

Se trata de hallar el óptimo con un concepto de decisión de máximo beneficio esperado.

Se tiene un producto perecedero con demanda aleatoria, que tiene etiquetado un plazo de vida útil. Pasado el tiempo
puede tener cierto valor residual diferente de cero. Existe un costo de escasez. Hallar la cantidad de producto óptima a
fabricar, suponiendo un modelo normal de media µ y varianza σ

Si el lote a producir es P, el problema consiste en hallar P con un concepto óptimo.

x≤P B = vx − cP + vR (P − x) = (v − vR) x− (c − vR) P


x>P B = vP − cx + cs (x − P) = (v c + cs) P − cs x

∫ [(v − v )x − (c − v ) P] f ( x)dx + ∫ [(v − c + cs) P − csx]fxdx


P ∞
E ( B) = R R
−∞ P

E ( B ) = (v − v R ) H ( P) − (c − v R ) PF ( P) + ( v − c + cs) P(1 − F ( P)) − cs( µ − H ( P))


dy ( P) dy ( P) 2
E ( B ) = y ( P) ∴ = 0 ⇒ P = Poptimo si y solo si < 0 dado que en P hay
dP dP 2
un maximo

[ ]
dE ( B )
= (v − v R ) H ' ( P) − (c − v R ) PF ' ( P ) + (c − v R ) F ( P) + ( v − c + cs)(1 − F ( P)) − (vc + cs) PF '( P) + csH
dP

pero como
Decisiones y Juegos. 14

x dF ( x ) d
F ( x) = ∫
dx ∫
f ( x )dx ⇒ = f ( x )dx = f ( x )
−∞ dx
x dH ( x ) d
H ( x) = ∫−∞
f ( x )dx ⇒
dx
=
dx ∫
xf ( x )dx = xf ( x )
resulta:
dE ( B)
= (v − c + cs) − (v − v R + cs) F ( P ) = 0
dP
( v − c + s)
F ( P) =
(v − v R + cs)
d 2 E ( B)
= − (v − v R + cs) F ' ( P) < 0
dP 2
luego P es óptimo, maximizando el beneficio esperado. Reemplazando F(P) en E(B)
maxE ( B) = (v − v R + cs) H ( P) − csµ
donde
− z2
σe 2
H ( P ) = µΦ ( z ) −

Para una distribución normal N. ¿Cuál es el mejor actor?
Cuando x = P, entonces B = (v − c)x
E((v − c)x) = BEIP = v − c E(x) = (v − c)µ
BEIP = (v − c)µ

Entonces:
VEIP= BEIP − E ( B)
VEIP = (v − c) µ − (v − v R + cs) H ( P) − csµ
  −z2 
σ
VEIP = (v − c) µ − (v − v R + cs) ( )µΦ( z ) −   − csµ
2
e
  2π 
  
− z2
σe 2
VEIP = (v − v R + cs)

Si σ aumenta el VEIP: cuando mayor es la dispersión de la información mayor es el costo a pagar por ella

PROBLEMA
Una panificadora desarrolla un nuevo producto a lanzar al mercado. El producto tiene un costo unitario de 12 y un valor
de venta de 20. El producto no vendido se destina a pan rallado y tiene un valor de 8. La demanda sigue una
distribución normal estable de σ = 3233 unidades y de µ = 22750 unidades semanales.
1. Determinar la cantidad óptima a producir semanalmente
2. El beneficio que arrojaría esa producción
3. El VEIP
v − c + cs 20 − 12
F ( P) = = = 0,66
v − v R − cs 20 − 8
x−µ
z= ⇒ x = µ + σz
σ
F ( P) = 0,66 = Φ( z ) por tabla z = 0,4316
luego x = Popt = 22750 + 0,4316 * 3233 = 24144 unidades
Análisis en la toma de decisiones 15

4.- Análisis en la toma de decisiones

ANÁLISIS DE MERCADO. Valor esperado de la información de


muestra.
Supóngase un caso de toma de decisiones en el cual, basándose en la experiencia que se tiene sobre el
negocio, se estiman las siguientes probabilidades para la aceptación de un nuevo producto: 0,4 fracaso;
0,4 para éxito y 0,2 para un gran éxito. Se debe decidir entre una inversión Baja (B), Media (M) o Alta
(A). Utilizando el criterio probabilístico se obtiene la decisión de inversión Media:

CASO: Una empresa debe decidir lanzar un nuevo producto según el siguiente cuadro de situación:
RESULTADOS
DECISIÓN ↓ FRACASO – F ÉXITO – E GRAN ÉXITO – G
PROBABILIDAD→ → 0,4 0,4 0,2
BAJA – B -2 5 8
MEDIA – M -5 10 12
ALTA – A -8 6 15

Alternativa seleccionada: Inversión Media (M) con una ganancia esperada de $4,4

Podría ocurrir, sin embargo, que la estimación de probabilidad fuera diferente, lo que conduciría a una
decisión distinta: si la probabilidad de fracaso fuera 0,7, la de éxito 0,25 y la de gran éxito fuera 0,05, la
decisión sería la de inversión Baja con una ganancia esperada de $ 0,25.

Como los cambios en las probabilidades producen cambios en la decisión y en la ganancia esperada, debe
comprenderse que la estimación de ella debe realizarse con la mayor precisión posible.

El análisis de mercado ofrece herramientas para la determinación más precisa posible de la probabilidad
asociada a la toma de decisión. Obviamente esta herramienta tiene un costo de utilización que es limitante
para ella.

Diseño de la Investigación de Mercados


El objetivo es encontrar un indicador o estimador del proyecto propuesto.

Un indicador podría ser, por ejemplo, un puntaje de 1 a 10 que represente el grado de conveniencia del
proyecto. También puede ser Éxito, Fracaso, 0, 1, Favorable, Desfavorable, muy conveniente, poco
conveniente, inconveniente, muy inconveniente, etc.
Supóngase que se establece un indicador de recomendación Favorable (SF) o Desfavorable (NF), que se
define –arbitrariamente– así:

INDICADOR DEFINICIÓN
SF Más del 10% del mercado objetivo acepta el producto
NF Menos del 10% del mercado objetivo acepta el producto

El resultado de la investigación de mercado será uno de los dos indicadores y se utilizará para evaluar las
probabilidades de los diferentes indicadores de modo de poder tomar una decisión.

Sin embargo puede haber resultados incorrectos, porque la investigación de mercado se realiza sobre una
muestra aleatoria y no sobre todo el mercado objetivo. Por lo tanto se debe saber cual es el grado de
confiabilidad de la investigación realizada.

La investigación será confiable cuando sea pequeña la probabilidad de obtener el indicador equivocado
(por ejemplo, se obtuvo el indicador NF y el producto resultó un éxito)

Para ello cada investigación deberá ser contrastada con experiencias anteriores similares. Se elaboran
tablas partiendo de ciertas deducciones:
Análisis en la toma de decisiones 16

Si el producto va a ser un éxito, se cree que el 90% de las veces la investigación del mercado va a llegar
al indicador SF, lo que es correcto, y se expresa así:

P(SF | G) = probabilidad condicional de que se obtenga SF dado que el producto es un gran éxito) = 0,90

de igual manera, la probabilidad condicional de que la investigación tenga como resultado el indicador
NF si el producto es un fracaso será, por ejemplo, 0,80.

La tabla ejemplo sería:


TABLA 1
RESULTADO
F E G
NF 0,8 0,3 0,1
SF 0,2 0,7 0,9

Con esta tabla se puede construir un árbol de probabilidades estructurado con nodos y arcos:

Ahora bien, supóngase que se hace la investigación de mercado, con la cual es posible obtener dos
resultados: Favorable (SF) o Desfavorable (NF). Deben calcularse las nuevas estimaciones de las
probabilidades de cada resultado: por ejemplo, si el resultado es Favorable, SF ¿qué probabilidad hay que
el producto sea un fracaso?

Se definen probabilidades posteriores para cada caso:


Si el resultado es SF:
P( FySF )
P( F | SF ) =
P( SF )
P( EySF )
P( E | SF ) =
P( SF )
P(GySF )
P(G | SF ) =
P( SF )

Si el resultado es NF:
Análisis en la toma de decisiones 17

P( FyNF )
P( F | NF ) =
P( NF )
P( EyNF )
P( E | NF ) =
P( NF )
P(GyNF )
P(G | NF ) =
P ( NF )
Donde el numerador es la Probabilidad conjunta, que es la probabilidad de que se presente una pareja de
resultado e indicador. Por ejemplo la probabilidad conjunta de F y SF será
P( FySF ) = P( SF | F ) × P( F ) = 0,2 × 0,4 = 0,08
lo que significa que existe un 8% de probabilidades que el indicador sea Favorable y el producto sea un
fracaso.

El denominador es la probabilidad marginal, que es la suma de cada renglón de la tabla de


probabilidades de indicadores de la Tabla 1:
P(NF)=0,32 + 0,12 + 0,02 = 0,46
P(SF)=0,08 + 0,28 + 0,18 = 0,54
Con estos parámetros se obtiene la probabilidad revisada de los resultados basados en la investigación
de mercado:

Si la investigación resultó NF:


P(F|NF) = 0,69565
P(E|NF) = 0,26087
P(G|NF) = 0,04348
Si la investigación resultó SF:
P(F|SF) = 0,14815
P(E|SF) = 0,51852
P(G|SF) = 0,3333

DESARROLLO EN WinQSB:
Hasta este punto el problema puede desarrollarse mediante el módulo Análisis de decisiones de WinQSB,
seleccionando la opción Análisis Bayesiano, e indicando tres estados de la natura y dos indicadores en la pantalla de
arranque:

Con estos datos se procede a cargar la matriz de probabilidades en la pantalla de carga:

Seleccionando el menú Resolver el Problema se accede a la ventana de probabilidades revisadas:


Análisis en la toma de decisiones 18

Con el menú resultados se puede acceder a:


Probabilidades marginales:

o a Probabilidades conjuntas:

o al árbol de decisiones (debe notarse la diferencia con el de probabilidades):

El siguiente paso es identificar la decisión óptima:

a) Si la investigación de mercado resultó en el indicador NF:

DECISIÓN GANANCIA ESPERADA


Baja 0,69565 (–2) + 0,26087 ( 5) + 0,04348 ( 8) = 0,26089
Moderada 0,69565 (–5) + 0,26087 (10) + 0,04348 (12) = –0,34779
Alta 0,69565 (–8) + 0,26087 ( 6) + 0,04348 (15) = –3,34778

b) Si la investigación de mercado resultó en el indicador SF:


DECISIÓN GANANCIA ESPERADA
Baja 0,14815 (–2) + 0,51852 ( 5) + 0,33333 ( 8) = 4,96294
Moderada 0,14815 (–5) + 0,51852 (10) + 0,33333 (12) = 8,44441
Alta 0,14815 (–8) + 0,51852 ( 6) + 0,33333 (15) = 6,92587

En el caso a), la decisión óptima será la inversión baja y en el b) la moderada.

Cuánto pagar por la investigación de mercado


Como ya fue discutido con la información perfecta, el valor óptimo se calcula:
Análisis en la toma de decisiones 19

Valor esperado de ganancia esperada con la Ganancia esperada


la Información de = información de – sin la información de
Muestra muestra muestra

Como se enunció antes, la ganancia esperada sin la información de muestra es 4,4.

Para calcular la ganancia espera con la información con muestra, se procede así:

Ganancia esperada Ganancia esperada Ganancia esperada


con la información = cuando el x P(NF) + Cuando el indicador x P(SF)
de muestra indicador Es SF
es NF

Lo que da:
Ganancia… con la información de muestra = 0,26089 x 0,46 + 8,44441 x 0,54 = 4,67999

Y se calcula
Valor esperado de la información de muestra = 4,67982 – 4,4 = 0,27999.

Se lee: la ganancia esperada aumentará 0,27999 si se usan los resultados de la investigación de mercado:
la empresa no debería gastar más de 0,27999 en hacer la investigación de mercado.

Se define Eficiencia de la investigación de mercado (o información de muestra) ηim:


valor.esperado.de.la.in.de.muestra
η im =
valor.esperado.de.la.in. perfecta

que para este caso será:


0,2799
η im = × 100 = 15,56
1,8
lo que significa que la información de muestra proporciona un valor del 15,5% del que se tendría de tener
la información perfecta. Cuanto mayor sea el porcentaje, más útil es la investigación de mercado.

Árboles de decisión. Toma de decisiones multinivel.


Se desarrolla el tema siguiendo el ejemplo anterior. Si se recuerda la tabla original del problema

RESULTADOS
DECISIÓN ↓ FRACASO – F ÉXITO – E GRAN ÉXITO – G
PROBABILIDAD→→ 0,4 0,4 0,2
BAJA – B -2 5 8
MEDIA – M -5 10 12
ALTA – A -8 6 15

Estos datos pueden resumirse en un árbol que comienza con un nodo cero que representa el momento en
el cual se debe tomar una decisión: se debe elegir una de las tres alternativas de inversión. Cada
alternativa tiene tres resultados posibles. Así, el nodo cero conecta con el nodo 1, con el 2 y con el 3. Si se
llegó al nodo 1, hay tres arcos, uno al nodo 4, otro al 5 y el último al 6.

Si se llegó al 4 se obtuvo una “ganancia” de –2 (Inversión baja con resultado Fracaso). La probabilidad de
encontrar este resultado es:

P(fracaso | inversión baja) = P (F|B) = 0,4.

Para utilizar el árbol se debe comenzar con calcular la ganancia esperada con cada alternativa de los
nodos 1, 2 y 3. Por ejemplo:
Análisis en la toma de decisiones 20

Ganancia Ganancia Probabilidad Ganancia Probabilidad Ganancia Probabilidad


Esperada = Esperada x Asociada con + esperada x Asociada con + esperada x Asociada
En el En el nodo el en el el en el con el
nodo 1 4 Arco 1–4 Nodo 5 Arco 1–5 Nodo 6 Arco 1–6

Ganancia
Esperada = –2 x 0,4 + 5 x 0,4 + 8 x 0,2
En el
nodo 1

Ganancia Esperada (GE) en el nodo 1 = 2,8


Este valor calculado para cada alternativa se incorpora al árbol:

Se verifica que la mejor alternativa es la inversión moderada, que promete una ganancia de 4,4. Es un
resultado congruente con los obtenidos, ya que se usan los mismos cálculos. Sin embargo este método
permite calcular tomas de decisiones más complejas, como aquellas en que las probabilidades de los
resultados se afectan por la decisión tomada.
Desarrollo en WinQSB:

Se selecciona la opción Análisis de Tabla de Pagos:

se carga la matriz de datos:


Análisis en la toma de decisiones 21

y se obtiene el conjunto de resultados por todos los métodos, de los cuales interesa el de valor esperado:

y el árbol de decisiones:

Se puede analizar el mismo problema desde otro punto de vista: suponer que si se realiza una inversión
alta las probabilidades de éxito son mayores que si se realizara una baja inversión. Se puede suponer que
se rediseña la tabla inicial con probabilidades que están relacionadas con el nivel de inversión:

RESULTADOS
DECISIONES↓↓ FRACASO – F ÉXITO – E GRAN ÉXITO – G
BAJA – B 0,6 0,3 0,1
MODERADA – M 0,4 0,4 0,2
ALTA – A 0,2 0,5 0,3

Ahora la ganancia esperada para el nodo 1 pasa a ser –2 x 0,6 + 5 x 0,3 + 8 x 0,1 = 1,1
Análisis en la toma de decisiones 22

En este caso se verifica que la mejor inversión es la alta.

Resolución con WinQSB:


Se opta por “Análisis de árbol de decisiones”, se informa que son 13 nodos y se carga la planilla correspondiente al
árbol:

Obsérvese que la columna Tipo de Nodo lleva una letra C si es opción (por Choice), D si es decisión o nada si es
terminal. Luego se procede a encontrar una solución en tabla y otra gráfica. La tabla indica que la decisión es inversión
alta (A):
Análisis en la toma de decisiones 23

Mediante esta introducción se puede comenzar a trabajar en árboles multinivel, que permiten tomar
decisiones en varios puntos del tiempo, de manera tal que la decisión tomada en un momento dado
influye en las que se deben tomar en momentos posteriores.

Se replantea el problema ejemplo, suponiendo que solo pueden existir dos resultados: Fracaso (F) o éxito
(E), con las siguientes estimaciones de ganancias:

Ganancias de los Resultados


Fracaso – F Éxito – E
Baja – B –2 5
Moderada – M –5 8
Alta – A –5 10

Y con las siguientes probabilidades condicionadas para cada resultado:

Probabilidades de los Resultados


Fracaso – F Éxito – E
Baja – B 0,7 0,3
Moderada – M 0,6 0,4
Alta – A 0,3 0,7
Análisis en la toma de decisiones 24

El árbol de decisiones correspondiente será:

Supóngase que luego de lanzar el producto se esperan 8 semanas a efectos de tomar una segunda decisión
sobre el resto de la inversión que se utilizará con fines publicitarios para completar el año.

Esta segunda decisión depende de cuál fue la primera y de qué resultado se obtuvo al cabo de las ocho
semanas, por ejemplo, si la primer decisión fue hacer una inversión alta, las alternativas para la segunda
decisión serán:
Primera decisión Segunda Decisión
Decisión Tomada Resultado Alternativas
A F Abandonar
A E Seguir con inversión en publicidad
Moderada M o
Seguir con inversión Alta A
Esta tabla se completa cuando se agregan todas las posibilidades, quedando más compleja:
Primera Decisión Segunda Decisión
Decisión Resultado Decisión Resultado Probabilidad Ganancia
Baja Fracaso Abandonar – – 1
Baja Éxito Seguir con M Fracaso 0,4 –2,5
Exito 0,6 8

Seguir con A Fracaso 0,2 –4


Éxito 0,8 7

Moderada Fracaso Abandonar – – –2


Moderada Éxito Seguir con M Fracaso 0,3 –4
Éxito 0,7 4

Seguir con A Fracaso 0,1 –5


Éxito 0,9 4
Análisis en la toma de decisiones 25

Alta Fracaso Abandonar – – –3


Alta Éxito Seguir con M Fracaso 0,2 –5
Éxito 0,8 3

Seguir con A Fracaso 0,1 –6


Éxito 0,9 2

Con ella se puede construir el árbol de decisiones:

El objetivo es calcular la ganancia en cada nodo como la ganancia óptima esperada de ahí en adelante.
Sea por ejemplo el nodo 11, que es un nodo conectado con los nodos terminales del árbol, como lo son
los nodos 12, 14, 15 17 y 18.

La ganancia en el nodo 11 es cero, por lo que la ganancia esperada será:

Ganancia total Ganancia Ganancia


esperada en = En el nodo + Futura en el =
el nodo 11 11 Nodo 11

Ganancia Probabilidad Ganancia Probabilidad Ganancia


total = 0 + Del arco x En el + Del arco x En el
esperada en 11 – 19 Nodo 19 11 – 20 Nodo 20
el nodo 11

= 0 + 0,4 x –2,5 + 0,6 x 8 = 3,8

Este valor puede incluirse en el árbol y calcularse en forma similar para cada uno de los demás nodos.

El árbol, en esta etapa presentaría las GANANCIAS FUTURAS ESPERADAS (GFE)


Análisis en la toma de decisiones 26

Procediendo hacia atrás en el tiempo, en este punto es necesario calcular las ganancias totales esperadas
en los nodos 4 a 9, utilizando las ganancias de los nodos 10 a 18. Por ejemplo, el nodo 5, que es un punto
de decisión de segundo nivel, representa una inversión baja que dio un resultado exitoso. En ese punto se
pueden realizar cualquiera de las siguientes acciones: Invertir en publicidad moderadamente, con una
ganancia esperada de 3,8 o invertir en un nivel alto, con una ganancia esperada de 4,8 (nodos 11 y 12,
respectivamente) Se debería elegir el mejor resultado esperado, 4,8, el cual sumado a la ganancia propia
del nodo, 5, arroja un total esperado de 9,8. El conjunto de los nodos se analiza de la misma manera y
queda el árbol que sigue:

Se sigue retrocediendo en el tiempo, analizándose ahora los nodos 1 a 3. Por ejemplo, para el nodo 1, la
ganancia futura esperada es:
Análisis en la toma de decisiones 27

Ganancia total Ganancia Ganancia


Esperada en el = en el nodo + Futura en el =
Nodo 1 1 Nodo 1

Ganancia total Probabilidad Ganancia Probabilidad Ganancia


Esperada en el = 0 + Del arco x En el + Del arco x En el
Nodo 1 1–4 Nodo 4 1–5 Nodo 5

GE N1 = 0 + 0,7 x (–3) + 0,3 x 9,8 = 0,84


Con esto el árbol queda:

El último paso será calcular el valor del nodo cero, que significa evaluar los nodos 1, 2 y 3:
a) Inversión Baja, B, con una ganancia esperada de 0,84 ! Nodo 1
b) Inversión moderada, M, con una ganancia esperada de 0,24 ! Nodo 2
c) Inversión alta, A, con una ganancia esperada de 4,68 ! Nodo 3
Significa que la primera decisión, el primer nivel de decisiones, será la inversión alta, y conduce al nodo
3. En ese momento la nueva decisión se tomará en función de los resultados obtenidos, que conduce a los
nodos 8 o 9: si fue un fracaso, ir al nodo 8, abandonar, con una ganancia de –11 (pérdida de 11). Si fue
éxito, ir al nodo 9, inversión publicitaria moderada, con una ganancia de 11,4.

Resolución con WinQSB:


Se ingresa en análisis de árbol de decisiones con 31 nodos:
Análisis en la toma de decisiones 28

debe considerarse con cuidado el carácter del nodo: si a partir de él salen flechas para cada decisión se debe marcar
con D, si es un estado de la naturaleza, con C. Se arriba al siguiente resultado:
Análisis en la toma de decisiones 29

Teoría de utilidades
Hasta este punto el criterio de decisión fue el de maximizar las ganancias, en los casos recién vistos, las
ganancias esperadas. Sin embargo pueden existir casos en que este criterio no sea el más apropiado: por
ejemplo, una persona que quiere tomar la decisión de jugar al Loto o a cualquier juego de lotería, sabe
que la ganancia esperada es un valor negativo (si no fuera así Lotería Nacional no ganaría dinero), por lo
tanto si la decisión se tomara con el criterio de ganancia esperada esa persona no jugaría.

Los que toman la decisión de jugar lo hacen porque aceptan la altísima probabilidad de perder poco
dinero frente a la despreciable probabilidad de ganar mucho dinero.

Otro caso es la decisión de adquirir un contrato de seguro de incendios. El resultado esperado es negativo
(las compañías aseguradoras ganan dinero), pero el asegurado gasta dinero por la pequeña probabilidad de
tener que gastar mucho dinero en reparaciones grandes.

Las diferencias que existen entre los que juegan y los que no o entre los que aseguran y los que no, radica
en un criterio distinto al de la ganancia y que se puede expresar como el valor que le dan al dinero: para
algunos el valor de perder unos pocos pesos en el Loto en muy pequeño comparado con el valor de la
posible ganancia de varios millones, mientras que otros consideran que no vale la pena perder esos pesos
porque los valoran más que la remota posibilidad de ganar. Obviamente esto es un criterio subjetivo, que
–sin embargo− podría ser cuantificado utilizando un planteo sistemático al que se llamará utilidad.

Una empresa fabrica grandes muebles de oficina desde hace muchos años y decide ampliar su campo
incorporando la representación de una marca de computadoras por cinco años. Las alternativas
presentadas son:
1. Adquirir la representación de una empresa con productos bien conocidos. Ofrece alta
probabilidad de ganar mercado, pero los costos son altos. ALTERNATIVA B.
2. Adquirir la representación de una empresa sin renombre. La probabilidad de ganar el mercado es
menor pero los costos son más bajos. ALTERNATIVA N.
3. Adquirir la representación de una empresa nueva que tiene un desarrollo innovador y cuya
política es avanzar en sistemas que otras empresas no poseen. La alternativa es riesgosa pero
si el producto es aceptado en el mercado, las ganancias serán altas. ALTERNATIVA I

Se tabula la participación en el mercado como:


a) Baja, L
b) Promedio, A
c) Alta, H

Estas probabilidades están condicionadas por la decisión primaria: de qué tipo de representación fue
elegida.

Con estos datos se obtienen tablas de ganancias expresadas en millones:

Ganancias en función de Resultados


en la participación del mercado
Decisiones Baja (L) Promedio (A) Alta (H)
B– –5 4 7
N– –1 2 5
I– –1 3 15

Probabilidades condicionales de los


Resultados dada una decisión
Decisiones Baja (L) Promedio (A) Alta (H)
B– 0,3 0,5 0,2
N– 0,4 0,4 0,2
I– 0,6 0,3 0,1

Para determinar la mejor alternativa primero se debe elegir un criterio de decisión. Supóngase que se
decide el criterio de maximizar la ganancia esperada, cuyos resultados serán:
Análisis en la toma de decisiones 30

DECISIÓN GANANCIA ESPERADA


B –5 x 0,3 + 4 x 0,5 + 7 x 0,2 = 1,9
N –1 x 0,4 + 2 x 0,4 + 5 x 0,2 = 1,4
I –1 x 0,6 + 3 x 0,3 + 15 x 0,1 = 1,8

Con estos resultados sería la decisión B la recomendable. ¿Se pueden correr riesgos y optar por otras
alternativas?

Para poder valorizar numéricamente las ganancias esperadas como utilidades se sigue el siguiente
método:
1. Orden de ganancias

Se clasifican las ganancias en orden descendente: 15, 7, 5, 4, 3, 2, –1, –1, –5. Se puede asignar un valor
relativo cualquiera, por ejemplo 100 a la mayor ganancia (15 en este caso) y cero a la menor (–5)

2. Convertir las ganancias en utilidades


Si se desea estimar cuánto representa, por ejemplo, la ganancia de 7 respecto a los extremos, se debería
comenzar con una encuesta entre los que toman decisiones.

Esa encuesta puede diseñarse, por ejemplo, solicitando se considere un juego de lotería que ofrece la
ganancia potencial de 15 con una probabilidad de 0,05 y la ganancia potencial de –5 con una probabilidad
de 1–0,05=0,95 y efectuando la pregunta en estos términos: ¿preferiría jugar a la lotería o aceptar dar
garantías por una ganancia de 7? Es casi seguro que los encuestados contestarían a favor de los 7, y que se
volcarían a favor de la lotería si las probabilidades fueran las inversas a las planteadas.

Por tanto el objetivo es determinar la probabilidad p de ganar los 15 y la probabilidad 1 – p de ganar –5


de manera tal que a los encuestados le sea indiferente optar por la lotería o por los 7 de ganancia,
presentando diferentes valores de probabilidad cada vez que se hace la pregunta.

Como ejemplo, supóngase que el resultado de las entrevistas arroja un valor de p = 0,40. A los que toman
la decisión les resulta indiferente obtener una ganancia de 7 o participar de un juego donde hay una
probabilidad de 0,4 para obtener 15 de premio y una probabilidad de 0,6 para obtener –5.

En ese ejemplo, la utilidad de los 7 es 100p = 100 x 0,4 = 40.


La ganancia esperada en la lotería será 15p + (–5)(1–p) = 15 x 0,4 – 5 x 0,6 = 3
Esto indica que el encuestado estaría dispuesto a pagar 7 para jugar una lotería cuya ganancia esperada es
solo de 3, ¿porqué? Porque le dan un valor mayor a la oportunidad de ganar 15.
Con este método se puede hallar un valor de utilidad a cada una de las ganancias. Se muestra en la tabla
un ejemplo:

Ganancia P Utilidad
(100p)
15 – 100
7 0,40 40
5 0,30 30
4 0,25 25
3 0,20 20
2 0,16 16
–1 0,10 10
–1 0,10 10
–5 – 0

En este punto se puede reemplazar la tabla de ganancias por una tabla de utilidades, reemplazando la
ganancia por la utilidad asociada:
Análisis en la toma de decisiones 31

Ganancias en función de Resultados


en la participación del mercado
Decisiones Baja (L) Promedio (A) Alta (H)
B– 0 25 40
N– 10 16 30
I– 10 20 100

3. Toma de decisión usando la tabla de utilidades

Utilizando la tabla de probabilidades y la utilidad en lugar de la ganancia, se busca la decisión que


maximice las utilidades:

Decisión Utilidad esperada


B– 0x0,3 + 25x0,5 + 40x0,2 = 20,5
N– 10x0,4 + 16x0,4 + 30x0,2 = 16,4
I– 10x0,6 + 20x0,3 + 100x0,1= 22,0

Lo que arroja como resultado la alternativa innovadora, diferente a la encontrada con el criterio
conservador anterior.

Funciones de utilidad
Si se grafican las utilidades versus las ganancias, como se ve en la figura siguiente, se observa que la
función de utilidad obtenida está por debajo de la línea recta que une los puntos extremos de las
ganancias: una función de este tipo indica tomas de decisiones agresivas y con riesgos. Si la curva
estuviera por encima, sería indicativa de decisiones conservadoras.

Utilidad 2
y = 0,2072x + 2,828x + 10,602
100
90
80
70
60
50
40
30
20
10
0
Ganancia
-10 -5 0 5 10 15 20

Esta función fue obtenida graficando los valores de utilidad de la tabla y obteniendo la línea de tendencia
polinomial para este ejemplo. Con la función es posible calcular la utilidad asociada a cualquier valor de
ganancia.

Cuando las funciones de utilidad halladas son del tipo de las del ejemplo, que trazan por debajo de la
línea recta que une los valores extremos se trata de decisiones buscadoras de riesgo, o decididores que
prefieren alternativas de inversión relativamente agresivas.

Por contrario, si la función de utilidad fuera la del gráfico siguiente, se tendría una función conservadora
o contrario al riesgo, en el sentido que se le da mayor utilidad a las ganancias más bajas y,
consecuentemente, más seguras:
Análisis en la toma de decisiones 32

y = -0,2651x 2 + 7,7004x + 44,201


100 Ganancia Utilidad
-5 0
80 -1 35
-1 35
60
2 59
40 3 65
4 72
20 5 77
7 84
0 15 100
-10 -5 0 5 10 15 20
-20

Una tercera alternativa es la neutralidad, cuya función de utilidad es la línea recta que une los extremos,
en ese caso la función de utilidad es lineal.

Sensibilidad
Las probabilidades que se usan en la toma de decisiones son simplemente estimaciones, por lo cual puede
resultar necesario poseer información adicional sobre la validez de las soluciones halladas cuando
cambian las probabilidades utilizadas para hallarlas. Si la decisión óptima hallada es muy sensible a un
cambio de probabilidad puede justificar una mayor inversión en encontrar las probabilidades adecuadas.

Se retorna al caso de desarrollo, del cual se reproduce la tabla original de probabilidades:

RESULTADOS
DECISIONES FRACASO – F ÉXITO – E GRAN ÉXITO – G
BAJA – B 0,6 0,3 0,1
MODERADA – M 0,4 0,4 0,2
ALTA – A 0,2 0,5 0,3

Se trata de averiguar cuanto puede cambiar la probabilidad de los tres resultados posibles obtenidos por
haber decidido hacer una inversión alta sin que se altere el resultado que llevó a tomar esa decisión.

Se reemplaza la fila de probabilidades asociadas con la inversión alta por los valores p1, p2 y p3, o sea
convirtiendo las probabilidades en variables.

p1 + p 2 + p 3 = 1
p3 = 1 − p1 + p 2
Análisis en la toma de decisiones 33

Las ganancias esperadas son:


PARA EL NODO 1:
GE(1) = 0,6 x GE (4) + 0,3 x GE(5) + 0,1 x GE(6) = 0,6 x (-2) + 0,3 x 5 + 0,1 x 8 = 1,1

PARA EL NODO 2:
GE(2) = 0,4 x (-5) + 0,4 x 10 + 0,2 x 12 = 4,4

PARA EL NODO 3:
GE(3) = p1 x (-8) + p2 x 6 + (1 – p1 – p2) x 15 = 15 – 23 p1 – 9 p2

Para que la inversión alta siga siendo la decisión óptima la ganancia asociada debería ser de al menos el
mismo valor que el de una inversión baja de 1,1 o moderada de 4,4. Ambas condiciones son restricciones
que se aseguran satisfaciendo

15 – 23 p1 – 9 p2 ≥ 4,4
o sea
– 23 p1 – 9 p2 ≥ 10,6
además de que
0 ≤ p1 ≤ 1 y 0 ≤ p2 ≤ 1
y
p3 = 1 – p1 – p3 ≥ 0 que resulta p1 + p2 ≤ 1

En síntesis se puede suponer que se posee un conjunto de restricciones como el siguiente:

1) 23 p1 + 9 p2 ≤ 10,6
2) p1 ≤ 1
3) p2 ≤ 1
4) 0 ≤ p1 y 0 ≤ p2
Análisis en la toma de decisiones 34

Como se ve en la figura, las probabilidades dadas caen dentro del área de soluciones factibles. Cualquier
cambio en esas probabilidades debería caer en esa misma área para que la solución óptima hallada sea la
misma. Por ejemplo si ambas probabilidades aumentaran a 0,25 y 0,55, la decisión óptima ya no sería
inversión alta, sino que sería inversión moderada.

23 p1 + 9 p 2 ≤ 10,6
23 × 0,2 + 9 × 0,5 = 9,1 ≤ 10,6
23 × 0,25 + 9 × 0,55 = 10,7 ≥ 10,6

como se ve con la probabilidad original se satisface la inecuación, pero con un desvío de 0,05 no se
satisface.

Análisis de sensibilidad para las probabilidades condicionales


Con un procedimiento similar se puede determinar la sensibilidad de la decisión tomada, inversión alta en
este ejemplo, a los cambios en las probabilidades condicionales asociadas con una de las otras inversiones
y suponiendo que las de las demás permanecen sin variaciones.

Se convierten en variables las probabilidades de la segunda fila de la tabla: p1, p2 y p3, determinando los
valores de p1 y de p2 de manera tal que la decisión siga siendo inversión alta. Esto ocurre cuando la
ganancia esperada para la inversión alta excede a la de las inversiones baja y moderada, cosa que ocurre
cuando se satisfacen las siguientes condiciones:

1) 17p1 + 2p2 ≥ 6,1


2) p1 ≤1
3) p2 ≤ 1
4) p1 + p2 ≤ 1
Análisis en la toma de decisiones 35

Siempre que los pares de probabilidad p1 y p2 caigan dentro de la región sombreada se obtendrá que la
decisión óptima sigue siendo la inversión alta.

Este mismo proceso se puede realizar para la inversión baja, sustituyendo sus valores de probabilidad por
variables (1er. Renglón de la tabla) y graficando.
Análisis en la toma de decisiones 36

5. - Teoría de Juegos
Hay un cierto número de problemas conocidos como “juegos” en los cuales intervienen no solo el azar
sino también los factores humanos. Estos problemas se generan en situaciones de conflicto. Blas Pascal
tenía inquietudes por modelizar los juegos de azar. En 1928 Von Neuman enuncia el teorema Minimax,
que constituye el primer modelo que desarrolló la teoría de juegos, profundizándose posteriormente, hasta
la fecha, ya que por ejemplo, John Nash obtuvo en la década de los 90 un premio Novel al realizar
modelos de equilibrio.

El modelo de von Neuman intenta abordar el conflicto de dos o más partes enfrentadas (beligerantes, en el
campo militar, competidoras en el campo económico), en donde intervienen aspectos emotivos,
psicológicos, o de coyuntura, los cuales son acotados para formalizar un modelo matemático.

Definiciones
Juego queda definido por un conjunto de reglas, denominadas “modelo del juego”, que establecen:
• número de jugadores
• información que cada jugador posee acerca del juego y de los demás
• como se establecen sus relaciones
• cual es el resultado del juego
El juego se desarrolla a través de movimientos: cada jugador realiza, por turno, una selección. El conjunto
completo de movimientos se denomina Partida.

Estrategia: es el modo de acción por el cual cada jugador efectúa sus selecciones a lo largo de una
partida.

Clasificación de los juegos:


Desde el punto de vista de la cantidad de jugadores:
a. Unipersonales
b. Bipersonales
c. Multipersonales
En a. no se puede diferenciar un adversario concreto: la naturaleza, el medio ambiente, etc. Constituye un
capítulo en la teoría de toma de decisiones.
En b. y en c. hay oponentes (2 o más), enfrentados, los cuales toman sus decisiones individualmente.

Desde el punto de vista de la cantidad de estrategias posibles:


a. Finitos, cuando se tiene un conjunto numerable de estrategias.
b. Diferenciales, cuando hay una cantidad de estrategias dentro del conjunto de los números
reales.

Desde el punto de vista de los pagos:


a. De suma cero: los oponentes están enfrentados por un objetivo excluyente: ganar. Todo lo que
gana uno es lo que no podrá ganar el otro.
b. Cooperativos: se da una oscilación permanente entre enfrentamiento y cooperación (paritarias,
p.e.).

LA FORMULACIÓN MATEMÁTICA COMPRENDE A JUEGOS BIPERSONALES, FINITOS Y DE


SUMA CERO.

Juegos Rectangulares
Si se toma como caso una partida de ajedrez, existen dos jugadores: Blancas y Negras. Cada uno de ellos
puede explicitar un número n de estrategias: S1, S2,... Sn, para las Blancas. T1, T2, Tn para las negras.

Existen tres resultados posibles: 1) Gana Blancas (B), 2) Gana Negras (N), 3) Tablas (T).
Análisis en la toma de decisiones 37

Conociendo las estrategias se podría decir cual es el resultado de la partida. Esta información puede ser
llevada a una Matriz de Estrategias: en cada elemento se encuentra el resultado de confrontar la estrategia
Si con la estrategia Ti:
T1 T2 ... Tn
S1 B T
S2 N N
...
Sn
Donde B es Gana Blancas. N es Gana Negras y T es Tablas.

Para utilizar nomenclatura cuantificable, se puede escribir la misma tabla reemplazando B = Gana blancas
por 1; N = Gana Negras por -1 y T = Tablas por 0. Estos valores son arbitrarios. Pueden ser cualquier
otro valor convenido.

Con estos valores se construye la Matriz de Pagos:

T1 T2 ... Tn Resolver el juego significa poder decir que


S1 1 0 estrategia conviene a cada uno de los jugadores,
S2 -1 -1 cual es valor de pago resultante de esa acción. Es
... un problema de optimización: cual es la jugada
Sn óptima y que valores están en juego.

Hipótesis de Von Neuman


Se formulan las siguientes hipótesis previas para plantear este caso de dos jugadores
1. ambos jugadores tienen intereses opuestos
2. ambos jugadores poseen la información completa para construir la matriz de pagos
3. ambos jugadores son igualmente sagaces.
4. ambos jugadores son conservadores: buscan la máxima seguridad en sus jugadas

Si se construye la matriz de pagos con los valores de pago del Jugador II al I:

II
E1 E2 E3 E4 E5
E1 8 3 5 7 9
I E2 6 4 3 6 8
E3 4 3 5 2 6
E4 2 4 1 4 7
El valor de cada estrategia se obtiene teniendo en cuenta las hipótesis y estableciendo para cada una el
menor valor posible.

El jugador I elegirá el mínimo de cada fila, con lo que construirá un vector. De ese vector elegirá ahora el
máximo:
E1 3 Siendo los dos elementos 3 el máximo de los mínimos, a los que
II E2 3 llamaremos vI..
E3 2
E4 1 Por otra parte, el jugador II querrá minimizar los pagos (o dicho de otra
manera minimizar lo máximo a perder): El jugador II elegirá el mínimo
de los máximos de cada columna, construyendo un vector fila:

II
E1 E2 E3 E4 E5
8 4 5 7 9

vII = 4.
Análisis en la toma de decisiones 38

Como el juego está planteado como una matriz de pagos del Jugador II al I, vI implica el máximo de lo
mínimo que puede ganar para todas sus estrategias y vII implica el mínimo de lo máximo a perder en
todas sus estrategias.

Si en la matriz original cambiamos la celda I-E2:II-E3 de su valor 3 a 8; queda:

II
E1 E2 E3 E4 E5
E1 8 3 5 7 9
I E2 6 4 8 6 8
E3 4 3 5 2 6
E4 2 4 1 4 7
siendo el vector de las filas:

E1 3
II E2 4
E3 2
E4 1
donde vI = 4

y el de las columnas

II
E1 E2 E3 E4 E5
8 4 8 7 9
donde vII = 4.
Por tanto vI = vII, lo que significa que lo que el jugador I está dispuesto a ganar es lo que el jugador II está dispuesto a
perder. Este juego se denomina JUEGO DE INFORMACIÓN COMPLETA O ESTRICTAMENTE DETERMINADO
(vI = vII).

Como el caso que se examina tiene vI = 3 y vII = 4, no está estrictamente determinado. Cuando está
determinado, el punto I = II es el valor del juego y se llama punto de MINIMAX.

Para una matriz con m filas (cada una es i) y n columnas (cada una es j), se tiene:

II
1 2 ... j ... n
1 a11 a12 ... a1j ... a1n
I 2 a21 a22 ... a2j ... a2n
... ... ... ... ... ... ...
i ai1 ai2 ... aij ... ain
... ... ... ... ... ... ...
m am1 am2 ... amj ... amn

El jugador I busca el mínimo de cada fila, construye un vector y busca el máximo de ese vector:

v I = max min(a ij )


i j
El Jugador II busca el máximo de cada columna, construye un vector en el que busca el mínimo:

(
v II = min max (a ij ) .
j i
)
Que se tenga la igualdad vI = vII implica que existe un punto de minimax. Sin embargo la matriz no tiene
porque tener un punto minimax único: ya que puede haber en varios lugares los mismos valores
numéricos.
Análisis en la toma de decisiones 39

Si esto ocurre, pueden aparecer varias estrategias óptimas. Si E1, E2, E3, son estrategias óptimas para el
jugador I, toda combinación lineal convexa es también una estrategia óptima:

E * = αE1 + βE 2 + γE 3 (lineal)
α +β +γ =1 (convexa)
Esta es una manera de darle peso a diferentes Ei.

Cuando existe la desigualdad vI < vII se dice que hay juegos no estrictamente determinados. Con una
cantidad grande de jugadas, existiendo o no un valor esperado del juego, debe determinarse con que
frecuencia juega cada estrategia.

Si se llama x a la frecuencia relativa al jugador I e y a la frecuencia relativa al jugador II, se tienen


vectores llamados de estrategias mixtas:
Jugador I: x = (x1 x2 x3 )
Jugador II: y = (y1 y2 y3)
quedando una matriz como la siguiente:

II
y1 y2 y3
x1 a11 a12 a13
I x2 a21 a22 a23
x3 a31 a32 a33
Cómo elige el Jugador I el vector x
• Si el jugador II juega la estrategia E1, la ganancia esperada será:
Jugador I, juega con vector x, Jugador II juega con estrategia 1: E(x,1)

n
E (x ,1) = a 11 x1 + a 21 x 2 + a 31 x 3 = ∑ a i 1 x i (y1)
i
• Si el jugador II juega con la estrategia E2

n
E (x ,2) = a 12 x1 + a 22 x 2 + a 32 x 3 = ∑ a i 2 x i (y2)
i
• y con la estrategia E3
n
E (x ,3) = a 13 x1 + a 23 x 2 + a 33 x 3 = ∑ a i 3 x i (y3)
i

Luego, la ganancia esperada del Jugador I será:


GEI = E (x ,1) y1 + E (x ,2) y 2 + E (x ,3) y 3 = E ( x , y )
 
GEI = E (x , y ) = ∑  ∑ a ij x i  y j
j  i 

Planteo para el Jugador II


Se juega con el vector y, haciendo un análisis como el anterior:
m
E (1, y ) = a 11 y1 + a 12 y 2 + a 13 y 3 = ∑ a 1 j y i
j
m
E (2 , y ) = a 21 y1 + a 22 y 2 + a 23 y 3 = ∑ a 2 j y i
j
m
E (3, y ) = a 31 y1 + a 32 y 2 + a 33 y 3 = ∑ a 3 j y i
j
pero con el vector x de frecuencias relativas. La Pérdida Esperada por II será
Análisis en la toma de decisiones 40

PEII = E (1, y )x1 + E (2 , y )x 2 + E (3, y )x 3 = E (x , y )


 
PEII = E (x , y ) = ∑  ∑ a ij y j  x i
i  ji 

Existe un vector x optimo: x y un vector y óptimo: y que darán un valor de juego E( x , y ) que es único.
Este valor es el teorema de Von Neuman (minimax para juego no estrictamente determinado).

EJEMPLO
Sea la siguiente matriz:
II
y1 y2
I x1 5 −3 −3
x2 −6 8 −6
5 8
donde
vI = −3
vII = 5
x = (x1, x2)
y = (y1, y2)
E(x,1) = a21x1 + a21x2 = 5 x1 − 6x2
E(x,2) = a21x1 + a22x2 = −3 x1 + 8x2
x1 + x2 = 1

Si se grafica E(x,j) vs x1, de donde x2 = 1 − x1 resulta


E(x,1) = 5 x1 − 6 (1 − x1) = 11 x1 − 6
E(x,2) = −3 x1 + 8 (1 − x1) = −11 x1 + 8

AOB es el lugar geométrico de las mínimas ganancias esperadas.


El máximo de todos los mínimos es el punto O, cuyas coordenadas son
x*1 = 7/11
x*2 = 4/11
Valor del juego = E(x*1, 1) = E (x*1, 2) = 1 = vI.

Para el jugador II
E(1, y) = 5 y1 + (−3) y2
E(2, y) = 6 y1 + 8 y2
y2 = 1 − y1

E(1, y) = 8 y1 − 3
E(2, y) = −14 y1 + 8
Análisis en la toma de decisiones 41

Donde COD es el lugar geométrico de las máximas pérdidas de II. Como se busca minimizar las pérdidas corresponde
al punto O: y*1 = 0,5
vI = vII = E(x, y).

Resolución en WinQSB
Se debe optar en el módulo Análisis de decisiones por Juegos de suma cero, con la siguiente pantalla de carga:

Obteniéndose el siguiente resultado:

Donde se ve que cada jugador dispone de una probabilidad asociada a su estrategia (7/11, 4/11, ½ y ½,
respectivamente) y el valor del juego queda determinado en 1.

Estrategia mixta
Es la regla de decisión que permite elegir una estrategia cuando el juego no está estrictamente
determinado.

Teoría de Juegos y programación lineal


Sea una matriz de pagos
II
y1 y2 Si I juega una estrategia mixta al máximo de los mínimos, vI,
x1 a11 a12 es lo que menos recibe:
I
x2 a21 a22 min∑ aij x j = v I = v
i
significa que como mínimo recibe v, por lo tanto
E(x,j) ≥ v
a11 x1 + a12 x2 ≥ v
a21 x1 + a22 x2 ≥ v
Análisis en la toma de decisiones 42

como v es funcional y además x1 + x2 = 1, dividiendo por v se origina una nueva variable


x’i = xi/v
z=v-1

El programa lineal es
1
z= = x '1 + x 2 ≡ MIN
v
a11 x '1 + a 21 x ' 2 ≥ 1
a 21 x '1 + a 22 x ' 2 ≥ 1
el valor del juego, v, es la inversa del funcional z., por lo que deberá interpretarse la solución del
problema para el cálculo de x1 y de x2.
El dual permite calcular y1 e y2 dado que cj – Zj de las slacks corresponden a los valores y’1 e y’2.
Este modelo puede ser generalizado.

Para el ejemplo anterior:

II
y1 y2
I x1 5 −3 −3
x2 −6 8 −6
5 8
z = x’1 + x’2 ≡ MIN (=v-1)
5x’1 + (−6) x’2 ≥ 1
−3x’1 + 8 x’2 ≥ 1

5x’1 − 6 x’2 − x’3 + λ1 =1


−3x’1 + 8 x’2 − x’4 + λ2 = 1

PROBLEMA I
Dos jugadores muestran simultáneamente 1, 2 o 3 dedos uno al otro. Si la suma es par, el jugador II paga al I esa
suma en dinero. Si es impar el jugador II recibe esa suma.
a) Construcción de la matriz de pagos y del valor del juego
II
E1 E2 E3 min
E1 2 −3 4 −3
I E2 −3 4 −5 −5
E3 4 −5 6 −5
max 4 4 6

vI = maxj (mini aij ) = −5


vII = minjj(maxijaij ) = 4
Se debe hallar v = E(x,y), siendo x e y los vectores óptimos.

PROBLEMA II
Dos cadenas de supermercados se proponen construir cada una un supermercado en la región rural W, que
comprende tres ciudades.
Aproximadamente el 45% de la población de W vive cerca de la ciudad A, 35% cerca de la B y 20% de la C. La cadena
I es más prestigiosa y grande que la II, por lo que controlará la mayoría del negocio siempre que sus ubicaciones sean
comparativas. Ambas cadenas conocen los intereses de la otra y ambas han terminado estudios de mercado que dan
proyecciones idénticas.
Si ambas cadenas se sitúan en la misma ciudad o equidistantes de una, la I controlará el 65% del negocio de esa
ciudad. Si la I está más cerca de una ciudad que la II, controlará el 90% del negocio de esa ciudad.
En cambio, si la I se encuentra más alejada de una ciudad que la II, atraerá el 40% del negocio de ese pueblo. El resto
de las operaciones, bajo cualquier circunstancia, irá a la cadena II.
La política de la cadena I, conocida por la II, es no ubicarse en lugares con menos de 20000 habitantes, lo que desecha
la posibilidad de hacerlo en la ciudad B, que tiene 15000.

Plantear la matriz de pagos.


Análisis en la toma de decisiones 43
Otras estrategias. Equilibrio de Nash 44

6.- Equilibrio de Nash


Otras Estrategias y Aplicaciones en Macroeconomía.
Ahora parece que he vuelto a pensar racionalmente de nuevo, en el estilo característico de los científicos. Sin embargo
eso no es algo de lo que haya que alegrarse como si alguien con alguna limitación física hubiera recuperado su buena
salud. Un aspecto de esto es que la racionalidad del pensamiento impone un límite al concepto que tiene una persona
de su relación con el cosmos. Por ejemplo, un no-zoroastriano podría considerar a Zaratustra simplemente como un
loco que arrastró a millones de ingenuos seguidores a un culto de adoración ritual del fuego. Pero sin esa "locura"
Zaratustra habría sido solo otro de los millones o billones de individuos que han vivido y después han sido olvidados.

John F. Nash, Autobiografía tras la concesión del Premio Nobel, 1994

En 1994 se otorgó el Premio Nobel en Economía a Nash, Harsanyi y Selten1 por sus desarrollos en el
campo de la teoría de juegos. La economía tradicional se ha basado casi exclusivamente en perspectivas
provenientes de la competencia perfecta y el monopolio como casos polares y la competencia
monopolística como combinación de ambos, excluyendo el problema de la competencia. Tanto en la
competencia perfecta como en el monopolio todo está en equilibrio y no hay amenazas de entrada de
nuevos competidores, de guerra de precios, de nuevas tecnologías o de nuevas políticas gubernamentales,
ni interacciones entre las reacciones y decisiones de los participantes en el mercado en condiciones
usuales estáticas de corto plazo. A pesar de que hay antecedentes en la teoría económica en términos de
reacciones e interacciones entre los participantes, es un hecho que el pensamiento económico ha estado
dominado en los análisis en períodos cortos por las visiones de la competencia perfecta −donde la
competencia ya se dio− y el monopolio −donde por definición no se puede dar−. Por supuesto, tanto en el
caso del monopolio puro como en el de los carteles, los economistas han estado conscientes de la
posibilidad de la erosión de su poder a mediano y largo plazos, ante la perspectiva de la sustitución
tecnológica, de los consumos o la entrada de nuevos productores, pero los modelos polares, en base sobre
todo a su mayor simplicidad y determinación de resultados y a que las inferencias analíticas no difieren
substancialmente de los modelos mixtos, han dominado la manera de pensar de los economistas.

La mayor importancia de las estructuras de mercado de pocos productores y de la competencia global, así
como el reconocimiento de las decisiones de política económica entre pocos líderes dentro y entre países,
han puesto de manifiesto la necesidad de estudiar situaciones en las que hay estrategias. Una empresa
toma sus decisiones de precios o de expansión de su producción tomando en cuenta las reacciones de sus
posibles competidores, que a su vez actúan considerando las reacciones de los demás. Esto es en esencia
la competencia estratégica, que caracteriza precisamente la toma de decisiones en muchos e importantes
casos de la economía y la política económica.

La ausencia de rigor y de resultados definidos en los modelos de pocos participantes inhibió en el pasado
el pensamiento estratégico formal en la economía. Con el desarrollo de la teoría de juegos por los autores
distinguidos con el Nobel de Economía en 1994 se ha creado un instrumento matemático apropiado para
la competencia estratégica, con el resultado previsible de impulsar tanto el análisis matemático como el
analítico de las decisiones estratégicas, tomando más en serio la competencia entre pocos.

Asimismo, al reconocer formalmente la existencia de equilibrios potenciales múltiples, la posibilidad de


resultados alternativos posibles, dependiendo de situaciones probables o inciertas (situaciones riesgosas o
con incertidumbre), alienta la credibilidad de enfoques previos en esta dirección y amplía las perspectivas
en el análisis de las decisiones económicas, de política económica y de economía política.

Los principios para aplicar la teoría de juegos a la economía fueron presentados por Oskar Morgenstern y
John Von Neumann en su Teoría de Juegos y el Comportamiento Económico (1944).

1
John F. Nash. Estadounidense, nació en 1928. Licenciatura y maestría por el Carnegie Institute of Technology, doctorado por
Princeton. Profesor en Massachusetts Institute of Technology de 1951 a 1959.
John C. Harsanyi. Nacido en Budapest, Hungría en 1920. Emigró a Estados Unidos de América en 1961. Largamente asociado con
la Universidad de California.
Reinhard Selten. Alemán, nacido en 1930. Licenciatura y doctorado por la Universidad de Frankfurt. Profesor en la Universidad
Libre de Berlín, Universidad de Bielefeld y en la de Bonn.
Otras estrategias. Equilibrio de Nash 45

Nash distinguió entre juegos cooperativos, en los que existen acuerdos que se cumplen, y no
cooperativos, donde no los hay. El equilibrio de Nash se refiere al equilibrio de juegos no cooperativos en
los que los jugadores tienen información completa de las ganancias esperadas y de las estrategias de los
participantes.

El punto de equilibrio de Nash es una situación en la que ninguno de los jugadores siente la tentación de
cambiar de estrategia ya que cualquier cambio implicaría una disminución en sus pagos. Von Neumann y
Oskar Morgenstern habían ya ofrecido una solución similar pero sólo para los juegos de suma cero. Para
la descripción formal del problema y su solución, Nash utilizó funciones de mejor respuesta y el teorema
del punto fijo de los matemáticos Brouwer y Kakutani.

En los años siguientes publicó nuevos escritos con originales soluciones para algunos problemas
matemáticos y de la teoría de juegos, destacando la "solución de regateo de Nash" para juegos
bipersonales cooperativos. Propuso también lo que se ha dado en llamar "el programa de Nash" para la
reducción de todos los juegos cooperativos a un marco no cooperativo.

Selten desarrolló los aspectos dinámicos. Así, los equilibrios no cooperativos múltiples encontrados por
Nash han sido clarificados por Selten al eliminar aquellos que no son razonables en términos económicos.
Por ejemplo, una situación macroeconómica típica de desequilibrio externo con desempleo puede
considerarse un equilibrio de Nash, en tanto los inversionistas extranjeros estén dispuestos a financiar los
déficit, de otro modo no. En el caso del equilibrio con desempleo, un mal equilibrio definitivamente, es a
pesar de ello un equilibrio de Nash, en tanto que la amenaza de los afectados por deshacer el juego y
romper las estrategias instrumentadas no sean creíbles. Selten ha trabajado suponiendo conocimiento de
las probabilidades de los diferentes eventos, analizando también juegos con probabilidad de errores en el
juego y su impacto en el equilibrio.

Harsanyi prosiguió el mejoramiento de la teoría de juegos considerando situaciones en las que no se


conocen completamente las retribuciones de las estrategias o las estrategias mismas. Es decir, juegos con
ignorancia, incertidumbre o información incompleta.

Lo anterior, incidentalmente, clarifica tesis incomprendidas de Keynes y los post-keynesianos, en el


sentido de diagnosticar el desempleo como situación de equilibrio bajo incertidumbre, incomprensión que
ha obstaculizado el enriquecimiento de puntos de vista, vulgarizando el pensamiento de Keynes e
induciendo políticas económicas incongruentes con las reglas mismas del sistema económico capitalista.

La teoría de juegos es aplicable y ha sido aplicada al resultado de subastas, al análisis de estrategias


industriales, al comportamiento de los bancos centrales, etc. En general, en toda decisión de pocos
participantes en interacción, con información completa, probable o incierta. También en la definición de
reglas que eviten conductas depredatorias, por ejemplo, en la subasta pública de derechos en ramas que
por razones tecnológicas, del consumo del bien, o de otro tipo, requieren de la protección de la amenaza
de competidores potenciales para que la subasta sea atractiva.

Al clarificar la existencia de equilibrios estables pero malos y la posibilidad de resultados no


deterministas, abre el horizonte para el pensamiento de alternativas no dogmáticas, al considerar que hay
equilibrios sub-óptimos o de sub-juegos, para los cuales habría que buscar nuevos arreglos, pero
evaluando racionalmente los costos y resultados de diferentes opciones. El desarrollo de instituciones,
leyes, arreglos organizacionales, ideas e ideologías, programas y políticas que fomenten la creatividad y
cooperación sobre bases realistas, es un panorama en el que muchos pensadores han creído como parte de
su visión del mundo y que, ahora, con el prestigio y rigor analítico de la teoría de juegos, gana
credibilidad. La teoría de juegos puede contribuir a vencer la cerrazón y esterilidad del pensamiento
determinista, mecánico y dogmático, quizá no tanto en términos exclusivamente matemáticos, por la
enorme dificultad de formalizar matemáticamente situaciones relativamente sencillas, sino como modos y
actitudes de ver la realidad. Es probable que esta sea la contribución más importante de la teoría de
juegos.

El dilema de los prisioneros


Otras estrategias. Equilibrio de Nash 46

Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden
comunicarse entre ellos. El comisario sospecha que han participado en el robo del banco, delito cuya
pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito
menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que
reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco.

Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia
"lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero.
Llamaremos "traición" a la estrategia alternativa.

Dilema del Preso Y


Prisionero
Matriz de Pagos
Lealtad Traición
(años de carcel)

Lealtad 2/2 10/1


Preso X
Traición 1/10 5/5

Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el
preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos.

En vez de expresar los pagos en años de cárcel, se puede indicar simplemente el orden de preferencia de
cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general.

Dilema del Preso Y


Prisionero
Matriz de Pagos
Lealtad Traición
(orden de preferencias)

Lealtad 2/2 4/1


Preso X
Traición 1/4 3/3 (*)

La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la


decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para
ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash
y está señalado en la matriz mediante un asterisco.

El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula, bipersonal,
biestratégico y simétrico. Fue formalizado y analizado por primera vez por A. W. Tucker en 1950. Es
posiblemente el juego más conocido y estudiado en la teoría de juegos. En base a él se han elaborado
multitud de variaciones, muchas de ellas basadas en la repetición del juego y en el diseño de estrategias
reactivas.

Duopolios y Teoría de Juegos


Extractado de Martínez Coll, Juan Carlos (2001): "La teoría de juegos" en La Economía de Mercado, virtudes e
inconvenientes http://www.eumed.net/cursecon/8/La%20Teoria%20de%20Juegos.htm consultado diciembre de 2002.

En el oligopolio, los resultados que obtiene cada empresa dependen no sólo de su decisión sino de las
decisiones de las competidoras. El problema para el empresario, por tanto, implica una elección
estratégica que puede ser analizada con las técnicas de la Teoría de Juegos.

Suponga que dos empresas, Hipermercados Xauen y Almacenes Yuste, constituyen un duopolio local en
el sector de los grandes almacenes. Cuando llega la época de las tradicionales rebajas de enero, ambas
empresas acostumbran a realizar inversiones en publicidad tan altas que suelen implicar la pérdida de
todo el beneficio. Este año se han puesto de acuerdo y han decidido no hacer publicidad por lo que cada
una, si cumple el acuerdo, puede obtener unos beneficios en la temporada de 50 millones. Sin embargo
una de ellas puede preparar en secreto su campaña publicitaria y lanzarla en el último momento con lo
Otras estrategias. Equilibrio de Nash 47

que conseguiría atraer a todos los consumidores. Sus beneficios en ese caso serían de 75 millones
mientras que la empresa competidora perdería 25 millones.

Los beneficios o pérdidas mostrados a la izquierda de cada casilla son los que obtiene Xauen cuando elige
la estrategia mostrada a la izquierda y Yuste la mostrada arriba. Los resultados a la derecha en las casillas
son los correspondientes para Yuste.

Yuste
Cooperar Traicionar
Xauen Cooperar 50/50 −25/75
Traicionar 75/−25 0/0

El que lo máximo que se puede obtener sea 75 o 85 no tiene mucha influencia sobre la decisión a adoptar,
lo único que importa en realidad es la forma en que están ordenados los resultados. Si substituimos el
valor concreto de los beneficios por el orden que ocupan en las preferencias de los jugadores, la matriz
queda como la mostrada en el cuadro. Las situaciones como las descritas en esta matriz son muy
frecuentes en la vida real y reciben el nombre de Dilema de los Presos.
Yuste
Cooperar Traicionar
Xauen Cooperar 2°/2° 4°/1°
Traicionar 1°/4° 3°/3°
Veamos cuál debe ser la decisión a adoptar por esos almacenes. El director de la división de estrategia de
Xauen pensará: "Si Yuste no hace publicidad, a nosotros lo que más nos conviene es traicionar el
acuerdo, pero si ellos son los primeros en traicionar, a nosotros también nos convendrá hacerlo. Sea cual
sea la estrategia adoptada por nuestros competidores, lo que más nos conviene es traicionarles".

El director de la división de estrategia de Yuste hará un razonamiento similar. Como consecuencia de ello
ambos se traicionarán entre sí y obtendrán resultados peores que si hubieran mantenido el acuerdo. La
casilla de la matriz de pagos marcada con un asterisco es la única solución estable: es un punto de
equilibrio de Nash. Contrariamente a las argumentaciones de Adam Smith, en las situaciones
caracterizadas por el Dilema de los Presos si los agentes actúan buscando de forma racional su propio
interés, una "mano invisible" les conducirá a un resultado socialmente indeseable.

Supongamos ahora otra situación ligeramente diferente. Si ambas empresas se enredan en una guerra de
precios, haciendo cada vez mayores rebajas, ambas sufrirán importantes pérdidas, 25 millones cada una.
Han llegado al acuerdo de no hacer rebajas con lo que cada una podrá ganar 50 millones. Si una de ellas,
incumpliendo el acuerdo, hace en solitario una pequeña rebaja, podrá obtener un beneficio de 75 millones
mientras que la otra perdería muchos clientes quedándose sin beneficios ni pérdidas.
Yuste
Cooperar Traicionar
Xauen Cooperar 50/50 0/75
Traicionar 75/0 −25/−25
Si, como en el caso anterior, substituimos los valores concretos por su orden en la escala de preferencias
obtenemos una matriz que es conocida en Teoría de Juegos como Gallina o Halcón-Paloma.
Yuste
Cooperar Traicionar
Xauen Cooperar 2°/2° 3°/1°
Traicionar 1°/3° 4°/4°
El razonamiento de los estrategas será ahora diferente: "Si nuestros competidores cooperan, lo que más
nos interesa es traicionarles, pero si ellos nos traicionan será preferible que nos mostremos cooperativos
en vez de enredarnos en una guerra de precios. Hagan lo que hagan ellos, nos interesará hacer lo
contrario".

En el juego "Gallina" el orden en que actúen los jugadores es muy importante. El primero en intervenir
decidirá Traicionar, forzando al otro a Cooperar y obteniendo así el mejor resultado. La solución de
Otras estrategias. Equilibrio de Nash 48

equilibrio puede ser cualquiera de las dos marcadas con un asterisco en la matriz de pagos, dependiendo
de cuál haya sido el primer jugador en decidirse. Ambas soluciones son puntos de equilibrio de Nash.

En casi todos los modelos, sea cual sea la forma de la matriz, el protocolo o reglas del juego influirá
mucho en la solución. Además del orden de intervención de los jugadores, habrá que tener en cuenta si el
juego se realiza una sola vez o si se repite cierto número de veces, la información de que disponen en
cada momento, el número de jugadores que intervienen y la posibilidad de formar coaliciones, etc.

Modelo Halcón Paloma


En el lenguaje ordinario entendemos por "halcón" a los políticos partidarios de estrategias más agresivas
mientras que identificamos como "paloma" a los más pacifistas. El modelo Halcón-Paloma sirve para
analizar situaciones de conflicto entre estrategias agresivas y conciliadoras. Este modelo es conocido en la
literatura anglosajona como el "hawk-dove" o el "chicken" y en español es conocido también como
"gallina".

En la filmografía holywoodiense se han representado en varias ocasiones desafíos de vehículos


enfrentados que siguen este modelo. Los dos vehículos se dirigen uno contra otro en la misma línea recta
y a gran velocidad. El que frene o se desvíe ha perdido. Pero si ninguno de los dos frena o se desvía...

También se ha utilizado este modelo abundantemente para representar una guerra fría entre dos
superpotencias. La estrategia Halcón consiste en este caso en proceder a una escalada armamentística y
bélica. Si un jugador mantiene la estrategia Halcón y el otro elige la estrategia Paloma, el Halcón gana y
la Paloma pierde. Pero la situación peor para ambos es cuando los dos jugadores se aferran a la estrategia
Halcón. El resultado puede modelizarse con la siguiente matriz de pagos.
Jugador Y
Cooperar Traicionar
Jugador X Cooperar 2°/2° 3°/1°
Traicionar 1°/3° 4°/4°

Obsérvense las sutiles pero importantes diferencias de este modelo con el Dilema del Prisionero. En
principio la matriz es muy parecida, simplemente se han trocado las posiciones de los pagos 3º y 4º, pero
la solución y el análisis son ahora muy diferentes.

Hay aquí dos resultados que son equilibrios de Nash: cuando las estrategias elegidas por cada jugador son
diferentes; en la matriz aquí representada esas soluciones están marcadas con un asterisco. Compruébese,
por el contrario, que en el Dilema del Prisionero el equilibrio de Nash está en el punto en que ambos
jugadores traicionan.

Otra notable diferencia de este juego con otros es la importancia que aquí adquiere el orden en que los
jugadores eligen sus estrategias. Como tantas veces en la vida real, el primero que juega, gana. El primero
elegirá y manifestará la estrategia Halcón con lo que el segundo en elegir se verá obligado a elegir la
estrategia Paloma, la menos mala.

Modelo de la Guerra de los Sexos


El modelo de "La guerra de los sexos" es un ejemplo muy sencillo de utilización de la teoría de juegos
para analizar un problema frecuente en la vida cotidiana.
Hay dos jugadores: "ÉL" y "ELLA". Cada uno de ellos puede elegir entre dos posibles estrategias a las
que llamaremos "Fútbol" y "Discoteca".
Supongamos que el orden de preferencias de ÉL es el siguiente:
1º (lo más preferido) ÉL y ELLA eligen Fútbol.
2º ÉL y ELLA eligen Discoteca.
3º ÉL elige Fútbol y ELLA elige Discoteca.
4º (lo menos preferido) Él elige Discoteca y ELLA elige Fútbol.
Otras estrategias. Equilibrio de Nash 49

Supongamos que el orden de preferencias de ELLA es el siguiente:


1º (lo más preferido) ÉL y ELLA eligen Discoteca.
2º ÉL y ELLA eligen Fútbol.
3º ÉL elige Fútbol y ELLA elige Discoteca.
4º (lo menos preferido) Él elige Discoteca y ELLA elige Fútbol.
La matriz de pagos es como sigue:
ELLA
Fútbol Discoteca
Fútbol 1/2 3/3(*)
EL
Discoteca 4/4 2/1
Los pagos representan el orden de preferencias. A la
izquierda de la barra, los pagos a EL. A la derecha los
pagos a ELLA

Este juego, tal como lo hemos descrito, es un juego sin repetición y sin transferencia de utilidad. Sin
repetición significa que sólo se juega una vez por lo que no es posible tomar decisiones en función de la
elección que haya hecho el otro jugador en juegos anteriores. Sin transferencia de utilidad significa que
no hay comunicación previa por lo que no es posible ponerse de acuerdo, negociar ni acordar pagos
secundarios ("Si vienes al fútbol te pago la entrada").
El problema que se plantea es simplemente un problema de coordinación. Se trata de coincidir en la
elección. Al no haber comunicación previa, es posible que el resultado no sea óptimo. Si cada uno de los
jugadores elige su estrategia maximín el pago que recibirán (3\3) es subóptimo. Esa solución, marcada en
la matriz con un asterisco, no es un punto de equilibrio de Nash ya que los jugadores están tentados de
cambiar su elección: cuando ELLA llegue a la discoteca y observe que ÉL se ha ido al fútbol, sentirá el
deseo de cambiar de estrategia para obtener un pago mayor.
El modelo que hemos visto es un juego simétrico ya que jugadores o estrategias son intercambiables sin
que los resultados varíen. Podemos introducir una interesante modificación en el juego convirtiéndolo en
asimétrico a la vez que nos aproximamos más al mundo real. Supongamos que las posiciones 2ª y 3ª en el
orden de preferencias de ÉL se invierten. ËL prefiere ir solo al Fútbol más que ir con ELLA a la
Discoteca. La matriz de pagos queda como sigue:
ELLA
Fútbol Discoteca
Fútbol ½ (*) 2/3
EL
Discoteca 4/4 3/1

Si ELLA conoce la matriz de pagos, es decir, las preferencias de ÉL, el problema de coordinación
desaparece. Está muy claro que ÉL elegirá siembre la estrategia Fútbol, sea cual sea la elección de ELLA.
Sabiendo esto ELLA elegirá siempre la estrategia Fútbol también, ya que prefiere estar con ÉL aunque
sea en el Fútbol que estar sola aunque sea en la Discoteca. La estrategia maximín de ambos jugadores
coincide. El resultado, marcado con un asterisco, es un óptimo, un punto de silla, una solución estable, un
punto de equilibrio de Nash. Obsérvese que esta solución conduce a una situación estable de dominación
social del jugador que podríamos calificar como el más egoísta.

También podría gustarte