Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5.2 LA MODELIZACIÓN
Vienen determinados por el nivel de información. De que se dispone sobre los estados
de la naturaleza (sucesos de los depende la decisión y en los que no puede influir
apenas el decisor).
Ejemplo; Un agricultor se tiene que decidir por un cultivo u otro y los resultados
dependen de que sea seco S1 (son estados de la naturaleza) S2 medio y S3
húmedo; E alternativas de decisión
S1 S2 S3
E1 60 50 40
E2 10 40 70
C) Criterio pesimista o Wald persona que cualquiera que fuera la estrategia que
eligiera, el estado que se presentaría sería el menos favorable (maxi-min o mini-max).
E1 = 40 E2 = 10 Maxi-min = 40 -> E1
El resultado nunca será menor que 40
H1 = 60 · x + 40 (1-x)
H2 = 70 · x + 10 (1-x) Aplicando 60% = x (criterio de optimismo)
E) Criterio del mínimo pesar de Savage lo siguen aquellos quienes tienen aversión
a arrepentirse por equivocarse. Se elabora una matriz de pesares, se elige el criterio
correspondiente al menor pesar.
S1 S2 S3
E1 0 0 30
E2 50 10 0
Se resta 60-10
Lo máximo que puede dejar de ganar es 30. -> E1 (el menor de los máximos pesares)
Estrategias dominadas: Se dice que una estrategia A esta dominada por una B, si
cualquiera que sea el estado de la naturaleza que se presente en B es igual o menor
que A. B>= A
Número de participantes
Ganancia total obtenida por el conjunto de los participantes. Si no hay
ganancia (uno sólo gana lo que pierde el otro) se llama de suma nula
Número de jugadas
La información de que disponen los jugadores (completa o incompleta)
Los elementos que intervienen en las decisiones, son de estrategia pura
(sólo interviene la decisión de los jugadores) o de estrategia mixta
(interviene además algún elemento aleatorio)
Vamos a ver el más sencillo, el juego de dos personas de suma nula, llamado juego
rectangular, por la forma de la matriz de decisiones. Es la base de la teoría de los
juegos.
Para obtener la matriz y la solución de un juego rectangular hay que hallar las mejores
estrategias de los jugadores y el valor del juego (cantidad que gana un jugador y
pierde el otro).
Los juegos en los que el maxi-min del ganador coincide con el mini-max del perdedor
se denominan juegos con punto de silla. A veces hay varios puntos de silla, o sea,
varias soluciones posibles.
Ejemplo
Sea P el perdedor, viene formado por tres estrategias X,Y,Z y G el ganador formado
por A,B,C
P/G X Y Z
A 100 250 220
B 300 150 180
C 220 180 190
De las filas elegimos el valor menor 100, 150, 180 y de estos el mayor 180 (criterio
maxi-min)
De las columnas elegimos el valor mayor 300,250 y 220 y de estos el menor 220
(criterio mini-max).
Como no coinciden (180 es distinto de 220) no existe ningún punto de silla.
En otros casos, pueden aparecer varios puntos de silla, es decir, varias soluciones
posibles.
P/G X Y Z maxi-min
A 50 100 120 50
B 30 40 50 30 50
C 40 60 90 40
50 100 120
mini-max 50 1 punto de silla
Para encontrar un punto de silla es determinar un número que sea el menor de su fila
y el mayor de su columna
P(S) = h/n
P(C∩3)=P(C)P(3)=1/2*1/6=1/12
[Ejemplo tipo: Si en una urna hay una bola negra y una blanca, ¿qué posibilidad hay
de obtener dos bolas negras en dos extracciones sucesivas, con y sin
reemplazamiento?]
Una variable es aleatoria cuando no se sabe con certeza el valor que tomará, sino sólo
que valores puede tomar y qué probabilidades tiene cada uno de ellos.
Al conjunto de valores que puede tomar y sus probabilidades se le denomina
distribución de probabilidad. Se suele representar por medio de un histograma.
E(SP)=2*1/9+3*2/9+4*3/9+5*2/9+6*1/9=4 puntos
4/10
3/10 3/10
3 4 5
2
(x) = (3-4)²3/10+ (4-4)²4/10 +(5-4)²3/10=6/10=3/5
(x) = [2(x)]1/2
La varianza y la desviación típica miden la dispersión (posibilidad de alejamiento de la
media) de la variante.
Dispersión equivale a riesgo (si hay certeza, la varianza equivale a cero y va creciendo
a medida que el riesgo va siendo superior).
CV(x) = s(x)/E(x)
T = (S1T)(S2T) …(SnT)
P(T) = P(S1T) + P(S2T) +…+ P(SnT)
P(T) = P(T/S1)P(S1) + P(T/S2)P(S2) +…+ P(T/Sn)P(Sn)
Que equivale a:
P(S/T) = P(S) P( T / S) _
P(T/S1)P(S1) + P(T/ S2) P(S2) + … + P(T/Sn)P(Sn)
Oro= 45 millones
Plata: 15 millones
P(3∩p)=1/3*1/2=1/6
P(p)=1/3*0+1/3*1+1/3*1/2=1/2
E(B/p)=B1P(1/p)+B2P(2/P)+B3P(3/p)
P(2/p)=1-P(3/p)= 1-1/3=2/3
E(B/p)=90*0+30*2/3+60*1/3=40 m
2(x)=((30-60)²*1/3+(60-60)²*1/3+(90-60)²(1/3)) ½ =
24,5 m
Tras el descubrimiento:
(B/p)=((30-40)² 2/3+(60-40)²*1/3)) ½ =
14,14 m
Existen variables que pueden tomar ciertos valores (discretas) y otras que pueden
tomar infinitos valores (continuas). Las más importantes de éstas son las llamadas
variables normales, a cuyas distribuciones de probabilidad se llama distribuciones
normales. Características de las mismas:
x N[E(x), (x)] se lee: la variable x sigue una distribución normal con una
esperanza matemática igual a E(x) y una desviación típica igual a (x).
Motivo de su aplicación. El teorema fundamental del límite señala que, si una variable
está formada por la suma de un infinito número de variables (y se aplica de forma
aproximada cuando el número es suficientemente grande) independientes entre sí,
cada una de las cuales tiene una distribución de media y una varianza finitas, esa
variable-suma seguirá una distribución normal.
Hay una distribución normal que está tabulada. Se trata de la distribución normal
estandarizada o tipificada, que es aquélla cuya esperanza matemática vale cero y
cuya desviación típica es igual a uno, por lo que también se le denomina distribución
normal cero-uno.
El logaritmo puede ser neperiano (en cuyo caso la información viene medida en nits),
decimal (y, entonces la unidad de información será el Hartley) o binario (y, en ese
caso, la información se mide en bits).
Normalmente se utiliza en logaritmo binario, midiéndose la información en bits. Cada
bit constituye la información proporcionada por el acaecimiento de un suceso de
probabilidad igual a un medio.
H mide la incertidumbre que afecta al sistema antes de saberse cuál de los sucesos va
a producirse. A H se le denomina entropía o desorden en el sistema.
P(cara) = ½ P(cruz) = ½
h(1/2) = -log(1/2) = 1
H= ½ * 1 + ½ * 1 = 1 bit
La moneda no es perfecta hay un 25% de que salga cara ¿Cuánto vale la entropía?
P(cara) = 0,25
P(cruz) = 0,75
h(cara) = log2(1/P) = log2(1/0,25) h(cruz) = log2(1/P) = log2(1/0,75)
h(cara) = log2(1/4)= 2 bits h(cruz) = 0,415 bits
RESUMEN
Los ambientes de decisión difieren entre sí por el diferente nivel de información que
comporta, se distinguen:
Certeza
Riesgo
Incertidumbre estructurada
Incertidumbre no estructurada.
A los juegos maxi-min del ganador coincide con el mini-max del perdedor se le
denomina juegos con punto de silla.
Variable aleatoria: no se sabe con certeza el valor que tomara (solo los valores que
puede tomar y las probabilidades de cada uno)