Está en la página 1de 32

Universidad Nacional de Colombia

Sede Medellín

Clase # 22

Toma de decisiones sin


experimentación.

Diseño: Andrés Gómez 22-1


• No se dispone de datos
Toma de previos.
decisiones sin • Las circunstancias
datos previos varían constantemente.
• La decisión no se toma
en forma repetida

• Se dispone de datos
Toma de previos.
decisiones con • Las circunstancias no
datos previos varían constantemente.
• La decisión se toma en
forma repetida
Diseño: Andrés Gómez 22-2
Resumen del análisis de toma de decisiones.

1. El tomador de decisiones necesita elegir una de


las acciones posibles.
2. La naturaleza elegirá entonces uno de los estados
de la naturaleza posibles.
3. Cada combinación de una acción a y un estado
de la naturaleza  da como resultado un pago
p(a ,).
4. La tabla de pagos debe usarse para encontrar
una acción óptima para el tomador de decisiones
según un criterio adecuado.

Diseño: Andrés Gómez 22-3


En la toma de decisiones sin experimentación
existen varios criterios para elegir la acción óptima.

1. Criterio del Pago Máximo (pesimista).


2. Criterio del optimista.
3. Criterio de la máxima posibilidad.
4. Criterio de minimización del arrepentimiento.
5. Criterio de maximización del pago promedio
(Regla de decisión de Bayes)

Diseño: Andrés Gómez 22-4


Criterio del Pago máximo (pesimista o maximin)
Algoritmo

1. Para cada acción se escoge el pago mínimo sobre


todos los estados de la naturaleza y se lleva a una
lista.
2. De esta lista se escoge el máximo valor. La acción
asociada con este valor es la acción a elegir.

Este razonamiento es bastante válido cuando se está


compitiendo contra un oponente racional y malévolo. Sin
embargo, este criterio es demasiado conservador pues supone
que la naturaleza es un oponente que le quiere infligir al
tomador de decisiones todo el daño que sea posible.
Diseño: Andrés Gómez 22-5
Ejemplo GOFERBROKE COMPANY .


Petróleo Seco Mínimo
a

Perforar $700000 -$100000 -$100000

Vender $90000 $90000 $90000


Probabilidad 0.25 0.75

Elegimos el pago mínimo sobre los estados de la


naturaleza de las 2 acciones posibles y luego el
máximo de estos. Sigue
Diseño: Andrés Gómez 22-6
Pagos
Este es el menor
mínimos pago posible que la
petrolera podría
a1 :-100000 obtener, dado que la
naturaleza obrara
a2 : 90000 malévolamente.

La compañía petrolera eligirá entonces vender los


terrenos, y se abstendrá de realizar la perforación.

El criterio del pesimista siempre garantiza un pago mínimo

Diseño: Andrés Gómez 22-7


Ejemplo PIZZERÍA COMINI.

 No Arrendar Construir
a mudanza Apartamentos Apartamentos

No trasladarse 100 50 20

Cra 65 40 150 25
Calle Colombia -20 20 200
Probabilidad 1/3 1/3 1/3

Elegimos el pago mínimo de las 3 acciones posibles


y luego el máximo de estos. Sigue
Diseño: Andrés Gómez 22-8
Pagos mínimos
Este es el menor
a1 : 20 pago posible que la
pizzería podría
a2 : 25 obtener, dado que la
naturaleza obrara
a3 :-20
malévolamente.

La Pizzería eligirá entonces trasladase a la carrera


65 pues de esta manera obtendrá el mejor pago,
dado que ocurra lo peor.

Diseño: Andrés Gómez 22-9


Criterio del optimista.
Algoritmo

1. Para cada acción se escoge el mayor valor y se


lleva a una lista.
2. De esta lista se escoge el mayor valor. La acción
asociada con este valor es la acción a elegir.

Este criterio es completamente opuesto al anterior, pues acá


supone que la naturaleza obrará completamente a favor del
tomador de decisiones y que la suerte estará siempre del lado
de este. En este criterio el tomador de decisiones lo arriesga
todo sin mirar lo malo que pueda ocurrir.

Diseño: Andrés Gómez 22-10


Ejemplo GOFERBROKE COMPANY .


Petróleo Seco
a

Perforar $700000 -$100000

Vender $90000 $90000


Probabilidad 0.25 0.75

Sobre todos los estados de la naturaleza elegimos el


pago máximo de las 2 acciones posibles y luego el
máximo de estos. Sigue
Diseño: Andrés Gómez 22-11
Pagos
Este es el mayor
máximos pago posible que la
petrolera podría
a1 : 700000 obtener, dado que la
naturaleza obrara
a2 : 90000 benévolamente.

La compañía petrolera eligirá entonces perforar los


terrenos que tienen a su disposición.

Diseño: Andrés Gómez 22-12


Ejemplo PIZZERÍA COMINI.

 No Arrendar Construir
a mudanza Apartamentos Apartamentos

No trasladarse 100 50 20

Cra 65 40 150 25
Calle Colombia -20 20 200
Probabilidad 1/3 1/3 1/3

Elegimos el pago máximo de las 3 acciones posibles


y luego el máximo de estos. Sigue
Diseño: Andrés Gómez 22-13
Pagos máximos Este es el mayor
a1 : 100 pago posible que la
pizzería podría
a2 : 150 obtener, dado que la
naturaleza obrara
a3 : 200
benévolamente.

La Pizzería eligirá entonces trasladase a la Calle


Colombia pues de esta manera obtendrá el mejor
pago, dado que ocurrirá lo mejor.
Diseño: Andrés Gómez 22-14
Criterio de la máxima posibilidad
Algoritmo

1. De todos los estados de la naturaleza se elige el


estado que tenga mayor probabilidad de ocurrir.
2. Para este estado de la naturaleza se encuentra la
acción con el máximo pago y se elige.

La mayor desventaja de este criterio es que ignora por


completo mucha información relevante. No se considera
ningún estado de la naturaleza distinto del más probable. En
un problema con muchos estados de la naturaleza, la
probabilidad del más importante puede ser bastante
pequeña.
Diseño: Andrés Gómez 22-15
Ejemplo GOFERBROKE COMPANY .


Petróleo Seco
a

Perforar $700000 -$100000

Vender $90000 $90000


Probabilidad 0.25 0.75

Elegimos el estado de la naturaleza con mayor


probabilidad.
Sigue
Diseño: Andrés Gómez 22-16
Pagos Este es el mayor
Estado seco pago posible que la
petrolera podría
a1 :-100000 obtener para el
estado de la
a2 : 90000 naturaleza con
mayor probabilidad.

El estado de la naturaleza más probable es que no


exista petróleo en los terrenos. Por lo tanto la
compañía decidirá vender los terrenos.
Diseño: Andrés Gómez 22-17
Ejemplo PIZZERÍA COMINI.

 No Arrendar Construir
a mudanza Apartamentos Apartamentos

No trasladarse 100 50 20

Cra 65 40 150 25
Calle Colombia -20 20 200
Probabilidad 1/3 1/3 1/3

Elegimos el estado de la naturaleza con mayor


probabilidad. Sigue
Diseño: Andrés Gómez 22-18
Pagos Los 3 estados tienen
a1 : 100 igual probabilidad
por lo que se elige el
a2 : 150 mayor pago de cada
estado y luego el
a3 : 200
mayor de estos

La Pizzería eligirá entonces trasladase a la Calle


Colombia pues de esta manera obtendrá el mejor
pago. Los 3 estados son igual de probables, por lo
tanto lo mejor es elegir la acción que otorgue un
mayor beneficio.
Diseño: Andrés Gómez 22-19
Modelo de minimización del
arrepentimiento (minimax)
Algoritmo

1. Para cada estado de la naturaleza:


a) Determinar el máximo pago.
b) Para cada acción obtener la pérdida de
oportunidad.
c) Construir una tabla de arrepentimientos
con estos valores.

2. De la tabla de arrepentimientos tomar para cada


acción al valor máximo y llevarlo a una lista.
3. De esta lista escoger el mínimo valor
Diseño: Andrés Gómez 22-20
Arrepentimiento: Pérdida o costo de oportunidad.
Es lo que se pierde por no haber tomado la mejor
decisión.

Pérdida de Pago de la
Pago máximo
oportunidad de acción para el
para el estado -
una acción para = estado de la
de la naturaleza
un estado de la naturaleza
naturaleza

Diseño: Andrés Gómez 22-21


Ejemplo GOFERBROKE COMPANY .


Petróleo Seco
a

Perforar $700000 -$100000

Vender $90000 $90000


Probabilidad 0.25 0.75

Para cada estado de la naturaleza elegimos la


alternativa de mayor pago y construimos la tabla
de arrepentimiento Sigue
Diseño: Andrés Gómez 22-22

Petróleo Seco
a

Perforar $700000 -$100000

Vender $90000 $90000

Tabla de
arrepentimiento
Petróleo Seco

Perforar $0 $190000

Vender $610000 $0
Diseño: Andrés Gómez 22-23
Arrepen- Este es el valor que
timiento minimiza el
arrepentimiento .
a1 :$190000

a2 :$610000

Lo máximo de lo que puede arrepentirse la


petrolera si elige la acción 1 es de perder $100000 y
dejar de ganar $90000.
Diseño: Andrés Gómez 22-24
Ejemplo PIZZERÍA COMINI.

 No Arrendar Construir
a mudanza Apartamentos Apartamentos

No trasladarse 100 50 20

Cra 65 40 150 25
Calle Colombia -20 20 200
Probabilidad 1/3 1/3 1/3
Para cada estado de la naturaleza elegimos la
alternativa de mayor pago y construimos la tabla
de arrepentimiento Sigue
Diseño: Andrés Gómez 22-25
 No Arrendar Construir
a mudanza Apartamentos Apartamentos
No trasladarse 100 50 20
Cra 65 40 150 25
Calle Colombia -20 20 200

Tabla de No Arrendar Construir


arrepentimiento mudanza Apartamentos Apartamentos
No trasladarse 0 100 180

Cra 65 60 0 175
Calle Colombia 120 130 0
Diseño: Andrés Gómez 22-26
Arrepen-
timiento Este es el valor que
a1 : 180 minimiza el
arrepentimiento
a2 : 175
a3 : 130

La Pizzería eligirá entonces trasladase a la Calle


Colombia pues de esta manera obtendrá lo máximo
de lo que puede arrepentirse es de ganar 20 cuando
pudo haber ganado 150 .
Diseño: Andrés Gómez 22-27
Modelo de maximización del pago
promedio (Regla de decisión de Bayes)

Algoritmo

1. Usando las probabilidades de cada estado de la


naturaleza se calcula el valor esperado del pago de
cada acción posible.
2. Se escoge el mayor valor esperado y la acción
asociada al mayor valor es la elegida

La gran ventaja de este criterio es que incorpora toda la


información disponible, incluyendo todos los pagos y las
mejores estimaciones disponibles de las probabilidades de los
respectivos estados de la naturaleza.
Diseño: Andrés Gómez 22-28
Ejemplo GOFERBROKE COMPANY .


Petróleo Seco
a

Perforar $700000 -$100000

Vender $90000 $90000


Probabilidad 0.25 0.75

Calculemos el valor esperado del pago de cada


acción posible
Sigue
Diseño: Andrés Gómez 22-29
E {p(a1 ,)}= 0.25* $700000 + 0.75*(-$100000) = $100000

E {p(a2 ,)}= 0.25* $90000 + 0.75*($900000) = $90000

La petrolera eligirá la acción 1 pues esta es la


alternativa con el mayor valor esperado del pago

Diseño: Andrés Gómez 22-30


Ejemplo PIZZERÍA COMINI.

 No Arrendar Construir
a mudanza Apartamentos Apartamentos

No trasladarse 100 50 20

Cra 65 40 150 25
Calle Colombia -20 20 200
Probabilidad 1/3 1/3 1/3

Calculemos el valor esperado del pago de cada


acción posible
Diseño: Andrés Gómez
Sigue 22-31
E {p(a1 ,)}= 1/3*100 + 1/3*50 + 1/3*20 = 56.6

E {p(a2 ,)}= 1/3*40 + 1/3*150 + 1/3*25 = 71.6

E {p(a3 ,)}= 1/3*(-20) + 1/3*20 + 1/3*200 = 66.6

La pizzería eligirá la acción 2 pues esta es la


alternativa con el mayor valor esperado del pago

Diseño: Andrés Gómez 22-32

También podría gustarte