Está en la página 1de 32
13.1 SE Solucién Toma de decisiones bajo incertidumbre ‘Todos hemos terido que tomar decisiones importantes en situaciones donde habia incer- tidumbre acerca de los factores pertinentes para las docisionas, El siguiente modelo abarca varios aspectos de la toma de decisiones en ausencia de cert ‘Gumbre. Quien toma ia decision lige primero una accién a; de un conjunto A = (8s, @3,. 21) {62 acciones disponibles. Luego se observa el estado dal mundo; con probabilidad p, se ob- ‘sorva el estado del mundo como s & S = (6, S2,..-1 9) Sige olige la accién ay el esta- 4 del mundo es s, quien toma la decision recibe una recompensa ry. Se hace referencia leste modelo como toma de decisiones observando el estado del mundo. En este capitulo se prosenta la teoria basica de la toma de decisiones bajo incertidum: bre: el ampliamente usado modelo de utlidad de Von Neumanr-Morgenster y el empleo de Jrboles decision para tomar decisiones en diferentes puntos del tiempo. Se concluye con- siderando la toma de decisions con varios objativos, Criterios de. decisién En esta secci6n, se consideran cuatro criterios de decisién que se pueden usar para tomar decisiones bajo incertidumibre. La vendedora Phyllis Pauley vende periédicos en la esquina de la avenida Kirkwood y la calle Indiana, y todos los dias debe determinar cudntos periédicos pedir. Phyllis paga a la compafia 20¢ por cada ejemplar y los vende a 25¢ cada uno. Los periédicos que no se venden al terminar el dia no tienen valor alguno. Phyllis sabe que cada dia puede ven- der entre 6 y 10 ejemplares, cada uno con una posibilidad equiprobable, Demuestre c6- ‘mo se ajusta este problema en el modelo del estado del mundo, Eneste ejemplo, los elementos de S = {6,7, 8, 9, 10} son pos alors pox ea demat- a diaria de periédicos. Se sabe que py = py = px = Po = Pio = +. Phyllis debe elegir tna acciGn (el nimero de priddicos que debe ofteoar cada a) ded = {6,7,8,9, 10) ‘Si Phyllis compra é ejemplares y la demanda es de entonees se compran / ejempla- res a um costo de 20%¢, y min (,) periddicos se venden a 25¢ cada uno.” Asi, si Phyllis ‘compra i periédicos y se venden j, obtiene una ganancia neta de ry, donde ry = 251-20= Si SA 1g = 25) — 208 us) Los valores de ry se tabulan en la tabla 1 “mies ol mas pequeto dey TABLA 1 Preis pare la venta de perites Demande de eenplires Kempo: des 6 1 8 2 0 6 3030, 30¢ 0g 0. 7 1OE 35¢ ASK aSE SE 8 log 15€ 406 40E 40g 8 -30¢ Se ease ase 10 ~s0g -25¢ 25K Sg OSE Acciones dominadas {Por qué no se consideré la posibilidad de que Phyllis ordenaria 1, 2, 3, 4, 5 o més de 10 cjemplares? Contestar esta pregunta tiene que ver con la idea de una accién dominada, DEFINICION @ Unaaccién a, es dominada por una acciém ay si para todas © S, ry ray y pare algiin estado Sp.ryp 11) esti dominado por ordenar 10 (véase el problema 3 al final de esta seecién). Una compro bacién ripida muestra que ninguna de las acciones en A = (6, 7, 8, 9, 10) esté dominada. Asi, Phyllis debe de hecho elegir su accién de 4 = {6, 7,8, 9, 10} ‘Ahora se analizan cuatro criterios que se pueden usar para clegir una accién. Criterio maximin Para cada accién, determine el peor resultado (premio mas pequeiio), Bl criterio maximin elige Ja accion con el “mejor” peor resultado, DEFINICION m Eleriterio maximin clige la acci6n a, con el valor més grande de minyesry. 738 Para el ejemplo 1, se obtienen los resultados de Ia tabla 2. Asi, el criterio maximin reco- ‘mienda ordenar 6 periédicos. Con esto se asegura que Phyllis, sin importar el estado del ‘mundo, obtendré una ganancia de por lo menos 30¢. El criterio maximin tiene que ver com hacer lo més placentero que se pueda el peor resuliado posible. Infortunadamente,elegit una decision para mitigar el peor caso podria evitar que quien toma la decisién aproveche Ja buena fortuna. Por ejemplo, si Phyllis sigue el crterio maximin, nunea obtendré menos de 30¢, pero mnea haré mas de 30¢. ariravo 4 Tama d dines tle incertae iia sntaansinemcaodiline th einen steicen-+gaciic eae jen TABLA 2 Cian ef esi macnn para la andere de pricas Fetes Pow estas Prien ol par A i 5 6 6,7,8,9,10 30g 7 6 10g 8 6 10g 9 6 308 10 6 =50¢ Criterio maximax Para cada accién, determine el mejor resultado (mayor recompensa). El criterio maximax clige 1a accién con el mejor resultado. DEFINICION @ Elcriterio maximax elige la accién a, con el valor més grande de maxjcsry. Para el ejemplo I, se obtienen los resultados de Ia tabla 3. Asi, el criterio maximax reco- mendaria ordenar 10 periédicos. En la mejor situacién (cuando la demanda sea de 10 ejemplares), esto produce una ganancia de 50g. Por supuesto, tomar una decision de acuerdo con el criterio maximax deja a Phyllis expuesta a la desastrosa posibilidad de que sélo se vendan 6 ejemplares, en cuyo caso pierde SO¢. Arrepentimiento minimax Fl criterio de arrepentimiento minimax (creacién de L. J. Savage) utiliza el concepto de costo de oportunidad para legar a una decisin. Para cada situacién posible del mundo s, encuentre una accién #*(j) que maximiza a ry. Es decir, /*(,) es la mejor accién posible para elegir si el estado del mundo es en realidad 5. Entonces para cualquier accién a, y el estado 5, la pérdida de oportunidad o arrepentimiento para a, en s; €3 Fi) ~ ye POF ejemplo, si la demanda de periédicos ¢s j = 7, la mejor decisién es ordenar i*(7) = 7 pe- riédicos, produciendo tna ganancia de rr» = 7(25) ~ 7(20) = 35¢. Suponga que se elige ordenar j = 6 periédicos. Puesto que req = 6(25) — 6(20) = 30¢, la pérdida de oportuni- dad 0 arrepentimiento para i = 6 y j = 7 es 35 — 30 = 5¢. Asi, si ordenamos 6 periédicos yy la demanda es de 7, a posteriori se comprende que al hacer la eleccién dptima (ordenar 7 periéicos) para la situaci6n real del mundo (7 peri6dicos requeridos), se habrian obtenido 5¢ mis de lo que se obtendria ordenando 6 periédicos. En la tabla 4 se muestra la matriz de costo de oportunidad o de arrepentimiento para el ejemplo 1. El eriterio de arrepentimiento TABLA 3 Gilde decide mina pra vdeo de pains Peridene Susan gee produce rieaiee_ e-jerratuade Molo routado 6 6,7,8, 9,10 30¢ 7 7,8,9, 10 35¢ 8 8,9, 10 40¢ 9 9,10 45¢ 10 10 soe 13.1. Gites de dain 739 ‘minimax clige una accién aplicando el criterio minimax a la matriz de arrepentimiento, En otras palabras, el criterio de arrepentimiento minimax intenta evitar la desilusién sobre 19 que podria haber sido. De la matriz de arrepentimiento en la tabla 4, se obtiene la decisiéa de arrepentimiento minimax en la tabla 5, Asi, el criterio de arrepentimiento minimax -e- ‘comienda ordenar 6 o 7 periddicos. Criterio del valor esperado El criterio del valor esperado elige la accién que produce la recompensa espetada mais Brande. Para el ejemplo 1, el criterio del valor esperado recomendaria ordenar 6 0 7 per. dicos (véase la tabla 6). Los criterios de toma de decisiones analizados en esta seccién podsfan parecer razora- ‘bles, pero muchas personas toman decisiones sin usar alguno de ellos. Un modelo mas ‘completo de toma de decisiones individuales, el modelo de utilidad de Von Neumann-Mor- ‘genstern (se analiza en la seccién 13.2.) | | TABLA 4 Matic de arapniniei parla wader d yrins Demande de peices | Peniieas | sides 5 1 4 2 2 | 6 30 — 30 = 0g 10¢ 50 ~ 30 = 20¢ 7 30 ~ 10 = 20¢ se 50 ~ 35 = 15¢ 8 30+ 10 = 40g oe 50 ~ 40 = 10¢ | 9 30 +30 = 60¢ 20¢ 50-45 = 5¢ 10 30 + 50 = 80¢ 4g 50 ~ 50 = 0¢ TABLA 5 Cao de dein de amapninietn rina pra vdeo te periias “repent | Potions pies sina 6 20¢ 7 20¢ a 40g 9 60g 10 80g TABLA 6 ‘Goalo de Ia dsisin dal valor esperede para le vendedora de peiéicos oc eds evpeis een $0 + 30+ 30+ 30+ 30) = 30¢ TCO + 35 +35 +35 + 35) = 30¢ E(-10 + 15 + 40 + 40 + 40) = 259 $(-30 5-420 +45 + 45) = 15g His - 25 + 0+ 25 + 50) = | 740 eapivie 4 Teme dcisines bao ncartuntre PROBLEMAS Grupo A 1 Pizea King y Noble Greek son dos restaurantes contra- fos, Cada uno debe deteminar al mismo Gempo si empren- una campata de publicidad pequeia mediana o grande, fizza King cre que es igulment probable que Noble Greck prenda una campata publctaria pequete, medina o {pande. Deperdendo de las accion elegidas por cada res- Crate, as ganancias de Pizza King se muestan en a tbla 7. Paras cateros de arepentiniento maximin, maxima ‘inlmas, determine la elescign de campata publictaia de za King. TABLA 7 poe eet rs Spon de Pua ing _Pagueia Medians _rane Pequeia $6,000 $5,000 $2,000 Medina $5,000 $6,000 $1,000 Grande $9,000 $6,000 $0 2 Sodaco esti considerando producir un nuevo producto: ‘peseosa Chocovan. Sodaco estima que la demanda anual pa- ‘aChocovan, D (en miles de caja), tiene la siguiente funciéa ée masa: P(D = 30) = 30, P(D = 50) = 40, P(D = 80) 33, Cada eaja de Chocovan se vende en $ dares y se incu- ‘meen un costo variable de 3 délares. Cuesta 800 000 délares coastruir una planta para producir Chocovan. Suponga que si se recibe | délar cada afo (por siempre), esto es equivalente ‘avoeibir 10 délares al tiempo actual. Considerando la recom- peasa para cada accién y el estado del mundo en términos 13.2 Teoria de la utilidad duce $10 000: Ly del valor presente neto, use cada criterio de decisi6n de esta seccign para determinar si Sodaco debe construi la planta ‘8. Para el ejemplo 1, muestre que ordenar 11 0 mas perié- ios esti dominado por ordenar 10 periédicos. Grupo B 4 Suponga que Pizza King y Noble Grock dejan de anun- ciarse pero deben determinarel precio que deben cargar pa- 1a cada pizza vendida. Pizza King considera que el precio de [Noble Greek es una variable aleatoria D que tiene la siguien- te funcién de masa. P(D = $6) = 25, P(D = $8) = 50, PQ = $10) = 25, Si Pizza King carga un precio py y No- ble Greek carga un precio p,, Pizza King venderd 100 + 25(p2 — pi) pizzas. A Pizza King le cuesta 4 dolares hacer luna pizza. Pizza King esta considecando cargar 5, 6, 7,809 dlares por pizza. Aplique cada eriterio de decision de este seccidn para determinar el precio que debe cargar Pizza King. 5 Alden Construction lleva a cabo una lictacién a fin de ‘competir con Forbes Construction por un proyecto, Alden cree que la oferta de Forbes es una variable aleatoria B con la siguiente funcién de masa: P(B = $6,000) = 40, PB = ‘$8 000) = 30, P(B = $11 000) = .30. A Alden le cuesta 6 000 détares completar el proyecto. Use cada uno de los crterios de devisign de esta seccion para determinar la ofer- ta de Alden. Suponga que en caso de un empate, Alden. na Ia liitaciOn. (Sugerencia: sea p = oferta de Alden. Pare P= 6000, 6000 < p = 8000, $000 < p< 11000 y p> 11.000, determine ia ganancia de Alden en términos de la oferta de Alden y la oferta de Forbes.) ‘Ahora se muestra e6mo se puede usar el concepto de Von Neumann-Morgenstern de una funcién de utilidad como auxiliar en Ia toma de decisiones bajo incertidumbre. Considere una situacién en la que una persona recibird, para i = 1, 2, compensa 7, con probabilidad p,, Esto se denota como la loteria (py, "1; Pv Pai» -} Pm 9). Una loteria suele representarse mediante un drbol en el que cada rama representa ua resultado posible de fa loteria, y el mimero en cada rama representa la probabilidad de que ‘ocurrird el resultado. Asi, la loteria (4, $500; '$0) se podria denotar por $500 $0 ‘Suponga que se pide elegir entre dos loterias (E, y Z3). Con certeza, la loteria L, pro- 810000 13.2 Teoia dele ied 744 La loterfa 2 consiste en lanzar una moneda. Siel resultado es cara, se reciben $30 000, y si sale cruz se reciben $0: $30 000 L— 30 Ly produce una recompensa esperada de $10 000 y Lz da une recompensa de (3)(30 000) ~ (0) = $15 000, Aunque La tiene un valor esperado més grande que L;, la mayoria de les ‘personas prefieren La Zp porque L, oftece la certeza de un pago relativamente grande, ¢2 tanto que L; produce un cambio sustancial (1) de obtener una recompensa de $0. En resv- rmen, la mayerfa de las personas preferen Ly @ Ls porque [tiene menos riesgo que (0 in- ‘certidumbre) que >. El objetivo es determinar un método que pueda usar una persona para clegir entre lote- sas, Suponga que una persona debe elegir entre J; 0 La. Se escribe LipLa sila persona preficre Ly. Se eseribe LyiL2 si la persona no tiene preferencia entre elegit Ly y La. Si Lis, se dice que L; y Z2 son loterias equivalentes, Por timo, se escribe ZopL, si quies toma la decisin prefiere Zs. Suponga que se pide a una persona que toma desisiones clasificar las siguientes loteias: 32 530000 t,—— 10000 t- 0 80 -—2— -si0 000 no» Lo ee iss00 EI método de Von Neumann-Morgenstern para clasificar estas loterias es como sigue Comience por identificar los resultados mas favorable ($30 000) y el menos favorable ($10 000) que pueden ocurrir, Para los otros resultados posibles (r, = $10 000, 72 3500 y rs = $0), se pide a quien toma la decision que determine Ia probabilided p tal que a iat a ni —2— $30.00 LI=2:_ ~s10000 Suponga que para r; = $10 000, quien toma ta decision es indiferente entre 30.000 sie yy — yy 10 -s10 000 y para ry = $500, indiferente entre $30 000 1 ss00 y = —4 38 _s10 000 cavirece Tama de decisis tj nertinire y para ry = $0, indiferente entre 830.000 80 a 40 $10 000 Usando (1) a (3), quien toma la decisién construye loterias Li, 13, L5 y Li tal que Li, y cada L; s6lo tiene que ver con el mejor resultado posible ($30 000) y el peor (—$10 000) Asi, de (1), se encuentra que Z;iL', donde 5° $39 000 | 10 310 000 De (3), se encuentra que ZoiL3, donde —*2— $30 000 0 $3000 50. 7 40 =S10.000 $ es una loteria compuesta en la que con probabilidad 0.50 se reciben $30 000 y con probabilided .50 se juega una loteria que produce .60 de posibilidad en $30 000 y .40 en. $10 000. De manera més formal, una loteria L es una loterfa compuesta si para alguna 4, hay una probabilidad p; de que la recompensa de quien toma la decisién sea jugar otra loteria L'. A continuacién se da un ejemplo de una loteria compuesta: 60. 36 50, «@ -s4 50 gg Asi, con probabilidad .50, L produce una recompensa de —$4 y con probabilidad .50, L ‘causa que se juegue Z'. Si una loteria no es compuesta, se trata de una loteria simple. De regreso al anélisis de Z3, se observa que 13 es una loteria que produce .50 + .50(,60) = .80 de posibilidad en $30 000 y una de .40(.50) = .20 en —$10 000. Asi, LiL SiL4, donde 2 $30 000 | a. ~$10 000 ‘De manera similar, usando (3), se encuentra que L3iL3, donde £0 $30 000 3B 40 =$10.000 13.2 Tei de wutdat 743 744 ‘Usando (2), se encuentra que quien toma la decisién no tiene proferencia entre Le y Li, donde -—22— -si0000 ie —%— 30000 98 38 $10 000 En realidad, sin embargo, L4 da una posibilidad de 98(.62) = .6076 en $30 000 y una de 02 + 38(.98) = 3924 en ~$10 000. Asi, Z4iL7iLi, donde 27 $30.00 924 =310 000 Puesto que LiL}, se podria clasificar 1, L2, L3 y Ly al clasificar Li, 13, L5 y Li. Conside- dos loterias cuyostnicos resultados posibes son $30 000 (el mis favorable) y ~$10 000 (el menos favorable). Sia la persona se le da a elegir entre dos lotetia de est tipo, al to- ‘mat la decision simplemente elige la loteria con le mayor posibilidad de reebir el results- do mis favorable. Aplicando esta idea desde L; hasta Li se obtiene LipLZpLipLi. Puesto aque LiL!, se podria concluir que LipLapLepLs. "Ahora se da una descripeién més formal del proceso que se uilizé para clasficar L,, La, Lsy Ly La utilidad de la recompensa r, escita u(r), ¢8 el nimero g, tal que quien te- rma Ja decisin es indiferente en las siguientes dos loteras: ——2— Resultado mas favorable pty —| L_1=4 Resultado menos favorable Esta definicién fuerza a que u(resultado menos favorable) = 0 y w(resultado més favore- ble) = 1, Para los pagos posibles de $30 000, ~$10 000, $0, $500 y $10 000, primera se encuentra que u($30 000) = 1 y u(—$10000) = 0. Entonces (1)~(3) producer 110 000) = 90, 14($500) = .62 y w(S0) ~ .60. La especificacién de u(r) para las recom pensas r; se llama la funcién de utilidad de quien toma la decision. Para wna loteria determinada L = (py, "15 Ps Tai - i Pu Masdefina la utilidad esperaéa de la loteria L, escrita EU para L), por WU para L) = > par) ‘Asi, en nuestro ejemplo EWU para L,) = 1.90) =.90 EU para La) = 501) + 50(-60) EU para Ls) = 1(.60) = 60 E(U para Ls) = .02(0) + 98(.62) = 6076 Recuerde que se encontrs que LAL}, donde L/ produjo una probabilidad E(U pare 1) ‘en $30 000 y una probabilidad 1 — E(U'para Z,) en ~10 000. Asi al elegir entre ls loteries carirace 13 Tuma de decisis fj eriantr | | |

También podría gustarte