Está en la página 1de 11

EL CONTROL DE LA INCERTIDUMBRE: EL CLCULO DE PROBABILIDADES Y LA TEORA DE LA UTILIDAD

FRANCISCO JAVIER GIRN GONZLEZ-TORRE Y JOS MIGUEL BERNARDO HERRANZ

Real Academia de Ciencias


INTRODUCCIN

Los fsicos nos han enseado a modelar la realidad mediante abstracciones como son las magnitudes fsicas, tales como la longitud, la velocidad, la masa, etc., y, lo que es ms importante, nos han proporcionado mtodos y patrones precisos para su medicin. Este paso fue fundamental para convertir la fsica en una ciencia. Sin medidas precisas no es sencillo describir fenmenos deterministas mediante ecuaciones que expresan la relacin entre ciertas magnitudes. Por otra parte, en el estudio de los fenmenos aleatorios y en la mayora de los problemas de decisin, aparece de forma natural la incertidumbre. Lo que observamos, y podemos medir, es slo una posibilidad entre muchas -como en el lanzamiento de una moneday, de algn modo, necesitamos de una escala que nos represente la verosimilitud de lo realmente observado en relacin con el resto. En otras ocasiones, ni siquiera existe la posibilidad de observar la realizacin de un suceso. As, si nos preguntamos sobre la posibilidad de que el hombre ponga el pie en el planeta Marte antes del ao 2020, ste es un suceso incierto de tipo no repetitivo, pero al que podemos asignar una mayor o menor verosimilitud, de modo puramente personal o subjetivo y que depender, en gran medida, de lo versado que est uno en el tema. Un experto de la NASA dara una respuesta muy distinta de la que nos ofrecera una persona ajena al tema. Una de las escalas para medir la incertidumbre, quiz la ms utilizada, es la probabilidad. Esta escala debe servir, igualmente, para medir probabilidades asociadas tanto a los sucesos de tipo repetitivo como a los de carcter no repetitivo, como lo son, a poco que reflexionemos, la mayora de los sucesos que ocurren a lo largo de nuestras vidas, y de los que dependen nuestras decisiones ms importantes. Por qu se debe medir la incertidumbre en trminos de probabilidad y no de alguna otra medida alternativa, como pudieran ser las funciones de credibilidad o la lgica difusa?

La pregunta anterior afecta a los fundamentos mismos de la inferencia inductiva, de la estadstica y de la teora de la decisin. Mucho esfuerzo se ha dedicado al tema de los fundamentos de estas disciplinas y a la justificacin de que las medidas de la incertidumbre deben expresarse en trminos de cantidades que obedezcan a las reglas del clculo de probabilidades. La mayor parte de los desarrollos axiomticos de la teora de la decisin y de la inferencia estadstica concluyen con la existencia de una medida de probabilidad sobre el lgebra de los sucesos inciertos, que representa el grado de credibilidad que un individuo determinado asigna a esos sucesos. Lo ms interesante de este tipo de resultados es que cada individuo, dependiendo de la informacin que tenga sobre los sucesos inciertos, cuantifica su incertidumbre con una medida de probabilidad personal o subjetiva. Este hecho es el que diferencia a la probabilidad de otras magnitudes: que es personal! Nos explicaremos: si a dos individuos distintos se les pide que estimen la longitud de una determinada barra y, para ello, se les da la misma cinta mtrica, ambos acabarn, en condiciones experimentales similares, con el mismo nmero, dentro de un margen de error presumiblemente pequeo. Sin embargo, en el caso de medir la incertidumbre de un mismo suceso, dos sujetos pueden producir respuestas muy distintas porque sus instrumentos de medida -sus cintas mtricas- son distintas. La explicacin de esta aparente paradoja es que, en el caso de medir la incertidumbre, el instrumento de medicin se ve afectado por la distinta informacin que cada uno de ellos tiene. Si las dos personas tuviesen exactamente la misma informacin, la probabilidad que asignaran al suceso incierto sera la misma. La conclusin
que se sigue es que todas las probabilidades son siempre condicionadas a un cierto estado de informacin. No hay, por

consiguiente, probabilidades absolutas. De modo que las probabilidades que una persona asigna a los sucesos inciertos, adems de cumplir el requisito de ser compatibles con las reglas del clculo de probabilidades, son siempre individuales o subjetivas. Esto no es bice para que, en ciertas circunstancias, la asignacin de probabilidades a sucesos inciertos sea prcticamente la

205

FRANCISCO JAVIER GIRN GONZLEZ-TORRE Y JOS MIGUEL BERNARDO HERRANZ

misma por parte de cualquier individuo, como ocurre, nir, por ejemplo en geometra, lo que se entiende por por ejemplo, en juegos de azar, como la ruleta, o en si- un punto o una recta. Lo importante para construir una tuaciones, como suele suceder en las ciencias experimen- teora matemtica es establecer los axiomas que relaciotales, en las que la informacin compartida constituye casi nen estos conceptos sin necesidad de definirlos. Como toda la informacin disponible. hemos comentado en la introduccin, las relaciones enPor otra parte, la forma en que medimos el otro ingre- tre las medidas que se asignan a los sucesos inciertos dediente esencial en los problemas de toma de decisiones, las ben hacerse de acuerdo con los axiomas del clculo de proconsecuencias de nuestras acciones que medimos mediante babilidades, lo que adems permite asimilar los sucesos la denominada funcin de utilidad, es tambin de carc- ciertos o seguros con aquellos que tienen probabilidad ter subjetivo. Lo que, por otra parte, es evidente dado el uno. distinto comportamiento que tenemos las personas ante Los sucesos inciertos son ciertos subconjuntos de un situaciones inciertas idnticas. espacio paramtricoQ. que pertenecen a una cierta (7-lgeLa conclusin que puede extraerse de los argumentos prebra Ba y la incertidumbre que inicialmente asignamos a cedentes es que para que la toma de decisiones y, en conestos sucesos mediante la llamada distribucin apriori es secuencia, la inferencia estadstica (al menos, la bayesiana) se haya convertido en una ciencia, que hoy conocemos una medida de probabilidad P{9) sobre el espacio probacomo teora de la decisin bayesiana, ha sido necesario apli- bilstico (2, Ba). En lo que sigue supondremos, sin prcar las mismas ideas que se han aplicado a otras disciplinas dida de generalidad, que la distribucin a priori P{9) es abpara convertirlas en ramas de la ciencia; a saber, construir solutamente continua respecto de una medida fi(9) a-finita un sistema axiomtico sobre sus principios y cuantificar definida sobre (2, Bn), de modo que la distribucin a priori queda perfectamente caracterizada por la funcin de los ingredientes que la constituyen. Los que arguyen que la teora de la decisin no es una densidad p{0), que es una versin de la derivada de Radondisciplina cientfica anloga a otras bien establecidas, ba- Nikodym de P{9) respecto de i{9). sndose bien en argumentos de que ni la incertidumbre Uno de los problemas bsicos de la inferencia o esni las preferencias de los individuos pueden cuantificarse tadstica inductiva es el de reducirla incertidumbre inicial de modo racional, o bien en que el comportamiento real dada por P{9) mediante razonamientos deductivos o mede las personas no se ajuste a las teoras normativas que sur- diante la realizacin y observacin de experimentos esgen de la teora de la decisin, desconocen el argumento tadsticos que nos proporcionen informacin sobre 9, en anterior. sentido amplio. Si el experimento es concluyente, como La conclusin es clara: no debemos tomar como modelo sucede, por ejemplo, cuando se recurre a una demostrade la teora de la decisin el comportamiento real de las cin matemtica o se examinan todos los elementos de personas, primero porque la mente humana no est ca- una poblacin finita, la incertidumbre se reduce totalpacitada para procesar informacin sin la ayuda del clculo mente y llegamos a la certeza. de probabilidades y, segundo, porque el comportamienBsicamente, un experimento estadstico es un proceto humano muestra muchas incoherencias incluso en siso de reduccin o disminucin de la incertidumbre que tuaciones simples, como se ha demostrado en repetidos experimentos- que deben excluirse de cualquier teora permite el trnsito de la incertidumbre a la certeza, aunque sta slo se alcance de manera asinttica. normativa de la decisin. Las observaciones son subconjuntos de un espacio muesLa alternativa parece partir de una teora, tal como la que ofrece el paradigma de la maximizacin de la esperanza de tralX, que pertenecen a una cierta cr-lgebra Bx, que suutilidad subjetiva, que se deduce de unos principios bsi- puestamente nos permiten reducir la incertidumbre sobre cos que concitan el consenso de una mayora, al menos en los sucesos inciertos. Con mayor precisin, un experimento estadstico es un el terreno de las decisiones individuales, teora que puemodelo probabilstico, representado por una medida de de y debe ser mejorable con el tiempo, como demuestran los recientes avances realizados en el campo de los funda- probabilidad condicionada P{x\ 9) sobre el espacio mentos de la teora de la decisin. (X, SA). Supondremos que la familia de probabilidades En las pginas que siguen queremos ilustrar, con ejem- condicionadas \F\x\ 9); 9 2 est dominada por una plos sencillos tomados de la realidad cotidiana, el modo medida (7-finita v(x) sobre (X, B^), de modo que el expede enfrentarse a situaciones inciertas utilizando el para- rimento queda caracterizado por la funcin de densidad digma descrito. condicionada f{x \9), que relaciona lo incierto 9 con lo observable x. El proceso de aprendizaje, o reduccin secuencial de la LA PROBABILIDAD COMO MEDIDA incertidumbre inicial, p{9), a medida que se van obserDE LA INCERTIDUMBRE vando los datos x, x,,..., x,}, se realiza mediante la aplicacin No se puede dar una definicin precisa de lo que es la sucesiva del teorema de Bayes, tal como se muestra en el incertidumbre, del mismo modo que no se puede defi- diagrama siguiente: 206

EL CONTROL DE LA INCERTIDUMBRE: EL CLCULO DE PROBABILIDADES Y LA TEORA DE LA UTILIDAD

p(d)
Incertidumbre inicial

p(0\x

p(0\X,Xl)

p(d\x]y x2, ..., x,)

Datos observados x{, ..., x,,

Incertidumbre final

y donde la incertidumbre residual sobre el parmetro 9 en la etapa /-sima, una vez observados los datos xx, x2, ..., x,, viene dada por la densidad aposteriorip {6 I xx, x2, ..., x) que se calcula por el teorema de Bayes mediante la frmula: p(9\ x[yx2,..., x,) ocp(6\ xx,x2,..., xiA)f{x,\ 9,xi,x2,..., *,_,) donde la constante de proporcionalidad se determina con la condicin de que la funcin p(9 I xx, x2, ..., x) sea una funcin de densidad, es decir, integre la unidad con respecto de la medida /u(9). Si las observaciones xv x2,..., xn se pueden suponer (condicionalmente) independientes, entonces la frmula anterior se simplifica, resultando
p (9 I x, x2, ..., x)
2,

coincidan con los de la otra varilla y forme un arco de circunferencia (ver figura 1). Cul es la deflexin mxima /entre ambas? El problema es puramente determinista; no hay nada de incierto en su solucin, que se obtiene resolviendo un sistema no linalas tres ecuaciones con tres incgnitas, d, r, y 9, pues y r d, al que se llega por sencillos razonamientos geomtricos y trigonomtricos. Pero si no dispusisemos de mtodos de clculo, y nos pidiesen una estimacin subjetiva de dicha distancia, en cunto estimaramos el valor de d?

/"

- ^ ^ ^ ^
E 8

..., x,__x) f(x, I 9)


E

El proceso de aprendizaje que acabamos de describir es lo que bsicamente se conoce como inferencia bayesiana, y su principal mxima es, como acabamos de sealar, que toda la informacin referente al estado de nuestra incerndumbre tras haber observado la muestra . .-del experimento estadstico viene descrita o representada por la densidad a posteriori p{9 I xv x2, ..., x). Si la distribucin a posteriori es degenerada en un punto, digamos 90, entonces la incertidumbre ha desaparecido y tenemos certeza (con probabilidad 1) '. Incertidumbre en situaciones deterministas Muchas situaciones puramente deterministas presentan incertidumbre, precisamente por no tener informacin suficiente o por no disponer de medios de clculo adecuados que suplan nuestra incapacidad para procesar datos. La valoracin de dicha incertidumbre no es fcil y, en muchas ocasiones, la intuicin resulta ser contradictoria con la lgica. De aqu la necesidad de recurrir, cuando se pueda, a las matemticas o a los argumentos rigurosos para reducir, e incluso eliminar, la incertidumbre inherente a ciertas situaciones deterministas en las que est presente. El ejemplo siguiente, adaptacin del problema que apareci por vez primera en el libro de Acton (1970), es sorprendente, pues parece contradecir la intuicin de la mayora de las personas, incluidos los matemticos. Ejemplo 1 Se tienen dos varillas de 1 m de longitud. A una de ellas se le aade 1 cm y se curva de modo que sus extremos

y
Var la
>

^^-j^s_--

le"----~^_

Fig. 1 . - Representacin grfica del problema de las varillas.

La mayora de las personas suele estimar el valor de den menos de 1 centmetro. Sin embargo, la respuesta correcta es d= 6,13 cm, r= 206,89 cm y el ngulo 9= 14 0' 13". Si en vez de 1 cm slo se aadiese 1 mm, la respuesta sera an ms sorprendente, pues d= 1,94 cm, r 646,37 cm y el ngulo 0 = 4 " 26' 12". El ejemplo 2 muestra un comportamiento habitual en las personas, incluidos los expertos en clculo de probabilidades, que generalmente tienden a infravalorar o sobrevalorar probabilidades si las asignamos de modo intuitivo como se hace con frecuencia en el diagnstico mdico en vez de computarlas de acuerdo con las reglas del clculo de probabilidades. Ejemplo 2 Se tienen dos urnas con 100 bolas cada una. La primera, / p contiene 70 bolas rojas y 30 azules y la segunda, U, 30 bolas rojas y 70 azules. Se extraen sin reemplazamiento 10 bolas de una urna elegida al azar (sin saber de cul se trata) y resultan 7 rojas y 3 azules. Cuntas veces es ms probable que la urna elegida sea la primera que la segunda?

El lector interesado en una descripcin elemental ms detallada del paradigma bayesiano puede consultar Bernardo (2001).

207

FRANCISCO JAVIER GIRN GONZLEZ-TORRE Y JOS MIGUEL BERNARDO HERRANZ

Est claro que es ms probable que la urna elegida sea la primera que la segunda, pero determinar cuntas veces es ms probable no es inmediato. La respuesta correcta es 43,67 veces, que es equivalente a que la probabilidad de que la urna sea la /, es 0,978 y la de que sea la U2 es 0,022, por lo que podemos estar muy seguros de que la urna es la /,. Sin embargo, la mayora de las personas a las que se les plantea el problema anterior, dan como respuesta un nmero inferior a 10. Ejemplo 3: Paridad de los dgitos del nmero n Cul es la probabilidad de que el dgito que ocupa la posicin p de la parte decimal de n sea par? Este ejemplo, sobre la presencia de la incertidumbre en una situacin determinista, se ha comentado con detalle en Girn (2001). Aqu slo nos limitamos a unos breves comentarios, ilustrados con las figuras 2 y 3.

slo parece que tiende a estabilizarse, sino que lo hace en torno al valor 0,5 tal como muestra la figura 2 para los 10.000 primeros dgitos. Adems, la sucesin de las frecuencias empricas de los dgitos pares presenta un aspecto similar al de la figura 3, obtenida por simulacin de una muestra de tamao 10.000 de una distribucin de Bernoulli de parmetro 0,5. No slo se estabilizan las frecuencias sino que la sucesin de los dgitos pasa las pruebas habituales de aleatoriedad e independencia estocstica. Si en vez de analizar los 10.000 primeros dgitos se analizan los 100.000 primeros, el comportamiento de stos aparece como puramente aleatorio, con distribucin uniforme, y lo mismo se puede concluir sobre el desarrollo decimal del nmero transcendente e. El comportamiento lmite de la sucesin de dgitos no se conoce, pero el afirmar que la probabilidad de que el dgito que ocupa la posicin />-sima de la parte decimal de 7t sea par, cuando p es grande, es aproximadamente de 1/2 parece una respuesta totalmente razonable.
EL PROCESO DE APRENDIZAJE: EL TEOREMA DE BAYES

El ejemplo siguiente muestra una aplicacin sencilla del teorema de Bayes en un caso de diagnstico mdico, que pone de manifiesto el importante papel que desempea la probabilidad a priori a la hora de emitir un diagnstico. Diagnstico probabilstico de una enfermedad
Fig. 2.- Evolucin secuenaal de la proporcin emprica de los dgitos pares correspondiente a los 10.000 primeros dgitos de la parte decimal de K.

A un grupo de personas con trastornos respiratorios se les aplic un test de tuberculina para determinar si padecan dicha enfermedad. Del test se conoce, por estudios previos, su sensibilidad y su especificidad, dadas por: Sensibilidad = Pr {+ lEnfermo }= 0,98 Especificidad = Pr f-ISano }= 0,95

00

6000

8000

10000

de modo que la probabilidad de falsos positivos es Pr{+ ISano} = 1 - 0,95 = 0,05 y la de falsos negativos es

Fig. 3.- Evolucin secuenaal de la proporcin emprica de xitos de una muestra aleatoria de tamao 10.000 de un modelo de Bernoulli con probabilidad de xito 0,5.

Pr{- lEnfermo} = 1 - 0,98 = 0,02 Los sucesos inciertos son 6), = Enfermo y 62 = Sano, mientras que las observaciones son los resultados del test X, = Positivo (+) y x2 Negativo (-). Las probabilidades condicionadas del experimento se resumen en la tabla siguiente:
Positivo (+) Enfermo Sano 0,98 0,05 Negativo (-) 0,02 0,95

Parece claro que a medida que p aumenta, y nos alejamos en el desarrollo de la parte decimal de n, nuestra incertidumbre sobre la paridad de los dgitos aumenta, si no disponemos de mtodos de clculo adecuados; de hecho, sp es demasiado grande, probablemente nunca podamos saber cul es el dgito correspondiente. Pero, por otra parte, la proporcin de los dgitos pares o impares, no

208

EL CONTROL DE LA INCERTIDUMBRE: EL CLCULO DE PROBABILIDADES Y LA TEORI'A DE LA UTILIDAD

Si el resultado del test, aplicado a una persona de ese grupo de riesgo, fue Positivo (+): Cul es la evidencian favor de que esa determinada persona estuviese realmente enferma? La solucin correcta, es decir, el diagnstico probabilstico, la da la probabilidad de que la persona est enferma condicionada a que el resultado del test es positivo, es decir, la cantidad Pr(Enfermol+). Muchas personas, desconocedoras de las reglas del clculo de probabilidades, cometen un grave error lo que en el contexto legal se conoce como paradoja del fiscal-, que consiste en confundir, y por consiguiente igualar, la probabilidad condicionada de un suceso A supuesto que B ha ocurrido con la probabilidad condicionada de un suceso B supuesto que A ha ocurrido. En nuestro caso esto conducira a que: Pr(Enfermo 1+) = Pr(+ lEnfermo) = 0,98 Otro modo de razonar, propio de la estadstica clsica, es considerar puesto que el suceso + se ha observado el cociente o razn de verosimilitudes, tambin llamado factor de Baves: Pr(+I Enfermo) Pr(+ISano) 0,98 ~ 0,05

Enfermo Positivo (+) Negativo (-) 0,1653 0,0002

Sano

0,8347 0,9998

REDUCCIN SECUENCIAL DE LA INCERTIDUMBRE

Una de las ventajas de medir la incertidumbre mediante una medida de probabilidad es la de poder disponer de todas las herramientas y resultados del clculo de probabilidades, con lo que, desde la perspectiva bayesiana, la estadstica no es sino una aplicacin del clculo de probabilidades. Prediccin de resultados electorales Los problemas de prediccin son desde el punto de vista prctico de los ms interesantes e importantes de la estadstica. La prediccin del comportamiento de magnitudes futuras que todava no se han observado no slo es importante per se, sino que adems sirve para validar el modelo estadstico que se emplea para predecir. Desde el punto de vista de la inferencia bayesiana, la prediccin se realiza calculando la densidad a posteriori de la magnitud futura condicionada a los datos ya observados. As, si estamos interesados en predecir la magnitud futura T[xIHl, xm2> > *+,) habiendo observado x= (A',, X^ ..., x,,), la solucin viene dada por la frmula siguiente:

= 19,6

Si este cociente es significativamente mayor que 1, como ocurre en nuestro ejemplo, se diagnostica que la persona est enferma. La solucin, es decir, el diagnstico probabilstico correcto, resulta de aplicar el teorema de Bayes, para lo cual hace falta un dato adicional que es la probabilidad a priori de que una determinada persona del grupo de riesgo tenga la enfermedad, es decir, Pr(Enfermo). En medicina, a esta cantidad se la conoce con el nombre de prevalencia de la enfermedad. De estudios epidemiolgicos se sabe que la prevalencia de la enfermedad en el grupo al cual perteneca esa persona es aproximadamente Pr(Enfermo) 0,01. La probabilidad de que la persona est tuberculosa condicionada a que el test ha dado positivo se calcula por el teorema de Bayes como sigue:
Pr Enfermo I + = Pr Enfermo Pr(+ I Enfermo) Pr(Enfermo)Pr(+l Enfermo) + Pr(Sano)Pr(+I Sano) = 0,1653

donde f{t\ 9) representa la densidad del estadstico 7\xln], xm2, , xmll) condicionada al parmetro 6. La densidad/(rl x), llamada densidad predictiva, contiene toda la incertidumbre referente a la magnitud futura T\x,Hl, xml, ..., xmil).

La conclusin, que aparentemente resulta chocante, es que del colectivo de personas del grupo de riesgo slo el 16,53 % de las que diesen positivo estaran realmente enfermas: la mayora de las que diesen positivo (el 83,47%) resultaran ser falsos positivos. La tabla siguiente da las probabilidades a posteriori de padecer o no tuberculosis condicionadas a que el resultado del test haya sido positivo o negativo.

La prediccin de resultados electorales es una de las aplicaciones ms llamativas del clculo de probabilidades. En el ejemplo que sigue consideramos una versin simplificada, que consiste en escrutar los votos de una urna cuando hay varios candidatos y se tiene en cuenta adems la posibilidad de que haya votos en blanco y nulos. No estamos interesados en predecir el porcentaje de votos obtenidos por cada uno de los candidatos, sino en el problema mucho ms interesante de predecir secuencialmente la probabilidad de que cada uno de ellos obtenga una cierta mayora, a medida que se van escrutando los votos de una urna. Este problema no es posible abordarlo desde el punto de vista de la estadstica clsica, pues no se trata de un simple problema de estimacin secuencial, ya que al ser el problema discreto -las posibles configuraciones de la urna son finitas-, el espacio paramtrico tambin lo es y la inferencia clsica nicamente considera espacios paramtricos continuos. Adems, el clculo de las probabilidades predictivas implica necesariamente la especificacin de unas probabilidades a priori, que son ajenas a la estadstica clsica.

209

FRANCISCO JAVIER GIRN GONZLEZ-TORRE Y JOS MIGUEL BERNARDO HERRANZ

Incluso desde el punto de vista bayesiano el clculo de las probabilidades predictivas es complejo debido al enorme nmero de posibles configuraciones de la urna, sobre todo cuando hay muchos votos y varios candidatos, por lo que en estas ocasiones se hace imprescindible recurrir a los mtodos de Monte Cario. Elecciones de acadmicos en la Real Academia de Ciencias Segn los estatutos de la Real Academia de Ciencias, para ser elegido acadmico en la primera votacin es necesario obtener al menos un nmero de votos favorables igual o superior a los dos tercios de los acadmicos con derecho a voto. En la segunda votacin, si ha lugar, se ha de obtener al menos un nmero de votos favorables igual o superior a los dos tercios del nmero de acadmicos presentes en la votacin y, en la tercera votacin, si ha lugar, slo es necesario obtener la mayora absoluta entre los acadmicos presentes. En el supuesto que sigue hay 41 acadmicos con derecho a voto, de los cuales 37 estuvieron presentes en las tres votaciones y hay dos candidatos C, y C2. Los votos en blanco o nulos se representan por B y los votos emitidos por V.E. El nmero mnimo de votos favorables necesario en cada una de las tres votaciones es por consiguiente: 28 votos en la primera vuelta, 25 en la segunda y 19 en la tercera. La tabla I muestra cul fue el desarrollo de la votacin, en la que el resultado final aparece en negrita.
Tabla 1. Desarrollo secuencial de la votacin V.E.
1

Las predicciones futuras se hacen condicionadas a la informacin obtenida en cada momento del escrutinio, y reflejan con precisin los cambios cuantitativos que se van produciendo a lo largo del mismo.

Fig. 4.- Variacin secuencial de las probabilidades de que el primer candidato obtenga la plaza de acadmico en primera (rojo), segunda (verde) y tercera votacin (azul).

O
0 0 1 1 1 2

B
0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

V.E.
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

C ,
13 14 14 15 16 17 18 18 19 19 20 21 22 23 24 24 25 26

C;
5 5 6 6 6 6 6 7 7 7 7 7 7

B
2

2
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

2
2

2 2
2

2
3 3 4 5 6 7 8 8 8 9 10 1 1 12 13

2 2
2

2
3 3 3 3 3 3 4

Fig. 5.- Variacin secuencial de las probabilidades de que el segundo candidato obtenga la plaza de acadmico en primera (rojo), segunda (verde) y tercera votacin (azul).

2 2 2
3 3 3 3 3 3 3 3 3

ESTIMACIN PROBABILSTICA DE MAGNITUDES CONTINUAS

5 5 5
5 5 5

7 7
8 8 8

En las figuras 4 y 5 se muestra el comportamiento, es decir, la variacin secuencial de las probabilidades predictivas de que el primer y segundo candidatos obtengan la plaza de acadmico en cada una de las votaciones, respectivamente. 210

Los dos ejemplos siguientes muestran cmo se estiman parmetros o magnitudes continuos, desde la perspectiva bayesiana. La solucin es, como ya hemos comentado, la densidad a posteriori del parmetro, que en el caso unidimensional puede representarse grficamente y de la que se puede extraer informacin precisa sobre el parmetro. Por razones de espacio no podemos detallar el proceso de obtencin de las densidades a posteriori, a partir del modelo estadstico correspondiente. En ambos ejemplos se supone que la informacin inicial sobre el parmetro es mnima o, de modo equivalente, la incertidumbre inicial es mxima.

EL CONTROL DE LA INCERTIDUMBRE: EL CLCULO DE PROBABILIDADES Y LA TEORA DE LA UTILIDAD

Determinacin experimental de la aceleracin normal g,

El conjunto de 10 medidas independientes, en m/s~, del valor en el laboratorio de la aceleracin normal de la gravedad g0, D = {9,78 9,84 9,97 10,02 9,75 9,68 9,84 9,78 9,98 9,73} se obtuvo en unas prcticas de la asignatura de mecnica realizadas con un pndulo. Con esos datos, qu podemos afirmar sobre el valor de la magnitud g El modelo estndar para este tipo de datos experimentales es el modelo normal, de modo que suponemos que los datos jf|, ..., x1()son observaciones independientes que siguen el modelo probabilstico normal:

que son anlogas a las que se obtienen con los intervalos de confianza de la estadstica clsica. Es interesante sealar que aunque a g0 se la considere una constante fsica, de hecho es una magnitud aleatoria que se conoce con mayor o menor precisin segn las condiciones experimentales y que adems vara segn la latitud y la altura sobre el nivel del mar. Determinacin de la proporcin 8 de individuos seropositivos Los resultados, D= {-, -, ..., - } , de los tests de inmunodeficiencia realizados a 200 estudiantes universitarios elegidos al azar en la Universidad de Valencia han sido felizmente negativos para todos ellos. Qu podemos afirmar de la proporcin 0 de individuos seropositivos en el colectivo de todos los estudiantes universitarios de esa universidad? El estimador intuitivo de 6, que es el estimador de mxima verosimilitud, sera 0, que no es admisible, pues no tendra sentido afirmar que en la poblacin universitaria no hay ningn seropositivo, por el hecho de no haber observado ninguno en la muestra. Como en el ejemplo anterior, toda la informacin sobre 0est contenida en la densidad a posteriori de Acondicionada a los datos D (ver figura 7).

x,~N{&, a2)
donde gn es el parmetro que queremos estimar y O2 es otro parmetro subsidiario, que no interesa estimar en este ejemplo, y que representara la variabilidad del instrumento de medida, en este caso las observaciones realizadas con el pndulo. Toda la informacin sobre g0 est contenida en la grfica de la densidad a posteriori de gn condicionada a los datos D, que muestra de forma clara la incertidumbre residual sobre gn.

0.2

0.4

0.6

0.8

9.9

10.0

10.1

10.2

Fig. 7 . - Conclusiones sobre la proporcin 9 de seropositivos entre los estudiantes basadas en el modelo binomial y en los resultados experimentales.

Fig. 6.- Conclusiones sobre el valor de la aceleracin de la gravedad g0 basadas en el modelo normal y en los resultados experimentales.

De la densidad a posteriori se deduce que la estimacin puntual de g0 es la media muestral x = 9,837, que en este caso adems coincide con la moda y mediana de la densidad a posteriori, debido a la simetra de sta. De la grfica se deduce que valores de la aceleracin normal menores que 9,7 o mayores que 10 son muy improbables. De la densidad a posteriori (ver figura 6) tambin se pueden obtener afirmaciones probabilsticas del tipo: Pr((9,75< i, < 9,92)1/)) = 0,95

La densidad a posteriori en este caso es muy asimtrica pues, como cabe esperar, refleja la asimetra de los datos: todos los resultados fueron negativos. La estimacin puntual basada en la media de la distribucin a posteriori (sealada con un punto) es 0,25%, mientras que la basada en la mediana es 0,11 %, valores muy pequeos pero no nulos. La afirmacin probabilstica: Pr(0% < 0 < 0,9546%)l>) = 0,95 mide la incertidumbre residual sobre 6, despus de analizar los datos, con una probabilidad alta, en este caso de

211

FRANCISCO JAVIER GIRN GONZLEZ-TORRE Y JOS MIGUEL BERNARDO HERRANZ

0,95, con lo que podramos concluir que la probabilidad de que el porcentaje de infectados en la poblacin de estudiantes sea menor que el 1% es muy alta.
PREDICCIN PROBABILSTICA

Tabla II. Probabilidades predictivas del nmero de accidentes que ocurrirn en los tres periodos de tiempo especificados

NI.0 acc. 0 1 2 3 4 5 6 7

1 semana 0,912871 0,076073 0,009509 0,001321 0,000193 0,000029 0,000004 0,000001

5 semanas 0,707107 0,176777 0,066291 0,027621 0,012084 0,005438 0,002492 0,001157

10 semanas 0,577350 0,192450 0,096225 0,053458 0,031184 0,018710 0,011434 0,007078

El ejemplo siguiente, un problema de prediccin relativamente sencillo, se resuelve calculando las distribuciones predictivas correspondientes a tres instantes o intervalos de tiempo futuro. La solucin del problema pone de manifiesto la ventaja de trabajar en trminos probabilsticos, calculando las respectivas distribuciones predictivas, en lugar de dar, como es habitual, un estimador puntual o numrico de la prediccin (generalmente el valor esperado) que no slo es insuficiente -como lo es toda estimacin puntual-, sino que puede ser ridculo. En cambio, la prediccin probabilstica muestra toda la informacin relevante al problema de prediccin. Previsin del nmero de accidentes de carretera En un tramo recin inaugurado de una carretera comarcal no se ha registrado ningn accidente durante cinco semanas consecutivas, es decir, se ha observado el vector D = {0 0 0 0 0}. Qu podemos afirmar, es decir, predecir, sobre el nmero de accidentes que se va a producir la semana prxima, o en las cinco o diez semanas prximas, suponiendo que no hay variaciones sustanciales en el trfico como, por ejemplo, las debidas a puentes, fiestas nacionales o autonmicas, etc.? Un modelo probabilstico adecuado para describir este tipo de situaciones es el de Poisson homogneo en el tiempo. As que supondremos que el nmero de accidentes semanales x]y ..., xs, y el de futuros accidentes x6, ... , x^,... sigue un modelo de Poisson de parmetro X, es decir: X x ,'e -X x,\ Como en el ejemplo anterior, el estimador intuitivo, que es el estimador de mxima verosimilitud, del parmetro X es 0, que es inadmisible: sera obviamente imprudente afirmar, esto es predecir, que en ese tramo nunca ms habr accidentes. No detallamos la expresin, ni la grfica, de la densidad a posteriori de A,, obtenida bajo la hiptesis de mnima informacin, o mxima incertidumbre, sobre el parmetro, pero mostramos en cambio, en la tabla II, las tres distribuciones predictivas del nmero de accidentes correspondientes a los tres futuros perodos de tiempo especificados, a saber: una semana, cinco semanas y diez semanas. 212

Las predicciones puntuales basadas en la media de las distribuciones predictivas del nmero de accidentes para la semana siguiente, para el conjunto de las cinco semanas siguientes y para el conjunto de las diez semanas siguientes son j = 0,1, % 0,5 y 10 = 1respectivamente. Las modas y las medianas de las tres distribuciones predictivas tampoco son muy tiles como estimadores puntuales, pues son todas igual a 0. Estas estimaciones puntuales, adems de ser ridiculas, dan muy poca informacin sobre el nmero de accidentes que, se predice, va a ocurrir. Sin embargo, la tabla de las probabilidades predictivas muestra claramente lo que puede ocurrir en cada uno de los tres casos. En todos ellos, las probabilidades predictivas del nmero de accidentes son decrecientes con el nmero de stos, y la tasa de decrecimiento es menor cuanto ms largo sea el periodo para el que se realiza la prediccin, de acuerdo con la intuicin. En particular, de la tabla II resultan los intervalos de credibilidad predictivos: 0 o 1 accidentes en la semana siguiente, con probabilidad 0,988944. 0, 1 o 2 accidentes en las cinco semanas siguientes, con probabilidad 0,950175. 0, 1, 2, 3 o 4 accidentes en las diez semanas siguientes, con probabilidad 0,950667. Si llegara a observarse un nmero superior de accidentes en los periodos especificados, habra fundadas sospechas para suponer que o bien ha ocurrido un suceso raro o bien se ha producido un aumento sustancial en la siniestralidad debido a posibles factores como, por ejemplo, un incremento en la densidad del trfico.
LA TEORA DE LA UTILIDAD

Pr(x, I X) =

i = \, .... 5, 6, .... 15,

Hemos visto que la manera de cuantificar o medir la incertidumbre es expresndola mediante una distribucin de probabilidad, que se va transformando mediante la aplicacin del teorema de Bayes, a medida que se incorpora nueva informacin. Sin embargo, nuestras decisiones no slo entraan incertidumbre, sino que tienen unas consecuencias que tam-

EL CONTROL DE LA INCERTIDUMBRE: EL CLCULO DE PROBABILIDADES Y LA TEORA DE LA UTILIDAD

bien tenemos que valorar, y que son el otro ingrediente de los problemas de toma de decisiones individuales. La medida de las consecuencias de nuestros actos, aunque se trate de consecuencias numricas, es el objetivo de la teora de la utilidad. El origen de la teora de la utilidad se debe a Daniel Bernoulli, quien en un artculo de 1738 expone una crtica del concepto de esperanza matemtica que debera sustituirse por el de esperanza moral o, en terminologa moderna, utilidad esperada. En ese artculo aparece por vez primera un problema, que ahora se conoce como la paradoja de San Petersburgo por haberse publicado en la revista de la Academia de Ciencias de esa ciudad, y que consiste en determinar el precio justo de un juego cuya esperanza matemtica es infinita, a pesar de que slo se puede ganar una cantidad finita. El problema se puede formular de la siguiente manera: Cunto se estara dispuesto a pagar por jugar a una lotera L que ofrece premios por valor de 1.000 2'"' pesetas, con probabilidades respectivas de 1/2', que podemos representar por: 1/2 1.000 1/4 2.000 1/8 4.000 1/16 8.000

La idea de Bernoulli qued olvidada durante ms de dos siglos, pero resurgi en uno de los libros ms influyentes del siglo XX, Theory ofGames and Economic Behavior del matemtico John von Neumann y el economista Oskar Morgenstern (1944). Funcin de utilidad: aversin al riesgo Por qu personas distintas pagaran precios diferentes cuando se enfrentan a la misma situacin de riesgo, como en el ejemplo de la paradoja de San Petersburgo, donde las probabilidades son objetivas y fcilmente comprensibles? La respuesta es que distintas personas pagaran distintas cantidades, dependiendo de su situacin econmica y de su actitud ante el riesgo, que son propias de cada individuo. Consideremos un ejemplo sencillo de determinar el valor, o precio justo, de una lotera simple como la siguiente: 1/2 0 1/2 100.000

y cuya esperanza matemtica es infinita ya que E[L] = ? La experiencia demuestra que la mayora de las personas no estaran dispuestas a pagar una cantidad demasiado elevada, por ejemplo, superior a 4.000 o 5.000 pesetas, por jugar al juego que da origen a la paradoja de San Petersburgo. Sin embargo, en la teora elemental del clculo de probabilidades se dice, con demasiada frecuencia, que la esperanza es el precio justo que se debe pagar por jugar a un juego de azar. El argumento que se esgrime es que, a la larga, es decir, si se jugase muchas veces y en virtud de la ley fuerte de los grandes nmeros, el valor medio de todos estos juegos se aproximara a la esperanza, lo que no parece razonable cuando la esperanza es infinita. Incluso si la esperanza fuese finita, el argumento anterior no tendra en cuenta las fluctuaciones aleatorias ni la posibilidad de ruina de los jugadores (ver Feller, 1968, cap. 3). La solucin que propone Bernoulli es sustituir el valor monetario por un ndice de utilidad u, de modo que la nueva esperanza sea finita: = > 1.000X2'"1 X2

que se puede interpretar como un juego donde con probabilidad 1/2 el jugador se queda como est y con probabilidad 112 su patrimonio aumenta en 100.000 pesetas. Cunto se estara dispuesto a pagar por jugar a esa lotera? La esperanza matemtica de la lotera es igual a 50.000 pesetas. Pero, adems de lo anteriormente sealado, la mayora de las personas estara dispuesta a pagar menos que el valor de la esperanza. Esto nos lleva a preguntarnos sobre la utilidad del dinero, no en el sentido estricto y puramente crematstico de que el dinero sea til, sino en el de valorarlo o medirlo a travs de un ndice o funcin de utilidad que, de algn modo, refleje la aficin o aversin de las personas hacia situaciones que entraan riesgo, que tengan en cuenta adems su posicin econmica o patrimonio. Por situaciones que entraan riesgo entendemos aquellas en que las probabilidades de los sucesos inciertos estn especificadas, por lo que se identifica el riesgo con la incertidumbre probabilstica. La utilidad del dinero Los comentarios precedentes plantean, entre otras, las siguientes preguntas: Por qu la esperanza monetaria no es un buen criterio para tomar decisiones?

E\u(L

con lo que el precio justo p, que se pagana por jugar, sera la solucin de la ecuacin
u(plt) = E[u(L)]

La respuesta es que la utilidad del dinero, aunque es una funcin creciente del dinero, no es una funcin lineal del dinero para la mayora de las personas.

213

FRANCISCO JAVIER GIRN GONZLEZ-TORRE Y JOS MIGUEL BERNARDO HERRANZ

Por qu se suele pagar menos que el valor de la esperanza de una lotera? La respuesta es porque la mayora de las personas suele
tener aversin al riesgo.

En la tabla III, el patrimonio xn y el precio justo p se especifican en pesetas.


Tabla III. Precio justo que se pagara por las loteras L y i.1, segn el patrimonio de una persona con funcin de utilidad u(x)

De hecho, la aversin al riesgo se define por la propieL L dad anteriormente sealada de que el precio que pagara una persona por jugar a cualquier lotera es siempre mePrecio justo: p Patrimonio: x0 Precio justo: p Patrimonio: x0 nor que la esperanza matemtica de dicha lotera. 16.158 3.068 Desde el punto de vista matemtico, esta definicin 10.000 3.134 10.000 17.289 100.000 4.273 100.000 38.352 equivale a que la funcin de utilidad de las personas que 200.000 4.425 200.000 43.728 tienen aversin al riesgo sea una funcin cncava. La fi4.427 43.814 400.000 400.000 gura 8 muestra la forma de una posible funcin de utili4.427 1.000.000 1.000.000 43.815 dad cncava como las que a veces se utilizan en la prctica. Por el contrario, las personas que muestran aficin al riesgo -aquellas que por jugar a una lotera pagaran una Comparacin de inversiones cantidad superior a la esperanza matemtica de sta- tenEn situaciones inciertas ms generales, cmo se toman dran una funcin de utilidad convexa. decisiones individuales que entraan riesgo o incertidumbre probabilstica? La respuesta que se conoce como el paradigma de la maximizacin de la utilidad esperada es valorar las consecuencias asociadas a cada posible decisin y a cada suceso incierto elemental por un ndice o funcin de utilidad; calcular la esperanza de este ndice respecto de la probabilidad a posteriori, y tomar aquella decisin que haga mximo el valor de esa esperanza. Si representamos por D el conjunto de las posibles decisiones del individuo, por u{d,8) la utilidad de la consecuencia que se deriva de tomar la decisin de D cuando el suceso incierto es 6 e D, y por p(9 I x) la densidad a posteriori del individuo en el momento de tomar la decisin, entonces la regla de decisin ptima se obtiene reFig. 8.- Forma caracterstica de una funcin de utilidad que representa aversin al riesgo decreciente. solviendo el problema de optimizacin: Cmo se calculara el precio justo/) que hay que pagar por jugar a una lotera cuyo premio es una variable aleatoria L de distribucin conocida, supuesto que el patrimonio de la persona es x0 y su funcin de utilidad es (*)? La solucin es igualar la esperanza de utilidad de la lotera a la utilidad de la situacin sin riesgo u(x0), es decir:
u(x() = E[u(xt) + L- p)\

max Este problema [de optimizacin] puede ser muy complejo dependiendo del tamao de los espacios D y Q y la complejidad y propiedades de la funcin de utilidad u{d, 6) y de la densidad a posteriori p(91 x), por lo que no podemos entrar en detalles acerca de su resolucin. Concluimos este trabajo con una aplicacin del paradigma anterior al problema de seleccionar una cartera o inversin. Para simplificar la exposicin, el ejemplo se centra en la comparacin de slo dos carteras. Vamos a suponer que la rentabilidad de la cartera z-sima, R, se distribuye segn una normal de media fi y volatilidad o desviacin tpica O,, es decir, Ri ~ N(JJ, a). Si una persona opta por invertir su patrimonio x en la cartera z-sima, su situacin actual vendra representada por la variable aleatoria xo(l + R). La esperanza de utilidad de esta variable es:

y resolver la ecuacin en la variable p. Como aplicacin de este criterio consideremos el problema de determinar el precio justo que se pagara por jugar a las loteras L de la paradoja de San Petersburgo y E del problema 2, respectivamente, segn sea el patrimonio de cada persona, cuando la funcin de utilidad es la que muestra la figura 8, a saber:
-0,0()5.v . -0,05A-

u(x) = 1 - ?

+e
E[u(x)\ R,xo]= I u{x)

donde la variable x est medida en miles de pesetas. 214

EL CONTROL DE LA INCERTIDUMBRE: EL CLCULO DE PROBABILIDADES Y LA TEORA DE LA UTILIDAD

y se seleccionara la cartera que hiciese mxima la integral anterior. En ciertas circunstancias no se hace necesario el clculo de la esperanza anterior, debido a que hay teoremas matemticos que garantizan que no es necesario conocer con precisin la funcin de utilidad de la persona para saber que la esperanza de utilidad de una inversin es mayor que la de otra. Un ejemplo de tal situacin ocurre cuando las dos carteras tienen la misma volatilidad y diferentes rentabilidades medias. En este caso, una de las inversiones domina estocsticamente a la otra y un teorema garantiza que la cartera de mayor rentabilidad media siempre tiene esperanza de utilidad mayor cualquiera que sea la funcin de utilidad de la persona siempre que sea creciente con el dinero. La figura 9 muestra esta situacin, en la que la primera cartera tiene una rentabilidad R] ~ 7V(8, 1) y la segunda R2 ~ N{6, 1), por lo que la primera siempre sera preferible a la segunda.

Sin embargo, si la persona tiene aficin al riesgo, ocurre lo contrario, es decir, preferir aquella cartera con mayor volatilidad. Si la funcin de utilidad tiene unas partes convexas y otras cncavas, no se puede asegurar lo anterior y se hace necesario el clculo de las esperanzas de utilidad. Por ltimo, si la rentabilidad media y la volatilidad son distintas, entonces hay que calcular la esperanza de utilidad de cada cartera y elegir aquella que la maximice. Esta situacin es la que se ilustra en la figura 11, donde las dos rentabilidades son /?, ~ 7V(5, 5)yR2~ N(\0, 20), respectivamente.

Cartera 1 Cartera 2

0.4

0.2 0.1 2

J11
4 6 8

AA

- 40

- 20

Rentabilidad

Cartera 1
Cartera 2 Rentabilidad

Fig. 1 1 . - Carteras con distinta rentabilidad y volatilidad.

10 12 14

Fig. 9.- Carteras con distinta rentabilidad y la misma volatilidad.

Consideremos ahora la situacin en la que dos carteras tienen la misma rentabilidad media y distinta volatilidad. Esta situacin es la que se ilustra en la figura 10, suponiendo que /?, - N[5, 1,5) y R2~ N{5, 3).

As, por ejemplo, suponiendo que la funcin de utilidad del inversor u(x) es la misma que antes, y suponiendo que se tiene invertido todo el patrimonio en alguna de las dos carteras representadas en la grfica, si el patrimonio es mayor que 533.287 pesetas, entonces la primera cartera es preferible a la segunda, y viceversa. El resultado tiene su lgica, pues si el patrimonio invertido es muy grande, se tienen prdidas negativas cada vez mayores en valor absoluto que, a su vez -por la forma de la funcin de utilidad en la parte negativa (que no se muestra en la figura 8)- tienen utilidad negativa cada vez mayor.
BIBLIOGRAFA

Fig. 10.- Carteras con la misma rentabilidad y distinta volatilidad.

Si la persona tiene aversin al riesgo, entonces, por otro teorema, siempre preferir aquella que tenga mnima volatilidad.

1. Acton, F. (1970). Numerical Methods that Work. Ed.: Harper & Row, New York. 2. Bernardo, J. M. (2001). Bayesian Statistics. En Encyclopaedia ofLife Support Systems (EOLSS). Ed.: UNESCO, Pars (en prensa). 3. Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis. Comentarii Academiae Scientiae Imp. PetropolitanaeV, 175-192. 4. Feller, W (1968). An Introduction to Probability Theory and its Applications. 3rd Edition. Vol. 1. Ed.: Wiley, New York. 5. Girn, E J. (2001). Determinismo, Caos, Azar e Incertidumbre. En Horizontes Culturales: las fronteras de la ciencia 1999. Ed.: Espasa, Madrid, pp. 73-84.

215

También podría gustarte