Está en la página 1de 12

134

Ing. Agr. M. Sci Laura Pruzzo y Lic. Daniela Picardi


Departamento de Producción Animal, Facultad de Agronomía UBA

Introducción

En vez de pensar en la probabilidad simplemente como la frecuencia de un evento,


como hemos visto hasta ahora, en el enfoque subjetivo o bayesiano, la probabilidad es una
construcción que depende de la información o estado del observador.
Para el analista de riesgo, la subjetividad es un hecho. Cada modelo que se construye
es sólo una aproximación del mundo real. Las decisiones acerca de la estructura y
exactitud aceptable del modelo de análisis de riesgo, son muy subjetivas. A todo esto se
agrega que a menudo el analista debe sustentarse en estimaciones subjetivas de muchas
variables del modelo, muy frecuentemente, sin ninguna observación que lo respalde.
En tanto se reúne nueva información, un observador puede revisar el entendimiento del
sistema, explicando así algunos sesgos sistemáticos o estadísticos y, posiblemente,
revelando otros. Por ejemplo, si el observador comienza asumiendo que un dado está
equilibrado, entonces se esperarían iguales probabilidades para cada número (1/6), y sería
una sorpresa obtener por ejemplo una alta proporción de seis. Si, en cambio, el observador
sabe que el dado está cargado, este resultado no le sorprenderá. El observador bayesiano
continuará ajustando su expectativa basado en la nueva información que llega: primero, la
seguidilla de seis, y luego, posiblemente, la información de que el dado está cargado. Y
finalmente, ajustará la distribución de probabilidad para reflejar esta información
adicional.
Los recursos para hacer inferencia estadística bayesiana se conocen desde hace más de
200 años. El reverendo Thomas Bayes resolvió cuantitativamente por entonces, el
problema de determinar cuál de varias hipótesis es más probable sobre la base de los
datos. Su descubrimiento básico se conoce como el Teorema de Bayes.
Bayes nació en Londres en 1702 y falleció el 17 de abril de 1761 en Tunbridge Wells,
Kent. Fue distinguido como Fellow de la Royal Society en 1742, aunque hasta ese
momento no había dado publicidad a ningún trabajo bajo su nombre. Su artículo más
emblemático se titulaba Ensayo hacia la solución de un problema en la doctrina del azar
(Essay towards solving a problem in the doctrine of chances) y fue publicado
póstumamente.
El Teorema de Bayes provee un marco conceptual para evaluar probabilidades, o
riesgos, sobre la base de diferentes conjuntos de observaciones. La idea central es que la
probabilidad de un evento debe recalcularse, si sabemos con certeza que otro evento ha
ocurrido, y ambos no son independientes.
135

Conceptos generales

Los trabajos desarrollados por Fisher en los años 20 y por los matemáticos Neyman y
Pearson en la década del 30, dieron lugar al método actualmente conocido como prueba de
significación, correspondiente al paradigma frecuentista. Este método engloba un índice
para medir la fuerza de la evidencia, el valor p, y el procedimiento de prueba de hipótesis.
Se ha señalado que el paradigma clásico implica una decisión dicotómica, que constituye
una medida que depende vitalmente de un elemento exógeno a los datos: el tamaño de
muestra. A un efecto pequeño observado en un estudio con un tamaño de muestra grande
puede corresponder el mismo valor p que a un gran efecto registrado a través de una
muestra pequeña.
Alternativamente, la inferencia bayesiana conforma una aproximación metodológica
exenta de casi todas las críticas que se le hacen a las pruebas de significación y permite
incorporar las evidencias aportadas por experiencias previas dentro del proceso analítico,
contemplándolas en las conclusiones. Por ejemplo, un médico tiene un criterio a priori
sobre un paciente; realiza exámenes complementarios y actualiza su visión inicial sobre el
diagnóstico que corresponde a ese paciente al conjugar las dos cosas (visión inicial e
información complementaria) en lo que constituye un proceso de inducción integral.
Parece bastante natural que un investigador se conduzca de manera similar; esa es
exactamente la forma en que opera el pensamiento bayesiano.
El pensamiento bayesiano tiene más similitud que el frecuentista con el tipo de
situaciones en que se ve el científico habitualmente: lo que tiene son datos (individuos
enfermos con ciertos rasgos, medias muestrales, series de datos) y lo que quiere es
descubrir qué circunstancias determinaron que los datos fueran esos y no otros (es decir,
quiere hacer juicios acerca de las leyes que gobiernan el proceso que produjo los datos que
observa). La diferencia esencial entre el pensamiento clásico y el bayesiano radica en que
aquél se pronuncia probabilísticamente sobre los datos a partir de supuestos; en tanto que
éste se pronuncia (también probabilísticamente) sobre los supuestos partiendo de los datos.

Probabilidad subjetiva

La inferencia bayesiana constituye un enfoque alternativo para el análisis estadístico


de datos que se diferencia de los métodos convencionales de inferencia, por la forma en
que asume y maneja la probabilidad. Existen dos definiciones de la noción de
probabilidad: objetiva y subjetiva. La definición frecuentista considera que la probabilidad
es el límite de frecuencias relativas (o proporciones) de eventos observables. Pero la
probabilidad puede también ser el resultado de una construcción mental del observador,

en este marco las probabilidades pueden variar de una persona a otra, se llaman
probabilidades subjetivas o grados de creencia. La alternativa bayesiana está abierta a
manejarse con esta última variante, aunque no excluye la primera.
sugiere cierta arbitrariedad; sin embargo, el hecho de que diferentes sujetos atribuyan
probabilidades diferentes al mismo evento no significa que se conduzcan arbitrariamente.

de las frecuencias relativas se definen en términos de secuencias infinitas, las cuales no


son observables directamente.
136

Qué probabilidad hay que un alumno apruebe un examen? para emitir una respuesta,
nadie exigiría someterlo 1.000 veces a ese examen para poder contar cuántas veces aprobó
y poder computar el porcentaje de éxitos.
La inducción bayesiana consiste en usar recursos probabilísticos para actualizar
(cambiar) nuestra asignación probabilística inicial o previa (haya sido ésta, objetiva o
subjetivamente establecida) a la luz de nuevas observaciones; es decir, computar nuevas
asignaciones condicionadas por nuevas observaciones.

1. Revisión de reglas de Probabilidad

1.1. Si X e Y son eventos excluyentes P (x ó y) = P (x) + P (y)


Si no son mutuamente excluyentes P (x ó y) = P (x) + P (y) P (x e y)

Por ejemplo, cierta clase de fruta se cultiva en 2 regiones, A y B. Ambas áreas sufren a
veces de invasiones de mosca de la fruta. Las probabilidades son:

P (A) = 1/10 P (B)= 1/20 P (A y B) = 1/50

¿Qué probabilidad hay de que una, otra o ambas regiones estén infectadas en determinado
momento?

P (A ó B) = P (A) + P (B) = 0,1 + 0,05 0,02 = 0,13

Esquemáticamente:

P (sólo B) = 0,05 0,02 = 0,03

P (sólo A) = 0,1 0,02 = 0,08

1.2. Concepto de independencia

Los eventos X e Y son independientes si la probabilidad de que ocurra X no se ve


afectada por la ocurrencia de Y; entonces:

P (X e Y) = P (X) P (Y)
137

1.3. Probabilidad Condicional

Si A y B son dos eventos, la probabilidad de que A ocurra dado que B ha ocurrido es

Se define como:

P A B
P AB = , P B 0
P B

1.4. Sumario

En la página siguiente se presenta en forma esquemática un resumen de las reglas de


probabilidad.

Sean los sucesos X e Y y las siguientes posibilidades:


138

Son X e Y
mutuamente excluyentes?

1. P (X e Y) = 0 1. P (X e Y) > 0
2. P (X ó Y) = P (x) + P (y) 2. P (X ó Y) = P(X) + P(Y) P(X e Y)

Son X e Y independientes?

P x e y
1. P (X Y) = P (X) 1. P x y
P y
2. P (X e Y) = P (X) P (Y) 2. P (X e Y) = P (X Y) P (Y)
= P (Y X) P (X)

2. Teorema de Bayes

El teorema de Bayes es una herramienta para pasar de una probabilidad inicial, a una
probabilidad posterior o actualizada, sobre la base de una nueva observación. Produce una
probabilidad conformada a partir de dos componentes: una que con frecuencia se delimita
subjetivamente, conocida como probabilidad a priori, y otra objetiva, llamada
verosimilitud, basada exclusivamente en los datos. A través de la combinación de ambas,
el analista conforma entonces un juicio de probabilidad que sintetiza su nuevo grado de
convicción al respecto. Esta probabilidad a priori, una vez incorporada la evidencia que
aportan los datos, se transforma así en una probabilidad a posteriori.
El teorema de Bayes se deriva a partir de la definición de probabilidad condicional.
Esta se definiría para dos sucesos A y B, donde A y B son ambos sucesos posibles, es
139

decir, con probabilidad no nula. Entonces la probabilidad condicional de B dado A, como


se presentara en 1.3, se define del modo siguiente:

P A B
P B/A [1]
P A
Análogamente,

P A B
P AB =
P B

más simple de expresar la regla de Bayes:

P A/B P B
P B/A [2]
P A

Ahora bien, supóngase que B1, B2, ..., Bk son k sucesos mutuamente excluyentes, uno
de los cuales ha de ocurrir necesariamente; entonces la ley de la probabilidad total
establece que:

k
P A P A/Bi P(Bi )
i 1

De modo que, tomando el suceso Bj en lugar de B en la fórmula [2] y aplicando al


denominador la mencionada ley, se tiene:

P A/B P B
P Bj / A k
[3]
P A/Bi P Bi
i=1

que es otra forma en que suele expresarse la regla de Bayes.


La regla de Bayes produce probabilidades inversas, en el sentido de que expresa
P(B|A) en términos de P(A|B).
La terminología convencional para P(B|A) es: la probabilidad a posteriori de B dado
A; y para P(B) es: la probabilidad a priori de B, (debe su nombre a que se aplica antes, sin
estar condicionada por la información de que A ocurrió).
Sintetizando, el enfoque bayesiano resulta útil como un método que combina las
evidencias subjetivamente acumuladas, con la información objetiva obtenida de un
experimento en particular.
140

La formalización del teorema se enuncia a continuación:


Si la realización de un acontecimiento aleatorio A depende necesariamente de que
se produzca uno de los acontecimientos excluyentes B1, B2, B3...Bn., y se sabe que A se ha
cumplido, la probabilidad para que sea uno determinado, por ejemplo Bj, el cual se haya
cumplido conjuntamente con A, está dado por:

P(A/B j )P(B j )
P(B j/A) k
P(A/Bi )P(Bi )
i=1

Dónde:
P(Bi) son las probabilidades a priori. Representan las probabilidades de los estados
del suceso antes de tomar la información adicional.
P(A/Bj) es la verosimilitud de la hipótesis. Representa la probabilidad condicional
de observar la información adicional A, cuando el estado del suceso que se
presenta sea Bj.
P(Bi/A) es la probabilidad a posteriori. Representa la probabilidad de ocurrencia
del estado del suceso Bi dada la información adicional A.

3. Aplicación al Análisis de Riesgo

El análisis bayesiano puede, y de hecho, es ampliamente aplicado en análisis


probabilísticos técnicos, médicos, financieros, etc. La mejor forma de entender la
inferencia bayesiana es a través de ejemplos; para tener una impresión de la diversidad de
aplicaciones, consideraremos un escenario que frecuentemente ocurre en análisis de riesgo
en importación de animales, incorporando algunos conceptos relevantes a dicho
escenario.

Primeramente recordamos que:

Los diagramas de árbol son útiles para organizar cálculos que envuelvan varias
etapas.
Cada segmento del árbol es una etapa del problema
Las probabilidades en las ramas de cada punto deben sumar 1.
La probabilidad de alcanzar el final de cualquier vía completa es el producto de las
probabilidades en sus ramas.

Es importante recordar el siguiente concepto:

Prevalencia: proporción de animales en un grupo o población que están infectados


con una enfermedad en particular.

Adicionalmente se define como:

Falso positivo: cuando la prueba indica enfermedad, no habiendo presente ninguna.


Falso negativo: ocurre cuando la enfermedad está presente, pero la prueba indica
un individuo sano.
141

Sensibilidad (Se): la probabilidad de que un individuo resulte positivo ( y no

mide la calidad de la prueba diagnóstica: cuanto más cerca de uno esté, mejor es el
test.
Especificidad (Sp): la probabilidad de
prueba) dado que no está infectado. Es otra probabilidad condicional y medida de
calidad: cuanto más cerca esté de la unidad, mejor es la prueba.

Deseamos conocer la probabilidad de que un animal esté infectado (I), dado que pasa
un control veterinario específico. Primeramente visualizamos el problema mediante un
diagrama de árbol de eventos:

SI Pasa/Infectado (0,05) F -
SI PASA
P=0,08 TEST ? No pasa/Infectado (0,95) Se
NO
Animal infectado?
NO
NO PASA No pasa/Sano (0,02) F +
0,92 TEST ? Pasa/Sano (0,98) Sp
SI

¿Cuál es la probabilidad de que un animal infectado haya resultado negativo (es decir,
haya pasado la prueba)?

Del Teorema de Bayes:

Prevalencia Falso negativo


P I Pasa
Prevalencia F 1 Prevalencia Especificidad

0,08 0,05 0,004


0, 004416
0,08 0,05 0,92 0,98 0,9056

Alternativamente, también puede adoptarse un método tabular conveniente utilizando


el Teorema de Bayes. Leyendo a través de las filas se computa la probabilidad bayesiana,
en este caso para Resultado Negativo de la prueba (es decir, el animal analizado pasa la
prueba):
142

Verosimilitud
Alternativa Priori Conjunta Posterior
P (pasa/alt)
Infectado 0,08 0,05 0,004 0,004416
Sano 0,92 0,98 0,9016
Norma 0,9056

Primera columna: el animal está sano o enfermo


Segunda columna: son las probabilidades a priori
Tercera columna: verosimilitud de la hipótesis; probabilidad de que pase la prueba estando
infectado (falso negativo) y probabilidad de que pase la prueba estando sano
(especificidad)
Cuarta columna: se multiplican las dos columnas, la suma de las casillas es el
denominador de la regla de Bayes o norma
Finalmente la probabilidad posterior se obtiene dividiendo el producto correspondiente por
la norma.

4. Inferencia Bayesiana

Inferencia basada en el Teorema de Bayes que describe matemáticamente el proceso


de aprendizaje. Comenzamos con una opinión vaga, y luego modificamos nuestra opinión
a la luz de la evidencia presentada.
A continuación se presenta una reseña breve, pues el tema se detalla en material
complementario por exceder el alcance del curso.
Con el propósito de explicar la inferencia bayesiana para el caso de variables continuas se
expresa la fórmula del Teorema de la siguiente manera:

( )l ( x / )
f ( / x)
( )l ( x / )d

Donde:
istribución a priori.

de incertidumbre. Es decir, constituye una representación adecuada de nuestro estado de


x hayan sido observados.

Probabilidad calculada a partir de observar aleatoriamente los datos x para un dado valor
ión incorpora la información contenida en los datos. Si
contienen muy poca, la función tendrá una elevada dispersión, en tanto que si contienen
mucha información, estará muy concentrada alrededor de un valor particular del
parámetro. Si la forma de la función se corresponde fuertemente con la distribución a

distribución posterior no será muy diferente de la distribución a priori. Es decir, no se


habrá aprendido gran cosa con los datos. Y a la inversa, si existe mucha diferencia entre
ambas.
143

datos x es de haberlos observado

El denominador de la ecuación simplemente normaliza la distribución posterior para


tener un área total igual a uno. Dado que el denominador es simplemente un valor escalar
enientemente como:

f ( / x) ( )l ( x / )

que el valor de la función de densidad posterior es proporcional al producto de la función


de densidad a priori y la función de verosimilitud. Es interesante recalcar que la inferencia
bayesiana no está interesada en valores absolutos de la distribución a priori y de la función
de verosimilitud, sino solamente en su forma. Asimismo el uso de esta ecuación implica
que eventualmente deberemos normalizar la distribución.

Bibliografía
Kammen, D. y Hassenzahl, D. 2001. Should we risk it?. Princeton University Press.
Pérez, E. 2000. Decisión Estadística Bayesiana. Ediciones cooperativas.
Organización Panamericana de la Salud. 2003. Análisis Bayesiano. OPS y Dir. Gral. Salud
Pública de Galicia Editores.
Vose, D. Risk Analysis, a quantitative guide. 2004. John Wiley and Sons.
144

En una ciudad de la Provincia de Mendoza el 25% de las viviendas contiene concreto


en sus cimientos, y 75% no. Estudios previos han demostrado que el 80% de las viviendas
con cimientos de concreto tiene problemas de radón en su interior, debido a la intrusión de
gas Rn222 del suelo. En tanto que, de las viviendas que no contienen concreto, el 10%
tiene problemas de radón en su interior debido a otras fuentes remanentes, por ejemplo,
materiales de construcción.

1. Consigne todos los eventos posibles en este caso

2. Represente todos los porcentajes informados como probabilidades simples o


condicionales

3. ¿Cuál es la probabilidad de encontrar una vivienda que contiene concreto en los


cimientos, y con problemas de radón en su interior?

4. ¿Cuál es la probabilidad de encontrar una vivienda que no contiene concreto y con


problemas de radón en su interior?

5. ¿Cuál sería el porcentaje esperado de viviendas con problemas de radón?

1. En cierta provincia, el 25% de los automóviles emiten una cantidad excesiva de


contaminantes. La probabilidad de que un auto que emite una cantidad excesiva de
contaminantes no pase la prueba de emisión vehicular de la provincia, es de 0,99 y la
probabilidad de que un auto que no emite exceso de contaminantes, tampoco pase la
prueba es de 0,17. ¿Cuál es la probabilidad de que un auto que no pasa la prueba esté
emitiendo realmente un exceso de contaminantes?

2. Se le realiza un análisis diagnóstico para detectar una enfermedad que afecta una
persona cada 5000, y que no presenta síntomas inicialmente. El análisis tiene un 5% de
falsos positivos y un 2% de falsos negativos. Aplicando análisis bayesiano para la
obtención de las probabilidades a posteriori, qué concluye Ud. si:
a) Su test resulta negativo para la enfermedad
b) El resultado de su test es positivo para la enfermedad.
145

3. Considere una evaluación poblacional para cáncer mamario, cuya prevalencia es de 1


en 5000 mujeres. La prueba identifica correctamente el 90% de mujeres que presentan
la enfermedad. Asimismo se sabe que ocurren en promedio, 5 resultados positivos cada
1000 mujeres que no presentan la enfermedad.
a) Consigne los valores de especificidad, sensibilidad, falsos negativos y falsos
positivos de la prueba.
b) Encuentre la probabilidad de que una mujer tenga la enfermedad, si su prueba
dice que la tiene.
c) ¿Qué concluye del resultado obtenido en b)?

4. Se desarrolla un dispositivo de medición de concentración de monóxido de carbono


([CO]) en el interior de edificios de departamentos. Dicho dispositivo posee un monitor
que produce una lectura positiva cada vez que la [CO] excede un nivel crítico de
calidad de aire (72 ppm en 8 horas). Los controles de calidad señalan que el dispositivo
indica correctamente que se excede el nivel crítico, un 95% de las veces que esto
ocurre. Asimismo, el 10% de las veces informa un problema de [CO] cuando éste no
existe.

a) ¿Cuáles son los valores de calidad de este dispositivo?


b) En una ciudad ocurren problemas de [CO] en el 10% de los edificios.
Si el monitor presenta una lectura positiva, ¿Qué probabilidad hay de que exista
realmente un problema de [CO]?

También podría gustarte