Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teora de probabilidades
y resolucin de problemas
Diagramas de Venn
Antes de comenzar a desarrollar las reglas bsicas que rigen el comportamiento de las probabilidades, presentaremos un diagrama que resulta til para organizar las probabilidades. El
diagrama, llamado diagrama de Venn, se denomina as en honor de John Venn (1834-1923).
En este diagrama representamos el conjunto de posibilidades para un experimento mediante
un rectngulo. A este conjunto le llamamos espacio muestral y lo representamos con la letra
mayscula S (Fig. 3.1a). Un suceso de inters se representa mediante una curva cerrada
dentro del rectngulo y se indica mediante una letra mayscula distinta de S. En la Figura 3.1b se ha representado el suceso A. El suceso que no se produzca A, se indica mediante
A y se representa en la regin del rectngulo que queda fuera de A (Fig. 3.1c). El suceso A se
denomina suceso complementario de A. Cuando dos sucesos A1 y A2 estn relacionados en el
mismo experimento, dividen el rectngulo en cuatro reas separadas. Cada rea representa
una forma exclusiva de combinar los dos sucesos. stas se muestran en la Figura 3.1d a g. En
el ejemplo, ilustraremos esta idea.
Ejemplo 3.1.1. Se disea un estudio para investigar el peso y el hbito de fumar de los
pacientes con hipertensin. Aqu S representa a todos los pacientes con hipertensin. Establezcamos que A1 representa a los pacientes con sobrepeso y A2 a los fumadores. La Figura 3.1d representa a los pacientes con sobrepeso que no fuman; la Figura 3.1e representa a los
101
102
(a)
(b)
(c)
S
A1
A2
S
A1
(d)
S
A1
A2
(e)
A2
(f)
S
A1
A2
(g)
Figura 3.1. (a) El espacio muestral se representa mediante un rectngulo; (b) el suceso A se representa mediante una curva cerrada dentro del rectngulo; (c) el suceso A es el suceso de que A no
ocurra; (d) ocurre A1 pero no A2; (e) ocurre A2 pero no A1; (f ) ocurren tanto A1 como A2; (g) no ocurre
ni A1 ni A2.
que fuman pero que no tienen sobrepeso. La Figura 3.1f muestra a los pacientes con sobrepeso y fumadores, mientras que los que ni fuman ni tienen sobrepeso estn representados en la
Figura 3.1g.
La palabra castellana o tiene dos significados diferentes. Cuando se utiliza con sentido
de inclusin, significa lo uno o lo otro o quiz ambos; en el sentido de exclusin significa o uno u otro pero no ambos. En este texto, la palabra o se utiliza en sentido de
inclusin, salvo que se especifique lo contrario. Por ejemplo, si decimos que un paciente que
sufre hipertensin tiene sobrepeso o fuma, queremos decir que el paciente presenta, al menos,
una de estas caractersticas. l o ella tiene (1) sobrepeso pero no fuma o (2) fuma pero no
tiene sobrepeso o (3) fuma y tiene sobrepeso. En la Figura 3.2 se muestra el diagrama de
Venn para los sucesos A1 o A2.
Axiomas de probabilidad
Comenzamos considerando tres axiomas de probabilidad. Estos axiomas, que se admiten
como ciertos y que no requieren demostracin, son de origen intuitivo. Mucha gente los
aplica de forma bastante natural sin tener la menor idea de lo que est haciendo.
Antes de establecer los axiomas, desarrollaremos una definicin. Considrense los dos
sucesos, A1: el paciente A se recupera de una operacin de corazn, y A2: el paciente A fallece
en la mesa de operaciones. Es evidente que estos sucesos no pueden producirse simultneamente. El hecho de que se produzca uno excluye que sea posible el otro. Cuando esto ocurre,
decimos que los sucesos A1 y A2 son mutuamente excluyentes. En la Figura 3.3a se muestra la
representacin del diagrama de Venn de dos sucesos mutuamente excluyentes. Obsrvese
que, en este caso especial, las curvas que representan los dos sucesos no se superponen. La
idea se extiende a un conjunto de sucesos mutuamente excluyentes en la Figura 3.3b.
Todos los
pacientes con
sobrepeso
103
Todos los
pacientes
que fuman
Para sentar las bases de los teoremas bsicos de resolucin de los problemas de este
captulo se utilizan tres axiomas. Son los siguientes:
Axiomas de probabilidad
1. Sea S el espacio muestral de un experimento. Entonces P[S] = 1.
2. P[A] n 0 para todo suceso A.
3. Sea A1, A2, A3, ... un conjunto finito o infinito de sucesos mutuamente excluyentes.
Entonces P[A1 o A2 o A3 o ] = P[A1] + P[A2] + P[A3] + .
El Axioma 1 alude a un hecho que a la mayora de las personas le parecer obvio, es decir,
la probabilidad asignada al suceso seguro, al suceso cierto, es 1. El Axioma 2 afirma que la
probabilidad nunca puede ser negativa. El Axioma 3 garantiza que cuando se tiene una serie
de sucesos mutuamente excluyentes, la probabilidad de que ocurra uno u otro de los sucesos
puede calcularse sumando las probabilidades individuales. Estos axiomas conducen fcilmente al Teorema 3.1.1.
Teorema 3.1.1. P[] = 0.
A1
A3
A1
A2
A2
An
(a)
(b)
Figura 3.3. (a) Los sucesos A1 y A2 son mutuamente excluyentes. Si ocurre uno, el otro es imposible. (b) Un conjunto de n sucesos mutuamente excluyentes.
104
AB: 4 %
O: 45 %
Obsrvese que este teorema proporciona una forma de hallar la probabilidad del suceso complementario del suceso A.
EJERCICIOS 3.1
1.
Sea L el suceso que un paciente tiene leucemia y W el suceso que el recuento de leucocitos es alto. Considrense los diagramas de Venn de la Figura 3.4. Describir, en cada
caso, los pacientes representados por la regin sombreada.
2. Sea H el suceso que un rbol est situado en un lugar muy alto y G el suceso que el
crecimiento de los rboles es deficiente. Considrense los diagramas de Venn de la
Figura 3.5. Describir, en cada caso, los rboles representados por la regin sombreada.
3. En un estudio de vacunacin realizado con nios en edad preescolar, el inters se centr
en las vacunas contra la parotiditis y contra el sarampin. P representa el suceso de
(a)
105
(b)
(c)
(d)
Figura 3.4
que un nio haya recibido la vacuna contra la parotiditis y M el suceso de que un nio
haya recibido la vacuna contra el sarampin.
a) Describir a los nios del suceso P y M.
b) Dibujar un diagrama de Venn para representar al conjunto de nios que han recibido la vacuna contra el sarampin, pero no la vacuna contra la parotiditis.
c) Dibujar un diagrama de Venn para representar al conjunto de nios que no han
recibido ninguna vacuna.
(a)
(b)
(c)
Figura 3.5
(d)
106
4.
5.
6.
7.
d) Dibujar un diagrama de Venn para representar al conjunto de nios que han recibido la vacuna contra la parotiditis o contra el sarampin.
e) Dibujar un diagrama de Venn para representar al conjunto de nios que han recibido la vacuna contra la parotiditis o el sarampin, pero que no han recibido ambas.
En un estudio sobre el efecto que produce el dixido de azufre en los rboles a lo largo
de las autopistas principales de los Smokies, se han identificado dos sucesos. Estos son:
L, el rbol tiene las hojas daadas, y T, el rbol ha crecido poco.
a) Dibujar un diagrama de Venn para representar el conjunto de rboles que no han
crecido poco.
b) Dibujar un diagrama de Venn para representar el conjunto de rboles que han crecido poco, pero que no tienen las hojas daadas.
c) Dibujar un diagrama de Venn para representar el conjunto de rboles que no presentan ninguna de estas caractersticas.
d) Dibujar un diagrama de Venn para representar el conjunto de rboles que han crecido poco o que tienen las hojas daadas.
e) Dibujar un diagrama de Venn para representar el conjunto de rboles que han crecido poco o que tienen las hojas daadas, pero que no tienen ambos problemas.
Cules de los siguientes pares de sucesos son mutuamente excluyentes?
a) A: El hijo de Jane tiene hemofilia.
B: La hija de Jane es portadora de hemofilia.
b) A: El 65 % de las semillas de guisante que han sido plantadas germinar.
B: El 50 % de las semillas de guisante que han sido plantadas no llegar a germinar.
c) A: Jos sufre hipotermia.
B: La temperatura de Jos es de 39 C.
d) A: El pH de una muestra de superficie de terreno es igual a 7.0.
B: La muestra de superficie de terreno es alcalina.
e) A: Un paciente tiene SIDA.
B: El paciente ha recibido una transfusin de sangre.
f ) A: El animal es un mamfero.
B: El animal es un delfn.
C: El animal est cubierto de pelo.
g) A: El rbol es de hoja perenne.
B: El rbol es un encino.
C: El rbol es un cornejo.
h) A: El bosque es una extensin virgen.
B: El bosque fue talado hace 10 aos.
Tratando a bebs prematuros, la cantidad de oxgeno recibido puede afectar a su visin. Se puede categorizar a cada nio tratado como de visin normal, de lesin media, de lesin moderada, de lesin grave o ciego. Un estudio muestra que la probabilidad de que ocurra cada uno de estos sucesos es de 0.80, 0.10, 0.06, 0.02 y 0.02,
respectivamente.
a) Determinar la probabilidad de que un nio nazca con visin defectuosa.
b) Determinar la probabilidad de que un nio nazca con visin normal.
Un determinado anlisis qumico tiene un alcance ms bien limitado. Generalmente, el
15 % de las muestras estn demasiado concentradas para que puedan contrastarse sin
llevar a cabo una dilucin previa, el 20 % estn contaminadas con algn material obstaculizante que deber ser eliminado antes de llevar a cabo el anlisis. El resto puede ser
analizado sin pretratamiento. Supongamos que las muestras no estn en ningn caso
concentradas y contaminadas a la vez. Cul es la probabilidad de que una muestra
seleccionada aleatoriamente pueda ser contrastada sin pretratamiento?
8.
9.
10.
11.
12.
107
B: 20 %
AB: 4 %
Si se lleva a una mujer de raza negra a una clnica de urgencias, cul es la probabilidad
de que sea del tipo A, B o AB? (Basado en la informacin de Technical Manual, American Association of Blood Banks, 1985.)
13. Demostrar el Teorema 3.1.1. Sugerencia: Obsrvese que S = S o y que S y son
mutuamente excluyentes. Aplicar los Axiomas 3 y 1.
14. Demostrar el Teorema 3.1.2. Sugerencia: Obsrvese que S = A o A y que A y A son
mutuamente excluyentes. Aplicar los Axiomas 1 y 3.
15. Sean A y B dos sucesos tales que A est contenido en B (vase la Fig. 3.6). Obsrvese que
B = A o (B pero NO A)
y que los sucesos de la parte derecha de la igualdad son mutuamente excluyentes.
a) Utilizar la informacin y los teoremas y axiomas desarrollados en esta seccin para
probar que
P[A] m P[B]
108
En la Seccin 3.1, vimos cmo tratar cuestiones relativas a la probabilidad de que se produzca
uno u otro de dos sucesos mutuamente excluyentes. En esta seccin, vamos a examinar la
regla general de la adicin. Su propsito es permitir el manejo del caso ms general, calcular
la probabilidad de que ocurra al menos uno de dos sucesos que no es necesario que sean
mutuamente excluyentes.
Comenzaremos por observar el diagrama de Venn de la Figura 3.7. Obsrvese que A1 y A2
no son mutuamente excluyentes. Por tanto, la regin sombreada no es una regin vaca. Si
calculamos P[A1 o A2] como en la Seccin 3.1, concluiremos que
P[A1 o A2] = P[A1] + P[A2]
No obstante, dado que la regin sombreada est contenida en A1 y A2, incluimos P[A1 y A2]
dos veces en el clculo anterior. Para corregirlo, debemos restar P[A1 y A2] del miembro de la
derecha de la ecuacin. La expresin resultante es la regla general de la adicin.
Teorema 3.2.1. Regla general de la adicin. Sean los sucesos A1 y A2. Entonces
P[A1 o A2] = P[A1] + P[A2] P[A1 y A2]
A1
A2
109
dad aparece la palabra o, la adicin est casi siempre involucrada. En las Secciones 3.5 y 3.6
se ver que la palabra y es un indicativo de que se multiplicarn los nmeros para resolver
el problema de que se trate. El empleo de esta regla se explica en el Ejemplo 3.2.1.
Ejemplo 3.2.1. Se estima que el 30 % de los habitantes de Estados Unidos son obesos (A1)
y que el 3 % sufre diabetes (A2). El 2 % es obeso y padece de diabetes. Cul es la probabilidad de que una persona aleatoriamente elegida sea obesa o sufra diabetes? Se nos da
P[A1] = 0.3, P[A2] = 0.03 y P[A1 y A2] = 0.02. Hemos de hallar P[A1 o A2]. Aplicando la regla
general de la adicin, obtenemos:
P[A1 o A2] = P[A1] + P[A2] P[A1 y A2]
= 0.30 + 0.03 0.02
= 0.31
La regla general de la adicin no slo es til para calcular P[A1 o A2], sino que, disponiendo de la informacin adecuada, podemos utilizarla para hallar P[A1 y A2]. El Ejemplo 3.2.2
ilustra cmo se hace.
Ejemplo 3.2.2. Se sabe por informes recientes que el 18 % de los estudiantes de segunda
enseanza sufre depresin en algn perodo de su escolarizacin (A1), que el 2 % piensa en el
suicidio (A2) y que el 19 % padece depresin o piensa en el suicidio. Cul es la probabilidad
de que un estudiante de secundaria elegido aleatoriamente sufra depresin y piense en el
suicidio? Cul es la probabilidad de que un estudiante de secundaria elegido aleatoriamente
sufra depresin pero no piense en el suicidio?
Sabemos que P[A1] = 0.18, P[A2] = 0.02 y P[A1 o A2] = 0.19. Hemos de hallar, primero,
P[Al y A2]. Aplicando la regla general de la adicin, obtenemos
P[A1 o A2] = P[A1] + P[A2] P[A1 y A2]
o bien
P[A1 y A2] = P[A1] + P[A2] P[A1 o A2]
= 0.18 + 0.02 0.19
= 0.01
Para resolver la segunda cuestin propuesta, utilizamos la informacin dada por el diagrama de Venn. Puesto que P[A1 y A2] = 0.01, sabemos que el 1 % del rea total del diagrama
corresponde a la regin representada por Al y A2, como muestra la Figura 3.8a. Puesto que
P[A1] = 0.18, del rea total, el 18 % corresponde a la regin marcada por A1; dado que (A1 y
A2) est contenido en A1, el 17 % del rea corresponde a la regin sombreada de la Figura 3.8b. Anlogamente, puesto que P[A2] = 0.02 y (A1 y A2) est contenido en A2, el 1 % del
rea corresponde a la regin sombreada de la Figura 3.8c. Ya que P[S] = 1 y que tenemos ya
contabilizado el 17 + 1 + 1 = 19 % del rea, el 81 % restante corresponde a la regin sin
sombrear de la Figura 3.8d. Ahora podemos resolver la segunda cuestin buscando la regin
apropiada en el diagrama de Venn, es decir, A1 y A2. Puede verse que la probabilidad asociada
a esta regin es 0.17. Por lo tanto, la probabilidad de que un estudiante de segunda enseanza
sufra depresin pero no haya pensado en el suicidio es 0.17.
Obsrvese que, si los porcentajes registrados en problemas como stos estn basados en
los datos de poblacin, las probabilidades calculadas utilizando la regla general de la adicin
son exactas. Sin embargo, si los porcentajes estn basados en muestras extradas de una
poblacin mayor, las probabilidades calculadas son frecuencias relativas. Son aproximaciones a la probabilidad real de que se produzca el suceso en cuestin. Dado que muchos porcen-
110
A1
0.01
A1
A2
0.01
0.17
(a)
0.01
A2
A1
A2
0.01
(b)
A1
0.17
A2
0.17
0.01
0.01
S (1)
0.81
(c)
(d)
Figura 3.8. Clculo de probabilidades mediante los diagramas de Venn. (a) P[A1 y A2] = 0.01;
(b) P[A1] = 0.18; (c) P[A2] = 0.02; (d) P[A1 o A2] = 0.19, lo cual implica que P[(A1 o A2)] = 0.81.
tajes de los registrados en la bibliografa se basan en muestras, la mayora se interpreta correctamente como frecuencias relativas. Utilizamos la palabra probabilidad, pero entendiendo que las probabilidades dadas y calculadas utilizando los teoremas de este captulo son, en
muchos de los casos, slo aproximaciones.
EJERCICIOS 3.2
Supongamos que P[A1 y A2] = 0.04, P[A1] = 0.06, P[A2] = 0.10. Hallar
a) P[A1 o A2]
b) P[A1 y A2]
c) P[A1 y A2]
d) P[A1 y A2]
e) Disear un diagrama de Venn para visualizar la descomposicin de las probabilidades dentro del espacio muestral, segn se ha descrito en la Figura 3.8.
2. Supongamos que P[A1 o A2] = 0.30, P[A1] = 0.15, P[A2] = 0.20. Hallar
a) P[A1 y A2]
b) P[A1 y A2]
c) P[A1 y A2]
d) P[A1 o A2]
e) P[(A1 o A2)]
f ) Disear un diagrama de Venn para visualizar la descomposicin de las probabilidades dentro del espacio muestral, segn se ha descrito en la Figura 3.8.
3. Para satisfacer la demanda de los granjeros de utilizar pinos blancos jvenes como proteccin contra el viento, los empleados del servicio forestal tomaron muestras de los
granjeros del estado. Hallaron que el 30 % haba adquirido rboles del servicio forestal en
aos anteriores, el 40 % haba anticipado el pedido de rboles para el ao siguiente, el
10 % haba adquirido rboles en el pasado y anticipado el pedido de rboles para el ao
siguiente. Cul es la probabilidad de que un granjero seleccionado aleatoriamente haya
adquirido rboles en el pasado o haya anticipado el pedido para el ao siguiente? Cul
1.
4.
5.
6.
7.
8.
3.3.
111
112
condicionada son si y dado que. Utilizaremos la notacin P[A2 | A1] para designar la probabilidad del suceso A2 condicionada por el hecho de que haya sucedido previamente A1. Obsrvese que, a pesar de que en esta expresin intervienen dos sucesos, se alude nicamente a una
probabilidad. El primero de los sucesos reseados es aquel que no sabemos si ocurrir o no; la
barra se lee dado que; el segundo suceso es el que se supone que ha ocurrido ya.
Ejemplo 3.3.1. Una mujer tiene tres hijos. Cul es la probabilidad de que los dos primeros
sean chicos (A1)? Cul es la probabilidad de que exactamente dos sean chicos (A2)? Cul es
la probabilidad de que se satisfagan ambas condiciones?
Estas son preguntas no condicionadas y fciles de contestar utilizando un diagrama en
rbol (vase Fig. 3.9). Si suponemos que cada hijo tiene la misma posibilidad de ser chico que
chica, entonces los ocho puntos muestrales representados en el diagrama son igualmente probables. Por esta razn, puede usarse la aproximacin clsica para calcular las probabilidades
deseadas. En particular
P[A1] =
P[A2] =
P[A1 y A2] =
2
8
3
8
1
8
Supongamos que ya sabemos que los dos primeros hijos son chicos. Ahora, cul es la probabilidad de que haya exactamente dos chicos en la familia? Esto es, cul es P[A2 | A1]? Puesto
que sabemos que los dos primeros hijos son chicos, el espacio muestral para el experimento
lgicamente no estar constituido por los ocho puntos, sino que, de hecho, ahora contendr
solamente los dos puntos MMM y MMF. El resto de los puntos no son consistentes con la
informacin que tenemos. La pregunta condicionada planteada se resuelve mediante este nuevo espacio muestral formado por dos puntos. Ya que estos dos puntos son igualmente probables, y slo uno de ellos corresponde a tener exactamente dos chicos en la familia,
P[A2 | A1] = P[exactamente dos chicos | los dos primeros son chicos] =
1
2
En este caso observamos que 12 = P[A2 | A1] | P[A2] = 38. La nueva informacin afecta a la
probabilidad asignada al suceso de que exactamente dos de los nios sean varones.
El Ejemplo 3.3.1 es una simplificacin del problema general. La mayor parte de las preguntas que se plantean sobre probabilidad condicionada se refiere a situaciones en las que no
es conveniente trabajar directamente con un espacio muestral restringido explcitamente. As
que es necesario desarrollar una frmula para la probabilidad condicionada que, en esencia,
Primer
hijo
Segundo
hijo
M
Tercer
hijo
M
F
M
F
F
M
M
F
F
M
F
F
113
1
=
2
1
8
2
8
P[A1 y A2]
P[A1]
P[A1 y A2]
P[A1]
Probabilidad condicionada =
P[ambos sucesos]
P[suceso dado]
Ejemplo 3.3.2. Se estima que el 15 % de la poblacin adulta padece hipertensin, pero que
el 75 % de todos los adultos cree no tener este problema. Se estima tambin que el 6 % de la
poblacin tiene hipertensin pero no es consciente de padecer dicha enfermedad. Si un paciente adulto opina que no es hipertenso, cul es la probabilidad de que la enfermedad, de
hecho, exista?
Siendo A1 el suceso el paciente no cree tener la enfermedad y A2 el suceso la enfermedad
existe, se nos ha dado que P[A1] = 0.75, P[A2] = 0.15 y P[A1 y A2] = 0.06. Pretendemos hallar
P[A2 | A1].
Por la Definicin 3.3.1,
P[A2 | A1] =
=
Hay un 8 % de posibilidades de que un paciente que opine que no tiene problemas de hipertensin padezca, de hecho, la enfermedad. Del mismo modo podemos preguntar: si la enfermedad existe, cul es la probabilidad de que el paciente lo sospeche? Es decir, cul es
P[A1 | A2]? Antes de aplicar la Definicin 3.3.1, organicemos los datos por medio de un
diagrama de Venn, como se muestra en la Figura 3.10. Por la Definicin 3.3.1,
P[A1 | A2] =
114
A1
0.69
0.06
0.16
0.09
A2
EJERCICIOS 3.3
1.
115
Algn da
esta instalacin
ser un
99
99 100 %
segura
Desgraciadamente
1
sta es la 100 %
que no lo ser
Planta de
energa nuclear
(? Copyright 1980. Chicago Tribune Company. Todos los derechos reservados. Reproducido con
autorizacin.)
7.
Unos estudios muestran que los ejemplares de una cierta raza de liebres de alta montaa
(liebre esquiadora) mueren antes de lo normal, aun en ausencia de depredadores o de
enfermedad conocida alguna. Dos de las causas de muerte identificadas son: baja cantidad de azcar en sangre y convulsiones. Se estima que el 7 % de los animales presenta
ambos sntomas, el 40 % tiene bajo nivel de azcar en sangre, y el 25 % sufre convulsiones, cul es el porcentaje de muertes producidas por causas que no sean las que hemos
mencionado? Cul es la probabilidad de que un animal elegido aleatoriamente que tiene
bajo nivel de azcar en sangre sufra tambin convulsiones?
116
8.
Utilizar los datos del Ejercicio 3 de la Seccin 3.2 para hallar la probabilidad de que un
granjero pida rboles para el ao que viene dado que ya ha pedido rboles en el pasado.
Hallar la probabilidad de que un granjero no efecte ningn pedido de rboles para el ao
que viene dado que ya ha adquirido rboles en el pasado. Cul es la relacin matemtica
entre las dos respuestas? Explicar por qu ha sucedido esto.
9. Utilizar los datos del Ejercicio 4 de la Seccin 3.2 para hallar la probabilidad de que un
donante seleccionado aleatoriamente sea negativo para el test del VIH. Hallar la probabilidad de que un donante seleccionado aleatoriamente sea negativo para el test del VIH
dado que da negativo en el test del herpes.
3.4.
Una de las aplicaciones ms tiles de las probabilidades en el campo mdico o biolgico est en
el rea de los tests de diagnstico. Un test de diagnstico es un test para detectar la presencia de
alguna condicin especfica en una unidad experimental. En el campo mdico, generalmente
intentamos detectar la presencia de una enfermedad, un factor gentico o alguna otra condicin
especfica en un ser humano. Sera deseable que estos tests fueran seguros en el sentido de que
siempre detectaran la condicin cuando de hecho est presente y nunca la indicaran cuando el
individuo no tiene dicha condicin. Desgraciadamente, esto no es as. Slo podemos esperar
que los tests existentes actualmente no den resultados errneos muy a menudo.
En un test de diagnstico, o bien cada sujeto es realmente positivo, lo que significa que la
condicin para la que est diseado el test est presente, o bien el sujeto en realidad es
negativo. El test, en s mismo, puede dar positivo, lo que significa que se ha detectado la
presencia de la condicin, o no darlo. Esto garantiza que cada sujeto entrar exactamente en
una de entre cuatro categoras. stas son:
1.
Obsrvese que es posible cometer dos tipos de errores. Esperamos no cometer ninguno
pero cualquiera de ellos es posible. Un test ideal es aquel en el que la probabilidad de cometer
cualquier error es pequea. A continuacin se definen estas probabilidades, llamadas coeficientes de error.
Definicin 3.4.1. Coeficiente de falsos positivos. El coeficiente de falsos positivos de un
test se denota por a (alfa) y viene dado por
a = P[el test resulta positivo | el sujeto es realmente negativo]
Definicin 3.4.2. Coeficiente de falsos negativos. El coeficiente de falsos negativos de un
test se denota por b (beta) y viene dado por
b = P[el test resulta negativo | el sujeto es realmente positivo]
117
Estado real
Condicin ausente ()
Condicin encontrada (+)
Resultados
del test
Al realizar un test para detectar una enfermedad, un error causado por un alto coeficiente
de falsos positivos puede ocasionar inconvenientes y gastos a la persona implicada. A sta se le
detecta una enfermedad que no est presente y como resultado probablemente busque un tratamiento para un problema inexistente. Un error resultante de un alto coeficiente de falsos negativos es potencialmente peligroso. En este caso, el sujeto desconoce una condicin existente y, por
lo tanto, no buscar el tratamiento que necesita. Con una tabla de frecuencias pueden hallarse las
aproximaciones de estos coeficientes mediante la tcnica descrita en el Ejemplo 3.4.1.
Ejemplo 3.4.1. El suero de una mujer embarazada puede ser analizado por medio de un
procedimiento llamado electroforesis en gel de almidn. Este procedimiento permite detectar
la presencia de una zona protenica llamada zona de embarazo, la cual se supone que es un
indicador de que el nio es una hembra. Para investigar las propiedades de este test se seleccionaron 300 mujeres para su estudio. En la Tabla 3.2 se dan los resultados del test y los sexos
de los nios nacidos. Obsrvese que, en este caso, el nico valor de la tabla predeterminado o
fijado por el experimentador es el tamao total de la muestra. Todos los otros son aleatorios,
los totales por filas, los totales por columnas y las frecuencias de las celdas. Por definicin el
coeficiente de falsos positivos es
a = P[test + | realidad ]
Para estimar esta probabilidad condicionada debemos estimar P[realidad ] y P[test + y
realidad ]. Utilizando el mtodo de la frecuencia relativa para hallar la probabilidad, P[realidad ] ^ 147/300 y P[test + y realidad ] ^ 51/300. La definicin de la probabilidad condicionada nos conduce a
aX
51/300
51
=
= 0.3469
147/300 147
Tabla 3.2
Sexo
Zona de embarazo
Presente (test +)
Ausente (test )
Varn (realidad )
Mujer (realidad +)
51 (aleatorio)
96 (aleatorio)
78 (aleatorio)
75 (aleatorio)
147 (aleatorio)
153 (aleatorio)
129 (aleatorio)
171 (aleatorio)
300 (fijo)
118
Este resultado puede obtenerse por observacin directa de la Tabla 3.2 considerando que, una
vez que sabemos que el sujeto es realmente negativo, la atencin deber centrarse inmediatamente en los 147 casos de la columna 1. De stos, 51 dieron positivo. Por tanto, el sentido
comn apunta a 51/147 como el coeficiente de falsos positivos estimado. Para calcular b,
obsrvese que de los 153 sujetos realmente positivos, 75 dieron negativo. Por lo tanto
bX
75
= 0.4902
153
Dado que son coeficientes de error estimados, el test no parece ser efectivo para determinar el
sexo de un nio. (Basado en datos registrados en Human Heredity, vol. 20, 1970, pg. 530.)
Estado real
Embarazadas (+)
No embarazadas ()
No embarazadas
(realidad )
Embarazadas
(realidad +)
5 (fijo)
5 (fijo)
1 (fido)
4 (fijo)
10 (fijo)
5 (fijo)
6 (aleatorio)
9 (aleatorio)
15 (fijo)
119
embarazada, lo est realmente, no puede aproximarse a partir de este experimento. Sin embargo,
para hallar la ltima, las cinco mujeres embarazadas seleccionadas aleatoriamente por el experimentador pueden entenderse como una muestra aleatoria de la poblacin de todas las mujeres
embarazadas. Por lo tanto, podemos utilizar el mtodo de la frecuencia relativa para encontrar que
la aproximacin de la probabilidad de que una mujer embarazada d positivo en el test es de 15.
Hemos visto que los coeficientes de falsos positivos y de falsos negativos para un test de
diagnstico pueden aproximarse a partir de una tabla con los totales de todas las filas y
columnas, los cuales pueden variar. El Ejemplo 3.4.2 muestra que tambin pueden aproximarse cuando los totales de las filas (o columnas) son fijos siempre que los totales fijos se
refieran al nmero de sujetos realmente positivos y realmente negativos del estudio.
Riesgo relativo
Algunos estudios se disean para investigar un factor que el investigador cree que puede estar
asociado con el desarrollo de una enfermedad o condicin especfica. Este factor se denomina
factor de riesgo. Para realizar el estudio se seleccionan dos muestras. Una muestra, representada mediante E, consiste en sujetos que han estado expuestos al factor de riesgo; los dems,
representados mediante E, no han estado expuestos al factor de riesgo.
En un momento dado, se clasifica cada sujeto segn tenga la enfermedad, D, o no la
tenga, D. Hay dos probabilidades condicionadas de inters. Estas son: la probabilidad de que
la enfermedad est presente dado que el sujeto estuvo expuesto al riesgo, P[D | E], y la
probabilidad de que la enfermedad est presente aunque el sujeto no estuvo expuesto al riesgo
P[D | E]. Puesto que los tamaos muestrales para los sucesos E y E son fijos, puede hacerse
un clculo aproximado de cada una de estas probabilidades utilizando la idea demostrada en
el Ejemplo 3.4.2. Puede realizarse un clculo aproximado de una medida del impacto del
factor de riesgo a partir de estas probabilidades condicionadas. Esta medida, denominada
riesgo relativo (RR), se calcula mediante:
RR X
P[D | E]
P[D | E]
Recurdese que, dado que las probabilidades utilizadas en el clculo son aproximadas, el
riesgo obtenido slo es una estimacin del riesgo relativo verdadero. Si RR = 1, significa que
no existe asociacin entre el factor de riesgo y el desarrollo de la enfermedad. Si RR > 1, se
supone que un individuo expuesto al riesgo tiene ms probabilidades de desarrollar la enfermedad que uno que no est expuesto al riesgo. Un valor de RR < 1 significa que un individuo
expuesto al riesgo es menos probable que desarrolle la enfermedad que uno no expuesto al
riesgo. El Ejemplo 3.4.3 muestra esta idea.
Ejemplo 3.4.3. Se ha realizado un estudio sobre la edad de la madre en el momento del
nacimiento de su hijo como factor de riesgo en el desarrollo del sndrome de la muerte sbita
del lactante (SMSL). Se seleccionaron para el estudio un total de 7330 mujeres que estaban
por debajo de los 25 aos en el momento del nacimiento del nio. De ellas, 29 tuvieron nios
afectados de SMSL. De las 11 256 mujeres seleccionadas para el estudio que tenan 25 aos o
ms en el momento del nacimiento de sus hijos, 15 tuvieron nios con SMSL. Estos datos se
muestran en la Tabla 3.4. Partiendo de esta tabla podemos observar que
P[D | E] =
29
7330
P[D | E] =
15
11 256
120
SMSL
Edad
Menos de 25 aos
25 aos o ms
No
29
15
7 301
11 241
7 330 (fijo)
11 256 (fijo)
P[D | E]
29/7330
=
= 2.96
P[D | E] 15/11 256
Podemos sacar la conclusin de que un nio de una madre joven (menos de 25 aos) tiene
aproximadamente 2.96 veces ms probabilidades de sufrir un SMSL que uno nacido de una
madre de ms edad. (Basado en los datos registrados por Norman Lewak, Bea van der Berg y
Bruce Beckwith, en Sudden Infant Death Syndrome Risk Factors: Prospective Data Review, Clinical Pediatrics, vol. 18, 1979, pgs. 404-411.)
Dado que se puede hacer un clculo aproximado de P[D | E] y P[D | E] a partir de los
datos de las tablas, ya que todos los totales por filas y columnas son aleatorios, puede hacerse
un clculo aproximado del riesgo relativo a partir de dichas tablas. El Ejercicio 14 de esta
seccin es un ejemplo de ello.
EJERCICIOS 3.4
1.
Clasificacin verdadera
Autoclasificacin
+
No idnticos ()
Idnticos (+)
12
130
54
4
200
121
Color
Fragancia
S
No
No
12
50
118
20
200
probabilidades. Si no fuera posible aproximar a partir de estos datos alguna probabilidad en particular, explicar por qu.
a) P[una azalea seleccionada aleatoriamente tenga olor].
b) P[una azalea seleccionada aleatoriamente tenga color].
c) P[una azalea seleccionada aleatoriamente tenga color y olor].
d) P[una azalea seleccionada aleatoriamente tenga color dado que tiene olor].
e) P[una azalea seleccionada aleatoriamente tenga olor dado que tiene color].
3. Los resultados descritos en la Tabla 3.7 se obtuvieron en un estudio diseado para
averiguar la capacidad de un cirujano anatomopatlogo para codificar correctamente
biopsias quirrgicas en malignas o benignas. Aproximar a y b a partir de estos datos.
4. Se ha realizado un estudio para poner a prueba un procedimiento de deteccin de enfermedades renales en pacientes con hipertensin. Aplicando el nuevo procedimiento, los
experimentadores detectan 137 pacientes hipertensos. A continuacin se determin de
nuevo la presencia o ausencia de enfermedad renal por otro mtodo. Los datos obtenidos se recogen en la Tabla 3.8. Utilizando estos datos, aproximar los coeficientes de
falsos positivos y de falsos negativos del test.
5. Definicin: La especificidad de un test es la probabilidad de que el resultado del test sea
negativo supuesto que el sujeto sea ciertamente negativo. Aproximar la especificidad
del test del Ejercicio 1. En general, es de desear que la especificidad de un test sea alta,
o baja? Explicarlo.
Tabla 3.7
Estado real
Informe del anatomopatlogo
+
Benigno ()
Maligno (+)
7
395
79
19
500
Tabla 3.8
Estado real
Enfermedad detectada
S (+)
No ()
Enfermedad ausente ()
23
60
44
10
137
122
Tabla 3.9
Estado real
Test EIA
+
Anticuerpos ausentes ()
1 000
98 969
30
1
100 000
123
Tabla 3.10
Estado real
Tos presente
Tos ferina
ausente ()
Tos ferina
presente (+)
83
32
116
2
S (+)
No ()
233
vity and Specifity of Clinical Case Definition of Pertussis, American Journal of Public
Health, vol. 78, nm. 7, julio de 1988, pgs. 833-835.)
14. En 1985, muchas familias estadounidenses adoptaron a nios asiticos. Algunos de
estos nios haban estado expuestos al virus de la hepatitis B y eran hipotticos transmisores del virus a otros. En un estudio del riesgo implicado, se obtuvieron los datos de la
Tabla 3.11. Los valores de las celdas representan el nmero de familiares cercanos a los
que se les ha detectado el virus y todos los totales por filas y columnas son aleatorios.
Hallar la aproximacin del riesgo relativo. (Basado en la informacin hallada en Andrew Friede et al., Transmission of Hepatitis B Virus from Adopted Asian Children to
Their American Families, American Journal of Public Health, vol. 78, nm. 1, enero
de 1988, pgs. 26-29.)
15. Se sabe que los pacientes con SIDA a menudo presentan tuberculosis. Se llev a cabo
un estudio de los factores de riesgo asociados con el desarrollo de esta enfermedad en
los pacientes. Uno de los factores considerados fue la adiccin a drogas intravenosas.
De los 1992 pacientes del estudio, 307 haban abusado de las drogas por va intravenosa. Cuarenta y seis de los pacientes tenan tuberculosis y, de ellos, 11 eran adictos a
drogas por va intravenosa. (Basado en los datos registrados en Timothy Cote et al.,
The present and the Future of AIDS and Tuberculosis in Illinois, American Journal of
Public Health, vol. 80, nm. 8, agosto de 1990, pgs. 950-953.)
a) Construir una tabla de 2 2 para visualizar estos datos.
b) Hallar e interpretar el riesgo relativo.
16. En un estudio sobre la relacin entre el uso regular de tinte para el cabello y el desarrollo de la leucemia, fueron seleccionados 577 pacientes con leucemia y 1245 personas
sin la enfermedad (controles) y fueron consultados en relacin con el uso de dicho tinte.
Cuarenta y tres pacientes y 55 controles dijeron haber estado bastante expuestos al tinte.
(Basado en la informacin hallada en Kenneth Cantor et al., Hair Dye Use and Risk of
Leukemia and Lymphoma, American Journal of Public Health, vol. 78, nm. 5, mayo
de 1988, pgs. 570-571.)
a) Completar la Tabla 3.12.
Tabla 3.11
Virus presente
Expuesto al riesgo
S
No
No
7
4
70
228
124
Leucemia presente
S
Utiliza tinte para cabello
S
No
No
43 (fijos)
55 (fijos)
577 (fijos)
1245 (fijos)
b) En este caso, es posible hallar la aproximacin del riesgo relativo usando la definicin dada en esta seccin? Explicarlo.
c) Es posible hacerse una idea de la repercusin del uso de tinte para cabello, considerando el cociente
P[E | D]
P[E | D]
donde E es el suceso de que el individuo estuvo expuesto al riesgo y D es el suceso
de que la leucemia est presente. Puede estimarse cada una de las probabilidades
condicionadas implicadas en este cociente? Si es as, evaluarlo e interpretarlo.
3.5.
INDEPENDENCIA
Pueden existir, fundamentalmente, dos relaciones entre sucesos. La primera, ser mutuamente
excluyentes, ha sido tratada en la Seccin 3.1; la segunda, ser independientes, se expone en
sta. El trmino matemtico tiene prcticamente el mismo significado que el lingstico.
Webster define objetos independientes como objetos que actan con independencia el uno
del otro. De este modo, dos sucesos son independientes si uno puede producirse con independencia del otro. Es decir, la realizacin o no realizacin de uno no tiene efecto alguno
sobre la realizacin o no del otro. En numerosos casos, podemos determinar sobre una base
puramente intuitiva, si dos sucesos son independientes. Por ejemplo, los sucesos A1, el paciente tiene sinovitis, y A2, el paciente tiene apendicitis, son intuitivamente independientes. El
hecho de que el paciente tenga apendicitis nada tiene que ver con que padezca o no sinovitis,
y viceversa.
En algunos casos, no obstante, la delimitacin no es tan evidente. Necesitamos entonces
una definicin matemtica precisa del concepto, para poder determinar sin la menor duda si
dos sucesos son, de hecho, independientes. La definicin es fcil de justificar. Por ejemplo,
supongamos que, basndonos en los sntomas descritos, podamos admitir que la probabilidad
de que un paciente tenga apendicitis sea de 0.9 (A2). Supongamos que se nos d ahora la
informacin adicional de que el paciente tiene sinovitis (A1). Cul es la probabilidad de que
el paciente tenga apendicitis? Obviamente, la respuesta sigue siendo 0.9! Dado que A1 y A2
son independientes, la nueva informacin es irrelevante y no afecta para nada a la probabilidad original. De este modo la independencia entre dos sucesos A1 y A2 implica que la probabilidad condicionada P[A1 | A2] ha de ser igual a la asignada originalmente a A2. Esta caracterizacin se adopta como definicin del trmino sucesos independientes.
Definicin 3.5.1. Sucesos independientes. Sean A1 y A2 dos sucesos tales que P[A1] | 0.
Estos sucesos son independientes si y slo si
P[A2 | A1] = P[A2]
125
Ejemplo 3.5.1. Se estima que entre la poblacin total de Estados Unidos, el 55 % padece
obesidad (A1), el 20 % es hipertenso (A2) y el 60 % es obeso o hipertenso. Es, de hecho,
independiente el que una persona sea obesa de que padezca hipertensin? La respuesta a esta
pregunta no es obvia. Haciendo uso del principio general de la adicin, se tiene
P[A1 y A2] = P[A1] + P[A2] P[A1 o A2]
En este caso
P[A1 y A2] = 0.55 + 0.20 0.60 = 0.15
As que
P[A2 | A1] =
=
P[A1 y A2]
P[A1]
0.15 15
=
= 0.27
0.55 55
Puesto que P[A2 | A1] = 0.27 | 0.20 = P[A2], puede concluirse que los sucesos no son independientes. Hablando en trminos prcticos, el hecho de que una persona tenga exceso de
peso aumenta la probabilidad de que tenga hipertensin.
Obsrvese que estamos suponiendo que las probabilidades del Ejemplo 3.5.1 se basan en
datos de la poblacin y, por lo tanto, son exactas. Aqu puede utilizarse esta Definicin 3.5.1
para probar la independencia de dos sucesos. En la prctica, esta situacin surge muy raras
veces. En cambio, habitualmente estaremos tratando con probabilidades de frecuencias relativas obtenidas de muestras extradas de la poblacin. En este caso, no puede utilizarse la
Definicin 3.5.1 para probar la independencia. No obstante, en el Captulo 12 se desarrollar
un test apropiado para las muestras.
La Definicin 3.5.1 es lgica y fcil de comprender. No obstante, no es la que normalmente se emplea para el trmino sucesos independientes. La definicin usual puede derivarse
de lo siguiente:
P[A2 | A1] =
P[A1 y A2]
es siempre cierta en tanto que P[A1] | 0
P[A1]
As que, si A1 y A2 son independientes, ambas ecuaciones se verifican simultneamente. Tenemos pues para P[A2 | A1], dos expresiones que conducen a
P[A1 y A2]
= P[A2]
P[A1]
Multiplicando ambos miembros de la ecuacin obtenida por P[A1], obtenemos: P[A1 y A2] =
= P[A1]P[A2], que es la definicin usual del trmino sucesos independientes.
Definicin 3.5.2. Sucesos independientes. Sean A1 y A2 dos sucesos. A1 y A2 son independientes si y slo si P[A1 y A2] = P[A1] P[A2].
Obsrvese que cuando los sucesos son independientes la probabilidad de que ambos ocurran simultneamente se obtiene por multiplicacin. As, como se indic en la Seccin 3.2, la
palabra y es la clave de que las probabilidades se deben multiplicar.
126
Ejemplo 3.5.2. Estudios de gentica de poblaciones indican que el 39 % de los genes que
gobiernan la informacin del factor Rh determinan que ste sea negativo. Basndose en ello,
cul es la probabilidad de que un individuo seleccionado aleatoriamente tenga Rh negativo?
El factor Rh negativo se presenta si, y slo si, el individuo implicado posee dos genes determinativos de informacin negativa. Dado que cada gen se hereda de uno de los padres, puede
suponerse que el tipo de cada uno de los genes es independiente del otro. Por lo tanto, la
probabilidad de que un individuo tenga dos genes negativos es (0.39)(0.39) X 0.15. (Basado
en la informacin de William Keeton y Carol McFadden, Elements of Biological Science,
W.W. Norton, Nueva York, 1983.)
La Definicin 3.5.2 debe utilizarse con cuidado. Se debe estar seguro de que es razonable
suponer que los sucesos son independientes antes de aplicar la definicin para calcular la
probabilidad de que se produzca una serie de sucesos. En el Ejemplo 3.5.4 se ilustra el peligro
de una independencia errneamente supuesta.
0.1
0.9
0.1
0.9
0.9
0.01
C*
0.9
0.1
0.9
0.1
0.9
E*
C
E*
C
0.9
E
0.1
0.1
127
Ejemplo 3.5.4. Un estudio del Comit de Energa Atmica, WASH 1400, inform de que
la probabilidad de que se produzca un accidente nuclear, parecido al que ocurri en Three
Mile Island en marzo de 1978, es de 1 en 10 millones. No obstante, el accidente se produjo.
Segn Mark Stephens, la metodologa del WASH 1400 utiliz rboles de sucesos, secuencias de acciones que eran necesarias para que se produjera el accidente. Estos rboles de
sucesos no suponan ninguna interrelacin entre sucesos, que podan haber sido causados por
el mismo error de juicio o como parte de la misma accin equivocada. Los profesionales de la
estadstica que asignaron las probabilidades al proyecto WASH 1400 dijeron, por ejemplo,
que exista un riesgo del 1 por 1000 de que una de las vlvulas auxiliares de control de entrada
de agua (de las doce) estuviera cerrada. Y si existe una probabilidad de que dos vlvulas estn
cerradas, es una milsima parte de sta, es decir, de una en un milln. Pero las doce fueron
cerradas por la misma persona el 26 de marzo y una nunca fue cerrada con la otra. Los
sucesos A1: la primera vlvula est cerrada, y A2: la segunda vlvula est cerrada, no eran
independientes. Sin embargo, fueron tratados como tales al calcular la probabilidad de un
accidente. Esto, entre otras cosas, llev a una subestimacin del potencial de accidentalidad
(de Three Mile Island de Mark Stephens, Random House, 1980).
EJERCICIOS 3.5
1. Cules de los siguientes pares de sucesos cree usted que son independientes? Cules
son mutuamente excluyentes?
A1: Una madre padece rubola durante los tres primeros meses de embarazo.
B1: Un hijo nace muerto o deforme.
A2: Un hombre es estril.
B2: Un hombre padece parotiditis en la edad adulta.
A3: Una rata hembra y una rata macho son enjauladas juntas.
B3: La rata hembra es estril.
A4: Un nio es miope.
B4: Un nio es hipermtrope.
A5: Un terreno ha sido drenado.
B5: El terreno experimenta frecuentes inundaciones.
A6: Un conejo es inoculado con virus de poliomielitis.
B6: La sangre del conejo contiene anticuerpos de poliomielitis.
A7: Un conejo es inoculado con virus de poliomielitis.
B7: La sangre del conejo contiene anticuerpos de sarampin.
2. Argumentar, de forma intuitiva, que si dos sucesos que no son imposibles son mutuamente excluyentes, no pueden ser independientes. Probarlo matemticamente. Sugerencia: demostrar que, con estas condiciones, no se puede satisfacer la Definicin 3.5.2.
3. Los contaminantes ms comunes de las aguas son de origen orgnico. Puesto que la
mayor parte de los materiales orgnicos se descompone por accin de bacterias que
requieren oxgeno, un exceso de materia orgnica puede significar una disminucin en
la cantidad de oxgeno disponible. Ello afecta eventualmente a otros organismos presentes en el agua. La demanda de oxgeno por parte de una bacteria se llama demanda
biolgica de oxgeno (DBO). Un estudio de las corrientes acuticas que circulan en las
proximidades de un complejo industrial revela que el 35 % tiene una alta DBO, el 10 %
muestra una acidez elevada y un 4 % presenta ambas caractersticas. Son independientes los sucesos la corriente tiene una alta DBO y la corriente posee una acidez
elevada? Calcular la probabilidad de que la corriente tenga una acidez elevada, dado
que presenta una alta DBO.
4. El 50 % de la poblacin aproximadamente corresponde a varones, el 68 % bebe con
cierto exceso, y el 38.5 % bebe y es varn. Dado que una determinada persona aleatoria-
128
5.
6.
7.
8.
9.
129
Tabla 3.13
Tipo de apareamiento
10.
11.
12.
13.
14.
3.6.
Probabilidad
de
cruzamiento
Varn
Mujer
AA
AA
AA
Aa
1
4
1
4
1
4
1
2
AA
Aa
Aa
Aa
aa
aa
aa
aa
AA
Aa
aa
AA
Aa
aa
1
4
1
4
Genotipo
filial
posible
Genotipo
filial
probable
Probabilidad
de la
trayectoria
AA
AA
Aa
Aa
1
16
1
16
1
16
1
16
1
2
1
2
Podemos ahora calcular P[A1 y A2], si los sucesos son independientes. Adems, si la informacin de que disponemos lo permite, es posible hacerlo mediante la regla general de la adicin.
130
Existe algn otro procedimiento para hallar la probabilidad de que dos sucesos se produzcan
simultneamente, si stos no son independientes? La respuesta es afirmativa, y el mtodo
utilizado es fcil de deducir. Sabemos que
P[A2 | A1] =
P[A1 y A2]
P[A1]
regla de la multiplicacin
131
Puesto que el genotipo de la madre no tiene efecto sobre el padre o sobre su capacidad de
transferir un gen positivo al nio, A3 es independiente de A1 y A2. Por el Ejemplo 3.5.2
sabemos que P[A3] ^ 0.15. As pues, por la definicin de independencia,
P[(A1 y A2) y A3] X 0.24(0.15) = 0.0360
Existen otras formas de que est presente la condicin. El Ejercicio 1 lo seala y permite
calcular la probabilidad de que un nio contraiga el problema de cualquier procedencia.
EJERCICIOS 3.6
1.
2.
3.
4.
5.
6.
Un nio tendr eritroblastosis fetal si la madre es Rh negativo y el padre es homocigoto Rh positivo (++). Utilizar la informacin del Ejercicio 10 de la Seccin 3.5 para
hallar la probabilidad de que esto ocurra. Determinar la probabilidad de que un nio
seleccionado aleatoriamente tenga la condicin, combinando este resultado con el
obtenido en el Ejemplo 3.6.2.
Ciertos estudios indican que el 82 % de los profesionales varones bebe. De los que
beben, el 18 % corresponde a grandes bebedores. Cul es la probabilidad de que,
seleccionando aleatoriamente a un profesional, beba y sea un gran bebedor?
De todos los pacientes de cncer, en el 52 % son mujeres. El 40 % de los pacientes
sobrevive al menos cinco aos desde el momento del diagnstico. No obstante, esta
tasa de supervivencia es vlida solamente para el 35 % de las mujeres. Cul es la
probabilidad de que un paciente de cncer seleccionado aleatoriamente sea mujer y
sobreviva, al menos, cinco aos?
La probabilidad de que una unidad de sangre proceda de un donante remunerado es
0.67. Si el donante es remunerado, la probabilidad de que la unidad contenga el suero
de la hepatitis es 0.0144. Si el donante es desinteresado, esta probabilidad es 0.0012.
Un paciente recibe una unidad de sangre. Cul es la probabilidad de que contraiga
hepatitis como consecuencia de ello?
El 2 % de la poblacin en general padece diabetes. De ellos, solamente la mitad lo
sabe. Si se selecciona aleatoriamente a un individuo. Cul es la probabilidad de que
padezca diabetes pero no sea consciente de padecerla?
Se sabe que el coeficiente de falsos positivos de un test para una determinada enfermedad es del 4 % y que el coeficiente de falsos negativos es del 6 %. El test muestra que el 15 % de las personas da positivo. Cul es la probabilidad de que un individuo aleatoriamente seleccionado tenga efectivamente la enfermedad? Sugerencia:
Sea x = P[realmente positivo] y 1 x = P[realmente negativo]. Obsrvese que
P[test positivo] = P[test positivo y realmente positivo]
+ P[test positivo y realmente negativo]
7.
8.
En la replicacin del DNA, a veces se presentan errores que pueden dar lugar a mutaciones observables en el organismo. En ocasiones, tales errores estn inducidos qumicamente. Se expone un cultivo de bacterias a la presencia de un producto qumico
que tiene un 0.4 de probabilidad de inducir a error. Sin embargo, el 65 % de los errores
es silencioso, en el sentido de que no dan lugar a una mutacin observable. Cul es
la probabilidad de que se observe una colonia mutada? Sugerencia: Hallar P[error y
observable].
En la ciencia es importante la capacidad de observar y recordar datos. Desgraciadamente, el poder de la sugestin puede distorsionar la memoria. Se realiz un estudio
132
sobre los recuerdos: a los sujetos se les muestra una pelcula en la que un coche pasa
por una carretera. En la pelcula no sale ningn granero. A continuacin, se les formula una serie de preguntas relacionadas con la pelcula a los sujetos. A la mitad se les
pregunt: Con qu velocidad se mueve el coche cuando pasa por el granero? A la
otra mitad de los sujetos no se les hizo esta pregunta. Ms tarde, se le pregunt a cada
uno de ellos: Sale algn granero en la pelcula? Entre los que se les formul la
primera pregunta concerniente al granero, el 17 % respondi s; slo el 3 % de los
restantes respondi s. Cul es la probabilidad de que un participante en este estudio, seleccionado aleatoriamente, haya dicho ver el granero inexistente? Decir que
se ha visto el granero es independiente de que se le haya formulado la primera pregunta sobre el mismo? Sugerencia:
P[s] = P[s y se le ha preguntado acerca del granero]
+ P[s y no se le ha preguntado acerca del granero]
(Basado en un estudio registrado en McGraw-Hill Yearbook of Science and Technology, 1981, pgs. 249-251.)
9. Mtodo aleatorizado de respuesta para obtener respuestas honestas a preguntas comprometidas. Es un mtodo que se utiliza para garantizar que un individuo que responde a cuestiones comprometidas mantenga el anonimato, animndole as a dar una
respuesta verdadera. Funciona de la forma siguiente: se plantean dos preguntas A y B,
una de las cuales es referente a temas comprometidos y la otra no. Debe conocerse la
probabilidad de recibir un s como respuesta a la pregunta no comprometida. Por
ejemplo, se podra preguntar
A: Su nmero de la Seguridad Social termina en un dgito impar? (No comprometida)
B: Alguna vez ha cursado intencionadamente una reclamacin de seguro fraudulenta? (Comprometida)
Sabemos que P[responde s | ha respondido a A] = 12. Deseamos hallar la aproximacin
de P[responde s | ha respondido a B]. Se le pide al sujeto que tire una moneda y
responda a A si en la moneda sale cara y a B si sale cruz. De esta forma, el entrevistador
no sabe a qu pregunta est respondiendo el sujeto. As, una respuesta afirmativa no es
incriminativa. No existe forma alguna de que el entrevistador sepa si el sujeto est
diciendo S, mi nmero de la Seguridad Social termina en un dgito impar o S, he
cursado intencionadamente una reclamacin fraudulenta. El porcentaje de sujetos del
grupo de individuos que han respondido s, se utiliza para calcular P[responde s].
a) Utilizar el hecho de que el suceso responde s es el suceso responde s y ha
respondido a A o responde s y ha respondido a B para demostrar que P[responde s | ha respondido a B] es igual a
P[responde s] P[responde s | ha respondido a A] P[ha respondido a A]
P[ha respondido a B]
b) Si se prueba esta tcnica en 100 sujetos y 60 responden s, hallar la probabilidad
aproximada de que una persona del grupo, seleccionada aleatoriamente, haya cursado intencionalmente una reclamacin fraudulenta.
10. En un estudio sobre estudiantes de bachillerato, a cada sujeto se le pide que tire un dado
y luego una moneda. Si en la moneda sale cara, el sujeto debe responder a la pregunta A,
de lo contrario, a la pregunta B.
133
TEOREMA DE BAYES
El objeto de esta seccin es el teorema formulado por el reverendo Thomas Bayes (1761).
Est relacionado con la probabilidad condicionada. El teorema de Bayes se utiliza para hallar
P[A | B] cuando la informacin de que se dispone no es directamente compatible con la que se
requera en la Definicin 3.3.1. Es decir, se utiliza para hallar P[A | B] cuando P[A y B] y P[B]
no se conocen de inmediato.
Los problemas de Bayes pueden resolverse con la ayuda de un diagrama de rbol. Ilustraremos la idea antes de formular formalmente el teorema.
Ejemplo 3.7.1. Se ha desarrollado un procedimiento para detectar un tipo particular de
artritis en individuos de alrededor de cincuenta aos de edad. A partir de una investigacin
realizada a nivel nacional, se sabe que, aproximadamente, el 10 % de los individuos de esta
edad sufre esta forma de artritis. Se aplica el procedimiento propuesto a individuos con enfermedad artrtica confirmada, y su resultado es correcto en el 85 % de los casos. Cuando el
procedimiento se pone a prueba con individuos de la misma edad que, se sabe, estn libres de
la enfermedad, se obtiene un coeficiente de falsos positivos del 4 %.
Para que este test sea utilizado como detector de la artritis es necesario que sea un fuerte
indicador de que la enfermedad est presente. Sea D el suceso que denote la presencia de la
enfermedad y T+ el suceso que alude al resultado positivo para el test. Pretendemos hallar
P[D | T+] y que sea alta. Puesto que esta probabilidad es condicionada, lo primero que se nos
ocurrira hacer sera aplicar la Definicin 3.3.1. Sin embargo, no tenemos P[D y T+], la
probabilidad de que exista la enfermedad y el test d positivo, ni tampoco P[T+], la probabilidad de resultado positivo para el test. As que la Definicin 3.3.1 no puede emplearse directamente; se necesita otro mtodo para calcular la probabilidad deseada.
Para resolver el problema, obsrvese que se dan las probabilidades (T denota el hecho de
que el resultado del test sea negativo):
P[D] = 0.10
P[D] = 0.90
P[T+ | D] = 0.85
P[T | D] = 0.15
P[T+ | D] = 0.04
P[T | D] = 0.96
Dado que conocemos P[D] y P[D], empezamos el rbol enumerando estos sucesos junto
con sus probabilidades correspondientes. Si la enfermedad est presente, podemos asignar
Probabilidad de la trayectoria
0.85
T+
0.15
0.04
T+
0.96
D
0.1
0.9
D
134
probabilidades de 0.85 y 0.15 a los sucesos T+, el resultado del test es positivo, y T, el
resultado del test es negativo, respectivamente. Si la enfermedad no est presente, estas probabilidades condicionadas son, respectivamente, 0.04 y 0.96. Todas estas probabilidades se
muestran en la Figura 3.12. Obsrvese que la probabilidad de la primera trayectoria es P[D]
P[T+ | D] lo que, mediante la regla de la multiplicacin, nos da P[D y T+].
Para hallar P[D | T+], el coeficiente predictivo positivo, aplicamos la Definicin 3.3.1
para obtener
P[D y T+]
P[T+]
P[D | T+] =
En el rbol, vemos que P[D y T+] = 0.085. El suceso T+ se representa mediante las trayectorias 1 y 3, y, por lo tanto, P[T+] = 0.085 + 0.036 = 0.121. Mediante sustitucin obtendremos
0.085
= 0.70
0.121
P[D | T+] =
P[Aj y B]
P[B]
P[B | Aj]P[Aj]
n
; P[B | Ai]P[Ai]
i=1
135
Ejemplo 3.7.2. En el Ejemplo 3.7.1, hemos calculado P[D | T+], donde D es el suceso que
significa tenga artritis y T+ es el suceso representativo del hecho de que el test sea positivo.
Los sucesos D y D forman una particin de S. (Un individuo o tiene o no tiene artritis.) El
suceso T+ tiene asociada una probabilidad distinta de cero. Se nos da
P[D] = 0.10
P[D] = 0.90
P[T+ | D] = 0.85
P[T | D] = 0.15
P[T+ | D] = 0.04
P[T | D] = 0.96
P[T+ | D]P[D]
P[T] | D]P[D] + P[T+ | D]P[D]
(0.85)(0.10)
X 0.70
(0.85)(0.10) + (0.04)(0.90)
Obsrvese que el resultado es el mismo que el obtenido por medio del diagrama de rbol.
El Ejemplo 3.7.3 nos muestra el manejo del teorema de Bayes cuando S est dividido por
una particin de ms de dos sucesos.
Ejemplo 3.7.3. Se cree que la distribucin de los grupos sanguneos en Estados Unidos en
la Segunda Guerra Mundial era: tipo A, 41 %; tipo B, 9 %; tipo AB, 4 %; y tipo 0, 46 %. Se
estima que en esa poca, el 4 % de las personas pertenecientes al tipo 0 fue clasificado como
del tipo A; el 88 % de los del tipo A fue correctamente clasificado; el 4 % de los del tipo B se
clasific como del tipo A, y el 10 % de los del tipo AB fue, igualmente, clasificado como del
tipo A. Un soldado fue herido y conducido a la enfermera. Se le clasific como del tipo A.
Cul es la probabilidad de que tal grupo sea ciertamente el suyo?
Sean los sucesos:
A1:
A2:
A3:
A4:
B:
Es
Es
Es
Es
Es
del tipo A.
del tipo B.
del tipo AB.
del tipo 0.
clasificado como del tipo A.
=
=
=
=
0.41
0.09
0.04
0.46
P[B
P[B
P[B
P[B
| A1]
| A2]
| A3]
| A4]
=
=
=
=
0.88
0.04
0.10
0.04
En la Figura 3.13 se muestra el diagrama de rbol utilizado para responder a esta pregunta. Obsrvese que, segn la Definicin 3.3.1, P[A1 | B] = P[A1 y B]/P[B]. El numerador
de esta probabilidad es la probabilidad de la trayectoria 1, es decir, 0.3608. El denominador
es la suma de las probabilidades de las trayectorias 1, 3, 5 y 7, es decir, 0.3868. Por tanto,
P[A1 | B] = 0.3608/0.3868 X 0.93. Por el teorema de Bayes,
P[A1 | B] =
P[B | A1]P[A1]
4
; P[B | Ai]P[Ai]
i=1
(0.88)(0.41)
(0.88)(0.41) + (0.04)(0.09) + (0.10)(0.04) + (0.04)(0.46)
X 0.93
136
0.12
0.04
0.96
0.10
0.90
0.04
0.96
A1
0.41
0.09
A2
0.04
(0.04) (0.10) = 0.004 = P[A3 y B]
A3
0.46
A4
Figura 3.13. P[A1 y B] = 0.3608; P[B] = 0.3608 + 0.0036 + 0.004 + 0.0184 = 0.3868; P[A1 | B] =
= 0.3608/0.3868 X 0.93
EJERCICIOS 3.7
1.
Las estadsticas indican que en Estados Unidos la probabilidad de que una madre muera
durante el parto es 0.00022. Si no es de raza negra, la probabilidad de muerte es 0.00017,
mientras que si lo es, esta probabilidad aumenta a 0.00064. Supongamos que el 10 % de
los partos corresponde a mujeres negras.
a) Dibujar un diagrama de rbol describiendo las probabilidades dadas, y hallar las probabilidades correspondientes a las trayectorias en cada uno de los cuatro casos. (Sea D
el suceso que denota que la madre muere y B el que alude a que es de raza negra.)
b) Utilizar el rbol del apartado a para calcular la probabilidad de que una madre que
muere en el parto sea de raza negra.
c) Haciendo uso del teorema de Bayes, hallar la probabilidad de que una madre que muere
en el parto sea de raza negra, y comparar el resultado con el obtenido en el apartado b.
2. Un test diseado para diagnosticar el cncer de cuello uterino tiene un coeficiente de
falsos negativos y falsos positivos de 0.05, cada uno. De una cierta poblacin de mujeres,
el 4 % est afectado por este tipo de cncer. Cul es la probabilidad de que una mujer de
la poblacin elegida aleatoriamente tenga cncer de cuello uterino, dado que su resultado
con el test es positivo?
3. Un paciente de cncer est siendo tratado con una combinacin de tres frmacos. Se
observa que, cuando se utilizan simultneamente, a menudo dos de los tres frmacos se
inhibirn de forma que, de hecho, slo uno ser activo frente al tumor. Suponga que
cuando esto ocurra, la probabilidad de que el frmaco A acte solo es la misma que la del
frmaco B y la del C, es decir 13. La efectividad de cada frmaco, con respecto a producir
137
A2
An
A1
A2 y B
A1 y B
An y B
B (sombreado)
138