Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A03 PDF
A03 PDF
Teoría de probabilidades
y resolución de problemas
Diagramas de Venn
Antes de comenzar a desarrollar las reglas básicas que rigen el comportamiento de las proba-
bilidades, presentaremos un diagrama que resulta útil para organizar las probabilidades. El
diagrama, llamado diagrama de Venn, se denomina así en honor de John Venn (1834-1923).
En este diagrama representamos el conjunto de posibilidades para un experimento mediante
un rectángulo. A este conjunto le llamamos espacio muestral y lo representamos con la letra
mayúscula S (Fig. 3.1a). Un suceso de interés se representa mediante una curva cerrada
dentro del rectángulo y se indica mediante una letra mayúscula distinta de S. En la Figu-
ra 3.1b se ha representado el suceso A. El suceso «que no se produzca A», se indica mediante
Añ y se representa en la región del rectángulo que queda fuera de A (Fig. 3.1c). El suceso Añ se
denomina suceso complementario de A. Cuando dos sucesos A1 y A2 están relacionados en el
mismo experimento, dividen el rectángulo en cuatro áreas separadas. Cada área representa
una forma exclusiva de combinar los dos sucesos. Éstas se muestran en la Figura 3.1d a g. En
el ejemplo, ilustraremos esta idea.
Ejemplo 3.1.1. Se diseña un estudio para investigar el peso y el hábito de fumar de los
pacientes con hipertensión. Aquí S representa a todos los pacientes con hipertensión. Esta-
blezcamos que A1 representa a los pacientes con sobrepeso y A2 a los fumadores. La Figu-
ra 3.1d representa a los pacientes con sobrepeso que no fuman; la Figura 3.1e representa a los
101
102 Estadística para Biología y Ciencias de la Salud
S S S
A A
S S S
A1 A2 A1 A2 A1
A2
S
A1 A2
(g)
Figura 3.1. (a) El espacio muestral se representa mediante un rectángulo; (b) el suceso A se repre-
senta mediante una curva cerrada dentro del rectángulo; (c) el suceso Añ es el suceso de que A no
ocurra; (d) ocurre A1 pero no A2; (e) ocurre A2 pero no A1; (f ) ocurren tanto A1 como A2; (g) no ocurre
ni A1 ni A2.
que fuman pero que no tienen sobrepeso. La Figura 3.1f muestra a los pacientes con sobrepe-
so y fumadores, mientras que los que ni fuman ni tienen sobrepeso están representados en la
Figura 3.1g.
La palabra castellana «o» tiene dos significados diferentes. Cuando se utiliza con sentido
de inclusión, significa «lo uno o lo otro» o «quizá ambos»; en el sentido de exclusión signifi-
ca «o uno u otro» pero no «ambos». En este texto, la palabra «o» se utiliza en sentido de
inclusión, salvo que se especifique lo contrario. Por ejemplo, si decimos que un paciente que
sufre hipertensión tiene sobrepeso o fuma, queremos decir que el paciente presenta, al menos,
una de estas características. Él o ella tiene (1) sobrepeso pero no fuma o (2) fuma pero no
tiene sobrepeso o (3) fuma y tiene sobrepeso. En la Figura 3.2 se muestra el diagrama de
Venn para los sucesos A1 o A2.
Axiomas de probabilidad
Todos los
pacientes con
Todos los
sobrepeso
pacientes
que fuman
Para sentar las bases de los teoremas básicos de resolución de los problemas de este
capítulo se utilizan tres axiomas. Son los siguientes:
Axiomas de probabilidad
1. Sea S el espacio muestral de un experimento. Entonces P[S] = 1.
2. P[A] n 0 para todo suceso A.
3. Sea A1, A2, A3, ... un conjunto finito o infinito de sucesos mutuamente excluyentes.
Entonces P[A1 o A2 o A3 o ñ] = P[A1] + P[A2] + P[A3] + ñ.
El Axioma 1 alude a un hecho que a la mayoría de las personas le parecerá obvio, es decir,
la probabilidad asignada al suceso seguro, al suceso cierto, es 1. El Axioma 2 afirma que la
probabilidad nunca puede ser negativa. El Axioma 3 garantiza que cuando se tiene una serie
de sucesos mutuamente excluyentes, la probabilidad de que ocurra uno u otro de los sucesos
puede calcularse sumando las probabilidades individuales. Estos axiomas conducen fácil-
mente al Teorema 3.1.1.
Teorema 3.1.1. P[®] = 0.
El teorema establece que la probabilidad asociada al suceso «imposible», ®, es 0. Puesto
que el suceso imposible corresponde al suceso físico que no puede ocurrir, recurriremos a
nuestros axiomas para asignar a tales sucesos la probabilidad 0. Por ejemplo, consideremos el
experimento consistente en tirar un único dado corriente de seis caras. Las caras del dado
contienen los números del 1 al 6. Si preguntamos cuál es la probabilidad de obtener 8 en una
A1
A1 A3
A2
A2
An
(a) (b)
Figura 3.3. (a) Los sucesos A1 y A2 son mutuamente excluyentes. Si ocurre uno, el otro es imposi-
ble. (b) Un conjunto de n sucesos mutuamente excluyentes.
104 Estadística para Biología y Ciencias de la Salud
Ejemplo 3.1.2. La distribución de tipos de sangre en Estados Unidos entre los individuos
de raza blanca es aproximadamente la siguiente:
A: 40 % AB: 4 %
B: 11 % O: 45 %
Tras un accidente de automóvil, un individuo de raza blanca es conducido a una clínica de
urgencia. Se le hace un análisis de sangre para establecer el grupo al que pertenece. ¿Cuál es
la probabilidad de que sea del tipo A, o del B, o del AB? Para hallar la probabilidad deseada se
puede utilizar el Axioma 3. Vamos a denominar A1, A2 y A3 a los sucesos relativos a que el
paciente sea del grupo sanguíneo A, B y AB, respectivamente. Vamos a calcular P[A1 o A2
o A3]. Dado que es imposible que un individuo tenga dos grupos sanguíneos diferentes, estos
sucesos son mutuamente excluyentes. Por el Axioma 3,
P[A1 o A2 o A3] = P[A1] + P[A2] + P[A3]
= 0.40 + 0.11 + 0.04
= 0.55
Hay un 55 % de posibilidades de que el paciente tenga uno de los tres grupos sanguíneos
mencionados. (Basado en la información del Technical Manual, American Association of
Blood Banks, 1985.)
Obsérvese que este teorema proporciona una forma de hallar la probabilidad del suceso com-
plementario del suceso A.
EJERCICIOS 3.1
1. Sea L el suceso que un paciente tiene leucemia y W el suceso que el recuento de leucoci-
tos es alto. Considérense los diagramas de Venn de la Figura 3.4. Describir, en cada
caso, los pacientes representados por la región sombreada.
2. Sea H el suceso que un árbol está situado en un lugar muy alto y G el suceso que el
crecimiento de los árboles es deficiente. Considérense los diagramas de Venn de la
Figura 3.5. Describir, en cada caso, los árboles representados por la región sombreada.
3. En un estudio de vacunación realizado con niños en edad preescolar, el interés se centró
en las vacunas contra la parotiditis y contra el sarampión. P representa el suceso de
Teoría de probabilidades y resolución de problemas 105
L W L W
(a) (b)
L W L W
(c) (d)
Figura 3.4
que un niño haya recibido la vacuna contra la parotiditis y M el suceso de que un niño
haya recibido la vacuna contra el sarampión.
a) Describir a los niños del suceso P y M.
b) Dibujar un diagrama de Venn para representar al conjunto de niños que han recibi-
do la vacuna contra el sarampión, pero no la vacuna contra la parotiditis.
c) Dibujar un diagrama de Venn para representar al conjunto de niños que no han
recibido ninguna vacuna.
H G H G
(a) (b)
H G H G
(c) (d)
Figura 3.5
106 Estadística para Biología y Ciencias de la Salud
d) Dibujar un diagrama de Venn para representar al conjunto de niños que han recibi-
do la vacuna contra la parotiditis o contra el sarampión.
e) Dibujar un diagrama de Venn para representar al conjunto de niños que han recibi-
do la vacuna contra la parotiditis o el sarampión, pero que no han recibido ambas.
4. En un estudio sobre el efecto que produce el dióxido de azufre en los árboles a lo largo
de las autopistas principales de los Smokies, se han identificado dos sucesos. Estos son:
L, el árbol tiene las hojas dañadas, y T, el árbol ha crecido poco.
a) Dibujar un diagrama de Venn para representar el conjunto de árboles que no han
crecido poco.
b) Dibujar un diagrama de Venn para representar el conjunto de árboles que han creci-
do poco, pero que no tienen las hojas dañadas.
c) Dibujar un diagrama de Venn para representar el conjunto de árboles que no pre-
sentan ninguna de estas características.
d) Dibujar un diagrama de Venn para representar el conjunto de árboles que han creci-
do poco o que tienen las hojas dañadas.
e) Dibujar un diagrama de Venn para representar el conjunto de árboles que han creci-
do poco o que tienen las hojas dañadas, pero que no tienen ambos problemas.
5. ¿Cuáles de los siguientes pares de sucesos son mutuamente excluyentes?
a) A: El hijo de Jane tiene hemofilia.
B: La hija de Jane es portadora de hemofilia.
b) A: El 65 % de las semillas de guisante que han sido plantadas germinará.
B: El 50 % de las semillas de guisante que han sido plantadas no llegará a germinar.
c) A: José sufre hipotermia.
B: La temperatura de José es de 39 °C.
d) A: El pH de una muestra de superficie de terreno es igual a 7.0.
B: La muestra de superficie de terreno es alcalina.
e) A: Un paciente tiene SIDA.
B: El paciente ha recibido una transfusión de sangre.
f ) A: El animal es un mamífero.
B: El animal es un delfín.
C: El animal está cubierto de pelo.
g) A: El árbol es de hoja perenne.
B: El árbol es un encino.
C: El árbol es un cornejo.
h) A: El bosque es una extensión virgen.
B: El bosque fue talado hace 10 años.
6. Tratando a bebés prematuros, la cantidad de oxígeno recibido puede afectar a su vi-
sión. Se puede categorizar a cada niño tratado como de visión normal, de lesión me-
dia, de lesión moderada, de lesión grave o ciego. Un estudio muestra que la probabili-
dad de que ocurra cada uno de estos sucesos es de 0.80, 0.10, 0.06, 0.02 y 0.02,
respectivamente.
a) Determinar la probabilidad de que un niño nazca con visión defectuosa.
b) Determinar la probabilidad de que un niño nazca con visión normal.
7. Un determinado análisis químico tiene un alcance más bien limitado. Generalmente, el
15 % de las muestras están demasiado concentradas para que puedan contrastarse sin
llevar a cabo una dilución previa, el 20 % están contaminadas con algún material obsta-
culizante que deberá ser eliminado antes de llevar a cabo el análisis. El resto puede ser
analizado sin pretratamiento. Supongamos que las muestras no están en ningún caso
concentradas y contaminadas a la vez. ¿Cuál es la probabilidad de que una muestra
seleccionada aleatoriamente pueda ser contrastada sin pretratamiento?
Teoría de probabilidades y resolución de problemas 107
0: 49 % B: 20 %
A: 27 % AB: 4 %
Si se lleva a una mujer de raza negra a una clínica de urgencias, ¿cuál es la probabilidad
de que sea del tipo A, B o AB? (Basado en la información de Technical Manual, Ameri-
can Association of Blood Banks, 1985.)
13. Demostrar el Teorema 3.1.1. Sugerencia: Obsérvese que S = S o ® y que S y ® son
mutuamente excluyentes. Aplicar los Axiomas 3 y 1.
14. Demostrar el Teorema 3.1.2. Sugerencia: Obsérvese que S = A o Añ y que A y Añ son
mutuamente excluyentes. Aplicar los Axiomas 1 y 3.
15. Sean A y B dos sucesos tales que A está contenido en B (véase la Fig. 3.6). Obsérvese que
B = A o (B pero NO A)
P[A] m P[B]
108 Estadística para Biología y Ciencias de la Salud
En la Sección 3.1, vimos cómo tratar cuestiones relativas a la probabilidad de que se produzca
uno u otro de dos sucesos mutuamente excluyentes. En esta sección, vamos a examinar la
regla general de la adición. Su propósito es permitir el manejo del caso más general, calcular
la probabilidad de que ocurra al menos uno de dos sucesos que no es necesario que sean
mutuamente excluyentes.
Comenzaremos por observar el diagrama de Venn de la Figura 3.7. Obsérvese que A1 y A2
no son mutuamente excluyentes. Por tanto, la región sombreada no es una región vacía. Si
calculamos P[A1 o A2] como en la Sección 3.1, concluiremos que
No obstante, dado que la región sombreada está contenida en A1 y A2, incluimos P[A1 y A2]
dos veces en el cálculo anterior. Para corregirlo, debemos restar P[A1 y A2] del miembro de la
derecha de la ecuación. La expresión resultante es la regla general de la adición.
Teorema 3.2.1. Regla general de la adición. Sean los sucesos A1 y A2. Entonces
A1 A2
Teoría de probabilidades y resolución de problemas 109
dad aparece la palabra o, la adición está casi siempre involucrada. En las Secciones 3.5 y 3.6
se verá que la palabra «y» es un indicativo de que se multiplicarán los números para resolver
el problema de que se trate. El empleo de esta regla se explica en el Ejemplo 3.2.1.
Ejemplo 3.2.1. Se estima que el 30 % de los habitantes de Estados Unidos son obesos (A1)
y que el 3 % sufre diabetes (A2). El 2 % es obeso y padece de diabetes. ¿Cuál es la probabili-
dad de que una persona aleatoriamente elegida sea obesa o sufra diabetes? Se nos da
P[A1] = 0.3, P[A2] = 0.03 y P[A1 y A2] = 0.02. Hemos de hallar P[A1 o A2]. Aplicando la regla
general de la adición, obtenemos:
La regla general de la adición no sólo es útil para calcular P[A1 o A2], sino que, disponien-
do de la información adecuada, podemos utilizarla para hallar P[A1 y A2]. El Ejemplo 3.2.2
ilustra cómo se hace.
Ejemplo 3.2.2. Se sabe por informes recientes que el 18 % de los estudiantes de segunda
enseñanza sufre depresión en algún período de su escolarización (A1), que el 2 % piensa en el
suicidio (A2) y que el 19 % padece depresión o piensa en el suicidio. ¿Cuál es la probabilidad
de que un estudiante de secundaria elegido aleatoriamente sufra depresión y piense en el
suicidio? ¿Cuál es la probabilidad de que un estudiante de secundaria elegido aleatoriamente
sufra depresión pero no piense en el suicidio?
Sabemos que P[A1] = 0.18, P[A2] = 0.02 y P[A1 o A2] = 0.19. Hemos de hallar, primero,
P[Al y A2]. Aplicando la regla general de la adición, obtenemos
Para resolver la segunda cuestión propuesta, utilizamos la información dada por el diagra-
ma de Venn. Puesto que P[A1 y A2] = 0.01, sabemos que el 1 % del área total del diagrama
corresponde a la región representada por Al y A2, como muestra la Figura 3.8a. Puesto que
P[A1] = 0.18, del área total, el 18 % corresponde a la región marcada por A1; dado que (A1 y
A2) está contenido en A1, el 17 % del área corresponde a la región sombreada de la Figu-
ra 3.8b. Análogamente, puesto que P[A2] = 0.02 y (A1 y A2) está contenido en A2, el 1 % del
área corresponde a la región sombreada de la Figura 3.8c. Ya que P[S] = 1 y que tenemos ya
contabilizado el 17 + 1 + 1 = 19 % del área, el 81 % restante corresponde a la región sin
sombrear de la Figura 3.8d. Ahora podemos resolver la segunda cuestión buscando la región
apropiada en el diagrama de Venn, es decir, A1 y Añ2. Puede verse que la probabilidad asociada
a esta región es 0.17. Por lo tanto, la probabilidad de que un estudiante de segunda enseñanza
sufra depresión pero no haya pensado en el suicidio es 0.17.
Obsérvese que, si los porcentajes registrados en problemas como éstos están basados en
los datos de población, las probabilidades calculadas utilizando la regla general de la adición
son exactas. Sin embargo, si los porcentajes están basados en muestras extraídas de una
población mayor, las probabilidades calculadas son frecuencias relativas. Son aproximacio-
nes a la probabilidad real de que se produzca el suceso en cuestión. Dado que muchos porcen-
110 Estadística para Biología y Ciencias de la Salud
A1 A2 A1 A2
0.01 0.01
0.17
S S
(a) (b)
A1 A2
A2 A1
0.17
0.01 0.01 S 0.17 0.01 S (1)
0.01
0.81
(c) (d)
Figura 3.8. Cálculo de probabilidades mediante los diagramas de Venn. (a) P[A1 y A2] = 0.01;
(b) P[A1] = 0.18; (c) P[A2] = 0.02; (d) P[A1 o A2] = 0.19, lo cual implica que P[(A1 o A2)ñ] = 0.81.
EJERCICIOS 3.2
1. Supongamos que P[A1 y A2] = 0.04, P[A1] = 0.06, P[A2] = 0.10. Hallar
a) P[A1 o A2]
b) P[A1 y Añ2]
c) P[Añ1 y A2]
d) P[Añ1 y Añ2]
e) Diseñar un diagrama de Venn para visualizar la descomposición de las probabilida-
des dentro del espacio muestral, según se ha descrito en la Figura 3.8.
2. Supongamos que P[A1 o A2] = 0.30, P[A1] = 0.15, P[A2] = 0.20. Hallar
a) P[A1 y A2]
b) P[A1 y Añ2]
c) P[Añ1 y A2]
d) P[Añ1 o Añ2]
e) P[(A1 o A2)ñ]
f ) Diseñar un diagrama de Venn para visualizar la descomposición de las probabilida-
des dentro del espacio muestral, según se ha descrito en la Figura 3.8.
3. Para satisfacer la demanda de los granjeros de utilizar pinos blancos jóvenes como pro-
tección contra el viento, los empleados del servicio forestal tomaron muestras de los
granjeros del estado. Hallaron que el 30 % había adquirido árboles del servicio forestal en
años anteriores, el 40 % había anticipado el pedido de árboles para el año siguiente, el
10 % había adquirido árboles en el pasado y anticipado el pedido de árboles para el año
siguiente. ¿Cuál es la probabilidad de que un granjero seleccionado aleatoriamente haya
adquirido árboles en el pasado o haya anticipado el pedido para el año siguiente? ¿Cuál
Teoría de probabilidades y resolución de problemas 111
condicionada son si y dado que. Utilizaremos la notación P[A2 | A1] para designar la probabi-
lidad del suceso A2 condicionada por el hecho de que haya sucedido previamente A1. Obsér-
vese que, a pesar de que en esta expresión intervienen dos sucesos, se alude únicamente a una
probabilidad. El primero de los sucesos reseñados es aquel que no sabemos si ocurrirá o no; la
barra se lee «dado que»; el segundo suceso es el que se supone que ha ocurrido ya.
Ejemplo 3.3.1. Una mujer tiene tres hijos. ¿Cuál es la probabilidad de que los dos primeros
sean chicos (A1)? ¿Cuál es la probabilidad de que exactamente dos sean chicos (A2)? ¿Cuál es
la probabilidad de que se satisfagan ambas condiciones?
Estas son preguntas no condicionadas y fáciles de contestar utilizando un diagrama en
árbol (véase Fig. 3.9). Si suponemos que cada hijo tiene la misma posibilidad de ser chico que
chica, entonces los ocho puntos muestrales representados en el diagrama son igualmente pro-
bables. Por esta razón, puede usarse la aproximación clásica para calcular las probabilidades
deseadas. En particular
2
P[A1] = 8
3
P[A2] = 8
1
P[A1 y A2] = 8
Supongamos que ya sabemos que los dos primeros hijos son chicos. Ahora, ¿cuál es la proba-
bilidad de que haya exactamente dos chicos en la familia? Esto es, ¿cuál es P[A2 | A1]? Puesto
que sabemos que los dos primeros hijos son chicos, el espacio muestral para el experimento
lógicamente no estará constituido por los ocho puntos, sino que, de hecho, ahora contendrá
solamente los dos puntos MMM y MMF. El resto de los puntos no son consistentes con la
información que tenemos. La pregunta condicionada planteada se resuelve mediante este nue-
vo espacio muestral formado por dos puntos. Ya que estos dos puntos son igualmente proba-
bles, y sólo uno de ellos corresponde a tener exactamente dos chicos en la familia,
1
P[A2 | A1] = P[exactamente dos chicos | los dos primeros son chicos] = 2
En este caso observamos que 12 = P[A2 | A1] | P[A2] = 38. La nueva información afecta a la
probabilidad asignada al suceso de que exactamente dos de los niños sean varones.
El Ejemplo 3.3.1 es una simplificación del problema general. La mayor parte de las pre-
guntas que se plantean sobre probabilidad condicionada se refiere a situaciones en las que no
es conveniente trabajar directamente con un espacio muestral restringido explícitamente. Así
que es necesario desarrollar una fórmula para la probabilidad condicionada que, en esencia,
P[A1 y A2]
P[A2 | A1] =
P[A1]
P[ambos sucesos]
Probabilidad condicionada =
P[suceso dado]
Ejemplo 3.3.2. Se estima que el 15 % de la población adulta padece hipertensión, pero que
el 75 % de todos los adultos cree no tener este problema. Se estima también que el 6 % de la
población tiene hipertensión pero no es consciente de padecer dicha enfermedad. Si un pa-
ciente adulto opina que no es hipertenso, ¿cuál es la probabilidad de que la enfermedad, de
hecho, exista?
Siendo A1 el suceso «el paciente no cree tener la enfermedad» y A2 el suceso «la enfermedad
existe», se nos ha dado que P[A1] = 0.75, P[A2] = 0.15 y P[A1 y A2] = 0.06. Pretendemos hallar
P[A2 | A1].
Por la Definición 3.3.1,
Hay un 8 % de posibilidades de que un paciente que opine que no tiene problemas de hiperten-
sión padezca, de hecho, la enfermedad. Del mismo modo podemos preguntar: si la enfer-
medad existe, ¿cuál es la probabilidad de que el paciente lo sospeche? Es decir, ¿cuál es
P[Añ1 | A2]? Antes de aplicar la Definición 3.3.1, organicemos los datos por medio de un
diagrama de Venn, como se muestra en la Figura 3.10. Por la Definición 3.3.1,
0.16
A2
EJERCICIOS 3.3
Stayskal
Algún día 80 Chicago
esta instalación Tribune
será un
99
99 100 %
segura Desgraciadamente
1
ésta es la 100 %
que no lo será
Planta de
energía nuclear
(? Copyright 1980. Chicago Tribune Company. Todos los derechos reservados. Reproducido con
autorización.)
7. Unos estudios muestran que los ejemplares de una cierta raza de liebres de alta montaña
(liebre esquiadora) mueren antes de lo normal, aun en ausencia de depredadores o de
enfermedad conocida alguna. Dos de las causas de muerte identificadas son: baja canti-
dad de azúcar en sangre y convulsiones. Se estima que el 7 % de los animales presenta
ambos síntomas, el 40 % tiene bajo nivel de azúcar en sangre, y el 25 % sufre convulsio-
nes, ¿cuál es el porcentaje de muertes producidas por causas que no sean las que hemos
mencionado? ¿Cuál es la probabilidad de que un animal elegido aleatoriamente que tiene
bajo nivel de azúcar en sangre sufra también convulsiones?
116 Estadística para Biología y Ciencias de la Salud
8. Utilizar los datos del Ejercicio 3 de la Sección 3.2 para hallar la probabilidad de que un
granjero pida árboles para el año que viene dado que ya ha pedido árboles en el pasado.
Hallar la probabilidad de que un granjero no efectúe ningún pedido de árboles para el año
que viene dado que ya ha adquirido árboles en el pasado. ¿Cuál es la relación matemática
entre las dos respuestas? Explicar por qué ha sucedido esto.
9. Utilizar los datos del Ejercicio 4 de la Sección 3.2 para hallar la probabilidad de que un
donante seleccionado aleatoriamente sea negativo para el test del VIH. Hallar la probabi-
lidad de que un donante seleccionado aleatoriamente sea negativo para el test del VIH
dado que da negativo en el test del herpes.
Una de las aplicaciones más útiles de las probabilidades en el campo médico o biológico está en
el área de los tests de diagnóstico. Un test de diagnóstico es un test para detectar la presencia de
alguna condición específica en una unidad experimental. En el campo médico, generalmente
intentamos detectar la presencia de una enfermedad, un factor genético o alguna otra condición
específica en un ser humano. Sería deseable que estos tests fueran seguros en el sentido de que
siempre detectaran la condición cuando de hecho está presente y nunca la indicaran cuando el
individuo no tiene dicha condición. Desgraciadamente, esto no es así. Sólo podemos esperar
que los tests existentes actualmente no den resultados erróneos muy a menudo.
En un test de diagnóstico, o bien cada sujeto es realmente positivo, lo que significa que la
condición para la que está diseñado el test está presente, o bien el sujeto en realidad es
negativo. El test, en sí mismo, puede dar positivo, lo que significa que se ha detectado la
presencia de la condición, o no darlo. Esto garantiza que cada sujeto entrará exactamente en
una de entre cuatro categorías. Éstas son:
1. La condición está presente y el test detecta su presencia. Es decir, un sujeto realmente
positivo da positivo. En este caso no se ha cometido ningún error.
2. La condición está presente pero el test no detecta su presencia. Cuando un sujeto
realmente positivo da negativo, decimos que hemos obtenido un resultado falso ne-
gativo. En este caso se ha cometido un error.
3. La condición no está presente pero el test detecta su presencia. Cuando un sujeto
realmente negativo da positivo, decimos que se ha obtenido un resultado falso positi-
vo. Se ha cometido un error.
4. La condición no está presente y el test no indica su presencia. Un sujeto realmente
negativo da negativo. No se ha cometido ningún error.
Obsérvese que es posible cometer dos tipos de errores. Esperamos no cometer ninguno
pero cualquiera de ellos es posible. Un test ideal es aquel en el que la probabilidad de cometer
cualquier error es pequeña. A continuación se definen estas probabilidades, llamadas coefi-
cientes de error.
Definición 3.4.1. Coeficiente de falsos positivos. El coeficiente de falsos positivos de un
test se denota por a (alfa) y viene dado por
a = P[el test resulta positivo | el sujeto es realmente negativo]
Definición 3.4.2. Coeficiente de falsos negativos. El coeficiente de falsos negativos de un
test se denota por b (beta) y viene dado por
b = P[el test resulta negativo | el sujeto es realmente positivo]
La Tabla 3.1 resume la terminología introducida hasta ahora.
Teoría de probabilidades y resolución de problemas 117
Estado real
Condición ausente (−) Condición presente (+)
Al realizar un test para detectar una enfermedad, un error causado por un alto coeficiente
de falsos positivos puede ocasionar inconvenientes y gastos a la persona implicada. A ésta se le
detecta una enfermedad que no está presente y como resultado probablemente busque un trata-
miento para un problema inexistente. Un error resultante de un alto coeficiente de falsos negati-
vos es potencialmente peligroso. En este caso, el sujeto desconoce una condición existente y, por
lo tanto, no buscará el tratamiento que necesita. Con una tabla de frecuencias pueden hallarse las
aproximaciones de estos coeficientes mediante la técnica descrita en el Ejemplo 3.4.1.
Ejemplo 3.4.1. El suero de una mujer embarazada puede ser analizado por medio de un
procedimiento llamado electroforesis en gel de almidón. Este procedimiento permite detectar
la presencia de una zona proteínica llamada zona de embarazo, la cual se supone que es un
indicador de que el niño es una hembra. Para investigar las propiedades de este test se selec-
cionaron 300 mujeres para su estudio. En la Tabla 3.2 se dan los resultados del test y los sexos
de los niños nacidos. Obsérvese que, en este caso, el único valor de la tabla predeterminado o
fijado por el experimentador es el tamaño total de la muestra. Todos los otros son aleatorios,
los totales por filas, los totales por columnas y las frecuencias de las celdas. Por definición el
coeficiente de falsos positivos es
a = P[test + | realidad −]
51/300 51
aX = = 0.3469
147/300 147
Tabla 3.2
Sexo
Zona de embarazo Varón (realidad −) Mujer (realidad +)
Este resultado puede obtenerse por observación directa de la Tabla 3.2 considerando que, una
vez que sabemos que el sujeto es realmente negativo, la atención deberá centrarse inmediata-
mente en los 147 casos de la columna 1. De éstos, 51 dieron positivo. Por tanto, el sentido
común apunta a 51/147 como el coeficiente de falsos positivos estimado. Para calcular b,
obsérvese que de los 153 sujetos realmente positivos, 75 dieron negativo. Por lo tanto
75
bX = 0.4902
153
Dado que son coeficientes de error estimados, el test no parece ser efectivo para determinar el
sexo de un niño. (Basado en datos registrados en Human Heredity, vol. 20, 1970, pág. 530.)
Ejemplo 3.4.2. Supongamos que se ha desarrollado un nuevo test doméstico para detectar
el embarazo. Se realiza un experimento para hallar la aproximación de los coeficientes de falsos
positivos y de falsos negativos del test. Para participar en el estudio se seleccionaron cinco
mujeres que se sabía que estaban embarazadas y 10 mujeres no embarazadas. Se efectuó el
nuevo test en cada una de ellas y el resultado se indica en la Tabla 3.3 (los datos son ficticios).
A partir de estos datos, es posible hallar una aproximación fiable de algunas probabilida-
des condicionadas mientras que para otras, no. Por ejemplo, en el caso de
Tabla 3.3
Estado real
No embarazadas Embarazadas
(realidad −) (realidad +)
embarazada, lo esté realmente, no puede aproximarse a partir de este experimento. Sin embargo,
para hallar la última, las cinco mujeres embarazadas seleccionadas aleatoriamente por el experi-
mentador pueden entenderse como una muestra aleatoria de la población de todas las mujeres
embarazadas. Por lo tanto, podemos utilizar el método de la frecuencia relativa para encontrar que
la aproximación de la probabilidad de que una mujer embarazada dé positivo en el test es de 15.
Hemos visto que los coeficientes de falsos positivos y de falsos negativos para un test de
diagnóstico pueden aproximarse a partir de una tabla con los totales de todas las filas y
columnas, los cuales pueden variar. El Ejemplo 3.4.2 muestra que también pueden aproxi-
marse cuando los totales de las filas (o columnas) son fijos siempre que los totales fijos se
refieran al número de sujetos realmente positivos y realmente negativos del estudio.
Riesgo relativo
Algunos estudios se diseñan para investigar un factor que el investigador cree que puede estar
asociado con el desarrollo de una enfermedad o condición específica. Este factor se denomina
factor de riesgo. Para realizar el estudio se seleccionan dos muestras. Una muestra, represen-
tada mediante E, consiste en sujetos que han estado expuestos al factor de riesgo; los demás,
representados mediante Eñ, no han estado expuestos al factor de riesgo.
En un momento dado, se clasifica cada sujeto según tenga la enfermedad, D, o no la
tenga, Dñ. Hay dos probabilidades condicionadas de interés. Estas son: la probabilidad de que
la enfermedad esté presente dado que el sujeto estuvo expuesto al riesgo, P[D | E], y la
probabilidad de que la enfermedad esté presente aunque el sujeto no estuvo expuesto al riesgo
P[D | Eñ]. Puesto que los tamaños muestrales para los sucesos E y Eñ son fijos, puede hacerse
un cálculo aproximado de cada una de estas probabilidades utilizando la idea demostrada en
el Ejemplo 3.4.2. Puede realizarse un cálculo aproximado de una medida del impacto del
factor de riesgo a partir de estas probabilidades condicionadas. Esta medida, denominada
riesgo relativo (RR), se calcula mediante:
P[D | E]
RR X
P[D | Eñ]
Recuérdese que, dado que las probabilidades utilizadas en el cálculo son aproximadas, el
riesgo obtenido sólo es una estimación del riesgo relativo verdadero. Si RR = 1, significa que
no existe asociación entre el factor de riesgo y el desarrollo de la enfermedad. Si RR > 1, se
supone que un individuo expuesto al riesgo tiene más probabilidades de desarrollar la enfer-
medad que uno que no esté expuesto al riesgo. Un valor de RR < 1 significa que un individuo
expuesto al riesgo es menos probable que desarrolle la enfermedad que uno no expuesto al
riesgo. El Ejemplo 3.4.3 muestra esta idea.
Ejemplo 3.4.3. Se ha realizado un estudio sobre la edad de la madre en el momento del
nacimiento de su hijo como factor de riesgo en el desarrollo del síndrome de la muerte súbita
del lactante (SMSL). Se seleccionaron para el estudio un total de 7330 mujeres que estaban
por debajo de los 25 años en el momento del nacimiento del niño. De ellas, 29 tuvieron niños
afectados de SMSL. De las 11 256 mujeres seleccionadas para el estudio que tenían 25 años o
más en el momento del nacimiento de sus hijos, 15 tuvieron niños con SMSL. Estos datos se
muestran en la Tabla 3.4. Partiendo de esta tabla podemos observar que
29 15
P[D | E] = y P[D | Eñ] =
7330 11 256
120 Estadística para Biología y Ciencias de la Salud
SMSL
Sí No
Dado que se puede hacer un cálculo aproximado de P[D | E] y P[D | Eñ] a partir de los
datos de las tablas, ya que todos los totales por filas y columnas son aleatorios, puede hacerse
un cálculo aproximado del riesgo relativo a partir de dichas tablas. El Ejercicio 14 de esta
sección es un ejemplo de ello.
EJERCICIOS 3.4
Tabla 3.5
Clasificación verdadera
Tabla 3.6
Color
Sí No
Fragancia Sí 12 118
No 50 20
200
Tabla 3.7
Estado real
Informe del anatomopatólogo Benigno (−) Maligno (+)
+ 7 79
− 395 19
500
Tabla 3.8
Estado real
Tabla 3.9
Estado real
Tabla 3.10
Estado real
Tos presente Tos ferina Tos ferina
ausente (−) presente (+)
Sí (+) 83 116
No (−) 32 2
233
vity and Specifity of Clinical Case Definition of Pertussis», American Journal of Public
Health, vol. 78, núm. 7, julio de 1988, págs. 833-835.)
14. En 1985, muchas familias estadounidenses adoptaron a niños asiáticos. Algunos de
estos niños habían estado expuestos al virus de la hepatitis B y eran hipotéticos transmi-
sores del virus a otros. En un estudio del riesgo implicado, se obtuvieron los datos de la
Tabla 3.11. Los valores de las celdas representan el número de familiares cercanos a los
que se les ha detectado el virus y todos los totales por filas y columnas son aleatorios.
Hallar la aproximación del riesgo relativo. (Basado en la información hallada en An-
drew Friede et al., «Transmission of Hepatitis B Virus from Adopted Asian Children to
Their American Families», American Journal of Public Health, vol. 78, núm. 1, enero
de 1988, págs. 26-29.)
15. Se sabe que los pacientes con SIDA a menudo presentan tuberculosis. Se llevó a cabo
un estudio de los factores de riesgo asociados con el desarrollo de esta enfermedad en
los pacientes. Uno de los factores considerados fue la adicción a drogas intravenosas.
De los 1992 pacientes del estudio, 307 habían abusado de las drogas por vía intraveno-
sa. Cuarenta y seis de los pacientes tenían tuberculosis y, de ellos, 11 eran adictos a
drogas por vía intravenosa. (Basado en los datos registrados en Timothy Cote et al.,
«The present and the Future of AIDS and Tuberculosis in Illinois», American Journal of
Public Health, vol. 80, núm. 8, agosto de 1990, págs. 950-953.)
a) Construir una tabla de 2 × 2 para visualizar estos datos.
b) Hallar e interpretar el riesgo relativo.
16. En un estudio sobre la relación entre el uso regular de tinte para el cabello y el desarro-
llo de la leucemia, fueron seleccionados 577 pacientes con leucemia y 1245 personas
sin la enfermedad (controles) y fueron consultados en relación con el uso de dicho tinte.
Cuarenta y tres pacientes y 55 controles dijeron haber estado bastante expuestos al tinte.
(Basado en la información hallada en Kenneth Cantor et al., «Hair Dye Use and Risk of
Leukemia and Lymphoma», American Journal of Public Health, vol. 78, núm. 5, mayo
de 1988, págs. 570-571.)
a) Completar la Tabla 3.12.
Tabla 3.11
Virus presente
Sí No
Expuesto al riesgo Sí 7 70
No 4 228
124 Estadística para Biología y Ciencias de la Salud
Tabla 3.12
Leucemia presente
Sí No
b) En este caso, ¿es posible hallar la aproximación del riesgo relativo usando la defi-
nición dada en esta sección? Explicarlo.
c) Es posible hacerse una idea de la repercusión del uso de tinte para cabello, conside-
rando el cociente
P[E | D]
P[E | Dñ]
donde E es el suceso de que el individuo estuvo expuesto al riesgo y D es el suceso
de que la leucemia está presente. ¿Puede estimarse cada una de las probabilidades
condicionadas implicadas en este cociente? Si es así, evaluarlo e interpretarlo.
3.5. INDEPENDENCIA
Pueden existir, fundamentalmente, dos relaciones entre sucesos. La primera, ser mutuamente
excluyentes, ha sido tratada en la Sección 3.1; la segunda, ser independientes, se expone en
ésta. El término matemático tiene prácticamente el mismo significado que el lingüístico.
Webster define objetos independientes como objetos que actúan «con independencia el uno
del otro». De este modo, dos sucesos son independientes si uno puede producirse con inde-
pendencia del otro. Es decir, la realización o no realización de uno no tiene efecto alguno
sobre la realización o no del otro. En numerosos casos, podemos determinar sobre una base
puramente intuitiva, si dos sucesos son independientes. Por ejemplo, los sucesos A1, el pa-
ciente tiene sinovitis, y A2, el paciente tiene apendicitis, son intuitivamente independientes. El
hecho de que el paciente tenga apendicitis nada tiene que ver con que padezca o no sinovitis,
y viceversa.
En algunos casos, no obstante, la delimitación no es tan evidente. Necesitamos entonces
una definición matemática precisa del concepto, para poder determinar sin la menor duda si
dos sucesos son, de hecho, independientes. La definición es fácil de justificar. Por ejemplo,
supongamos que, basándonos en los síntomas descritos, podamos admitir que la probabilidad
de que un paciente tenga apendicitis sea de 0.9 (A2). Supongamos que se nos dé ahora la
información adicional de que el paciente tiene sinovitis (A1). ¿Cuál es la probabilidad de que
el paciente tenga apendicitis? ¡Obviamente, la respuesta sigue siendo 0.9! Dado que A1 y A2
son independientes, la nueva información es irrelevante y no afecta para nada a la probabili-
dad original. De este modo la independencia entre dos sucesos A1 y A2 implica que la probabi-
lidad condicionada P[A1 | A2] ha de ser igual a la asignada originalmente a A2. Esta caracteri-
zación se adopta como definición del término sucesos independientes.
Definición 3.5.1. Sucesos independientes. Sean A1 y A2 dos sucesos tales que P[A1] | 0.
Estos sucesos son independientes si y sólo si
P[A2 | A1] = P[A2]
Teoría de probabilidades y resolución de problemas 125
Ejemplo 3.5.1. Se estima que entre la población total de Estados Unidos, el 55 % padece
obesidad (A1), el 20 % es hipertenso (A2) y el 60 % es obeso o hipertenso. ¿Es, de hecho,
independiente el que una persona sea obesa de que padezca hipertensión? La respuesta a esta
pregunta no es obvia. Haciendo uso del principio general de la adición, se tiene
P[A1 y A2] = P[A1] + P[A2] − P[A1 o A2]
En este caso
P[A1 y A2] = 0.55 + 0.20 − 0.60 = 0.15
Así que
P[A1 y A2]
P[A2 | A1] =
P[A1]
0.15 15
= = = 0.27
0.55 55
Puesto que P[A2 | A1] = 0.27 | 0.20 = P[A2], puede concluirse que los sucesos no son inde-
pendientes. Hablando en términos prácticos, el hecho de que una persona tenga exceso de
peso aumenta la probabilidad de que tenga hipertensión.
Obsérvese que estamos suponiendo que las probabilidades del Ejemplo 3.5.1 se basan en
datos de la población y, por lo tanto, son exactas. Aquí puede utilizarse esta Definición 3.5.1
para probar la independencia de dos sucesos. En la práctica, esta situación surge muy raras
veces. En cambio, habitualmente estaremos tratando con probabilidades de frecuencias relati-
vas obtenidas de muestras extraídas de la población. En este caso, no puede utilizarse la
Definición 3.5.1 para probar la independencia. No obstante, en el Capítulo 12 se desarrollará
un test apropiado para las muestras.
La Definición 3.5.1 es lógica y fácil de comprender. No obstante, no es la que normal-
mente se emplea para el término sucesos independientes. La definición usual puede derivarse
de lo siguiente:
P[A1 y A2]
P[A2 | A1] = es siempre cierta en tanto que P[A1] | 0
P[A1]
P[A2 | A1] = P[A2] si P[A1] | 0 y los sucesos son independientes.
P[A1 y A2]
= P[A2]
P[A1]
Multiplicando ambos miembros de la ecuación obtenida por P[A1], obtenemos: P[A1 y A2] =
= P[A1]P[A2], que es la definición usual del término sucesos independientes.
Obsérvese que cuando los sucesos son independientes la probabilidad de que ambos ocu-
rran simultáneamente se obtiene por multiplicación. Así, como se indicó en la Sección 3.2, la
palabra y es la clave de que las probabilidades se deben multiplicar.
126 Estadística para Biología y Ciencias de la Salud
Ejemplo 3.5.2. Estudios de genética de poblaciones indican que el 39 % de los genes que
gobiernan la información del factor Rh determinan que éste sea negativo. Basándose en ello,
¿cuál es la probabilidad de que un individuo seleccionado aleatoriamente tenga Rh negativo?
El factor Rh negativo se presenta si, y sólo si, el individuo implicado posee dos genes determi-
nativos de información negativa. Dado que cada gen se hereda de uno de los padres, puede
suponerse que el tipo de cada uno de los genes es independiente del otro. Por lo tanto, la
probabilidad de que un individuo tenga dos genes negativos es (0.39)(0.39) X 0.15. (Basado
en la información de William Keeton y Carol McFadden, Elements of Biological Science,
W.W. Norton, Nueva York, 1983.)
Ejemplo 3.5.3. A lo largo de un día, se pone a prueba un determinado diagnóstico con tres
pacientes que no guardan relación alguna entre ellos. El diagnóstico es fiable en un 90 % de
los casos tanto cuando se da como cuando no se da la condición para cuya detección se ha
diseñado la prueba. ¿Cuál es la probabilidad de que exactamente dos de los tres resultados de
la prueba sean erróneos?
Un diagrama de árbol nos ayudará a resolver la cuestión. En él, C representa una decisión
correcta, y E un error. En la Figura 3.11 aparecen las probabilidades correspondientes a cada
alternativa. Las ramas representan alternativas interesantes. Cada trayectoria completa repre-
senta la realización simultánea de tres sucesos diferentes. Por ejemplo, la trayectoria EEC
representa que se dieron simultáneamente, un error con el primer paciente (E1), un error con el
segundo (E2) y una decisión correcta con el tercero (C3). Puesto que las pruebas se llevan a
cabo sobre pacientes diferentes y con independencia las unas de las otras, podemos suponer
que los resultados son independientes. De acuerdo con la Definición 3.5.2, la probabilidad a
lo largo de cada trayectoria se calculará multiplicando las probabilidades que aparecen en el
recorrido. Así, en este caso, se tendrá P[E1 y E2 y C3] = P[E1]P[E2]P[C3] = (0.1)(0.1)(0.9) =
= 0.009. Dado que hay tres trayectorias en las que aparecen exactamente dos errores, la
probabilidad de obtener exactamente dos errores en cualquier orden es 3(0.009) = 0.027.
La Definición 3.5.2 debe utilizarse con cuidado. Se debe estar seguro de que es razonable
suponer que los sucesos son independientes antes de aplicar la definición para calcular la
probabilidad de que se produzca una serie de sucesos. En el Ejemplo 3.5.4 se ilustra el peligro
de una independencia erróneamente supuesta.
Ejemplo 3.5.4. Un estudio del Comité de Energía Atómica, WASH 1400, informó de que
la probabilidad de que se produzca un accidente nuclear, parecido al que ocurrió en Three
Mile Island en marzo de 1978, es de 1 en 10 millones. No obstante, el accidente se produjo.
Según Mark Stephens, «la metodología del WASH 1400 utilizó árboles de sucesos, secuen-
cias de acciones que eran necesarias para que se produjera el accidente. Estos árboles de
sucesos no suponían ninguna interrelación entre sucesos, que podían haber sido causados por
el mismo error de juicio o como parte de la misma acción equivocada. Los profesionales de la
estadística que asignaron las probabilidades al proyecto WASH 1400 dijeron, por ejemplo,
que existía un riesgo del 1 por 1000 de que una de las válvulas auxiliares de control de entrada
de agua (de las doce) estuviera cerrada. Y si existe una probabilidad de que dos válvulas estén
cerradas, es una milésima parte de ésta, es decir, de una en un millón. Pero las doce fueron
cerradas por la misma persona el 26 de marzo y una nunca fue cerrada con la otra». Los
sucesos A1: la primera válvula está cerrada, y A2: la segunda válvula está cerrada, no eran
independientes. Sin embargo, fueron tratados como tales al calcular la probabilidad de un
accidente. Esto, entre otras cosas, llevó a una subestimación del potencial de accidentalidad
(de Three Mile Island de Mark Stephens, Random House, 1980).
EJERCICIOS 3.5
1. ¿Cuáles de los siguientes pares de sucesos cree usted que son independientes? ¿Cuáles
son mutuamente excluyentes?
A1: Una madre padece rubéola durante los tres primeros meses de embarazo.
B1: Un hijo nace muerto o deforme.
A2: Un hombre es estéril.
B2: Un hombre padece parotiditis en la edad adulta.
A3: Una rata hembra y una rata macho son enjauladas juntas.
B3: La rata hembra es estéril.
A4: Un niño es miope.
B4: Un niño es hipermétrope.
A5: Un terreno ha sido drenado.
B5: El terreno experimenta frecuentes inundaciones.
A6: Un conejo es inoculado con virus de poliomielitis.
B6: La sangre del conejo contiene anticuerpos de poliomielitis.
A7: Un conejo es inoculado con virus de poliomielitis.
B7: La sangre del conejo contiene anticuerpos de sarampión.
2. Argumentar, de forma intuitiva, que si dos sucesos que no son imposibles son mutua-
mente excluyentes, no pueden ser independientes. Probarlo matemáticamente. Sugeren-
cia: demostrar que, con estas condiciones, no se puede satisfacer la Definición 3.5.2.
3. Los contaminantes más comunes de las aguas son de origen orgánico. Puesto que la
mayor parte de los materiales orgánicos se descompone por acción de bacterias que
requieren oxígeno, un exceso de materia orgánica puede significar una disminución en
la cantidad de oxígeno disponible. Ello afecta eventualmente a otros organismos pre-
sentes en el agua. La demanda de oxígeno por parte de una bacteria se llama demanda
biológica de oxígeno (DBO). Un estudio de las corrientes acuáticas que circulan en las
proximidades de un complejo industrial revela que el 35 % tiene una alta DBO, el 10 %
muestra una acidez elevada y un 4 % presenta ambas características. ¿Son independien-
tes los sucesos «la corriente tiene una alta DBO» y «la corriente posee una acidez
elevada»? Calcular la probabilidad de que la corriente tenga una acidez elevada, dado
que presenta una alta DBO.
4. El 50 % de la población aproximadamente corresponde a varones, el 68 % bebe con
cierto exceso, y el 38.5 % bebe y es varón. Dado que una determinada persona aleatoria-
128 Estadística para Biología y Ciencias de la Salud
Tabla 3.13
Podemos ahora calcular P[A1 y A2], si los sucesos son independientes. Además, si la informa-
ción de que disponemos lo permite, es posible hacerlo mediante la regla general de la adición.
130 Estadística para Biología y Ciencias de la Salud
¿Existe algún otro procedimiento para hallar la probabilidad de que dos sucesos se produzcan
simultáneamente, si éstos no son independientes? La respuesta es afirmativa, y el método
utilizado es fácil de deducir. Sabemos que
P[A1 y A2]
P[A2 | A1] =
P[A1]
Ejemplo 3.6.2. Si una madre es Rh negativo y su hijo es Rh positivo, existe una incompati-
bilidad sanguínea que puede conducir a una eritroblastosis fetal, consistente en que la madre
crea un anticuerpo contra el Rh del feto que conduce a la destrucción de los hematíes del feto.
¿Cuál es la probabilidad de que un niño seleccionado aleatoriamente corra este riesgo?
Una forma de que el niño tenga este problema es que el padre sea heterocigoto Rh
positivo (+ − o − +) y pase un gen positivo al niño mientras que la madre sea Rh negativo.
Para determinar la probabilidad de esta combinación de sucesos, debemos hallar P[(A1 y A2)
y A3] donde A1 representa que el padre sea heterocigoto Rh positivo, A2 que el padre trans-
mita un gen positivo al niño y A3 que la madre sea Rh negativo. Obsérvese que los sucesos
A1 y A2 no son independientes. El hecho de que el padre sea heterocigoto Rh positivo está
presente en la posibilidad de que el niño obtenga un gen positivo de esta fuente. A través de
la regla de la multiplicación,
Por el Ejercicio 10 de la Sección 3.5, sabemos que P[A1] X 0.48. Dado que un gen se hereda
aleatoriamente del padre, P[A2 | A1] = 0.5. Por lo tanto
Puesto que el genotipo de la madre no tiene efecto sobre el padre o sobre su capacidad de
transferir un gen positivo al niño, A3 es independiente de A1 y A2. Por el Ejemplo 3.5.2
sabemos que P[A3] ^ 0.15. Así pues, por la definición de independencia,
Existen otras formas de que esté presente la condición. El Ejercicio 1 lo señala y permite
calcular la probabilidad de que un niño contraiga el problema de cualquier procedencia.
EJERCICIOS 3.6
7. En la replicación del DNA, a veces se presentan errores que pueden dar lugar a muta-
ciones observables en el organismo. En ocasiones, tales errores están inducidos quí-
micamente. Se expone un cultivo de bacterias a la presencia de un producto químico
que tiene un 0.4 de probabilidad de inducir a error. Sin embargo, el 65 % de los errores
es «silencioso», en el sentido de que no dan lugar a una mutación observable. ¿Cuál es
la probabilidad de que se observe una colonia mutada? Sugerencia: Hallar P[error y
observable].
8. En la ciencia es importante la capacidad de observar y recordar datos. Desgraciada-
mente, el poder de la sugestión puede distorsionar la memoria. Se realizó un estudio
132 Estadística para Biología y Ciencias de la Salud
sobre los recuerdos: a los sujetos se les muestra una película en la que un coche pasa
por una carretera. En la película no sale ningún granero. A continuación, se les formu-
la una serie de preguntas relacionadas con la película a los sujetos. A la mitad se les
preguntó: «¿Con qué velocidad se mueve el coche cuando pasa por el granero?» A la
otra mitad de los sujetos no se les hizo esta pregunta. Más tarde, se le preguntó a cada
uno de ellos: «¿Sale algún granero en la película?» Entre los que se les formuló la
primera pregunta concerniente al granero, el 17 % respondió «sí»; sólo el 3 % de los
restantes respondió «sí». ¿Cuál es la probabilidad de que un participante en este estu-
dio, seleccionado aleatoriamente, haya dicho ver el granero inexistente? ¿Decir que
se ha visto el granero es independiente de que se le haya formulado la primera pregun-
ta sobre el mismo? Sugerencia:
Probabilidad de la trayectoria
probabilidades de 0.85 y 0.15 a los sucesos T+, el resultado del test es positivo, y T−, el
resultado del test es negativo, respectivamente. Si la enfermedad no está presente, estas pro-
babilidades condicionadas son, respectivamente, 0.04 y 0.96. Todas estas probabilidades se
muestran en la Figura 3.12. Obsérvese que la probabilidad de la primera trayectoria es P[D]
P[T+ | D] lo que, mediante la regla de la multiplicación, nos da P[D y T+].
Para hallar P[D | T+], el coeficiente predictivo positivo, aplicamos la Definición 3.3.1
para obtener
P[D y T+]
P[D | T+] =
P[T+]
En el árbol, vemos que P[D y T+] = 0.085. El suceso T+ se representa mediante las trayecto-
rias 1 y 3, y, por lo tanto, P[T+] = 0.085 + 0.036 = 0.121. Mediante sustitución obtendremos
0.085
P[D | T+] = = 0.70
0.121
P[Aj y B]
P[Aj | B] =
P[B]
Teorema 3.7.1. Teorema de Bayes. Sea A1, A2, A3,..., An una colección de sucesos que
forman una partición de S. Sea B un suceso tal que P[B] | 0. Entonces, cualquiera que sea el
suceso Aj , j = 1, 2, 3, ..., n,
P[B | Aj]P[Aj]
P[Aj | B] = n
; P[B | Ai]P[Ai]
i=1
Ejemplo 3.7.2. En el Ejemplo 3.7.1, hemos calculado P[D | T+], donde D es el suceso que
significa «tenga artritis» y T+ es el suceso representativo del hecho de que el test sea positivo.
Los sucesos D y Dñ forman una partición de S. (Un individuo o tiene o no tiene artritis.) El
suceso T+ tiene asociada una probabilidad distinta de cero. Se nos da
P[T+ | D]P[D]
P[D | T+] =
P[T] | D]P[D] + P[T+ | Dñ]P[Dñ]
(0.85)(0.10)
= X 0.70
(0.85)(0.10) + (0.04)(0.90)
Obsérvese que el resultado es el mismo que el obtenido por medio del diagrama de árbol.
El Ejemplo 3.7.3 nos muestra el manejo del teorema de Bayes cuando S está dividido por
una partición de más de dos sucesos.
Ejemplo 3.7.3. Se cree que la distribución de los grupos sanguíneos en Estados Unidos en
la Segunda Guerra Mundial era: tipo A, 41 %; tipo B, 9 %; tipo AB, 4 %; y tipo 0, 46 %. Se
estima que en esa época, el 4 % de las personas pertenecientes al tipo 0 fue clasificado como
del tipo A; el 88 % de los del tipo A fue correctamente clasificado; el 4 % de los del tipo B se
clasificó como del tipo A, y el 10 % de los del tipo AB fue, igualmente, clasificado como del
tipo A. Un soldado fue herido y conducido a la enfermería. Se le clasificó como del tipo A.
¿Cuál es la probabilidad de que tal grupo sea ciertamente el suyo?
Sean los sucesos:
A1: Es del tipo A.
A2: Es del tipo B.
A3: Es del tipo AB.
A4: Es del tipo 0.
B: Es clasificado como del tipo A.
Deseamos calcular P[A1 | B]. Los datos de que disponemos son:
P[A1] = 0.41 P[B | A1] = 0.88
P[A2] = 0.09 P[B | A2] = 0.04
P[A3] = 0.04 P[B | A3] = 0.10
P[A4] = 0.46 P[B | A4] = 0.04
En la Figura 3.13 se muestra el diagrama de árbol utilizado para responder a esta pre-
gunta. Obsérvese que, según la Definición 3.3.1, P[A1 | B] = P[A1 y B]/P[B]. El numerador
de esta probabilidad es la probabilidad de la trayectoria 1, es decir, 0.3608. El denominador
es la suma de las probabilidades de las trayectorias 1, 3, 5 y 7, es decir, 0.3868. Por tanto,
P[A1 | B] = 0.3608/0.3868 X 0.93. Por el teorema de Bayes,
P[B | A1]P[A1]
P[A1 | B] = 4
; P[B | Ai]P[Ai]
i=1
(0.88)(0.41)
=
(0.88)(0.41) + (0.04)(0.09) + (0.10)(0.04) + (0.04)(0.46)
X 0.93
136 Estadística para Biología y Ciencias de la Salud
0.04
0.10 B (0.04) (0.10) = 0.004 = P[A3 y B]
A3
0.46 0.90 B′
Figura 3.13. P[A1 y B] = 0.3608; P[B] = 0.3608 + 0.0036 + 0.004 + 0.0184 = 0.3868; P[A1 | B] =
= 0.3608/0.3868 X 0.93
EJERCICIOS 3.7
1. Las estadísticas indican que en Estados Unidos la probabilidad de que una madre muera
durante el parto es 0.00022. Si no es de raza negra, la probabilidad de muerte es 0.00017,
mientras que si lo es, esta probabilidad aumenta a 0.00064. Supongamos que el 10 % de
los partos corresponde a mujeres negras.
a) Dibujar un diagrama de árbol describiendo las probabilidades dadas, y hallar las pro-
babilidades correspondientes a las trayectorias en cada uno de los cuatro casos. (Sea D
el suceso que denota que la madre muere y B el que alude a que es de raza negra.)
b) Utilizar el árbol del apartado a para calcular la probabilidad de que una madre que
muere en el parto sea de raza negra.
c) Haciendo uso del teorema de Bayes, hallar la probabilidad de que una madre que muere
en el parto sea de raza negra, y comparar el resultado con el obtenido en el apartado b.
2. Un test diseñado para diagnosticar el cáncer de cuello uterino tiene un coeficiente de
falsos negativos y falsos positivos de 0.05, cada uno. De una cierta población de mujeres,
el 4 % está afectado por este tipo de cáncer. ¿Cuál es la probabilidad de que una mujer de
la población elegida aleatoriamente tenga cáncer de cuello uterino, dado que su resultado
con el test es positivo?
3. Un paciente de cáncer está siendo tratado con una combinación de tres fármacos. Se
observa que, cuando se utilizan simultáneamente, a menudo dos de los tres fármacos se
inhibirán de forma que, de hecho, sólo uno será activo frente al tumor. Suponga que
cuando esto ocurra, la probabilidad de que el fármaco A actúe solo es la misma que la del
fármaco B y la del C, es decir 13. La efectividad de cada fármaco, con respecto a producir
Teoría de probabilidades y resolución de problemas 137
A2
An S
A1
A2 y B An y B
B (sombreado)
A1 y B