Documentos de Académico
Documentos de Profesional
Documentos de Cultura
02 Probabilidades
02 Probabilidades
CÁLCULO DE PROBABILIDADES
● .............................................................................
● .............................................................................
Racca, Bottai, Ivancovich, Piskulic, Prunello, Allasia, Silva Quintana, Daurelio (2018). Problemas de Estadística aplicados a la Biología y la
Química. Capítulo 2. UNR Editora, Rosario.
42 Capítulo 2. Cálculo de probabilidades
La intersección de los k sucesos será un suceso formado por todos los puntos muestra
que pertenecen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3. Existen varios factores que pueden aumentar el riesgo de contraer cáncer de mama: menarca
temprana, menopausia tardía, hormonoterapia, no haber amamantado, etc. Con el objetivo
de analizar si dicho riesgo depende de la edad a la que se tiene el primer hijo, se indagó a un
grupo de mujeres acerca de este factor y se las clasificó según diagnóstico positivo o negativo
de cáncer de mama.
Considere el experimento aleatorio E consistente en elegir al azar una de las mujeres encuesta-
das que tuvieron al menos un hijo y determinar:
(a) Calcule la probabilidad de que un hijo de una pareja de portadores sanos sea enfermo.
(b) ¿Cuál es la probabilidad de que un hijo de padre normal y madre talasémica menor sea
normal?
2.2 Probabilidad de un suceso 43
(c) Si todos los individuos con talasemia mayor mueren antes de alcanzar la edad adulta,
¿cuál es la proporción esperada de portadores entre los adultos descendientes de padres
talasémicos menores?
(a) Si dos padres sin síntomas de la enfermedad tienen un hijo con fibrosis quística, ¿cuáles
son sus genotipos con respecto a este alelo?
(b) Habiendo tenido este hijo, ¿cuál es la probabilidad de que tengan otro hijo con la misma
enfermedad?
(c) ¿Qué proporción de los hijos se espera que sean portadores del alelo de la fibrosis quística?
(d) ¿Qué proporción de los hijos se espera que no lleven el alelo?
9. La siguiente tabla da los resultados obtenidos al clasificar a las 1559 mujeres con al menos un
hijo, citadas en el ejercicio 3 (página 42), según diagnóstico positivo o negativo de cáncer de
mama y edad a la cual tuvo su primer hijo:
(a) En el informe descriptivo de este conjunto de datos se presentó la Figura 2.1. Realice un
breve comentario del mismo.
(b) Estime la probabilidad de que al elegir al azar una mujer de la población de la cual proviene
la muestra:
● tenga diagnóstico positivo de cáncer de mama.
● haya tenido su primer hijo a una edad mayor a 34 años.
● tenga diagnóstico positivo de cáncer de mama y la edad a la cual tuvo su primer hijo
haya sido menor a 20 años.
● haya tenido su primer hijo a una edad menor a 20 años o tenga diagnóstico positivo
de cáncer de mama.
44 Capítulo 2. Cálculo de probabilidades
● habiendo tenido su primer hijo a una edad mayor de 34 años, tenga diagnóstico
positivo de cáncer de mama.
(c) Cada una de las frecuencias relativas que se indican a continuación estima, en relación
con nuestro ejercicio, a la probabilidad de un suceso. Explicite en palabras del problema
de qué suceso se trata:
Figura 2.1: Distribución de las mujeres según diagnóstico de cáncer y edad a la cual tuvo el primer hijo
<20
20−24
Diagnóstico
25−29 Negativo
Positivo
30−34
>34
0 20 40 60 80 100
Porcentaje
● Por definición:
P(A1 /A2 ) = . . . . . . . . . . . . . . . . . / . . . . . . . . . . . (Suponiendo P(A2 ) ≠ 0)
Similarmente:
P(A2 /A1 ) = . . . . . . . . . . . . . . . . . / . . . . . . . . . . . (Suponiendo P(A1 ) ≠ 0)
● P(A1 ∩ A2 ) = . . . . . . . . . . . . . . . . . (Regla del producto)
● Sean A1 y A2 , tales que P(A1 ) ≠ 0 y P(A2 ) ≠ 0, se dirá que A1 y A2 son independientes
si se verifica que:
P(A1 /A2 ) = . . . . . . . . . . . . . . . . . = P(A1 )
o
P(A2 /A1 ) = . . . . . . . . . . . . . . . . . = P(A2 )
Si ambos sucesos son independientes, entonces
P(A1 ∩ A2 ) = . . . . . . . . . . . . . . . . . (Regla del producto para sucesos independientes)
(a) Estime la probabilidad del suceso “que habiendo sido madre por primera vez con menos
de 20 años, tenga diagnóstico positivo de cáncer de mama”.
(b) Estime la probabilidad del suceso “que habiendo sido madre por primera vez con menos
de 20 años, tenga diagnóstico negativo de cáncer de mama”.
(c) Calcule la probabilidad del suceso unión de los dos sucesos mencionados en los ítems
anteriores.
(d) En función del resultado obtenido, ¿cómo definiría dichos sucesos? ¿Cómo expresaría
este resultado en forma general?
12. Dentro de los tipos de meningitis bacteriana, uno de los más peligrosos es conocido como
Enfermedad Meningocócica invasora (EM), una infección grave causada por la bacteria Neisseria
meningitidis. Si bien existen diferentes serotipos de esta bacteria, sólo es posible que se presente
uno de ellos en caso de enfermedad. En Argentina, en el año 2010, lograron identificarse los
serotipos B (41 % de los casos), C (5 %), W135 (49 %) e Y (3 %). Calcule la probabilidad de que al
analizar un caso de EM al azar en dicho año, el mismo sea causado por un serotipo diferente de
los cuatro mencionados.
14. En una población en la cual el 34 % de los individuos se alimenta con dietas ricas en grasas,
la probabilidad de desarrollar cáncer de colon es de 0.05 para individuos con dicho tipo de
dieta, mientras que para aquellos con dietas equilibradas es de 0.009. Dado un experimento
consistente en elegir al azar un individuo de esta población y determinar su tipo de dieta y si
padece cáncer de colon:
15. Con referencia al ejercicio 9 (página 43), escriba la igualdad probabilística que debería cumplirse
para afirmar que los dos criterios de clasificación considerados son independientes e indique
con qué frecuencias relativas estimarían a cada una de las probabilidades que intervienen en
dicha igualdad. En base a esas estimaciones, ¿podría pensarse que contraer cáncer de mama es
independiente de la edad a la que tiene el primer hijo?
16. Una asignatura de la carrera se regulariza mediante la aprobación de dos exámenes parciales.
La probabilidad de que un alumno apruebe el primer parcial es 0.85. Si un alumno aprueba el
primer parcial, la probabilidad de que apruebe el segundo es 0.73.
17. El factor Rhesus (Rh) es una proteína heredada que se encuentra en la superficie de los glóbulos
rojos en el 85 % de las personas (Rh+). Si se seleccionan tres individuos al azar de esa población
y considerando que sus fenotipos son independientes:
(a) Estime la probabilidad de que al seleccionar al azar una planta de girasol de la población,
la misma tenga una altura:
● menor o igual a 2.60 m
● mayor a 2.71 m
● mayor a 2.38 y menor o igual que 2.71 m
(b) Estime la probabilidad de que al elegir dos plantas de la población al azar, ambas presenten
una altura mayor a 2.60 m.
21. Un test de screening tiene una probabilidad de 0.90 de dar positivo en casos de enfermedad y
una probabilidad de 0.995 de dar negativo en personas sanas. La prevalencia de la enfermedad
es 0.001.
(a) En un árbol de probabilidad en el que el primer nivel de ramas se refiere a estar enfermo
o no y el segundo nivel a dar positivo o no el test de screening, indicar las probabilidades
correspondientes a cada rama.
(b) Realice otro árbol donde el primer nivel de ramas se refiera al resultado del test y el
segundo nivel a la enfermedad y complete las probabilidades correspondientes a cada
rama de este árbol.
(c) Calcule las probabilidades para las cuatro posibles combinaciones de enfermedad y test?
¿Cuál de los dos árboles se podría utilizar para tal fin?
(d) Si el test se aplica independientemente a dos muestras distintas del mismo individuo,
¿cuál es la probabilidad de que ambas pruebas den el mismo resultado?
22. Un polimorfismo de un solo nucleótido (conocido como SNP por sus siglas en inglés, Single
Nucleotide Polymorphism) es una variación en la secuencia de ADN que afecta a una sola base.
En una región determinada del genoma se encuentra la siguiente secuencia: _AT_ACT, donde la
primera y cuarta bases son SNPs. Con respecto al primer SNP, el 97 % de la población tiene una
timina (T) y el 3 % una guanina (G), mientras que en relación al segundo, el 90 % tiene citosina
(C), el 6 % adenina (A) y el 4 % T. Considerando esto, ¿cuál es la probabilidad de obtener cada
una de las seis posibles de secuencias en dicha región? Asuma que estos dos SNPs varían en
forma independiente entre sí.
23. La enfermedad de Wilson es una enfermedad hereditaria autosómica recesiva, con una inci-
1
dencia de alrededor de 50000 . Su principal efecto es la acumulación de cobre en los tejidos
manifestada por síntomas neurológicos, cataratas o enfermedades hepáticas.
Suponga que el primer hijo de una pareja de individuos asintomáticos, presenta dicha enferme-
dad. La pareja planea tener tres hijos más y desea conocer la probabilidad de que los tres sean
sanos. Calcule dicha probabilidad.
24. El 60 % de los individuos de una población están vacunados contra cierta enfermedad. Durante
una epidemia se sabe que el 20 % la contrajo y que el 2 % de los individuos están vacunados y
enfermaron. Calcule el porcentaje de individuos que contrajeron la enfermedad dentro de los
vacunados y el de vacunados entre los enfermos.
Sí No
0 ≤ P(M) ≤ 1
P(S) = 1
P(MF)
P(M/F) = P(F)
P(M) = 0, por lo tanto M es un suceso imposible
P(M) = 1, por lo tanto M es un suceso seguro
26. Sea un experimento consistente en seleccionar dos comprimidos de una producción y verificar
si la cantidad de un compuesto es la especificada (E) o no (N) en cada uno. En cada caso marque
la o las respuestas correctas.
48 Capítulo 2. Cálculo de probabilidades
(a) Indique cuál de los siguientes conjuntos es el espacio muestral del experimento dado:
S = {(x1 , x2 ) / 0 ≤ xi ≤ a }
S = {(EN), (EE), (NN), (NE)}
S = {(E) , (N)}
(b) Considere el suceso A: que al menos uno de los comprimidos posea la cantidad especifica-
da. La expresión de dicho subconjunto por extensión es:
A = {(NN), (EN), (NE)}
A = {(NE), (EN), (EE)}
(c) Considere el suceso B: que a lo sumo un comprimido posea la cantidad especificada,
entonces:
P(A ∪ B) = P(A) + P(B)
P(A ∪ B) = P(A) + P(B) − P(AB)
P(A ∪ B) = 1
(d) Considere el suceso C: que ambos comprimidos tengan la cantidad especificada y suponga
que P(E) = p, entonces:
P(C) = p2
P(C) = 2p
P(C) = (1 − p)2
(e) ¿Bajo qué supuesto importante, no aclarado, calculó P(C)?
Los sucesos son mutuamente excluyentes
Los sucesos son independientes
(a) ¿Cuál es la probabilidad de que al elegir al azar cuatro cajas de dicho medicamento (sin
reposición), todas hayan sido producidas por el laboratorio nacional?
(b) ¿Cuál es la probabilidad de que al elegir cuatro cajas (sin reposición), todas hayan sido
producidas por el mismo laboratorio?
(c) Calcule las probabilidades correspondientes a los incisos anteriores si la elección de las
cajas se efectuara con reposición.
29. En la Tabla 1.2 de la página 14 se resume la información de la variable número de hojas de las
60 plantas de girasol elegidas al azar en la estación experimental agropecuaria. En base a esa
información:
(a) Estime la probabilidad de que al elegira al azar una planta de girasol de esa misma pobla-
ción, la misma tenga:
● por lo menos 10 hojas.
2.4 Ejercicios propuestos 49
● 11 hojas.
● a lo sumo 8 hojas.
● entre 9 y 12 hojas (incluyendo ambos extremos).
(b) Si se eligen dos plantas al azar, ¿cómo estimaría la probabilidad de que una tenga 12 hojas?
30. Con la finalidad de estudiar la posible asociación entre dislipemia y eritrocitosis, se eligieron
al azar 297 mujeres con edades entre 19 y 89 años y se clasificaron según la concentración
de eritrocitos (normal o elevada) y según presentaran dislipemia o no. Se encontró que 24
presentaron eritrocitosis, 4 de ellas no tenían dislipemia. Las mujeres con dislipemia fueron
180.
31. Un investigador planteó la hipótesis de que si una proteína presenta una mayoría de residuos
hidrofóbicos, su localización sub-celular sería anclada en la membrana citoplasmática. Para
corroborarla clasificó una biblioteca de 7500 proteínas de secuencia y localización conocidas,
según se muestra a continuación:
Residuos
Localización
Mayoría hidrofóbicos Mayoría hidrofílicos
De membrana 2906 952
Citosólica 702 2940
(a) En base a estos resultados, ¿cuál es la probabilidad de que una proteína que tiene mayoría
de residuos hidrofóbicos se encuentre anclada a la membrana citoplasmática?
(b) ¿Cuál es la probabilidad de que una proteína que tiene mayoría de residuos hidrofóbicos
se encuentre soluble en el citosol?
(c) ¿Se puede concluir que la localización subcelular depende de la cantidad de residuos
hidrofóbicos? Justifique la respuesta.
2.5 Respuestas
1
6. (a) 4
2
(b) 4
2
(c) 3
1
7. (b) 4
2
(c) 4
1
(d) 4
12. 0.02
13. 0.683
23. 0.0156
26. (a) 2
(b) 2
(c) 2 y 3
(d) 1
(e) 2