Está en la página 1de 5

Certamen Recuperativo de Bioestadı́stica

Profesores Patricio Cumsille Atala - Hellen Pezo Llanos

29 Julio de 2010

P1 [30 puntos]. Los funcionarios de un consultorio registran su hora de ingreso. Los retrasos (en
minutos) obtenidos, se resumen en la tabla siguiente, cuyas clases son de ancho constante.

Clases Frec. Abs. Frec. Rel. Frec. Abs. Acum. Frec. Rel. Acum. Marca de clase
11 - 23 7 7/100 7 7/100 17
23 - 35 9 9/100 16 16/100 29
35 - 47 20 20/100 36 36/100 41
47 - 59 35 35/100 71 71/100 53
59 - 71 18 18/100 89 89/100 65
71 - 83 11 11/100 100 1 77

(a) Complete la tabla de frecuencias anterior, rellenando los espacios en blanco.


(b) Calcule e interprete la media y la mediana.
(c) Calcule e interprete el cuartil Q1 y el percentil P95 .
(d) Calcule e interprete la desviación estándar.
(e) ¿Entre qué valores está comprendido el 90 % central de los retrasos de los funcionarios?

Solución: El ı́tem (a) se responde rellenando los espacios en blanco en la misma tabla dada en el
enunciado. Los datos con letra en negrilla corresponden a los que fueron dados en el enunciado [6
puntos].

(b) Primero calculamos la media aritmética:


6
1X 1 5072
X̄ = ni · xi = (7 · 17 + 9 · 29 + 20 · 41 + 35 · 53 + 18 · 65 + 11 · 77) = = 50, 72.
n 100 100
i=1

O sea el retraso promedio de los 100 funcionarios del consultorio es de 50,72 minutos [3 puntos].
Ahora calculamos la mediana. Esta se encuentra en la cuarta clase, porque allı́ se supera por
primera vez la mitad de los 100 datos. Luego:
50 − 36
Med = 47 + · 12 = 51, 8.
35
O sea el retraso del 50 % de los funcionarios del consultorio es inferior o igual a 51,8 minutos
(y por ende el retraso del 50 % restante es superior o igual a 51,8 minutos) [3 puntos].
(c) Calculamos primero el primer cuartil Q1 = P25 . Este se encuentra en la tercera clase, porque
allı́ se supera por primera vez el 25 % de los 100 datos. Luego:
25 − 16
Q1 = P25 = 35 + · 12 = 40, 4.
20
O sea el retraso del 25 % de los funcionarios es inferior o igual a 40,4 minutos [3 puntos].
Ahora calculemos el percentil P95 . Este se encuentra en la última clase, porque sólo allı́ se
supera por primera vez el 95 % de los 100 datos. Luego:
95 − 89
P95 = 71 + · 12 = 77, 6 (aprox.)
11
O sea el retraso del 95 % de los funcionarios es inferior o igual a 77,6 minutos [3 puntos].
(d) Primero calculamos la varianza:
6
1X
S2 = ni · x2i − X̄ 2
n
i=1
1 ¡ ¢
= 7 · 172 + 9 · 292 + 20 · 412 + 35 · 532 + 18 · 652 + 11 · 772 − 50, 722
100
282796
= − 2572, 5184 = 255, 4416.
100
Por lo tanto la desviación estándar es:
p
S = 255, 4416 = 15, 98 (aprox.) [3 puntos].

Dado que los datos varı́an entre 11 y 83, el valor anterior es comparable a los mismos, y por lo
tanto, podemos decir que estos son relativamente heterogéneos [3 puntos].
(e) Entre el percentil 5 y el percentil 95. Como ya calculamos el percentil 95 P95 en la parte (c),
sólo hay que calcular el percentil 5 P5 [3 puntos]. Este se encuentra en la primera clase, porque
allı́ ya se supera el 5 % de los datos. Luego:
5−0
P5 = 11 + · 12 = 19, 6 (aprox.) [2 puntos].
7
Notemos que al estar P5 en la primera clase la frecuencia absoluta acumulada hasta la clase
anterior es cero (no hay clase anterior a la primera). Ası́, el 90 % central de los retrasos de los
funcionarios fluctua entre los 19,6 y 77,6 minutos [1 punto].

P2 [18 puntos].
Sea X la concentración de plomo en partes por millón en la corriente sanguı́nea de un individuo.
Supongamos que X es una variable normal con media 0,25 y desviación tı́pica 0,11. Una concen-
tración igual o superior a 0,6 partes por millón se considera extremadamente alta.

(a) ¿Cuál es la probabilidad de que un individuo seleccionado al azar esté incluido en esta categorı́a?
(b) ¿Cuál es la concentración mı́nima del 30 % de los individuos con más concentración?
(c) ¿Cuál es la mediana de la concentración?

Solución: Como siempre en estos ejercicios, introducimos la variable tipificada o estandarizada


Z := X−µ
σ , donde en este caso, µ = 0, 25 y σ = 0, 11 (partes por millón).

(a) Interpretando en sı́mbolos matemáticos la probabilidad pedida, esta se traduce en:

P(X ≥ 0, 6) = P(Z ≥ (0, 6 − 0, 25)/0, 11) = P(Z ≥ 3, 18) ≈ P(Z ≥ 3, 09) = 0, 0010.

Notemos que hemos utilizado el valor 3,09 puesto que es aquel que está más cercano a 3,18
[4 puntos]. Ası́, la probabilidad de que un individuo seleccionado al azar esté incluido en
esta categorı́a es (inferior a) 0,1 % (o sea, la probabilidad de que un individuo tenga una
concentración de plomo extremadamente alta es muy baja) [2 puntos].
(b) Llamemos por x a la concentración mı́nima del 30 % de los individuos con más concentración,
esto es:
P(X ≥ x) = 0, 30 ⇐⇒ P(Z ≥ z) = 0, 30,
donde z = x−0,25
0,11 [3 puntos]. Según tabla normal, el valor z para el cual el área o probabilidad
superior es 0,3015 es z = 0, 52. Luego:
x − 0, 25
0, 52 = =⇒ x = 0, 52 · 0, 11 + 0, 25 = 0, 3072 [2 puntos].
0, 11
Es decir la concentración mı́nima de plomo del 30,15 % de los individuos con más concentración
es 0,3072 (partes por millón) [1 punto].
(c) Como la distribución normal es simétrica con respecto a la media, entonces la mediana coincide
con la media, es decir, la mediana de la concentración es 0,25 (partes por millón) [6 puntos].

P3 [10 puntos].
En una investigación sobre la influencia de la dieta alimenticia sobre la diabetes se han utilizado
tres tipos de ratas A, B y C, en las siguientes proporciones: 60 %, 30 % y 10 %. El 25 % de las ratas
de tipo A padecen diabetes y el 35 % de las ratas diabéticas del tipo A presentan además una lesión
en el hı́gado. Si se elige una rata al azar. ¿cuál es la probabilidad de que sea de tipo A, diabética y
tenga el hı́gado lesionado?
Solución: Definamos los siguientes eventos [2 puntos]:

A : una rata escogida al azar es de tipo A,


Diab : una rata escogida al azar padece diabetes,
Les : una rata escogida al azar presenta una lesión en el hı́gado.

Interpretando adecuadamente el enunciado tenemos que [3 puntos]:

P(A) = 0, 60
P(Diab|A) = 0, 25
P(Les|Diab ∩ A) = 0, 35.

La probabilidad pedida es P(A∩Diab∩Les) [2 puntos]. Esta se calcula utilizando la regla o fórmula


de la probabilidad compuesta:

P(A1 ∩ A2 ∩ . . . ∩ An ) = P(A1 ) · P(A2 |A1 ) · P(A3 |A2 ∩ A1 ) · . . . · P(An |An−1 ∩ An−2 ∩ . . . ∩ A1 )

En este caso tenemos la intersección de n = 3 sucesos:

P(A1 ∩ A2 ∩ A3 ) = P(A1 ) · P(A2 |A1 ) · P(A3 |A2 ∩ A1 )

Aplicando la fórmula anterior para A1 := A, A2 := Diab y A3 := Les tenemos que:

P(A ∩ Diab ∩ Les) = P(A) · P(Diab|A) · P(Les|Diab ∩ A) = 0, 60 · 0, 25 · 0, 35 = 0, 0525 [2 puntos].

Luego, la probabilidad de que una rata escogida al azar sea de tipo A, diabética y tenga el hı́gado
lesionado es de 5,25 % [1 punto].

P4 [12 puntos]. La probabilidad de presentar una caracterı́stica genética es de 1/20.

(a) Tomando una muestra de 8 individuos, calcule la probabilidad de que 3 individuos presenten
la caracterı́stica.
(b) Tomando una muestra de 100 personas, ¿cuál será la probabilidad de que aparezcan más de 6
individuos con la caracterı́stica?
Solución: Definamos la variable aleatoria X: número de individuos que presentan una cierta car-
acterı́stica genética. Es claro que esta variable sigue una distribución binomial de parámetros n y
p = 1/20.

(a) En este caso n = 8, o sea X ; B(8, 1/20) [3 puntos]. Nos piden P(X = 3):
µ ¶ µ ¶3 µ ¶5
8 1 19
P(X = 3) = · · = 0, 0054 (según tabla binomial) [3 puntos].
3 20 20

(b) Ahora n = 100 y nos piden P(X > 6). Hay dos formas posibles de hacer este ejercicios. Veremos
las dos, puesto que ambas son válidas, aunque una es mejor que otra.
1o forma: Esta es la forma directa, pero requiere del uso de una buena calculadora cientı́fica
para calcular las probabilidades binomiales, puesto que la tabla binomial sólo da los valores
hasta n = 20.
Considerando que X ; B(n = 100, p = 1/20), obviamente conviene calcular P(X ≤ 6):
6
X 6 µ
X ¶ µ ¶k µ ¶100−k
100 1 19
P(X ≤ 6) = P(X = k) = · ·
k 20 20
k=0 k=0
= 0, 005920529 + 0, 03116068 + 0, 081181772 + 0, 139575678 + 0, 178142642
+0, 180017827 + 0, 150014856 = 0, 766013984 [4 puntos].

Por lo tanto, P(X > 6) == 1 − P(X ≤ 6) = 1 − 0, 766013984 = 0, 233986016 [1 punto]. O sea,


la probabilidad de que aparezcan más de 6 individuos con la caracterı́stica genética es 23,4 %
(aprox.) [1 punto].
2o forma: Esta es la forma más astuta, y no requiere del uso de una calculadora sofisticada,
sino que sólo se requiere la tabla normal.
Como 
n = 100 > 30 
n·p=5>4 [1 punto],

n · q = 95 > 4
entonces podemos considerar que X se distribuye aprox. en forma normal, es decir,

X ; N (µ, σ 2 ),

donde µ = n · p = 5, y σ 2 = n · p · q = 4, 75 [2 puntos]. Luego, la probabilidad pedida P(X > 6)


se calcula estandarizando. Definiendo Z := (X − µ)/σ tenemos que:

P(X > 6) = P(Z > (6 − 5)/2, 18) = P(Z > 0, 46) = 0, 3228 [2 puntos].

O sea, la probabilidad de que aparezcan más de 6 individuos con la caracterı́stica genética es


32,3 % (aprox.) [1 punto].

P5 [30 puntos] Se ha medido el volumen diario de bilis, expresado en litros, en 10 individuos sanos,
obteniéndose:
0, 98; 0, 85; 0, 77; 0, 92; 1, 12; 1, 06; 0, 89; 1, 01; 1, 21; 0, 77.
Suponiendo que la muestra ha sido obtenida por muestreo aleatorio simple desde una población
normal, se pide:

(a) ¿Cuál tiene mayor amplitud, un intervalo de confianza al nivel 0,95 ó 0,99? Conteste razonada-
mente.
(b) Calcule la media X̄ y la cuasivarianza Ŝ 2 de volumen diario de bilis para la muestra de los 10
individuos sanos.
(c) Hallar un intervalo de confianza para la producción diaria media de bilis en individuos sanos,
sabiendo que la desviación tı́pica de la población es de 0,2.
(d) Hallar un intervalo de confianza para la producción diaria media de bilis en individuos sanos.
(e) Hallar un intervalo de confianza para la varianza de la producción diaria media de bilis en
individuos sanos.

Solución:

(a) Tiene mayor amplitud un I.C. al nivel 0,99 [3 puntos], puesto que a mayor nivel de confianza,
mayor amplitud [3 puntos].
(b) Media [3 puntos]:
1
X̄ = (0, 98 + 0, 85 + 0, 77 + 0, 92 + 1, 12 + 1, 06 + 0, 89 + 1, 01 + 1, 21 + 0, 77) = 0, 958
10
Cuasivarianza [3 puntos]:
1¡ ¢
Ŝ 2 = 0, 982 + 0, 852 + 0, 772 + 0, 922 + 1, 122 + 1, 062 + 0, 892 + 1, 012 + 1, 212 + 0, 772
9
10
− · 0, 9582 ≈ 0, 0213
9

(c) Aplicamos la fórmula para varianza conocida (σ 2 = 0, 22 ), tomando un nivel de confianza de


0,95. Ası́ α = 0, 05 =⇒ α/2 = 0, 025 [2 puntos] y por lo tanto z1−α/2 = 1, 96 (según tabla
normal) [2 puntos]. Luego:
· ¸
σ
µ ∈ X̄ ± z1−α/2 √ = [0, 958 ± 0, 124] = [0, 834; 1, 082] [2 puntos].
n

(d) Aplicamos la fórmula general (varianza poblacional desconocida), tomando un nivel de confi-
anza de 0,95. Ası́ α/2 = 0, 025 [2 puntos] y luego tn−1;1−α/2 = t9;0,975 = 2, 262 (según tabla t
de student) [2 puntos]. Por lo tanto:
" #

µ ∈ X̄ ± tn−1;1−α/2 √ = [0, 958 ± 0, 104] = [0, 854; 1, 062] [2 puntos].
n

(e) El I.C. para la varianza es: " #


(n − 1)Ŝ 2 (n − 1)Ŝ 2
σ2 ∈ ,
χ2n−1;1−α/2 χ2n−1;α/2

En este caso, como el nivel de confianza es 95 %, entonces α/2 = 0, 025 [2 puntos] y χ2n−1;α/2 y
χ2n−1;1−α/2 corresponden a los percentiles de orden α/2 y 1−α/2 de la distribución chi-cuadrado
con 9 grados de libertad, los cuales se determinan por la condiciones siguientes:

P(χ2n−1 > χ2n−1;α/2 ) = 1 − α/2 = 0, 975 P(χ2n−1 > χ2n−1;1−α/2 ) = α/2 = 0, 025.

Por lo tanto:
χ29;0,025 = 2, 70 χ29;0,975 = 19, 02 [2 puntos].
Luego el I.C. al nivel 95 % es:

σ 2 ∈ [0, 01; 0, 071] [2 puntos].

También podría gustarte