Está en la página 1de 10

RESULTADOS NECESARIOS PARA HACER LOS EJERCICIOS

QUE SE PROPONEN A CONTINUACIÓN

INTERVALOS DE CONFIANZA

Intervalo de confianza de nivel 100(1 ↵)% de una proporción p


Condiciones: • el tamaño de la muestra grande (n > 30)
• 0.1  p̂  0.9
✓ r r ◆
p̂q̂ p̂q̂
IC100(1 ↵)% (p) = p̂ z1 (↵/2)
n
, p̂ + z1 (↵/2)
n

con p̂ = número de éxitos y q̂ = 1 p̂


total de individuos

CONTRASTES SOBRE UNA PROPORCIÓN

Hipótesis nulas: H0 : p = p0 , H0 : p  p0 o H0 : p p0
Hipótesis alternativas: H1 : p 6= p0 , H1 : p > p0 o H1 : p < p0

Condiciones: • el tamaño de la muestra grande (n > 30)


• 0.1  p0  0.9
estadı́stico de contraste

X n p0
Z= p , que sigue una ley N (0, 1) si H0 es cierta
n p0 q0

Con q0 = 1 p0
Para que una muestra sea válida en estos contrastes, sus pruebas deben ser independientes y la
probabilidad del éxito debe permanecer constante en cada prueba.
EJERCICIOS RESUELTOS DE CONTRASTES DE UNA PROPORCIÓN

1. Un modelo genético sugiere que al menos el 80% de las plantas obtenidas de un cruce entre dos
tipos de semillas serán de talla enana. Después de criar 196 de estas plantas, se encontró que 64 de
ellas habı́an alcanzado una talla normal.
a) Efectúe un contraste de hipótesis, a un nivel de significación del 5%, para decidir si estos datos
apoyan o contradicen el modelo genético propuesto.
b) Dar un intervalo de confianza al 90% para la proporción de plantas de talla enana.
c) Con la misma proporción estimada y la misma confianza, cómo mı́nimo, ¿cuántas plantas habrá
que examinar para que el error máximo en la estimación de la media poblacional sea menor que
0.1?
Solución:
a) Es un contraste sobre la proporción de planta de talla enana p. Se eligen al azar 196 plantas.
Definimos las variables
Xi : “talla de la planta i-ésima”, i = 1, 2, . . . , 120, donde
Xi ⇠ Ber p = P (una planta sea de talla enana)
La variable aleatoria X: “número de plantas de talla enana de un total de 196”, puede verse como
suma de las 196 v.a. anteriores que son independientes, por tanto:
P196
X = i=1 Xi ⇠ Bi n = 196, p = P (una planta sea de talla enana)
Las hipótesis que se contrastan son:
H0 : p 0.8;
como n = 196 30 y 0.1 < p0 = 0.8 < 0.9
H1 : p < 0.8
El estadı́stico de contraste es
X n · p0
Z=p ⇠ N (0, 1) si H0 es cierta
n · p0 · q0

Como ↵ = 0.05 y el contraste es unilateral a la izquierda tenemos que calcular el valor crı́tico,
que es el percentil
z0.05 = 1.65
X indica el número de plantas de talla enana que se han observado en la muestra, que son
196-64=132. El valor del estadı́stico de contraste es
132 196 · 0.8
zexp = p = 4.43
196 · 0.8 · 0.2

La región de rechazo es R = ( 1, 1.65] y la región de aceptación A = ( 1.65, +1).


Como 4.43 2 ( 1, 1.65] rechazo H0 a un nivel de significación ↵ = 0.05
b) La estimación puntual de p, es p̂ = número de éxitos = 132
196 = 0.67
total de individuos
Dado que n = 196 > 30 y 0.1  p̂ = 0.67  0.9 intervalo
✓ de confianza de nivel 100(1◆ ↵)% de
q q
proporción p en una ley normal es: IC100(1 ↵)% (p) = p̂ z1 2 · n , p̂ + z1 2 · p̂q̂

p̂q̂ ↵
n

• Si la confianza es del 90% entonces

100(1 ↵) = 90 =) 1 ↵ = 0.90 =) ↵ = 0.1 =) 1 ↵/2 = 0.95


✓ q q ◆
el intervalo de confianza al 90% es IC90% (p) = p̂ z0.95 · n , p̂ + z0.95 · p̂q̂
p̂q̂
n

z0.95 = 1.65 buscando 0.95 dentro de la tabla de la normal (0,1).


N�0,1�

z experimental

0.05 0.95

�4.43 �1.65
Región de Región de
rechazo aceptación

r r !
0.67(1 0.67) 0.67(1 0.67)
IC90% (p) = 0.67 1.65 · , 0.67 + 1.65 ·
196 196
= (0.67 0.055 , 0.67 + 0.055) = (0.615 , 0.725)
Este resultado podemos interpretarlo de dos formas diferentes:
(1) A partir de (0.615 , 0.725): con una confianza del 90% podemos decir que la proporción de
semillas de talla enana es un valor entre 0.615 y 0.725.
(2) A partir de (0.67 0.055 , 0.67 + 0.055) :la proporción de semillas de talla enana es 0.67 con un
error máximo de 0.055. La confianza es del 90%.

c) Para calcular el tamaño mı́nimo, considerando la misma proporción


✓ y la misma confianza, se consi-◆
q q
dera el intervalo de confianza para la proporción: IC90% (p) = p̂ z0.95 · n , p̂ + z0.95 · p̂q̂
p̂q̂
n
q
z0.95 · p̂q̂n es el error máximo que se comete al estimar p con una confianza del 90% y este error
máximo debe ser menor que 0.1, por tanto imponemos la condición:
r p
p
z0.95 · n < 0.1 =) z0.95 · 0.1p̂q̂ < n =) z20.95 0.1
p̂q̂ p̂q̂
2
<n

0.67(1 0.67)
=) 1.652 = 60.194 < n =) n 61
0.01
2. Para contrastar si la proporción de animales de una especie de ungulados, afectados por una
determinada morfologı́a genética, es superior al 20% se han elegido al azar 120 de estos animales, de
los cuales 20 estaban afectados.
a) Formule las hipótesis nula y alternativa adecuadas a este contraste y decida si puede admitirse
la hipótesis nula propuesta a un nivel ↵ = 0.10.
b) Dar un intervalo de confianza al 90% para la proporción de estoa animales afectados por la
alteración genética.
c) Con la misma proporción estimada y con una confianza del 99% , cómo mı́nimo, ¿cuántos animañ
les habrá que examinar para que el error máximo en la estimación de la media poblacional fuese
menor que 0.3?
Solución: Es un contraste sobre la proporción animales afectados por una determinada morfologı́a
genética p. Se eligen al azar 120 animales.
Definimos las variables
Xi : “presencia de la enfermedad en el animal i-ésimo”, i = 1, 2, . . . , 120, donde
Xi ⇠ Ber p = P (un animal presente la alteración genética)
La variable aleatoria X: “número de animales afectados por la alteración genética de un total de
120”, puede verse como suma de las 120 v.a. independientes anteriores, por tanto:
P120
X = i=1 Xi ⇠ Bi n = 120, p = P (un animal presente la alteración genética)
Las hipótesis que se contrastan son:
H0 : p  0.2;
como n = 120 30 y 0.1 < p0 = 0.2 < 0.9
H1 : p > 0.2
El estadı́stico de contraste es
X n · p0
Z=p ⇠ N (0, 1) si H0 es cierta
n · p0 · q0
Como ↵ = 0.1 y el contraste es unilateral a la derecha tenemos que calcular el valor crı́tico, que
es el percentil
z1 ↵ = z0.9 = 1.29
X indica el número de animales de una especie de ungulados, afectados por una determinada
morfologı́a que se han observado en la muestra, que son 20. El valor del estadı́stico de contraste es
20 120 · 0.2
zexp = p = 0.91
120 · 0.2 · 0.8
La región de rechazo es R = [1.29, +1) y la región de aceptación A = ( 1, 1.29).
Como 0.91 2 ( 1, 1.29] no rechazo H0 a un nivel de significación ↵ = 0.1

N�0,1�

z experimental
0.9 0.1

�0.91 1.29
Región de Región de
aceptación rechazo
b) La estimación puntual de p, es p̂ = número de éxitos = 120
20
= 0.17
total de individuos
Dado que n = 120 > 30 y 0.1  p̂ = 0.17  0.9 intervalo
✓ de confianza de nivel 100(1◆ ↵)% de
q q
proporción p en una ley normal es: IC100(1 ↵)% (p) = p̂ z1 2 · n , p̂ + z1 2 · p̂q̂

p̂q̂ ↵
n

• Si la confianza es del 90% entonces

100(1 ↵) = 90 =) 1 ↵ = 0.90 =) ↵ = 0.1 =) 1 ↵/2 = 0.95


✓ q q ◆
el intervalo de confianza al 90% es IC90% (p) = p̂ z0.95 · n , p̂ + z0.95 · p̂q̂
p̂q̂
n

z0.95 = 1.65 buscando 0.95 dentro de la tabla de la normal (0,1).


r r !
0.17(1 0.17) 0.17(1 0.17)
IC90% (p) = 0.17 1.65 · , 0.17 + 1.65 ·
120 120
= (0.17 0.057 , 0.17 + 0.057) = (0.113 , 0.227)

c) Para calcular el tamaño mı́nimo, considerando la misma proporción


✓ y la misma confianza, se consi- ◆
q q
dera el intervalo de confianza para la proporción: IC99% (p) = p̂ z0.995 · n , p̂ + z0.995 · p̂q̂
p̂q̂
n
q
z0.995 · p̂q̂n es el error máximo que se comete al estimar p con una confianza del 99% y este error
máximo debe ser menor que 0.3, por tanto imponemos la condición:
r p
p
z0.995 · n < 0.3 =) z0.995 · 0.3p̂q̂ < n =) z20.995 0.3
p̂q̂ p̂q̂
2
<n

0.17(1 0.17)
=) 2.582 = 10.44 < n =) n 11
0.09
3. Entre las moscas de la fruta obtenidas en un experimento genético, se han elegido al azar 100 de
ellas y se ha observado que el 16% presenta alguna mutación. Contraste, a un nivel del 10%, si la
verdadera proporción de moscas con mutaciones que resultan de este experimento es inferior al 20%.

Solución: Es un contraste sobre la proporción moscas de la fruta que presentan alguna mutación p.
Se eligen al azar 100 moscas.
Definimos las variables
Xi : “presencia de la mutación en la mosca i-ésima”, i = 1, 2, . . . , 100, donde
Xi ⇠ Ber p = P (la mosca presente alguna mutación genética)
La variable aleatoria X: “número de moscas que presentan alguna mutación genética de un total de
100”, puede verse como suma de las 100 v.a. independientes anteriores, por tanto:
P100
X = i=1 Xi ⇠ Bi n = 100, p = P (moscas que presentan alguna mutación genética)
Las hipótesis que se contrastan son:
H0 : p 0.2;
como n = 100 30 y 0.1  p0 = 0.2  0.9
H1 : p < 0.2
El estadı́stico de contraste es
X n · p0
Z=p ⇠ N (0, 1) si H0 es cierta
n · p0 · q0

Como ↵ = 0.1 y el contraste es unilateral a la izquierda tenemos que calcular el valor crı́tico, que
es el percentil
z↵ = z0.1 = 1.29
X indica en este ejercicio, el número de moscas que presentan la mutación, que son 16. El valor
del estadı́stico de contraste es
16 100 · 0.2
zexp = p = 1
100 · 0.2 · 0.8
La región de rechazo es R = ( 1, 1.29] y la región de aceptación A = ( 1.29, +1).
Como 1 2 ( 1.29, +1) no rechazo H0 a un nivel de significación ↵ = 0.1

N�0,1�

z experimental

0.1 0.9

�1
�1.29
Región de Región de
rechazo aceptación
4. Se cree que la incidencia de grafosis en un bosque de olmos es del 60%. Para contrastar la
veracidad de esta afirmación se examinan 120 olmos, de los cuales 75 están enfermos.
a) Dar un intervalo de confianza al 95% de la proporción de olmos enfermos. ¿Cuántos olmos
habrá que examinar para que el error máximo que se cometa en la estimación de la media
poblacional sea como mucho 0.15?
b) A un nivel de significación del 5% indique si los datos corroboran o no la hipótesis planteada
en el enunciado.

Solución:
a) La estimación puntual de p, es p̂ = número de éxitos = 120
75
= 0.625
total de individuos
Dado que n = 120 > 30 y 0.1  p̂ = 0.625  0.9 intervalo
✓ de confianza de nivel 100(1◆ ↵)% de
q q
proporción p en una ley normal es: IC100(1 ↵)% (p) = p̂ z1 ↵2 · p̂q̂
n , p̂ + z1 ↵ ·
2
p̂q̂
n

• Si la confianza es del 95% entonces

100(1 ↵) = 95 =) 1 ↵ = 0.95 =) ↵ = 0.05 =) 1 ↵/2 = 0.975


✓ q q ◆
el intervalo de confianza al 95% es IC95% (p) = p̂ z0.975 · n , p̂ + z0.975 · p̂q̂
p̂q̂
n

z0.975 = 1.96 buscando 0.975 dentro de la tabla de la normal (0,1).

r r !
0.625(1 0.625) 0.625(1 0.625)
IC95% (p) = 0.625 1.96 · , 0.625 + 1.96 ·
120 120
= (0.625 0.087 , 0.625 + 0.087) = (0.538 , 0.712)

Para calcular el tamaño mı́nimo, considerando la misma proporción


✓ y la misma confianza, se consi- ◆
q q
dera el intervalo de confianza para la proporción: IC95% (p) = p̂ z0.975 · n , p̂ + z0.975 · p̂q̂
p̂q̂
n
q
z0.975 · p̂q̂n es el error máximo que se comete al estimar p con una confianza del 95% y este error
máximo debe ser como mucho 0.15, por tanto imponemos la condición:
r p
p̂q̂ p̂q̂ p p̂q̂
z0.975 · n  0.15 =) z0.975 · 0.15  n =) z20.975
0.152
n

0.625(1 0.625)
=) 1.962 = 40.02  n =) n 41
0.152

b) Es un contraste sobre la incidencia de grafosis en un bosque de olmos. Se eligen al azar 120


olmos.
Definimos las variables
Xi : “presencia de grafosis en el olmo i-ésimo”, i = 1, 2, . . . , 120, donde
Xi ⇠ Ber p = P (un olmo presenta grafosis)
La variable aleatoria X: “número de olmos con grafosis de un total de 120”, puede verse como suma
de las 120 v.a. independientes anteriores, por tanto:
P120
X = i=1 Xi ⇠ Bi n = 120, p = P (un olmo presente grafosis)
Las hipótesis que se contrastan son:
H0 : p = 0.6;
como n = 120 30 y 0.1 < p0 = 0.6 < 0.9
H1 : p 6= 0.6
El estadı́stico de contraste es
X n · p0
Z=p ⇠ N (0, 1) si H0 es cierta
n · p0 · q0

Como ↵ = 0.05 y el contraste es bilateral tenemos que calcular dos valores crı́ticos, que son los
percentiles
z1 ↵/2 = z0.975 = 1.96; y z↵/2 = z0.025 = 1.96
X indica en este ejercicio, el número de olmos que presentan grafosis, que son 75. El valor del
estadı́stico de contraste es
75 120 · 0.6
zexp = p = 0.559
120 · 0.6 · 0.4
La región de rechazo es R = ( 1, 1.96][[1.96, +1) y la región de aceptación A = ( 1.96, 1.96).
Como 0.559 2 ( 1.96, 1.96) no rechazo H0 a un nivel de significación ↵ = 0.05

0.025
z experimental 0.025

�1.96 1.96
Región de Región de Región de
rechazo aceptación rechazo

Otra forma de hacer el contrate bilateral es ver si el valor 0.6 pertenece al intervalo de confianza
al 95%. Como 0.6 2 (0.538 , 0.712) no rechazo H0 a un nivel de significación del 5%.
5. Según un estudio sobre los niños que padecen dolor de pecho, realizado por Selbst, Ruddy y
Clark (Clinical Pediatrics, 1990), se ha hallado que de 137 niños que tenı́an dolor de pecho, 100
daban radiografı́as de tórax normales.
a) Obtener un intervalo de confianza del 98% para la proporción p de niños con dolor de pecho
que dan radiografı́as normales.
b) Hallar el mı́nimo tamaño muestral para que el error cometido en la estimación de proporción
de niños con dolor de pecho que dan radiografı́as normales, p, sea inferior a 0.06, con una
confianza del 98%.
c) Se cree que la prevalencia del dolor de pecho en los niños que tienen radiografı́as normales es
inferior al 70%, a un nivel de significación ↵ = 0.01 ¿ los datos corroboran o no la hipótesis
planteada?
Solución:
a) La estimación puntual de p, es p̂ = número de éxitos = 100 137 = 0.73
total de individuos
Dado que n = 137 > 30 y 0.1  p̂ = 0.73  0.9 intervalo
✓ de confianza de nivel 100(1◆ ↵)% de
q q
proporción p en una ley normal es: IC100(1 ↵)% (p) = p̂ z1 ↵2 · p̂q̂
n , p̂ + z ↵ ·
1 2
p̂q̂
n

• Si la confianza es del 98% entonces

100(1 ↵) = 98 =) 1 ↵ = 0.98 =) ↵ = 0.02 =) 1 ↵/2 = 0.99


✓ q q ◆
el intervalo de confianza al 98% es IC98% (p) = p̂ z0.99 · n , p̂ + z0.99 · p̂q̂
p̂q̂
n

z0.99 = 2.33 buscando 0.99 dentro de la tabla de la normal (0,1).


r r !
0.73(1 0.73) 0.73(1 0.73)
IC98% (µ) = 0.73 2.33 · , 0.73 + 2.33 ·
137 137
= (0.73 0.088 , 0.73 + 0.088) = (0.642 , 0.818)

b) Para calcular el tamaño mı́nimo, considerando la misma proporción


✓ y la misma confianza, se consi-◆
q q
dera el intervalo de confianza para la proporción: IC98% (p) = p̂ z0.99 · n , p̂ + z0.99 · p̂q̂
p̂q̂
n
q
z0.99 · p̂q̂n es el error máximo que se comete al estimar p con una confianza del 98% y este error
máximo debe ser menor que 0.06, por tanto imponemos la condición:
r p
p̂q̂ p̂q̂ p p̂q̂
z0.99 · n < 0.06 =) z0.99 · 0.06 < n =) z20.99
0.062
<n

0.73(1 0.73)
=) 2.332 = 297.23 < n =) n 298
0.062

b) Es un contraste el dolor de pecho en niños. Se eligen al azar 137 niños.


Definimos las variables
Xi : “dolor de pecho en el niño i-ésimo”, i = 1, 2, . . . , 120, donde
Xi ⇠ Ber p = P (presencia de dolor de pecho en un niño)
La variable aleatoria X: “número de niños con dolor de pecho de un total de 137”, puede verse como
suma de las 137 v.a. independientes anteriores, por tanto:
P137
X = i=1 Xi ⇠ Bi n = 137, p = P (presencia de dolor de pecho en un niño)
Las hipótesis que se contrastan son:
H0 : p 0.7;
como n = 137 30 y 0.1 < p0 = 0.7 < 0.9
H1 : p < 0.7
El estadı́stico de contraste es
X n · p0
Z=p ⇠ N (0, 1) si H0 es cierta
n · p0 · q0

Como ↵ = 0.01 y el contraste es unilateral a la izquierda tenemos que calcular un valor crı́tico ,
que es el percentil
z↵ = z0.01 = 2.33
X indica en este ejercicio, el número de niños que tienen dolor de pecho, que son 100. El valor
del estadı́stico de contraste es
100 137 · 0.7
zexp = p = 0.764
137 · 0.7 · 0.3

No rechazo H0 a un nivel de significación ↵ = 0.01

0.01 z experimental

�2.33
Región de Región de
rechazo aceptación

También podría gustarte