Está en la página 1de 95

Contraste de Hipótesis

Estadística Teórica II

CONTRASTE DE HIPÓTESIS

Santiago de la Fuente Fernández 93


Contraste de Hipótesis
RELACIÓN: INTERVALOS CONFIANZA - CONTRASTE HIPÓTESIS

Intervalo de confianza para la media μ de una distribución


normal N(μ, σ) de varianza conocida:
σ σ
⎧media error ⎫ x − zα ≤ μ ≤ x + zα
⎪muestral
muestral
6474 8⎪ 2
n 2
n
⎪ } σ ⎪ σ σ
I1− α (μ) = ⎨ x ± zα ⎬ − zα ≤ x − μ ≤ zα
⎪ 2
n⎪ 2
n 2
n
⎪ ⎪ σ
⎩ ⎭ x − μ ≥ zα
2
n

Hipótesis sobre la media de una población con σ2 conocida : REGIÓN DE RECHAZO


⎧⎪ σ ⎫⎪
H 0 : μ = μ 0 H1 : μ ≠ μ 0 R = ⎨ x − μ 0 > z α /2 ⎬ bilateral (compuesta)
⎪⎩ n ⎪⎭
⎧⎪ σ ⎫⎪
H 0 : μ = μ 0 H1 : μ1 > μ 0 R = ⎨ x −μ0> zα ⎬ unilateral (simple)
⎪⎩ n ⎪⎭
⎧ z α = − z 1− α
} ⎫
⎪ σ ⎪
H 0 : μ = μ 0 H1 : μ1 < μ 0 R = ⎨ x − μ0 < z 1− α ⎬ unilateral (simple)
⎪⎩ n ⎪⎭

Intervalo de confianza para la media μ de una distribución normal


N(μ, σ) de varianza desconocida con muestras pequeñas n ≤ 30
⎧media error
muestral

⎪muestral 6 4 4744 8 ⎪n σ2x = (n−1) s2x
⎪ } sx ⎪ 6 474 8 ⎧
⎪ σ x ⎫⎪
I1− α (μ) = ⎨ x ± tα ⎬ 14 4 ≡
2 4 43 ⎨x ± t α ⎬
⎪ 2
, (n−1) n ⎪ 2 ⎪⎩ 2
, (n−1) n − 1 ⎪⎭
sx σ2
⎪ ⎪ = x
⎩ ⎭ n n−1

sx sx sx sx
x − tα ≤ μ ≤ x + tα tα ≤ x − μ ≤ tα
2
, (n−1) n 2
, (n−1) n 2
, (n−1) n 2
, (n−1) n
sx
x − μ ≥ tα
2
, (n−1) n

Hipótesis sobre la media de una población con σ2 desconocida : REGIÓN DE RECHAZO


⎧ sx ⎫
H 0 : μ = μ 0 H1 : μ ≠ μ 0 R = ⎨ x − μ 0 > t α / 2 ; (n −1) ⎬ bilateral (compuesta)
⎩ n ⎭
⎧⎪ s x ⎫⎪
H 0 : μ = μ 0 H 1 : μ 1 > μ 0 R = ⎨ x − μ 0 > t α ; (n−1) ⎬ unilateral (simple)
⎪⎩ n ⎪⎭
⎧ t α ; n = − t 1− α ; n
} ⎫
⎪ sx ⎪
H 0 : μ = μ 0 H1 : μ1 < μ 0 R = ⎨ x − μ 0 < t 1− α ;(n−1) ⎬ unilateral (simple)
⎪⎩ n⎪

Santiago de la Fuente Fernández 94


Contraste de Hipótesis

Intervalo de confianza para la diferencia de medias (μ 1 − μ 2 ) de dos distribuciones


normales N(μ 1, σ 1 ) , N(μ 2 , σ 2 ) con varianzas poblacionales conocidas:

⎧ error
muestral

⎪ diferencia 6447448 ⎪
⎪ 6muestral
4748 σ21 σ22 ⎪⎪

I1− α (μ 1 − μ 2 ) = ⎨ (x − y) ± z α + ⎬
⎪ 2
n 1 n2 ⎪
⎪ ⎪
⎪⎩ ⎪⎭
de donde,

σ21 σ22 σ21 σ22


(x − y) − z α + ≤ (μ 1 − μ 2 ) ≤ (x − y) + z α +
2
n1 n2 2
n1 n2

σ21 σ22
(x − y) − (μ 1 − μ 2 ) ≥ z α +
2
n1 n2

Santiago de la Fuente Fernández 95


Contraste de Hipótesis
Contraste de igualdad de medias de dos poblaciones normales con varianzas conocidas:
REGIÓN DE RECHAZO
⎧ σ 12 σ 22 ⎫⎪

H0 : μ1 = μ 2 R = ⎨ (x − y ) − 0 > z α 2 + ⎬ bilateral
⎪⎩ n1 n2 ⎪

⎧ σ 12 σ 22 ⎫⎪

H0 : μ1 − μ 2 = k R = ⎨ x − y − k > z α /2 + ⎬ bilateral
⎪⎩ n1 n2 ⎪

⎧ σ 12 σ 22 ⎫⎪

H0 : μ1 − μ 2 ≤ k R = ⎨ x − y − k > zα + ⎬ unilateral
⎪⎩ n1 n2 ⎪

⎧ σ 12 σ 22 ⎫⎪

H0 : μ1 − μ 2 ≥ k R = ⎨ x − y − k < z 1− α + ⎬ unilateral
⎪⎩ n1 n2 ⎪

⎧ σ 12 σ 22 ⎫⎪

H0 : μ 1 ≤ μ 2 R = ⎨x − y > zα + ⎬ unilateral
⎪⎩ n1 n2 ⎪

⎧ z α = − z 1− α ⎫
⎪ } σ 12 σ 22 ⎪
H0 : μ 1 ≥ μ 2 R = ⎨x−y > z 1− α + ⎬ unilateral
⎪⎩ n1 n2 ⎪

CONTRASTE HIPÓTESIS

Contraste de la media de una población normal N (μ, σ) con varianza σ2 conocida:

a) CONTRASTE BILATERAL o DE DOS COLAS

Hipótesis nula: H 0 : μ = μ 0 Hipótesis alternativa: H 1 : μ ≠ μ 0

Como la hipótesis alternativa es μ ≠ μ 0 en la decisión que hayamos de tomar deberán


ser válidos los valores de μ mayores o menores que μ 0 , por lo cual el contraste debe
ser bilateral o de dos colas.

⎧⎪ Si x ≤ k se acepta la hipótesis nula H 0 (Región Aceptación)


Regla de decisión ⎨
⎪⎩ Si x > k se rechaza la hipótesis nula H 0 (Región Rechazo)

⎛ σ ⎞⎟
De otra parte, en la distribución del muestreo x ≈ N ⎜⎜ μ, , que bajo la hipótesis nula
⎝ n ⎟⎠
⎛ σ ⎞⎟ x − μ0
x ≈ N ⎜⎜ μ 0 , ⎟ , con lo que la variable es N(0, 1).
⎝ n⎠ σ n
El valor crítico k se calcula mediante el error de significación α :

Santiago de la Fuente Fernández 96


Contraste de Hipótesis

⎡ ⎛ σ ⎞⎟ ⎤ ⎡ x − μ0 ⎤
[ ]
α = P Rechazar H 0 / H 0 es cierta = P ⎢ x > k / N ⎜⎜ μ 0 , ⎥ = P ⎢ > K ⎥ =
⎢⎣ ⎝ n ⎟⎠ ⎥⎦ ⎢⎣ σ n ⎥⎦
simetría N(0, 1)
⎡⎛ x − μ 0 ⎞ ⎛x − μ0 ⎞⎤ ⎡x − μ 0 ⎤ ⎡x − μ 0 ⎤ 678 α α
= P ⎢⎜⎜ < −K ⎟⎟ ∪ ⎜⎜ > K ⎟⎟ ⎥ = P ⎢ < −K ⎥ + P ⎢ > K⎥ = +
⎢⎣⎝ σ n ⎠ ⎝ σ n ⎠⎦⎥ ⎢
⎣ σ n ⎥
⎦ ⎢
⎣ σ n ⎥
⎦ 2 2

x − μ0 ⎧⎪ σ ⎫⎪
La región crítica será > zα 2 ⇒ R = ⎨ x − μ 0 > zα 2 ⎬
σ n ⎪⎩ n ⎪⎭

En otras palabras,

x − μ0
Se acepta H 0 si ≤ zα 2
σ n

x − μ0
Se rechaza H 0 si > zα 2
σ n

b) CONTRASTE UNILATERAL o DE UNA COLA

Hipótesis nula: H 0 : μ = μ 0 Hipótesis alternativa: H 1 : μ 1 > μ 0

Como la hipótesis alternativa es μ 1 > μ 0 en la decisión que hayamos de tomar solo son
válidos los valores de μ 1 mayores que μ 0 , por lo cual el contraste debe ser unilateral o
de una cola.

⎧ Si x ≤ k se acepta la hipótesis nula H 0 (Región Aceptación)


Regla de decisión ⎨
⎩ Si x > k se rechaza la hipótesis nula H 0 (Región Rechazo)

⎛ σ ⎞⎟
De otra parte, en la distribución del muestreo x ≈ N ⎜⎜ μ,
⎝ n ⎟⎠

Bajo la hipótesis nula:


⎛ σ ⎞⎟
x ≈ N ⎜⎜ μ 0 ,
⎝ n ⎟⎠
Bajo la hipótesis alternativa:
⎛ σ ⎞⎟
x ≈ N ⎜⎜ μ 1,
⎝ n ⎟⎠
Para hallar el valor crítico K recurrimos al Error Tipo I:

Santiago de la Fuente Fernández 97


Contraste de Hipótesis

⎡ ⎛ σ ⎞⎟ ⎤ ⎡x − μ 0 ⎤
[ ]
α = P [ ET I ] = P Rechazar H 0 / H 0 es cierta = P ⎢ x > k / N ⎜⎜ μ 0 , ⎥ = P ⎢ > K ⎥
⎢⎣ ⎝ n ⎟⎠ ⎥⎦ ⎢⎣ σ n ⎥⎦

x − μ0 ⎧⎪ σ ⎫⎪
La región crítica será > zα ⇒ R = ⎨ x − μ 0 > zα ⎬
σ n ⎪⎩ n ⎪⎭

En otras palabras,

x − μ0
Se acepta H 0 si ≤ zα
σ n

x − μ0
Se rechaza H 0 si > zα
σ n

Contraste de igualdad de medias de dos poblaciones normales con varianzas


conocidas

a) CONTRASTE BILATERAL o DE DOS COLAS

Hipótesis nula: H 0: μ 1 − μ 2 = 0 Hipótesis alternativa: H 1: μ 1 − μ 2 ≠ 0

⎧⎪ Si x − y ≤ k no se rechaza H0 a (RA)
La regla de decisión será: ⎨
⎪⎩Si x − y > k se rechaza H0 a (RC)

♦ La región crítica de dos colas x − y > k es función de la diferencia de las medias


muestrales. En esta línea, las distribuciones en el muestreo de las medias son:

⎡ σ1 ⎤ ⎡ σ2 ⎤
x ≈ N ⎢μ 1 , ⎥ , y ≈ N ⎢μ 2 , ⎥ , con lo cual, la diferencia de medias muestrales,
⎢⎣ n1 ⎥⎦ ⎢⎣ n 2 ⎥⎦
⎡ σ 12 σ 22 ⎤
bajo la hipótesis nula H0 : μ 1 − μ 2 = 0 , se distribuye: x − y ≈ N ⎢0 , + ⎥
⎢ n1 n2 ⎥
⎣ ⎦

El valor crítico k se determina mediante el error tipo I:

α = P (ET I) = P (Re chazar H0 H0 cierta) = P [ ]


x − y > k / H0 : μ 1 − μ 2 = 0 =

Santiago de la Fuente Fernández 98


Contraste de Hipótesis
⎡ ⎤
( x − y) − 0
= P⎢ >K⎥ =
⎢ (σ21 n 1 ) + (σ22 n 2) ⎥
⎣ ⎦
⎡⎛ ⎞ ⎛ ⎞⎤
⎜ x−y ⎟ ⎜ x−y ⎟
= P ⎢⎜ < − K⎟ ∪ ⎜ > K ⎟⎥ =
⎢⎜ (σ 21 n 1 ) + (σ22 n 2) ⎟ ⎜ (σ 21 n 1 ) + (σ 22 n 2) ⎟⎥
⎣⎢ ⎝ ⎠ ⎝ ⎠ ⎦⎥
⎡⎛ ⎞⎤ ⎡⎛ ⎞⎤
⎜ x−y ⎟⎥ ⎜ x−y ⎟ α α
= P⎢⎜ < − K⎟ + P ⎢ ⎜ > K ⎟⎥ = + (simetría)
⎢⎜ (σ21 n 1 ) + (σ22 n 2) ⎟⎥ ⎢⎜ (σ21 n 1 ) + (σ22 n 2) ⎟⎥ 2 2
⎣⎝ ⎠⎦ ⎣⎝ ⎠⎦

La región crítica es

⎧ σ 12 σ 22 ⎫⎪
x−y ⎪
> zα 2 a R = ⎨ (x − y) > z α 2 + ⎬
(σ21 n 1 ) + (σ22 n 2 ) ⎪⎩ n1 n2 ⎪

x−y
En otras palabras, se acepta la hipótesis nula H 0 si: ≤ zα 2
(σ21
n 1 ) + (σ22 n 2 ) {
estadístic o
14444244443 teórico
estadístic o
observado

x−y
se rechaza la hipótesis nula H 0 si: > zα 2
(σ21 n 1 ) + (σ22 n 2 ) {
estadístic o
14444244443 teórico
estadístic o
observado

b) CONTRASTE UNILATERAL o DE UNA COLA

Hipótesis nula: H 0: μ 1 − μ 2 = Ko Hipótesis alternativa: H 1: μ 1 − μ 2 > K o

⎧ Si (x − y) ≤ k no se rechaza H0 a (RA)
La regla de decisión será: ⎨
⎩Si (x − y) > k se rechaza H0 a (RC)

♦ La región crítica de una cola (x − y) > k es función de la diferencia de las medias


muestrales. En esta línea, las distribuciones en el muestreo de las medias son:

⎡ σ1 ⎤ ⎡ σ2 ⎤
x ≈ N ⎢μ 1 , ⎥ , y ≈ N ⎢μ 2 , ⎥ , con lo cual, la diferencia de medias muestrales,
⎢⎣ n1 ⎥⎦ ⎢⎣ n 2 ⎥⎦
⎡ σ 12 σ 22 ⎤

x − y ≈ N (μ 1 − μ 2 ) , + ⎥ , bajo la hipótesis nula H0: μ 1 − μ 2 = Ko ,
⎢ n1 n2 ⎥
⎣ ⎦
⎡ σ 12 σ 22 ⎤

x − y ≈ N Ko , + ⎥
⎢ n1 n2 ⎥
⎣ ⎦

Santiago de la Fuente Fernández 99


Contraste de Hipótesis
El valor crítico K se determina mediante el nivel de significación α:

[
α = P (ET I) = P (Rechazar H0 H0 cierta) = P (x − y) > k / H0 : μ 1 − μ 2 = K o = ]
⎡ ⎤ ⎡ ⎤
( x − y) − K o k − Ko k − Ko
= P⎢ > ⎥ = P ⎢z > ⎥
⎢ (σ21 n 1 ) + (σ22 n 2 ) (σ21 n 1 ) + (σ22 n 2 ) ⎥⎦ ⎢ (σ21 n 1 ) + (σ22 n 2 ) ⎥⎦
⎣ ⎣

k − Ko
con lo cual, el valor crítico se despeja = zα.
(σ21 n 1 ) + (σ22 n 2 )

Comprobando después si se verifica o no la evidencia empírica (x − y) > k

( x − y) − K o
De otra parte, la región crítica > zα
(σ21 n 1 ) + (σ22 n 2 )

por tanto, la región de rechazo: R = ⎡⎢( x − y) − K o > z α (σ21 n 1 ) + (σ22 n 2 ) ⎤⎥


⎣ ⎦

Santiago de la Fuente Fernández 100


Contraste de Hipótesis
CÁLCULO DEL ERROR TIPO I, DEL TIPO II Y POTENCIA, DADAS LAS HIPÓTESIS SIMPLES

⎧ α ≡ probabilidad de rechazar la hipótesis nula H 0 siendo cierta (Error Tipo I)




⎪ β ≡ probabilidad de aceptar la hipótesis nula H 0 siendo falsa (Error Tipo II)

1 − β ≡ probabilidad de rechazar la hipótesis nula H 0 siendo falsa (Potencia Contraste)

ƒ Los errores están relacionados, al disminuir el uno aumenta el otro:

α = P (Error Tipo I) = 0 a Rechazar siempre H 1 ⇔ β = P (Error Tipo II) = 1

β = P (Error Tipo II) = 0 a Rechazar siempre H 0 ⇔ α = P (Error Tipo I) = 1

Un contraste debería buscar simultáneamente el nivel de significación α más bajo


posible y la potencia 1 − β más alta posible.
Fijado el nivel de significación, se determina la región de rechazo cuya potencia es
mayor entre todos los contrastes cuyo tamaño sea el fijado a priori.

La única posibilidad para conseguir que un contraste mejore su potencia 1 − β , sin


aumentar el nivel de significación α , es incrementar el tamaño de la muestra.
Al aumentar el tamaño de la muestra, varía la ley de distribución del estadístico de
contraste, y generalmente disminuye la varianza. Generalmente, las propiedades del
contraste mejoran.

Antes de la universalización del ordenador se utilizaban como más representativos los


valores del 1%, 5%, y 10%. La metodología más razonable es tomar un nivel de
significación α de acuerdo con la experiencia y después obtener el llamado p-valor.

Santiago de la Fuente Fernández 101


Contraste de Hipótesis
⎧⎪ nivel de significación α más pequeño posible que se puede escoger, para
p − valor ≡ ⎨
⎪⎩ el que todavía se rechazaría la hipótesis nula H 0 con la muestra actual.
⎧⎪Si α < p − valor a Se acepta H 0 ⎫⎪
⎨ ⎬
⎪⎩Si α ≥ p − valor a Se rechaza H 0 ⎪⎭

El p-valor es el menor α que permite aceptar la hipótesis alternativa H 1 .


El p-valor tiene la ventaja de permitir que se decida que hipótesis se acepta, esto no es
posible cuando se indica sólo el resultado del contraste (si se acepta o se rechaza H 0
con un α fijo.

En otras palabras, los CRITERIOS GENERALES para los CONTRASTES:

♦ Calcular una cantidad experimental Qexp a partir de los datos


♦ Calcular una cantidad teórica Qα a partir de las tablas

Si Qexp < Qα ⇒ Se acepta H 0 Si Qexp ≥ Qα ⇒ Se rechaza H 0

EL NIVEL MÍNIMO DE SIGNIFICACIÓN (P-valor) es el error de la primera


región crítica de rechazo. Es decir, el área que deja a la derecha la cantidad
experimental Qexp

Santiago de la Fuente Fernández 102


Contraste de Hipótesis
CÁLCULO DEL NIVEL DE SIGNIFICACIÓN. POTENCIA DEL CONTRASTE.

1. - La edición de un libro se considera buena si el número medio de erratas por página


no supera el 0,1 ( H0 ). Dadas las pruebas de imprenta, se eligen 10 páginas al azar, y se
rechazan las pruebas si se observan 2 ó más erratas. Se supone que el número de
erratas por página sigue una distribución de Poisson.
¿Qué nivel de significación tiene el contraste? ¿Con qué probabilidad se aceptara un
libro si realmente tiene una media de 0,2 erratas por página?

Solución:

Se tiene una muestra aleatoria (X1, X2, L , Xn ) , de tamaño 10, donde X = ‘número de
erratas por página’, con X ∈ P (λ).
Nos interesa el número medio de erratas por página = E (Número erratas por página) =
= E (X) = λ.

La región de rechazo de la hipótesis nula:


⎡ 10 ⎤
R = {Número total de erratas en diez páginas ≥ 2} = ⎢∑ Xi ≥ 2⎥
⎣ i =1 ⎦
10
⎡ ⎤
El nivel de significación: α = P ⎢∑ Xi ≥ 2 H0 : λ ≤ 0,1⎥
⎣ i =1 ⎦

Considerando que se verifica la hipótesis nula ( H0 : λ = 0, 1 ), tenemos que


10
∑ Xi ≈ P (λ = 10 . 0,1 = 1) , con lo cual:
i =1

⎡ 10 ⎤ ⎡ 10 ⎤ ⎡ 10 10

α = P ⎢∑ Xi ≥ 2 λ = 1⎥ = 1 − Pλ = 1 ⎢∑ Xi < 2⎥ = 1 − ⎢Pλ = 1 ( ∑ Xi = 0) + Pλ = 1 ( ∑ Xi = 1)⎥ =
⎣ i =1 ⎦ ⎣ i =1 ⎦ ⎣ i =1 i =1 ⎦
= 1 − [0,3679 + 0,3679 ] = 0, 2642

Por otra parte, un libro que tiene generalmente una media de 0,2 erratas por página, es
10
un libro para el que λ = 0, 2 , con lo que ∑ Xi ≈ P (λ = 10 . 0, 2 = 2) , por tanto la
i =1

probabilidad de aceptar un libro en estas condiciones es:

⎡ 10 ⎤ ⎡ 10 10

P ⎢∑ Xi ≤ 1 λ = 2⎥ = ⎢Pλ =2 ( ∑ Xi = 0) + Pλ =2 ( ∑ Xi = 1)⎥ = 0,1353 + 0, 2707 = 0, 4060
⎣ i =1 ⎦ ⎣ i =1 i =1 ⎦

Santiago de la Fuente Fernández 103


Contraste de Hipótesis

CÁLCULO DEL NIVEL DE SIGNIFICACIÓN. POTENCIA DEL CONTRASTE.

2.- En una piscifactoría se desea contrastar la hipótesis nula de que el porcentaje de


peces adultos que miden menos de 20 cm es, como máximo, del 10%. Para ello, se toma
una muestra de 7 peces, rechazando la hipótesis nula si se encuentra más de un pez con
longitud inferior a 20 cm. Se pide:
1. Nivel de significación del contraste.
2. Calcular la potencia del contraste si en realidad hay un 20% de peces que miden
menos de 20 cm.

Solución:

1) Sea el parámetro p = ‘Proporción de peces adultos que miden menos de 20 cm’, en


una muestra aleatoria (X1, X2, L , X7 ) , con X ∈ B ( 1, p)
La región de rechazo de la hipótesis nula:

R = {Número de peces con longitud inf erior a 20 cm, entre 7 > 1}

Considerando que se verifica la hipótesis nula ( H0 : p = 0, 1 ), tenemos que la muestra


sigue una distribución binomial B (n = 7, p = 0,1) , con que el nivel de significación:

α = P [B (n = 7, p = 0,1) > 1 ] = 1 − P [B (n = 7, p = 0,1) ≤ 1 ] =


= 1 − ( P [B (n = 7, p = 0,1) = 0 ] + P [B (n = 7, p = 0,1) = 1 ] ) = 1 − [0, 4783 + 0, 3720 ] = 0,1497

2) Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H1 cierta)


La potencia del contraste, cuando p = 0, 20 , donde la muestra sigue una distribución
binomial B (n = 7, p = 0, 2) , viene dada por:

Po = P [B (n = 7, p = 0, 2) > 1 ] = 1 − P [B (n = 7, p = 0, 2) ≤ 1 ] =
= 1 − ( P [B (n = 7, p = 0, 2) = 0 ] + P [B (n = 7, p = 0, 2) = 1 ] ) = 1 − [0, 2097 + 0, 3670 ] = 0, 4233

Santiago de la Fuente Fernández 104


Contraste de Hipótesis

CÁLCULO DEL ERROR TIPO I, DEL TIPO II Y POTENCIA.

3.- Sea una variable aleatoria X procedente de una población con densidad de
probabilidad N (μ , 5). Efectuadas dos hipótesis sobre el valor de μ
H 0 : μ = μ 0 = 12 H 1 : μ = μ 1 = 15
mediante un muestreo aleatorio simple de tamaño 25, se contrasta la hipótesis H 0
respecto de la hipótesis H1 , estableciéndose que si la media muestral es menor que 14
se aceptaría la hipótesis nula. Determinar:
a) La probabilidad de cometer el error tipo I
b) La probabilidad de cometer el error tipo II
c) La potencia del contraste

Solución:

Sea la variable aleatoria X ≈ N( μ, 5)

Las hipótesis sobre la media poblacional (contraste unilateral):

H 0 : μ 0 = 12
H1 : μ 1 = 15

⎧ x < 14 se acepta H0 región aceptación (R.A.)


Regla de decisión ⎨
⎩ x ≥ 14 no se acepta H0 región crítica (R.C.)

La distribución de la media muestral x , de tamaño 25, con la varianza poblacional


σ 2 = 25 conocida:
σ 5
H 0 : x ∈ N(μ 0 , ) = N (12 , ) = N (12 , 1)
n 25
σ 5
H1 : x ∈ N(μ 1 , ) = N (15 , ) = N (15 , 1)
n 25

a) Error Tipo I: α = P (ET I) = P (Rechazar H0 / H0 cierta)

14 − 12
α = P (ET I) = P( x ≥ 14 H 0 : μ 0 = 12) = P (z ≥ ) = P (z ≥ 2) = 0, 0228
1

H 0 se rechaza cuando es cierta el 2,28% de los casos

Santiago de la Fuente Fernández 105


Contraste de Hipótesis

b) Error Tipo II: β = P (ET II) = P ( Aceptar H 0 / H 0 falsa)


14 − 15
β = P (ET II) = P( x < 14 H 1 : μ 1 = 15) = P (z < ) = P (z < − 1) = P (z > 1) = 0,1587
1

H 0 se acepta cuando es falsa el 15,87% de los casos

c) Potencia del Contraste: Potencia = P (Rechazar H 0 H 0 falsa) = 1 − β


1 − β = P (Rechazar H 0 H 0 falsa) = 1 − 0,1587 = 0, 8413

H 0 se rechaza cuando es falsa el 84,13% de los casos

Resaltar que es más grave cometer un Error Tipo I (α) que un Error Tipo II (β) .

Santiago de la Fuente Fernández 106


Contraste de Hipótesis
4.- Las latas de mejillones de una determinada marca indican que el peso escurrido de
dicho producto es de 250 gr. No obstante, un consumidor está convencido de que el
peso escurrido medio de dicho producto es menor que el que indican las latas. Si el peso
escurrido sigue una ley normal con desviación típica 9 gr.
a) Determinar, si existe, la mejor región crítica para contrastar la mejor región
crítica, con un nivel de significación del 5% y muestras aleatorias simples de
tamaño 100.
b) Tomar una decisión acerca del rechazo o no de la hipótesis nula a partir de una
muestra aleatoria simple de tamaño 100 en la cual se ha observado un peso
escurrido promedio de 245 gr.
c) Determinar la función de potencia del contraste.

Solución:

a) Sea la variable aleatoria X = "peso escurrido de las latas de mejillones"

Se trata de un contraste unilateral:

H 0 : μ = 250 H1 : μ < 250

⎧ x > k se acepta H 0 (R.A.)


La regla de decisión del muestreo: ⎨
⎩ x ≤ k se rechaza H 0 (R.C.)

La variable aleatoria X en el muestreo, bajo la hipótesis nula, sigue una distribución


⎡ 9 ⎤
N ⎢250, ⎥
⎢⎣ 100 ⎥⎦

El valor crítico k, bajo la hipótesis nula, se determina con el nivel de significación α :

α = P (ET I) = P (Rechazar H 0 / H 0 cierta) = P (x ≤ k / H 0 cierta) =


⎡ x − 250 k − 250 ⎤ ⎡ k − 250 ⎤
= P [ x ≤ k / N (250 ; 0,9) ] = P ⎢ ≤ ⎥ = P ⎢z ≤ = 0,05
⎣ 0,9 0,9 ⎦ ⎣ 0,9 ⎥⎦

observando las tablas de la N(0,1), y considerando que z α = − z 1− α , se tiene:

k − 250
= −1,96 a k = 248,52
0,9

La región crítica más potente, para muestras de tamaño 100, es x ≤ 248,52

Santiago de la Fuente Fernández 107


Contraste de Hipótesis

b) Dado que x = 245 < 248,52 , el peso


escurrido promedio se encuentra en la
región de rechazo de la hipótesis nula.

c) La función potencia del contraste se establece como:

⎡ 9 ⎤ ⎡ x − μ 248,52 − μ ⎤
P (μ) = P (x ≤ 248,52) = P ⎢ x ≤ k / N (μ ; )⎥ = P⎢ ≤ ⎥=
⎢⎣ 100 ⎥⎦ ⎣ 0,9 0,9 ⎦
⎡ 248,52 − μ ⎤
= P ⎢z ≤ ⎥
⎣ 0,9 ⎦ μ ≤ 250

Santiago de la Fuente Fernández 108


Contraste de Hipótesis
5.- Sea una variable aleatoria X procedente de una población con densidad de
probabilidad N (μ , 4). Se quiere contrastar la hipótesis nula H 0 : μ = μ 0 = 10 frente a
la hipótesis alternativa H 1 : μ = μ 1 = 12 , con un nivel de significación α = 0,05 , con un
muestreo simple de tamaño 25.
Determinar:
a) La probabilidad de cometer el error tipo II
b) La potencia del contraste

Solución:

Sea la variable aleatoria X ≈ N( μ, 4)

Las hipótesis sobre la media poblacional (contraste unilateral):

H0 : μ 0 = 10
H1 : μ 1 = 12

⎧x≤k se acepta H0 a región aceptación (R.A.)


Regla de decisión ⎨
⎩ x>k no se acepta H0 a región crítica (R.C.)

La distribución de la media muestral x , de tamaño 25, con la varianza poblacional


σ 2 = 16 conocida:
σ 4
H 0 : x ∈ N(μ 0 , ) = N (10 , ) = N (10 ; 0,8)
n 25
σ 4
H1 : x ∈ N(μ 1 , ) = N (12 , ) = N (12 ; 0,8)
n 25

a) Para hallar el valor crítico 'k' recurrimos al Error Tipo I:

α = P (ET I) = P (Rechazar H0 / H0 cierta) = 0,05

α = P (ET I) = P( x > k H 0 : μ 0 = 10) =


k − 10
= P (z > ) = 0, 05
0,8
k − 10
= 1,645 ⇒ K = 11,316
0,8

Santiago de la Fuente Fernández 109


Contraste de Hipótesis
Error Tipo II: β = P (ET II) = P ( Aceptar H 0 / H 0 falsa)
11,316 − 12
β = P (ET II) = P( x ≤ 11,316 H 1 : μ 1 = 12) = P (z ≤ ) = P (z ≤ − 0,855) =
0,8
= P (z ≥ 0,855) = 0, 1963

b) Potencia del Contraste: Potencia = P (Rechazar H 0 H 0 falsa) = 1 − β


1 − β = P (Rechazar H 0 H 0 falsa) = 1 − 0, 1963 = 0, 8037

Santiago de la Fuente Fernández 110


Contraste de Hipótesis
6.- Un agricultor sabe que el peso en kg. de las patatas sigue una distribución N (μ , 1) .
Una muestra de patatas dio un peso medio de 330 gramos. Con la muestra se realizó un
contraste, con un nivel de significación del 5% y una potencia de 0,6406, en el que la
hipótesis nula era μ = 0,4 Kg y la alternativa μ = 0,3 Kg. Se pide:
a) ¿Cuál es el tamaño de la muestra utilizada por el agricultor?.
b) Qué hipótesis fue aceptada

Solución:

a) Sea la variable aleatoria X = 'peso en kg. de las patatas". X ≈ N (μ;1)

⎧ H 0 : μ 0 = 0,4
Hipótesis sobre μ: ⎨
⎩ H1 : μ 1 = 0,3

Regla de decisión:

⎧ Si x > k a R.A : Acepto H0



⎩ Si x ≤ k a R.C : Rechazo H 0

⎛ 1 ⎞⎟
La distribución de la media muestral, bajo la hipótesis nula, sigue una ley N ⎜⎜ 0,4;
⎝ n ⎟⎠
• A partir del nivel de significación, se tiene:

α = P (Rechazar H 0 H 0 cierta) = P(x ≤ k H 0 cierta) = P(x ≤ k μ = 0,4) =


⎡ x − 0,4 k − 0,4 ⎤ N (0;1) k − 0,4
=P⎢ ≤ ⎥ = 0,05 ⎯⎯ ⎯⎯→ = −1,64
⎢⎣ 1 n 1 n ⎥⎦ 1 n

• Por otro lado, como la potencia del contraste es 0,6406:

Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H 1 cierta)


⎛ 1 ⎞⎟
La media muestral, bajo la hipótesis alternativa, sigue una ley N ⎜⎜ 0,3; , con lo cual,
⎝ n ⎟⎠
⎡ x − 0,3 k − 0,3 ⎤ ⎡ k − 0,3 ⎤ N (0;1) k − 0,3
Potencia = P ⎢ ≤ ⎥ = P ⎢z > ⎥ = 0,3594 ⎯⎯ ⎯⎯→ = 0,36
⎣⎢ 1 n 1 n ⎦⎥ ⎣⎢ 1 n ⎦⎥ 1 n

Santiago de la Fuente Fernández 111


Contraste de Hipótesis
⎧ 1,64
⎪ k − 0,4 = − n
⎪⎪
Resolviendo el sistema: ⎨ n = 2 0,1 a n = 400
⎪ 0,36
⎪ k − 0,3 =
⎪⎩ n

Con el tamaño muestral n = 400 , es decir, el tamaño de la muestra de patatas utilizada


por el agricultor es de 400 patatas.

k − 0,4
Se determina el valor crítico k: = −1,64 ⎯⎯
⎯→ k = 0,318
1 400

b) La región crítica es de la forma x ≤ 0,318 , lo que significa que se rechazará la


hipótesis nula cuando el peso medio de la muestra de patatas sea igual o inferior a 318
gramos. En consecuencia, se acepta la hipótesis nula de que el peso medio de las patatas
es de 400 gramos.

Santiago de la Fuente Fernández 112


Contraste de Hipótesis
CONTRASTE UNILATERAL DE LA PROPORCIÓN. HIPÓTESIS SIMPLES.

7.- Un laboratorio farmacéutico quiere lanzar un nuevo medicamento para la


hipertensión, llamado Hipotensil. El director de dicho laboratorio cree que la eficacia
del medicamento sería de un 95%, medida ésta como la proporción de pacientes a los
que se les suministra y que experimentan una mejoría. Sin embargo, el inspector de
sanidad del Ministerio no es tan optimista y opina que la eficacia es sólo del 85%. Para
analizar la eficacia del medicamento antes de su comercialización, se selecciona una
muestra aleatoria de 500 pacientes, a los que se les administra Hipotensil, de los cuales
mejoran 467. ¿Tiene razón el director del laboratorio?.
Suponga un nivel de significación del 5%.

Solución:

Sea la variable aleatoria X =’eficacia Hipotensil’ ≈ B ( 1, p)

Las hipótesis sobre la proporción (contraste unilateral):

H0 : p 0 = 0,95
H1 : p 1 = 0,85

⎧⎪ p̂ > k No se rechaza H 0 ( R.A.)


Regla de decisión para el valor crítico k ⎨
⎪⎩ p̂ ≤ k Se rechaza H 0 ( R.C.)

n
∑ xi T .}C.L.⎡ p.q ⎤
La distribución en el muestreo del estadístico p̂ = i =1
≈ N ⎢ p, ⎥ , en
n ⎣ n ⎦
consecuencia:
⎡ 0, 95 . 0, 05 ⎤
Bajo la hipótesis H 0 : p̂ 0 ≈ N ⎢0, 95 ; ⎥ = N (0, 95 ; 0, 00974)
⎣ 500 ⎦
⎡ 0, 85 . 0, 15 ⎤
Bajo la hipótesis H1 : p̂1 ≈ N ⎢0, 85 ; ⎥ = N (0, 85 ; 0, 01597 )
⎣ 500 ⎦

Se determina el valor crítico k a partir del nivel de significación α :

Santiago de la Fuente Fernández 113


Contraste de Hipótesis
k − 0, 95
α = P (ET I) = P (Re chazar H0 H0 cierta) = P (p̂ ≤ k) = P (z ≤ ) = 0, 05 ⇒
0, 00974
0, 95 − k
= P (z ≥ ) = 0, 05
0, 00974
Observando en las tablas de la normal N (0 ; 1), resulta:

0, 95 − k
= 1, 645 ⇒ k = 0, 95 − (0, 00974 . 1, 645) = 0, 9339
0, 00974

Comparando el valor crítico k = 0,9339 con el valor del estadístico muestral p̂


467
(evidencia empírica), p̂ = = 0,934 , se tiene:
500

p̂ = 0, 934 > 0, 9339 , por lo que no existe evidencia empírica suficiente para rechazar la
hipótesis H 0 . Es decir, se acepta la hipótesis H 0 concluyendo que el Hipotensil es
eficaz en un 95% de los casos.

Santiago de la Fuente Fernández 114


Contraste de Hipótesis
8.- Se trata de determinar si en una ciudad el 20% o el 30% de las familias dispone de
lavavajillas; para dilucidarlo se toma al azar una muestra de 400 familias de la
mencionada ciudad y se adopta el criterio de si en la muestra hay menos de 100 familias
con lavavajillas, se rechaza que el 20% de las familias poseen el mencionado
electrodoméstico. Se pide:
a) Nivel de significación del test.
b) Potencia del test.

Solución:

a) Sea el parámetro p = "proporción de familias con lavavajillas"

Al realizar un contraste sobre una proporción, partimos de una muestra aleatoria


(X 1, X 2 , L , X n ) de tamaño n = 400 , donde X ≈ B (1; p) .

Para calcular la probabilidad interesa conocer la distribución del parámetro muestral


n
∑xi ⎧ 1 si la familia tiene lavavajillas
p̂ = i =1
donde x i = ⎨
n ⎩ 0 si la familia no tiene lavavajillas

Al ser el tamaño suficientemente grande (N = 400) y estar definido p̂ como suma de


variables independientes según una distribución de Bernouilli B (1; p) , se puede
aproximar la distribución muestral de p̂ como :

n
∑ x i T.C}.L.⎡ p.q ⎤
i=1
x = p̂ = ≈ N ⎢p , ⎥
n ⎢⎣ n ⎥⎦

En el contraste: La hipótesis nula H 0: p = 0,2 y la hipótesis alternativa H 1: p ≠ 0,3


100
Por el lema de Neyman-Pearson, la regla de decisión del muestreo ( p̂ = = 0,25 ):
400

⎧⎪ p̂ ≤ 0,25 se acepta H 0 (R.A.)



⎪⎩ p̂ > 0,25 se rechaza H 0 (R.C.)

⎡ 0,2 . 0,8 ⎤
Con la hipótesis nula H 0: p = 0,2 : p̂ = N ⎢ 0,2 , ⎥ = N (0,2 ; 0,02)
⎣⎢ 400 ⎦⎥

El nivel de significación α , bajo la hipótesis nula, se determina, mediante el valor


crítico k = 0,25:

Santiago de la Fuente Fernández 115


Contraste de Hipótesis
α = P (ET I) = P (Rechazar H 0 / H 0 cierta) = P (p̂ > 0,25 / H 0 cierta) =
⎡ p̂ − 0,2 0,25 − 0,2 ⎤
= P{ p̂ > 0,25 / N (0,2 ; 0,02)} = P ⎢ > ⎥ = P [ z > 2,5] = 0,00621
⎣ 0,02 0,02 ⎦

b) Potencia del Contraste: Potencia = P (Rechazar H 0 H 0 falsa) = 1 − β

Error Tipo II: β = P (ET II) = P ( Aceptar H0 / H 0 falsa)

⎡ 0,3 . 0,7 ⎤
Con la hipótesis alternativa H 1: p = 0,3 : p̂ = N ⎢ 0,3 , ⎥ = N (0,3 ; 0,0229)
⎣⎢ 400 ⎦⎥

⎡ p̂ − 0,3 0,25 − 0,3 ⎤


[ ]
β = P (ET II) = P p̂ ≤ 0,25 / N (0,3 ; 0,0229) = P ⎢ ≤
0,0229 ⎥⎦
= P [ z ≤ −2,1822] =
⎣ 0,0229

= P [ z ≥ 2,1822] = 0,0144

En consecuencia, Pot = 1 − β = P (Rechazar H 0 H 0 falsa) = 1 − 0, 0144 = 0, 9856

Santiago de la Fuente Fernández 116


Contraste de Hipótesis
CONTRASTE UNILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL CONOCIDA.

9.- Las especificaciones de un tipo de báscula aseguran que los errores de los pesajes
siguen una distribución N (0, σ). Se quiere contrastar la afirmación sobre la dispersión
que es igual a la unidad, frente a una hipótesis alternativa de que es el doble. Para ello
se realizan 5 pesajes en las que el error cometido resultó ser:

1 0,9 - 0,2 1,4 - 0,7

Para un nivel de significación del 5% se pide enunciar una regla de decisión (obtener la
región crítica) e indicar que hipótesis resulta aceptada.

Solución:

Sea la variable aleatoria X = ‘Errores en el peso’ X ∈N (0, σ)

⎧⎪ H : σ 20 = 1
Hipótesis sobre σ 2 : ⎨ 0 2
⎪⎩ H1 : σ 1 = 4

⎧⎪ Si σ 2x > k a R.C : Re chazo H 0


Regla de decisión: ⎨ 2
⎪⎩ Si σ x ≤ k a R.A : Acepto H 0
H0
}
n σ 2x (n − 1) s 2x σ 20. χ2n−1 2
χ4
Por el Lema de Fisher: = ≈ χ2n−1 con lo cual, σ 2x ≈ =
σ2 σ2 n 5

La determinación del valor crítico k a partir de α (Error Tipo I):

α = P (Rechazar H0 H0 cierta) = P(σ 2x > k H 0 cierta) = P(σ 2x > k σ 2 = 1) =


⎡ χ2 ⎤
⎢ 4 ⎥ Tablas χ 2 Pearson
= P⎢ > k ⎥ = P (χ2 > 5 k) = 0,05 ⎯⎯ ⎯ ⎯ ⎯ ⎯ ⎯⎯→ 5 k = 9, 488 ⇒ k = 1, 898
5 4
⎢⎣ ⎥⎦

Comparamos el valor crítico (k = 1, 898) con la evidencia muestral, siendo:


xi 1 0,9 - 0,2 1,4 - 0,7 x = ∑x i 5 = 0, 48
x i2 1 0,81 0,04 1,96 0,49 ∑x 2
i 5 = 0, 86
σ 2x = ( ∑x 2
i 5) − ( ∑x i 5 ) 2 = 0, 6296

Santiago de la Fuente Fernández 117


Contraste de Hipótesis
Como σ 2x = O,6296 < 1,898 nos situamos en la región de
aceptación (R.A), no pudiendo rechazar la hipótesis de que la
dispersión sea 1, con un nivel de confianza del 95%.

II Método

⎧ 5
⎪⎪ Si ∑ (x i − μ )2 ≥ k se rechaza H 0 (R.C.)
Regla de decisión ⎨ i =1
5
⎪ Si ∑ (x i − μ )2 < k se acepta H 0 (R.A.)
⎩⎪ i =1

Para calcular el valor de la constante k, determinando la región crítica de forma óptima,


se parte del nivel de significación α :

⎡5 ⎤
α = P (Rechazar H 0 / H 0 cierta) = P ⎢ ∑ (x i − μ )2 ≥ k / H 0 cierta⎥
⎣ i =1 ⎦

5
El estadístico ∑ ( xi − μ ) 2 en el muestreo, bajo la hipótesis nula, donde las variables
i =1

xi − μ
aleatorias independientes x i ≈ N(μ , σ 0 ). En consecuencia, sigue una N (0 , 1)
σ0
2
n ⎡xi − μ ⎤ Recuerda que χn2 = X12 + X22 + L + Xn2 variables aleatorias
∑ ⎢ σ ⎥ = χ n2
⎣ 0 ⎥⎦
i =1 ⎢ N(0, 1) independientes entre si

A partir del nivel de significación α (Error Tipo I):

⎡5 ⎡ ⎤
2 ⎤
x −
⎢ i =1 ⎢ σ 0 ⎥
μ k
α = P (Rechazar H 0 / H 0 cierta) = P ⎢ ∑ ⎢ 2 ⎥ ≥ 2 / H 0 cierta⎥ = P χ 52 ≥ k = 0,05
i

σ0 ⎥
[ ]
⎣ ⎣ ⎦ ⎦
2
k = χ 0,05 ; 5 = 11, 07
5
El valor muestral del estadístico ∑ (x i − 0 )2 = 4,3 verifica que
i =1
5
∑ (x i − 0 )2 = 4,3 < 11, 07 = k , lo que conduce a no rechazar la hipótesis nula de que la
i =1
población sigue una N ( 0 , 1) , advirtiendo que se halla en la región de aceptación.

CONTRASTE UNILATERAL DE LA VARIANZA CON LA MEDIA POBLACIONAL CONOCIDA.


POTENCIA DEL CONTRASTE.

Santiago de la Fuente Fernández 118


Contraste de Hipótesis

10.- En una población N(5 , σ) se quiere contrastar la hipótesis nula H 0 : σ 2 = σ 20 = 2


frente a la hipótesis alternativa H1 : σ 2 = σ 12 = 3 , con un nivel de significación
α = 0,025 , con una muestra aleatoria simple de tamaño 10:

5,1 6,2 4 2,8 2,9 5,6 3,7 3,4 2,5 5,2

Hallar la potencia del contraste.

Solución:
⎧⎪ H : σ 20 = 2
Hipótesis sobre σ 2 : ⎨ 0 2
σ 12 > σ 20
⎪⎩ H1 : σ 1 = 3

⎧ 10
⎪⎪ Si ∑ (x i − μ )2 ≥ k se rechaza H 0 (R.C.)
Regla de decisión ⎨ i =1
10
⎪ Si ∑ (x i − μ )2 < k se acepta H 0 (R.A.)
⎪⎩ i =1

Para calcular el valor de la constante k, determinando la región crítica de forma óptima,


se parte del nivel de significación α :

⎡ 10 ⎤
α = P (Rechazar H 0 / H 0 cierta) = P ⎢ ∑ (x i − μ )2 ≥ k / H 0 cierta⎥
⎣ i =1 ⎦

10
El estadístico ∑ (x i − μ )2 en el muestreo, bajo la hipótesis nula, donde las variables
i =1

aleatorias independientes xi siguen una ley N ( 5 , 2 ) .

2
xi − 5 10 ⎡ xi − 5⎤
En consecuencia, sigue una N (0 , 1) . Por tanto, ∑ ⎢ 2
⎥ = χ 10
2 ⎣ 2 ⎥⎦
i =1 ⎢

(Recuerda que χn2 = X12 + X22 + L + Xn2 variables aleatorias N(0, 1) independientes
entre si)

A partir del nivel de significación α (Error Tipo I), calculamos el valor crítico k:

⎡ 10 ⎡ x − 5 ⎤ 2 ⎤
⎢ i k⎥ ⎡ 2 k⎤
α = P (Rechazar H 0 / H 0 cierta) = P ∑ ⎢ ⎥ ≥ = P ⎢ χ 10 ≥ ⎥ = 0,025
⎢ i=1 ⎣⎢ 2 ⎦⎥ 2⎥ ⎣ 2⎦
⎣ ⎦
k
= χ 20,025 ; 10 = 20, 483 ⇒ k = 40, 966
2

Santiago de la Fuente Fernández 119


Contraste de Hipótesis

10
Por otra parte, el valor muestral del estadístico ∑ (x i − 5)2 = 22,6
i =1
10
Siendo ∑ (x i − 5)2 = 22,6 < 40, 966 = k no se rechaza la hipótesis nula de que la
i =1

población sigue una N ( 5 , 2 ) .

La potencia del contraste:

1 − β = Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H 1 cierta)

⎡ 2 ⎤
1 − β = P ⎢ χ 10
k
σ1
⎡ 2
≥ 2 / H1 cierta⎥ = P ⎢ χ 10


40,966 ⎤
3 ⎥

2
= P χ 10 ≥ 13,655 = 0,267 [ ]
⎢⎣ ⎥⎦

Abscisas Áreas
4,865 − 15,987 0,90 − 0,10 2,322 . 0,80
x = 0,10 + = 0,267
13,665 − 15,987 x − 0,10 11,122

II Método

⎧⎪ H : σ 20 = 2
Hipótesis sobre σ 2 : ⎨ 0 2
σ 12 > σ 20
⎪⎩ H1 : σ 1 = 3

⎧⎪ Si σ 2x > k a R.C : Re chazo H 0


Regla de decisión: ⎨ 2
⎪⎩ Si σ x ≤ k a R.A : Acepto H 0

n σ 2x (n − 1) s 2x σ 20. χ2n−1
Por el Lema de Fisher: = ≈ χ2n−1 con lo cual, σ 2x ≈
σ2 σ2 n

En el muestreo, bajo la hipótesis nula σ 20 = 2 , con tamaño muestral n = 10, se tiene:


H
6708
σ 20. χ2n−1 2 .χ29
σ 2x ≈ =
n 10

La determinación del valor crítico k a partir de α (Error Tipo I):

α = P (Rechazar H 0 H 0 cierta) = P(σ 2x > k H 0 cierta) = P(σ 2x > k σ 2 = 2) =

Santiago de la Fuente Fernández 120


Contraste de Hipótesis
⎡ 2 .χ2 ⎤
⎢ 9 ⎥ Tablas χ 2 Pearson
= P⎢ > k ⎥ = P (χ2 > 5 k) = 0,025 ⎯⎯ ⎯ ⎯ ⎯ ⎯ ⎯⎯→ 5 k = 19, 023 a k = 3,8046
10 9
⎢⎣ ⎥⎦

Comparamos el valor crítico (k = 3, 8046) con la evidencia muestral σ 2x = 1,5204


Como σ 2x = 1,5204 < 3,8046 nos situamos en la región de aceptación (R.A), aceptando
la hipótesis de que la varianza es 2, con un nivel de confianza del 97,5%.

De otra parte, la potencia del contraste será:

Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H 1 cierta)

En el muestreo, bajo la hipótesis alternativa σ 20 = 3 , con tamaño muestral n = 10, se


H 1
67 8
σ 20. χ2n−1 3 .χ29
tiene: σ 2x ≈ =
n 10

⎡ 3.χ2 ⎤

Potencia = P ⎢
10
9 ⎥
[
> 3,8046 / H1 cierta⎥ = P χ 29 ≥ 12,682 = 0,252 ]
⎢⎣ ⎥⎦

Abscisas Áreas
4,168 − 14,684 0,90 − 0,10 2,002 . 0,80
x = 0,10 + = 0,252
12,682 − 14,684 x − 0,10 10,516

CONTRASTE UNILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL DESCONOCIDA.


POTENCIA DEL CONTRASTE.

Santiago de la Fuente Fernández 121


Contraste de Hipótesis

11.- En una población con distribución N (μ , σ) , con un nivel de significación del 1%,
para contrastar la hipótesis nula H 0 : σ 20 = 25 frente a la hipótesis alternativa
H1 : σ 12 = 36 , se toma una muestra aleatoria de tamaño 16, con varianza igual a 27.
Hallar la potencia del contraste.

Solución:
⎧⎪ H 0 : σ 20 = 25
2
Hipótesis simple sobre σ : ⎨ 2
σ 12 > σ 20
⎪⎩ H1 : σ 1 = 36

⎧ 16
⎪⎪ Si ∑ (x i − x )2 ≥ k se rechaza H 0 (R.C.)
Regla de decisión ⎨ i =1
16
⎪ Si ∑ (x i − x )2 < k se acepta H 0 (R.A.)
⎪⎩ i =1

Por el Lema de Fisher-Cochran:

n
∑ (x i − x) 2
(n − 1). s2x
=
n σ 2x
= n =
∑ (x i − x) 2 ≈ χ2n−1
2 2
σ σ σ2 σ2

16
∑ (x i − x )2
bajo la hipótesis nula, se tiene: i=1
≈ χ215
σ 20

Para calcular el valor de la constante k, determinando la región crítica de forma óptima,


se parte del nivel de significación α :

⎡ 16 ⎤
α = P (Rechazar H 0 / H 0 cierta) = P ⎢ ∑ (x i − x )2 ≥ k / H 0 cierta⎥
⎣ i =1 ⎦

⎡ 16 ⎤
⎢∑ ( xi − x ) 2
k ⎥ ⎡ 2 k ⎤
α = P ( Rechazar H0 / H0 cierta ) = P ⎢ i =1 ≥ / H cierta ⎥ = P ⎢ χ 15 ≥ = 0,025
⎢ σ02 2
σ0 0
⎥ ⎣ 25 ⎥⎦
⎢⎣ ⎥⎦
k
= χ 20,025 ; 15 = 27, 488 ⇒ k = 687, 2
25
16
∑ (x i − x )2 16
Por otra parte, el valor muestral σ 2x = i =1
16
= 27 ⇒ ∑ (x i − x )2 = 432
i =1

Siendo 432 < 687,2 conduce a no rechazar la hipótesis nula de que la población sigue
una N ( μ , 5) , advirtiendo que se halla en la región de aceptación.

Santiago de la Fuente Fernández 122


Contraste de Hipótesis

La potencia del contraste:

1 − β = Potencia = P (Rechazar H 0 / H 0 falsa) ≡ P (Rechazar H 0 / H1 cierta)

⎡ 16 ⎤ ⎡
1 − β = P ⎢∑ (x i − x )2 ≥ k / H 1 cierta⎥ = P ⎢χ215 ≥
687, 2 ⎤
36
2
⎥ = P χ 15 ≥ 19,09 = 0,287 [ ]
⎣i =1 ⎦ ⎣ ⎦

Áreas Abscisas
0,90 − 0,10 8,547 − 22,307 3,217 . 0,80
x = 0,10 + = 0, 287
x − 0,10 19,09 − 22,307 13,76

II Método

⎧⎪ H : σ 20 = 25
Hipótesis sobre σ 2 : ⎨ 0 2
σ 12 > σ 20
⎪⎩ H1 : σ 1 = 36

⎧⎪ Si σ 2x > k a R.C : Re chazo H 0


Regla de decisión: ⎨ 2
⎪⎩ Si σ x ≤ k a R.A : Acepto H 0

n σ 2x (n − 1) s 2x σ 20. χ2n−1
Por el Lema de Fisher: = ≈ χ2n−1 con lo cual, σ 2x ≈
σ2 σ2 n

En el muestreo, bajo la hipótesis nula σ 20 = 25 , con tamaño muestral n = 16, se tiene:


H
64704 8
σ 20. χ2n−1 2
25 .χ 15
σ 2x ≈ =
n 16

La determinación del valor crítico k a partir de α (Error Tipo I):

α = P (Rechazar H 0 H 0 cierta) = P(σ 2x > k H 0 cierta) = P(σ 2x > k σ 2 = 2) =


⎡ 25 .χ2 ⎤
⎢ 15 ⎥ 16 χ 2 Pearson 16
=P⎢ > k ⎥ = P (χ2 > k) = 0,01 ⎯⎯ ⎯ ⎯ ⎯⎯→ k = 30, 578 a k = 47,778
16 15 25 25
⎢⎣ ⎥⎦

Comparamos el valor crítico (k = 47, 778) con la evidencia muestral σ 2x = 27


Como σ 2x = 27 < 47,778 nos situamos en la región de aceptación (R.A), aceptando la
hipótesis de que la varianza es 25, con un nivel de confianza del 99%.
De otra parte, la potencia del contraste será:

Santiago de la Fuente Fernández 123


Contraste de Hipótesis
Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H 1 cierta)

En el muestreo, bajo la hipótesis alternativa σ 20 = 36 , con tamaño muestral n = 16, se


H
64714 8
σ 20. χ2n−1 2
36 .χ 15
tiene: σ 2x ≈ =
n 16

⎡ 36 .χ2 ⎤

Potencia = P ⎢
16
15 ⎥ 2
> 47,778 / H1 cierta⎥ = P χ 15 [
≥ 21,235 = 0,162 ]
⎢⎣ ⎥⎦

Abscisas Áreas
8,547 − 22,307 0,90 − 0,10 1,072 . 0,80
x = 0,10 + = 0,162
21,235 − 22,307 x − 0,10 13,76

CONTRASTE UNILATERAL DE LA VARIANZA DE UNA POBLACIÓN CON MEDIA POBLACIONAL


CONOCIDA Y DESCONOCIDA. POTENCIA DEL CONTRASTE.

Santiago de la Fuente Fernández 124


Contraste de Hipótesis

12.- El retraso de salidas de vuelos sigue un normal N(μ , σ) . Los responsables de un


aeropuerto afirman que el retraso medio es de 30 minutos con una desviación típica de
5 minutos. A pesar de ello, una organización de consumidores manifiesta que se muestra
de acuerdo de que los retrasos sigue una ley normal con media 30 minutos, pero que la
desviación típica es de 15 minutos. Se pide:
1. Contrastar con un nivel de significación del 5%, la hipótesis nula
H0 : σ = 5 min utos frente a la alternativa H1: σ = 15 min utos , a partir de una
muestra aleatoria simple de vuelos cuyos retrasos se adjuntan:
32,3 36,4 35,2 38,9 39,3 38,4 51,5 36,4
29,3 39,2 43,4 30,2 37,4 42,6 40,1
2. Calcular la potencia del contraste anterior.
3. ¿Cambia la decisión tomada en el apartado (1) si el retraso medio hubiera sido
desconocido?

Solución:

⎧⎪ H 0 : σ 20 = 25
2
1. Hipótesis sobre σ : ⎨ 2
σ 12 > σ 20
⎪⎩ H1 : σ 1 = 225

Las hipótesis nula y alternativa son simples, con media poblacional conocida. El lema de
Neyman-Pearson conduce a la regla de decisión:

⎧ 15
⎪⎪ Si ∑ (x i − μ )2 ≥ k se rechaza H 0 (R.C.)
Regla de decisión ⎨ i =1
15
⎪ Si ∑ (x i − μ )2 < k se acepta H 0 (R.A.)
⎪⎩ i =1

Para calcular el valor de la constante k, determinando la región crítica de forma óptima,


se parte del nivel de significación α :

⎡ 15 ⎤
α = P (Rechazar H 0 / H 0 cierta) = P ⎢ ∑ (x i − μ )2 ≥ k / H 0 : σ 20 = 25 cierta⎥
⎣ i =1 ⎦

15
El estadístico ∑ (x i − μ )2 en el muestreo, bajo la hipótesis nula, donde las variables
i =1
aleatorias independientes x i siguen una ley N ( 30 , 5 ) .

2
x i − 30 15⎡xi − μ ⎤
En consecuencia, sigue una N (0 , 1) . Por tanto, ∑ ⎢ 2
⎥ = χ 15
5 i =1 ⎣ 25 ⎦

A partir del nivel de significación α (Error Tipo I):

Santiago de la Fuente Fernández 125


Contraste de Hipótesis

⎡ 15 ⎡ x − 30 ⎤ 2 k ⎤ ⎡ 2 k ⎤
i
α = P (Rechazar H 0 / H 0 cierta) = P ∑ ⎢
⎢ ⎥ ≥ / H 0 cierta⎥ = P ⎢ χ 15 ≥ = 0,05
⎢ i =1 ⎣ 5 ⎦ 25 ⎥ ⎣ 25 ⎥⎦
⎣ ⎦

k
= χ 20, 05 ; 15 = 24, 996 ⇒ k = 624, 9
25

15
Por otra parte, el valor muestral del estadístico ∑ (x i − 30 )2 = 1393,02
i =1

15
Siendo ∑ (x i − 30 )2 = 1393,02 > 624, 9 = k se rechaza la hipótesis nula, el retraso
i =1
medio de la salida de los vuelos no sigue una N ( 30 , 5 ) .

⎧ n ⎫
⎪⎪ ∑ (x i − μ )
2
⎪⎪
2
Adviértase que la región de rechazo de la hipótesis nula: R = ⎨ i=1 ≥ χ α ; n⎬
⎪ σ 20 ⎪
⎪⎩ ⎪⎭
⎧ 15 ⎫
⎪⎪ ∑ (x i − 30 )
2
⎪⎪
2
en este caso, R = ⎨ i =1
= 55,72 ≥ χ 0,05 ; 15 = 24,996⎬ la región de rechazo se
⎪ 25 ⎪
⎪⎩ ⎪⎭
verifica, con lo que no se acepta la hipótesis nula, esto es, el retraso medio de salida de
los vuelos no sigue una ley normal N ( 30 , 5 ) .

2. La potencia del contraste:

Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H1 : σ 12 = 225 cierta) = 1 − β

⎡ 2 ⎤
1 − β = P ⎢ χ 15
k ⎡ 2
≥ 2 / H1 cierta⎥ = P ⎢ χ 15
σ1 ⎣

624,9 ⎤
225 ⎦⎥
2
= P χ 15 [
≥ 2,777 ≈ 1 ]
⎣⎢ ⎥⎦

3. Como se desconoce el valor de la media poblacional las hipótesis son compuestas, no


pudiéndose aplicar el lema de Neyman-Pearson.
En consecuencia, para obtener la región crítica es necesario utilizar el test de razón de
verosimilitud, que conduce a la regla de decisión:

⎧ 15
⎪⎪ Si ∑ (x i − x )2 ≥ k se rechaza H 0 (R.C.)
Regla de decisión ⎨ i =1
15
⎪ Si ∑ (x i − x )2 < k se acepta H 0 (R.A.)
⎪⎩ i =1

Santiago de la Fuente Fernández 126


Contraste de Hipótesis
15

n σ 2x ∑ (x i − x )2
Por el Lema de Fisher-Cochran 2
≈ χ2n−1 , bajo la hipótesis nula: i =1
≈ χ214
σ 25

Para calcular el valor de la constante k, determinando la región crítica de forma óptima,


se parte del nivel de significación α :

⎡ 15 ⎤
α = P (Rechazar H 0 / H 0 cierta) = P ⎢ ∑ (x i − x ) 2 ≥ k / H 0 : σ 20 = 25⎥
⎣ i =1 ⎦

⎡ 15 ⎤
⎢ ∑ (x i − x )
2
k ⎥ k ⎤ k
α = P ⎢ i=1 ≥ ⎥ = P ⎡⎢ χ 14
2
≥ ⎥ = 0,05 ⇒ = 23, 685 ⇒ k = 592, 125
⎢ 25 25 ⎥ ⎣ 25 ⎦ 25
⎢ ⎥
⎣ ⎦
15
∑ (x i − x )2 15
De otro lado, el valor muestral σ 2x = i=1
15
= 28,2264 ⇒ ∑ (x i − x )2 = 423,396
i=1

15
Siendo ∑ (x i − x )2 = 423,396 < 592,125 = k no se rechaza la hipótesis nula, por
i =1
tanto, se cambia la decisión que se tomó en el apartado (1).

⎧ n ⎫
⎪⎪ ∑ (x i − x)
2
⎪⎪
2
Adviértase que la región de rechazo de la hipótesis nula: R = ⎨ i=1 2
≥ χ α ; (n −1) ⎬ ,
⎪ σ 0 ⎪
⎩⎪ ⎭⎪
⎧ 15 ⎫
⎪⎪ ∑ (x i − x )
2
⎪⎪
en este caso, R = ⎨ i=1 = 16,94 ≥ χ20,05 ; 14 = 23,685⎬ la región de rechazo no
⎪ 25 ⎪
⎪⎩ ⎪⎭
se verifica, con lo que se acepta la hipótesis nula, esto es, el retraso medio de salida de
los vuelos sigue una ley normal N ( 30 , 5 ) .

CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA DESCONOCIDA. CALCULAR Y


REPRESENTAR LA FUNCIÓN DE POTENCIA.

Santiago de la Fuente Fernández 127


Contraste de Hipótesis
13.- El directorio de uno de los grandes operadores de Internet está considerando la
posibilidad de ofrecer tarifa plana a sus clientes. Según sus conocimientos sobre el
tema, sabe que está trabajando con una variable aleatoria que se distribuye como una
normal. Mantiene la hipótesis de que los hogares que tienen Internet se conectan con
una media de 5 horas mensuales. No obstante, existen otros estudios que sostienen que
el tiempo de conexión es más alto. Para evaluar, a un 10% de significación, dicha
hipótesis, el directorio decide encuestar a una muestra aleatoria de 30 hogares,
obteniendo una media de 5,34 horas de conexión, con una dispersión de 7,24 horas.
a) Formular el contraste a realizar.
b) Determinar la mejor región crítica del contraste.
c) ¿Se puede rechazar la hipótesis nula?
d) Calcular y representar la función de potencia. ¿Qué representa la función de
potencia?. Para facilitar los cálculos, suponer que el tamaño muestral es 300
hogares.

Solución:

Sea la variable aleatoria X = ’conexión a Internet por hogares’ X ≈ N (5, σ)

a) Las hipótesis sobre la media poblacional μ con σ 2 desconocida:

⎧ H0 : μ0 = 5
Hipótesis sobre μ : ⎨
⎩ H1 : μ1 > 5
Se trata de un contraste unilateral, siendo H 1 compuesta.

⎧ Si x > k a R.C : Re chazo H 0


b) Regla de decisión: ⎨
⎩ Si x ≤ k a R.A : Acepto H 0

En el muestreo de una población normal con varianza desconocida, y desviación típica


x −μ σx
muestral σ x , la variable: = tn−1 a x = μ + tn−1
σx n−1
n−1

c) Determinación de k a partir del nivel de significación α:

α = P (Rechazar H 0 H 0 cierta) = P(x > k H 0 cierta) = P(x > k μ 0 = 5) =


⎡ σx ⎤ ⎡ 7,24 ⎤ ⎡ (k − 5) . 29 ⎤
P ⎢ μ 0 + t n −1 > k μ 0 = 5⎥ = P ⎢5 + t30 −1 > k ⎥ = P ⎢t29 > ⎥ = 0,10
⎣ n−1 ⎦ ⎣ 30 − 1 ⎦ ⎢⎣ 7,24 ⎥⎦

En las tablas de la t de Student: t 0,10 ;29 = 1,311 , con lo cual,

Santiago de la Fuente Fernández 128


Contraste de Hipótesis
(k − 5). 29 1, 311. 7,24
= 1, 311 ⇒ k = 5 + = 6,76
7,24 29

Comparando k con el valor del estadístico muestral x 0 = 5,34

El valor x 0 = 5,34 < 6,76 , no pudiendo rechazar H0 , por


lo que tiene razón el Directivo, el tiempo medio de
conexión es de 5 horas.

ƒ Alternativamente, con el estadístico de contraste (valor experimental), la región


de rechazo R viene dada por la expresión:
⎧ sx ⎫ ⎧ σx ⎫
R = ⎨ x − μ 0 > t α ; (n−1) ⎬ ≡ ⎨ x − μ 0 > t α ; (n−1) ⎬
⎩ n⎭ ⎩ n−1 ⎭
⎧ 678 7,24 ⎫⎪
t 0, 10 ;29

R = ⎨ 5,34 − 5 > 1,311 ⎬ ≡ [0, 34 > 1,763] , no cumpliéndose la región de
⎪ 29 ⎪
⎩ ⎭
rechazo, no existe evidencia significativa de rechazar la hipótesis H0 con un nivel de
confianza del 90%.

Una forma análoga de enfocar el problema consistiría en aceptar la hipótesis H0 cuando


el estadístico experimental fuera menor o igual que el estadístico teórico, es decir:
estadístic o experimental
6447448 estadístic o teórico
x −μ 678
Se acepta H0 cuando se verifica: tn−1 = ≤ t α ;n−1
σx
n−1
5,34 − 5
En este caso, t 29 = = 0,2537 < 1,311 = t 0,10 ;29 , se acepta la hipótesis H0
7,24 29

d) Potencia = (1 − β) = P (Rechazar H 0 H 0 falsa)


La hipótesis H1 es compuesta (existen infinitos valores tal que μ > 5), se construye una
función, es decir:

H1 : μ1 > 5 β 1−β
Distintos valores
Re gión
Decisión
}
β = P(ET II) = P (Rechazar H1 H1 cierta) = P (Aceptar H0 H0 falsa) = P(x < k H1 )
En el muestreo de una población normal con varianza desconocida, y desviación típica
σx
muestral σ x , la variable: (x − μ) = tn−1 , siendo la muestra n = 300 , la
n−1
distribución se aproxima a una N (0, 1)

Santiago de la Fuente Fernández 129


Contraste de Hipótesis
k = 6,76
⎡ σx ⎤ ⎡ (k − μ 1 ). n − 1 ⎤ }
β = P(x < k H1 ) = P ⎢μ 1 + tn −1 < k H1 ⎥ = P ⎢ t n − 1 < ⎥ = {
⎣ n−1 ⎦ ⎢⎣ σx ⎥⎦ n> 30
⎡ (6, 76 − μ 1 ). n − 1 ⎤
= P ⎢z < ⎥ , en consecuencia:
⎢⎣ σx ⎥⎦

ƒ H 1 : μ 1 = 5, 5
⎡ (6, 76 − μ 1 ). n − 1 ⎤ ⎡ (6, 76 − 5, 5). 299 ⎤
β = P ⎢z < ⎥ = P ⎢z < ⎥ = P [z < 3] = 0,9986
⎢⎣ σx ⎥⎦ ⎢⎣ 7,24 ⎦⎥

ƒ H1 : μ1 = 6
⎡ (6, 76 − 6). 299 ⎤
β = P ⎢z < ⎥ = P [z < 1,82] = 0,9656
⎣⎢ 7,24 ⎦⎥

ƒ H1 : μ1 = 7
⎡ (6, 76 − 7). 299 ⎤
β = P ⎢z < ⎥ = P [z < − 0,57] = 0,2843
⎣⎢ 7,24 ⎦⎥

ƒ H1 : μ1 = 8
⎡ (6, 76 − 8). 299 ⎤
β = P ⎢z < ⎥ = P [z < − 2,96] = 0,00154
⎣⎢ 7,24 ⎦⎥

H1 : μ1 > 5 β 1−β
5,5 0,9986 0,0014
6 0,9656 0,0034
7 0,2843 0,7157
8 0,0015 0,9985

A medida que se alejan las hipótesis H0 y H1 aumenta la potencia del contraste. Es


decir, cuanto más alejadas se encuentren las hipótesis para contrastar, mayor será la
probabilidad de que se rechace H0 cuando sea falsa, algo deseable (constante α y k).

14.- El propietario de un automóvil sospecha que su vehículo tiene un consumo medio de


combustible en carretera superior a los 5,6 litros /100 Km., que es lo que el fabricante
indica en su publicidad. Para apoyar empíricamente su sospecha observa el consumo
medio en 11 viajes seleccionados aleatoriamente entre todos los que realiza en el año,
obteniendo los siguientes resultados:

Santiago de la Fuente Fernández 130


Contraste de Hipótesis
6,1 6,5 5,1 6 5,9 5,2 5,8 5,3 6,2 5,9 6,3
Se pide:
a) ¿Están fundadas las sospechas del propietario a un nivel de significación del 1%?
b) ¿En cuántas ocasiones debería observarse el consumo medio para que con un nivel
de confianza del 99% se detectase un consumo medio de 5,9 litros/100 km.?

Solución:

a) Suponemos que el consumo medio del automóvil sigue una distribución normal
N (μ, σ) , ambos parámetros desconocidos, y mientras el fabricante afirma que
H 0 : μ = 5,6 el propietario del vehículo cree que H 1 : μ > 5,6 .
Se trata, pues, de un contraste unilateral, donde H 1 es compuesta.

⎧ Si x ≤ k a R.A : Acepto H 0
Regla de decisión: ⎨
⎩ Si x > k a R.C : Rechazo H 0

En el muestreo de una población normal con varianza desconocida, desviación típica


x−μ x−μ
muestral ( σ x ), cuasidesviación típica ( sx ), la variable: = = tn−1
sx n σx n−1

Bajo la hipótesis nula, con los datos muestrales ( x = 5,8454 , s x = 0,4612 ), el


⎡ 0,4612 ⎤
muestreo sigue una distribución t 10 ⎢5,6 ; ⎥ ≡ t 10 (5,6 ; 0,1390)
⎣⎢ 11 ⎦⎥

El valor crítico k, bajo la hipótesis nula, se calcula a partir del nivel de significación α:

α = P (Rechazar H 0 H 0 cierta) = P(x > k H 0 cierta) = P(x > k μ 0 = 5,6) =


⎡ x − 5,6 k − 5,6 ⎤ ⎡ k − 5,6 ⎤ k − 5,6
=P⎢ > ⎥ = P ⎢t 10 > ⎥ = 0,01 ⇒ = 2,764
⎣ 0,1390 0,1390 ⎦ ⎣ 0,1390 ⎦ 0,1390

de donde, k = 5,9842 . Siendo x = 5,8454 < 5,9842 no se puede rechazar la hipótesis


nula H 0 , con lo que se acepta las afirmaciones del fabricante sobre el consumo medio
del automóvil.
b) En esta ocasión se plantea la cuestión P(x > k / μ = 5,9)

x − 5,9
Donde el tamaño muestral es desconocido, y donde el estadístico ≠ t10 no sigue
sx n
un t-Student con 10 grados de libertad.

Por tanto, recurrimos a la siguiente estrategia:

Santiago de la Fuente Fernández 131


Contraste de Hipótesis

⎡ x − 5,6 ⎤ ⎡ x − 5,9 + 0,3 ⎤


P (x > k / μ = 5,9) = P ⎢ > 2,764 / μ = 5,9⎥ = P ⎢ > 2,764⎥ =
⎢⎣ s x n ⎥⎦ ⎢⎣ s x n ⎥⎦

⎡ x − 5,9 0,3 ⎤ ⎡ x − 5,9 0,3 ⎤


=P⎢ + > 2,764⎥ = P ⎢ > 2,764 − ⎥ = 0,99
⎢⎣ s x n sx n ⎥⎦ ⎢⎣ s x n sx n ⎥⎦

⎡ x − 5,9 0,3 ⎤
o bien, P ⎢ ≤ 2,764 − ⎥ = 0,01
⎢⎣ s x n sx n ⎥⎦

Nos encontramos en un punto donde no se pueden utilizar las tablas de la t-Sudent


porque no conocemos el tamaño de la muestra. Para ello, suponemos que el tamaño es
suficientemente grande para que pueda ser aceptable la aproximación de la t mediante
la distribución normal.
Con la aproximación normal, y con la simetría de la N(0, 1):

⎡ 0,3 ⎤ 0,3
P ⎢z ≤ 2,764 − ⎥ = 0,01 ⇒ 2,764 − = −2,327
⎢⎣ sx n ⎥⎦ sx n

2
0,3 ⎡ (5,091) . s x ⎤
= 5,091 a n = ⎢ ⎥
sx n ⎣ 0,3 ⎦

Otra vez en un callejón sin salida, aún es necesario conocer la cuasidesviación típica de
una muestra sin saber su tamaño. Podemos dar una salida, suponiendo que la
cuasidesviación típica de esta nueva muestra es igual a la obtenida en la muestra
anterior s x = 0,4612 . En este caso,

2
⎡ (5,091) . (0,4612) ⎤
n= ⎢ ⎥ = 61,255
⎣ 0,3 ⎦

Para mayor seguridad en el logro de nuestro objetivo, redondeamos con el entero


inmediato superior, esto es, el tamaño de la muestra es 62.

CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA CONOCIDA.

15.- El número de averías de un determinado tipo de avión se considera una variable


aleatoria con distribución de Poisson de media 2 averías al mes. El equipo de
mantenimiento intenta reducir esta media incorporando algunas mejoras. Para

Santiago de la Fuente Fernández 132


Contraste de Hipótesis
comprobar si con estas medidas se reduce el número medio de averías, se decide
observar el número medio de averías en los 25 meses siguientes a la introducción de las
mejoras. Si el número medio de averías en esos 25 meses fue de 1,5. ¿Qué decisión
debe adoptar el servicio técnico a un nivel de significación del 1%?. ¿Y si el servicio
técnico relaja su nivel de exigencia al 85% de confianza?. ¿Cambiaría su decisión?.

Solución:
n}
→∞
Sea la variable aleatoria X = ‘Número de averías al mes’ X ∈ P (λ = 2) → N(2, 2)

En la muestra de tamaño n = 25 meses ˆ


λ = x = 1, 5 averías. La distribución en el
⎡ σ ⎤ ⎡ 2 ⎤
muestreo, bajo la hipótesis nula H0 , x ≈ N ⎢μ, ⎥ ≡ N ⎢2, ⎥
⎢⎣ n ⎥⎦ ⎢⎣ 25 ⎥⎦

⎧ H0 : μ = 2 ⎫
Es un contraste unilateral, donde se plantean las hipótesis: ⎨ ⎬,
⎩ H1 : μ < 2 (compuesta)⎭

⎧ Si x > k no se rechaza H0 a (RA)


donde la regla de decisión, existe k ⎨
⎩ Si x ≤ k se rechaza H0 a (RC)

Se determina el valor de k considerando el nivel de significación α :

⎡ k−2 ⎤
α = P (Re chazar H 0 H 0 cierta) = P( x ≤ k / H 0 : μ = 2) = P ⎢z ≤ ⎥ = 0,01 ⇒
⎣⎢ 2 / 25 ⎦⎥
⎡ 2−k ⎤ 2−k
⇒ P ⎢z ≥ ⎥ = 0,01 ⇒ = 2,32 = z 0,01 a k = 1,34
⎢⎣ 2 / 25 ⎥⎦ 2 / 25

Se advierte que ( 1, 5 > 1, 34 ), cae en la región de aceptación, con lo cual se acepta la


hipótesis nula, esto es, con un nivel de significación del 1% se afirma que las averías
mensuales se mantienen siendo 2, y en consecuencia, las mejorías no son operativas.

2−k
Si α = 0, 15 se replantean los cálculos: = 1,04 = z 0,15 a k = 1,71
2 / 25
Como 1,71 < 1,34 , cae en la región de rechazo, con lo que no se acepta la hipótesis nula,
y se concluye que las mejoras son operativas.

CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL DESCONOCIDA.

16.- La concentración media de dióxido de carbono en el aire en una determinada zona


no es habitualmente mayor que 355 p.p.m.v (partes por millón en volumen). Se sospecha
que esta concentración es mayor en la capa de aire más próxima a la superficie.

Santiago de la Fuente Fernández 133


Contraste de Hipótesis
Para contrastar esta hipótesis se analiza aire en 20 puntos elegidos aleatoriamente a
una misma altura del suelo. Los datos recogidos tienen una media muestral de 580
p.p.m.v y una cuasidesviación típica muestral de 180.
Suponiendo que las mediciones siguen una distribución normal, ¿podemos afirmar a un
nivel de 0,01, que los datos proporcionan suficiente evidencia estadística a favor de la
hipótesis de que la concentración es mayor cerca del suelo?.
Indicar razonadamente si el p-valor es mayor o menor que 0,01

Solución:

Tenemos una muestra aleatoria (X 1, X 2 , L , X n ) de tamaño n = 20 , donde la


variable aleatoria X = "concentración de dióxido de carbono en puntos cercanos al
suelo" sigue una distribución normal X ≈ N (μ ; σ) con varianza poblacional desconocida.

Deseamos comprobar si hay suficiente evidencia estadística a favor de que


μ > 335 . Para ello, planteamos un contraste con la hipótesis nula H 0 : μ ≤ 335 frente a
la hipótesis alternativa H 1 : μ > 335 , con un nivel de significación α = 0,01
En esta línea, nos encontramos ante un contraste unilateral (una cola) para la media
poblacional con varianza poblacional desconocida.

Se rechaza la hipótesis nula si se verifica la región de rechazo:

⎧⎪ s x ⎫⎪
R = ⎨ x − μ 0 > t α ;(n−1) ⎬
⎪⎩ n ⎪⎭

donde,
x − μ 0 = 580 − 355 = 225

sx 180
t α ;(n−1) = t 0,01 ; 19 = 2,539 = 102,19
n 20

Como R = { 225 > 102,19 } SI se verifica la condición de rechazo, por tanto,


RECHAMOS la hipótesis nula H 0 .
En consecuencia, existe suficiencia estadística (con un nivel de significación 0,01) para
concluir que la concentración media de dióxido de carbono es superior a 355 cerca del
suelo.

Por otra parte, el p-valor se interpreta como el apoyo que los datos proporcionan a la
hipótesis nula H 0 .
En otras palabras, Cuando el p-valor < α ⇒ SE RECHAZA H 0
Como hemos rechazado H 0 con α = 0,01 , el p-valor < 0,01

Santiago de la Fuente Fernández 134


Contraste de Hipótesis

CONTRASTE BILATERAL DE LA PROPORCIÓN.

17.- Un dentista afirma que el 40% de los niños de 10 años presentan indicios de caries
dental. Tomada una muestra de 100 niños, se observó que 36 presentaban indicios de
caries.

Santiago de la Fuente Fernández 135


Contraste de Hipótesis
Contrastar la hipótesis del dentista para un nivel de confianza del 90%.

Solución:

Sea el parámetro p = "proporción de niños que presentan indicios de caries dental".

Como siempre que queremos hacer un contraste sobre una proporción, partimos
de una muestra aleatoria (X 1, X 2 , L , X n ) de tamaño n = 100 , donde X ≈ B (1; p) .
n
∑ x i T.C}.L.⎡ p.q ⎤
La distribución en el muestreo del estadístico x = p̂ = i=1
≈ N ⎢p , ⎥
n ⎢⎣ n ⎥⎦

Recurrimos al contraste de la hipótesis nula H 0: p = 0,40 frente a la hipótesis


alternativa H 1: p ≠ 0,40 , con un nivel de significación α = 0,10

La Hipótesis nula se rechaza cuando se verifica la región de rechazo:

⎧⎪ p 0 (1 − p 0 ) ⎫⎪
R = ⎨ x − p0 > zα 2 ⎬
⎪⎩ n ⎪⎭
donde,
36
x − p 0 = p̂ − 0,40 = − 0,40 = 0,04
100

p 0 (1 − p 0 ) 0,40 (1 − 0,40)
zα 2 = z0,05 = (1,64) . (0,0489898) = 0,08
n 100

por tanto, R = { 0,04 > 0,08 } NO se verifica la condición de rechazo y aceptamos la


hipótesis nula H 0 . En consecuencia, con un nivel de significación de 0,10, se puede
afirmar que el 40% de los niños presenta indicios de caries dental.

18.- En los días previos a unas elecciones municipales, el candidato de un partido


político está convencido de obtener el 60% de los votos electorales. No obstante, su
partido encarga una encuesta entre 100 votantes potenciales, resultando que el 52% de
ellos dijeron tener intención de votar a dicho candidato. Con un nivel de significación
del 5%, se pide contrastar:
a) H 0: p = 0,60 frente a H 1: p = 0,50

Santiago de la Fuente Fernández 136


Contraste de Hipótesis
b) H 0: p = 0,60 frente a H 1: p ≠ 0,60
c) Potencia del contraste efectuado en el apartado (a).

Solución:

a) Sea la variable X ="% de votos al candidato"

Nos encontramos ante un contraste de hipótesis nula simple frente a una hipótesis
alternativa simple: H 0: p = 0,60 frente a H 1: p = 0,50

Regla de decisión:
⎪⎧ p̂ > k Se acepta H 0 (R.A.)

⎪⎩ p̂ ≤ k Se rechaza H 0 (R.C.)

1 100 ⎧ 1 vota Si
La distribución en el muestreo de p̂ = ∑
100 i=1
x i siendo x i = ⎨
⎩ 0 vota No
p (1 − p)
donde se conoce E (p̂) = p y que V (p̂) = .
n

Al ser el tamaño suficientemente grande n = 100 y estar definido p̂ como suma de


variables aleatorias independientes, según una distribución de Bernouilli B (1, p) se
[
puede aproximar la distribución exacta de p̂ ≈ N p , p . (1 − p) n ]
⎡ 0,60 .(1 − 0,60) ⎤
Bajo la hipótesis nula: p̂ ≈ N ⎢ 0,60 , ⎥ ≡ N (0,60 ; 0,049)
⎢⎣ 100 ⎥⎦

El valor crítico K se determina, bajo la hipótesis nula, por el nivel de significación:

α = P (ET I) = P (Rechazar H0 / H0 cierta) = 0,05

⎡ p̂ − 0,60 k − 0,60 ⎤ ⎡ k − 0,60 ⎤


α = P (ET I) = P( p̂ ≤ k H 0: p = 0,6) = P ⎢ ≤ ⎥ = P ⎢z ≤ = 0,05
⎣ 0,049 0,049 ⎦ ⎣ 0,049 ⎥⎦
k − 0,60
= −1,645 a k = 0,5186
0,049

En consecuencia, como la proporción


muestral fue p̂ = x = 52 100 = 0,52 ,
se encuentra dentro de la región de
aceptación de la hipótesis nula.

Santiago de la Fuente Fernández 137


Contraste de Hipótesis
b) En este caso, se trata de un contraste bilateral con hipótesis nula simple frente a
una hipótesis alternativa compuesta: H 0: p = 0,60 frente a H 1: p ≠ 0,60

Regla de decisión:
⎧⎪ p̂ > k Se acepta H 0 (R.A.)

⎪⎩ p̂ ≤ k Se rechaza H 0 (R.C.)

Bajo la hipótesis nula: p̂ ≈ N (0,60 ; 0,049)

Para determinar el crítico K, bajo la hipótesis nula, nos apoyamos en el nivel de


significación:
α = P (ET I) = P (Rechazar H0 / H0 cierta) = 0,05

⎡ p̂ − 0,60 K − 0,60 ⎤
α = P (ET I) = P( p̂ ≤ K H 0: p = 0,6) = P ⎢ ≤ ⎥ = 0,05
⎣ 0,049 0,049 ⎦

p̂ − 0,60 p̂ − 0,60 > (0,049) (1,96) = 0,696


La región crítica: > 1,96 = z 0,025 a
0,049 p̂ − 0,60 < − (0,049) (1,96) = 0,504

Como p̂ = x = 52 100 = 0,52 se encuentra


en la región de aceptación, se acepta la
hipótesis nula.

c) Potencia del Contraste: Potencia = P (Rechazar H 0 H 0 falsa) = 1 − β

Error Tipo II: β = P (ET II) = P ( Aceptar H0 / H 0 falsa)

⎡ 0,5 . 0,5 ⎤
Con la hipótesis alternativa H 1: p = 0,50 : p̂ = N ⎢ 0,5 ; ⎥ = N (0,5 ; 0,05)
⎣⎢ 100 ⎦⎥

⎡ p̂ − 0,5 0,5186 − 0,5 ⎤


[ ]
β = P (ET II) = P p̂ > 0,5186 / N (0,5 ; 0,05) = P ⎢ > ⎥=
⎣ 0,05 0,05 ⎦
= P (z > 0,372) = 0,35496

Abscisas Areas
(0,008) (0,0037)
0,37 - 0,38 0,3557 - 0,3520 x = 0,3520 + = 0,35496
0,01
0,372 - 0,38 x - 0,3520

Potencia = 1 − β = 1 − 0,35496 = 0,6450

Santiago de la Fuente Fernández 138


Contraste de Hipótesis
♦ También se podía haber realizado por la definición de potencia de un contraste:

[ ]
Potencia = P (Rechazar H 0 H 0 falsa) = P p̂ ≤ 0,5186 / N (0,5 ; 0,05) =
⎡ p̂ − 0,5 0,5186 − 0,5 ⎤
=P⎢ ≤ ⎥ = P (z ≤ 0,372) = 1 − P (z ≥ 0,372) = 0,6450
⎣ 0,05 0,05 ⎦

19.- El dueño de los cines CINEFILÓN considera que, dado el aforo de la sala, una
afluencia diaria a la misma del 85% sería óptima, en el sentido de que los clientes se
sientan cómodos y para que a la vez no haya pérdidas económicas. Durante un período de
tiempo, se analiza la afluencia a los cines, observándose que, en media, se ocupan 171 de
las 200 butacas. ¿Con qué confianza podrá afirmar el dueño de CINEFILÓN que la
asistencia a sus cines es óptima? ¿Qué pasaría si el dueño quisiera estar más seguro de
su decisión, y ampliar el nivel de confianza al 99%?

Santiago de la Fuente Fernández 139


Contraste de Hipótesis
Nota: La regla de la decisión adoptada es que si hay una desviación inferior al 5% de la
cantidad óptima, se aceptaría la hipótesis de que la afluencia es, efectivamente, óptima.

Solución:

Sea la variable aleatoria X = '% asistencia diaria a los cines CINEFILÓN' , X ≈ B (1, p) .

- En el contraste bilateral se establecen las hipótesis:

H0 : p 0 = 0,85 H1 : p 1 ≠ 0,85

X
- En el muestreo, la proporción que acude a los cines (200 butacas) en un día ( p̂ = ),
n
bajo la hipótesis nula, por el TCL (Teorema Central Límite), sigue una distribución

⎡ p.q ⎤ ⎡ 0,85 . 0,15 ⎤


N ⎢p , ⎥ ≡ N ⎢0,85 , ⎥ = N (0,85 ; 0,025)
⎣ n ⎦ ⎣ 200 ⎦

- Se determina (1 − α) a partir de los valores críticos, considerando que una desviación


inferior al 5% de la cantidad óptima significa que 0,80 < p̂ < 0,90

α = P (Rechazar H0 / H0 cierta) =
⎡⎛ 0,80 − 0,85 ⎞ ⎛ 0,90 − 0,85 ⎞⎤
= P ⎢⎜⎜ > z ⎟⎟ ∪ ⎜⎜ z > ⎟⎥ =
⎢⎣⎝ 0,025 ⎠ ⎝ 0,025 ⎟⎠⎥⎦
= P[− 2 > z ] + P[z > 2] = 2 . 0,028 = 0, 0456

El nivel de confianza: 1 − α = 1 − 0,0456 = 0,9544


• Si el nivel de confianza [1 − α ] = 99% ⇒ α = 1% (mayor exigencia).

El valor crítico k se determina a partir del nivel de significación α = 0,01

⎡⎛ k1 − 0,85 ⎞ ⎛ k2 − 0,85 ⎞⎤
α = P (Rechazar H0 / H0 cierta) = P ⎢⎜ > z ⎟ ∪ ⎜⎜ z < ⎟⎥ = 0,01

⎢⎣⎜⎝ 0,025 ⎟
⎠ ⎝ 0 , 025 ⎠⎥⎦

k − 0,85 k1 = 0,914
= 2,57 = z 0, 005 ⇒
0,025 k2 = 0,786

Santiago de la Fuente Fernández 140


Contraste de Hipótesis
Comparando los valores críticos k con el valor del estadístico muestral (evidencia
171
empírica) p̂ = = 0,855 , se observa que cae dentro de la región de aceptación (R.A.),
200
concluyendo que se acepta la hipótesis nula siendo óptima la afluencia a los cines
CINEFILÓN.

CONTRASTE BILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL CONOCIDA.

20.- En una población N(10 , σ) se desea contrastar la hipótesis nula H 0 : σ 2 = 3


frente a la hipótesis alternativa H1 : σ 2 ≠ 3 con un nivel de significación del 5%. En una
muestra aleatoria simple de tamaño 4 se obtuvieron los resultados:

10 8 12 14

Solución:

Santiago de la Fuente Fernández 141


Contraste de Hipótesis
⎧⎪ H : σ = 3 2
Hipótesis compuesta sobre σ 2 : ⎨ 0 2
⎪⎩ H1 : σ ≠ 3

Como la hipótesis alternativa es σ 2 ≠ 3 en la decisión que tomemos deberán ser válidos


valores de σ 2 tanto mayores o menores que 3, por lo que el contraste debe ser
bilateral o de dos colas.

⎧ 4
⎪ Si

∑ (x i − μ )2 ≥ k a R.C : Re chazo H 0
i =1
Regla de decisión: ⎨ 4
⎪ Si ∑ (x i − μ )2 < k a R.A : Acepto H 0
⎪⎩ i =1

4
En la distribución en el muestreo del estadístico ∑ (x i − μ )2 , las variables aleatorias
i =1

independientes xi se distribuyen N(10 , σ) ; bajo la hipótesis nula N(10 , 3 ) :

2 2
4 ⎛ xi − μ ⎞ 4 ⎛ x − 10 ⎞
∑ ⎜⎜ σ ⎟⎟ = ∑ ⎜⎜
i
⎟ = χ 24 (suma de 4 variables aleatorias N (0 , 1) , independientes entre sí)
i=1 ⎝ 0 ⎠ i=1 ⎝ 3 ⎟⎠

Fijado el nivel de significación α (Error Tipo I), se halla el valor de la constante k:

⎡ 2 ⎤
[
α = P Rechazar H 0 / H 0 cierta = P ⎢

]
4
∑ ⎜⎜
⎛ x i − 10 ⎞
i =1 ⎝ 3 ⎟⎠
⎟ [
≥ k / H 0 cierta ⎥ = P χ24 ≥ k =

]
⎣ ⎦
[ ] [
= P ( χ24 ≤ k 1) ∪ ( χ24 ≥ k 2 ) = P χ24 ≤ k 1 + P χ24 ≥ k 2 ] [ ] = α 1 + α 2 = 0,05

[ ] [ ]
P χ24 ≤ k 1 = 1 − P χ24 ≥ k 1 = 1 − α 1 = 0,975 ⇒ k 1 = χ 20, 975 ; 4 = 0,484
P [χ 2
4 ≥ k2 ] = α = 0,025 ⇒
2 k 2 = χ 20, 025 ; 4 = 11,143

Región de rechazo:
( χ24 < 0,484) ∪ ( χ24 > 11,143) ,

con lo que la región de aceptación es


el intervalo [0,484 ; 11,143 ] .

4
∑ (x i − 10 )2
El estadístico muestral, bajo la hipótesis nula, = 8 , pertenece a la
i =1
3
región de aceptación, concluyendo que la varianza de la distribución es 3.

Santiago de la Fuente Fernández 142


Contraste de Hipótesis
Análogamente,
⎡n ⎤
⎢ ∑ (x i − μ )
2

Considerando la región de rechazo: R = ⎢ i=1
⎢ σ0 2
[
∉ χ21 − α / 2 ; n ; χ2α / 2 ; n ]


⎢ ⎥
⎣ ⎦
4
El valor del estadístico muestral ∑ (x i − μ )2 = 24 , bajo la hipótesis nula resulta:
i =1
4
∑ (x i − μ )2 24 χ2 = χ2 = 0,484
i =1
= = 8 . Los valores tabulares son 12 − α / 2 ; n 2 0,975 ; 4
σ 20 3 χ α / 2 ; n = χ 0,025 ; 4 = 11,143

La región de aceptación de la hipótesis nula es el intervalo [0,484 ; 11,143 ] .


4
∑ (x i − μ )2
Al pertenecer el valor muestral del estadístico i =1
= 8 a la región de
σ 20
aceptación, se concluye que la varianza de la distribución es 3.

CONTRASTE BILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL CONOCIDA.

21.- En una población N(μ , 5) se quiere contrastar la hipótesis nula H 0 : μ = 18 frente


a la hipótesis alternativa H1 : μ ≠ 18 , con un nivel de significación α = 0,01 , con una
muestra de tamaño 10:

16 12 15 16 20 25 14 18 17 22

Solución:

Santiago de la Fuente Fernández 143


Contraste de Hipótesis
⎧ H 0 : μ = 18
En el contraste se establecen las hipótesis: ⎨ Como la hipótesis alternativa
⎩ H1 : μ ≠ 18
es μ ≠ 18 en la decisión que hayamos de tomar deberán ser válidos valores de μ tanto
mayores o menores que 18, por lo cual el contraste debe ser bilateral o de dos colas.

⎧⎪ Si x > k se rechaza H 0 (R.C.)


Regla de decisión ⎨
⎪⎩ Si x ≤ k se acepta H 0 (R.A.)

10
∑ xi
La muestra de tamaño 10, con media x = i=1
10
= 17,5 siendo la varianza poblacional
5
conocida σ 2 = 25 , bajo la hipótesis nula sigue una distribución N(18 , ) , con lo que
10
x − 18
la variable es N (0 , 1) .
5
10

El valor de k se calcula mediante el nivel de significación α = 0,01 :


⎡ ⎤
⎢ ⎥
⎢ x − 18
α = P (Rechazar H 0 H 0 cierta) = P ( x > k) = P > K⎥ =
⎢ 5 ⎥
⎢ ⎥
⎣ 10 ⎦
⎡⎛ ⎞ ⎛ ⎞⎤ ⎡⎛ ⎞⎤ ⎡⎛ ⎞⎤
⎢⎜ ⎟ ⎜ ⎟⎥ ⎢⎜ ⎟⎥ ⎢⎜ ⎟⎥
⎜ x − 18 ⎟ ⎜ x − 18 ⎟ ⎜ x − 18 ⎟ ⎜ x − 18 ⎟
= P⎢⎜ < − K⎟ ∪ ⎜ > K⎟⎥ = P⎢⎜ < − K⎟ ⎥ + P ⎢⎜ > K ⎟ ⎥ = 0,01
⎢ 5 5 ⎥ ⎢ 5 ⎥ ⎢ 5 ⎥
⎢ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎥ ⎢ ⎜⎜ ⎟⎟ ⎥ ⎢ ⎜⎜ ⎟⎟ ⎥
⎣ ⎝ 10 ⎠ ⎝ 10 ⎠⎦ ⎣ ⎝ 10 ⎠⎦ ⎣ ⎝ 10 ⎠⎦

La región crítica será:

⎧ 5
x − 18 ⎪ x > 18 + 10 (2, 575) = 22,07

> 2, 575 = z α / 2 = z 0, 005 ⇒⎨
5 5
⎪ x < 18 − (2, 575) = 13,93
10 ⎪⎩ 10

En consecuencia, la región de aceptación: 13,93 < x < 22,07


10
∑ xi
Como la media muestral x = i =1
10
= 17,5 está contenida en la región de aceptación, no
se rechaza la hipótesis nula μ = 18 , con un nivel de significación de 0,01.

Santiago de la Fuente Fernández 144


Contraste de Hipótesis

⎧ σ ⎫
Análogamente, la región de rechazo: R rechazo = ⎨ x − μ 0 > z α 2 . ⎬
⎩ n⎭

⎧ 5 ⎫ ⎧ 5 ⎫
R rechazo = ⎨ 17,5 − 18 > z 0,05 . ⎬ = ⎨ 17,5 − 18 > (2,575). ⎬ = { 0,5 > 4,071 }
⎩ 10 ⎭ ⎩ 10 ⎭

No se verifica la región de rechazo, en consecuencia se admite la hipótesis nula μ = 18 ,


con un nivel de significación de 0,01.

CONTRASTE BILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL DESCONOCIDA.

22.- En una población N(μ , σ) se quiere contrastar la hipótesis nula H 0 : μ = 2 frente


a la hipótesis alternativa H1 : μ ≠ 2 , con un nivel de significación α = 0,01 , con una
muestra aleatoria simple de tamaño 15:

2,1 2,25 3,01 2,92 2,98 3,08 3,8 3,95


2,75 2,74 3,16 2,56 3,15 2,65 3,12

Solución:

Santiago de la Fuente Fernández 145


Contraste de Hipótesis

En la muestra se obtiene:

15 15 15
∑ xi ∑ ( x i − x)2 ∑ ( x i − x)2
x = i =1
= 2,948 σ 2x = i =1
= 0,2264 s 2x = i =1
= 0,2426
15 15 14

σ x = 0, 476 s x = 0, 493 n = 15

Como la hipótesis alternativa es μ ≠ 2 en la decisión que hayamos de tomar deberán ser


válidos valores de μ bien sean mayores o menores que 2, por lo cual el contraste debe
ser bilateral o de dos colas.

Regla de decisión:
⎧⎪ Si x > k se rechaza H 0 (R.C.)

⎪⎩ Si x ≤ k se acepta H 0 (R.A.)

En el muestreo de una población normal con varianza desconocida, y desviación típica


x−μ x−μ
muestral σ x , la variable = = tn−1
σx sx
n−1 n
Con el nivel de significación α = 0,01 se determina la región crítica:
⎡ x−μ ⎤
α = P (Re chazar H 0 H 0 cierta) = P ( x > k / H 0 ) = P ⎢ > K / μ = 2⎥ =
⎢⎣ σ x n−1 ⎥⎦
⎡ ⎤
⎢ ⎥
⎢ x −2 ⎡⎛ x −2 ⎞ ⎛ x −2 ⎞⎤
= P⎢ > K ⎥⎥ = P ⎢ ⎜ < −K ⎟ ∪ ⎜ > K ⎟⎥ =
0, 476 14
⎢ 14 ⎥ ⎢⎣ ⎜⎝ 0, 476 14 ⎟ ⎜ 0, 476 14
⎠ ⎝
⎟⎥
⎠⎦
4244 3
⎢⎣ t14 ⎥⎦
⎡ ⎤ ⎡ ⎤
⎢ ⎥ ⎢ ⎥
⎢ x−2 ⎥ ⎢ x−2 α α
= P < − K + P > ⎥ =
K + = 0,01
⎢ 0, 476 14 ⎥ ⎢ 0, 476 14 ⎥ 2 2
⎢ 144244 3 ⎥ ⎢ 144244 3 ⎥
⎣⎢ t 14 ⎦⎥ ⎣⎢ t 14 ⎦⎥

x−2
La región crítica es: > 2,977 = t α / 2 ;( n−1 ) = t 0,005 ;14 , con lo cual,
0, 476 14

x−2 ⎧⎪ x > 2 + 2,977 .(0, 476 14 ) = 2,378


> 2,977 ⇒ ⎨
0, 476 14 ⎪⎩ x < 2 − 2,977 .(0, 476 14 ) = 1,622

Santiago de la Fuente Fernández 146


Contraste de Hipótesis
La región de aceptación será: 1,622 < x < 2,378

Se observa que el valor del estadístico muestral x = 2,948 no se encuentra en la


región de aceptación, por tanto, se rechaza la hipótesis nula y se acepta que la media
de la distribución poblacional es distinta de 2.

Adviértase que rechazamos la hipótesis nula si se verifica la región de rechazo:


⎧ 678 0,493 ⎫⎪
t 0,005 ;14
⎧ sx ⎫ ⎪
R = ⎨ x − μ 0 > t α / 2 ; (n−1) ⎬ = ⎨ 2,948 − 2 > 2,977 ⎬ = { 0,948 > 0,379 }
⎩ n⎭ ⎪ 15 ⎪
⎩ ⎭

verificándose la región de rechazo, con lo cual no se acepta la hipótesis nula,


concluyendo que se acepta la hipótesis alternativa de que la media de la distribución
poblacional es distinta de 2.

Una forma análoga de enfocar la cuestión consiste en aceptar la hipótesis nula


H 0 : μ = 2 cuando el estadístico experimental fuera menor o igual que el estadístico
teórico, esto es:
estadístic o exp erimental
644 47444 8
estadístic o teórico
x − μ0 64748
tn−1 = ≤ t α / 2 ;( n−1 )
sx n
x − μ0 2,948 − 2
El estadístico de contraste: t n − 1 = = = 7,447
sx n 0,493 / 15

El valor tabular del estadístico teórico: t α / 2 ; ( n −1 ) = t 0,005 ;14 = 2,977

Como t n − 1 = 7,447 > 2,977 = t 0,005 ;14 se rechaza la hipótesis nula, concluyendo que la
media de la distribución poblacional es distinta de 2.

23.- Se recibe un envío de latas de conserva de las que se afirma que el peso medio son
1.000 gr. Examinada una muestra de 5 latas se obtiene un peso medio de 995 gr. con una
cuasivarianza s2x = 19,6 . Al nivel de confianza del 95%, ¿se puede aceptar que el peso
medio son 1.000 gr.?

Solución:

Tenemos una muestra aleatoria (X 1, X 2 , L , X n ) de tamaño n = 5 , donde la variable


aleatoria X = "peso de una lata de conserva", suponemos que sigue una distribución
normal X ≈ N (μ; σ) con varianza poblacional desconocida.

Santiago de la Fuente Fernández 147


Contraste de Hipótesis
Deseamos ver si resulta aceptable que μ = 1000 . Para ello, planteamos un contraste
con la hipótesis nula H 0 : μ = 1000 frente a la hipótesis alternativa H 1 : μ ≠ 1000 , con
un nivel de significación α = 0,05

Adviértase que como la hipótesis alternativa H 1 : μ ≠ 1000 , en la decisión que hayamos


de tomar deberán ser válidos valores de μ tanto mayores o menores que 1000, por lo
que el contraste debe ser BILATERAL o de dos colas.
En esta línea, se rechaza la hipótesis nula si se verifica la región de rechazo:

⎧ sx ⎫
R = ⎨ x − μ 0 > t α / 2 ; (n−1) ⎬
⎩ n⎭
donde,
x − μ 0 = 995 − 1000 = 5

sx sx 19,6
t α / 2 ; (n−1) = t 0,025 ; 4 = 2,776 = 5,50
n n 5

Como R ≠ { 5 > 5,5 } NO se verifica la condición de rechazo, ACEPTAMOS la hipótesis


nula H 0 . En consecuencia, con un nivel de significación de 0,05, se puede afirmar que el
peso medio son 1000 gramos.

CONTRASTE BILATERAL DE LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES


CONOCIDAS.

24.- El análisis laboral que la U.E ha realizado para toda Europa, señala que en España,
el salario mensual de los varones, en algunos sectores económicos, supera en más de 100
euros el salario de las mujeres que desempeñan las mismas tareas.
El Ministerio de Trabajo español decide considerar el salario mensual como una variable
aleatoria normalmente distribuida con desviación típica de 39,6 euros para los
trabajadores masculinos y de 36 euros para las trabajadoras de dichos sectores, siendo
el salario de cada población independiente del de la otra. Para tratar de verificar lo
publicado, se elige una muestra aleatoria simple de 500 trabajadores y de 700

Santiago de la Fuente Fernández 148


Contraste de Hipótesis
trabajadoras, obteniéndose unos salarios medios mensuales de 1.500 y 1.370 euros
respectivamente.
¿Está fundamentada las conclusiones de la U.E al 1% de significación?

Solución:

Sean las variables aleatorias, respectivamente, X = ‘Salario mensual de los varones’ e


Y = ‘Salario mensual de las mujeres’, donde X ≈ N(μ x , 39,6) e Y ≈ N(μ y , 36) .

⎧ x = 1.500 € n x = 500

En las muestras se obtuvieron los resultados: ⎨
⎪ y = 1.370 € n y = 700

- En el contraste se establecen las hipótesis:

H 0 : μ x − μ y = 100 H1 : μ x − μ y > 100 (compuesta)

⎧ Si (x − y) > k se rechaza H 0 (RC)


La regla de decisión será: ⎨
⎩ Si (x − y) ≤ k no se rechaza H 0 (RA)

- La diferencia de medias muestrales (x − y) , siendo las varianzas muestrales


conocidas, bajo la hipótesis nula, sigue una distribución:

⎡ σ 2xσ 2y ⎤ ⎡ 39,6 2 36 2 ⎤
N ⎢(μ x − μ y ) ; + ⎥ ≡ N ⎢100 ; + ⎥ = N(100 ; 2,23)
⎢ nx ny ⎥ ⎢⎣ 500 700 ⎥
⎣ ⎦ ⎦

- Se determina el valor de k mediante el nivel de significación α :


⎡ k − 100 ⎤
α = P (Re chazar H0 H 0 cierta) = P( x − y > k / H0 : μ x − μ y = 100) = P ⎢z > = 0,01
⎣ 2,23 ⎥⎦
k − 100
⇒ = 2,32 = z 0,01 a k = 105,2 €
2,23

La evidencia empírica x − y = 1.500 − 1.370 = 130 € . Se advierte que 130 > 105,2 ,
cae en la región de rechazo, con lo cual no se acepta la hipótesis nula, esto es, con un
nivel de significación del 1%, se afirma que con el mismo trabajo las diferencias salarias
entre hombres y mujeres en algunos sectores económicos españoles son superiores a
100 euros mensuales.

Santiago de la Fuente Fernández 149


Contraste de Hipótesis

25.- Con un nivel de significación del 4,72%, se desea contrastar la hipótesis nula de
igualdad de medias de dos poblaciones N ( μ 1 , 4 ) y N ( μ 2 , 4,5) . Para ello, se han
tomado dos muestras aleatorias simples e independientes, respectivamente,
obteniéndose los siguientes valores:

xi 20,4 10,2 7,3 12,8 13,4 9,4


yj 19,8 9,7 14,6 15.7 8,4

Solución:

⎧ H0 : μ 1 − μ 2 = 0
En el contraste bilateral se establecen las hipótesis ⎨
⎩ H1 : μ 1 − μ 2 ≠ 0

Santiago de la Fuente Fernández 150


Contraste de Hipótesis
⎧⎪ Si x − y > k se rechaza H 0
Regla de decisión ≡ ⎨
⎪⎩ Si x − y ≤ k se acepta H 0

Para analizar el contraste, se realizan los cálculos muestrales:

6 5

∑ xi ∑ yj
j =1
x = i =1
= 12, 25 y= = 13, 64 n1 = 6 n2 = 5
6 5

La región crítica de dos colas x − y > k es función de la diferencia de las medias


muestrales. En esta línea, las distribuciones en el muestreo de las medias son:

⎡ σ1 ⎤ ⎡ σ2 ⎤

x ≈ N μ1 , ⎥ , y ≈ N μ2 ,
⎢ ⎥ , con lo cual, la diferencia de medias muestrales,
⎢⎣ n1 ⎥⎦ ⎢⎣ n 2 ⎥⎦
bajo la hipótesis nula H0 : μ 1 − μ 2 = 0 , se distribuye:

⎡ σ 22 ⎤ ⎡
σ 12 4 2 4,5 2 ⎤
x − y ≈ N ⎢0 , + ⎥ ≡ N ⎢0 , + ⎥ = N[0 , 2,59]
⎢ n1 n2 ⎥ ⎢⎣ 6 5 ⎥
⎣ ⎦ ⎦

Se determina el valor de k mediante el nivel de significación α :

[
α = P (Re chazar H 0 H 0 cierta) = P x − y > k / H 0 : μ 1 − μ 2 = 0 = ]
⎡ ( x − y) − 0 ⎤ ⎡⎛ x − y ⎞ ⎛ x−y ⎞⎤
= P⎢ > K ⎥ = P ⎢ ⎜⎜ < − K ⎟⎟ ∪ ⎜⎜ > K ⎟⎟ ⎥ =
⎣ 2,59 ⎦ ⎣ ⎝ 2,59 ⎠ ⎝ 2,59 ⎠⎦
⎡ x−y ⎤ ⎡ x−y ⎤ α α
= P⎢ < − K⎥ + P ⎢ > K ⎥ = + = 0,05 por simetría N(0, 1)
⎣ 2,59 ⎦ ⎣ 2,59 ⎦ 2 2

x−y x − y > 5, 17
La región crítica es > 1,995 = z 0, 0236 a
2,59 x − y < − 5, 17

En consecuencia, la región de aceptación: − 5, 17 ≤ x − y ≤ 5, 17

La evidencia empírica x − y = 12, 25 − 13,64 = 1,39 , valor que no se encuentra en la


región de rechazo, por lo que se acepta la hipótesis nula de igualdad de medias, con un
nivel de significación del 4,72%.

Análogamente, la región de rechazo de la hipótesis nula H0 :

Santiago de la Fuente Fernández 151


Contraste de Hipótesis
⎧ σ 12 σ 22 ⎫⎪ ⎧⎪ ⎫⎪
⎪ 4 2 4,5 2
R = ⎨ x − y > zα2 + ⎬ a R = ⎨ 12,25 − 13,64 > (1,995 ) + ⎬
⎪⎩ n1 n2 ⎪ ⎪ 6 5 ⎪⎭
⎭ ⎩

La región de rechazo de la hipótesis nula no se cumple, R = {1, 39 > 5,17 } , se concluye


que existe igualdad entre las medias poblacionales.

Cálculo de z 0, 0236 :
Abscisas Áreas
1,98 − 1,99 0, 0239 − 0, 0233 0, 01 . 0, 0003
x = 1, 99 + = 1, 995
x − 1, 99 0, 0236 − 0, 0233 0, 0006

26.- Una empresa dedicada a la fabricación de artículos deportivos dispone de dos


máquinas para el inflado de balones. La presión en kg a la que son inflados los balones es
una variable aleatoria X con distribución N(α ; 0,25) .
Se desea contrastar con un nivel de significación del 5%, la hipótesis de que los balones
inflados con las dos máquinas tienen igual presión media. Para ello, se toman dos
muestras aleatorias simples de balones con las siguientes presiones de inflado:

Máquina 1 3 5 6 4 3 5
Máquina 2 5 4 3 7 6 5 4 7 4

¿Cuál es el resultado del contraste?

Santiago de la Fuente Fernández 152


Contraste de Hipótesis
Solución:

Sean las variables aleatorias X = ‘presión en kg que son inflados los balones en la
máquina 1’ e Y = ‘presión en kg que son inflados los balones en la máquina 2’,
respectivamente, las variables aleatorias siguen distribuciones N(α 1 ; 0,25) e
N(α 2 ; 0,25) .
La presión media con que son inflados los balones en las máquinas respectivas se
⎡ 0,25 ⎤ ⎡ 0,25 ⎤
distribuyen con parámetros: x ≈ N ⎢α 1 ; ⎥ e y ≈ N ⎢α 2 ; ⎥
⎣⎢ 6 ⎦⎥ ⎣⎢ 9 ⎦⎥

Se desea contrastar la hipótesis nula de que las presiones medias de inflado con ambas
máquinas son iguales: H0 : α 1 = α 2 frente a la hipótesis alternativa H1 : α 1 ≠ α 2

Como la hipótesis alternativa es α 1 ≠ α 2 en la decisión que tengamos que tomar deben


ser válidos valores mayores o menores que α 2 , con lo que el contraste debe ser
bilateral o de dos colas.

⎧⎪ Si x − y > k se rechaza H 0 (RC)


La regla de decisión será: ⎨
⎪⎩ Si x − y ≤ k no se rechaza H 0 (RA)

Para analizar el contraste se realizan los cálculos:


6 9

∑x
i=1
i ∑y
j=1
j

x = = 4,33 y = =5 n1 = 6 n2 = 9
6 9
⎡ 0,25 ⎤ ⎡ 0,25 ⎤
- En las distribuciones del muestreo x ≈ N ⎢α 1 , ⎥ , y ≈ N ⎢α 2 , ⎥ , con lo cual,
⎣⎢ 6 ⎥⎦ ⎣⎢ 9 ⎥⎦
la diferencia de medias muestrales, bajo la hipótesis nula H0 : α 1 = α 2 , se distribuye:

⎡ σ 12σ 22 ⎤ ⎡ 0,25 2 0,25 2 ⎤


x − y ≈ N ⎢0 , + ⎥ ≡ N ⎢0 ; + ⎥ = N( 0 ; 0,13)
⎢ n1 n2 ⎥ ⎢⎣ 6 9 ⎥
⎣ ⎦ ⎦

- Se determina el valor de k mediante el nivel de significación α :

[
α = P (Rechazar H0 H0 cierta) = P x − y > k / H0 : μ x − μ y = 0 = ]

Santiago de la Fuente Fernández 153


Contraste de Hipótesis
⎡ ( x − y) − 0 ⎤ ⎡⎛ x − y ⎞ ⎛ x−y ⎞⎤ ⎡ x−y ⎤ ⎡ x−y ⎤
= P⎢ > K ⎥ = P ⎢ ⎜⎜ < − K ⎟⎟ ∪ ⎜⎜ > K ⎟⎟ ⎥ = P ⎢ < − K⎥ + P ⎢ > K⎥
⎣ 0,13 ⎦ ⎣ ⎝ 0,13 ⎠ ⎝ 0,13 ⎠⎦ ⎣ 0,13 ⎦ ⎣ 0,13 ⎦
α α
= + = 0,05 por simetría N(0, 1)
2 2

x−y x − y > 0, 255


La región crítica es > 1,96 = z 0, 025 a
0,13 x − y < − 0, 255

En consecuencia, la región de aceptación: − 0, 255 ≤ x − y ≤ 0, 255

La evidencia empírica x − y = 4, 33 − 5 = 0, 67 , valor que se encuentra en la región de


rechazo, por lo que no se acepta la hipótesis de que los balones inflados con las dos
máquinas tienen igual presión media.

ƒ Análogamente, la región de rechazo de la hipótesis nula H0 :

⎧ σ 12 σ 22 ⎫⎪ ⎧⎪ 0,25 2 0,25 2 ⎫⎪

R = ⎨ x − y > zα 2 + ⎬ a R = ⎨ 4, 33 − 5 > (1,96 ) + ⎬
⎪⎩ n1 n2 ⎪ ⎪⎩ 6 9 ⎪⎭

Se verifica la región de rechazo de la hipótesis nula, R = { 0,67 > 0, 255} , concluyendo


que los balones inflados con las dos máquinas no tienen igual presión media.

CONTRASTE BILATERAL – UNILATERAL DE DIFERENCIA DE MEDIAS CON VARIANZAS


POBLACIONALES CONOCIDAS.

27.- Una empresa ubicada en Madrid tiene dos conductores para trasladar a los
empleados a Segovia. Los conductores deben anotar la duración de cada trayecto. En
una muestra aleatoria simple de 50 partes de incidencias por conductor, el conductor A
registra un tiempo medio de trayecto de 62,30 minutos con una desviación típica de
10,325 minutos, mientras que el conductor B tiene un tiempo medio de trayecto de
60,02 minutos con una desviación típica de 8,625 minutos.

Santiago de la Fuente Fernández 154


Contraste de Hipótesis
El tiempo medio empleado por el conductor A en el trayecto sigue una ley normal
N(μ 1 , 9) y el empleado por el conductor B se distribuye según una ley N(μ 2 , 8) . Con un
nivel de significación del 5%, se pide contrastar:
1. H 0: μ 1 = μ 2 frente a H1: μ 1 ≠ μ 2
2. H 0: μ 1 − μ 2 ≥ 2 frente a H 0: μ 1 − μ 2 < 2

Solución:

1. Para realizar el contraste bilateral planteado ( H 0: μ 1 = μ 2 ) se recurre al test razón


de verosimilitud, ya que, en este caso el lema de Neyman-Pearson no proporciona una
región crítica óptima.

La regla de decisión que proporciona el test de razón de verosimilitud es:

⎧⎪ Si x − y > k se rechaza H 0
Regla de decisión ≡ ⎨
⎪⎩ Si x − y ≤ k se acepta H 0

La región crítica de dos colas x − y > k es función de la diferencia de las medias


muestrales. En esta línea, las distribuciones en el muestreo de las medias son:

⎡ σ1 ⎤ ⎡ σ2 ⎤
x ≈ N ⎢μ 1 , ⎥ , y ≈ N ⎢μ 2 , ⎥ , con lo cual, la diferencia de medias muestrales,
⎢⎣ n1 ⎥⎦ ⎢⎣ n 2 ⎥⎦
bajo la hipótesis nula, se distribuye:

⎡ σ 12 σ 22 ⎤ ⎡ 92 82 ⎤
x − y ≈ N ⎢0 , + ⎥ ≡ N ⎢0 , + ⎥ = N[0 , 1,7]
⎢ n1 n2 ⎥ ⎢⎣ 50 50 ⎥
⎣ ⎦ ⎦

El valor de k se determina a partir del nivel de significación α = 0,05

[
α = P (Rechazar H0 H 0 cierta) = P x − y > k / H0 : μ 1 − μ 2 = 0 = ]
⎡ k−0⎤ ⎡⎛ k ⎞ ⎛ k ⎞⎤ ⎡ k ⎤ ⎡ k ⎤
= P⎢ z > ⎥ = P ⎢ ⎜⎜ z < − ⎟⎟ ∪ ⎜⎜ z > ⎟⎟ ⎥ = P ⎢ z < − ⎥ + P ⎢z > = 0,05
⎣ 1,7 ⎦ ⎣⎝ 1,7 ⎠ ⎝ 1,7 ⎠ ⎦ ⎣ 1,7 ⎦ ⎣ 1,7 ⎥⎦

⎡ k k ⎤
y por consiguiente: P ⎢ − ≤ z ≤ = 0,95 = 1 − α
⎣ 1,7 1,7 ⎥⎦

Santiago de la Fuente Fernández 155


Contraste de Hipótesis
⎧ k
⎪ 1,7 = 1,96 = z α / 2 = z 0, 025

por simetría N(0, 1) ⎨ es decir, k = 3, 3377
⎪−k
⎪ = − 1,96 = − z α / 2 = − z 0, 025
⎩ 1,7

La región crítica es x − y > 3,3377 .


En consecuencia, la región de aceptación: − 3, 3377 ≤ x − y ≤ 3, 3377

La evidencia empírica x − y = 62, 30 − 60,02 = 2, 28 , valor que no se encuentra en la


región de rechazo, por lo que se acepta la hipótesis nula de igualdad de medias, con lo
que los dos conductores emplean en promedio el mismo tiempo en el trayecto Madrid-
Segovia, con una fiabilidad del 95%.

⎧ σ 12 σ 22 ⎫⎪

Señalar que la región de rechazo de la hipótesis nula: R = ⎨ x − y > z α 2 + ⎬
⎪⎩ n1 n2 ⎪

2. La hipótesis nula planteada es H 0: μ 1 − μ 2 ≥ 2 , en este caso, la región crítica que se


⎧ σ 12 σ 22 ⎫⎪

desprende de la razón de verosimilitud es R = ⎨ x − y − k < − z α + ⎬
⎪⎩ n1 n2 ⎪

en este caso, z 0, 05 = 1,645
⎧⎪ 92 8 2 ⎫⎪
R = ⎨ 62, 30 − 60,02 − 2 < − 1,645 + ⎬ = {0,28 < − 2,8013 }
⎪⎩ 50 50 ⎪

Como la región de rechazo no se verifica, se acepta la hipótesis nula formulada.

CONTRASTE BILATERAL DE LA DIFERENCIA DE PROPORCIONES.

28.- Muebles Quintana realiza un estudio sobre la satisfacción de sus empleados en


distintas secciones. En una muestra aleatoria simple de 100 trabajadores de barnizado
60 se encuentran satisfechos y de otra de 200 trabajadores de cortado se

Santiago de la Fuente Fernández 156


Contraste de Hipótesis
manifestaron satisfechos 125. ¿Existen diferencias en los porcentajes de trabajadores
satisfechos de ambas secciones, con un nivel de significación del 5%?

Solución:

Sean las variables aleatorias X = ‘trabajador de la sección de barnizado’ e Y =


‘trabajador de la sección de cortado’, respectivamente, las variables aleatorias toman el
valor uno si el trabajador está satisfecho, y el valor cero en caso contrario.
Las dos variables aleatorias siguen una distribución de Bernouilli de parámetro p
desconocido.
60 125
Las proporciones muestrales obtenidas son: p̂x = = 0, 6 p̂ y = = 0, 625
100 200

Se contrasta la hipótesis nula de que no existen diferencias entre las proporciones de


trabajadores satisfechos en ambas secciones, es decir, H0 : px = p y ; frente a la
hipótesis alternativa de que si existen diferencias, esto es, H1 : px ≠ p y . El contraste
debe ser bilateral o de dos colas.

⎧⎪ Si px − p y > k se rechaza H0 (RC )


La regla de decisión será: ⎨
⎪⎩ Si px − p y ≤ k no se rechaza H0 (RA)

La diferencia de las proporciones muestrales ( p̂x − p̂ y ) , teniendo en cuenta el tamaño de


las muestras (TCL), bajo la hipótesis nula, podemos considerar que siguen una
⎡ p̂x . q̂x p̂ y . q̂y ⎤ ⎡ 0, 6 . 0, 4 0, 625 . 0, 375 ⎤
distribución N ⎢ 0, + ⎥ ≡ N ⎢ 0, + ⎥ ≡ N [0 ; 0, 06 ]
⎢ nx ny ⎥ ⎢
⎣ 100 200 ⎦⎥
⎣ ⎦

Se determina el valor de k mediante el nivel de significación α :

⎡ ( p̂x − p̂ y ) − 0 ⎤
[
α = P (Re chazar H0 H0 cierta) = P p̂x − p̂ y > k / H0 : px − p y = 0 = P ⎢ ] ⎢⎣ 0, 06
> K⎥ =
⎥⎦
⎡⎛ p̂x − p̂ y ⎞ ⎛ p̂x − p̂ y ⎞⎤ ⎡ p̂x − p̂ y ⎤ ⎡ p̂x − p̂ y ⎤ α α
= P ⎢⎜ < − K⎟ ∪ ⎜ > K ⎟⎥ = P ⎢ < − K⎥ + P ⎢ > K ⎥ = + = 0, 05
⎢⎣⎜⎝ 0, 06 ⎟ ⎜ 0, 06
⎠ ⎝
⎟⎥
⎠⎦ ⎣⎢ 0, 06 ⎦⎥ ⎣⎢ 0, 06 ⎦⎥ 2 2
p̂x − p̂ y ⎧⎪ p̂ − p̂ y > 0, 1176
La región crítica es > 1,96 = z 0, 025 ⇒ ⎨ x
0, 06 ⎪⎩ p̂x − p̂ y < − 0, 1176

Región de aceptación de la hipótesis nula: − 0,1176 < p̂x − p̂ y < 0, 1176

Santiago de la Fuente Fernández 157


Contraste de Hipótesis
La evidencia empírica (estadístico observado)
p̂x − p̂ y = 0, 6 − 0, 625 = 0, 025 se encuentra en la
región de aceptación, por lo que se admite la
hipótesis nula, es decir, no aparecen diferencias
significativas en los porcentajes de trabajadores
satisfechos en las secciones de Muebles Quintana, con una fiabilidad del 95%.

Análogamente, analizando la región de rechazo:

p̂x − p̂ y = 0, 6 − 0, 625 = 0, 025 z 0, 025 = 1,96 ⎧


⎪ p̂x . q̂x p̂ y . q̂y ⎫⎪
0, 6 . 0, 4 0, 625 . 0, 375 R = ⎨ p̂x − p̂ y > z α 2 + ⎬
1,96 . + = 0,1176 ⎪⎩ nx ny ⎪
100 200 ⎭

0, 025 < 0,1176 , por lo que no se cumple la región de rechazo, aceptándose la hipótesis
nula con un nivel de significación del 5%.

CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS CON MEDIAS POBLACIONALES


DESCONOCIDAS.

Santiago de la Fuente Fernández 158


Contraste de Hipótesis

29.- Una empresa productora de cemento ensaya productos químicos para mejorar la
resistencia de las piezas de hormigón. Para ello, desea contrastar con un nivel de
significación del 5% la resistencia de dos muestras aleatorias simples, la muestra A no
es tratada con productos químicos mientras que la muestra B se encuentra tratada.
En la tabla adjunta se muestra la resistencia de las piezas ensayadas en kg/cm2:

Muestra A 350 370 340 355 365 347


Muestra B 348 363 372 360 359 365 361

Suponiendo que las dos muestras siguen una distribución normal, indicar si el
tratamiento con productos químicos consiguió una mejora en la resistencia de las piezas
de hormigón.

Solución:

Sea la variable aleatoria X que representa la resistencia de las piezas de hormigón sin
tratar con productos químicos, suponemos que X es una variable aleatoria normal de
media poblacional μ 1 desconocida y desviación típica poblacional σ 1 también
desconocida. Análogamente, la variable aleatoria Y representa la resistencia de las
piezas de hormigón tratadas con media poblacional μ 2 y desviación típica poblacional
σ 2 , ambas desconocidas.

Deseamos contrastar la hipótesis nula de que las resistencias esperadas son iguales,
H 0 : μ 1 = μ 2 , frente a la hipótesis alternativa de que las resistencias esperadas de las
piezas sin tratar es menor que las tratadas, es decir, H1 : μ 1 < μ 2 .

Como se trata de muestras pequeñas necesitamos comprobar estadísticamente si las


varianzas poblacionales σ 12 y σ 22 son iguales, planteando primero el siguiente contraste:

CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS POBLACIONALES CON MEDIAS


POBLACIONALES DESCONOCIDAS:

H 0 : σ 21 = σ 22 H1 : σ 21 ≠ σ 22
⎧⎪ s12
[
Región de rechazo de la hipótesis nula: R = ⎨ 2 ∉ F1 − α 2; (n1 − 1), (n2 − 1) ; Fα 2; (n1 − 1), (n2 − 1) ] ⎫⎪⎬
⎪⎩ s2 ⎪⎭
s 12
análogamente, región de aceptación: F1 − α 2; (n1 − 1), (n2 − 1) ≤ 2 ≤ Fα 2; (n1 − 1), (n2 − 1)
s2
ó el equivalente,

Santiago de la Fuente Fernández 159


Contraste de Hipótesis
n
(m − 1) ∑ ( xi − x ) 2
región aceptación H0 : F1 − α 2; (n1 − 1), (n2 − 1) ≤ i =1
m ≤ Fα 2; (n1 − 1), (n2 − 1)
(n − 1) ∑ (y j − y ) 2

j =1

En nuestro caso, con los datos muestrales:

6

⎪ ∑ ( xi − x ) 2 F5 , 6 = s 21 s 22 = 2,43
⎪ n1 = 6 x = 354, 5 s 21 = i =1
= 127, 5
⎪ 5 1 1
⎨ F0,975 ; 5, 6 = = = 0,1432

7
F0, 025 ; 6, 5 6,98

∑ (y j − y ) 2 F0, 025 ; 5, 6 = 5,99
j =1
⎪⎩ n 2 = 7 y = 361,14 s 22 =
6
= 52, 476

Se observa que el estadístico experimental


de contraste F5 , 6 = 2,43 se encuentra en la
región de aceptación de la hipótesis nula,
F0,975 ; 5, 6 = 0,1432 ≤ 2,43 ≤ 5,99 = F0, 025 ; 5, 6 ,
con lo que concluimos que, con un nivel de
significación del 5%, no hay evidencias de
que la resistencia de las piezas tratadas con
productos químicos presente una varianza distinta de aquellas piezas que no fueron
tratadas.

CONTRASTE UNILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZAS


POBLACIONALES DESCONOCIDAS PERO IGUALES:

Planteamos la hipótesis nula H 0 : μ 1 = μ 2 frente a la hipótesis alternativa H1 : μ 1 < μ 2


⎧⎪ 1 1 ⎫⎪
Región de rechazo de la hipótesis nula: R = ⎨ ( x − y ) > t α ; ( n 1 + n 2 − 2) s p + ⎬,
⎪⎩ n1 n2 ⎪⎭
o lo que es igual, se acepta H0 si
(x − y) (n1 − 1) s 12 + (n 2 − 1) s 22
t= ≤ t α ; ( n 1 + n 2 − 2) s p2 =
sp n1 + n1 1442443 n1 + n 2 − 2
1 2 estadístic o teórico 1444444 24444443
144244 3 cuasi varianza muestral
estadístic o contraste

En nuestro caso,

Santiago de la Fuente Fernández 160


Contraste de Hipótesis

⎪ n1 = 6 x = 354,5 s 21 = 127,5 354,5 − 361,14
⎪⎪ t= = − 1,2832
2 1 1
⎨ n 2 = 7 y = 361,14 s 2 = 52, 476 86,58 +
⎪ 6 7
⎪ s 2 = 5. 127,5 + 6 . 52, 476 = 86,58 t α ; ( n 1 + n 2 − 2) = t 0, 05 ; 11 = 1, 796
⎪⎩ p 11

El estadístico empírico (contraste) es menor que el estadístico teórico,


t = − 1,2832 < 1,796 = t 0, 05 ; 11 , con un nivel de significación del 5% se acepta la
hipótesis nula, concluyendo que no se aprecia en la primera muestra una resistencia
media significativa menor que en la segunda muestra tratada. Esto es, el tratamiento
químico no presenta mayor resistencia en las piezas de hormigón.

Santiago de la Fuente Fernández 161


Contraste de Hipótesis
CONTRASTE BILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZAS
POBLACIONALES DESCONOCIDAS.

30.- Un instituto de alimentación animal quiere comparar estadísticamente dos tipos


de dietas. Selecciona al azar una muestra de quince animales de una población de
animales comparables. A nueve de ellos se les suministra la dieta primera y a los seis
restantes la dieta segunda. Los resultados del aumento de peso en kg en una semana son
los siguientes:

Dieta primera 3,75 4,2 4,6 3,95 4,1 3,9 4,3 3,9 4
Dieta segunda 3,6 4,5 4,4 3,2 4 3

Con un nivel de significación del 10%, ¿puede afirmarse que la dieta primera es mejor
que la segunda?

Solución:

Suponiendo que la variable de respuesta (X, Y) para cada una de las dietas (aumento
semanal de peso en kg) es una variable que, respectivamente, se distribuye normal
N(μ 1 , σ 1 ) y N(μ 2 , σ 2 ) , donde σ 1 y σ 2 son desconocidas, al tratarse de muestras
pequeñas antes de realizar el contraste para la igualdad de medias poblacionales
necesitamos comprobar estadísticamente si las varianzas poblacionales desconocidas
σ 12 y σ 22 son iguales o distintas.
Por ello, primeramente se plantea:

CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS POBLACIONALES CON MEDIAS


POBLACIONALES DESCONOCIDAS:

H 0 : σ 21 = σ 22 H1 : σ 21 ≠ σ 22
⎧⎪ s 12 ⎫⎪
Región Rechazo de Hipótesis nula: R = ⎨ 2 ∉ [F1 − α 2; (n1 − 1), (n2 − 1) ; F ]
α 2; (n1 − 1), (n2 − 1) ⎬
⎪⎩ s 2 ⎪⎭
s 12
Análogamente, la Región de Aceptación: F1− α 2; (n1 − 1), (n2 − 1) ≤ ≤ Fα 2; (n1 − 1), (n2 − 1)
s 22
Para hallar el estadístico de contraste, según los datos muestrales:

9

⎪ ∑ ( xi − x ) 2 F8, 5 = s 12 s 22 = 0, 1735
⎪ n1 = 9 x = 4, 08 s 12 = i =1
= 0, 067
⎪ 8 1 1
⎨ F0,95 ; 8, 5 = = = 0, 2711

6
F0, 05 ; 5, 8 3,6875
∑ (y j − y ) 2
⎪ j =1 F0, 05 ; 8, 5 = 4, 8183
⎪⎩ n2 = 6 y = 3, 78 s 22 =
5
= 0, 386

Región de rechazo: R = { 0, 1735 ∉ [ 0,2711 ; 4,8183] }

Santiago de la Fuente Fernández 162


Contraste de Hipótesis
Se observa que el estadístico experimental
de contraste F8 , 5 = 0, 1735 verifica la
región de rechazo de la hipótesis nula, con
lo que concluimos que, con un nivel de
significación del 10%, hay evidencias de
que las varianzas poblacionales son
desconocidas y distintas.

CONTRASTE UNILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZAS


POBLACIONALES DESCONOCIDAS Y DISTINTAS:

Basándonos en la comprobación estadística que hemos realizado, planteamos la hipótesis


nula H 0 : μ 1 ≤ μ 2 frente a la hipótesis alternativa H1 : μ 1 > μ 2

⎧ s 12 s 22 ⎫
⎪ ⎪
Región de rechazo de la hipótesis nula: R = ⎨ ( x − y ) > t α ; f + ⎬ , o lo que es
⎪⎩ n1 n2 ⎪⎭
igual, se acepta H0 si
2
⎛ s 12 s 22 ⎞⎟
⎜ +
(x − y) ⎜ n1 n 2 ⎟⎠
t= ≤ t α; f f = ⎝ − 2
s12 s 22 { (s 12 / n1 ) 2 (s 22 / n 2 )2
+ estadístic o +
n1 n 2 teórico n1 + 1 n +1
14
42443 14444444 42442444444 3
estadístic o contraste aproximación de Welch

⎧ n1 = 9 x = 4,08 s 21 = 0,067

En nuestro caso, ⎨
⎪⎩ n 2 = 6 y = 3,78 s 22 = 0,386

( 4,08 − 3,78 ) s 12 s 22 0,067 0,386


t= = 1,128 + = + = 0,266
0,067 0,386 n1 n2 9 6
+
9 6
2
⎛ 0,067 0,386 ⎞
⎜ + ⎟
⎝ 9 9 ⎠
f = − 2 = 2,125 ≈ 2 t α ; f = t 0,10 ; 2 = 1,886
(0,067 / 9) 2 (0,386 / 6) 2
+
10 7

En consecuencia, la región de rechazo de la hipótesis nula no se verifica:

⎧ s 12 s 22 ⎫
⎪ ⎪
R = ⎨ (x − y) > t α; f + ⎬ = { 0, 3 > 1,886 . 0,266 } = { 0, 3 > 0,5 }
⎪⎩ n1 n2 ⎪⎭

Santiago de la Fuente Fernández 163


Contraste de Hipótesis

Análogamente, el estadístico empírico (contraste) es menor que el estadístico teórico,


t = 1, 128 < 1,886 = t 0, 10 ; 2 , por tanto, con un nivel de significación del 10%, se acepta
la hipótesis nula, concluyendo que no existe evidencia estadística de que la primera
dieta sea mejor que la segunda.

31.- Una empresa que se dedica a fabricar zapatillas de deporte dispone de dos
proveedores de suelas de goma. Para analizar el desgaste de las suelas se ha tomado
una muestra al azar de cada proveedor, obteniéndose los siguientes resultados:

Santiago de la Fuente Fernández 164


Contraste de Hipótesis

Proveedor Tamaño muestral Desgaste medio Cuasivarianza desgaste


1 n = 10 x = 0,6 s2x = 0,068
2 m = 14 y = 0,62 s2y = 0,054

Suponiendo que el desgaste de las suelas sigue una distribución normal, ¿se puede decir,
para un nivel de confianza del 95%, que ambos proveedores proporcionan un producto
de semejante resistencia media al desgaste?.

Solución:
⎧ H0 : μ 1 = μ 2
Se tiene que realizar un contraste bilateral de igualdad de medias: ⎨
⎩ H1 : μ 1 ≠ μ 2
con varianzas poblacionales desconocidas, con muestras pequeñas n + m < 30

Dependiendo de que se suponga que las varianzas son iguales o no el contraste variará.
Por ello, es necesario realizar primero un contraste relativo a la igualdad de varianzas.

CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS POBLACIONALES CON MEDIAS


POBLACIONALES DESCONOCIDAS:

H0 : σ21 = σ22 H1 : σ21 ≠ σ22

Como la hipótesis alternativa es σ 12≠ σ 22 en la decisión que se elija deberán ser válidos
valores de σ 12 > σ 22 ó σ 12 < σ 22 , por lo cual el contraste debe ser bilateral o de dos colas.

Una distribución F de Fisher-Snedecor,


con dos variables χ2n y χ2m , independientes
χ2n n
entre si, es una variable Fn , m = .
χ2m m
s21
Estadístico de contraste: = F(n−1) , (m−1)
s22

La regla de decisión será: 0 ≤ F9 , 13 ≤ k


El valor crítico de k se determina mediante el nivel de significación α = 0,05 :

[
α = P (Rechazar H0 / H0 cierta) = 0 ≤ F9 , 13 ≤ k / H0 = ]
[ ] [ ] [
= P (0 ≤ F9 , 13 ≤ k1 ) ∪ ( k2 ≤ F9 , 13 ≤ ∞) = P F9 , 13 ≤ k 1 + P k 2 ≥ F9 , 13 = 0,05 ]

Santiago de la Fuente Fernández 165


Contraste de Hipótesis
[ ] [ ] [ ]
P 0 ≤ F9 , 13 ≤ k 1 = P F9 , 13 ≤ k 1 − P F9 , 13 ≤ 0 = P F9 , 13 ≤ k 1 [ ]
[ ] [ ]
P k 2 ≤ F9 , 13 ≤ ∞ = P F9 , 13 ≤ ∞ − P F9 , 13 ≤ k 2 =[ ]
[
= 1 − P F9 , 13 ≤ k ] = 1 − (1 − P [ F
2 9 , 13 ≥ k2 ] ) = P [F 9 , 13 ≥ k2 ]
se tiene:


[ ]
⎪ P F9 , 13 ≤ k 1 = 0,025 ⇒ k 1 = F1− 0,025 ; 9 , 13 = F
1
=
1
3,83
= 0,2611
⎪ 0,025 ; 13 , 9


[
⎪ P k ≥F
2 9 , 13 ]
= 0,025 ⇒ k 2 = F0,025 ; 9 , 13 = 3,31

La región crítica es:

(0 ≤ F9 , 13 ≤ 0,2611) ∪ (F9 , 13 ≥ 3,31)

s21 0,068
Se observa que el estadístico muestral F9 , 13 = = = 1,259 no se encuentra en
s22 0,054
la región de rechazo. En consecuencia, con un nivel de confianza del 95%, se acepta que
las varianzas son desconocidas pero iguales.

♦ Otra forma rápida de contrastar la hipótesis es haber utilizado la Región de


Rechazo de la Hipótesis nula:
⎧⎪ s 12 ⎫⎪
[
R = ⎨ 2 ∉ F1− α 2; (n − 1), (m− 1); Fα 2; (n − 1), (m − 1) ⎬ ]
⎪⎩ s 2 ⎪⎭

[
R = 1,259 ∉ (0,2611 = F0,975; 9, 13; 3,31 = F0,025; 9, 13 ) ]

CONTRASTE BILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZAS


POBLACIONALES DESCONOCIDAS PERO IGUALES:

La hipótesis nula H 0 : μ 1 = μ 2 frente a la hipótesis alternativa H 1 : μ 1 ≠ μ 2


Como la hipótesis alternativa es μ 1 ≠ μ 2 en la decisión que tengamos que tomar deben
ser válidos valores mayores o menores que μ 2 , con lo que el contraste debe ser
bilateral o de dos colas.

Santiago de la Fuente Fernández 166


Contraste de Hipótesis
⎧⎪ Si x − y ≤ k se acepta H 0 (RA)
La regla de decisión será: ⎨
⎪⎩ Si x − y > k se rechaza H 0 (RA)

En el muestreo de las dos poblaciones normales con varianzas desconocidas pero iguales,
x − μ1 y − μ2
las variables X e Y, respectivamente: = t10 −1 e = t14 −1
s1 n s2 m

s2p s2p
Bajo la hipótesis nula (μ 1 = μ 2 ) : (x − y) ≈ t9 +13 (0 ; + ) , donde:
n m
s2 s2
6 −14
4n7 86 47148 6 4m7−14
86 47248
(10 − 1) (0,068) + (14 − 1) (0,054)
s2p = = 0,0597 (cuasivarianza muestral ponderada)
10
14 + 14
4244 −32
n + m− 2

0,0597 0,0597
es decir, (x − y) ≈ t 9 +13 (0 ; + ) ≡ t22 (0 ; 0,101)
10 14

El valor crítico k, bajo la hipótesis nula, (x − y) ≈ t22 (0 ; 0,101) , se calcula a partir del
nivel de significación α:

α = P (Rechazar H 0 H 0 cierta) = P( x − y > k H 0 cierta ) =


⎡x−y k ⎤
=P ⎢ > ⎥ = 0,05
⎣ 0,101 0,101 ⎦

x−y
La región crítica: > 2,074 = t 0,025; 22 a x − y > 0,209
0,101

La región de rechazo de la hipótesis nula es: R = ( x − y > 0,209 ) . La evidencia


empírica muestra que x − y = 0,6 − 0,62 = 0,02 , valor que no se encuentra en la
región de rechazo, por lo que se acepta la hipótesis nula.
Así pues, no existe diferencia entre las resistencias medias al desgaste de los
productos proporcionados por los dos proveedores, con una confianza del 95%.

♦ Otra forma rápida de contrastar la hipótesis es haber utilizado la Región de


Rechazo de la Hipótesis nula:
⎧⎪ 1 1 ⎫⎪
R = ⎨ x − y > t α 2 ;(n + m − 2) s p + ⎬
⎪⎩ n m ⎪⎭
sp = 0,0597 = 0,2443 , t0,025; 22 = 2,074

⎧⎪ 1 1 ⎪⎫
R = ⎨ 0,6 − 0,62 > (2,074) (0,2443) + ⎬ a R = { 0,02 > 0,209 }
⎪⎩ 10 14 ⎭⎪

Santiago de la Fuente Fernández 167


Contraste de Hipótesis
La evidencia muestra que no se verifica la región de rechazo, por lo que se acepta la
hipótesis nula, con un nivel de confianza del 95%. Esto es, no existe diferencia entre
las resistencias medias al desgaste de los productos proporcionados por los dos
proveedores.

Santiago de la Fuente Fernández 168


Contraste de Hipótesis

32.- En un informa presentado por un reportero a una revista feminista se afirma que
el número medio de horas semanales de conexión a Internet es el mismo para hombres
que para mujeres. Sin embargo no parece prudente publicar estos datos sin
contrastarlos estadísticamente. Se selecciona para ello una muestra de 75 hombres y
50 mujeres. Los resultados muestrales se recogen en la siguiente tabla:

Hombres Mujeres
Tamaño muestral 75 50
Número medio de horas/semana 7,42 5,34
Dispersión en la conexión 9,08 7,24

a) Formular el contraste a realizar y señalar los supuestos que se deben realizar para
resolver el ejercicio.
b) Determinar la región crítica del contraste.
c) Calcular el estadístico del contraste.
d) ¿Existe evidencia para rechazar la hipótesis nula a un nivel de significación del 5%?

Solución:

a) Sean las variables aleatorias, respectivamente, X = 'Tiempo conexión a Internet de


los hombres' e Y = 'Tiempo conexión a Internet de las mujeres', donde X ≈ N(μ 1, σ1 )
e Y ≈ N(μ 2 , σ2 ) .
⎧ x = 7,42 s 1 = 9,08 n = 75

En las muestras se obtuvieron los resultados: ⎨
⎪ y = 5,34 s 2 = 7,24 m = 50

NOTA.- En el supuesto que la dispersión muestral se refiriese a la desviación típica,


tendríamos que considerar la relación [ n σ2 = (n − 1) s2 ], en este caso, se tendría
s 1 = 9,14 y s 2 = 7,31

⎧ H 0: μ 1 − μ 2 = 0
b) En el contraste se establecen las hipótesis: ⎨
⎩ H1: μ 1 − μ 2 ≠ 0

Como la hipótesis alternativa es μ 1 − μ 2 ≠ 0 en la decisión que se elija deberán ser


válidos valores de μ 1 > μ 2 ó μ 1 < μ 2 , por lo cual el contraste debe ser bilateral o de
dos colas.
⎧⎪ Si x − y ≤ k se acepta H0 (R.A.)
La regla de decisión será: ⎨
⎪⎩ Si x − y > k se rechaza H 0 (R.C.)
Varianzas poblacionales desconocidas con muestras grandes
Los supuestos son:
Independencia de la selección muestral

Santiago de la Fuente Fernández 169


Contraste de Hipótesis

c) En el muestreo de las dos poblaciones normales con varianzas desconocidas, las


⎛ s1 ⎞ ⎛ s ⎞
variables X e Y, respectivamente, siguen distribuciones: N ⎜⎜ μ 1, ⎟ y N ⎜ μ 2, 2 ⎟ ,
⎝ n ⎟⎠ ⎜
⎝ m ⎟⎠
⎡ s21 s22 ⎤
con lo que la diferencia de medias muestrales (x − y) ≈ N ⎢(μ 1 − μ 2 ) , + ⎥
⎢ n m⎥
⎣ ⎦

Con lo cual, la diferencia de medias muestrales, bajo la hipótesis nula H0 : μ 1 − μ 2 = 0 ,


se distribuye:
⎡ (9,08) 2 (7,24) 2 ⎤
(x − y) ≈ N ⎢0 , + ⎥ = N(0 ; 1,465)
⎢⎣ 75 50 ⎥

El valor crítico k se determina mediante el nivel de significación α :

[
α = P (Rechazar H 0 H 0 cierta) = P x − y > k / H 0 : μ 1 − μ 2 = 0 = ]
⎡ ( x − y) − 0 ⎤ ⎡⎛ x − y ⎞ ⎛ x−y ⎞⎤
= P⎢ > K ⎥ = P ⎢ ⎜⎜ < − K ⎟⎟ ∪ ⎜⎜ > K ⎟⎟ ⎥ =
⎣ 1, 465 ⎦ ⎣ ⎝ 1, 465 ⎠ ⎝ 1, 465 ⎠⎦
⎡ x−y ⎤ ⎡ x−y ⎤ α α
= P⎢ < − K⎥ + P ⎢ > K ⎥ = + = 0,05 por simetría N(0, 1)
⎣ 1, 465 ⎦ ⎣ 1, 465 ⎦ 2 2

x−y
La región crítica: > 1,96 = z 0, 025
1, 465

x − y > 2,8714

En consecuencia, la región de aceptación: − 2, 8714 ≤ x − y ≤ 2, 8714

d) La evidencia empírica x − y = 7, 42 − 5,34 = 2, 08 , valor que no se encuentra en la


región de rechazo, por lo que se acepta la hipótesis nula de igualdad de medias. Esto es,
con un nivel de significación del 5%, el número medio de horas conectados a internet es
el mismo para hombres que para mujeres.

Santiago de la Fuente Fernández 170


Contraste de Hipótesis

33.- En dos poblaciones N ( 2, σ 1 ) y N ( 3, σ 2 ) , con un nivel de significación del 10%, se


quiere contrastar la hipótesis de igualdad de varianzas, habiendo tomado,
respectivamente, dos muestras independientes, con los datos que se reflejan en la tabla
adjunta:

xi 2 7 5 9
yj 4 10 7 8 5 9

Solución:

Las variables aleatorias X e Y siguen, respectivamente, distribuciones N ( 2, σ 1 ) e


N ( 3, σ 2 ) .
⎧⎪ H : σ 12= σ 22
En el contraste bilateral se establecen las hipótesis: ⎨ 0 2
⎪⎩ H1 : σ 1 ≠ σ 2
2

n
∑ ( xi − μ ) 2
Sabemos que la variable i =1
2
≈ χ2n por ser la suma de n variables aleatorias
σ
χ2n n
N ( 0, 1) , independientes entre sí. Por otro lado, la variable Fn , m = se distribuye
χ2m m
como una F de Fisher-Snedecor con n y m grados de libertad.
4 6

∑ ( xi − 2 ) 2 ∑ ( yj − 3 ) 2
j =1
Bajo la hipótesis nula σ 12= σ 22= σ 2 , las variables i =1
2
≈ χ24 e ≈ χ26 , y
σ 1 σ 22
4
∑ ( xi − 2 ) 2 4
i =1
χ 2
4 4 4 σ2 6 ∑ ( xi − 2 ) 2
la variable F4 , 6 = = 6
= i =1
6
χ26 6 4
∑ ( yj − 3) 2
∑ ( yj − 3 ) 2
j =1 j =1

6σ 2

Como la hipótesis alternativa es σ 12≠ σ 22 en la


decisión que se elija deberán ser válidos valores
de σ 12 > σ 22 ó σ 12 < σ 22 , por lo cual el contraste
debe ser bilateral o de dos colas.

La regla de decisión será: 0 ≤ F4 , 6 ≤ k

El valor de k se determina mediante el nivel de significación α = 0, 10 :

Santiago de la Fuente Fernández 171


Contraste de Hipótesis

[ ] [
α = P (Rechazar H0 / H0 cierta) = 0 ≤ F4 , 6 ≤ k / H0 = P (0 ≤ F4 , 6 ≤ k1 ) ∪ ( k2 ≤ F4 , 6 ≤ ∞) = 0,10 ]
[ ] [
= P F4 , 6 ≤ k1 + P k2 ≥ F4 , 6 = 0, 10 ]
[ ] [ ] [
⎧ P 0 ≤ F4 , 6 ≤ k1 = P F4 , 6 ≤ k1 − P F4 , 6 ≤ 0 = P F4 , 6 ≤ k1 ] [ ]


⎩ [
2 4, 6
] [
4, 6 4, 6 2 ] [
⎪P k ≤ F ≤ ∞ = P F ≤ ∞ − P F ≤ k = 1 − P F ≤ k = 1 − 1 − P F ≥ k = P F ≥ k
4, 6 2 4, 6 2 4, 6 2] [ ] ( [ ]) [ ]

[ ]
⎪P F4 , 6 ≤ k1 = 0,05 ⇒ k1 = F1 − 0, 05 ; 4 , 6 = F
1
=
1
6,16
= 0,162
⎪ 0, 05 ; 6 , 4
se tiene: ⎨

[
⎪P k ≥ F
2 4, 6
]
= 0,05 ⇒ k2 = F0, 05 ; 4 , 6 = 4, 53

La región crítica es: (0 ≤ F4 , 6 ≤ 0,162) ∪ ( F4 , 6 ≥ 4, 53)

De otra parte, para conocer el valor muestral del estadístico F, es necesario calcular:

4
4 6
6 ∑ ( xi − 2 ) 2 6 . 83
∑ (xi − 2 ) 2 = 83 ∑ ( yj − 3) 2 = 131 F4 , 6 =
4
i =1
6
=
4 . 131
= 0,95
i =1 j =1
∑ ( yj − 3) 2
j =1

Se observa que el estadístico muestral F4 , 6 = 0,95 no pertenece a ninguno de los dos


intervalos, encontrándose en la región de aceptación, en consecuencia, aceptamos la
hipótesis nula de igualdad de varianzas, a un nivel de significación del 10%.

⎧⎪ s x2
[
Análogamente, la región de rechazo: R = ⎨ 2 ∉ F1 − α 2; (n 1 − 1), (n 2 −1) ; Fα 2; (n 1 − 1), (n 2 − 1)
⎪⎩ s y
]⎫⎪⎬⎪

4 6

∑ ( xi − x ) 2 ∑ ( yji − y ) 2 s x2
j =1
En el muestreo: s = 2
x
i =1
= 8,92 s =
2
y = 5,37 = 1,66
nx − 1 ny −1 s y2
1 1
F1 − α / 2 ; ( n 1 − 1), (n 2 − 1) = F0, 95 ; 3, 5 = = = 0,11 Fα / 2 ; ( n 1 − 1), (n 2 − 1) = F0, 05 ; 3, 5 = 5, 4095
F0, 05 ; 5, 3 9,0135

El estadístico muestral (s x2 / s y2 ) = 1,66 ∈ [0, 11 ; 5, 4095 ] , por lo que aceptamos la


hipótesis nula de igualdad de varianzas, con un nivel de significación del 10%.

Santiago de la Fuente Fernández 172


Contraste de Hipótesis
CONTRASTE DE HIPÓTESIS. TEOREMA DE NEYMAN-PEARSON.

34.- Un experto cree que el número medio de errores por página que comete es dos.
Por otra parte, el editor defiende que el número medio es de cuatro. Para una muestra
aleatoria simple de 100 páginas, con un nivel de significación del 5%, se pide:
1. Obtener la región crítica.
2. Hallar la potencia del contraste.
3. Si en la muestra aleatoria de 100 páginas se encontraron 250 errores, ¿qué
hipótesis se acepta?
Nota.- Se supone que el número de errores por página sigue una distribución de Poisson.

Solución:

1) La variable aleatoria X = ’número de errores por página’ sigue una distribución de


Poisson de parámetro λ (número medio de errores por página).
⎧H0 : λ = 2
Sobre el parámetro λ se establecen las hipótesis nula y alternativa: ⎨
⎩H1 : λ = 4
La función de verosimilitud para una muestra aleatoria simple de tamaño n:
n
∑xi
⎛ λx 1 − λ ⎞ ⎛ λx 2 − λ ⎞ ⎛ λx n − λ ⎞ λ =1
i
L ( x1 , x 2 , L , xn , λ ) = ⎜ e ⎟⎜ e ⎟L⎜ e ⎟= e −n λ
⎜ x1 ! ⎟ ⎜ x2 ! ⎟ ⎜ xn ! ⎟ n
⎝ ⎠⎝ ⎠ ⎝ ⎠ ∏ xi !
i =1

Para obtener la mejor región crítica se aplica el teorema de Neyman-Pearson:

100
∑ xi
2 i=1
n e − 2 00 100
∑ xi
100
∑ xi

L (x1, x2, L , xn , λ = 2) ∏ xi ! ⎡1 ⎤
i =1
⎡1 ⎤
i =1
k1
= i =1
100
=⎢ ⎥ e 2 00 ≤ k1 ⇒ ⎢ ⎥ ≤
L (x1 , x 2, L , xn , λ = 4) ⎣2 ⎦ ⎣2 ⎦ e 2 00
∑ xi
4 i=1
n e − 400
∏ xi !
i =1
100
∑ xi
i =1
⎡1 ⎤ k1 100 ⎡1 ⎤ ⎡ k1 ⎤ 100 ⎡ k1 ⎤
⎢⎣ 2 ⎥⎦ ≤ a ∑ xi ln ⎢ ⎥ ≤ ln ⎢ 2 00 ⎥ ⇒ − ∑ xi ln 2 ≤ ln ⎢ 2 00 ⎥
e 2 00
i =1 ⎣2 ⎦ ⎣e ⎦ i =1
⎣e ⎦

100 (
ln k1 e 2 00 ) = k . La mejor región crítica es de la forma 100
∑ xi ≥ ∑ xi ≥ k
i =1 ln 2 i =1

El valor de k se obtiene considerando que el nivel de significación es del 5%, y teniendo


100
en cuenta que ∑ xi , bajo la hipótesis nula, sigue una distribución de Poisson de
i =1

Santiago de la Fuente Fernández 173


Contraste de Hipótesis
100 100
parámetro λ = 100 . 2 = 200 , es decir, ∑ xi ∈ P (λ = 200) . Por otra parte, ∑ xi se puede
i =1 i =1

aproximar mediante la distribución normal N (200, 200 ) . En consecuencia:

⎡ 100 xi − 200 k − 200 ⎤


⎡ 100
⎤ ⎢ i∑ ⎥ k − 200
P ∑ xi ≥ k = P ⎢ =1
≥ = 0,05 a = 1, 645 ⇒ k = 223, 3
⎣⎢ i=1 ⎥⎦ 200 200 ⎥ 200
⎢ ⎥
⎣ ⎦

100
La mejor región crítica es ∑ xi ≥ 223, 3 . En otras palabras, si la suma de observaciones
i =1

muestrales es mayor que 223,3 se rechaza la hipótesis nula.

2) 1 − β = Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H1 cierta)

100
Considerando, de una parte, que bajo la hipótesis alternativa H1 : λ = 4 , el ∑ xi sigue
i =1
100
una distribución de Poisson de parámetro λ = 100 . 4 = 400 , es decir, ∑ xi ∈ P (λ = 400) .
i =1

Teniendo en cuenta su aproximación a la distribución normal N ( 400, 400 ) , resulta:

⎡ 100 xi − 400 223 − 400 ⎤


⎢ i∑ ⎥
= P [ z ≥ − 8, 85] ≈ 1
100
P = P ⎡⎢ ∑ xi ≥ 223 ⎤⎥ = P⎢ =1

⎣ i =1 ⎦ 400 400 ⎥
⎢⎣ ⎥⎦

La potencia del contraste es prácticamente la unidad.

3) En la muestra aleatoria simple de 100 páginas se encontraron 250 errores, como la


100
región crítica es ∑ xi ≥ 223, 3 , con un nivel de significación del 5% se rechaza la
i =1

hipótesis nula del experto que aseguraba que el número medio de errores por página era
de dos.

Santiago de la Fuente Fernández 174


Contraste de Hipótesis

35.- En una distribución de Poisson se establece sobre el parámetro la hipótesis nula,


H0: λ = 0,1 , y la alternativa, H1: λ = 0,4 . En muestras aleatorias simples de tamaño
100, siendo el nivel de significación 0,1, se desea conocer:
a) La mejor región crítica.
b) La potencia del contraste.

Solución.-

a) Una variable aleatoria X sigue una distribución de Poisson de parámetro λ cuando:

λk − λ
P(X = k) = e
k!

Aplicando el lema de Neyman-Pearson, el cociente de las funciones de verosimilitud:

x x x
0,1 1 − 0,1 0,1 2 − 0,1 0,1 100 − 0,1
e e L e
L(x 1, x 2 , L , x 100; λ = 0,1) x 1! x 2! x 100!
= x x x
=
L(x 1, x 2 , L , x 100; λ = 0,4) 0,4 1 − 0,4 0,4 2 − 0,4 0,4 100 − 0,4
e e L e
x 1! x 2! x 100!
100
∑ xi 100 100 100

0,1 ⎞ i∑ ∑ xi ∑ xi
−10 xi − −
0,1 =1
i e ⎛ ⎛ 0,4 ⎞
= 100
= ⎜ ⎟ =1
. e 30 = ⎜ ⎟ i =1
. e 30 = 4 i =1 . e 30 ≤ k 1
∑ xi ⎝ 0,4 ⎠ ⎝ 0,1 ⎠
0,4 =1
i e − 40

de donde,

100 100 100


− ∑ xi − ∑ xi − ∑ xi
4 i =1 . e 30 ≤ k 1 ⇒ 4 i =1 ≤ e − 30. k 1 ⇒ ln 4 i =1 ≤ ln (e − 30. k 1 )

100 ln (e − 30. k 1 ) 100 100


− ∑ xi ≤ a ∑ x i ≥ k . La mejor región crítica es ∑ x i ≥ k
i =1 ln 4 i =1 i =1

100
- Bajo la hipótesis nula, ∑ x i es una variable aleatoria, suma de cien variables
i =1
aleatorias independientes, que sigue una distribución de Poisson de parámetro
P(λ = 100 . 0,1) = P(10) .
Por otra parte, como el tamaño muestral es lo suficientemente grande se puede utilizar
100
la aproximación normal (teorema central del límite): ∑ x i ≈ N(10, 10 )
i =1

El valor crítico k se determina mediante el nivel de significación α = 0,1

Santiago de la Fuente Fernández 175


Contraste de Hipótesis

⎡ 100 ⎤
⎢ ∑ x i − 10 k − 10 ⎥ k − 10
⎡100 ⎤
P ⎢ ∑ x i ≥ k / H 0 ⎥ = P ⎢ i =1 ≥ ⎥ = 0,1 a = 1,2817 ⇒ k = 14,05
⎣ i =1 ⎦ ⎢ 10 10 ⎥ 10
⎣ ⎦
Como los valores que toma una variable de Poisson son enteros, la mejor región crítica
100
es ∑ x i ≥ 15 . Es decir, cuando la suma de los valores muestrales sea mayor que 15,
i =1
rechazaremos la hipótesis nula.

b) Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H 1 cierta)

100
Considerando, de una parte, que bajo la hipótesis alternativa H1 : λ = 0,4 , el ∑ xi sigue
i =1
100
una distribución de Poisson de parámetro λ = 100 . 0,4 = 40 : ∑ x i ≈ P (λ = 40)
i =1

Teniendo en cuenta su aproximación a la distribución normal N(40, 40 ) , resulta:

⎡ 100 ⎤
⎢ i∑ x i − 40 ⎥
⎡100 ⎤ 15 − 40
Po = P ⎢ ∑ x i ≥ 15 / H1 cierta⎥ = P ⎢ =1 ≥ ⎥ = P [ z ≥ − 3,95] = 0,99996
⎣ i =1 ⎦ ⎢ 40 40 ⎥
⎣ ⎦

La potencia del contraste es prácticamente la unidad.

Santiago de la Fuente Fernández 176


Contraste de Hipótesis

36.- Las patatas cultivadas en la parcela A siguen una distribución N (α 1 , 144) ;


mientras que las cultivadas en la parcela B siguen una distribución N (α2 , 225) . Un
agricultor quiere contrastar que el peso medio de las patatas cultivadas en ambas
parcelas es el mismo, H0 : α 1 − α2 = 0 , frente a la hipótesis alternativa de que el peso
medio de las patatas cultivadas en la parcela A es de 80 gramos mayor que el de las
cultivadas en la parcela B, H1 : α 1 − α2 = 80 . Para ello, selecciona una muestra aleatoria
de 100 patatas de la primera parcela con un peso medio de 400 gramos; y otra de 81
patatas de la segunda parcela con un peso medio de 324 gramos. Se pide:
1. Hallar la mejor región crítica.
2. Calcular la potencia del contraste.
3. ¿Se acepta la hipótesis de que las patatas cultivadas en ambas parcelas tienen el
mismo peso medio?

Solución:

Sean la variable aleatoria X = ’peso medio de las patatas en la parcela A’, que sigue una
distribución N (α 1 , 144) . Análogamente, sea la variable aleatoria Y = ’peso medio de las
v
patatas en la parcela B’, con una distribución N (α2 , 225) . Sean, respectivamente, x e
y , las dos medias muestrales de las dos muestras aleatorias simples de patatas
correspondientes a las dos parcelas.

⎡ σ1 ⎤ ⎡ 144 ⎤
x se distribuye según una N ⎢α 1 , ⎥ , es decir, N ⎢α 1 , ≡ N (α 1 ; 14,4)
⎢⎣ n1 ⎥ ⎣ 100 ⎥⎦

⎡ σ ⎤ ⎡ 225 ⎤
y se distribuye según una N ⎢α 2 , 2 ⎥ , es decir, N ⎢α2 , ≡ N (α 2 ; 25)
⎢⎣ n2 ⎥ ⎣ 81 ⎥⎦

La diferencia de las medias muestrales (x − y ) se distribuye según una normal:

[ ]
(x − y ) ∈ N α 1 − α 2 ; 14, 4 2 + 25 2 a (x − y ) ∈ N α 1 − α 2 ; 28, 85 [ ]
Para hallar la mejor región crítica se aplica el teorema de Neyman-Pearson:
1 ( x −μ) 2

f( x ) =
1
e 2 σ2 [( x − y ) − 0 ] 2
(1 28,85 )

σ 2π 2 . 28, 85 2 1 ⎛⎜ ( x − y ) 2 − [( x − y ) − 80 ] 2 ⎞⎟
L (x, α 1 − α2 = 0) } 2π e −
2 . 28, 85 2 ⎝ ⎠
= =e =
L (x, α 1 − α2 = 80) [( x − y ) − 80 ]2
(1 28,85 )

2 . 28, 85 2
2π e
1
− (160 ( x − y ) − 6400 )
2 . 28, 85 2
=e ≤ k1

Santiago de la Fuente Fernández 177


Contraste de Hipótesis
1

2 . 28, 85 2
(160 ( x − y ) − 6400 )
1
e ≤ k1 a − (160 (x − y ) − 6400) ≤ ln k1
2 . 28,85 2
160 (x − y ) ≥ − 1664,64 ln k1 + 6400 ⇒ (x − y ) ≥ k

Para hallar el valor de k se considera que el nivel de significación es 0,05, se


verifica la hipótesis nula H0 : α 1 − α2 = 0 , y por tanto (x − y ) ∈ N (0 ; 28, 85) , entonces:

[ ]
P (x − y ) ≥ k / H0 : α 1 − α2 = 0 = 0, 05

⎡ (x − y ) k ⎤ ⎡ k ⎤ k
P⎢ ≥ ⎥ = P ⎢z ≥ ⎥ = 0, 05 ⇒ = 1, 645 a k = 47, 46
⎣ 28,85 28,85 ⎦ ⎣ 28,85 ⎦ 28,85

Si la diferencia entre las medias de las dos muestras es superior a 47,46 gramos se
rechaza la hipótesis nula de igualdad de medias poblacionales.

2) Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H1 cierta)


Si se verifica la hipótesis alternativa H1 : α 1 − α2 = 80 , se tiene (x − y ) ∈ N (80 ; 28, 85)
Con lo cual,

⎡ (x − y ) − 80 47, 46 − 80 ⎤
Po = P ⎢ ≥ ⎥ = P [z ≥ − 1,13 ] = 0, 8708
⎣ 28,85 28,85 ⎦

2) La diferencia entre el peso medio de las muestras tomadas en ambas parcelas es:

400 − 324 = 76 gramos

Como la diferencia es mayor que 47,46 gramos, se rechaza la hipótesis nula de que
ambas parcelas producen patatas con igual peso medio.

Santiago de la Fuente Fernández 178


Contraste de Hipótesis
37.- El gasto diario, en miles de euros, en electricidad de una empresa es una variable
aleatoria con distribución N (α ; 1). Se desea contrastar con un nivel de significación del
5%, la hipótesis nula de que el gasto medio diario es de 30 euros frente a la hipótesis
alternativa de que dicho gasto es menor que la citada cifra.
Para ello se toma una muestra aleatoria simple de diez días en los que el gasto en
electricidad en euros fue:

29,50 29,30 30,50 31,50 29,10 29,90 30,10 31 31,50 30

Se pide:

1. ¿Cuál es la hipótesis aceptada?


2. ¿Cuál habría sido la probabilidad de aceptar que el gasto diario medio es de 30
euros, si el gasto medio diario fuese un 2% superior a la cifra supuesta en la
hipótesis nula?

Solución:

1) La variable aleatoria X = ‘gasto diario en facturas de electricidad’ X ∈N (α ; 1).


La hipótesis nula H0 : α = 30 frente a la hipótesis alternativa H1 : α < 30
Para una muestra aleatoria simple de tamaño n, de una población N (α ; 1), la función de
verosimilitud es:

n n
2 1
⎛ 1 − (x1 −α) 2 ⎞ ⎛
1
1 − ( x 2 −α) 2 ⎞
1 ⎛ 1 − (xn −α) 2 ⎞
1 ⎛ 1 ⎞ − 2 ∑ (x i −α)
L ( x1 , x 2 , L , xn , α) = ⎜ e 2 ⎟⎜ e 2 ⎟L⎜ e 2 ⎟ = ⎜ ⎟ e i = 1
⎜ 2π ⎟ ⎜ 2π ⎟ ⎜ 2π ⎟ ⎜ 2π ⎟
⎝ ⎠⎝ ⎠ ⎝ ⎠ ⎝ ⎠

Para obtener la región crítica, aplicando el teorema de Neyman-Pearson:

n
2 n 1
⎛ 1 ⎞ − 2 ∑ ( x i − 3)
⎜ ⎟ e i =1 1
n
1
n
L (x1, x2, L , xn , α = 3) ⎜⎝ 2π ⎟⎠ − ∑ ( x i − 3) 2 + ∑ ( x i − α ) 2
2 2
= n = e i =1 i =1 =
L (x1, x2, L, xn , α < 3) ⎛ ⎞
n 1
− ∑ (x i −α) 2

⎜ 1 ⎟ e 2 i =1
⎜ 2π ⎟
⎝ ⎠
n n n n n
1 ⎛⎜ ⎞ 1 ⎛⎜ ⎞
− ∑ x2 + 9 n − 6 ∑xi − ∑ x2 − n α 2 + 2 α ∑ x i ⎟⎟ − n ( 9 − α 2 ) + ( 2 α − 6) ∑ x i ⎟⎟
2 ⎜⎜ i i ⎟ 2 ⎜⎜ ⎟
=e ⎝ i =1 i =1 i =1 i =1 ⎠
=e ⎝ i =1 ⎠
≤ k1

n
1 ⎛⎜ ⎞
− n ( 9 − α 2 ) + ( 2 α − 6) ∑ x i ⎟⎟
2 ⎜⎜ 1 n
≤ k1 ⇒ − ⎛⎜ n (9 − α 2 ) + (2 α − 6) ∑ xi ⎞⎟ ≤ ln k1

e ⎝ i =1 ⎠
2⎝ i =1 ⎠
1 ⎛ n n
− ⎜ n (9 − α 2 ) + (2 α − 6) ∑ xi ⎞⎟ ≤ ln k1 a (2 α − 6) ∑ xi ≤ − 2 ln k1 − n (9 − α 2 )
2⎝ i =1 ⎠ i =1

Santiago de la Fuente Fernández 179


Contraste de Hipótesis
n
n − 2 ln k1 − n (9 − α 2 ) ∑ xi
∑ xi ≤ dividiendo por n, resulta x = i =1
≤k
i =1 (2 α − 6) n

con lo que la forma de la región crítica es x ≤ k .

[
Siendo el nivel de significación del 5%: P x ≤ k H0 : α = 30 = 0, 05 ]
Si la hipótesis nula es cierta, considerando que la muestra es de tamaño 10, la media
⎛ 1 ⎞
muestral se distribuye según una normal x ∈ N ⎜ 30 , ⎟ , por tanto,
⎝ 10 ⎠

[ ]⎡ x − 30
P x ≤ k H0 : α = 30 = P ⎢ ≤
k − 30 ⎤ ⎡
⎥ = P ⎢z ≤
k − 30 ⎤
⎥ = 0,05
⎣ 1 10 1 10 ⎦ ⎣ 1 10 ⎦

k − 30
observando las tablas de la N (0, 1) se tiene que = − 1, 645 ⇒ K = 29,48
1 10
La región crítica es: x ≤ 29, 48
10
∑ xi
Por otra parte, la media muestral es: x = = 30, 24
i =1
10
Siendo x = 30, 2 4 > 29, 48 se acepta la hipótesis nula, siendo el gasto medio diario en
electricidad de 30 euros, con una fiabilidad del 95%.

2) Si el gasto medio diario fuera un 2% superior a 30 euros, sería de 30,6 euros, es


decir α = 30, 6. En este caso, la media muestral se distribuye según una normal
⎛ 1 ⎞
x ∈ N ⎜ 30, 6 ; ⎟ , por tanto, la probabilidad pedida sería:
⎝ 10 ⎠

[
P Aceptar H0 siendo α = 30, 6 = P ⎢ ] ⎡ x − 30,6 29, 48 − 30,6 ⎤
> ⎥ = P[z > − 3, 54 ] = 0,9998
⎣ 1 10 1 10 ⎦

Santiago de la Fuente Fernández 180


Contraste de Hipótesis
38.- Las especificaciones de un tipo de báscula aseguran que los errores en las pesadas
siguen una distribución normal con esperanza nula y varianza unidad. Se desea
contrastar la afirmación sobre la varianza frente a la hipótesis alternativa de que la
varianza es 4. En este sentido, se realizan cinco pesadas en las que el error cometido
resultó ser

1 0,9 - 0,2 1,4 - 0,7

Para un nivel de significación del 5%, se pide:


1. Obtener la mejor región crítica.
2. Obtener la potencia del contraste.
3. Indicar qué hipótesis resultada aceptada.

Solución:

1) Sea la variable aleatoria X = ‘error cometido en la báscula’ X ∈N (0 ; σ).


Se tiene la hipótesis nula H0 : σ 2 = 1 frente a la hipótesis alternativa H1 : σ 2 = 4
La función de verosimilitud para una muestra aleatoria simple de tamaño 5 es:

5
1 1 5 1
⎛ 1 − x2 ⎞ ⎛ 1 − x2 ⎞ ⎛ 1 ⎞ − 2σ 2 ∑ x i
2

L (x1 , x2 , L , x 5 , σ ) =
2 ⎜ e 2σ 2
1
⎟ L ⎜ e 2σ 2
5
⎟ = ⎜ ⎟ e i =1
⎜ σ 2π ⎟ ⎜ σ 2π ⎟ ⎜ σ 2π ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠

La región crítica óptima se obtiene aplicando el teorema de Neyman-Pearson:

5
2 5 1
⎛ 1 ⎞ − 2 ∑ xi
⎜ ⎟ e i =1 1
5
1
5
3
5
L (x1, x2, L , x 5 , σ 2 = 1) ⎜ 2π ⎟ − ∑ x2 + ∑ x2 − ∑ x2
= ⎝ ⎠ 2 i 8 i 8 i
5
= 2 5 e i =1 i =1 = 2 5 e i =1 ≤ k1
L (x1, x2, L, x 5 , σ = 4) ⎛
2 5 1 2
1 ⎞ − 2 . 4 ∑ xi
⎜ ⎟ e i =1
⎜ 2 2π ⎟
⎝ ⎠

5 5
3 3

8 ∑ x2i −
8 ∑ x2i 3 5 2
25 e i =1 ≤ k1 ⇒ e i =1 ≤ k1 32 a − ∑ xi ≤ ln ( k1 32)
8 i =1

5 ln ( k1 32) 5 ln ( k1 32) 5
∑ xi ≤ a ∑ x2i ≥ a ∑ x2i ≥ k
2

i =1 −3 8 i =1 −3 8 i =1

5
La forma de la mejor región crítica es ∑ x2i ≥ k
i =1

El valor de k se obtiene apoyándonos en que el nivel de significación es del 5%:

Santiago de la Fuente Fernández 181


Contraste de Hipótesis
5
P ⎡ ∑ x2i ≥ k H0 : σ 2 = 1⎤ = 0, 05
⎢⎣ i=1 ⎥⎦

Si la hipótesis nula es cierta, la variable aleatoria se distribuye según una normal


5
N (0 ; 1) , siendo ∑ x2i una variable aleatoria suma de cinco variables aleatorias
i =1
5
independientes y con distribución N (0 ; 1) . En consecuencia, ∑ x2i se distribuye como
i =1

una χ (ji-cuadrado con cinco grados de libertad).


2
5
5
En este sentido, observando en las tablas: P ⎡ ∑ x2i ≥ k ⎤ = 0, 05 ⇒ K = 11, 07
⎢⎣ i=1 ⎥⎦

5
La región crítica es: ∑ x2i ≥ 11,07
i =1

En otras palabras, se aceptará la hipótesis nula cuando la suma de los cuadrados de las
observaciones muestrales sea menor que 11,07

2) La potencia del contraste es la probabilidad de rechazar la hipótesis nula cuando es


cierta la hipótesis alternativa, esto es:

5
Potencia = P ⎡ ∑ x2i ≥ 11, 07 H1 : σ 2 = 4⎤
⎢⎣ i=1 ⎥⎦

Observemos que si la hipótesis alternativa es cierta, la variable aleatoria X se


distribuye según una normal N (0 ; 2) , con lo que dividiendo cada xi por la desviación
5
típica σ = 2 , se tiene que ∑ (xi 2) 2 se distribuye según una χ25 , en consecuencia:
i =1

5 5
Potencia = P ⎡ ∑ x2i ≥ 11, 07 H1 : σ 2 = 4⎤ = P ⎡ ∑ (xi 2) 2 ≥ 2, 7675⎤ ≈ 0, 75
⎢⎣ i=1 ⎦⎥ ⎣⎢ i=1 ⎥⎦

5
3) El contraste se realiza hallando el ∑ x2i de la muestra aleatoria simple, siendo:
i =1
5
∑ x = 1 + 0, 9 + ( − 0, 2) + 1,4 + ( − 0, 7) = 4, 3 < 11,07
2 2 22 2 2
i
i =1

por lo que se acepta la hipótesis nula.

Santiago de la Fuente Fernández 182


Contraste de Hipótesis
39.- El precio de los productos vendidos por una empresa es una variable aleatoria con
función de densidad f(x) = θ x θ −1 , donde 0 < x < 1 , θ > 0 , que depende del parámetro
desconocido θ . Se quiere contrastar sobre el valor de dicho parámetro la hipótesis nula
H0 : θ = 1 frente a la alternativa H1 : θ = 2 . Para ello, se toma una muestra aleatoria
simple de tamaño dos.
Determinar el nivel de significación y la potencia del contraste, si se toma como región
crítica x1 x2 ≤ 0, 6

Solución:
El nivel de significación α es la probabilidad de rechazar la
hipótesis nula siendo cierta: α = P (Re chazar H 0 H 0 cierta) .

En la región crítica x1 x2 ≤ 0, 6 , para θ = 1 se tiene: f(x) = 1 ,


con lo cual:

x 1 = 0,6 x 2 =1 x 1 =1 x 2 = 0, 6 x 1
[
P x 1 x 2 ≤ 0, 6 H 0 : θ = 1 = ]
∫ ∫ x 1 =0
1 dx 1 dx 2 +
x 2 =0
∫ ∫ x 1 = 0,6
1 dx 1
x 2 =0
dx 2 =

∫ ∫ ∫ ∫
0,6 1 0,6 1
0, 6 x 1
= (x 2 ) 10 dx 1 + (x 2 ) 0 dx 1 = 1 dx 1 + (0, 6 x 1 ) dx 1 =
0 0, 6 0 0,6

= (x 1 ) 00,6 + ( ln x 1) 10,6 = 0, 6 + 0, 6 (ln 1 − ln 0, 6) = 0, 6 + 0, 6 (0 + 0,51) = 0, 906

La probabilidad de rechazar la hipótesis nula siendo cierta es alta, lo que indica que el
contraste es malo.

ƒ 1 − β = Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H1 cierta) .


En la región crítica x1 x2 ≤ 0, 6 , para θ = 2 se tiene f(x) = 2 x , la potencia será:

x 1 = 0,6 x 2 =1 x 1 =1 x 2 = 0, 6 x 1
[
Pot = P x 1 x 2 ≤ 0, 6 H 0 : θ = 2 = ]
∫ ∫ x 1 =0
2 x 1 2 x 2 dx 1 dx 2 +
x 2 =0
∫ ∫
x 1 = 0,6
2 x 1 2 x 2 dx 1 dx 2 =
x2 =0
0, 6 1 0, 6 1

∫ ∫ ∫ ∫
0, 6 / x 1
= 4 x1 ( x 2
2 2) dx1 +
1
0 4 x1 ( x 2
2 2)0 dx1 = 2 x1 dx1 + 2 (0, 36 / x1 ) dx1 =
0 0, 6 0 0, 6

= (x12 )00,6 + 0, 72 ( ln x1 )01 , 6 = 0, 36 + 0, 72 (ln 1 − ln 0, 6) = 0, 36 + 0, 72 (0 + 0,51) = 0, 7272

La potencia del contraste no resulta excesivamente alta, el contraste no es bueno.

Santiago de la Fuente Fernández 183


Contraste de Hipótesis
40.- El volumen diario de ventas de una empresa, en cien mil euros, es una variable
aleatoria X sobre cuya función de densidad se establece la hipótesis nula
H0 : f (x) = x 2 , 0 < x < 2 , frente a la hipótesis alternativa H1 : f (x) = 1 2 , 0 < x < 2.
Para realizar el contraste se toma una muestra aleatoria simple de dos días en los que
los volúmenes de venta fueron de 50.000 euros y 100.000 euros. Con un nivel de
significación del 5 por ciento, se pide:
1. Hallar la mejor región crítica.
2. Calcular la potencia del contraste.
3. Qué hipótesis se acepta.

Solución:

1) Para una muestra aleatoria simple de tamaño dos, la


mejor región crítica aplicando el teorema de Neyman-
Pearson, el cociente de las funciones de verosimilitud es:

L (x1, x2, f (x) = x 2) x1 . x 2


= = x1 . x 2 ≤ k
L (x1, x2, f (x) = 1 2) 1 2 .1 2

Si la hipótesis nula es cierta f(x) = x 2) , con un nivel de


significación del 5%, se tiene:

[ ]
x =k 2 x2 =2 x =2 x2 = k x 1
x1 x 2 x1 x 2
∫ ∫ ∫ ∫
1 1
0, 05 = P x1 x2 ≤ k H0 : f(x) = x 2 = dx1 dx2 + dx1 dx2 =
x =0 x2 = 0
4 x =k 2 x2 = 0
4
1 1
x =k 2 x =2 k2 2
x1 x1 x1
∫ ∫ ∫ ∫
1 1
k x1 k2
= (x22 / 2)20 dx1 + (x22 / 2)0 dx1 = dx1 + dx =
x =0
4 x =k 2
4 0
2 k2
8 x1 1
1 1

1 2 k 2 k2 k2 k2
[ln 2 − ln (k 2) ] = k ⎡⎢ 1 + 2 ln 2 − ln k ⎤⎥ = k [1, 8633 − ln k ] ⇒
2 2
= (x1 )0 + (ln x1 ) k2 2 = +
4 8 16 8 8 ⎣2 ⎦ 8
k 2
⇒ [1, 8633 − ln k ] = 0, 05 a k 2 [1, 8633 − ln k ] = 0, 40 de donde k = 0, 3733
8
La regla de decisión es x1 . x2 ≤ 0, 3733 .
Es decir, se rechaza la hipótesis nula si durante los días el producto de los dos
volúmenes de ventas de la muestra es inferior a 37.330 euros.

2) 1 − β = Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H1 cierta) .


En la región crítica x1 x2 ≤ 0, 3733 , con la función de densidad f (x) = 1 2 , la potencia:

[ ]
x = 0,3733 / 2 2 x =2 0, 3733 x 1

∫ ∫ ∫ ∫
1
1 1
1
P = P x1 x2 ≤ 0, 3733 H1 : f(x) = 1 2 = dx1 dx2 + dx1 dx2 =
x =0 0
4 x = 0,3733 / 2 0
4
1 1

Santiago de la Fuente Fernández 184


Contraste de Hipótesis
0, 3733 / 2 2 0, 3733 / 2 2

∫ ∫ ∫ ∫
1 1 0, 3733 / x 1 1 0, 3733 1
= (x2 )02 dx1 + ( x 2 )0 dx1 = dx1 + dx1 =
0
4 0, 3733 / 2
4 2 0
4 x
0, 3733 / 2 1

1 0, 3733 0, 3733 0, 3733


= (x1 )00, 3733 / 2 + ( ln x1 )02,3733 / 2 = + [ln 2 − ln (0,3733 / 2)] = 0, 3146
2 4 4 4

3) En la muestra aleatoria simple, los volúmenes de ventas fueron de 50.000 y 100.000


euros, en consecuencia x1 = 0, 5 y x2 = 1 , por tanto, x1 . x2 = 0, 5
Como la región crítica es x1 x2 ≤ 0, 3733 , se acepta la hipótesis nula.

Santiago de la Fuente Fernández 185


Contraste de Hipótesis
41.- Se sabe que las peras siguen una distribución N (θ , 1) . En una muestra de peras,
con peso medio de 300 gramos, se realizó un contraste con un nivel de significación del
5% y una potencia de 0,6443, en donde la hipótesis nula era de H0 : θ = 0, 4 kg frente a
la hipótesis alternativa de H1 : θ = 0, 3 kg. Se desea saber:
1. Cuál es el tamaño de la muestra.
2. Hallar la hipótesis aceptada.

Solución:

1) En una distribución N (θ , 1) , en una muestra de tamaño n, la función de verosimilitud


vendrá dada por la expresión:

1 n
1 −
1
( x 1 − θ) 2 1 −
1
( x 2 − θ) 2 1 −
1
(x n − θ) 2 ⎡ 1 ⎤
n −
2
∑ ( x i − θ) 2
L (x 1, x 2 , L , x n , θ) = e 2 e 2 L e 2 = ⎢ ⎥ e
i =1
2π 2π 2π ⎣ 2π ⎦

Con las hipótesis del contraste, H0 : θ = 0, 4 y H1 : θ = 0, 3 . La región crítica óptima se


obtiene aplicando el teorema de Neyman-Pearson:

n
1
n − ∑ ( x i − 0, 4 ) 2
⎡ 1 ⎤ 2 n n
⎢ ⎥ e i =1 1 ⎡ ⎤
− ⎢ ∑ ( x i − 0, 4 ) 2 − ∑ ( x i − 0, 3) 2 ⎥
L (x1, x2, L, xn , θ = 0, 4) 2π
= ⎣ ⎦ 2 ⎢ ⎥
n = e ⎣i=1 i =1 ⎦
=
L (x1, x2, L, xn , θ = 0, 3) n 1
− ∑ ( x i − 0, 3) 2
⎡ 1 ⎤ 2
⎢ 2π ⎥ e i =1

⎣ ⎦
n n n n n
1 ⎡⎢ ⎤ 1 ⎡⎢ ⎤
− ∑ x 2 + 0, 16 n − 0, 8 ∑ xi −∑ x 2 − 0, 09 n + 0, 6 ∑
xi ⎥ − 0, 7 n − 0, 2 ∑ xi ⎥
2 ⎢ i i ⎥ 2 ⎢ ⎥
= e ⎣i =1 i =1 i =1 i =1 ⎦
= e ⎣ i =1 ⎦
≤ k1

tomando logaritmos neperianos, resulta,

n
1 ⎡⎢ ⎤
− 0, 7 n − 0, 2 ∑ xi ⎥
1 n n
e
2 ⎢
⎣ i =1 ⎦

≤ k1 a − ⎡0, 7 n − 0, 2 ∑ xi ⎤ ≤ ln k1 ⇒ 0, 7 n − 0, 2 ∑ xi ≤ − 2 ln k1
2 ⎢⎣ i =1 ⎥⎦ i =1
n
n n 0, 7 n + 2 ln k1 ∑ xi 0, 7 n + 2 ln k1
− 0, 2 ∑ xi ≤ − 0, 7 n − 2 ln k1 ⇒ ∑ xi ≤ ⇒ i =1

i =1 i =1 0, 2 n 0, 2 n

La forma de la mejor región crítica es: x ≤ k

Ahora bien, la hipótesis nula H0 : θ = 0, 4 es cierta si x ∈ N ( 0, 4 ; 1 n ) . Con un nivel de


significación del 5%, se tiene:

Santiago de la Fuente Fernández 186


Contraste de Hipótesis

[ ]
⎡ x − 0,4 k − 0,4 ⎤
P x ≤ k H0 : θ = 0, 4 = P ⎢ ≤

⎥ = P ⎢z ≤
k − 0,4 ⎤
⎥ = 0,05 a
k − 0,4
= − 1, 645
⎣ 1 n 1 n ⎦ ⎣ 1 n ⎦ 1 n
− 1, 645
k − 0,4 =
n

De otra parte, sabemos que la potencia del contraste es 0,6443.

1 − β = Potencia = P (Rechazar H 0 H 0 falsa) ≡ P (Rechazar H 0 H1 cierta) .

Si se verifica la hipótesis alternativa H1 : θ = 0, 3 se tiene que x ∈ N ( 0, 3 ; 1 n)

[ ] ⎡ x − 0,3 k − 0,3 ⎤
P x ≤ k H1 : θ = 0, 3 = P ⎢ ≤

⎥ = P ⎢z ≤
k − 0,3 ⎤
⎥ = 0,6443 a
k − 0,3
= 0, 37
⎣ 1 n 1 n ⎦ ⎣ 1 n ⎦ 1 n
0, 37
k − 0,3 =
n

⎧ − 1, 645
⎪k − 0,4 = n = 406
⎪ n 2,015
Resolviendo el sistema: ⎨ 0,1 = ⇒
⎪ 0, 37 n
k = 0,3184
⎪k − 0,3 =
⎩ n

El tamaño de la muestra es de 406 peras.

2) La mejor región crítica será x ≤ k = 0,3184 , rechazándose la hipótesis nula cuando


el peso medio de la muestra de peras sea inferior a 318,4 gramos.
Como en la muestra se obtuvo un peso medio de 300 gramos ( 300 ≤ 318, 4 ), se rechaza
la hipótesis nula de que el peso medio de las peras es de 0,4 kg.

Santiago de la Fuente Fernández 187

También podría gustarte