Apunte7 09

Probabilidad y Estadística Pruebas de hipótesis 11
PRUEBAS DE HIPÓTESIS CON MUESTRAS GRANDES
INTRODUCCIÓN.
Recordemos que el objetivo de la estadística inferencial es conocer características de la población a

partir de la información contenida en una muestra. En particular, se hacen inferencias acerca de los
parámetros poblacionales desconocidos, basadas en la información contenida en una muestra.
En Estadística Inferencial hay dos formas de realizar inferencias acerca de un parámetro poblacional:
podemos estimar su valor que es lo que vimos la clase pasada, o bien, probar (o comprobar) una hipótesis
acerca de su valor, que es lo que vamos ver esta clase.
En la clase pasada vimos dos tipos de estimaciones:
Puntual: En este caso para estimar el valor de un parámetro poblacional , usamos un estimador puntual

insesgado 



y podemos calcular la probabilidad de que P(|   | < c) que es una medida del error que cometemos al usar

 para estimar .
Por intervalo: En este caso para estimar el valor de un parámetro poblacional , usamos un estimador puntual

insesgado, como  para determinar un intervalo
 
[  c   ,  + c   ]

donde   es la desviación estándar de la distribución muestral de  .
En particular, si z/2 es tal que P(z/2 < z ) = /2,
o equivalentemente, P(0 < z < z/2) = (1  
entonces
 
[  z/2   ,  + z/2   ] es un intervalo de confianza de 1.
es decir,
 
P([  z/2   ,  + z/2   ] contenga a ) =1.

Para calcular las probabilidades anteriores, se usa la distribución muestral de  . Se supuso que se
trabajaba con muestras grandes para que esta distribución fuera aproximadamente normal.

Hoy vamos a ver como se puede realizar una inferencia acerca de un parámetro poblacional
probando (o comprobando) una hipótesis acerca de su valor. Veamos algunos ejemplos en donde se puede
usar una prueba de hipótesis:
 Un investigador en medicina propone la hipótesis de que un medicamento A es más efectivo que otro B
para curar una cierta enfermedad.
 Un técnico de control de calidad propone la hipótesis de que un nuevo método de montaje produce sólo
5% de artículos defectuosos.
 Un educador afirma que dos métodos para enseñar tiene la misma eficacia.
 Un candidato político afirma que la mayoría de los votantes están de su parte.
En todos estos casos la hipótesis o afirmación se somete a una prueba estadística para compararla
con los resultados de los datos muestrales. Vamos a ver:
 Qué función de las mediciones muestrales debe utilizarse para realizar la prueba.
 Cómo se decide si una muestra no concuerda con la hipótesis
 Cuándo debe rechazarse la hipótesis, aceptarse la hipótesis o no decidir nada acerca de la hipótesis.
 Cuál es la probabilidad de tomar una decisión equivocada.
______________________________________________________________________
ELEMENTOS DE UNA PRUEBA DE HIPÓTESIS
El objetivo de toda prueba de hipótesis es probar una hipótesis acerca del valor de un parámetro
poblacional. Entonces el primer elemento de la prueba de hipótesis es la afirmación o hipótesis sobre el valor
de uno o más parámetros poblacionales y recibe el nombre de hipótesis alternativa.
Hipótesis alternativa, Ha: afirmación o hipótesis sobre el valor de uno o más parámetros poblacionales. Se
denota con Ha.
El segundo elemento es la hipótesis nula que es una negación de la hipótesis alternativa.
Hipótesis nula, H0: negación de la hipótesis alternativa.
El soporte para la validez de la hipótesis alternativa H a se obtiene mostrando, usando los valores
muestrales como evidencia, que la hipótesis nula H 0 es falsa. Así el soporte de una hipótesis se obtiene
mostrando la falta de soporte para la otra.
Ejemplo. a) Se cree que no más del 50% de los consumidores prefiere un producto de marca A.
Se propone como hipótesis alternativa que la proporción p de consumidores que prefieren la marca A es
mayor que 50% = 0.5
Ha: p > 0.5
Se propone además
H0: p = 0.5
La decisión de rechazar H 0 y de aceptar Ha, se basa en la información contenida en una muestra de n

mediciones, tomadas de una población.
b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A.

En este caso la muestra se extrae de una población binomial con parámetro p.
En función de los datos de una muestra se obtiene un número llamando la estadística de prueba (que puede
ser un estimador).
c) Por ejemplo, se obtiene x la cantidad de consumidores que prefieren A de los 100 de la muestra.
El conjunto de todos los valores que puede tomar la estadística de prueba se divide en dos
subconjuntos o regiones:
región de rechazo región de aceptación
Si la estadística cae en la región de rechazo, se rechaza H 0 a favor de Ha.
Si la estadística cae en la región de aceptación, se acepta H 0.
La región de rechazo debe contener valores que apoyen H a.
d) Como 0  x  100, es decir, x  [0, 100], Ha: p > 0.5 y H0: p = 0.5 se podría tener
región de rechazo: [60, 100] región de aceptación: [0, 60)
(observar que la región de rechazo contiene valores  60 que apoyan Ha).
Supongamos que x = 99. Como x está en la región de rechazo, rechazamos H 0 a favor de Ha y

concluimos que la proporción p de consumidores que prefieren la marca A es mayor a 0.5.
En general, la región de rechazo incluye valores de x que apoyan H a . En ese ejemplo, Ha: p > 0.5,
por lo tanto la región de rechazo incluye valores de x grandes, que son los que hacen poco probable que p 
0.5. La región de aceptación y que por lo tanto apoya H 0 incluye entonces valores de x chicos. Más allá
de estas consideraciones, la determinación de las regiones de rechazo y aceptación depende de la
probabilidad de cometer errores con la que se quiera trabajar. Antes de ver esto, resumamos cuales son los
elementos de una prueba de hipótesis.
Resumiendo
Elementos de una prueba estadística.
1. Hipótesis alternativa.
2. Hipótesis nula.
3. Estadística de prueba.
4. Región de rechazo.
Analicemos los errores que se pueden cometer al aceptar o rechazar H 0, cuales son las probabilidades
de cometer cada uno de ellos y como se usa esto para determinar las regiones de rechazo y aceptación.
La hipótesis nula H0 puede ser verdadera o falsa, cosa que no conocemos.
Si H0 es verdadera y la rechazamos se comete un error llamado de tipo I.

Si H0 es falsa y la aceptamos se comete un error llamado de tipo II.
Tabla de decisiones.
Hipótesis nula
Decisión Verdadera Falsa
Rechazar H0 Error tipo I Decisión correcta
Aceptar H0 Decisión correcta Error tipo II
La validez o bondad de una prueba de hipótesis se mide mediante las probabilidades de cometer cada
uno de estos errores
 probabilidad de cometer un error de tipo I

 probabilidad de cometer un error de tipo II
 corresponde a la región de rechazo.

 corresponde a la región de aceptación.
Volvamos al ejemplo que estábamos considerando.
Ejemplo. Sea p la proporción de consumidores que prefieren la marca A.

a) Ha: p > 0.5
H0: p = 0.5
b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A.
En este caso la muestra se extrae de una población binomial con parámetro p.
c) Estadística de prueba: x la cantidad de consumidores que prefieren A de los 100 de la
muestra.
Error tipo I:
Supongamos que H0 es verdadera, es decir, se cumple que p = 0.5. Entonces se puede cometer un
error tipo I, cuando se rechaza H0. Veamos como se calcula .
Como H0 es verdadera, x tiene una distribución binomial con parámetro p = 0.5. Como el tamaño n =
100 de la muestra es grande se puede suponer normal con
x = n p = 100 (0.5) = 50
x = npq = 100(0.5)(1  0.5) = 5
Si se define como
región de rechazo: x   + 2 = 60,
la probabilidad de cometer un error tipo I, es decir de rechazar H 0 siendo esta verdadera es
 = P( x  60 ) = 0.025.
Es decir x caerá en la región de rechazo 2.5% de las veces, cometiéndose un error al rechazar H 0
siendo verdadera. Vemos además que el valor de  queda fijo al fijar la región de rechazo.
Error tipo II:

Supongamos que H0 es falsa, es decir, se cumple que p  0.5. Entonces se puede cometer un error
tipo II.
Como H0 es falsa, x tiene una distribución binomial con parámetro p desconocido. Como el tamaño n
= 100 de la muestra es grande se puede suponer normal con
 = n p = 100 p
 = npq = 100 p (1  p )
Aunque sabemos que la distribución de x es normal, como desconocemos p no es imposible calcular la
probabilidad de x que caiga en un determinado intervalo, y por ende .
Sin embargo, podemos ver como se comporta  de acuerdo a si p se encuentra cerca o lejos del valor
estipulado en H0, que es 0.5.
Si p = 0.9, en la muestra de 100 consumidores casi la totalidad estará a favor de la marca A, con lo
cual x estaría bastante cerca de 100. De este modo, tendríamos una evidencia muy fuerte para rechazar H 0: p
= 0.5, y por ende de no equivocarnos. Es decir,  en este caso es chico.
Si p = 0.55, en la muestra de 100 consumidores casi la mitad estaría a favor de la marca A. De este
modo, tendríamos evidencia como para aceptar H 0: p = 0.5, y por ende de equivocarnos. Es decir,  en este
caso es grande.
En definitiva, mientras mayor sea la diferencia entre p real y el que propone H 0, menor es
probabilidad de cometer un error tipo II, es decir, menor es .
Relación entre los dos tipos de errores.

 corresponde a la región de rechazo.
 corresponde a la región de aceptación.
Mientras más grande (chica) es la región de rechazo más chica (grande) es la región de aceptación.
Si  crece (disminuye) entonces  disminuye (crece).
En general se tiene,
Propiedades de  y 
1. El valor de  se fija al escoger la región de rechazo.
2. El valor de  dependerá del valor que se use para definir H0.
Mientras más grande (chica) sea la diferencia entre el valor que se use para definir H 0 y el valor real del
parámetro, menor (mayor) será .
3. Si  crece (disminuye) entonces  disminuye (crece).
4. Si se aumenta el tamaño de la muestra  y  disminuyen.
Al idear una prueba de hipótesis se consideran los valores  y  que se quieren tolerar. Los pasos que
se suelen seguir son:
1. Se especifica .
2. En función de , se determina la región de rechazo.
3. Se selecciona un tamaño n de muestra para lograr un  adecuado.
El último paso es el que en general no se puede llevar a cabo porque es necesario conocer los
distintos valores de  para diferentes valores del parámetro en prueba. En la práctica, si la estadística de
prueba cae en la región de rechazo, podemos cometer un error tipo I y sabemos cual es la probabilidad  de
cometerlo. Si la estadística de prueba cae en la región de aceptación, con lo cual se está en riesgo de cometer
un error de tipo II, no se toma decisión alguna y se recolectan más datos.
___________________________________________________________________________
PRUEBA ESTADÍSTICA PARA MUESTRAS GRANDES
Ahora enunciaremos lo anterior, que se vio para un ejemplo concreto (parámetro p de una población
binomial), de modo general.
Recordemos que una estadística de prueba es un número que se obtiene en función de los datos de
una muestra. Se puede usar como estadística de prueba un estimador puntual insesgado que tenga una
distribución de muestreo aproximadamente normal para tamaños grandes de muestra como los que vimos la
clase pasada:
 La media muestral x es un estimador insesgado de la media poblacional .
 La proporción muestral p̂ es un estimador insesgado del parámetro p.
 x 1  x 2 es un estimador insesgado del parámetro 1  2.
 p̂ 1  p̂ 2 es un estimador insesgado del parámetro p1  p2.
 
En general, sea  es un estimador insesgado de un parámetro  . Se supone que  es un estimador
insesgado que tiene una distribución de muestreo aproximadamente normal.
 Supongamos que se quiere probar que el parámetro poblacional  es mayor que un cierto valor 0, es
decir
Ha:  > 0
Se propone entonces como hipótesis nula
H 0:  =  0

Estadístico de prueba: 

La región de rechazo debe contener valores de  que apoyen Ha,  > 0. Así se elige un C > 0, y se define

región de rechazo: {  > 0 + C}.
0 + C valor crítico de la estadística de prueba (separa la región de rechazo de la región de prueba).
 Si se quiere probar que el parámetro poblacional  es menor que un cierto valor 0,
Ha:  < 0
H0:  = 0


La región de rechazo debe contener valores de  que apoyen Ha,  < 0.

región de rechazo: {  < 0  C}
En ambos casos se dice que es una prueba estadística de una extremidad o cola pues la región de
rechazo se localiza en un sólo extremo de la distribución muestral de la estadística de prueba.
 Si se quiere probar que el parámetro poblacional  es distinto de cierto valor 0, se tendría
Ha:   0
H0:  = 0

 
región de rechazo: {  < 0  C} o {  > 0 + C}
y se dice que es una prueba estadística de dos extremidades o colas pues la región de rechazo se localiza en
ambos extremos de la distribución muestral de la estadística de prueba.
Probabilidad  de un error tipo I.


Es la probabilidad de que  caiga en la región de rechazo siendo H 0 verdadera. Luego es el área,

correspondiente a la región de rechazo, bajo la curva de la distribución muestral de  , que es normal con
media  = 0 y desviación estándar  ˆ . En el caso de una prueba de dos colas, a cada mitad de la región le
corresponde una probabilidad  / 2.

Para pruebas de una cola: Ha:  > 0, P({  > 0 + C}) =  (ver Figura 7.3, p. 243)

Ha:  < 0, P({  < 0  C}) = 
Para pruebas de dos colas: Ha:   0
   
P({  < 0  C}  {  > 0 + C}) = P({  < 0  C}) + P({  > 0 + C}) =  
 
P({  < 0  C}) = P({  > 0 + C}) = /2 (ver Figura 7.4, p. 243)
Probabilidad  de un error tipo II.


Es la probabilidad de que  caiga en la región de aceptación siendo H0 falsa.
Supongamos que H0 es falsa y que en realidad  = a siendo a desconocido. Luego la distribución

muestral de  , es normal con media a y desviación estándar  ˆ .
Con esta distribución de probabilidad se tiene (ver Figura 7.5, p. 244)

Para pruebas de una cola: Ha:  > 0, P({  < 0 + C}) = 

Ha:  < 0, P({  > 0  C}) = 

Para pruebas de dos colas: Ha:   0, P({0  C <  < 0 + C}) = 
(ya no hay simetría respecto a 0, sino respecto a a).

Si se utiliza como estadístico de prueba la variable
ˆ   0
z=
 ˆ

que es la desviación de una variable aleatoria  , respecto a 0, expresada en unidades de  ˆ .
si
 = P(error tipo I),
se pueden reescribir las pruebas anteriores como
Prueba estadística para muestras grandes

1. Hipótesis nula. H0:  = 0.
Prueba de una extremidad (o cola) Ha:  > 0 ( < 0)
Prueba de dos extremidades (o colas) Ha:  0.
ˆ   0
3. Estadística de prueba. z =
 ˆ
Prueba de una extremidad (o cola):z > z (z < z)
z es tal que P(z > z) = P(z < z) = .
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
z/2 es tal que P(z > z/2) = P(z < z/2) = /2.
(ver figuras del recuadro p. 245)
Suposición: Se seleccionó una muestra aleatoria de tamaño grande n ( 30).
En particular se tiene
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
Prueba estadística para  en el caso de muestras grandes

1. Hipótesis nula. H0:  = 0.
Prueba de una extremidad (o cola) Ha: > 0 ( < 0)
Prueba de dos extremidades (o cola) Ha:  0.
x  0 x  0
3. Estadística de prueba. z = =
x / n
Si no se conoce  se sustituye por s.
Suposición: Se seleccionó una muestra aleatoria de tamaño n  30.
Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una
media x = 871 toneladas y una desviación estándar s = 21 toneladas.
(a) Probar la hipótesis de que el promedio de la producción diaria es  = 880 toneladas por día contra la
alternativa de que  es mayor o menor a 880 toneladas por día.
Hipótesis nula. H0:  = 880.

Hipótesis alternativa.
Prueba de dos extremidades (o cola) Ha:  880.
x  0 x  880 x  880 x  880 x  880
Estadística de prueba. z = =  = 
 / n  / 50 s / 50 21 / 50 2.97
Región de rechazo.
Si se quiere  = 0.05, entonces z/ = 1.96. Luego

Región de rechazo. z > 1.96 o z < 1.96(ver Figura 7.6, p. 246)
Como x = 871, entonces z = 3.03 que cae en la región de rechazo. Así rechazamos que el
promedio de la producción diaria es  = 880 toneladas por día y la probabilidad de equivocarnos es de 5%.
Si usáramos intervalos de confianza tendríamos que el intervalo

x  z/ / n  871  5.82
tiene un coeficiente de confianza 1   = 0.95 = 95%. Hay un 95% de probabilidad de que este intervalo
contenga a . Entonces rechazaríamos  = 880 pues no cae en este intervalo.
Como x = 871 < 880, se sospecharía que en realidad  < 880.
(b) ¿Cuál es la probabilidad  de aceptar H0 si el valor real de  fuera 870 toneladas?.

Región de aceptación.
x  880 21 21
z  1.96  1.96 ( x  880)  1.96 x  1.96 + 880
21 / 50 50 50
x de 874.18 a 885.82
 es el área, correspondiente a la región de aceptación, bajo la curva normal que tiene

21
media  = 870 desviación estándar  x = = 2.97
50
 = 0.0793 (ver Figura 7.7, p. 247)
Así si  fuera en realidad 870 toneladas, la probabilidad  de aceptar H0:  = 880 es 7.9%.
________________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS MEDIAS POBLACIONALES
Prueba estadística para  1   2 en el caso de muestras grandes

1. Hipótesis nula. H0: 1  2 = D0.
Prueba de una extremidad (o cola) Ha:1  2 > D0 (1  2 < D0)
Prueba de dos extremidades (o cola) Ha:1  2  D0.
x 1  x 2  D0
x 1  x 2  D0
3. Estadística de prueba. z = =  12  22
 x1  x 2 
n1 n2
Si no se conocen 1 y 2 se sustituyen por s1 y s2.
Suposición: Los dos muestreos son aleatorios e independientes de tamaños n 1  30 y n2  30.
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL
Prueba estadística para p en el caso de muestras grandes

1. Hipótesis nula. H0: p = p0.
Prueba de una extremidad (o cola) Ha: p > p0 (p < p0)
Prueba de dos extremidades (o cola) Ha: p  p0.
pˆ  p 0
pˆ  p 0
3. Estadística de prueba. z = = p0 q0
 pˆ
n
Suposición: El muestreo aleatorio satisface las características de un experimento binomial y el tamaño de la
muestra n  30.
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES POBLACIONALES
Prueba estadística para p1  p2 en el caso de muestras grandes

1. Hipótesis nula. H0: p1  p2 = D0.
Prueba de una extremidad (o cola) Ha: p1  p2 > D0 (p1  p2 < D0)
Prueba de dos extremidades (o cola) Ha: p1  p2  D0.
pˆ 1  pˆ 2  D0
pˆ 1  pˆ 2  D0
3. Estadística de prueba. z = = p1 q1 p 2 q 2
 pˆ1  pˆ 2 
n1 n2
Como p1 y p2 se desconoce,
pˆ 1  pˆ 2
x1  x 2
Si D0 = 0, z = 1 1  , donde p̂ = .
pˆ qˆ    n1  n 2
 n1 n 2 
pˆ 1  pˆ 2  D0
Si D0  0, z = pˆ 1 qˆ1 pˆ 2 qˆ 2

n1 n2
Suposición: Los dos muestreos son aleatorios e independientes, satisfacen las características de experimentos
binomiales y los tamaños de las muestras son n1  30 y n2  30.
___________________________________________________________________________
VALORES p
En lo que sigue p no se refiere al parámetro de una población binomial.
La probabilidad de un error tipo I, , suele denominarse nivel de significación asociada a una prueba
estadística.
El valor p, es el mínimo nivel de significación para el cual los datos observados indican que se tendría que
rechazar la hipótesis.
El mínimo nivel de significación p se determina en función de la mínima región de rechazo que se

puede considerar teniendo en cuenta que se ha observado un determinado valor para la estadística de prueba.
La idea es que un valor observado de la estadística de prueba distinto al que afirma H 0, apoya el rechazo de
H0. Por lo tanto, la región de rechazo debería contener mínimamente este valor observado de la estadística de
prueba.
Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una
media x = 871 toneladas y una desviación estándar s = 21 toneladas.
Hipótesis nula. H0:  = 880.
Hipótesis alternativa. Prueba de dos extremidades (o cola) Ha:  880.
x  0 x  880 x  880 x  880
Estadística de prueba. z = =  =
 / n  / 50 s / 50 21 / 50
Se tiene el valor x = 871, entonces z = 3.03 es un valor observado de z.
Región de rechazo. Prueba de dos extremidades (o cola): z > z/2 o z < z/.
(Antes se usó  = 0.05, entonces z/ = 1.96. Luego Región de rechazo. z > 1.96 o z < 1.96)
Veamos como se determina el valor p de esta prueba.

z = 3.03 es un valor observado de z. La región de rechazo de H 0, a favor de Ha, debería incluir
mínimamente este valor, por lo tanto la mínima región de rechazo posible sería
z > 3.03 o z < 3.03
p es la probabilidad de cometer un error tipo I con esta región de rechazo
p = P(z  3.03) + P(z  3.03) = 0.0024.
Por lo tanto, al utilizar esta prueba estadística se elegirán valores de   0.0024.

Apunte7 09

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Apunte7 09

Cargado por

Copyright:

Formatos disponibles

Probabilidad y Estadística Pruebas de hipótesis 11

PRUEBAS DE HIPÓTESIS CON MUESTRAS GRANDES

Recordemos que el objetivo de la estadística inferencial es conocer características de la población a

El segundo elemento es la hipótesis nula que es una negación de la hipótesis alternativa.

Hipótesis nula, H0: negación de la hipótesis alternativa.

La decisión de rechazar H 0 y de aceptar Ha, se basa en la información contenida en una muestra de n

b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A.

La región de rechazo debe contener valores que apoyen H a.

Supongamos que x = 99. Como x está en la región de rechazo, rechazamos H 0 a favor de Ha y

Si H0 es verdadera y la rechazamos se comete un error llamado de tipo I.

 probabilidad de cometer un error de tipo I

 corresponde a la región de rechazo.

Volvamos al ejemplo que estábamos considerando.

Ejemplo. Sea p la proporción de consumidores que prefieren la marca A.

Error tipo II:

Relación entre los dos tipos de errores.

Probabilidad  de un error tipo I.

Probabilidad  de un error tipo II.

se pueden reescribir las pruebas anteriores como

Prueba estadística para muestras grandes

Prueba estadística para  en el caso de muestras grandes

Hipótesis nula. H0:  = 880.

Si se quiere  = 0.05, entonces z/ = 1.96. Luego

Si usáramos intervalos de confianza tendríamos que el intervalo

Como x = 871 < 880, se sospecharía que en realidad  < 880.

(b) ¿Cuál es la probabilidad  de aceptar H0 si el valor real de  fuera 870 toneladas?.

 es el área, correspondiente a la región de aceptación, bajo la curva normal que tiene

Prueba estadística para  1   2 en el caso de muestras grandes

Prueba estadística para p en el caso de muestras grandes

Prueba estadística para p1  p2 en el caso de muestras grandes

En lo que sigue p no se refiere al parámetro de una población binomial.

El mínimo nivel de significación p se determina en función de la mínima región de rechazo que se

Veamos como se determina el valor p de esta prueba.

p es la probabilidad de cometer un error tipo I con esta región de rechazo

p = P(z  3.03) + P(z  3.03) = 0.0024.

Por lo tanto, al utilizar esta prueba estadística se elegirán valores de   0.0024.

También podría gustarte