Está en la página 1de 40

PRUEBA DE HIPOTESIS

Conceptos de la prueba de hipótesis


  Hipótesis estadísticas.
1.
a) HIPÓTESIS ESTADÍSTICA: afirmación sobre uno o más parámetros de una o más
poblaciones.
b) LA HIPÓTESIS NULA H0: la hipótesis que se debe comprobar.
c) LA HIPÓTESIS ALTERNATIVA H1: se establece como el “complemento” de H0.

2. Comentarios.
d) H0 siempre se refiere a un valor específico del parámetro de población (como, por
ejemplo, μ), no al estadístico muestral (como ).
e) H0 siempre debe contener un signo igual respecto al valor especificado del parámetro
poblacional (por ejemplo, H0 : μ = 36, H0 : μ ≤ 36 o H0 : μ ≥ 36).
f) H1 nunca debe contener un signo igual respecto al valor especificado de parámetro de
población (por ejemplo, H1 : μ ≠ 36, H1 : μ < 36 o H1 : μ > 36).
3. Errores de tipo I y de tipo II.

Decisión sobre es verdadera es falsa


Decisión correcta Error de tipo II
No se rechaza
se llama grado de confianza Probabilidad = β
Error de tipo I Decisión correcta
Rechazar
se llama nivel de significancia 1 – β se llama potencia
 4. Estadístico de prueba y región crítica.

Un estadístico de prueba es un estadístico (es decir, una función que sólo depende de la
información muestral) que se utiliza para determinar si se rechaza, o no, la hipótesis nula.
La región crítica es el conjunto de todos los valores del estadístico de prueba para los cuales
la hipótesis nula será rechazada.
Entonces, la hipótesis nula será rechazada si y sólo si el valor observado o calculado del
estadístico de prueba se ubica en la región de rechazo.

5. Valor P o p-valor.
El p-valor o valor p es el mínimo nivel de significancia bajo la cual H0 es rechazada.
Tenemos que

a) P-valor ≤ α Rechazar al nivel α.


b) P-valor > α No rechazar al nivel α.

Cola izquierda Dos colas Cola derecha


6. Comentarios acerca de los términos “no rechazar” y “rechazar” .

Al “no rechazar” una hipótesis nula, no estamos asegurando necesariamente que


haya mucho en su favor. Una afirmación más precisa, aunque más pedante, sobre
la situación puede ser “los datos disponibles no proporcionan suficiente evidencia
para rechazar la hipótesis nula, dado que queremos fijar en la probabilidad de
rechazar una hipótesis nula que es cierta”.
Por esta razón, algunos autores prefieren la frase “no se rechaza la hipótesis nula”
en lugar de “se acepta la hipótesis nula”.
La situación es muy similar a la de un tribunal de justicia, donde el acusado, al
principio, goza de la presunción de inocencia, y la acusación debe presentar
evidencia contraria lo suficientemente clara como para conseguir un veredicto de
culpabilidad.
En el contexto de la prueba de hipótesis clásica, la hipótesis nula se considera
cierta inicialmente. La tarea de persuadirnos de lo contrario corresponde a los
datos de la muestra.
Aproximación a la prueba de hipótesis con probabilidad fija del error
tipo I
1. Establezca las hipótesis nula y alternativa.
2. Elija un nivel de significancia α fijo.
3. Seleccione un estadístico de prueba adecuado y establezca la región crítica con base
en α.
4. A partir del estadístico de prueba calculado, rechace H0 si el estadístico de prueba está
en la región crítica. De otra manera, no rechace H0.
5. Obtenga conclusiones científicas y de ingeniería.

Prueba de significancia (aproximación al valor P)

1. Establezca las hipótesis nula y alternativa.


2. Elija un estadístico de prueba adecuado.
3. Calcule el valor P con base en los valores calculados del estadístico de prueba.
4. Utilice el juicio con base en el valor P y reconozca el sistema científico.
PRUEBA DE HIPOTESIS
PARA UNA SOLA MUESTRA
Pruebas para una sola media (varianza poblacional conocida o muestra grande)

 El estadístico de prueba tiene la forma (varianza poblacional conocida) o


(varianza poblacional desconocida pero muestra grande) y la región crítica
dependerá de cada uno de estos de tres casos, como se ilustra en la tabla.

Tipo de hipótesis Regla de decisión


Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola izquierda
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
Una muestra aleatoria de 100 muertes registradas en cierto país durante el año
pasado mostró una vida promedio de 71,8 años. Suponiendo una desviación
estándar poblacional de 8,9 años, ¿parecería esto indicar que la vida promedio hoy
en día es mayor que 70 años? Utilice un nivel de significancia del 5%.

Tipo de hipótesis Regla de decisión


Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola izquierda
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
Recuerde:
1. Datos del problema.
2. Supuestos.
Para este caso sigma
muestral es la desviación
estándar de la población.
Activamos usar prueba Z porque la desviación estándar poblacional es
conocida. También activamos usar prueba Z cuando la muestra sea mayor o
igual que 30 independientemente que conozcamos la varianza poblacional o
desviación estándar poblacional
Una muestra aleatoria de 100 muertes registradas en cierto país durante el año
pasado mostró una vida promedio de 71,8 años. Suponiendo una desviación
estándar poblacional de 8,9 años, ¿parecería esto indicar que la vida promedio hoy
en día es mayor que 70 años? Utilice un nivel de significancia del 5%.
SOLUCION:

1. Sea μ la vida promedio poblacional (en años). En este ejemplo, se quiere probar la
hipótesis
H0 : μ ≤ 70 años versus H1 : μ > 70 años.

2.a= 0,05

 3. Estadístico:

 4. Rechazamos

5. Dado que rechazamos la hipótesis nula al nivel de significancia del 5%, se concluye que
la vida promedio hoy en día es mayor que 70 años
PRUEBA DE HIPOTESIS PARA LA MEDIA
Caso de muestra pequeñas y varianza poblacional desconocida
Nuevamente,
  para cualquiera de los tres casos siguientes que podemos considerar para la
hipótesis nula
H0 : μ = μ0, H0 : μ ≥ μ0, H0 : μ ≤ μ0,

la estadística de prueba tiene la forma , la distribución a considerar es la t de Student con n


− 1 grados de libertad y la región crítica dependerá de cada uno de estos tres casos, como se
ilustra en la tabla

Tipo de hipótesis Regla de decisión


Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola izquierda
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante
específico es de 10 litros, si los contenidos de una muestra aleatoria de 10
envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un
nivel de significancia de 0.01 y suponga que la distribución del contenido es
normal.

Tipo de hipótesis Regla de decisión


Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola izquierda
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
Introducir los datos en Statgraphics
Para cambiar nombre de la variable hacer doble click en Col_1
 Procedimiento para hallar la media muestral y desviación estándar muestral
Desactivar las demás opciones y click en aceptar
 Sólonos interesa el valor del promedio muestral ( y el valor de
la desviación estándar muestral ( )
Recuerde:
1. Datos del problema.
2. Supuestos.
Click en aceptar
En este caso no activamos Usar Prueba Z porque la varianza poblacional es
desconocida y el tamaño de la muestra es menor que 30
Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante
específico es de 10 litros, si los contenidos de una muestra aleatoria de 10
envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un
nivel de significancia de 0.01 y suponga que la distribución del contenido es
normal.
SOLUCION:

1. Sea μ el contenido promedio en litros de los envases. En este ejemplo, se quiere


probar la hipótesis
H0 : μ = 10 litros versus H1 : μ ≠ 10 litros.

2.a= 0,01

 3. Estadístico:

 4. No rechazamos

5. Dado que no rechazamos la hipótesis nula al nivel de significancia del 1%, no existe
evidencia estadística que demuestre lo contrario
De acuerdo con un estudio dietético una ingesta alta de sodio se puede relacionar con úlceras,
cáncer estomacal y migraña. El requerimiento humano de sal es de tan sólo 220 miligramos
diarios, el cual se rebasa en la mayoría de las porciones individuales de cereales listos para
comerse. Si una muestra aleatoria de 20 porciones similares de cierto cereal tiene un contenido
medio de 244 miligramos de sodio y una desviación estándar de 24.5 miligramos, ¿esto sugiere,
en el nivel de significancia de 0.05, que el contenido promedio de sodio para porciones
individuales de tal cereal es mayor que 220 miligramos? Suponga que la distribución de
contenidos de sodio es normal.

Tipo de hipótesis Regla de decisión


Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola izquierda
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
Prueba para la proporción
 El estadístico de prueba tiene la forma y la región crítica dependerá de cada uno de
estos de tres casos, como se ilustra en la tabla.
En cierta universidad se estima que a lo más 25% de los estudiantes van en
bicicleta. ¿Ésta parece ser una estimación válida si, en una muestra aleatoria de
90 estudiantes universitarios, se encuentra que 28 van en bicicleta ? Utilice un
nivel de significancia de 0.05.
Tipo de hipótesis Regla de decisión
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola izquierda
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
En cierta universidad se estima que a lo más 25% de los estudiantes van en
bicicleta. ¿Ésta parece ser una estimación válida si, en una muestra aleatoria de
90 estudiantes universitarios, se encuentra que 28 van en bicicleta ? Utilice un
nivel de significancia de 0.05.
SOLUCION:
1. Sea p proporción de estudiantes que van en bicicleta a la universidad. En
este ejemplo, se quiere probar la hipótesis
H0 : p ≤ 0,25 versus H1 : p > 0,25
2.a= 0,05
 3. Estadístico:

 4. Rechazamos si No se rechaza porque 1,338 ≤ 1,645

5. Dado que no rechazamos la hipótesis nula al nivel de significancia del 5%, se


concluye que la proporción de estudiantes que van en bicicleta a la universidad
no es significativamente mayor que el 25%
2. Una compañía petrolera afirma que un quinto de las casas en cierta ciudad se
calientan con petróleo. ¿Tenemos razón para creer que menos de 1/5 se
calientan con petróleo si, en una muestra aleatoria de 1000 casas en esta
ciudad, se encuentra que 136 se calientan con petróleo? Utilice un valor P en
su conclusión.
Tipo de hipótesis Regla de decisión
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola izquierda
Si , entonces se rechaza ; de lo contrario , no se
rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
Prueba para la varianza
 El estadístico de prueba tiene la forma y corresponde al valor de una variable
aleatoria que tiene distribución chi-cuadrada con grados de libertad. La región
crítica dependerá de cada uno de estos tres casos, como se ilustra en la tabla

Tipo de hipótesis Regla de decisión


Si , entonces se rechaza ; de lo contrario, no se
rechaza .
Cola izquierda EXCEL: =INV.CHICUAD(α; g.l)
Si, entonces se rechaza ; de lo contrario , no se rechaza .

Cola derecha
EXCEL: =INV.CHICUAD.CD(α; g.l)
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .

Dos colas
EXCEL: =INV.CHICUAD(α/2; g.l)

EXCEL: =INV.CHICUAD.CD(α/2; g.l)


Tipo de hipótesis Regla de decisión


  , entonces se rechaza ; de lo contrario, no


Si
Cola izquierda 
se rechaza .
EXCEL: =INV.CHICUAD(α; g.l)
    



  entonces se rechaza ; de lo contrario ,


Si,
Cola derecha 
no se rechaza .
EXCEL: =INV.CHICUAD.CD(α; g.l)

    



Dos colas   o , entonces se rechaza ; de lo contrario , no


Si
se rechaza .

EXCEL: =INV.CHICUAD(α/2; g.l)

EXCEL: =INV.CHICUAD.CD(α/2; g.l)


    
 1. Por experiencia se sabe que el tiempo que se requiere para que los estudiantes
de preparatoria de último año completen una prueba estandarizada es una
variable aleatoria normal, con una desviación estándar de 6 minutos. Pruebe la
hipótesis de que σ 6 contra la alternativa de que σ < 6, si una muestra aleatoria
de 20 estudiantes de preparatoria de último año tiene una desviación estándar s
= 4.51. Utilice un nivel de significancia de 0.05.

Tipo de hipótesis Regla de decisión


Si , entonces se rechaza ; de lo contrario, no se
rechaza .
Cola izquierda
Si, entonces se rechaza ; de lo contrario , no se rechaza .
Cola derecha
Si o , entonces se rechaza ; de lo contrario , no se
rechaza .
Dos colas
 1. Por experiencia se sabe que el tiempo que se requiere para que los estudiantes
de preparatoria de último año completen una prueba estandarizada es una
variable aleatoria normal, con una desviación estándar de 6 minutos. Pruebe la
hipótesis de que σ 6 contra la alternativa de que σ < 6, si una muestra aleatoria
de 20 estudiantes de preparatoria de último año tiene una desviación estándar
s = 4.51. Utilice un nivel de significancia de 0.05.
 SOLUCION:
1. Sea σ2 la variabilidad del tiempo empleado en terminar una prueba. En este
ejemplo, se quiere probar la hipótesis
H0 : σ2 36 versus H1 : σ2 < 36
2.a= 0,05
 3. Estadístico: con 19 grados de libertad

2
 𝜒 1 −𝛼 =𝐼𝑁𝑉 . 𝐶𝐻𝐼𝐶𝑈𝐴𝐷 ( 0,05 ; 19 ) =10,117

4. No rechazamos
5. Dado que no rechazamos la hipótesis nula al nivel
de significancia del 5%, se concluye que la
variabilidad del tiempo empleado por los
estudiantes es significativamente mayor que 36
Solución por
Statgraphics
 1. Por experiencia se sabe que el tiempo que se requiere para que los estudiantes
de preparatoria de último año completen una prueba estandarizada es una
variable aleatoria normal, con una desviación estándar de 6 minutos. Pruebe la
hipótesis de que σ 6 contra la alternativa de que σ < 6, si una muestra aleatoria
de 20 estudiantes de preparatoria de último año tiene una desviación estándar
s = 4.51. Utilice un nivel de significancia de 0.05.
2. Datos históricos indican que la cantidad de dinero que aportaron los residentes
trabajadores de una ciudad grande para un escuadrón de rescate voluntario es
una variable aleatoria normal con una desviación estándar de $1.40. Se sugiere
que las contribuciones al escuadrón de rescate sólo de los empleados del
departamento de sanidad son mucho más variables. Si las contribuciones de
una muestra aleatoria de 12 empleados del departamento de sanidad tienen
una desviación estándar de $1.75, ¿podemos concluir con un nivel de
significancia de 0.01 que la desviación estándar de las contribuciones de todos
los trabajadores de sanidad es mayor que la de todos los trabajadores que
viven en dicha ciudad?

 SOLUCION:
1. Sea σ2 la variabilidad de las contribuciones de todos los trabajadores de
sanidad. En este ejemplo, se quiere probar la hipótesis
H0 : σ2 36 versus H1 : σ2 >36

2.a= 0,01

 3. Estadístico: con 11 grados de libertad

2
 𝜒 𝛼 =𝐼𝑁𝑉 . 𝐶𝐻𝐼𝐶𝑈𝐴𝐷 . 𝐶𝐷 ( 0,01 ; 11 ) =19,675
2
 𝜒 𝛼 =𝐼𝑁𝑉 . 𝐶𝐻𝐼𝐶𝑈𝐴𝐷 . 𝐶𝐷 ( 0,01 ; 11 ) =19,675

 con 11 grados de libertad

4. No rechazamos

5. Dado que no rechazamos la hipótesis nula al nivel de significancia del 5%, se


concluye que la variabilidad del tiempo empleado por los estudiantes es
significativamente mayor que 36

También podría gustarte