Está en la página 1de 28

PRUEBA DE

HIPÓTESIS
Ing. Hernán A. Pinto Coaquira
PRUEBA DE HIPÓTESIS

■ Esta técnica estadística es muy utilizada como


soporte a la investigación sistemática y científica.
Consiste en suponer algún valor para el parámetro
de interés y usar los datos de la muestra para
aceptar o rechazar esta afirmación.
■ Es importante entender las diferentes situaciones
que pueden ocurrir al probar estadísticamente una
hipótesis.
TOMA DE DECISIÓN

■ Sea Ho: alguna hipótesis que se propone para el


parámetro de interés
Definiciones: Medición de los errores
Tipo I y Tipo II
■ Error Tipo I:
α = P(Rechazar Ho dado que Ho es verdadera)
■ Error Tipo II:
β = P(Aceptar Ho dado que otra hipótesis es
verdadera)
Terminología

■ Ho: Hipótesis nula. Es la hipótesis propuesta para el


parámetro de interés.
■ Ha: Hipótesis alterna. Es la hipótesis que se plantea en
oposición a Ho y que es aceptada en caso de que Ho
sea rechazada
■ α: El valor α se denomina nivel de significancia de la
prueba y puede darse como un dato para realizar la
prueba. Algunos valores típicos para α son: 10%, 5%,
2%, 1%
TIPOS DE PRUEBAS

Sean 𝜃: Parámetro de interés


𝜃0 : Algún valor que se propone para el parámetro
■ Pruebas de una cola
1) Ho: 𝜃 = 𝜃0 : (Hipótesis nula)
Ha: 𝜃 < 𝜃0 : (Hipótesis alterna)
2) Ho: 𝜃 = 𝜃0 : (Hipótesis nula)
Ha: 𝜃 > 𝜃0 : (Hipótesis alterna)
■ Prueba de dos colas
3) Ho: 𝜃 = 𝜃0 : (Hipótesis nula)
Ha: 𝜃 ≠ 𝜃0 (Hipótesis alterna)
PROCEDIMIENTO PARA
REALIZAR UNA PRUEBA
DE HIPÓTESIS
PASOS

■ Paso 1. Formular la hipótesis nula y la hipótesis alterna,


la cual es de interés probar.
■ Paso 2. Especificar el nivel de significancia de la
prueba.
■ Paso 3. Seleccionar el estadístico de prueba y definir la
región de rechazo de Ho.
■ Paso 4. Calcular el valor del estadístico de prueba con
los datos de la muestra
■ Paso 5. Tomar una decisión
Prueba de Hipótesis relacionada con la
media
■ Caso n ≥ 30 (Muestra grande)
Parámetro: 𝜇 (media poblacional)
Población con varianza 𝜎 2

Estimador: (media muestral) 𝑿
Valor propuesto para el parámetro: 𝜇0
Prueba de Hipótesis relacionada con la
media
■ Seleccionar el estadístico de prueba y definir la región
de rechazo de Ho. En este caso, por el Teorema del
Límite Central, el estadístico, tiene Distribución Normal
Estándar aproximadamente:
𝑋ത − 𝜇
𝑍𝑐 =
𝜎/ 𝑛
1 cola: 𝑍𝑡 = 𝑍1−𝛼
2 colas: 𝑍𝑡 = 𝑍1−𝛼/2
Ejemplo 1

■ Una muestra aleatoria de n=40 observaciones


tomada de una población en estudio, produjo una
media = 2.4 Suponga que se desea demostrar que
la media poblacional μ es mayor a 2.3 con una
desviación estándar =0.28
Ejemplo 2

■ Una muestra aleatoria de 100 paquetes mostró un


peso promedio de 71.8 gr. Pruebe con un nivel de
significancia de 3%, que el peso promedio de todos
los paquetes (población) es mayor a 70 gr. con una
desviación estándar de 8.9 gr..
Prueba de Hipótesis relacionada con dos
medias muestrales
■ Caso n ≥ 30 (Muestra grande)
Parámetro: 𝜇1 − 𝜇2
Estimador: 𝑋1 − 𝑋2
Varianzas: 𝑆12 , 𝑆22
Tamaño de muestra: 𝑛1 , 𝑛2
𝑋1 − 𝑋2
𝑍𝑐 =
𝑆12 𝑆22
+
𝑛1 𝑛2
1 cola: 𝑍𝑡 = 𝑍1−𝛼
2 colas: 𝑍𝑡 = 𝑍1−𝛼/2
Ejemplo 1

Se consideran dos métodos en un proceso de fabricación


de pintura con la finalidad de aumentar la producción. En
una muestra aleatoria de 100 días, la media de
producción diaria con el primer método fue de 625
toneladas, y la desviación estándar era de 40 toneladas.
En una muestra aleatoria de 64 días, la media de la
producción diaria que usaba el segundo método era de
640 toneladas, y la desviación estándar, de 50 toneladas.
Suponga que las muestras son independientes. ¿Puede
concluir que el segundo método produce la media de la
producción diaria mayor?
Ejemplo 2

Una prueba de resistencia al esfuerzo de dos tipos


de diferentes cables, que presentan desviaciones
típicas de 35 y 45 respectivamente, se llevo a cabo,
seleccionando dos muestra de tamaño 32 y 40, con
medias de 905 y 925. ¿Proporcionan estos
resultados, al nivel del 10%, suficiente evidencia de
que la resistencia de B es superior a la de A?
INFERENCIAS RELACIONADAS CON LA
PROPORCIÓN
■ Caso n≥30 (Muestras grandes)
Parámetro: 𝑃 (Es la proporción poblacional
cuyo valor se desea estimar)
𝑝 = Proporción obtenida de la muestra
Valor propuesto para el parámetro: 𝑝0
𝑝−𝑃
𝑍𝑐 =
𝑃(1 − 𝑃)
𝑛
1 cola: 𝑍𝑡 = 𝑍1−𝛼
2 colas: 𝑍𝑡 = 𝑍1−𝛼/2
Ejemplo 1

■ Un proceso productivo que fabrica semiconductores


produce un 2 % de artículos defectuosos cuando el
proceso productivo funciona adecuadamente. Con el fin
de mejorar la calidad de la producción se adquiere una
nueva máquina basada en una tecnología más
avanzada. Después de producir 200 artículos con la
nueva máquina se encuentra que 2 son defectuosos.
¿Se puede afirmar que la nueva máquina ha mejorado
la calidad de la producción?.
Ejemplo 2

■ Un gerente de una compañía afirma, que el 25% de


trabajadores llegan tarde al trabajo. Para ello
solicita al jefe de personal la revisión de 40 tarjetas
marcadas con las horas de llegada, y encuentra
que 8 han llegado tarde, al nivel del 4% ¿Hay razón
para concluir que el gerente de la compañia esta
exagerando?
INFERENCIAS RELACIONADAS CON DOS
PROPORCIONES
■ Caso n≥30 (Muestras grandes)
Parámetro: 𝑃1 , 𝑃2
𝑝1 , 𝑝2 = 2 Proporciones obtenida de la muestra
𝑝1 − 𝑝2
𝑧=
𝑝𝑐 (1 − 𝑝𝑐 ) 𝑝𝑐 (1 − 𝑝𝑐 )
+
𝑛1 𝑛2
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑋1 + 𝑋2
𝑝𝑐 = =
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑛1 + 𝑛2
1 cola: 𝑍𝑡 = 𝑍1−𝛼
2 colas: 𝑍𝑡 = 𝑍1−𝛼/2
Ejemplo 1

■ 132 de 200 electores de la región uno favorecen a


un candidato, mientras que le son favorables 90 de
150 electores de la región dos. Suponiendo que las
muestras son aleatorias e independientes
encuentre un intervalo de confianza de 99% para
la diferencia entre las proporciones de electores
que le son favorables en estas dos regiones.
Ejemplo 2

■ A menudo, las compañías industriales emplean métodos de


“transferencia de riesgo”, un seguro o las cláusulas de
indemnización en los contratos, como una técnica de
administración de riesgos. Se informa los resultados de una
encuesta en la cual se les pregunta a los directivos acerca de los
métodos importantes en la estrategia de administración de
riesgos de sus compañías. En una muestra de 43 compañías
petroleras, 22 indicaban que la transferencia de riesgos fue
determinante, mientras que en una muestra de 93 compañías
constructoras 55 confirmaron lo anterior. ¿Se puede concluir que
la proporción de compañías petroleras que emplean el método de
transferencia de riesgos es menor que la proporción de
compañías constructoras que lo hacen?
PRUEBA DE HIPÓTESIS RELACIONADA CON
LA MEDIA
■ Caso n<30 (Muestras pequeñas)
Parámetro: 𝜇 (Es la medida poblacional cuyo valor se
desea estimar)
Población con distribución normal, varianza 𝜎 2
desconocida
Estimador T (Variable aleatoria con distribución T, con gl =
n-1 )
Valor propuesto para el parámetro: 𝜇0
Prueba de Hipótesis relacionada con la
media
■ Seleccionar el estadístico de prueba y definir la
región de rechazo de Ho:
𝑋ത − 𝜇
𝑇𝑐 =
𝑆/ 𝑛
1 cola: 𝑇𝑡 = 𝑇𝑛−1;1−𝛼
2 colas: 𝑇𝑡 = 𝑇𝑛−1;1−𝛼/2
Ejemplo 2

■ Una muestra aleatoria de 10 observaciones


tomada de una población con distribución normal
produjo una media 2.5 y una desviación estándar
0.28. Suponga que se desea demostrar que la
media poblacional es mayor a 2.3
Ejemplo 1

■ De una población normal se tomó una muestra


aleatoria y se obtuvieron los siguientes resultados:
15, 17, 23, 18, 20. Probar con una significancia de
10% que la media de la población es mayor a 18.
PRUEBA DE HIPÓTESIS RELACIONADA CON
DOS MEDIAS
■ Caso n<30 (Muestras pequeñas)
Parámetro: 𝜇1, 𝜇2
Estimador: 𝑋1 , 𝑋2
Varianzas: 𝑆12 , 𝑆22
Tamaño de muestra: 𝑛1 , 𝑛2
𝑋ത1 − 𝑋ത2
𝑡= 1 cola: 𝑇𝑡 = 𝑇𝑛1 +𝑛2 −2;1−𝛼
2 1 1 2 colas: 𝑇𝑡 = 𝑇𝑛1 +𝑛2 −2;1−𝛼/2
𝑆𝑝 𝑛 + 𝑛
1 2
2
2
𝑛1 − 1 𝑆12 +
𝑛2 − 1 𝑆2
𝑆𝑝 =
𝑛1 + 𝑛2 − 2
Ejemplo 1

Se realizó un experimento para comparar la resistencia de dos


materiales, obteniéndose los siguientes resultados:
Material 𝑛 𝑋ത 𝑆
1 12 85 4
2 10 81 5
Suponga que son muestras aleatorias independientes y que
provienen de poblaciones normales con varianzas desconocidas
pero que se pueden considerar iguales.
Pruebe con 5% de significancia que la resistencia del material uno
excede a la resistencia del material dos en dos unidades.
Ejemplo 2

■ Se han desarrollado dos métodos para determinar el


contenido de níquel del acero. En una muestra de cinco
reproducciones del primer método sobre cierta clase de
acero, la medición promedio (en porcentaje) fue 𝑋ത =
3.16 y la desviación estándar 𝑆𝑋 = 0.042. El promedio
de las siete reproducciones del segundo método fue
𝑌ത = 3.24, y la desviación estándar, 𝑆𝑌 = 0.048.
Suponga que se conoce que las varianzas
poblacionales son casi iguales. ¿Se puede concluir que
hay diferencia en las mediciones promedio entre los dos
métodos?

También podría gustarte