HIPÓTESIS Ing. Hernán A. Pinto Coaquira PRUEBA DE HIPÓTESIS
■ Esta técnica estadística es muy utilizada como
soporte a la investigación sistemática y científica. Consiste en suponer algún valor para el parámetro de interés y usar los datos de la muestra para aceptar o rechazar esta afirmación. ■ Es importante entender las diferentes situaciones que pueden ocurrir al probar estadísticamente una hipótesis. TOMA DE DECISIÓN
■ Sea Ho: alguna hipótesis que se propone para el
parámetro de interés Definiciones: Medición de los errores Tipo I y Tipo II ■ Error Tipo I: α = P(Rechazar Ho dado que Ho es verdadera) ■ Error Tipo II: β = P(Aceptar Ho dado que otra hipótesis es verdadera) Terminología
■ Ho: Hipótesis nula. Es la hipótesis propuesta para el
parámetro de interés. ■ Ha: Hipótesis alterna. Es la hipótesis que se plantea en oposición a Ho y que es aceptada en caso de que Ho sea rechazada ■ α: El valor α se denomina nivel de significancia de la prueba y puede darse como un dato para realizar la prueba. Algunos valores típicos para α son: 10%, 5%, 2%, 1% TIPOS DE PRUEBAS
Sean 𝜃: Parámetro de interés
𝜃0 : Algún valor que se propone para el parámetro ■ Pruebas de una cola 1) Ho: 𝜃 = 𝜃0 : (Hipótesis nula) Ha: 𝜃 < 𝜃0 : (Hipótesis alterna) 2) Ho: 𝜃 = 𝜃0 : (Hipótesis nula) Ha: 𝜃 > 𝜃0 : (Hipótesis alterna) ■ Prueba de dos colas 3) Ho: 𝜃 = 𝜃0 : (Hipótesis nula) Ha: 𝜃 ≠ 𝜃0 (Hipótesis alterna) PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS PASOS
■ Paso 1. Formular la hipótesis nula y la hipótesis alterna,
la cual es de interés probar. ■ Paso 2. Especificar el nivel de significancia de la prueba. ■ Paso 3. Seleccionar el estadístico de prueba y definir la región de rechazo de Ho. ■ Paso 4. Calcular el valor del estadístico de prueba con los datos de la muestra ■ Paso 5. Tomar una decisión Prueba de Hipótesis relacionada con la media ■ Caso n ≥ 30 (Muestra grande) Parámetro: 𝜇 (media poblacional) Población con varianza 𝜎 2 ഥ Estimador: (media muestral) 𝑿 Valor propuesto para el parámetro: 𝜇0 Prueba de Hipótesis relacionada con la media ■ Seleccionar el estadístico de prueba y definir la región de rechazo de Ho. En este caso, por el Teorema del Límite Central, el estadístico, tiene Distribución Normal Estándar aproximadamente: 𝑋ത − 𝜇 𝑍𝑐 = 𝜎/ 𝑛 1 cola: 𝑍𝑡 = 𝑍1−𝛼 2 colas: 𝑍𝑡 = 𝑍1−𝛼/2 Ejemplo 1
■ Una muestra aleatoria de n=40 observaciones
tomada de una población en estudio, produjo una media = 2.4 Suponga que se desea demostrar que la media poblacional μ es mayor a 2.3 con una desviación estándar =0.28 Ejemplo 2
■ Una muestra aleatoria de 100 paquetes mostró un
peso promedio de 71.8 gr. Pruebe con un nivel de significancia de 3%, que el peso promedio de todos los paquetes (población) es mayor a 70 gr. con una desviación estándar de 8.9 gr.. Prueba de Hipótesis relacionada con dos medias muestrales ■ Caso n ≥ 30 (Muestra grande) Parámetro: 𝜇1 − 𝜇2 Estimador: 𝑋1 − 𝑋2 Varianzas: 𝑆12 , 𝑆22 Tamaño de muestra: 𝑛1 , 𝑛2 𝑋1 − 𝑋2 𝑍𝑐 = 𝑆12 𝑆22 + 𝑛1 𝑛2 1 cola: 𝑍𝑡 = 𝑍1−𝛼 2 colas: 𝑍𝑡 = 𝑍1−𝛼/2 Ejemplo 1
Se consideran dos métodos en un proceso de fabricación
de pintura con la finalidad de aumentar la producción. En una muestra aleatoria de 100 días, la media de producción diaria con el primer método fue de 625 toneladas, y la desviación estándar era de 40 toneladas. En una muestra aleatoria de 64 días, la media de la producción diaria que usaba el segundo método era de 640 toneladas, y la desviación estándar, de 50 toneladas. Suponga que las muestras son independientes. ¿Puede concluir que el segundo método produce la media de la producción diaria mayor? Ejemplo 2
Una prueba de resistencia al esfuerzo de dos tipos
de diferentes cables, que presentan desviaciones típicas de 35 y 45 respectivamente, se llevo a cabo, seleccionando dos muestra de tamaño 32 y 40, con medias de 905 y 925. ¿Proporcionan estos resultados, al nivel del 10%, suficiente evidencia de que la resistencia de B es superior a la de A? INFERENCIAS RELACIONADAS CON LA PROPORCIÓN ■ Caso n≥30 (Muestras grandes) Parámetro: 𝑃 (Es la proporción poblacional cuyo valor se desea estimar) 𝑝 = Proporción obtenida de la muestra Valor propuesto para el parámetro: 𝑝0 𝑝−𝑃 𝑍𝑐 = 𝑃(1 − 𝑃) 𝑛 1 cola: 𝑍𝑡 = 𝑍1−𝛼 2 colas: 𝑍𝑡 = 𝑍1−𝛼/2 Ejemplo 1
■ Un proceso productivo que fabrica semiconductores
produce un 2 % de artículos defectuosos cuando el proceso productivo funciona adecuadamente. Con el fin de mejorar la calidad de la producción se adquiere una nueva máquina basada en una tecnología más avanzada. Después de producir 200 artículos con la nueva máquina se encuentra que 2 son defectuosos. ¿Se puede afirmar que la nueva máquina ha mejorado la calidad de la producción?. Ejemplo 2
■ Un gerente de una compañía afirma, que el 25% de
trabajadores llegan tarde al trabajo. Para ello solicita al jefe de personal la revisión de 40 tarjetas marcadas con las horas de llegada, y encuentra que 8 han llegado tarde, al nivel del 4% ¿Hay razón para concluir que el gerente de la compañia esta exagerando? INFERENCIAS RELACIONADAS CON DOS PROPORCIONES ■ Caso n≥30 (Muestras grandes) Parámetro: 𝑃1 , 𝑃2 𝑝1 , 𝑝2 = 2 Proporciones obtenida de la muestra 𝑝1 − 𝑝2 𝑧= 𝑝𝑐 (1 − 𝑝𝑐 ) 𝑝𝑐 (1 − 𝑝𝑐 ) + 𝑛1 𝑛2 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑋1 + 𝑋2 𝑝𝑐 = = 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑛1 + 𝑛2 1 cola: 𝑍𝑡 = 𝑍1−𝛼 2 colas: 𝑍𝑡 = 𝑍1−𝛼/2 Ejemplo 1
■ 132 de 200 electores de la región uno favorecen a
un candidato, mientras que le son favorables 90 de 150 electores de la región dos. Suponiendo que las muestras son aleatorias e independientes encuentre un intervalo de confianza de 99% para la diferencia entre las proporciones de electores que le son favorables en estas dos regiones. Ejemplo 2
■ A menudo, las compañías industriales emplean métodos de
“transferencia de riesgo”, un seguro o las cláusulas de indemnización en los contratos, como una técnica de administración de riesgos. Se informa los resultados de una encuesta en la cual se les pregunta a los directivos acerca de los métodos importantes en la estrategia de administración de riesgos de sus compañías. En una muestra de 43 compañías petroleras, 22 indicaban que la transferencia de riesgos fue determinante, mientras que en una muestra de 93 compañías constructoras 55 confirmaron lo anterior. ¿Se puede concluir que la proporción de compañías petroleras que emplean el método de transferencia de riesgos es menor que la proporción de compañías constructoras que lo hacen? PRUEBA DE HIPÓTESIS RELACIONADA CON LA MEDIA ■ Caso n<30 (Muestras pequeñas) Parámetro: 𝜇 (Es la medida poblacional cuyo valor se desea estimar) Población con distribución normal, varianza 𝜎 2 desconocida Estimador T (Variable aleatoria con distribución T, con gl = n-1 ) Valor propuesto para el parámetro: 𝜇0 Prueba de Hipótesis relacionada con la media ■ Seleccionar el estadístico de prueba y definir la región de rechazo de Ho: 𝑋ത − 𝜇 𝑇𝑐 = 𝑆/ 𝑛 1 cola: 𝑇𝑡 = 𝑇𝑛−1;1−𝛼 2 colas: 𝑇𝑡 = 𝑇𝑛−1;1−𝛼/2 Ejemplo 2
■ Una muestra aleatoria de 10 observaciones
tomada de una población con distribución normal produjo una media 2.5 y una desviación estándar 0.28. Suponga que se desea demostrar que la media poblacional es mayor a 2.3 Ejemplo 1
■ De una población normal se tomó una muestra
aleatoria y se obtuvieron los siguientes resultados: 15, 17, 23, 18, 20. Probar con una significancia de 10% que la media de la población es mayor a 18. PRUEBA DE HIPÓTESIS RELACIONADA CON DOS MEDIAS ■ Caso n<30 (Muestras pequeñas) Parámetro: 𝜇1, 𝜇2 Estimador: 𝑋1 , 𝑋2 Varianzas: 𝑆12 , 𝑆22 Tamaño de muestra: 𝑛1 , 𝑛2 𝑋ത1 − 𝑋ത2 𝑡= 1 cola: 𝑇𝑡 = 𝑇𝑛1 +𝑛2 −2;1−𝛼 2 1 1 2 colas: 𝑇𝑡 = 𝑇𝑛1 +𝑛2 −2;1−𝛼/2 𝑆𝑝 𝑛 + 𝑛 1 2 2 2 𝑛1 − 1 𝑆12 + 𝑛2 − 1 𝑆2 𝑆𝑝 = 𝑛1 + 𝑛2 − 2 Ejemplo 1
Se realizó un experimento para comparar la resistencia de dos
materiales, obteniéndose los siguientes resultados: Material 𝑛 𝑋ത 𝑆 1 12 85 4 2 10 81 5 Suponga que son muestras aleatorias independientes y que provienen de poblaciones normales con varianzas desconocidas pero que se pueden considerar iguales. Pruebe con 5% de significancia que la resistencia del material uno excede a la resistencia del material dos en dos unidades. Ejemplo 2
■ Se han desarrollado dos métodos para determinar el
contenido de níquel del acero. En una muestra de cinco reproducciones del primer método sobre cierta clase de acero, la medición promedio (en porcentaje) fue 𝑋ത = 3.16 y la desviación estándar 𝑆𝑋 = 0.042. El promedio de las siete reproducciones del segundo método fue 𝑌ത = 3.24, y la desviación estándar, 𝑆𝑌 = 0.048. Suponga que se conoce que las varianzas poblacionales son casi iguales. ¿Se puede concluir que hay diferencia en las mediciones promedio entre los dos métodos?
Utilizacion de Membranas Como Tratamientos Terciarios para Regeneracion de Aguas Residuales Membranas Ceramicas (Escuela Politecnica Superior Villanueva de La Cañada)
Ficha Ambiental Ministerio de Desarrollo Sostenible Viceministerio de Recursos Naturales y Medio Ambiente Formulario: Ficha Ambiental Proyecto: Pavimentación Tramo Carretras I