Está en la página 1de 15

Prueba de Hipótesis (2da parte)

CLAUDIO CERRÓN
ESTADÍSTICA APLICADA A LA INGENIERÍA
Semana 02-03
Propósito de la Clase

Plantear, aplicar e interpretar pruebas de hipótesis para la media,


proporción y varianza a partir de una y dos muestras aleatorias.
Significación
Al comenzar cualquier análisis debemos especificar el nivel de significación α (o error de tipo I). La
prueba estadística nos arrojará un nivel crítico p (o p-valor) que es el valor asociado al estadístico
de contraste. Compararemos entonces el p-valor con el nivel de significación (α) para decidir si los
datos apoyan o no la hipótesis planteada.

Criterio de decisión
Diremos que un contraste es estadísticamente significativo cuando se rechaza Ho, y esto ha de
ocurrir siempre que el p-valor del contraste sea menor que el nivel de significación α (o error tipo I).
Asimismo, diremos que el estadístico no es significativo cuando no podamos rechazar Ho, es decir,
el p-valor es mayor o igual que α.

p≤α p>α
Rechazar la hipótesis nula No rechazar la hipótesis nula
Prueba de hipótesis para la proporción con R https://cran.r-project.org/bin/windows/base/
Nota: Es necesario instalar previamente la librería PASWR.

La función que resuelve contrastes de hipótesis para la proporción en R es prop.test. Sus argumentos
son los siguientes:
prop.test(x, n, p = NULL, alternative = c(“two.sided”, “less”, “greater”), correct=FALSE)

donde:
• x es un valor numérico que indica el número de elementos que presentan la característica de interés
• n es un valor numérico que indica el número total de elementos del grupo
• p es un valor numérico que se corresponde con el valor π0 que se desea comprobar
• alternative indica el tipo de la hipótesis alternativa del contraste.
• correct indica si se aplica la corrección de Yates.
Ejemplo 1:
Suponga que se encuentra con un fanático de los Cachorros Club al principio de la temporada de
fútbol. Los Cachorros han jugado 20 partidos y han ganado 11 de ellos, o el 55% de sus partidos. Con
base en esa evidencia, el aficionado tiene "mucha confianza" en que los Cachorros ganarán más de la
mitad de sus juegos este año. ¿Debería tener tanta confianza?

Ejemplo 2:
Una municipalidad está interesada en averiguar si el índice de absentismo laboral es menor en dicha
municipalidad que la media nacional la que se sitúa en 9%. Con este propósito, seleccionó al azar una
muestra de 200 trabajadores de dicha municipalidad y se encontró 10 ausencias. ¿Que podría concluir
respecto al interés de dicha municipalidad?
Ejemplo 3:
Cuando se prueba un fármaco para el control de los dolores de la migraña, menos del 15% de los
pacientes desarrolla gastritis. Un nuevo compuesto desarrollado en base a la planta Valeriana Officinalis,
en una muestra de 354 pacientes evidencia que solo en 90 pacientes evidencian síntomas de gastritis.
Emplee un nivel de significancia para probar que este nuevo fármaco también produce menos del 15% de
pacientes que desarrollan gastritis.
Prueba de hipótesis para una media
Prueba Z, con varianza poblacional σ2 conocida. (n > 30).
z.test(x, mu, sigma.x, alternative c("two.sided", "less", "greater"))

Prueba t de Student, con varianza poblacional σ2 desconocida.


t.test(x, mu, alternative c("two.sided", "less", "greater"))

donde:
• x es el vector con los elementos de interés. característica de interés.
• mu es el valor de contraste.
• sigma.x es la desviación estándar poblacional conocida.
Ejemplo 4
El artículo “Uncertainly Estimation in Railway Track Life-Cycle cost” (J, of Rail and Rapid Transit, 2009)
presenta los siguientes datos sobre el tiempo de reparación (minutos) de la rotura de un carril alto en una vía
curva del tren de cierta línea de ferrocarril.
159 120 480 149 270 547 340 430 228 202 240 218
Si la distribución de la población del tiempo tiene comportamiento normal. ¿Habrá pruebas de peso para
concluir que el tiempo medio verdadero de reparación es superior a 200 minutos? Utilice un α de 0,05.

Ejemplo 5
Un ingeniero industrial hace un análisis de la producción de la panadería Mantaro Valley que hace donas que
se empacan en cajas con etiquetas que dicen contener 36 donas. Si la variación entre las donas es muy
grande, algunas cajas contendrán menos peso (estafando a los consumidores) y otras más (disminuyendo las
ganancias). El supervisor de control de calidad encontró que es posible resolver el problema si las donas
tienen una media de 4,50 onzas y una desviación estándar de 0,06 onzas o menor. Se seleccionan al azar 36
donas de la línea de producción y se pesan, con los resultados que se dan aquí (en onzas).
4,43 4,37 4,58 4,50 4,68 4,61 4,43 4,37 4,58 4,50 4,68 4,61
4,61 4,30 4,37 4,58 4,50 4,32 4,61 4,30 4,37 4,58 4,50 4,32
4,42 4,52 4,66 4,50 4,36 4,42 4,42 4,52 4,66 4,50 4,36 4,42
¿La media poblacional de lo pesos no cumple con el requerimiento?
Ejemplo 6
Los datos que acompañan la fuerza del cubo de compresión (MPa) de probetas de hormigón apareció en
el artículo “Experimental Study of Recycled Rubber-Filled High-Strength Concrete” (Magazine of
Concrete Res., 2009: 549-556): 112,3 97,0 92,7 86,0 102,0
99,2 95,8 103,5 89,0 86,7
Si la fuerza promedio real del concreto es inferior a 100 MPa no podría utilizarse. Asumiendo que el
comportamiento de la resistencia a la compresión sigue una distribución normal, verifique si se podrá
utilizar el concreto. Utilice el nivel de significancia de 0,01

Ejemplo 7
La cantidad diaria recomendada de zinc en la dieta entre los varones de 50 años de edad es de 15
mg/día. El artículo “Nutrient Intakes and Dietary Patterns of Older Americans: A National Study” (J.
of Gerontology, 1992:M145-150) presenta el siguiente resumen de datos sobre el consumo de zinc en
una muestra de varones con edades entre 65 y 74 años: n=115; 𝑥=11.3 y s=6,43. ¿Indicarán estos datos
que la ingesta de zinc diaria promedio en la población de varones de todas las edades de 65 a 74 años
cae por debajo de la cantidad recomendada? Utilice un nivel de significancia de 0.01. Asuma
comportamiento normal.
Prueba de hipótesis para dos proporciones

Ejemplo 8
Se comparan dos máquinas de extrusión que fabrican varillas de acero. En una muestra de mil varillas
tomadas de la máquina número 01, 960 satisfacían las especificaciones de longitud y diámetro. En otra
muestra de 600 varillas tomadas de la máquina número 02, 582 cumplían las especificaciones. La máquina
número 02 tiene un costo de operación más alto, por lo que se decide que se usará la máquina número 01
a menos que se demuestre claramente que la máquina número 02 produce mayor proporción de varillas
que satisfacen las especificaciones. Establezca las hipótesis nula y alternativa adecuadas para tomar la
decisión respecto de qué máquina se utilizará.

Ejemplo 9
Se compran resistores etiquetados con 100 Ω a dos distribuidores diferentes. La especificación para este
tipo de resistor es que su resistencia verdadera esté dentro del 2% de su resistencia etiquetada. En una
muestra de 180 resistores del distribuidor A, 150 de éstos satisfacían la especificación. En otra muestra de
270 resistores comprados al distribuidor B, 233 cumplían la especificación. El distribuidor A es el proveedor
actual, pero si los datos demuestran convincentemente que una proporción mayor de los resistores del
distribuidor B satisface la especificación, se hará el cambio. ¿Se debe hacer el cambio?
Ejemplo 10
Para probar la eficacia de los empaques de protección, una compañía envió 1200 órdenes con un
empaque ligero común y 1500 órdenes con un empaque de gran resistencia. De las órdenes enviadas con
el empaque ligero, 20 llegaron deterioradas, mientras que, de las órdenes enviadas con el otro empaque,
15 llegaron deterioradas. ¿Puede concluir que el empaque de gran resistencia reduce la proporción de
órdenes deterioradas?

Ejemplo 11

Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno del día
es diferente al de los trabajadores del turno de la noche. Se toma una muestra de 150 trabajadores de
cada turno. Los resultados muestran 37 trabajadores del turno mañana y 52 del turno nocturno han
faltado por lo menos cinco veces. ¿Qué revelan estos datos sobre la tendencia al ausentismo entre los
trabajadores?
Prueba de hipótesis para dos medias.

Tendremos que considerar dos casos:


1. Muestras independientes.
• Varianzas conocidas.
• Varianzas desconocidas pero distintas.
• Varianzas desconocidas pero iguales.
2. Muestras relacionadas.
z.test(x1,x2, alternative=…, mu=0, sigma.x=…, sigma.y=...)

var.test(x1,x2)

t.test(x1, x2, alternative=…, paired=FALSE, var.equal=FALSE)


Ejemplo 12
Considere que, en una muestra de 41 observaciones de una población con una desviación estándar de la
población de 5, la media muestral es 102. Otra muestra de 51 observaciones de una segunda población
tiene una desviación estándar de la población de 6 y la media muestral es 99. Realice la prueba de
hipótesis de igualdad de medias al nivel de significancia de 0.04.

Ejemplo 13
La compañía Gibbs Baby desea comparar el aumento de peso en bebés que consumen su producto en
comparación con el producto de su competidor. Una muestra de 75 bebés que consumen los productos
Gibbs reveló un aumento de peso medio de 7.6 libras en los primeros tres meses después de nacidos.
Para la marca Gibbs, la desviación estándar de la población es 2.3 libras. Una muestra de 55 bebés que
consumen la marca del competidor reveló un aumento medio en peso de 8.1 libras. La desviación
estándar de la población es 2.9 libras. Con un nivel de significancia de 0.05, ¿es posible concluir que los
bebés que consumieron la marca Gibbs ganaron menos peso?
Ejemplo 14
Se piensa que la concentración de ingrediente activo en un detergente líquido de ropa se ve afectada por el
tipo de catalizador usado en el proceso. Se sabe que no existen mediciones atípicas y que la desviación
estándar de la concentración activa es de 3 gramos por litro, independientemente del tipo de catalizador.
Diez observaciones sobre la concentración se toman con cada catalizador, y los datos siguen:

Ejemplo 15
Dos máquinas se utilizan para llenar botellas de plástico con un volumen neto de 16.0 onzas. Se puede
suponer que el volumen de llenado es normal con la desviación estándar σ1 = 0.020 y σ2 = 0.025 onzas. Un
miembro del personal de ingeniería de calidad sospecha que ambas máquinas llenan el mismo volumen
neto medio, sea o no que este volumen sea 16.0 onzas. Una muestra aleatoria de 10 botellas se toma de la
salida de cada máquina.
Ejemplo 16
En 1908 William Gosset publicó el artículo "The Probable Error of a Mean" bajo el seudónimo de "Student"
(Biometrika, vol. 6, núm. I). El artículo incluyó los datos listados abajo para dos tipos diferentes de semillas
de maíz (comunes y secadas al horno) que se utilizaron en parcelas adyacentes. Los valores listados son
las cosechas de cabezas de maíz o mazorcas en libras por acre.

Ejemplo 17
El artículo “Slender High-Strength RC Columns Under Eccentric Compression” (Magazine of Concrete Res.,
2005: 361-370) dio los datos adjuntos sobre resistencia de cilindros (MPa) de varios tipos de columnas
curadas tanto en condiciones húmedas como en condiciones secas en el laboratorio.

También podría gustarte