Está en la página 1de 42

Muestreo y Diseño de Experimentos

Pruebas de Hipótesis

Dra. Gabriela Vargas González


Pruebas de Hipótesis: Teoría de las
decisiones
Introducción
Mediante las técnicas de muestreo probabilístico estudiadas, se
mostró cómo se puede estimar un parámetro a partir de los datos
contenidos en una muestra. Puede encontrarse ya sea un sólo
número (estimación puntual) o un intervalo de valores posibles
(estimación por intervalos de confianza).

Sin embargo, en situaciones prácticas, una inferencia estadística


puede comprender, tanto la estimación de un parámetro poblacional
mediante la técnica estadística de estimación de parámetros, como la
toma de decisiones a partir del valor del parámetro, mediante la

técnica estadística de prueba de hipótesis.


Por ejemplo:

Si una compañía farmacéutica está produciendo antibiótico en un


tanque de fermentación, se pueden usar muestras del tanque para
estimar la potencia media,  , de todo el antibiótico del tanque.

En contraste, es posible que la compañía no esté interesada en


estimar la potencia media exacta del antibiótico, sino sólo satisfacer
los estándares de potencia mínimos permitidos por el gobierno
(normatividad).

Entonces la compañía puede usar muestras del tanque para decidir


entre estas tres posibilidades:

• La potencia media  es igual a la potencia mínima permisible.

• La potencia media  no excede la potencia mínima permisible.

• La potencia media  excede la potencia mínima permisible.


Muchos problemas de ingeniería, ciencia, y administración, requieren
que se tome una decisión entre aceptar o rechazar una proposición
sobre algún parámetro de la población. Esta proposición recibe el
nombre de hipótesis.

Este es uno de los aspectos más útiles de la inferencia estadística,


puesto que muchos tipos de problemas de toma de decisiones,
pruebas o experimentos en el mundo de la ingeniería, pueden
formularse como problemas de prueba de hipótesis.

Una hipótesis estadística es una proposición (supuesto) sobre los


parámetros de la población con el propósito de probar su validez.

La prueba de hipótesis es una técnica estadística en la que, a


partir de una o mas muestras aleatorias se toma la decisión de
rechazar o no una proposición (hipótesis) asumiendo un riesgo
(probabilidad de error) de equivocarse al tomar la decisión.
La proposición que se desea probar, se denomina hipótesis nula y
se representa por H0.

Si se rechaza la hipótesis nula, la conclusión que se debe aceptar se


llama hipótesis alternativa y se simboliza por H1.

Por ejemplo:

Supóngase que se quiere probar la hipótesis de que la potencia


media del antibiótico que produce una compañía farmacéutica
satisface los estándares de potencia mínimos permitidos legalmente.

La hipótesis nula se establece como sigue:

H0 :   la potencia mínima permisible

La hipótesis alternativa se puede interpretar de tres maneras:

H1 :   la potencia mínima permisible


H1 :   la potencia mínima permisible
H1 :   la potencia mínima permisible
Es importante recordar que las hipótesis siempre son proposiciones
sobre la población o distribución bajo estudio, no proposiciones
sobre la muestra.

Por lo general, el valor del parámetro de la población especificado en la


hipótesis nula se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del


proceso, entonces el objetivo de la prueba de hipótesis usualmente
es determinar si el valor del parámetro si ha cambiado.

2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona


con el proceso bajo estudio. En este caso, el objetivo de la prueba
de hipótesis es verificar la teoría o modelo.

3. Cuando el valor del parámetro proviene de consideraciones externas


tales como las especificaciones de diseño o ingeniería, o de la
normatividad vigente. En esta caso, el objetivo usual de la prueba de
hipótesis es probar el cumplimiento de las especificaciones o de
la normatividad.
Pasos para realizar una prueba de hipótesis

Paso 1. Establecer la hipótesis nula y la alternativa

Paso 2. Seleccionar el nivel de significancia

Paso 3. Identificar el estadístico de prueba

Paso 4. Formular la regla de decisión para el  seleccionado

Paso 5. Tomar una muestra y llegar a una decisión

No rechazar la hipótesis nula Rechazar la nula y aceptar la alternativa


PRUEBA DE HIPOTESIS: Hipótesis nula y alternativa

La hipótesis nula (H0) La hipótesis alternativa (H1)

Es la hipótesis que el procedimiento Sirve para contrastar la hipótesis


estadístico somete a prueba. Se nula. También se le conoce como la
plantea esperando ser rechazada hipótesis de investigación y es la que
(que los datos de la muestra no la se espera sea apoyada por los datos
apoyen) de la muestra.

Es una proposición que no se Es una proposición que se acepta


rechaza a menos que los datos de solo si los datos de la muestra
la muestra proporcionen evidencia proporcionan evidencia suficiente
convincente de que es falsa. de que la hipótesis nula es falsa.

El planteamiento de la hipótesis nula El planteamiento de la hipótesis


siempre contiene un signo de alternativa nunca contiene un signo
igualdad con respecto al valor de igualdad con respecto al valor
especificado del parámetro. especificado del parámetro.

H0 :  =  0 H1:   0
H 1:  >  0
H 1:  < 
PRUEBA DE HIPOTESIS: Tipos de errores

Cuando se toma una decisión basada en información muestral, se


pueden cometer errores con respecto a la situación real de H0. 
PRUEBA DE HIPOTESIS: Tipos de errores

Error tipo I. Corresponde al “riesgo de equivocarse y rechazar la hipótesis


nula cuando es verdadera” y es el nivel de significancia  (alfa) de la
prueba. Este nivel esta bajo el control de la persona que realiza la prueba.
Generalmente se eligen valores de 0.05 y 0.01. Así si por ejemplo si se escoge
el nivel de 0.05 entonces se dice que hay 5 oportunidades sobre 100 de
rechazar una hipótesis nula H0 cuando esta debe ser aceptada.

El nivel de confianza (1 - ). indica la probabilidad de aceptar la hipótesis


nula cuando es verdadera. Con un nivel de confianza del 95%, el nivel de
significancia  es del 5% (0.05). Análogamente si se tiene un nivel de confianza
 del 99% entonces el nivel de significancia es del 1% (0.01).

Error tipo II. Corresponde al “riesgo de equivocarse y aceptar la hipótesis


nula cuando es falsa”. Se denota con la letra griega β (beta) y generalmente
se acepta un valor de 0.2 (20%).

El grado de potencia o valor predictivo (1 - ). Indica la probabilidad de


rechazar la hipótesis nula cuando es falsa. Con un grado de potencia del 80
%, el valor de β es del 20% (0.2).
PRUEBA DE HIPOTESIS: Tipos de errores

H0 Verdadero H0 Falso

Nivel de confianza Grado de potencia


0.95 o 95% 0.8 o 80%

 Zonas de error
α o nivel de significancia
0.2 o 20% 0.05 o 5%
 = 4
PRUEBA DE HIPOTESIS: Tipos de errores

En resumen, en una prueba de hipótesis existen cuatro probabilidades


condicionales. Estas son:

α = probabilidad de rechazar H0, cuando H0 es cierta

1-α = probabilidad de no rechazar H0, cuando H0 es cierta

β = probabilidad de no rechazar H0, cuando H0 es falsa

1-β = probabilidad de rechazar H0, cuando H0 es falsa


PRUEBA DE HIPOTESIS: Tipos de errores

Los errores tipo I y tipo II están relacionados.

1. Una disminución en la probabilidad de uno, aumenta la probabilidad


del otro.

2. Un aumento en el tamaño muestral n reduce  y  de forma


simultánea.
PRUEBA DE HIPOTESIS: Tipos de errores

En la práctica, un tipo de error puede ser más importante que


otro, el investigador tiene que definir el nivel de error que
arriesga, con el fin de limitar el error más importante.

Por ejemplo: Supóngase que cometer un error de tipo I implica el


tiempo, el trabajo y el costo de reelaborar un lote de sustancias
químicas que debería haber sido aceptado. Por otro lado, incurrir en
un error de tipo II significa correr el riesgo de envenenar a un grupo
entero de usuarios de la sustancia.

La gerencia de esta compañía preferiría el error de tipo I al de


tipo II y, en consecuencia, establecería niveles de significancia
 altos en sus pruebas para conseguir  bajas.
PRUEBA DE HIPOTESIS: Nivel de significancia

La distribución de muestreo del estadístico de prueba se divide en dos regiones:

 Región de rechazo de la hipótesis nula (conocida como región crítica).

 Región de no rechazo (aceptación) de la hipótesis nula.

El valor crítico es el valor que


separa a la región de aceptación
de H0 de las áreas de rechazo de
H0. Estos valores se obtienen de
las tablas estadísticas según el
nivel de significancia , el
número de colas y/o los grados
de libertad del estadístico que se
vaya a utilizar (tcrit., Zcrit., etc.).

Algunos valores críticos de Z y t


usados en las pruebas de hipótesis
PRUEBA DE HIPOTESIS:
Nivel de significancia
La región crítica o de rechazo del
estadístico de prueba dependerá
del tipo de hipótesis alternativa
formulada para el problema de
estudio:

 Si H1: entonces la región de


rechazo se encuentra en la cola
izquierda.

 Si H1: entonces la región de


rechazo se encuentra en la cola
derecha.

 Si H1: entonces la región de


rechazo se divide en dos partes,
una parte estará en la cola
derecha y la otra en la cola
izquierda.
PRUEBA DE HIPOTESIS: Estadístico de prueba

Toda prueba de hipótesis estadística está asociada a un modelo estadístico,


denominado estadístico de prueba. Este modelo está en función del
tamaño de la muestra y depende del parámetro poblacional en el que se
basa la prueba de hipótesis estadística (varianza, media, proporción, etc.).
La probabilidad calculada con los datos de la muestra a través del
estadístico de prueba, se compara con el valor crítico obtenido de las
tablas estadísticas, para tomar la decisión de rechazar o no la hipótesis
nula.

Los estadísticos de prueba que generalmente se utilizan en las pruebas de


hipótesis paramétricas son:

 La distribución normal Z (para probar medias y proporciones).

 La distribución t-student (para probar medias).

 La distribución chi-cuadrada (para probar varianzas).

 La distribución F de Fisher-Snedecor (para probar varianzas).


PRUEBA DE HIPOTESIS: Estadístico de prueba

Características de la distribución t-Student:

 Es continua, campanular, y simétrica


como la distribución Z.

 Existe una familia de distribuciones t


para cada tamaño de muestras con
media cero, pero con diferentes
desviaciones estándar.

 La distribución t es más aplanada y


de colas más largas que la Z.

 Tiende a la Z para tamaños grandes


de muestra.
8-12
PRUEBA DE HIPOTESIS: Estadístico de prueba

CASO 1. Cuando se plantean hipótesis para la media de la población y la


desviación estándar poblacional es conocida o el tamaño de la muestra
es grande ( 30), el estadístico de prueba está dado por:

 
PRUEBA DE HIPOTESIS: Estadístico de prueba

CASO 2. Cuando se plantean hipótesis para la media de la población y la


desviación estándar poblacional es desconocida y el tamaño de la
muestra es pequeño ( 30), el estadístico de prueba está dado por:
 

 
 
PRUEBA DE HIPOTESIS: Estadístico de prueba

CASO 3: Cuando se plantean hipótesis para la proporción de la población


en muestras grandes ( 30), el estadístico de prueba está dado por:
 

 
C
PRUEBA DE HIPOTESIS: Estadístico de prueba

CASO 4: Cuando se plantean hipótesis para la diferencia de medias de dos


poblaciones y las desviaciones estándar poblacionales son conocidas o el
tamaño de las muestras es grande, el estadístico de prueba está dado por:
 

 
PRUEBA DE HIPOTESIS: Estadístico de prueba

CASO 5. Cuando se plantean hipótesis para la diferencia de medias de dos


poblaciones y las desviaciones estándar poblacionales son desconocidas
pero iguales (por varianzas muestrales poco diferentes) y el tamaño de la
muestra es pequeño, el estadístico de prueba está dado por:
 

 
 
 
PRUEBA DE HIPOTESIS: Estadístico de prueba

CASO 6: Cuando se plantean hipótesis para la diferencia de medias de dos


poblaciones y las desviaciones estándar poblacionales son desconocidas,
distintas (por varianzas muestrales diferentes) y el tamaño de la muestra
es pequeño, el estadístico de prueba está dado por:
 

 
PRUEBA DE HIPOTESIS: Estadístico de prueba

CASO 7: Cuando las muestras están relacionadas y se quiere probar si luego


de aplicar un tratamiento las medias difieren (antes/después) y las
desviaciones estándar poblacionales son desconocidas y el tamaño de la
muestra es pequeño, el estadístico de prueba está dado por:

;
 
Continuación CASO 7…

 
PRUEBA DE HIPOTESIS: Reglas de decisión
Se selecciona la probabilidad de error de tipo I o nivel de significancia α
Se encuentra el valor crítico del estadístico de prueba de acuerdo al nivel de
significancia seleccionado a partir de las tablas estadísticas correspondientes:
Zcrit en la tabla de distribución normal estándar o tcrit en la tabla de la
distribución t de Student.
Se obtiene el valor del el estadístico de prueba para la muestra (Zobt, tobt)
Si de acuerdo con el tipo de hipótesis alternativa planteada, Z o t caen en la
región crítica, se rechaza la hipótesis nula y se acepta la hipótesis alternativa.
PRUEBA DE HIPOTESIS: Reglas de decisión
Valor P
Valor de
La decisión de rechazar o aceptar H0 se toma al Zcrit con
comparar el valor calculado con el valor crítico del  = 0.05
estadístico de prueba basado en el nivel de
significancia seleccionado. Sin embargo,
Valor de
diferentes niveles de significancia pueden llevar a
Zcrit con
diferentes conclusiones.  = 0.01
Por ejemplo, si en una prueba de cola derecha, el
estadístico de prueba es Zobt = 2.03, se puede
rechazar H0 al nivel de significancia  = 0.05
porque el estadístico de prueba es mayor que el
de Zcrit = 1.645. Sin embargo, no se puede
rechazar H0 al nivel de significancia  = 0.01
porque el estadístico de prueba es menor que el
de Zcrit = 2.33.

Para evitar ambigüedades en las conclusiones, Valor de Zobt a partir de


algunos investigadores prefieren usar un nivel de los datos de la muestra
significancia variable llamada valor p o «p-valor».
PRUEBA DE HIPOTESIS: Reglas de decisión

El p-valor o nivel de significancia observado de una prueba estadística es


el valor más pequeño de  para el cual la hipótesis nula se puede
rechazar; es el riesgo real de cometer un error tipo I si la hipótesis nula
es rechazada con base en el valor observado del estadístico de prueba;
mide la fuerza de la evidencia contra la hipótesis nula:
PRUEBA DE HIPOTESIS: Reporte de resultados

Los p-valores con frecuencia se usan en informes de resultados


estadísticos:

a) Si el p-valor es mayor a 0.05, los resultados se publican como


«ns», es decir, no significativos, al nivel de 5%.

b) Si el p-valor se encuentra entre 0.05 y 0.01, los resultados se


publican como P  0.05 que es significativo al nivel de 5%.

c) Si el p-valor se encuentra entre 0.01 y 0.001, los resultados se


publican como P  0.01 que es “altamente significativo” o
significativo al nivel de 1%.

d) Si el p-valor es menor de 0.001, los resultados se publican como P


 0.001, es decir, “muy altamente significativos” o significativos al
nivel de 0.1%.
Resumen de
pasos para
la prueba de
hipótesis
paramétrica
de muestras
grandes.
Ejercicios de aplicación

1. La producción diaria para una planta química local ha promediado


880 toneladas en los últimos años. A la gerente de control de
calidad le gustaría saber si este promedio ha cambiado en meses
recientes. Ella selecciona al azar 50 días de entre la base de datos
y calcula el promedio de 871 toneladas y desviación estándar de 21
toneladas a partir de las 50 producciones. Pruebe la hipótesis
apropiada usando un nivel de significancia del 5 %.
2. Una empresa procesadora de alimentos congelados afirma que el
peso promedio neto por paquete de un alimento es de 30 onzas. La
experiencia ha demostrado que los pesos están distribuidos en
forma aproximadamente normal, con una desviación típica de 1.5
onzas. Una muestra aleatoria de 35 paquetes arroja un peso
promedio de 29.4 onzas. ¿Constituye esto suficiente evidencia
como para concluir que el peso promedio verdadero de los
paquetes ha disminuido? Sea = 0.05
3. Los estándares establecidos por dependencias del gobierno
indican que los estadounidenses no deben exceder una ingesta
diaria de sodio con promedio de 3300 miligramos (mg). Para
averiguar si los estadounidenses están excediendo este límite, se
seleccionó una muestra de cien de ellos y se encontró que la
media y desviación estándar de ingesta diaria de sodio era de 3400
mg y 1100 mg, respectivamente. Use = 0.05 para efectuar una
prueba de hipótesis.
4. La tasa de producción promedio de los fusibles de 5 amperios en
Neary Co. Eléctrico es de 250 por hora. Se ha comprado e
instalado una máquina nueva que, según el proveedor, aumentará
la tasa de la producción. Una muestra de 10 horas seleccionadas
al azar a partir del mes pasado reveló que en promedio, la
producción por hora con la máquina nueva fue de 256 unidades,
con una desviación estándar de 6 por hora ¿En el nivel de
significancia del 5 % Neary puede concluir que la máquina nueva
es más rápida?
5. Un nuevo proceso para producir diamantes sintéticos sólo puede
funcionar a un nivel rentable si el peso promedio de los diamantes
que se obtengan es mayor que 0.50 quilates. Para evaluar la
rentabilidad del proceso se generan seis diamantes cuyos pesos
son 0.46; 0.61; 0.52; 0.48; 0.57 y 0.54 quilates. La media y la
desviación estándar de los seis pesos de los diamantes son 0.53 y
0.0559, respectivamente ¿Las seis mediciones proporcionan
suficiente evidencia de que el peso promedio de los diamantes que
se obtienen con este proceso sobrepasa los 0.5 quilates? Use un
nivel de significancia de 1 %.
6. El fabricante de una patente médica sostiene que la misma, tiene
un 90 % de efectividad en el alivio de una alergia, por un periodo de
8 horas. En una muestra de 200 individuos que tenían la alergia, la
medicina suministrada alivió a 160 personas. Determinar si la
aseveración del fabricante es cierta. Utilice un nivel de significancia
de 0.01.
7. Un diseñador de productos está interesado en reducir el tiempo
de secado de una pintura tapaporos. Se prueban dos fórmulas de
pintura; la fórmula 1 tiene el contenido químico estándar, y la
fórmula 2 tiene un nuevo ingrediente secante que debe reducir el
tiempo de secado. De la experiencia se sabe que la desviación
estándar del tiempo de secado es ocho minutos, y esta
variabilidad inherente no debe verse afectada por la adición del
nuevo ingrediente. Se pintan diez especímenes con la fórmula 1,
y otros diez con la fórmula 2. Los dos tiempos promedio de
secado muestrales son 121 min y 112 min respectivamente. ¿A
qué conclusiones puede llegar el diseñador del producto sobre la
eficacia del nuevo ingrediente, utilizando ?
8. Se llevó a cabo un experimento para comparar el desgaste por
abrasivos de dos diferentes materiales laminados. Se probaron 12
piezas del material 1, exponiendo cada pieza a una máquina para
medir el desgaste. Se probaron 10 piezas del material 2 de manera
similar. En cada caso se observó la profundidad del desgaste. Las
muestras del material 1 revelaron un desgaste promedio (codificado)
de 85 unidades con una desviación estándar muestral de 4; en tanto
que las muestras del material 2 revelaron un promedio de 81 y una
desviación estándar muestral de 5 ¿Se podrá concluir, a un nivel de
significancia de 0.05, que el desgaste abrasivo del material 1 excede
al del material 2 en más de 2 unidades? Suponga que las poblaciones
son aproximadamente normales con varianzas iguales.
 

( 𝑥1 − 𝑥 2 ) − ( 𝜇1 − 𝜇 2)
𝑡 𝑜𝑏𝑡 = ≈ 𝑡 𝑔𝑙=𝑛


+𝑛 2 −2

( )
1

2 1 1
𝑠𝑝 +
𝑛1 𝑛 2
9. En un estudio inmunológico, los investigadores desgarraron la
piel de dos lotes de ratones. El primer lote de 10 ratones no
recibió ningún tratamiento. El segundo lote de 10 ratones, ha
sido tratado por un antígeno de trasplante incubado en suero
normal. La sobrevivencia de ratones fue medida en días y los
resultados de esta experiencia son los siguientes:

( 𝑥1 − 𝑥 2 ) − ( 𝜇1 −𝜇 2)
𝑡 𝑜𝑏𝑡 = ≈ 𝑡 𝑔𝑙=𝑣
√ 𝑠 /𝑛 +𝑠 /𝑛
2
1 1
2
2 2

Se plantea la pregunta de saber si a un nivel de significancia


del 0.5 % (0.005), la sobrevivencia de los ratones se prolonga
con el tratamiento.
Ejercicio 10. En un estudio realizado por el Departamento de Nutrición
Humana y Alimentos del Instituto Politécnico se registraron los siguientes
datos acerca de la comparación de residuos de ácido sórbico, en ppm, en
jamón inmediatamente después de sumergirlo en una solución de ácido y
después de 60 días de almacenamiento:
Residuos de ácido sórbico en jamón (ppm)
Antes del Después del
Rebanada
almacenamiento almacenamiento
1 224 116
2 270 96
3 400 239
4 444 329
5 590 437
6 660 597
7 1400 689
8 680 576

Si se supone que las poblaciones se distribuyen normalmente, ¿hay


suficiente evidencia, al nivel de significancia de 0.05, para decir que la
duración del almacenamiento influye en las concentraciones residuales
de ácido sórbico?

También podría gustarte