Está en la página 1de 27

Prueba de hipótesis

Las secciones anteriores han mostrado cómo puede estimarse un parámetro a


partir de los datos contenidos en una muestra. Puede encontrarse ya sea un
sólo número (estimador puntual) o un intervalo de valores posibles (intervalo de
confianza). Sin embargo, muchos problemas de ingeniería, ciencia,
administración, etc. requieren que se tome una decisión entre aceptar o
rechazar una proposición sobre algún parámetro. Esta proposición recibe el
nombre de hipótesis. Este es uno de los aspectos más útiles de la inferencia
estadística, puesto que muchos tipos de problemas de toma de decisiones,
pruebas o experimentos en el mundo de la ingeniería, pueden formularse como
problemas de prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los


parámetros de una o más poblaciones.

Es importante recordar que las hipótesis siempre son proposiciones sobre la


población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parámetro de la población especificado en la hipótesis nula
se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del


proceso, entonces el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro.
2. Puede obtenerse a partir de alguna teoría o modelo que se relaciona con
el proceso bajo estudio. En este caso, el objetivo de la prueba de
hipótesis es verificar la teoría o modelo.
3. Cuando el valor del parámetro proviene de consideraciones externas,
tales como las especificaciones de diseño o ingeniería, o de
obligaciones contractuales. En esta situación, el objetivo usual de la
prueba de hipótesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisión sobre una hipótesis en particular


recibe el nombre de prueba de hipótesis. Los procedimientos de prueba de
hipótesis dependen del empleo de la información contenida en la muestra
aleatoria de la población de interés. Si esta información es consistente con la
hipótesis, se concluye que ésta es verdadera; sin embargo si esta información
es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse
hincapié en que la verdad o falsedad de una hipótesis en particular nunca
puede conocerse con certidumbre, a menos que pueda examinarse a toda la
población. Usualmente esto es imposible en muchas situaciones prácticas. Por
tanto, es necesario desarrollar un procedimiento de prueba de hipótesis
teniendo en cuenta la probabilidad de llegar a una conclusión equivocada.

La hipótesis nula, representada por Ho, es la afirmación sobre una o más


características de poblaciones que al inicio se supone cierta (es decir, la
"creencia a priori").

La hipótesis alternativa, representada por H1, es la afirmación contradictoria a


Ho, y ésta es la hipótesis del investigador.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la
evidencia muestral sugiere que H o es falsa. Si la muestra no contradice
decididamente a Ho, se continúa creyendo en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis
son rechazar Ho o no rechazar Ho.

Tipos de errores

El error tipo I se define como el rechazo de la hipótesis nula H o cuando ésta es


verdadera. También es conocido como αo nivel de significancia.

Si tuviéramos un nivel de confianza del 95% entonces el nivel de significancia


sería del 5%. Análogamente si se tiene un nivel de confianza del 90% entonces
el nivel de significancia sería del 10%.

El error tipo II ó error β se define como la aceptación de la hipótesis nula


cuando ésta es falsa.

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones


diferentes que determinan si la decisión final es correcta o errónea.

Decisión Ho es verdadera Ho es falsa


Aceptar Ho No hay Error Error tipo II o β
Rechazar Ho Error tipo I o α No hay Error

Tipos de prueba de hipótesis

Bilateral o de dos colas

Ho: µ = µo

H1: µ ≠ µo

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-1.960 0 1.960
X
Unilateral a la derecha

Ho: µ ≤ µo

H1: µ > µo

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.645
X

Unilateral a la izquierda

Ho: µ ≥ µo

H1: µ < µo

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
-1.645 0
X
Pasos para la prueba de hipótesis
1.- Contraste de hipótesis (plantear la Ho y la H 1)
2.- Elegir un nivel de significancia α
3.- Elección del estadístico de prueba (estadístico Z o t)
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
5.- Cálculo del estadístico de prueba
6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)
7.- Conclusión

Ejemplos resueltos
1.- Según experiencias pasadas, se sabe que en una compañía el retardo
promedio por mes de sus obreros es de 64 minutos con una desviación
estándar de 8 minutos. El gerente de la compañía considera que éste promedio
ha aumentado sensiblemente en los últimos meses, por lo cual ordena
efectuar la investigación correspondiente. Para tal fin, se toma una muestra
aleatoria de n=64 obreros y se encuentra que la misma presenta una media de
X́ = 68 minutos. Se pide comprobar si el gerente tiene o no la razón con un
nivel de significación de 0.05.

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H 1)
Ho: µ ≤ 64
H1: µ > 64

2.- Elegir un nivel de significancia: α = 0.05

3.- Elección del estadístico de prueba (estadístico Z o t)


Se conoce la desviación estándar de la población (σ), además que el tamaño
de muestra es lo suficientemente grande
X́−µ
Z= σ
√n
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
El tipo de prueba no lo indica la H1, (H 1: µ > 64) en este caso es unilateral
derecha

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.645
X

5.- Cálculo del estadístico de prueba


X́−µ 68−64
Z= σ = 8 =4
√n √6 4
6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)
Como 4.0 que es el valor de Z calculado, es mayor que el valor de Z según el
criterio de decisión, entonces 4.0 se encuentra en la zona de rechazo, por lo
cual debemos rechazar la hipótesis nula de que el promedio de retardos sigue
siendo de 64 minutos. Por lo tanto, el gerente tiene la razón con un nivel de
significación del 5%.

Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4 El valor de Z
calculado es igual
0.3 a 4, cae en la
región de rechazo
Densidad

0.2 de Ho

0.1

0.05
0.0
0 1.645
X
7.- Conclusión
Con un 95% de confianza se puede concluir que el retardo promedio de los
obreros de la compañía es mayor a 64 minutos.
En Minitab
Estadísticas Estadística básica  Z de 1 Muestra

Seleccionamos datos resumidos

Datos resumidos
Escribimos los datos del problema y después, seleccionamos opciones.

Escribimos los valores del


tamaño de muestra, la media
de la muestra y la desviación
estándar conocida

Aquí escribimos el valor de la


media hipotética, en nuestro
ejemplo 64

Después de escribir los


valores, seleccionamos
opciones
Aquí escribimos el nivel de
confianza

En este recuadro vamos a


poner lo de la hipótesis
alternativa (En nuestro

ejercicio es >)

Nivel de confianza, 95%

Hipótesis alterna, Media >


media hipotética

Le damos clic en aceptar y


aceptar
El valor de Z=4, es
igual al que
calculamos en Excel

Para tomar una decisión con


respecto a Ho es, si p ≤ α, se
rechaza la Ho, con este
valor de p, realizamos la
misma decisión que con el
valor crítica de Z

2.- Una muestra aleatoria de 20 bandas para motores de ciertas sierras


circulares presentaron un promedio de duración de 1.08 años con una
desviación estándar de 0.5 años. Se sabe por experiencia que dichas bandas
han durado en promedio 1.28 años y que la duración de las bandas se
distribuye normalmente. ¿Existe razón para considerar tal disminución, como
una pérdida de calidad en la fabricación? Nivel de significación 5%.

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H 1)
Ho: µ ≥ 1.28
H1: µ < 1.28
2.- Elegir un nivel de significancia α = 0.05
3.- Elección del estadístico de prueba (estadístico Z o t)
No se conoce la desviación estándar de la población (σ), además que el
tamaño de muestra es pequeño
X́−µ
t= s
√n
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
El tipo de prueba no lo indica la H1, (H 1: µ < 1.28) en este caso es unilateral
izquierda. Usamos la distribución t con v grados de libertan (n-1= 20 -1=19) y
α(0.05)

Gráfica de distribución
T, df=19
0.4

0.3
Densidad

0.2

0.1

0.05
0.0
-1.729 0
X

5.- Cálculo del estadístico de prueba


X́−µ 1.08−1.28
t= s = .05
√ 20
= -1.79
√n
6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)
Como -1.79 que es el valor de t calculado, es menor que el valor de t según el
criterio de decisión, entonces -1.79 se encuentra en la zona de rechazo, por lo
cual debemos rechazar la hipótesis nula de que el promedio es mayor o igual a
1.28 y se acepta la hipótesis alternativa de que la calidad de en la fabricación si
disminuyó.
7.- Conclusión
Con un 95% de confianza se puede concluir que el promedio de duración de
las bandas es menor a 1.28 años.
En Minitab
Estadísticas Estadística básica  t de 1 Muestra
Datos resumidos
Escribimos los valores del
tamaño de muestra, la media
de la muestra y la desviación
estándar conocida

Aquí escribimos el valor de la


media hipotética, en nuestro
ejemplo 1.28

Después de escribir los


valores, seleccionamos
opciones

Aquí escribimos el nivel de


confianza

En este recuadro vamos a


poner lo de la hipótesis
alternativa (En nuestro

ejercicio es <)
El valor de t=-1.79, es
igual al que
calculamos en Excel

Para tomar una decisión con


respecto a Ho es, si p ≤ α, se
rechaza la Ho, con este
valor de p, realizamos la
misma decisión que con el
valor crítica de Z

PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS

En la práctica, se presenta una diversidad de problemas en la industria


y en las ciencias sociales que nos sugieren confrontar cual de dos procesos
es mejor que el otro a la luz de la media que arroja cada uno de ellos. Se nos
podría ocurrir por ejemplo: a) verificar si el consumo de gasolina entre dos
marcas de vehículos se puede considerar idéntico o por el contrario una marca
es más económica que otra, b) Verificar si los salarios de la industria
metalúrgica se pueden considerar o no superiores a los salarios de la industria
textil en una región, c) Verificar si el contenido de determinada sustancia
en un artículo fabricado por una compañía A es inferior o no al
contenido de dicha sustancia en el mismo artículo fabricado por una
compañía B de la competencia. etc.

Con el fin de resolver las pruebas de hipótesis para la diferencia de medias,


debemos tener en cuenta el mismo procedimiento y las mismas reglas que
seguimos para las pruebas de hipótesis para la media.

Las fórmulas para el cálculo de los estadísticos “z” y “t”, son las mismas
empleadas en el cálculo de los intervalos de confianza para la diferencia de
medias en el capítulo anterior.
En cuanto a la distribución en el muestreo de la diferencia de medias,
recordemos los siguientes tres casos:

1) Si las dos poblaciones son normales, las diferencias de las medias


muestrales también se distribuirán normalmente cualquiera sea el tamaño de
las muestras. No obstante, si no se conocen las desviaciones estándar
poblacionales (σ1 y σ2), éstas pueden ser reemplazadas por la desviaciones
estándar de las muestras (S 1 y S2), si los tamaños de las muestras son
mayores que 30 (n1>30 y n2>30 o n1+n2>60).

2) Según el teorema central del límite, si las dos poblaciones no son


normales o no sabemos si se cumple o no éste comportamiento, las
diferencias de las medias muestrales se distribuirán aproximadamente
como una distribución normal, si los tamaños de las muestras son
mayores que 30 (n1>30 y n2>30 o n1+n2>60)

3) Si las dos poblaciones son normales o están muy cerca de éste


comportamiento y por otra parte no conocemos la desviaciones estándar
poblacionales y además los tamaños de las muestras son menores que 30
(n1<30 y n2<30 o n1+n2<60), entonces, las diferencias de las medias
muestrales se distribuirán de acuerdo a la ley t-student.

Por ejemplo una hipótesis nula podría plantearse como sigue: Ho: µ 1 - µ2 = 0 ó
Ho: µ1 = µ2 y en ambos casos la hipótesis alternativa podría ser µ 1 - µ2 ≠ 0 ó µ1
- µ2 > 0 o µ1 - µ2 < 0. Si la hipótesis nula se plantea como µ 1 - µ2 = A (siendo A
un valor cualquiera), entonces, las hipótesis alternativas serían las mismas que
las anteriores pero cambiando el valor de cero por el valor de A.

PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON


VARIANZA CONOCIDA.

Ejemplo

Un equipo de investigadores desea saber si los datos que han recolectado


proporcionan la evidencia suficiente para indicar una diferencia entre las
concentraciones medias de ácido úrico en el suero de individuos normales e
individuos con síndrome de Down. Los datos consisten en las lecturas de ácido
úrico en el suero de 12 individuos con síndrome de Down y 15 individuos
sanos. Las medias son X́ 1 = 4.5 mg /100 ml y X́ 2 =3.4 mg/ml.

Los datos corresponden a dos muestras aleatorias simples e independientes,


cada una extraída de una población que sigue una distribución normal, con una
varianza (σ 12) igual a 1 para la población con síndrome de Down, y de (σ 22) 1.5
para la población sana.

Se podrá decir que los datos ofrecen evidencia de que las medias
poblacionales son diferentes.

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H 1)
Ho :µ1 = µ2
H1 :µ1 ≠ µ2
2.- Elegir un nivel de significancia α = 0.05

3.- Elección del estadístico de prueba (estadístico Z o t)

Z = ( X́ − X́ )−¿ ¿
1 2

4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral


izquierda)
El tipo de prueba no lo indica la H1: (H 1: µ ≠ 1.28) en este caso es bilateral.
Usamos la distribución Z y α(0.05)
Gráfica de distribución
Normal, Media=0, Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-1.960 0 1.960
X

5.- Cálculo del estadístico de prueba


( 4.5−3.4 )−0
Z = ( X́ − X́ )−¿ ¿= Z = 1 1.5 2.57
1 2

√ +
12 15

En Excel

6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)


Se rechaza Ho porque 2.57 > 1.96.
7.- Conclusión
Con un 95% de confianza se concluye que, de acuerdo con estos datos, hay
indicios de que las medias de las poblaciones son diferentes.

PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON


VARIANZAS DESCONOCIDAS E IGUALES.

Ejemplo

Un estudio de los investigadores Eidelman et al. tiene como objetivo examinar


las características de destrucción pulmonar en personas que fuman cigarros
antes de desarrollar un marcado enfisema pulmonar. Se practicaron
mediciones de tres índices de destrucción pulmonar en los pulmones de
personas longevas que no fumaban y en personas con tabaquismo que
murieron repentinamente fuera del hospital por causas no respiratorias. Una
calificación alta indica un mayor daño pulmonar. En la tabla se muestran las
calificaciones producidas para uno de los índices de destrucción pulmonar de
una muestra de nueve personas que no fuman y 16 fumadores. Se pretende
saber si es posible concluir, con base en los datos, que las personas que sí
fuman, en general, tienen los pulmones más dañados que las personas no
fumadoras, como lo indican las mediciones.

Los datos corresponden a dos muestras aleatorias simples e independientes;


una muestra corresponde a la población de personas que no fuman (NF), y la
otra a la población de fumadores (F). Las calificaciones para los índices de
destrucción pulmonar en ambas poblaciones siguen una distribución
aproximadamente normal. No se conocen las varianzas poblacionales, pero se
supone que son iguales.

No fumadores 18.1 6 10.8 11 7.7 17.9 8.5 13 18.9


16.6 13.9 11.3 26.5 17.4 15.3 15.8 12.3 18.6
Fumadores
12 24.1 16.5 21.8 16.3 23.4 18.8

Pasos para la prueba de hipótesis


1.- Contraste de hipótesis (plantear la Ho y la H 1)
Ho :µF ≤ µNF
H1 :µF > µNF

2.- Elegir un nivel de significancia α = 0.05

3.- Elección del estadístico de prueba (estadístico Z o t)

t =( X́ ¿ ¿1− X́ )−¿ ¿ ¿ 2

(n¿¿ 2−1) s 22
sp = (n¿ ¿1−1) s 21 +
n1 +n 2−2
¿¿

ν = n1 + n2 – 2 (grados de libertad)
4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral
izquierda)
El tipo de prueba no lo indica la H1, (H1: µF > µNF) en este caso es unilateral
derecha. Como estamos usando el estadístico t, usamos un α = 0.05 y con n1
+ n2 -2 grados de libertad; en este ejemplo sería, 16 + 9 – 2 = 23

Gráfica de distribución
T, df=23

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.714
X

5.- Cálculo del estadístico de prueba


(n¿¿ 2−1)s 22
sp = √ 2
(n ¿¿1−1) s +
1
n 1+ n2−2
¿¿

(16−1)4.47522 +(9−1) 4.84922


sp = √ 16+9−2
= 4.6088

( 17.538−12.433 )−0
t =( X́ − X́ )−¿ ¿ = 1 1 2.66
1 2


4.6088 +
16 9

6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)


Se rechaza Ho porque 2.66 > 1.714, es decir, 2.66 está dentro de la región de
rechazo
7.- Conclusión
Con base en estos resultados, se puede concluir que las dos medias
poblacionales son diferentes, es decir, se concluye que, según indican los
índices del estudio, las personas que sí fuman tienen los pulmones más
dañados que las personas que no fuman, a un nivel de confianza de 95%
En Minitab
1.- Estadística  Estadística básica  t de 2 muestras

Copiamos los valores en el orden


que queremos la prueba de
hipótesis
Seleccionamos la opción, Cada
muestra está en su columna

Le damos clic en el
primer cuadro, (Muestra
1) y la damos doble clic
en F y repetimos, pero
ahora en Muestra 2

Enseguida
seleccionamos Opciones
Ponemos el Nivel de
confianza

La diferencia hipotética,
en este ejemplo es cero

En Hipótesis alterna, en este


ejemplo es, Diferencia > Diferencia
hipotética

Seleccionamos Asumir
varianzas iguales

Y le damos clic en aceptar y de nuevo aceptar, y el


programa nos arroja los resultados

Observamos que los


valores que sean
coherentes

Aquí está el valor de T,


que es igual al que se
calculó antes, y los
grados de libertad

Para tomar una decisión con respecto a Ho


es, si p ≤ α, se rechaza la Ho, con este
valor de p, realizamos la misma
decisión que con el valor crítica de Z

PRUEBAS DE HIPÓTESIS PARA


LA DIFERENCIA DE MEDIAS CON VARIANZAS DESCONOCIDAS Y
DIFERENTES.

Ejemplo

Un grupo de investigadores quiere saber si las poblaciones difieren con


respecto al valor medio de la actividad del complemento del suero total (C H50).
Los datos se componen de las mediciones de C H50 en n1 = 10 individuos
aparentemente sanos y n2 = 20 individuos enfermos. Las medias de las
muestras y desviaciones estándar son:
X́ 1 = 62.6, S1 = 33.8

X́ 2 = 47.2, S2 = 10.1

Los datos corresponden a dos muestras aleatorias independientes; una


extraída de una población de sujetos aparentemente normales, y la otra
seleccionada de una población de individuos enfermos. Se supone que los
valores de CH50 siguen una distribución aproximadamente normal en ambas
poblaciones. Las varianzas de las poblaciones se desconocen y son diferentes.
Pasos para la prueba de hipótesis
1.- Contraste de hipótesis (plantear la Ho y la H 1)
1.- Contraste de hipótesis (plantear la Ho y la H 1)
Ho :µ1 = µ2
H1 :µ1 ≠ µ2

2.- Elegir un nivel de significancia α = 0.05

3.- Elección del estadístico de prueba (estadístico Z o t)

t = ( X́ − X́ )−¿ ¿
1 2

2
s 21 s22
( +
n 1 n2 )
ν= s21
2
s 22
2
Redondeo hacía abajo al entero más cercano
( ) ( )
n1
+
n2
n 1−1 n2−1

4.- Tipo de prueba de hipótesis (bilateral, unilateral derecha o unilateral


izquierda)
El tipo de prueba no lo indica la H1 (H 1: µ1 ≠ µ2 ) en este caso es bilateral.
Usamos la distribución t con ν grados de libertad y α(0.05).
2
33.82 10.12
( 10
+
20 )
ν= 33.8 2 10.12
2 2
= 9.81≈ 9
( ) ( )
10
+
20
10−1 20−1
Gráfica de distribución
T, df=9
0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-2.262 0 2.262
X

5.- Cálculo del estadístico de prueba

( 62.6−47.2 )−0
t = ( X́ − X́ )−¿ ¿ = 33.8 2 10.12 = 1.41
1 2

√ 10
+
20
6.- Tomar una decisión sobre Ho (se rechaza o no se rechaza)
Puesto que -2.262 < 1.41 < 2.262, no es posible rechazar H
7.- Conclusión
Con base en estos resultados, no se puede concluir que las dos medias de las
poblaciones son diferentes a un nivel de significancia α = 0.05
En Minitab
1.- Estadística  Estadística básica  t de 2 muestras
Seleccionamos
Datos resumidos

Escribimos los
valores
correspondientes
en cada recuadro

Seleccionamos
opciones

Seleccionamos el
Nivel de confianza

En hipótesis alterna
seleccionamos
Diferencia ≠ diferencia
hipotética

No se asumen
varianzas iguales

Le damos clic en aceptar y de nuevo clic en aceptar, y el programa nos


presenta los resultados
Observamos que los
valores sean iguales

Aquí está el valor de T,


que es igual al que se
calculó antes, y los
grados de libertad

Para tomar una decisión con respecto a Ho


es, si p ≤ α, se rechaza la Ho, con este
valor de p, realizamos la misma
decisión que con el valor crítica de Z,
no se rechaza la Ho

También podría gustarte