INSTITUTO TECNOLOGICO SUPERIOR DE
TANTOYUCA
PRUEBAS DE HIPOTESIS
para la Materia:
ESTADISTICA ADMINISTRATIVA I
UNIDAD V
PRESENTA:
MARINA BAUTISTA SANTIAGO
N° DE CONTROL
213S0111
TITULAR DE LA MATERIA
BLANCA ISABEL HERNANDEZ LARA
TANTOYUCA, VER A 06 DE JUNIO DEL 2022
5.1 Hipótesis estadísticas. Conceptos generales.
Una hipótesis estadística es un enunciado acerca de la distribución de
probabilidad de una variable aleatoria. Las hipótesis estadísticas a menudo
involucran uno o más características de la distribución, como por ejemplo forma o
independencia de la variable aleatoria.
Es importante recordar que las hipótesis son siempre enunciados relativos a la
población o distribución bajo estudio, no enunciados en torno a la muestra. El valor
del parámetro de la población especificado en la hipótesis suele determinarse de
una de tres maneras:
a. Puede resultar de la experiencia o conocimientos pasados del proceso,
o incluso de experimentación previa. El objetivo entonces de la prueba de
hipótesis suele ser entonces determinar si la situación experimental ha cambiado.
b. Este valor puede determinarse a partir de alguna teoría o modelo con
respecto al objeto que se estudia. Aquí el objetivo de la prueba de hipótesis es
verificar la teoría o modelo.
c. Surge cuando el valor del parámetro de la población es resultado de
consideraciones experimentales, tales como especificaciones de diseño o
ingeniería, o de obligaciones contractuales. En esta situación, el objetivo de la
prueba de hipótesis es la prueba de conformidad.
Considere los ejemplos:
Según el Acta de energía remitida al congreso en 1978, se fijó un impuesto al
fabricante de cualquier auto nuevo que diera un promedio cuando mucho de 22.5
millas por galón de gasolina. En consecuencia, un fabricante de autos nuevos
podía no querer estimar el millaje promedio por galón de gasolina, sino que le
interesaba determinar si dicho millaje excedía las 22.5 millas por galón; esto es,
estaba interesado en comprobar las hipótesis:
A. La media del millaje no excede las 22.5 millas por galón de gasolina.
Contra la hipótesis
B. La media del millaje excede las 22.5 millas por galón de gasolina.
Con la esperanza de obtener información suficiente que apoyara la
hipótesis
5.2 Errores tipo I y II.
La probabilidad del error Tipo I es siempre igual al nivel de significancia que se
utiliza al probar las hipótesis nulas. Dicho de otra manera, hay todavía una
probabilidad (valor de ) de que se pudiera elegir una muestra al azar que diera
una media comprendida dentro de la región de rechazo ó las regiones de rechazo.
Ello haría que al rechazar la hipótesis nula siendo verdadera cometiéramos el
error Tipo I.
La única forma en que se puede determinar la probabilidad del error Tipo II ( ) es
con respecto a un valor específico incluido dentro del rango de la hipótesis
alternativa.
News & World Report publicó un artículo sobre la carrera de éxitos de Wal- Mart.
Actualmente es la mayor cadena de ventas al por menor de la nación. Empezó
con una sola tienda de descuento en la pequeña localidad de Rogers, Arkansas, y
a crecido hasta poseer 1300 tiendas en 25 estados. Este éxito le ha valido a Sam
Walton, fundador y mayor accionista, el título del hombre más rico de América. Las
ventas anuales se cifran en 15 millones de dólares por tienda.
a) Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas
medias de 15.39 millones de dólares, con una desviación estándar de 2.9
millones de dólares. Pruebe la hipótesis 15 millones con un nivel de
significancia del 10%
b) Si la es en realidad 14.8 millones de dólares, ¿Cuál es la probabilidad
de cometer el error Tipo II?
Datos
n = 120
X = 15.39 millones
s = 2.9 millones
a = .10
1. Establecer la hipótesis
Ho: = 15
Ha: 15
2. Establecer la estadística de prueba
X
Z= n
3. Definir el nivel de significancia y la zona de rechazo
Nivel de significancia = .10
Zona de rechazo = {Z/ Z < -1.64 o Z/Z > 1.64}
4. Calcular la estadística de prueba
X
Z= n
el valor de la media poblacional es el que está a prueba en la hipótesis, por lo
tanto
15.39 15
Z
2.9
120 1.47
Como 1.47 < 1.64
No se rechaza Ho
5. Conclusión
Existe evidencia para decir que las ganancias anuales por tienda son de 15
millones de dólares por tienda con un nivel de significancia de .10.
Pasos para calcular el error Tipo II
1. Plantear la hipótesis nula y alternativa para la prueba
Ho: = 15
Ha: 15
2. Determinar el valor crítico de la media muestral que debe utilizarse para
probar la hipótesis nula con un nivel de significancia dado.
Xc Z / n
X 15 (1.64) 2.9 / 120 = 14.5659
X 15 (1.64) 2.9 / 120 = 15.4341
3. Identificar la probabilidad del error Tipo I correspondiente al valor crítico
que se calculó antes, como base para la regla de decisión.
= .10
4. Identificar la probabilidad del error Tipo II correspondiente a la regla de
decisión, dada una media alternativa especificada.
P (error Tipo II) = P (14.56 < X < 15.44)
15.4341 14.8
Z 2.40
2.9
120
14.5659 14.8
Z
2.9
120 -.88
P (error Tipo II) = P (-0.88 < Z < 2.40) = 0.8024
5.3 Pruebas unilaterales y bilaterales.
Un contraste bilateral adopta en general la forma:
H0: θ = θ0 Contra H1: θ ≠ θ0
En determinadas ocasiones el experimentador prefiere plantear directamente un
contraste de la forma:
H0: θ = θ0 Contra H1: θ > θ0
conocido como contraste unilateral derecho. Obviamente, otra posibilidad es el
unilateral izquierdo:
H0: θ = θ0 Contra H1: θ < θ0
En estos tres casos, el contraste de hipótesis es simple contra compuesta.
En la mayoría de situaciones aplicadas, se desean realmente resolver contrastes
unilaterales que comportan hipótesis compuestas. El unilateral derecho es
entonces:
H0: θ ≤ θ0 Contra H1: θ > θ0
y el izquierdo es:
H0: θ ≥ θ0 Contra H1: θ < θ0
Aunque esta última formulación está relacionada con los contrastes unilaterales
simple contra compuesta anteriores, las dos hipótesis no son técnicamente
equivalentes Para simplificar la interpretación de los contrastes unilaterales,
atendiendo a los casos de los que se ocupa Statmedia, se formulan los contrastes
de esta última manera (compuesta contra compuesta) y se toma el nivel de
significación como si fuera el del contraste simple contra compuesta.
En cualquier caso, es importante entender que sólo debe resolverse uno de los
tres contrastes (bilateral o unilateral) con un conjunto de datos concreto.
Por ejemplo, es incorrecto desde el punto de vista metodológico empezar
contrastando bilateralmente, y hacer luego un test unilateral. El contraste que se
ha de emplear debe decidirse basándose en conocimientos previos del problema,
o bien guiándose por la cuestión de interés aplicado a responder.
Ejemplo de prueba unilateral
Un sociólogo ha pronosticado, que, en una determinada ciudad, el nivel de
abstención en las próximas elecciones será del 40% como mínimo. Se elige al
azar una muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales
estarían dispuestos a votar. Determinar con un nivel de significación del 1%, si se
puede admitir el pronóstico.
Solución
1 enunciamos las hipótesis nula y alternativa:
H0: μ ≥ 0.40 La abstención será como mínimo del 40%.
H1: μ < 0.40 La abstención será como máximo del 40%;
2 zona de aceptación
Para α = 0.01, le corresponde un valor crítico: zα = 2.33.
Determinamos el intervalo de confianza para la media:
3 verificación
4 decisión
Aceptamos la hipótesis nula H 0. Podemos afirmar, con un nivel de significación del
1%, que la abstención será como mínimo del 40%.
Ejemplo de prueba bilateral
Un fabricante de lámparas eléctricas está ensayando un nuevo método de
producción que se considerará aceptable si las lámparas obtenidas por este
método dan lugar a una población normal de duración media 2400 horas, con una
desviación típica igual a 300. Se toma una muestra de 100 lámparas producidas
por este método y esta muestra tiene una duración media de 2320 horas. ¿Se
puede aceptar la hipótesis de validez del nuevo proceso de fabricación con un
riesgo igual o menor al 5%?
Solución
1 enunciamos las hipótesis nula y alternativa:
H0: μ = 2400
H1: μ ≠2400
2 zona de aceptación
Para α = 0.05, le corresponde un valor críticoα/2 = 1.96.
Determinamos el intervalo de confianza para la media:
3 verificación
Valor obtenido de la media de la muestra: 2320.
4 decisión
Rechazamos la hipótesis nula H0, con un nivel de significación del 5%.
5.4. Prueba de una hipótesis: referente a la media
con varianza desconocida utilizando la distribución
normal y “t” de student.
PROBLEMA RESUELTO DE PRUEBA DE HIPOTESIS PARA LA
( conocida ó n 30 ) DISTRIBUCION NORMAL
2
Suponga una variable aleatoria X para designar el peso de un pasajero de avión,
que se interesa en conocer el peso promedio de todos los pasajeros. Como hay
limitaciones de tiempo y dinero para pesarlos a todos, se toma una muestra de 36
pasajeros de la cual se obtiene una media muestral X = 160 libras. Suponga
además que la distribución de los pasajeros tenga una distribución normal con
desviación estándar s = 30. Con un nivel de significancia de .05. ¿ Se puede
concluir que el peso promedio de todos los pasajeros es menor que 170 libras?
Solución
Datos
n =36
X = 160 libras
s = 30
a = .05
1. Establecer la hipótesis
Ho: 170
Ha: < 170
2. Establecer la estadística de prueba
X
Z= n
3. Definir el nivel de significancia y la zona de rechazo
-1.64
Nivel de significancia = .05
Zona de rechazo = { Z/ Z -1.64}
4. Calcular la estadística de prueba
X
Z= n la media poblacional está bajo la hipótesis nula entonces tenemos
160 170 10
Z 2
30 5
36
Hacer liga con nivel de significancia y zona de rechazo
5. Regla de decisión basada en la estadística de prueba
Como -2 es menor que -1.64 la hipótesis nula se rechaza con un nivel de
significancia de 0.05.
Regla de decisión basada en la probabilidad
P ( Z < -2 ) = .02275
P ( Z < -1.64) = .05
Como .02275 es menor que .05 la hipótesis nula se rechaza.
Regla de decisión basada en la distribución de probabilidad del estadístico
utilizado en la prueba.
162
X Z
n
30 30
170 (1.64)
X 162 170 ( 2.0 )
X 160
36 36
Como 160 es menor que 162 la hipótesis nula se rechaza.
6. Conclusión
Así podemos afirmar: que el peso promedio de todos los pasajeros
corresponde a un valor menor de 170 libras.
PROBLEMA RESUELTO DE PRUEBA DE HIPOTESIS PARA LA
( desconocida y n 30 ) DISTRIBUCION T DE STUDENT
2
Una empresa de construcción fue culpada de inflar los comprobantes que registra
para los contratos de construcción con el gobierno federal. El contrato estableció
que un cierto tipo de trabajo debería promediar US $ 1,150. Por motivos de
tiempo, los directivos de sólo 12 agencias del gobierno fueron llamados a dar
testimonio ante la corte respecto a los comprobantes de la empresa. Se descubrió
a partir del testimonio de una media US $ 1,275 y una desviación estándar de US
$ 235, ¿Los datos de la muestra arrojan evidencia para decir que los
comprobantes son diferentes de $1150? Pruebe con un nivel de significancia
de .05.
Solución
Datos
n =12
X = $1275
s= $ 235
a = .05
1. Establecer la hipótesis
Ho: m = 1150
Ha: m 1150
2. Establecer la estadística de prueba
X
s
t= n
3. Definir el nivel de significancia y zona de rechazo
g.l = 11
-2.201 2.201
Nivel de significancia = .05
Zona de rechazo = { t/t -2.201 ó t/t 2.201
4. Calcular la estadística de prueba
X
s
t= n como la media poblacional está bajo la hipótesis nula entonces
tenemos
1275 1150
t
235 125
12 = 67.83 = 1.84
5. Como 1.84 esta entre -2.201 y 2.201 no se rechaza la hipótesis nula a un nivel
de significancia de .05
6. Conclusión
No se tiene evidencia suficiente para decir que los comprobantes son
diferentes a $ 1150.
5.5 Dos muestras: pruebas sobre dos medias
utilizando la distribución Normal y “t” student.
EJEMPLO DE DIFERENCIA DE DOS MUESTRAS UTILIZANDO LA
DISTRIBUCIÓN NORMAL.
El salario promedio semanal para una muestra de n1 =30 empleados de la
empresa petrolera Lasmo es de
X̄ 1 =280000 Bs., con una desviación típica
muestral de S 1 =14000 Bs. En otra empresa petrolera grande, una muestra
aleatoria de n2 =40 empleados tiene un salario promedio semanal de
X̄ 2 =270000 Bs., con una desviación estándar muestral de S 2 =10000 Bs. Se
prueba la hipótesis de que no existe diferencia entre los salarios promedio
semanal de las dos empresas, utilizando un nivel de significancia de: a) 5 %, b) 1
%.
SOLUCIÓN: Lo primero que se hará será ordenar los datos y luego determinar el
valor
Z α /2 al 5%, de la tabla.
Datos:
Muestra..1........................................... Muestra..2
n1 =30.................................................n2=40
X̄ 1=280000 ...................................... X̄ 2=270000
S 1 =14000..........................................S 2=10000
El..valor .. segun..tabla ..de..Z α/2=±1.96
Hipótesis:
H 0 : μ1 =μ2
H 1 : μ1 ≠μ 2
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si
Z c <−Z α /2 . .. o. .. Z c >Z α /2 , es decir, Z c <−1. 96. .. . o .. .. Z c >1. 96 .
Aplicando la formula siguiente se tiene:
( X̄ 1 − X̄ 2 ) ( X̄ 1− X̄ 2 ) 280000−270000 10000
Zc= = = = → Z c=3 . 33
√ √ √ ( 14000)2 ( 10000 )2 3005 . 56
2 2 2 2
σ1 σ2 S1 S2
+ + +
n1 n2 n1 n2 30 40
Zc Z α /2 Z c =3 .33>1. 96
Conclusión: Como es mayor que , es decir, , se rechaza
H 0 : μ1 =μ2
con un nivel de significancia de 0.05. Esto se puede observar en la
Z c =3 .33
gráfica 1B en donde cae fuera del área de aceptación, por lo tanto,
los salarios promedios semanales de las dos empresas petroleras son diferentes.
EJEMPLO DE DIFERENCIA DE DOS MUESTRAS UTILIZANDO LA
DISTRIBUCIÓN “t” DE STUDENT.
En una muestra aleatoria de n1=10 focos el promedio de vida de los focos es
𝑋�1 = 4000 horas, con una desviación de S1=200 horas. Para otra marca de
focos de cuya vida útil también se presume que sigue una distribución
normal, una muestra aleatoria de n2= 8 focos tienen una media muestral de
𝑋�2 = 4300 horas y una desviación estándar muestral de S 2 = 250, pruebe la
hipótesis de que no existe ninguna diferencia entre el ciclo medio de vida útil
de las 2 marcas de focos con un nivel de significancia del 1%
S²=
= 49,843.75
𝑆1 ² 𝑆2 ²
𝑆𝑥̅1 −𝑥̅2 = �𝑛 1 + 𝑛 2
49,843.75 49,843.75
=� 10
+ 8
=105.90
α =.01/2 =0.005
𝑔𝑙 = 10 + 8 − 2 = 16 = 2.921
∴ Como cae en la zona de aceptación se acepta con un nivel de confianza
Del 99% la hipótesis nula, de que no existe diferencia entre las dos marcas de
focos
5.6 Una muestra prueba sobre una sola proporción
Las pruebas de hipótesis con proporciones son necesarias en muchas áreas del
conocimiento y en especial en la administración. Se considerará el problema de
probar la hipótesis de que la proporción de éxito en un experimento binomial sea
igual a un cierto valor especifico. Es decir, se probará la hipótesis nula de que p =
p0, donde p es el parámetro de la distribución binomial. La información de que
suele disponerse para la estimación de una porción real o verdadera (porcentaje o
x
n
probabilidad) es una proporción muestral , donde x es el número de veces que
ha ocurrido un evento en n ensayos. Por ejemplo, si una muestra aleatoria de 600
compras realizadas en una tienda y 300 se realizan con tarjeta de crédito,
x 300
= =0 .50
n 600
entonces se puede utilizar esa cifra como estimación de punto de
la proporción real de compras realizadas en ese negocio que se abonaron a
tarjetas de crédito. De la misma forma muchas compañías podrían estimar las
proporciones de muchas transacciones. La hipótesis alterna puede ser una de las
p< p0 , p> p0 , . . o .. p≠ p0
alternativas usuales unilateral o bilateral tales como: .
El proceso de prueba de hipótesis para la proporción poblacional p es muy similar
al de μ. Un valor Zc calculado a partir de la muestra se compara con un valor
p−p
Zc=
critico de Z dados en las tablas. Zc se obtiene así:
√ p .q
n
. O también se
x−np
Z=
√npq
puede utilizar:
EJEMPLO 1
Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo Marlboro.
Después de una campaña publicitaria del cigarrillo Marlboro, se entrevistaron a
200 fumadores para determinar la eficiencia de la campaña publicitaria. El
resultado de la muestra realizada detecto un total de 26 personas que fumaban
Marlboro. ¿Pueden considerarse que esos datos presentan evidencia suficiente
para indicar que hubo un aumento en la aceptación del cigarrillo Marlboro?
Obtenga las conclusiones del planteamiento desarrollando un contraste de
hipótesis con un nivel de significancia del 5 %.
SOLUCIÓN: Para resolver el problema se plantea una hipótesis alternativa
unilateral por la derecha. Por tabla se sabe que al 5 % por la derecha
Z α =1 , 645 .
26
p=0 . 10 ,. . q=0 . 90. .. . .. p= =0 . 13 ,. . n=200
Datos: 200 .
Hipótesis:
H 0 : p=0. 10
H 1 : p>0 .10
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si
Z c > Z α ,es
decir,
Z c >1, 645 .
Aplicando formula se tiene:
p−p 0 . 13−0 . 10 0 . 03 0 .03
Zc= = = = → Z =1 . 41
√ √p .q
n
0. 1 x 0 . 9
200
√0 . 00045 0 .02127 c
Zc Zα Z c =1 . 41<1. 96
Conclusión: Como es menor que , es decir, , se acepta
H 0 : p=0. 10
con un nivel de significancia de 0.05. Esto se puede observar en la
Z c =1 . 41
gráfica A en donde cae dentro del área de aceptación, por lo tanto, el
10 % de los fumadores prefieren Marlboro, lo que indica que la campaña
publicitaria no fue efectiva ya que de haberlo sido se hubiese aceptado la hipótesis
H 1 : p>0 .10 .
EJEMPLO 2
Un fabricante de semiconductores produce controladores que se emplean en el
sistema eléctrico de vehículos. El cliente requiere que la proporción de
controladores defectuosos no sea mayor de 0.05, y que el fabricante demuestre
estas características del proceso de fabricación con este nivel de calidad, con un
nivel de significancia del 5 %. El fabricante de semiconductores toma una muestra
aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El
fabricante puede demostrar al cliente la calidad exigida? Saque sus conclusiones.
SOLUCIÓN: para resolver el problema hay que plantear una hipótesis alternativa
unilateral de una cola por la izquierda, es decir, p< 0.05 y para ello se busca en la
tabla el valor de
Z α ,..que.. es.. Z α =1, 645 .
Datos: p=0.05 ,q=0.95 , p=4/200=0.02,n=200 .
Hipótesis:
H 0 : p=0. 05
H 1 : p<0 . 05
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si
Z c <−Z α ,es
decir,
Z c <−1 ,645 .
Aplicando formula se tiene:
p−p 0 . 02−0 . 05 0 . 03 0 . 03
Zc= = =− =− →Z =−1. 95
√ √p .q
n
0 . 05 x 0 . 95
200
√0 . 0002375 0 .0154 c
Zc Zα Z c =−1 . 95<−1 ,645
Conclusión: Como es menor que , es decir, , se
H 0 : p=0. 05
rechaza con un nivel de significancia de 0.05. Esto se puede
Z c =−1 . 95
observar en la gráfica A en donde cae fuera del área de aceptación,
H 1 : p<0 . 05
por lo tanto, se acepta y se concluye que la proporción de artículos
defectuosos es menor del 5 %, como quería el cliente.