Estadistica Final

“Año del dialogo y la reconciliación nacional”
UNIVERSIDAD NACIONAL DE PIURA
FACULTAD:
Ingeniería industrial
ESCUELA PROFESIONAL:
Ingeniería agroindustrial e industrias alimentarias

CURSO:
Estadística General
DOCENTE:
Mg. Mariela Córdova Espinoza
TEMA:
Pruebas de hipótesis para una media, dos medias, una proporción, dos
proporciones
INTEGRANTES DE GRUPO:
 Aquino Godos Fiorella

 Dueñas Labán Shirley
 Landacay Morocho Mirtha
 Madrid Sandoval Cristina
 Olaechea Jiménez Valeria
 Ramírez Córdova Raquel
PRUEBAS DE HIPÓTESIS Página 1

CONTENIDO
INTRODUCCIÓN ............................................................................................................................ 3
PRUEBAS DE HIPÓTESIS ................................................................................................................ 4
PRUEBA DE HIPOTESIS PARA UNA MEDIA…….……………………………………………………………………5
PRUEBA DE HIPOTESIS PARA UNA MEDIA CON VARIANZA CONOCIDA………………………...5
PRUEBA DE HIPOTESIS PARA UNA MEDIA CON VARIANZA DESCONOCIDA………………….9
PRUEBA DE HIPÓTESIS PARA DOS MEDIAS…………………………………………………………………….13
PRUEBA DE HIPOTESIS PARA DOS MEDIAS CON VARIANZA CONOCIDA……………………..13
PRUEBA DE HIPOTESIS PARA DOS MEDIAS CON VARIANZA DESCONOCIDA……….………15
PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN………………………………………………….………..21
PRUEBA DE HIPÓTESIS PARA DOS PROPORCIONES………………………………………………………..24
EJERCICIOS PROPUESTOS…………………………………………………………………………………………………..27
BIBLIOGRAFÍA…………………………………………………………………………………………………………………….28

INTRODUCCIÓN
Las pruebas de hipótesis junto a los intervalos de confianza constituyen dos enfoques
fundamentales de la inferencia estadística, es decir a ese proceso de estudiar muestras y
usar la información obtenida en estas y obtener conclusiones acerca de la población
(Blair & Taylor, 2008).
El proceso de inferencia estadística a partir de las pruebas de hipótesis se basa en hacer
suposiciones respecto a características o fenómenos de interés en una población (o
varias poblaciones) y tomando una muestra representativa de datos de esa población
(muestra aleatoria), de manera que estos datos muéstrales sirvan para contrastar la
validez de nuestra hipótesis (Celis & Labrada, 2014; Daniel, 2002).
El objetivo de este trabajo es exponer los métodos estadísticos básicos que se aplican
para tomar decisiones sobre la conjetura que se hace acerca del valor numérico del
parámetro de una población en estudio y que es sometida a comprobación experimental
con el propósito de determinar si los resultados de una muestra aleatoria extraída de esa
población contradicen o no en forma significativa tal afirmación.
Básicamente, el proceso de la prueba de hipótesis nos conduce a tomar la decisión de
rechazar o no rechazar la afirmación o conjetura acerca del valor numérico del
parámetro de la población en estudio. Tal suposición tiene el nombre genérico de
hipótesis estadística y puede ser verdadera o no. Por esto, la inferencia incluye una
medida del error que se cometería al rechazar la hipótesis principal cuando realmente es
cierta. Esta medida de error es denominado el nivel de significación.
En general, las hipótesis estadísticas son afirmaciones no solamente acerca de los
parámetros de una población si no también acerca de la forma como se distribuye la
población definida por la variable aleatoria en estudio. La conjetura hecha sobre el
parámetro o sobre la forma de la distribución de una población sometida a
comprobación experimental será rechazada sólo si el resultado muestral produce,
cuando la hipótesis es cierta, una probabilidad menor que el nivel de significación dado.

PRUEBAS DE HIPOTESIS
Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una
afirmación acerca de una población dependiendo de la evidencia proporcionada por una
muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se
probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no
hay diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que
es verdadero de acuerdo con la evidencia proporcionada por los datos de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis
nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel
de significancia (denotado como α o alfa), entonces puede rechazar la hipótesis nula.
Un error común de percepción es que las pruebas estadísticas de hipótesis están

diseñadas para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar
una prueba de hipótesis, establecemos la hipótesis nula como lo que queremos
desaprobar. Puesto que establecemos el nivel de significancia para que sea pequeño
antes del análisis (por lo general, un valor de 0.05 funciona adecuadamente), cuando
rechazamos la hipótesis nula, tenemos prueba estadística de que la alternativa es
verdadera. En cambio, si no podemos rechazar la hipótesis nula, no tenemos prueba
estadística de que la hipótesis nula sea verdadera. Esto se debe a que no establecimos la
probabilidad de aceptar equivocadamente la hipótesis nula para que fuera pequeña.
PASOS DE LA PRUEBA DE HIPÓTESIS

1. Expresar la hipótesis nula.
2. Expresar la hipótesis alternativa
3. Especificar el nivel de significancia
4. Determinar el tamaño de la muestra
5. Establecer los valores críticos que establecen las regiones de rechazo de las de no
rechazo.
6. Determinar la prueba estadística.
7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadística
apropiada.
8. Determinar si la prueba estadística ha sido en la zona de rechazo a una de no
rechazo.
9. Determinar la decisión estadística.
10. Expresar la decisión estadística en términos del problema.

PRUEBA DE HIPÓTESIS DE LA MEDIA DE UNA POBLACIÓN
1.1Prueba de hipótesis de la media de una población con varianza 𝝈𝟐

conocida
Sea 𝑋̅ la media de una muestra aleatoria de tamaño n seleccionada de una población
X con media µ y varianza 𝜎 2 distribuida de forma normal o de cualquier forma.
Suponemos que la varianza 𝜎 2 es conocida. Este hecho se justifica por datos
2
históricos o por estudios estadísticos similares o por su estimación puntual 𝑆𝑛−1
calculada de la muestra siempre que esta sea de tamaño grande, 𝑛 ≥ 30.
Si la población X es normal N(µ, 𝜎 2 ) entonces, por la propiedad reproductiva de la
𝜎2
normal, la distribución de a estadística 𝑋̅ es exactamente normal N(µ, 𝑛 ) para
cualquier valor de n (n≥2).
Si la población X no es normal, siempre que el tamaño de la muestra sea
suficientemente grande (n≥30), entonces la distribución de 𝑋̅ es aproximadamente
𝜎2
normal N(µ, 𝑛 ) por el teorema del límite central.
En cualquiera de los dos casos, la estadística adecuada para la prueba de 𝐻0 : 𝜇 = 𝜇0
contra cualquier alternativa 𝐻1 unilateral o bilateral es:
𝑋̅ −𝜇
Z=𝜎/
√𝑛
Cuya distribución es exacta o aproximadamente normal N(0,1)

Observe que Z define una familia infinita de curvas normales que dependen de 𝜇.
𝑋̅ −𝜇0
Pero si 𝐻0 : 𝜇 = 𝜇0 es supuesta verdadera, entonces, Z= 𝜎/ es una curva normal
√𝑛
fija, donde se determina la región de rechazo RC de 𝐻0 dado un nivel de
significación 𝛼.
 Prueba unilateral de cola a la derecha
Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 > 𝜇0 , dado el nivel de significación α y

𝑋̅ −𝜇0
dado que 𝐻1 indica cola a la derecha, en la distribución de Z= 𝜎/ especificada
√𝑛
por 𝐻0 supuesta verdadera, se halla el valor crítico 𝑍1−𝛼 tal que la probabilidad
de rechazar 𝐻0 cuando de hecho es verdadera sea, P[𝑍 > 𝑍1−𝛼 ] = α.
Por lo tanto la región crítica o de rechazo de 𝐻0 en el rango de variación de z es:
RC={𝑍 > 𝑍1−𝛼 }
Consecuentemente la región de aceptación de 𝐻0 es el intervalo RA={𝑍 ≤ 𝑍1−𝛼 }
𝑋̅ −𝜇0
La regla de decisión consiste en rechazar 𝐻0 si 𝑍𝑐𝑎𝑙 𝜖 RC, donde 𝑍𝑐𝑎𝑙 = 𝜎/ es el
√𝑛
valor de Z calculada en la muestra y no rechazar 𝐻0 en caso contrario.

̅
Región crítica en el rango de variación de 𝑿
𝑋̅ −𝜇0
Si se sustituye Z= 𝜎/ en P[𝑍 > 𝑍1−𝛼 ] = α se obtiene:
√𝑛
𝜎
P[𝑋̅ > 𝜇0 + 𝑍1−𝛼 ( 𝑛) ] = α
√
Entonces, la región de rechazo de 𝐻0 en el rango de variación de 𝑋̅ es:
𝜎
RC= {𝑋̅ > 𝑏1 } en donde 𝑏1 = 𝜇0 + 𝑍1−𝛼 ( 𝑛)
√
Consecuentemente la región de aceptación de 𝐻0 es el intervalo RA={𝑋̅ ≤ 𝑏1 }
La regla de decisión consiste en rechazar 𝐻0 si la estadística 𝑥̅ ∈ RC y no
rechazar 𝐻0 en caso contrario.
 Prueba unilateral de cola izquierda
Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 < 𝜇0 , dado el nivel de significación α y

𝑋̅ −𝜇0
dado que 𝐻1 indica cola a la izquierda, en la distribución de Z= 𝜎/
√𝑛
especificada por 𝐻0 supuesta verdadera, se halla el valor crítico 𝑍1−𝛼 tal que la
probabilidad de rechazar 𝐻0 cuando de hecho es verdadera sea, P[𝑍 < −𝑍1−𝛼 ]
= α.
RC={𝑍 < −𝑍1−𝛼 }
Consecuentemente la región de aceptación de 𝐻0 es el intervalo RA={𝑍 ≥
−𝑍1−𝛼 }
La regla de decisión consiste en rechazar 𝐻0 si el valor de Z calculada en la
muestra, 𝑍𝑐𝑎𝑙 𝜖 RC y no rechazar 𝐻0 en caso contrario.

̅
𝑋̅ −𝜇0
Si se sustituye Z= 𝜎/ en P[𝑍 < −𝑍1−𝛼 ] = α se obtiene:
√𝑛
𝜎
P[𝑋̅ < 𝜇0 − 𝑍1−𝛼 ( 𝑛) ] = α
√
Entonces, la región de rechazo de 𝐻0 en el rango de variación de 𝑋̅ es:
𝜎
RC= {𝑋̅ < 𝑎1 } en donde 𝑎1 = 𝜇0 − 𝑍1−𝛼 ( 𝑛)
√
Consecuentemente la región de aceptación de 𝐻0 es el intervalo RA={𝑋̅ ≥ 𝑎1 }
 Prueba bilateral o de dos colas
Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 ≠ 𝜇0 , dado el nivel de significación α y

𝑋̅ −𝜇0
dado que 𝐻1 indica dos colas, en la distribución de Z= 𝜎/ especificada por 𝐻0
√𝑛
supuesta verdadera, se halla el valor crítico 𝑍1−𝛼/2 tal que la probabilidad de
rechazar 𝐻0 cuando sea verdaderamente cierta sea, P[𝑍 < −𝑍1−𝛼 ] = α/2 o
P[𝑍 > 𝑍1−𝛼 ] = α/2

RC={𝑍 < −𝑍1−𝛼/2 𝑜 𝑍 > 𝑍1−𝛼/2 }
Consecuentemente la región de aceptación de 𝐻0 es el intervalo
RA={−𝑍1−𝛼/2 ≤ 𝑍 ≤ 𝑍1−𝛼/2 }
La regla de decisión consiste en rechazar 𝐻0 si el valor de Z calculada en la
muestra, 𝑍𝑐𝑎𝑙 𝜖 RC y no rechazar 𝐻0 en caso contrario.
̅
𝑋̅ −𝜇0
Si se sustituye Z= 𝜎/ en RC se obtiene la región crítica en el rango de
√𝑛
variación de 𝑋̅ dada por: RC= {𝑋̅ < 𝑎 𝑜 𝑋̅ > 𝑏}
𝜎 𝜎
Donde, a= 𝜇0 − 𝑍1−𝛼 ( ) y b= 𝜇0 + 𝑍1−𝛼 ( )
√𝑛 √𝑛
Consecuentemente la región de aceptación de 𝐻0 en 𝑋̅ es el intervalo RA={𝑎 ≤

𝑋̅ ≤ 𝑏 }
Ejemplo n°1:
Para comprobar si está controlado el proceso de producción de un producto que

sale al mercado en bolsas de 400 gramos se ha observado los pesos de una
muestra al azar de 16 bolsas del producto, resultando una media de 395 gramos.
Si el criterio es concluir que el proceso de empaquetado no está controlado
cuando el peso promedio real del producto es diferente de 400 gramos, ¿es
válido inferir con el resultado de la muestra y al nivel de significación del 5%
que el proceso está fuera de control?
Asuma que los pesos del producto tienen distribución normal con una desviación
estándar de 8 gramos.
Solución:
Sea X la variable aleatoria que define la población de los pesos del producto. Se
asume que la distribución de X es N(µ, (8)2 )
De la muestra se obtiene: n=16 y 𝑥̅ =395.
Entonces, el error típico de la media muestral es ET = 𝜎/√𝑛 =2
1. Hipótesis: probaremos 𝐻0 : 𝜇 = 400 (el proceso está controlado)
Contra 𝐻1 : 𝜇 ≠ 400 (el proceso está fuera de control)
2. Estadística y región crítica: la estadística de la prueba, cuando se supone 𝐻0
verdadera (por la propiedad reproductiva de la normal) es:
𝑋̅ −µ 𝑋̅ −400
Z=𝜎/ = ~ N(0,1)
√ 𝑛 2

En esta distribución, dado el nivel de significación α= 0.05 y dado que la
hipótesis 𝐻1 indica dos colas, se encuentra el valor crítico 𝑍1−𝛼/2 = 𝑍0.975 =
1.96.
Luego la región crítica de la prueba en la variable Z está dada por:

RC={𝑍 < −1.96 𝑜 𝑍 > 1.96}
3. Decisión: el valor de Z calculada en la muestra es
𝑋̅ −𝜇0 395−400
𝑧𝑐𝑎𝑙 = 𝜎/ = = -2.5
√𝑛 2
Dado que 𝑧𝑐𝑎𝑙 = -2.5 ∈ RC se debería rechazar 𝐻0 y concluir con un riesgo
error tipo I del 5% que el proceso de empaquetado del producto no está
controlado.
Toma de decisión en la variable 𝑋̅
En el rango de valores de 𝑋̅ la región crítica de la prueba es:
RC= {𝑋̅ < 400 − 1.96𝑥2 𝑜 𝑋̅ > 400 + 1.96𝑥2}
RC= {𝑋̅ < 396.08 𝑜 𝑋̅ > 403.92}
El hecho que 𝑥̅ = 395 ∈ RC se debe rechazar𝐻0 y concluir con un error tipo I
del 5%, que el proceso de empaquetar no está controlado.
1.2Prueba de hipótesis de la media de una población con varianza 𝝈𝟐

desconocida
Sea 𝑋1 , 𝑋2 … 𝑋𝑛 una muestra aleatoria de tamaño n escogida de una población

definida por la variable X cuya distribución de probabilidades es normal
N(𝜇, 𝜎 2 ) con ambos parámetros desconocidos y sean la media y la varianza
muéstrales respectivas:
∑ 𝑛 ∑𝑛 ̅ 2
𝑋1 𝑖=1(𝑋1 −𝑋)
𝑋̅= 𝑖=1 2
𝑆 2 𝑜 𝑆𝑛−1 =
𝑛 𝑛−1
Si la población es normal y con varianza desconocida, está probado que la

estadística
𝑋̅ −µ
T= 𝑆/
√𝑛
Tiene distribución es t-student con n-1 grados de libertad valido para n≥2. Esto es
T~t(n-1).
Cuando la hipótesis nula 𝐻0 : 𝜇 = 𝜇0 es supuesta verdadera, la estadística de la
prueba especificada por 𝐻0 es entonces:
𝑋̅ −𝜇0
T= ~ 𝑡(𝑛 − 1).
𝑆/√𝑛
En esta distribución de T se determina la región crítica de la prueba cuya
probabilidad sea igual al nivel de significación 𝛼.
𝑋̅ −𝜇0
De la muestra se calcula el valor de T dado por: 𝑡𝑐𝑎𝑙 = 𝑠/√𝑛

La regla de decisión de una prueba bilateral o un unilateral de la media consiste
rechazar 𝐻0 si 𝑡𝑐𝑎𝑙 y no rechazar 𝐻0 en caso contrario.
Nota si la región crítica está 𝑋̅en la variable se rechazará 𝐻0 si𝑋̅ ∈ RC y no se
rechazará H0 en caso contrario, donde 𝑋̅ es la media obtenida de la muestra.
 Prueba bilateral o de dos colas

Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 ≠ 𝜇0 dado el nivel de significación α y dado
(𝑋̅ −𝜇0 )
que 𝐻1 indica dos colas, en la distribución de T = ~t(n- 1) especificada por𝐻0
𝑠/√𝑛
supuesta verdadera, se hallan los valores críticos±𝑡1−𝛼,𝑛−1 tales que la
2
probabilidad de rechazar 𝐻0 si de hecho es verdadera P [T < -𝑡1−𝛼,𝑛−1 ] = α/2 o P [T
2
>𝑡1−𝛼,𝑛−1 ]=α/2
2
Luego, la región de rechazo de 𝐻0 en el rango de variación de T es el intervalo:
RC = {𝑇 < −𝑡1−𝛼,𝑛−1 𝑜 𝑇 > 𝑡1−𝛼,𝑛−1 }
2 2
(𝑋̅ −𝜇0 )
Por otro lado, si se sustituye T= en la región crítica RC y operando se obtiene
𝑠/√𝑛
la región crítica de la prueba en la variable 𝑋̅ dada por
RC= {𝑋̅ < 𝑎 𝑜 𝑋̅ > 𝑏}
Donde, a= 𝜇0 −𝑡1−𝛼,𝑛−1 (𝑠/√𝑛) b= 𝜇0 +𝑡1−𝛼,𝑛−1 (𝑠/√𝑛)
2 2
 Prueba unilateral de cola a la derecha

Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 > 𝜇0 , dado el nivel de significación α, y dado
𝑋̅ −𝜇0
que 𝐻1 indica cola derecha, en la distribución de T = ~ 𝑡(𝑛 − 1) especificada
𝑆/√𝑛
por 𝐻0 supuesta verdadera se halla el valor crítico 𝑡1−𝛼,𝑛−1 tal que la probabilidad
de rechazar 𝐻0 si de echo es verdadera sea P[T > 𝑡1−𝛼,𝑛−1]=α
Luego la región de rechazo de 𝐻0 en el rango de variación de T es el intervalo
RC= {𝑇 > 𝑡1−𝛼,𝑛−1 }

𝑋̅ −𝜇0
Por otro lado, si se sustituye T= 𝑆/ en la región crítica RC y operando se obtiene
√𝑛
la región crítica en el rango en la variable 𝑋̅ dada por RC={𝑋̅ > 𝑏1 } donde 𝑏1 =
𝜇0 +𝑡1−𝛼,𝑛−1 (𝑠/√𝑛)
2
 Prueba unilateral de cola a la izquierda

Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 < 𝜇0 , dado el nivel de significación α, y dado
𝑋̅ −𝜇0
que 𝐻1 indica cola derecha en la distribución de T = ~ 𝑡(𝑛 − 1) especificada
𝑆/√𝑛
por 𝐻0 supuesta verdadera, se halla el valor crítico 𝑡1−𝛼,𝑛−1 tal que la probabilidad
de rechazar 𝐻0 si de hecho es verdadera se P[T < -𝑡1−𝛼,𝑛−1]= α
Luego, la región crítica en el rango de variación de T es RC= [T< -𝑡1−𝛼,𝑛−1 ]
𝑋̅ −𝜇0
Por otro lado, si se sustituye T= 𝑆/ en la región crítica RC y operando se obtiene
√𝑛
la región crítica en el rango en la variable 𝑋̅ dada por RC={𝑋̅ > 𝑎1 } donde 𝑎1 =
𝜇0 −𝑡1−𝛼,𝑛−1 (𝑠/√𝑛)
2

Ejemplo n°2:
Se sembró en forma experimental una nueva variedad de uvas en el viñedo San
Pablo de San Mateo. El empresario Agroindustrial dueño del viñedo afirma que el
precio promedio por racimo es de al menos 160 gramos. Sin embargo una muestra
de 10 racimos de uva de la reciente cosechada ha dado los siguientes pesos en
gramos:
157, 157, 163, 158, 161, 159, 162, 159, 158, 156
A) ¿Cree usted que el empresario tiene la razón? Utilice un nivel de significación
del 5% y asuma que la población de pesos de racimos tiene distribución normal.
B) Cuales diablos limites inferior y superior donde se ubica el verdadero peso
medio de los racimos de uvas con un riesgo α= 0.05?
Solución:
Sea X la variable aleatoria que define la población de los pesos de los racimos de
uva. Se asume que la distribución de la población de los pesos es normal con media
µ y varianza 𝜎 2 desconocidas.
De la muestra se obtiene: n= 10, 𝑥̅ = 159, s = 2.3094 entonces el error estándar o
típico de la media muestral es ET = 𝑆/√𝑛 = 0,7303
1. Hipótesis: 𝑝𝑟𝑜𝑏𝑎𝑟𝑒𝑚𝑜𝑠, 𝐻0 : µ≥ 160 (Afirmación del empresario)
Contra : 𝐻1: µ< 160
2. Estadística y región critica
Como la muestra es pequeña y la población es normal con varianza
desconocida, la estadística apropiada de la prueba (cuando se supone 𝐻0 verdadera)
𝑋̅ −160
es: T= 𝑆/ ~ 𝑡(9)
√𝑛
En esta distribución, dado el nivel de significación α = 0.05 y dado que la

hipótesis 𝐻1 indica prueba unilateral cola izquierda, se encuentra el valor crítico,
𝑡0.05,9 = -1.833 por lo tanto la región critica de la prueba es RC =[T< -1.833]
𝑋̅ −160
3. Decisión: El valor de T calculada de la muestra es: 𝑇𝑐𝑎𝑙 =0.7303= - 1.3693
Y dado que t cal = -1.3693 no pertenece a RC no se debería rechazar: 𝐻0 y concluir

que la media de los pesos de los racimos de uvas de toda la producción es al menos
160 gramos. Por lo tanto, el empresario tiene la razón
B) Con un riesgo del 5% o una confianza del 95%la media real µ de los pesos tiene
los siguientes límites de confianza inferior y superior:
𝑋̅ ∓ 𝑡0.975,9(𝑆/√𝑛), 159 ∓2.262 x 0.7303, 159∓ 1.6519
Es decir, con confianza 95% la media real de los pesos va de 157.3481 a 160.6519

PRUEBA DE HIPÓTESIS DE LA DIFERENCA DE LAS MEDIAS
DE DOS POBLACIONES
Se usa para estimar parámetros de poblaciones y probar (contrastar) si una afirmación se

ve apoyada o desaprobada ante la evidencia de la muestra utilizando la distribución “t
de student (t)” En el proceso de toma de decisiones, en muchos casos, es necesario
determinar cuando los parámetros de dos poblaciones son similares o diferentes.
Probaremos si dos medias poblacionales son iguales con base e la información que se
tiene de dos muestras de éstas; o bien, que la diferencia entre ambas medias muestrales
es tan grande, se puede concluir que las medias poblacionales no son iguales
Algunas aplicaciones:
 Por ejemplo, deseamos verificar si existen diferencias en los promedios de
calificaciones obtenidos en castellano de dos cursos de 1º año de bachillerato de
diferentes colegios impartidos por un mismo profesor. Un curso promedio 18.2
puntos y el otro promedio 16.3 puntos.
 Un director de escuela desea saber si el promedio de asistencia de educación
básica es distinta del promedio de asistencia de educación secundaria.
 Un Analista del Ministerio de Educación desea saber si existe diferencias en la
tarifa media por hora de los docentes de la capital y los que trabajan en zonas
rurales
Nota
En estos casos lo importante para el Gerente Educativo son los parámetros
poblacionales y las relaciones entre los valores de los dos parámetros, es decir, qué tan
distintos son estos a qué se deben las diferencias
Atención:
 Es importante tomar en cuenta el tamaño de las muestras.
 Hay una diferencia en la fórmula del estadístico z.
2.1 Prueba de hipótesis de la diferencia de las medias de dos poblaciones con

varianzas conocidas
La metodología que utilizaremos para comprobar si una diferencia observada entre dos
medias muestrales se puede atribuir a la causalidad, se basa en los siguientes
fundamentos teóricos
Si X1 y X2 son las medias de dos muestras aleatorias e independientes, grandes de
tamaño n1 y n2, la distribución muestral del estadístico X1-X2 se aproxima a una normal
que tiene como media μ1 – μ2 y como desviación estándar α (X1-X2) (también conocido
como error estándar).

Entonces:
α (X1-X2) = √ (α21 / n1) + (α22 / n2)
Usualmente α1 y α2 son desconocidas, pero para muestras superiores a 30 podemos
utilizar las desviaciones muestrales S1 y S2 como estimadores de α1 y α2 y probar la H0
en el estadístico Z= (X1-X2) / √ (S21 / n1) + (S22 / n2)
Consideraciones:
Una diferencia entre medias se considera real, confiable, verdadera o significativa
cuando existe una alta probabilidad de que tal diferencia no es producto del azar o
accidental.
Cuando la diferencia que se observa entre dos medias puede ser fácilmente atribuida al
error estándar, es decir a los procesos de selección aleatoria o al azar, se dice que dicha
diferencia no es significativa.
El nivel o grado de probabilidad requerido para que la diferencia entre las medias sea
considerada como significativa, es determinado de manera arbitraria por el investigador.
Él debe establecer qué porcentaje del total de posibles diferencias observadas entre las
medias puede ser atribuido al azar.
Importante: Las muestras independientes son aquellas constituidas por sujetos que no
están relacionados o pareados entre sí. De manera que el desempeño de un individuo en
un grupo no afecta el desempeño de ninguno de los del otro grupo.
Ejemplo n°1:
¿Existen diferencias en los promedios de calificaciones obtenidos en castellano de dos
cursos de 1º año de bachillerato de diferentes Instituciones impartidos por un mismo
profesor?
Un curso promedio 18.2 puntos y el otro promedio 16.3 puntos.
A un nivel de significancia de 0.01, ¿es razonable concluir que la calificación promedio
obtenida por el Instituto A es menor que el obtenido en el Instituto B?
1. Definir hipótesis: H0: μ1 ≤ μ2 H1: μ1 > μ2
2. Definir Nivel de significación: α = 0.01, Z= + - 2,33
3. Calcular Z: Z = (X1-X2) / √ (S21 / n1) + (S22 / n2) Z = -9,89
4. Regla de Decisión: Rechazar la hipótesis nula y aceptar la hipótesis alternativa si
el valor calculado de z excede 2.33. Aceptamos la hipótesis nula si z es menor a
2.33.
5. Decisión: Debido a que el valor calculado de z (-9,89) es menor que el valor
crítico (-2.33), se acepta la hipótesis nula y se concluye que con base en la
información de las muestras, el instituto A obtiene menores calificaciones en
castellano que el instituto B a pesar de que cuentan con el mismo docente.

2.2 Prueba de hipótesis de la diferencia de medias de dos poblaciones
con varianzas desconocidas
A. Dos poblaciones normales
Con varianzas desconocidas supuesta iguales: 𝝈𝟐𝟏 = 𝝈𝟐𝟐 = 𝝈𝟐
Sean 𝑋̅1 y 𝑋̅2 las medias y 𝑆12 y 𝑆22 las varianzas de dos muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2 respectivamente seleccionadas de dos
poblaciones normales con medias 𝜇1 y 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 desconocidas.
Si las dos poblaciones son normales, independientes y con varianzas

desconocidas, pero, supuestas iguales (𝜎12 = 𝜎22 = 𝜎 2 ) , esta probado que la
distribución de la estadística T es una t- Student con 𝑛1 + 𝑛2 – 2 grados de libertad,
esto es:
(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
𝑇= ~ 𝑡(𝑛1 + 𝑛2 – 2)
𝑠𝑐2 𝑠𝑐2
√ +
𝑛 1 𝑛 2
(𝑛1 −1)𝑠𝑐2 +(𝑛2 −1)𝑠𝑐2

Donde, 𝑠𝑐2 = es la varianza común o promedio, si la hipótesis
𝑛1 + 𝑛2 – 2
nula H0: 𝜇1 = 𝜇2 es supuesta verdadera.
En esta distribución T especifica por H0 se ubica la región critica (RC) de la prueba cuya
probabilidad sea igual al nivel de significación α.
De las muestras se calcula el valor de T dado por:
𝑋̅1 − 𝑋̅2
𝑡=
𝐸𝑇
𝑠 2
𝑠 2
Donde, 𝐸𝑇 = √𝑛𝑐 + 𝑛𝑐 es el error típico de la diferencia de medias 𝑋̅1 − 𝑋̅2
1 2
La regla de decisión de una prueba bilateral o unilateral de dos medias consiste en

rechazar H0 si t ∈ RC y no rechazar H0 en caso contrario.
1) Prueba bilateral o de dos colas

Si se prueba H0: 𝜇1 = 𝜇2 contra H1: 𝜇1 ≠ 𝜇2 al nivel de significación α, la región
critica de la prueba es el intervalo:
RC = {𝑇 < 𝑡1−𝛼/2.𝑛1+𝑛2 −2 𝑜 𝑇 > 𝑡1−𝛼/2.𝑛1+𝑛2 −2 }
2) Prueba unilateral de cola a la derecha
Si se prueba H0: 𝜇1 = 𝜇2 contra H1: 𝜇1 > 𝜇2 al nivel de significación α, la región
RC = {𝑇 > 𝑡1−𝛼.𝑛1+𝑛2 −2 }
3) Prueba unilateral de cola a la izquierda

Si se prueba H0: 𝜇1 = 𝜇2 contra H1: 𝜇1 < 𝜇2 al nivel de significación 𝛼, la región
RC = {𝑇 < 𝑡1−𝛼.𝑛1+𝑛2 −2 }
Ejemplo n°2.1:
Una medicina A fue aplicada a una muestra de 10 pacientes aquejados de cierta

enfermedad. Otra medicina B fue aplicada a otra muestra de 9 pacientes aquejados de
la misma enfermedad. Los tiempos en días de recuperación de los pacientes fueron
los siguientes:
Medicina A: 6, 5, 6, 7, 4, 7, 6, 4, 3, 6.
Medicina B: 7, 6, 7, 9, 5, 8, 7, 6, 8.
Utilizando un nivel de significación del 5% y suponiendo poblaciones normales, ¿Es
válido inferir que no hay diferencias significativas en las medias de los tiempos de
tratamientos de las dos medicinas? Si hay diferencias, ¿Cuál de las medicinas es más
eficaz?
Solución:
Sean 𝑋̅1 y 𝑋̅2 las variables aleatorias que definen las poblaciones de los tiempos
en días de tratamiento de las medicinas A y B respectivamente. Se supone que X1
~ 𝑁 (𝜇1 , 𝜎12 ) y X2 ~ 𝑁 (𝜇2 , 𝜎22 ).
𝑥1 5.4, 𝑆12 = 1,8222, n2= 9, 𝑥

De la muestra se obtienen: n1= 10, ̅̅̅= ̅̅̅= 2
2 7.0 , 𝑆2 =
1,4999.
Prueba de la homogeneidad de dos varianzas
1. Hipótesis: Probaremos H0: 𝜎12 = 𝜎22 contra H1: 𝜎12 ≠ 𝜎22 .
2. Estadísticas y región critica. La estadística de la prueba especificada por la
hipótesis nula H0 supuesta verdadera es:
F = 𝑆12 / 𝑆22 ~𝐹(9.8)
En esta distribución, dado el nivel de significación: 𝛼 = 0.05 y la hipótesis H1
indica una prueba bilateral, se hallan los valores críticos:
𝑓0.025,9.8 = 1/𝑓0.975,9.8 = 1/4.10 = 0.244 𝑦 𝑓0.975,9.8 = 4.36
Luego, la región critica o de rechazo de H0 está dada por:
RC = {𝐹 < 0.244 𝑜 𝐹 > 4.36 }
3. Decisión: De la muestra se obtiene 𝑓𝑐𝑎𝑙 = 𝑆12 / 𝑆22 = 1,215

Dado que 𝑓𝑐𝑎𝑙 = 1,215 ∉ 𝑅𝐶 se debería aceptar H0 y concluir que son iguales las
varianzas de las dos poblaciones de los tiempos de recuperación
La probabilidad P de esta prueba es P= 2x P [𝐹(9.8) > 1.215]0.794 > 𝛼 = 0.05
Prueba de la diferencia de las dos medias

2. Estadísticas y región critica de la prueba: Dado que hay prueba de que las
dos varianzas poblaciones son iguales, la estadísticas especificada por H0
cuando está dada por:
(𝑋̅1 − 𝑋̅2 )
𝑇= ~ 𝑡(17)
𝑠𝑐2 𝑠𝑐2
√ +
𝑛 1𝑛 2
En esta distribución, dado el nivel de significación: 𝛼 = 0.05 y la hipótesis H1

indica una prueba bilateral, se ubica el valor crítico 𝑡0.975,17 = 2.110
La región critica o de rechazo de H0 es el intervalo:
RC = {𝑇 < −2.110 𝑜 𝑇 > 2.110}
3. Decisión: De la muestra se obtienen:

La varianza común:
(𝑛 −1)𝑠𝑐2 +(𝑛2 −1)𝑠𝑐2 9∗1.8222+8∗1.4999
𝑠𝑐2 = 1 = = 1.67053
𝑛1 + 𝑛2 – 2 10+9−2
El error típico de la diferencia de medias:
𝑠2 𝑠2
𝐸𝑇 = √𝑛𝑐 + 𝑛𝑐 =0.594
1 2
La estadística calculada:
𝑋̅1 − 𝑋̅2 5.4 − 7.0

𝑡= = = −2.694
𝐸𝑇 0.594
Y dado que 𝑡 = −2.694 ∈ 𝑅𝐶 de vemos rechazar H0 y concluir que los promedios de
los tiempos de tratamientos con las medicinas Ay B so9n diferentes.
Finalmente, dado 𝛼=0.05, grados de libertad = 17 y la hipótesis H1: 𝜇1 < 𝜇2 , el valor

crítico de la prueba unilateral es 𝑡0.05,17 = −1.740 y la región crítica es el intervalo:
RC = {𝑇 < −1.740}
Y dado que 𝑡𝑐𝑎𝑙 = −2.694 ∈ 𝑅𝐶 debemos rechazar H0 y concluir que la medicina A

más eficaz que la medicina B.
La probabilidad P de esta prueba unilateral es P= P 𝑃[𝑇 > 2.694] = 0.0075 y de la

prueba bilateral y P= 2x 0.0075= 0.015. Observe que ambos valores son menores que
𝛼 = 0.05.
Por lo que se debe rechazar H0 en ambos casos.

B. Dos poblaciones normales
Con varianzas desconocidas supuestas distintas 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐
Si las varianzas de las dos poblaciones normales independientes son desconocidas

son desconocidas pero supuestas diferentes (𝜎12 ≠ 𝜎22 ), entonces, la estadística de la
prueba es,
(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )

𝑇= ~ 𝑡(𝑟)
𝑠2 𝑠2
√ 𝑐 + 𝑐
𝑛1 𝑛2
Donde, el número de grados de libertad está dado por:
3
𝑠2 𝑠2
[𝑛𝑐 + 𝑛𝑐 ]
1 2
𝑟= 2 2
𝑠2 𝑠2
[𝑛𝑐 ] [𝑛𝑐 ]
1 2
+
𝑛1 − 1 𝑛2 − 1
Dado que r rara vez es un entero, se redondea al entero más cercano.
Si la hipótesis nula H0: 𝜇1 = 𝜇2 es supuesta verdadera, entonces la estadística es
(𝑋̅1 − 𝑋̅2 )
𝑇= ~ 𝑡(𝑟)
𝑠2 𝑠2
√ 𝑐 + 𝑐
𝑛1 𝑛2
En esta distribución T especificada por H0 se determina la región crítica RC de la

prueba cuya probabilidad sea igual al nivel de significación 𝛼.
De la muestra se calcula el valor T dado por:
𝑋̅1 − 𝑋̅2
𝑡=
𝐸𝑇
𝑠2 𝑠2
Donde, ET = √𝑛𝑐 + 𝑛𝑐 es el error típico de la diferencia de medias
1 2
La regla de decisión de una prueba bilateral o unilateral de dos medias consiste en

rechazar H0 si 𝑡 ∈ 𝑅𝐶 y no rechazar H0 en caso contrario.
Las regiones críticas y las reglas de decisión son similares a los del caso A) pero con r
grados de libertad.
Ejemplo n°2.2:
El agente de compras de una empresa quiere decidir la adquisición de una de dos

marcas de máquinas para procesar cierto producto. Por cuestiones de precio él está
pensando en comprar la marca A, a no ser que haya evidencias de la maquina B es más

veloz. Se le permitió operar los dos tipos de máquinas durante un periodo de prueba
observando los tiempos (en segundos) por unidad producida, luego, escogió al alzar una
muestra de 10 tiempos por máquina. Las maquinas son:
Maquina A: 55, 56, 57, 56, 58, 53, 54, 59, 60, 57
Maquina B: 50, 51, 42, 50, 40, 60, 53, 44, 58
¿Cree usted que el agente debería elegir la maquina B?. Aplique tanto el método de
prueba de hipótesis como el de intervalo de confianza, asumiendo 𝛼 = 0.05 y las
poblaciones de tiempos empleados, normales.
Solución:
Sean 𝑋̅1 y 𝑋̅2 las variables definen las poblaciones de los tiempos empleados por
maquinas A y B respectivamente. Se supone que X1 ~ 𝑁 (𝜇1 , 𝜎12 ) y X2 ~ 𝑁 (𝜇2 , 𝜎22 ).
𝑥1 56.5, 𝑆12 = 4,7222, n2= 10, ̅̅̅=

De la muestra se obtienen: n1= 10, ̅̅̅= 𝑥2 49.6 , 𝑆22 = 41,822.
Prueba de la homogeneidad de dos varianzas

2. Estadísticas y región critica. La estadística de la prueba especificada por
la hipótesis nula H0 supuesta verdadera es:
F = 𝑆12 / 𝑆22 ~𝐹(9.9)
En esta distribución, dado el nivel de significación: 𝛼 = 0.05 y la hipótesis
H1 indica una prueba bilateral, se hallan los valores críticos:
𝑓0.025,9.9 = 1/𝑓0.975,9.9 = 1/4.03 = 0.248 𝑦 𝑓0.975,9.9 = 4.03
Luego, la región critica o de rechazo de H0 está dada por:
RC = {𝐹 < 0.248 𝑜 𝐹 > 4.03 }
3. Decisión: De la muestra se obtiene 𝑓𝑐𝑎𝑙 = 𝑆12 / 𝑆22 = 0.1129

Dado que 𝑓𝑐𝑎𝑙 = 0.1129 ∈ 𝑅𝐶 se debería rechezar H0 y concluir que son
diferentes las varianzas de las dos poblaciones de los tiempos de proceso de
producción.
1
La probabilidad P de esta prueba es P= 2x P [𝐹(9.9) > 0.1129 = 8.856] =
0.003 < 𝛼 = 0.05
Prueba de la diferencia de las dos medias

1. Hipótesis: Probaremos H0: 𝜇1 = 𝜇2 contra H1: 𝜇1 > 𝜇2.
2. Estadísticas y región critica de la prueba: Dado que hay prueba de que las
dos varianzas poblaciones son diferentes, la estadísticas especificada por H0
cuando está es supuesta verdadera está dada por:
(𝑋̅1 − 𝑋̅2 )
𝑇= ~ 𝑡(𝑟)
𝑠𝑐2 𝑠𝑐2
√ +
𝑛 1 𝑛 2

Donde,
2
𝑠 𝑠 2 2 4.72 41.82 2
[ 𝑐+ 𝑐] [ 10 + 10 ]
𝑛1 𝑛2
𝑟= 2 2 2 = 4.72 2 41.82 2
𝑠 𝑠2
[𝑛𝑐 ] [𝑛𝑐 ] [ ] [
10 + 10
]
1 2
+ 9 9
𝑛1 −1 𝑛2 −1
En esta distribución t(11) , dado el nivel de significación: : 𝛼 = 0.05 y la hipótesis H1

indica una prueba bilateral, se ubica el valor critico 𝑡0.9500,11 = 1.796
La región critica o de rechazo de H0 es el intervalo:
RC = {𝑇 > 1.796}
3. Decisión: De la muestra se obtienen:

El error típico de la diferencia de medias:
𝑠2 𝑠2
𝐸𝑇 = √𝑛𝑐 + 𝑛𝑐 =2.1574
1 2
La estadística calculada:
𝑋̅1 − 𝑋̅2 6.9

𝑡= = = 3.198
𝐸𝑇 2.1574
Y dado que 𝑡 = 3.198 ∈ 𝑅𝐶 de vemos rechazar H0 y concluir que los agentes debería
adquirir la maquina B.
La probabilidad P de la prueba es P [𝑇 > 3.198] = 0.004 que nos lleva a rechazar

H0 en una prueba unilateral.
Intervalo de estimación de (𝜇1 − 𝜇2 ) con nivel de confianza 1-𝛼= 0.95 está dado por los
siguientes valores extremos:
6.9 ∓ 2.201 𝑥 2.1574 𝑜 6.9 ∓ 4.7484

Dado que 𝜇1 − 𝜇2 ∈ [2.152 , 11.648 ] se concluye que 𝜇1 > 𝜇2
Finalmente, dado 𝛼=0.05, grados de libertad = 17 y la hipótesis H1: 𝜇1 < 𝜇2 , el valor

critico de la prueba unilateral es 𝑡0.05,17 = −1.740 y la región critica es el intervalo:
RC = {𝑇 < −1.740}
Y dado que 𝑡𝑐𝑎𝑙 = −2.694 ∈ 𝑅𝐶 debemos rechazar H0 y concluir que la medicina A

más eficaz que la medicina B.
La probabilidad P de esta prueba unilateral es P= P 𝑃[𝑇 > 2.694] = 0.0075 y de la

prueba bilateral y P= 2x 0.0075= 0.015. Observe que ambos valores son menores que
𝛼 = 0.05.
Por lo que se debe rechazar H0 en ambos casos.

PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN DE UNA
POBLACIÓN
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria de tamaño n escogida de una población

Bernoulli B(1.p) donde, el parámetro desconocido P es la proporción de éxitos en la
población. Y sea la estadística.
𝑋
𝑃̅ =
𝑛
La proporción de éxitos en la muestra, donde X = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 es el número de
éxitos en la muestra.
La estadística X tiene una distribución exactamente binomial B(n,p). Pero, si n es

suficientemente grande (n ≥ 30), entonces, la estadística
𝑋−𝑛𝑥𝑝 𝑃̅ − 𝑝 TCL N (0,1)

𝑍= = ~
√𝑛 𝑥 𝑝 𝑥 (1 − 𝑝) √ 𝑝 𝑥 (1 − 𝑝)/𝑛 Aproximad
Si se supone verdadera la hipótesis nula 𝐻𝑂 : 𝑝 = 𝑝𝑜 , entonces, la distribución maestral

de X es exactamente binomial B(n, 𝑝𝑜 ) y la estadística:
𝑃̅ − 𝑝𝑜 TCL
𝑍= ~ N (0,1)
√ 𝑝𝑜 𝑥 (1 − 𝑝𝑜 )/𝑛 Aproximad
En esta distribución Z especificada por 𝐻𝑂 se determina la región critica RC de la
De la muestra se calcula el valor de Z dado por:
𝑃̅ − 𝑝𝑜 𝑝𝑜 𝑥 (1−𝑝𝑜 )
𝑧𝑐𝑎𝑙 = , donde ET = √ es el error típico de 𝑃̅
𝐸𝑇 𝑛
La regla de decisión de una prueba bilateral o unilateral de una proporción consiste

en rechazar 𝐻𝑂 si 𝑧𝑐𝑎𝑙 ∈ RC y no rechazar 𝐻𝑂 en caso contrario.
 Prueba bilateral
Si se prueba 𝐻𝑂 ∶ 𝑝 = 𝑝𝑜 contra 𝐻1 ∶ 𝑝 ≠ 𝑝𝑜 al nivel de significación 𝛼, la región

crítica en los valores de Z es el intervalo:
RC = {𝑍 < −𝑧1−𝛼/2 o 𝑍 > 𝑧1−𝛼/2 }
 Prueba unilateral cola derecha

Si la prueba es de 𝐻𝑂 ∶ 𝑝 = 𝑝𝑜 contra 𝐻1 ∶ 𝑝 > 𝑝𝑜 al nivel de significación 𝛼, la
región crítica en los valores de Z es el intervalo:
RC = {𝑍> 𝑧1−𝛼 }
 Prueba unilateral cola izquierda
Si se prueba 𝐻𝑂 ∶ 𝑝 = 𝑝𝑜 contra 𝐻1 ∶ 𝑝 < 𝑝𝑜 al nivel de significación 𝛼, la región

crítica en los valores de Z es el intervalo:
RC = {𝑍 < −𝑧1−𝛼 }
Ejemplo n°1:
Un productor afirma que al menos el 30% de todos los consumidores prefiere su
producto. Al parecer está afirmación es exagerada. Con el fin de comprobar la
afirmación del productor, se tomó una muestra aleatoria de 400 consumidores y se
encontró que 100 de ellos prefieren su producto.
a) ¿Existe suficiente evidencia para inferir que el productor no tiene la razón? ,
Utilice el nivel de significación del 1%.
b) Si se aplicara el intervalo RC = {X < 102} como la región de rechazo de la
hipótesis nula, donde X es el número de consumidores que prefieren el producto
en la muestra de 400, ¿Cuánto seria el nivel de significación de la prueba?
Solución:
a) Sea p el porcentaje de los consumidores que prefieren su producto.

100
De la muestra se obtiene, n = 400, x =100, 𝑃̅ = = 0,25.
400
1. Hipótesis: Probaremos, 𝐻𝑂 ≥ 𝑂. 30 contra 𝐻1 ∶ 𝑝 < 0.30
2. Estadística y región critica: La estadística de la prueba cuando se supone
𝐻𝑂 verdadera está dada por:
𝑃̅ − 0.3 TCL 0.3𝑥 0.7

𝑧= ~ N (0,1), donde, ET = √ 400 = 0.02291
𝐸𝑇 Aproximod
Dado el nivel de significación: 𝛼 = 0.01 y dado que la hipótesis 𝐻1 indica una prueba
unilateral cola izquierda en la distribución de Z se ubica el valor crítico 𝑧𝑐𝑎𝑙 = −2.33.
La región crítica de la prueba es entonces, RC = {𝑍 < −2.33}
3. Decisión. El valor de Z calculado de la muestra es:

𝑃̅ − 0.3 0.25−0.3
𝑧𝑐𝑎𝑙 = = = 2.18245
𝐸𝑇 0.02291
Como 𝑧𝑐𝑎𝑙 = - 2.18245 ∉ RC no deberíamos rechazar 𝐻𝑂 . Por lo tanto,

el productor tiene la razón.

Observe que en 𝑃̅, la región critica es, RC = {𝑃̅ < 0.247} y 𝑃̅ = 0.25 ∉
RC.
La probabilidad P de la prueba es P=P[𝑍 > 2.18] = 0.0146 > 𝛼 =
0.01.
b) Sea X= # de éxitos en la muestra, entonces, 𝑋 ~ 𝐵(400, 0.3) ≅

𝑁(120, (9.16515)2 ).
Por lo tanto, 𝛼 = 𝑃(𝑅𝐶) = 𝑃[𝑋 < 102] = 1 − 𝑃[𝑋 ≥ 102] = 0.025
Donde, 𝑃[𝑋 ≥ 102] = 𝑃[𝑍 ≥ (102 − 120)/9.16515] = 𝑃[𝑍 ≥ −1.96] =
0.975
Ejemplo n°2:
(Binomial con muestra pequeña)
Un laboratorio quiere comprobar que un nuevo medicamento que se prescribe para
aliviar determinada enfermedad es efectivo en más del 80% de los casos, por lo que en
un trabajo experimental se suministró tal medicamento a una muestra aleatoria de 15
pacientes resultando que 13 de ellos se aliviaron. En el nivel de significación del 5%,
¿Existe suficiente evidencia para concluir que realmente el medicamento es efectivo en
más del 80% de los casos?
SOLUCION
Sea X el número de pacientes que se alivian en la muestra de n = 15 pacientes. Entonces
𝑋 ~ 𝐵(15, 𝑝) donde p es el porcentaje de pacientes aliviados con el medicamento en la
población de todos los pacientes que sufren la enfermedad.
De la muestra se obtiene: n = 15, x = 13, 𝑃̅ = 13/15
Dado que la muestra es pequeña realizaremos la prueba de la hipótesis 𝐻𝑂 ∶ 𝑝 = 0.80
contra 𝐻1 ∶ 𝑝 > 0.80, calculando la probabilidad P de la prueba y comparándolo luego
con el nivel de significación 𝛼 = 0.05
Si la hipótesis nula es cierta, entonces, la variable 𝑋 ~ 𝐵(15, 0.8). Por lo tanto, se tiene:
P = P[𝑃̅ > 13/15] = 𝑃[𝑋 > 13] = 0.16713
Y dado que P = 0.16713 > 𝛼 = 0.05, no se debe rechazar 𝐻0 el medicamento no es

efectivo en más del 80 % de los casos.

PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE
PROPORCIONES DE DOS POBLACIONES INDEPENDIENTES
Son X1 y Y2 el número de éxitos en dos muestras aleatorias independientes de tamaños

n1 y n2 seleccionadas respectivamente de dos poblaciones de Bernoulli B(1, p1) y
B(1,p2), donde, los parámetros desconocidos p1 y p2 son las proporciones de éxitos
poblacionales respectivos.
𝑋1 𝑋2
⃐𝑃1 = 𝑦 ̅̅̅
𝑃2 =
𝑛1 𝑛2
Si n1 y n2 son suficientemente grandes (n1 ≥ 30 y n2 ≥ 30), entonces, la variable aleatoria

TCL
̅̅̅
𝑃1 − ̅̅̅
𝑃2 −(𝑝1 − 𝑝2 )
𝑍= 𝑝 (1−𝑝 ) 𝑝 (1− 𝑝 )
N (0.1)
√ 1𝑛 1+ 2 𝑛 2
1 2
Aproximad
Y si la hipótesis H0 : p1 = p2 = p se supone verdadera, la estadística es entonces.
TLC
𝑃̅1 − 𝑃̅2
𝑍= ~ 𝑁(0,1)
𝐸𝑇
Aproximad
Donde, ET= √ 𝑛̂ + 𝑛 es el error típico de 𝑝

𝑝𝑞 ̂
𝑝𝑞 𝑋 +𝑋
𝑝2 y pc o 𝑝̅ = 𝑛1 + 𝑛2 es el valor común
̅̅̅1 − ̅̅̅
1 2 1 2
de las proporciones muéstrales, resultando un estimador insesgado de:

p1 = p2 = p (probar!)
En esta distribución Z especializada por H0 se determina la región crítica RC de la

De las muestras se calcula el valor de Z dado por:
𝑃̅1 − ̅̅̅
𝑃2
𝑍𝐶𝐴𝐿 =
𝐸𝑇
La regla de decisión de una prueba bilateral o unilateral de dos proporciones consiste en
rechazar H0 si= zcal ϵ RC y no rechazará H0 en caso contrario.
Las regiones críticas y las reglas de decisión de esta prueba Z son similares a los de la
sección 10.8.1

Ejemplo n°1:
Con el fin de conocer el nivel de aceptación de un producto un analista cuantitativo
realizo un estudio de opinión en dos ciudades del interior del País. En Chiclayo 120
consumidor de una muestra al azar de 300 opinaron aceptando el producto, mientras
que, en Arequipa 120 consumidores de una muestra al azar de 400 opinaron estar de
acuerdo con el producto. ¿Puede considerarse significativa la diferencia de las dos
proporciones muestrales con una probabilidad de error tipo 1 al nivel del 5%?
Solución:
Sean p1 y p2 las proporciones de consumidores que aceptan el productoen Chiclayo y
Arequipa respectivamente.
De la muestras se obtiene: n1= 300, x1= 120, 𝑝

̅̅̅1 120/300 = 0.4, n2=400, x2=120,
120+120
𝑝2 =120/400=0.3. Por lo tanto, 𝑝̂ =
̅̅̅ = 0.34286 y el error típico de 𝑝
̅̅̅1 − ̅̅̅
𝑝2 es
300+400
𝑝̂𝑞̂ 𝑝̂𝑞̂ 1 1
𝐸𝑇 = √𝑛 + 𝑛 = √0.34286𝑥0.65714𝑥(300 + = 0.03625
1 2 400
1. Hipótesis. Probaremos H0 : p1 = p2 contra H1 : p1 > p2
2. Estadística y región crítica. La estadística de la prueba se supone H0 verdadera está

dada por:
TLC
𝑝
̂1 − 𝑝
̂2
𝑧= ~ 𝑁(0,1)
𝐸𝑇
Aproximad
Dado el nivel de significación ἀ = 0.05 y dado que la hipótesis H1 indica una prueba
unilateral cola derecha, en la distribución de Z se halla en valor crítico z0.95 = 1.645. Por
lo tanto, la región crítica de la prueba es el intervalo RC = [Z > 1.645]
3. Decisión. El valor de Z calculado de la muestra es:

̅̅̅̅−
𝑝 1 ̅̅𝑝̅̅
2 0.4−0.3
𝑍𝑐𝑎𝑙 = = 0.03625 = 2.7586
𝐸𝑇
Y dado que zcal = 207586 ϵ RC, deberíamos rechazar H0 e inferir que en Chiclayo el
producto tiene más aceptación que en Arequipa.
La probabilidad P de esta prueba es P= P[Z >2.76] = 0.0029 < ἀ= 0.05, por lo que se
rechaza H0.

Ejemplo n°2:
Recientemente Lenovo S.A ha experimentado un incremento en el número de unidades

defectuosas. El supervisor de producción considera que el turno de noche produce una
proporción más elevada de defectos que los del turno de día. Para comparar la
proporción de defectos, se toma una muestra de 500 unidades de la producción del turno
día y revela 14 defectos. Una muestra de 700 unidades del turno de la noche muestra 22
defectos. Si la proporción más grande de defectos se origina en la producción nocturna,
el supervisor pretende instituir un programa de capacitación para que los trabajadores
mejoren sus destrezas laborales. ¿Al nivel del 5% debería implementarse el programa?
𝐻0 : 𝑃𝑑 = 𝑃𝑛
𝐻1 : 𝑃𝑑 < 𝑃𝑛 Una cola a la
izquierda
Datos:
Día Noche
n=500 n=700
x=14 x=22
14 22
𝑝̂𝑑 = 𝑝̂𝑛 =
500 700
𝑥1 + 𝑥2 14 + 22
̅=
𝒑 = = 0.03
𝑛1 + 𝑛2 500 + 700
14 22
(𝑝̂1− 𝑝̂2 )−(𝑝1 −𝑝2 ) (𝑝̂1− 𝑝̂2 )−(0) ( − )−(0)
500 700
𝒁= ̅𝑞
𝑝 ̅ 𝑝
̅𝑞̅
= 1 1
= 1 1
= −𝟎. 𝟑𝟒𝟑
√𝑛 +𝑛 √𝑝̅ 𝑞̅(𝑛 +𝑛 ) √0.03(1−0.03)( + )
1 2 1 2 500 700
Acepta 𝐻0
como
verdadera
RPTA: No existe evidencia muestral suficiente para probar que el turno noche produce una
proporcion mas elevada de defectos . No deberia implementarse el programa.

 EJERCICIOS PROPUESTOS:
Una media
1. Un productor de cápsulas de uña de gato afirma que la demanda promedio de su

producto en el mercado es de 1000 cápsulas diarias. Sin embargo, un estudio de la
demanda de su producto en 36 días aleatorios de una media y una desviación estándar
de 850 y 360 cápsulas diarias respectivamente. ¿Son estos resultados suficientes
evidencias para contradecir la afirmación de este producto? Utilice el nivel de
significación 𝛼 = 1.5% en una prueba de unilateral
𝑅𝑝𝑡𝑎. 𝐻0 : 𝜇 ≥ 1,000 , 𝐻1 : 𝜇 < 1,0000, 𝑧𝑐𝑎𝑙 = −2.5, 𝑅𝐶 = {𝑍 < −2.17}, 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
2. La duración de cierta marca de baterías es una variable aleatoria cuya distribución se

supone normal. Se estima que su duración media es de 500 horas y el 95% del total
duran entre 480.4 y 519.6 horas. Si en una muestra aleatoria de 9 de tales baterías se
encuentra que la duración media es 495 horas, ¿Es esto evidencia para concluir al nivel
de significación del 5% que la duración media de todas esas baterías es diferente de 500
horas?
𝑅𝑝𝑡𝑎. 𝐻0 : 𝜇 = 500 , 𝐻1 : 𝜇 ≠ 500, 𝑧𝑐𝑎𝑙 = −1.5, 𝑅𝐶 = {−1.96 ≤ 𝑍 ≤ 1.96}, 𝜎 = 10
Una proporción
3. El director de la bolsa de trabajo de la universidad afirma que el 10%de sus egresados
consiguen empleo con una remuneración mayor de $3000 mensuales. Al parecer el
porcentaje indicado es demasiado optimista, por lo que se encarga este estudio a un
grupo de trabajo en estadística ¿cuál debería ser el tamaño de la muestra y cual la región
crítica que se debe diseñar el grupo si se quiere el riesgo sea de 0.2514 de cometer error
tipo I y que el riesgo de 0.0853 de tomar la decisión errada de aceptar la hipótesis del
director cuando la proporción de egresados con una remuneración mayor de $ 3,000
realmente es 5%.
Rpta. n=100, k=0.08
Diferencia de dos medias
4. Un informe estadístico indica entre otras cosas que el nivel de aptitud de los
postulantes hombres y mujeres a la policía nacional son iguales en promedio, y cada una
se distribuye de forma normal 𝜎1 = 8, 𝜎2 = 7 respectivamente. Si dos muestras
aleatorias de tamaño 20 y 25 escogidas de las poblaciones definidas, dieron los niveles
promedios de aptitud 200 y 205 respectivamente, ¿Cree usted, al nivel de significación
1%, que las medias de las dos poblaciones son distintas?¿Cuánto es la probabilidad P de
la prueba?
Rpta 𝐻0 :𝜇1 = 𝜇2 , 𝐻1 :𝜇1 ≠ 𝜇2 , 𝑍𝑐𝑎𝑙 = −2.2, RC={𝑍 < −2.575 𝑜 𝑍 > 2.575},
P=0.0278

Diferencia de dos proporciones
5. El grupo C&P quiere saber si una de sus marcas de cerveza promocionada a nivel
nacional lo consumen los de tarapoto en mayor porcentaje que los del cuzco. Si en dos
muestras aleatorias independientes de consumidores de tamaños 900 y 800 de tarapoto y
cuzco se encontró respectivamente que 270 y 200 consumen la marca del producto,
¿Cuál es su conclusión al nivel α = 0.02?¿Cuánto es la probabilidad P de la prueba?
Rpta. 𝐻𝑂 ∶ 𝑝 = 𝑝𝑜 , 𝐻1 ∶ 𝑝 > 𝑝𝑜 p=0.2765, 𝑧𝑐𝑎𝑙 = 2.3, RC={𝑍 > 2.05}, la consumen
en tarapoto, P= 0.0107
BIBLIOGRAFÍA
 SUÁREZ, Mario, (2012), Interaprendizaje de Probabilidades y Estadística
Inferencial con Excel, Winstats y Graph, Primera Edición. Imprenta M & V,
Ibarra, Ecuador.
 Hopkins, K.D., Hopkins, B.R. y Glass, G.V. (1997, 3ª Ed). Estadística Básica.
 CORDOVA, Manuel (2003)Estadística descriptiva e inferencial. Editorial
Mosilera.Quinta edición
WEBGRAFÍA:
 “Prueba de hipótesis de dos proporciones”
https//www.youtube.com/watch?v=fL03eGnpPR0
 “004 PH para dos proporciones”
https://www.youtube.com/watch?v=NPGMNPTncMw

Estadistica Final

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Final

Cargado por

Copyright:

Formatos disponibles

“Año del dialogo y la reconciliación nacional”

UNIVERSIDAD NACIONAL DE PIURA

Ingeniería agroindustrial e industrias alimentarias

Mg. Mariela Córdova Espinoza

 Aquino Godos Fiorella

PRUEBAS DE HIPÓTESIS Página 1

PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN………………………………………………….………..21

PRUEBA DE HIPÓTESIS PARA DOS PROPORCIONES………………………………………………………..24

PRUEBAS DE HIPÓTESIS Página 2

PRUEBAS DE HIPÓTESIS Página 3

Un error común de percepción es que las pruebas estadísticas de hipótesis están

PASOS DE LA PRUEBA DE HIPÓTESIS

PRUEBAS DE HIPÓTESIS Página 4

1.1Prueba de hipótesis de la media de una población con varianza 𝝈𝟐

Cuya distribución es exacta o aproximadamente normal N(0,1)

 Prueba unilateral de cola a la derecha

Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 > 𝜇0 , dado el nivel de significación α y

PRUEBAS DE HIPÓTESIS Página 5

 Prueba unilateral de cola izquierda

Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 < 𝜇0 , dado el nivel de significación α y

PRUEBAS DE HIPÓTESIS Página 6

 Prueba bilateral o de dos colas

Si se prueba 𝐻0 : 𝜇 = 𝜇0 contra 𝐻1 : 𝜇 ≠ 𝜇0 , dado el nivel de significación α y

PRUEBAS DE HIPÓTESIS Página 7

Consecuentemente la región de aceptación de 𝐻0 en 𝑋̅ es el intervalo RA={𝑎 ≤

Para comprobar si está controlado el proceso de producción de un producto que

PRUEBAS DE HIPÓTESIS Página 8

Luego la región crítica de la prueba en la variable Z está dada por:

1.2Prueba de hipótesis de la media de una población con varianza 𝝈𝟐

Sea 𝑋1 , 𝑋2 … 𝑋𝑛 una muestra aleatoria de tamaño n escogida de una población

Si la población es normal y con varianza desconocida, está probado que la

PRUEBAS DE HIPÓTESIS Página 9

 Prueba bilateral o de dos colas

 Prueba unilateral de cola a la derecha

PRUEBAS DE HIPÓTESIS Página 10

 Prueba unilateral de cola a la izquierda

PRUEBAS DE HIPÓTESIS Página 11

En esta distribución, dado el nivel de significación α = 0.05 y dado que la

Y dado que t cal = -1.3693 no pertenece a RC no se debería rechazar: 𝐻0 y concluir

PRUEBAS DE HIPÓTESIS Página 12

Se usa para estimar parámetros de poblaciones y probar (contrastar) si una afirmación se

2.1 Prueba de hipótesis de la diferencia de las medias de dos poblaciones con

PRUEBAS DE HIPÓTESIS Página 13

PRUEBAS DE HIPÓTESIS Página 14

Con varianzas desconocidas supuesta iguales: 𝝈𝟐𝟏 = 𝝈𝟐𝟐 = 𝝈𝟐

Si las dos poblaciones son normales, independientes y con varianzas

(𝑛1 −1)𝑠𝑐2 +(𝑛2 −1)𝑠𝑐2

La regla de decisión de una prueba bilateral o unilateral de dos medias consiste en

1) Prueba bilateral o de dos colas

PRUEBAS DE HIPÓTESIS Página 15

Una medicina A fue aplicada a una muestra de 10 pacientes aquejados de cierta

𝑥1 5.4, 𝑆12 = 1,8222, n2= 9, 𝑥

Luego, la región critica o de rechazo de H0 está dada por:

RC = {𝐹 < 0.244 𝑜 𝐹 > 4.36 }

3. Decisión: De la muestra se obtiene 𝑓𝑐𝑎𝑙 = 𝑆12 / 𝑆22 = 1,215

Prueba de la diferencia de las dos medias

1. Hipótesis: Probaremos H0: 𝜎12 = 𝜎22 contra H1: 𝜎12 ≠ 𝜎22 .

PRUEBAS DE HIPÓTESIS Página 16

En esta distribución, dado el nivel de significación: 𝛼 = 0.05 y la hipótesis H1

La región critica o de rechazo de H0 es el intervalo:

RC = {𝑇 < −2.110 𝑜 𝑇 > 2.110}

3. Decisión: De la muestra se obtienen:

𝑋̅1 − 𝑋̅2 5.4 − 7.0

Finalmente, dado 𝛼=0.05, grados de libertad = 17 y la hipótesis H1: 𝜇1 < 𝜇2 , el valor