Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD:
Ingeniería industrial
ESCUELA PROFESIONAL:
Estadística General
DOCENTE:
TEMA:
Pruebas de hipótesis para una media, dos medias, una proporción, dos
proporciones
INTEGRANTES DE GRUPO:
INTRODUCCIÓN ............................................................................................................................ 3
PRUEBAS DE HIPÓTESIS ................................................................................................................ 4
PRUEBA DE HIPOTESIS PARA UNA MEDIA…….……………………………………………………………………5
PRUEBA DE HIPOTESIS PARA UNA MEDIA CON VARIANZA CONOCIDA………………………...5
PRUEBA DE HIPOTESIS PARA UNA MEDIA CON VARIANZA DESCONOCIDA………………….9
PRUEBA DE HIPÓTESIS PARA DOS MEDIAS…………………………………………………………………….13
PRUEBA DE HIPOTESIS PARA DOS MEDIAS CON VARIANZA CONOCIDA……………………..13
PRUEBA DE HIPOTESIS PARA DOS MEDIAS CON VARIANZA DESCONOCIDA……….………15
EJERCICIOS PROPUESTOS…………………………………………………………………………………………………..27
BIBLIOGRAFÍA…………………………………………………………………………………………………………………….28
Las pruebas de hipótesis junto a los intervalos de confianza constituyen dos enfoques
fundamentales de la inferencia estadística, es decir a ese proceso de estudiar muestras y
usar la información obtenida en estas y obtener conclusiones acerca de la población
(Blair & Taylor, 2008).
El proceso de inferencia estadística a partir de las pruebas de hipótesis se basa en hacer
suposiciones respecto a características o fenómenos de interés en una población (o
varias poblaciones) y tomando una muestra representativa de datos de esa población
(muestra aleatoria), de manera que estos datos muéstrales sirvan para contrastar la
validez de nuestra hipótesis (Celis & Labrada, 2014; Daniel, 2002).
El objetivo de este trabajo es exponer los métodos estadísticos básicos que se aplican
para tomar decisiones sobre la conjetura que se hace acerca del valor numérico del
parámetro de una población en estudio y que es sometida a comprobación experimental
con el propósito de determinar si los resultados de una muestra aleatoria extraída de esa
población contradicen o no en forma significativa tal afirmación.
Básicamente, el proceso de la prueba de hipótesis nos conduce a tomar la decisión de
rechazar o no rechazar la afirmación o conjetura acerca del valor numérico del
parámetro de la población en estudio. Tal suposición tiene el nombre genérico de
hipótesis estadística y puede ser verdadera o no. Por esto, la inferencia incluye una
medida del error que se cometería al rechazar la hipótesis principal cuando realmente es
cierta. Esta medida de error es denominado el nivel de significación.
En general, las hipótesis estadísticas son afirmaciones no solamente acerca de los
parámetros de una población si no también acerca de la forma como se distribuye la
población definida por la variable aleatoria en estudio. La conjetura hecha sobre el
parámetro o sobre la forma de la distribución de una población sometida a
comprobación experimental será rechazada sólo si el resultado muestral produce,
cuando la hipótesis es cierta, una probabilidad menor que el nivel de significación dado.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se
probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no
hay diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que
es verdadero de acuerdo con la evidencia proporcionada por los datos de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis
nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel
de significancia (denotado como α o alfa), entonces puede rechazar la hipótesis nula.
̅
Región crítica en el rango de variación de 𝑿
𝑋̅ −𝜇0
Si se sustituye Z= 𝜎/ en RC se obtiene la región crítica en el rango de
√𝑛
variación de 𝑋̅ dada por: RC= {𝑋̅ < 𝑎 𝑜 𝑋̅ > 𝑏}
𝜎 𝜎
Donde, a= 𝜇0 − 𝑍1−𝛼 ( ) y b= 𝜇0 + 𝑍1−𝛼 ( )
√𝑛 √𝑛
Ejemplo n°1:
Tiene distribución es t-student con n-1 grados de libertad valido para n≥2. Esto es
T~t(n-1).
Cuando la hipótesis nula 𝐻0 : 𝜇 = 𝜇0 es supuesta verdadera, la estadística de la
prueba especificada por 𝐻0 es entonces:
𝑋̅ −𝜇0
T= ~ 𝑡(𝑛 − 1).
𝑆/√𝑛
En esta distribución de T se determina la región crítica de la prueba cuya
probabilidad sea igual al nivel de significación 𝛼.
𝑋̅ −𝜇0
De la muestra se calcula el valor de T dado por: 𝑡𝑐𝑎𝑙 = 𝑠/√𝑛
(𝑋̅ −𝜇0 )
Por otro lado, si se sustituye T= en la región crítica RC y operando se obtiene
𝑠/√𝑛
la región crítica de la prueba en la variable 𝑋̅ dada por
RC= {𝑋̅ < 𝑎 𝑜 𝑋̅ > 𝑏}
Donde, a= 𝜇0 −𝑡1−𝛼,𝑛−1 (𝑠/√𝑛) b= 𝜇0 +𝑡1−𝛼,𝑛−1 (𝑠/√𝑛)
2 2
𝑋̅ −𝜇0
Por otro lado, si se sustituye T= 𝑆/ en la región crítica RC y operando se obtiene
√𝑛
la región crítica en el rango en la variable 𝑋̅ dada por RC={𝑋̅ > 𝑎1 } donde 𝑎1 =
𝜇0 −𝑡1−𝛼,𝑛−1 (𝑠/√𝑛)
2
La metodología que utilizaremos para comprobar si una diferencia observada entre dos
medias muestrales se puede atribuir a la causalidad, se basa en los siguientes
fundamentos teóricos
Si X1 y X2 son las medias de dos muestras aleatorias e independientes, grandes de
tamaño n1 y n2, la distribución muestral del estadístico X1-X2 se aproxima a una normal
que tiene como media μ1 – μ2 y como desviación estándar α (X1-X2) (también conocido
como error estándar).
Ejemplo n°1:
¿Existen diferencias en los promedios de calificaciones obtenidos en castellano de dos
cursos de 1º año de bachillerato de diferentes Instituciones impartidos por un mismo
profesor?
Un curso promedio 18.2 puntos y el otro promedio 16.3 puntos.
A un nivel de significancia de 0.01, ¿es razonable concluir que la calificación promedio
obtenida por el Instituto A es menor que el obtenido en el Instituto B?
1. Definir hipótesis: H0: μ1 ≤ μ2 H1: μ1 > μ2
2. Definir Nivel de significación: α = 0.01, Z= + - 2,33
3. Calcular Z: Z = (X1-X2) / √ (S21 / n1) + (S22 / n2) Z = -9,89
4. Regla de Decisión: Rechazar la hipótesis nula y aceptar la hipótesis alternativa si
el valor calculado de z excede 2.33. Aceptamos la hipótesis nula si z es menor a
2.33.
5. Decisión: Debido a que el valor calculado de z (-9,89) es menor que el valor
crítico (-2.33), se acepta la hipótesis nula y se concluye que con base en la
información de las muestras, el instituto A obtiene menores calificaciones en
castellano que el instituto B a pesar de que cuentan con el mismo docente.
Sean 𝑋̅1 y 𝑋̅2 las medias y 𝑆12 y 𝑆22 las varianzas de dos muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2 respectivamente seleccionadas de dos
poblaciones normales con medias 𝜇1 y 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 desconocidas.
En esta distribución T especifica por H0 se ubica la región critica (RC) de la prueba cuya
probabilidad sea igual al nivel de significación α.
De las muestras se calcula el valor de T dado por:
𝑋̅1 − 𝑋̅2
𝑡=
𝐸𝑇
𝑠 2
𝑠 2
Donde, 𝐸𝑇 = √𝑛𝑐 + 𝑛𝑐 es el error típico de la diferencia de medias 𝑋̅1 − 𝑋̅2
1 2
Solución:
Sean 𝑋̅1 y 𝑋̅2 las variables aleatorias que definen las poblaciones de los tiempos
en días de tratamiento de las medicinas A y B respectivamente. Se supone que X1
~ 𝑁 (𝜇1 , 𝜎12 ) y X2 ~ 𝑁 (𝜇2 , 𝜎22 ).
La estadística calculada:
RC = {𝑇 < −1.740}
(𝑋̅1 − 𝑋̅2 )
𝑇= ~ 𝑡(𝑟)
𝑠2 𝑠2
√ 𝑐 + 𝑐
𝑛1 𝑛2
𝑋̅1 − 𝑋̅2
𝑡=
𝐸𝑇
𝑠2 𝑠2
Donde, ET = √𝑛𝑐 + 𝑛𝑐 es el error típico de la diferencia de medias
1 2
Las regiones críticas y las reglas de decisión son similares a los del caso A) pero con r
grados de libertad.
Ejemplo n°2.2:
¿Cree usted que el agente debería elegir la maquina B?. Aplique tanto el método de
prueba de hipótesis como el de intervalo de confianza, asumiendo 𝛼 = 0.05 y las
poblaciones de tiempos empleados, normales.
Solución:
Sean 𝑋̅1 y 𝑋̅2 las variables definen las poblaciones de los tiempos empleados por
maquinas A y B respectivamente. Se supone que X1 ~ 𝑁 (𝜇1 , 𝜎12 ) y X2 ~ 𝑁 (𝜇2 , 𝜎22 ).
RC = {𝑇 > 1.796}
La estadística calculada:
Intervalo de estimación de (𝜇1 − 𝜇2 ) con nivel de confianza 1-𝛼= 0.95 está dado por los
siguientes valores extremos:
RC = {𝑇 < −1.740}
𝑃̅ − 𝑝𝑜 TCL
𝑍= ~ N (0,1)
√ 𝑝𝑜 𝑥 (1 − 𝑝𝑜 )/𝑛 Aproximad
En esta distribución Z especificada por 𝐻𝑂 se determina la región critica RC de la
prueba cuya probabilidad sea igual al nivel de significación 𝛼.
De la muestra se calcula el valor de Z dado por:
𝑃̅ − 𝑝𝑜 𝑝𝑜 𝑥 (1−𝑝𝑜 )
𝑧𝑐𝑎𝑙 = , donde ET = √ es el error típico de 𝑃̅
𝐸𝑇 𝑛
Ejemplo n°1:
Un productor afirma que al menos el 30% de todos los consumidores prefiere su
producto. Al parecer está afirmación es exagerada. Con el fin de comprobar la
afirmación del productor, se tomó una muestra aleatoria de 400 consumidores y se
encontró que 100 de ellos prefieren su producto.
a) ¿Existe suficiente evidencia para inferir que el productor no tiene la razón? ,
Utilice el nivel de significación del 1%.
b) Si se aplicara el intervalo RC = {X < 102} como la región de rechazo de la
hipótesis nula, donde X es el número de consumidores que prefieren el producto
en la muestra de 400, ¿Cuánto seria el nivel de significación de la prueba?
Solución:
Dado el nivel de significación: 𝛼 = 0.01 y dado que la hipótesis 𝐻1 indica una prueba
unilateral cola izquierda en la distribución de Z se ubica el valor crítico 𝑧𝑐𝑎𝑙 = −2.33.
La región crítica de la prueba es entonces, RC = {𝑍 < −2.33}
Ejemplo n°2:
(Binomial con muestra pequeña)
Un laboratorio quiere comprobar que un nuevo medicamento que se prescribe para
aliviar determinada enfermedad es efectivo en más del 80% de los casos, por lo que en
un trabajo experimental se suministró tal medicamento a una muestra aleatoria de 15
pacientes resultando que 13 de ellos se aliviaron. En el nivel de significación del 5%,
¿Existe suficiente evidencia para concluir que realmente el medicamento es efectivo en
más del 80% de los casos?
SOLUCION
Sea X el número de pacientes que se alivian en la muestra de n = 15 pacientes. Entonces
𝑋 ~ 𝐵(15, 𝑝) donde p es el porcentaje de pacientes aliviados con el medicamento en la
población de todos los pacientes que sufren la enfermedad.
De la muestra se obtiene: n = 15, x = 13, 𝑃̅ = 13/15
Dado que la muestra es pequeña realizaremos la prueba de la hipótesis 𝐻𝑂 ∶ 𝑝 = 0.80
contra 𝐻1 ∶ 𝑝 > 0.80, calculando la probabilidad P de la prueba y comparándolo luego
con el nivel de significación 𝛼 = 0.05
Si la hipótesis nula es cierta, entonces, la variable 𝑋 ~ 𝐵(15, 0.8). Por lo tanto, se tiene:
P = P[𝑃̅ > 13/15] = 𝑃[𝑋 > 13] = 0.16713
𝑃̅1 − 𝑃̅2
𝑍= ~ 𝑁(0,1)
𝐸𝑇
Aproximad
𝑃̅1 − ̅̅̅
𝑃2
𝑍𝐶𝐴𝐿 =
𝐸𝑇
La regla de decisión de una prueba bilateral o unilateral de dos proporciones consiste en
rechazar H0 si= zcal ϵ RC y no rechazará H0 en caso contrario.
Las regiones críticas y las reglas de decisión de esta prueba Z son similares a los de la
sección 10.8.1
Solución:
Sean p1 y p2 las proporciones de consumidores que aceptan el productoen Chiclayo y
Arequipa respectivamente.
𝑝̂𝑞̂ 𝑝̂𝑞̂ 1 1
𝐸𝑇 = √𝑛 + 𝑛 = √0.34286𝑥0.65714𝑥(300 + = 0.03625
1 2 400
Y dado que zcal = 207586 ϵ RC, deberíamos rechazar H0 e inferir que en Chiclayo el
producto tiene más aceptación que en Arequipa.
La probabilidad P de esta prueba es P= P[Z >2.76] = 0.0029 < ἀ= 0.05, por lo que se
rechaza H0.
𝐻0 : 𝑃𝑑 = 𝑃𝑛
𝐻1 : 𝑃𝑑 < 𝑃𝑛 Una cola a la
izquierda
Datos:
Día Noche
n=500 n=700
x=14 x=22
14 22
𝑝̂𝑑 = 𝑝̂𝑛 =
500 700
𝑥1 + 𝑥2 14 + 22
̅=
𝒑 = = 0.03
𝑛1 + 𝑛2 500 + 700
14 22
(𝑝̂1− 𝑝̂2 )−(𝑝1 −𝑝2 ) (𝑝̂1− 𝑝̂2 )−(0) ( − )−(0)
500 700
𝒁= ̅𝑞
𝑝 ̅ 𝑝
̅𝑞̅
= 1 1
= 1 1
= −𝟎. 𝟑𝟒𝟑
√𝑛 +𝑛 √𝑝̅ 𝑞̅(𝑛 +𝑛 ) √0.03(1−0.03)( + )
1 2 1 2 500 700
Acepta 𝐻0
como
verdadera
RPTA: No existe evidencia muestral suficiente para probar que el turno noche produce una
proporcion mas elevada de defectos . No deberia implementarse el programa.
Una proporción
3. El director de la bolsa de trabajo de la universidad afirma que el 10%de sus egresados
consiguen empleo con una remuneración mayor de $3000 mensuales. Al parecer el
porcentaje indicado es demasiado optimista, por lo que se encarga este estudio a un
grupo de trabajo en estadística ¿cuál debería ser el tamaño de la muestra y cual la región
crítica que se debe diseñar el grupo si se quiere el riesgo sea de 0.2514 de cometer error
tipo I y que el riesgo de 0.0853 de tomar la decisión errada de aceptar la hipótesis del
director cuando la proporción de egresados con una remuneración mayor de $ 3,000
realmente es 5%.
Rpta. n=100, k=0.08
Diferencia de dos medias
4. Un informe estadístico indica entre otras cosas que el nivel de aptitud de los
postulantes hombres y mujeres a la policía nacional son iguales en promedio, y cada una
se distribuye de forma normal 𝜎1 = 8, 𝜎2 = 7 respectivamente. Si dos muestras
aleatorias de tamaño 20 y 25 escogidas de las poblaciones definidas, dieron los niveles
promedios de aptitud 200 y 205 respectivamente, ¿Cree usted, al nivel de significación
1%, que las medias de las dos poblaciones son distintas?¿Cuánto es la probabilidad P de
la prueba?
Rpta 𝐻0 :𝜇1 = 𝜇2 , 𝐻1 :𝜇1 ≠ 𝜇2 , 𝑍𝑐𝑎𝑙 = −2.2, RC={𝑍 < −2.575 𝑜 𝑍 > 2.575},
P=0.0278
BIBLIOGRAFÍA
SUÁREZ, Mario, (2012), Interaprendizaje de Probabilidades y Estadística
Inferencial con Excel, Winstats y Graph, Primera Edición. Imprenta M & V,
Ibarra, Ecuador.
Hopkins, K.D., Hopkins, B.R. y Glass, G.V. (1997, 3ª Ed). Estadística Básica.
CORDOVA, Manuel (2003)Estadística descriptiva e inferencial. Editorial
Mosilera.Quinta edición
WEBGRAFÍA:
“Prueba de hipótesis de dos proporciones”
https//www.youtube.com/watch?v=fL03eGnpPR0
“004 PH para dos proporciones”
https://www.youtube.com/watch?v=NPGMNPTncMw