Semana 11 - Videoconferencia

Inferencia Estadística
Estimación Interválica y
Prueba de hipótesis para la
diferencia de parámetros
Módulo 10
Probabilidad y Estadística
2023-1
Videoconferencia 11
Actividades – Semana 11
Inicio : Lunes 29 de mayo a la 1:00 pm Revisa también la sección anuncios y en la semana 11 el

“Material Complementario – Semana 11” preparado
Cierre : Lunes 05 de junio a la 1:00 pm siempre pensando en ti.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
LOGRO DE LA SESIÓN
Al culminar el estudio del módulo, el estudiante estará en capacidad
de resolver casos tomando decisiones en situaciones reales,
aplicando los diferentes tipos de estimación interválica y pruebas de
hipótesis con información obtenida de dos muestras, utilizando el
complemento Excel -MegaStat.

parámetros
ÍNDICE
1. Introducción
2. Estimación de Intervalo de Confianza para la diferencia de medias casos Z y T
3. Prueba de Levene (Homogeneidad de Varianzas)
4. Estimación de Intervalo de Confianza para la diferencia de proporciones caso Z
5. Prueba de Hipótesis para la diferencia de medias, caso Z y T
6. Prueba de Hipótesis para la diferencia de proporciones, caso Z
7. Casos de estudio
8. Conclusiones
parámetros
INTRODUCCIÓN
El sueldo promedio de
los hombres es igual
del sueldo promedio
de las mujeres
IC / Ho: U1= U2
El porcentaje de
hombres que trabajan
es igual al de mujeres
IC / Ho: P1 = P2
parámetros
Resumen α: nivel de significancia,

Intervalos de Confianza (IC) 1- α = nivel de confianza
Para una muestra Para dos muestras
O dos grupos, comparar
IC para la media IC para la IC para la diferencia de IC para la diferencia de

(𝜇) proporción (𝑝) medias (𝜇1 − 𝜇2 ) proporciones (𝑝1 − 𝑝2 )
Var cuantitativa Var cuantitativas Var cualitativas

Var cualitativa
De la muestra Si n1 y n2 ≥ 30, Si n1 y n2 < 30, De las muestras (n1 y n2),
Si n ≥ 30, usar “Z” (n), Identificar x1 y x2 (nro de elementos
usar “z” usar “t” con característica de interés)
Identificar x
Si n < 30, usar “t” (nro de “Prueba de Levene” (Homogeneidad de varianzas)
elementos
Si: Valor-p < α , Varianzas desiguales
con
De la muestra (n), característica Si: Valor-p ≥ α , Varianzas iguales (homogéneas)
Calculamos: promedio de interés)
Y desvest De las muestras (n1 y n2),
Calculamos: promedio1, promedio 2, desvest1 y desvest2
parámetros
Intervalo de
confianza
para dos
muestras
Intervalo de confianza para la diferencia de medias, cuando n1 y n2 < 30 Intervalo de confianza para la diferencia de medias,
cuando n1 y n2 ≥ 30
CASO 1: Varianzas 𝑺𝟐𝟏 y 𝑺𝟐𝟐 desconocidas pero iguales (varianzas homogéneas).
𝑆2𝑝 = varianza ponderada

𝜎12 𝜎22
1 1 n1 − 1 S12 + n2 − 1 S22 IC μ1 − μ2 = x1 − x2 ∓ 𝑧1−,α +
IC μ1 − μ2 = x1 − x2 ∓ t n α Sp2 + Sp2 = 2 𝑛1 𝑛2
1 +n2 −2, 2 n1 n2 n1 + n2 − 2
CASO 2: Varianzas 𝑺𝟐𝟏 y 𝑺𝟐𝟐 desconocidas pero desiguales (varianzas heterogéneas).

: debe ser redondeo por aproximación simple.
2
S12 S22
𝑆12 𝑆22 n1 + n2
IC 𝜇1 − 𝜇2 = 𝑥1 − 𝑥2 ∓ 𝑡𝜐,𝛼 + υ= 2 2
2 𝑛1 𝑛2 S12 S22
n1 n2
+
n1 − 1 n2 − 1
Intervalo de confianza para la diferencia de

proporciones
ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2) ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2)
(ොp1 − pො 2) - Zo + ෡𝟏 − 𝐏
≤𝐏 ෡𝟐 ≤ (ොp1 − pො 2) + Zo +
n1 n2 n1 n2
parámetros
Análisis del Intervalo de confianza para la diferencia de parámetros
1
REGLA DE DECISION PARA EL USO DE IC CON DOS POBLACIONES
Caso 1: Cuando el IC es de la forma [ + , + ] , entonces el primer parámetro es mayor que el segundo.
Caso 2: Cuando el IC es de la forma [ - , + ] , entonces los parámetros son iguales.
Caso 3: Cuando el IC es de la forma [ - , - ] , entonces el primer parámetro es menor que el segundo.
2
PRUEBA DE LEVENE
La prueba de Levene que otorga el MegaStat prueba si dos muestras provienen de poblaciones con
varianzas homogéneas.
Para tomar una decisión se compara el valor de Sig. que da el reporte del MegaStat con el valor del nivel
de significación (α)
3 REGLA DE DECISION:
Si: Valor - p < α , No se asumen varianzas iguales
Si: Valor - p ≥ α , Se asumen varianzas iguales .
parámetros
Ejemplo 1:
La empresa Peruvian Center desea determinar si los trabajadores

de género masculino presentan mayor número medio de
enfermedades de riesgo que las de género femenino, con la
finalidad de proponer un control de salud ocupacional adicional
durante el año para el género que presenten mayor promedio de
número de enfermedades de riesgo. Se solicita tomar una decisión
considerando la información de la base de datos adjunta,
asumiendo un nivel de confianza del 98%. ¿A que género de
trabajadores se le debe brindar el control de salud ocupacional
adicional?
parámetros
parámetros
X: Número de enfermedades de riesgo Variable cuantitativa

Intervalo de confianza para la diferencia de medias (m1 – m2)
Datos: 𝑛1 = 25, 𝑛2 = 15, NC: 98%, a = 2% = 0.02 Como n1, n2 < 30, usamos la
Distribución T de Student
EN MEGASTAT: 2do
1ro
En la base de
datos de Excel
segmentamos
los datos de la 3ro
variable
número de
enfermedades
por género
Clic
parámetros
4to 5to
Obtenemos el siguiente resultado:
1ro. Seleccionamos los
datos de ambos grupos 5to. Clic en OK
3ro. Ingresamos NC
y activamos display
2do. Seleccionamos 4to. Activamos la prueba de

“t” porque n1, n2 < 30 homogeneidad de varianzas para
“asumiendo comprobar si las varianzas son iguales.
temporalmente“ que
las varianzas son
𝐼𝐶(𝜇1 − 𝜇2 ) = [−0.144; 1.051] Como significancia = 0.3556 > 0.02,
iguales
entonces se asumen varianzas iguales
Interpretando: Con un nivel de confianza del 98% la verdadera diferencia del número promedio de enfermedades de riesgo de los
trabajadores de género masculino y femenino, se encuentra contenido en [-0.144; 1.051]. Es decir el número promedio de enfermedades
de riesgo de los trabajadores de género masculino y femenino son iguales, por lo tanto no se debe llevar a cabo un control de salud
ocupacional adicional, pues ambos géneros presentan el mismo número medio de enfermedades de riesgo.
parámetros
X: Número de enfermedades de riesgo Variable cuantitativa

USANDO LA FÓRMULA:
Datos: 𝑛1 = 25, 𝑛2 = 15, NC: 98%, a = 2% = 0.02

De la muestra 1 calculamos: 𝑋ത1 = 0.92 y 𝑆1 = 0.81 (En Excel – PROMEDIO y DESVEST.M)
De la muestra 2 calculamos: 𝑋ത2 = 0.47 y 𝑆2 = 0.64 (En Excel – PROMEDIO y DESVEST.M)
Hallamos: 𝑡𝑛1+𝑛2−2,1−𝛼/2 = 𝑡25+15−2,1−0.02/2 = 𝑡38,0.99= 2.4286 En Excel = INV.T(0.99;38)
Asumiendo varianzas iguales: Calculando los intervalos:

2 2
n1 − 1 S1 + n2 − 1 S 2 1 1
Sp2 = IC μ1 − μ2 = x1 − x2 ∓ t n α Sp2 +
1 +n2 −2, 2 n1 n2
n1 + n2 − 2
25 − 1 0.812 + 15 − 1 0.642
1 1
Sp2 = IC μ1 − μ2 = 0.92 − 0.47 ∓ 2.4286 0.5653 +
25 + 15 − 2 25 15
Sp2 = 0.5653 𝐼𝐶(𝜇1 − 𝜇2 ) = [−0.144; 1.051]
Interpretando: Con un nivel de confianza del 98% la verdadera diferencia del número promedio de enfermedades de riesgo de los
trabajadores de género masculino y femenino, se encuentra contenido en [-0.144; 1.051]. Es decir el número promedio de
enfermedades de riesgo de los trabajadores de género masculino y femenino son iguales, por lo tanto no se debe llevar a cabo un
control de salud ocupacional adicional, pues ambos géneros presentan el mismo número medio de enfermedades de riesgo.
parámetros
Ejemplo 2:
Una empresa pretende estimar la demanda que tendrá su producto y para ello encuesta a 500 jóvenes y 600 adultos,
quienes constituirían su mercado laboral potencial. De la gente joven 400 prefieren el producto, mientras que de la
gente adulta 360 manifiestan su preferencia por éste.
Con un nivel de confianza del 95%, ¿se puede afirmar que la preferencia del producto es igual para jóvenes y
adultos?
parámetros
X: preferencia por el producto Variable cualitativa

Intervalo de confianza para la diferencia de proporciones (p1 – p2)
Datos: 𝑛1 = 500, 𝑛2 = 600, NC: 95%, a = 5% = 0.05 𝑥
De la muestra 1 calculamos: 𝑝1 = 𝑛1 = 500
400
1
𝑥 360
De la muestra 2 calculamos: 𝑝2 = 𝑛2 = 600
EN MEGASTAT: 2
1ro
2do
parámetros
3ro 4to
Obtenemos el siguiente resultado:
3ro. Clic en OK
1ro. Ingresamos la información de ambas muestras
2do. Ingresamos NC
y activamos display
𝐼𝐶(𝑝1 − 𝑝2 ) = [0.1474; 0.2526]

Interpretando: Con un nivel de confianza del 95%, la verdadera diferencia de la proporción de jóvenes y adultos que
prefieren el producto está contenida en [0.1472; 0.2526]. Por lo tanto, podemos afirmar que los jóvenes prefieren en
mayor proporción el producto que los adultos
No se puede afirmar que la preferencia del producto es igual para jóvenes y adultos.
parámetros
X: preferencia por el producto Variable cualitativa

USANDO LA FÓRMULA:
Datos: 𝑛1 = 500, 𝑛2 = 600, NC: 95%, a = 5% = 0.05 Hallamos: 𝑍1−𝛼/2 = 𝑍1−0.05/2 = 𝑍0.975 = 1.96
𝑥 400
De la muestra 1 calculamos: 𝑝1 = 𝑛1 = 500 = 0.8 En Excel = INV.NORM.ESTAND(0.975)
1
𝑥 360
De la muestra 2 calculamos: 𝑝2 = 𝑛2 = 600 = 0.6
2
ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2) ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2)
(ොp1 − pො 2) - Zo + ෡𝟏 − 𝐏
≤𝐏 ෡𝟐 ≤ (ොp1 − pො 2) + Zo +
n1 n2 n1 n2
0.8(1−0.8) 0.6 (1−0.6)

IC 𝑝1 − 𝑝2 = (0.8 − 0.6) ∓ 1.96 +
500 600
𝐼𝐶(𝑝1 − 𝑝2 ) = [0.1474; 0.2526]
Interpretando: Con un nivel de confianza del 95%, la verdadera diferencia de la proporción de jóvenes y adultos que
prefieren el producto está contenida en [0.1472; 0.2526]. Por lo tanto, podemos afirmar que los jóvenes prefieren en
mayor proporción el producto que los adultos
No se puede afirmar que la preferencia del producto es igual para jóvenes y adultos.
parámetros
RECORDAMOS:
Procedimiento de una prueba una hipótesis con MEGASTAT
Paso 1 Paso 2 Paso 3 Paso 4

Se plantea la Se selecciona Se identifica el Comparar p-valor con α (N.
hipótesis nula el nivel de estadístico de de significancia) y tomar la Se Rechaza H0 Si P-valor < α
y alternativa. significancia. prueba. decisión. No se Rechaza H0 Si P-valor ≥ α
H0: =  ≤
H1: ≠ < >

α Zc =
( x1 − x 2 ) −(m1 − m 2 )
  12  22 
 +
 n1 n2 

Paso 5
Se rechaza H0
Decisión e
Ho: μ1 = μ2 μ1 - μ2 = 0 ( x1 − x 2 ) −(m1 − m 2 ) interpretación. o
Tc =
H1: μ1 ≠ μ2 o μ1 - μ2 ≠ 0 1 1
S c  +  Se acepta Ho
 n1 n2 
Ho: P1 ≤ P2 P1 – P 2 ≤ 0 𝑥1 −𝑥2 − 𝜇1 −𝜇2

H1: P1 > P2 P1 – P 2 > 0 𝑇𝑐 =
𝑆2 2
1 + 𝑆2
𝑛1 𝑛2
parámetros
Diferencia de medias para muestras independientes

Supongamos que disponemos de una muestra aleatoria de tamaño n1 y una muestra aleatoria de tamaño n2 independiente
de la anterior. Podemos construir contrastes de amplia aplicación, como se resume a continuación:
Prueba de hipótesis:
CASO 1.
Ho: μ1 = μ2 μ1 - μ2 = 0
H1: μ1 ≠ μ2 (caso bilateral) μ 1 - μ2 ≠ 0 Cuando n1,n2 son muestras grandes (ni ≥ 30), y las
varianzas poblacionales son conocidas:
Ho: μ1 ≤ μ2 Estadístico de prueba: Z

H1: μ1 > μ2 (caso unilateral)
( x1 − x 2 ) −(m1 − m 2 )
Ho: μ1 ≥ μ2 Zc =
  12  22 
H1: μ1 < μ2 (caso unilateral)  + 
 n1 n2 
parámetros
CASO 2.
Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas e iguales:
( x1 − x 2 ) −(m1 − m 2 )
Estadístico de prueba: t de Student Tc =
1 1
Sc  + 
 n1 n2 
Donde, la varianza mancomunada se detalla: Y los grados de libertad son:
( n −1) S 2
+ ( n −1) S 2 t( prob;n1 + n2 − 2 ) g .l
S c2 = 1 1 2 2
n1 + n2 − 2
Se rechaza Ho, con un riesgo α cuando valor-p < α

parámetros
CASO 3.
Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas y diferentes
Estadístico de prueba: t de Student 𝑥1 −𝑥2 − 𝜇1 −𝜇2

𝑇𝑐 =
𝑆2 𝑆
1+ 2
2
𝑛1 𝑛2
Donde, los grados de libertad son:
2
s2
s  2
n + n 
1 2
r, representa los
r =  12 2  2
grados de
libertad
 s12   s22 
n  n 
 1 +  2
n1 − 1 n2 − 1
Se rechaza Ho, con un riesgo α cuando valor-p < α

parámetros
Diferencia de proporciones- muestras independientes

Estadístico de prueba: Z
𝑝ҧ1 −𝑝ҧ2 −(𝑝1 −𝑝2 )

Prueba de hipótesis: 𝑍= 1 1
~𝑁(0,1)
ҧ
𝑝(1−𝑝)ҧ +
Ho: P1 = P2 P1 - P 2 = 0 𝑛1 𝑛2
H1: P1 ≠ P2 (caso bilateral)
X1
p1 =
n1 𝑥1 + 𝑥2
Ho: P1 ≤ P2 𝑝ҧ =
H1: P1 > P2 (caso unilateral) p2 =
X2 𝑛1 + 𝑛2
n2
Ho: P1 ≥ P2
H1: P1 < P2 (caso unilateral)
parámetros
Prueba de hipótesis
RESUMEN α: nivel de significancia, α = 100% - NC
Para una muestra Para dos muestras

O dos grupos, comparar
Hipótesis para la Hipótesis para la Hipótesis para la diferencia de Hipótesis para la diferencia de
media (𝜇) proporción (𝑝) medias (𝜇1 − 𝜇2 ) proporciones (𝑝1 − 𝑝2 )
Var cuantitativa Var cualitativa Var cuantitativa Var cualitativas
De la muestra De las muestras (n1 y n2),

(n), Si n1 y n2 ≥ 30, usar Si n1 y n2 < 30, usar Identificar x1 y x2 (n° de elementos con
Si n ≥ 30, usar “Z” Identificar x (n° característica de interés)
“z” “t”
de elementos
con
Si n < 30, usar “t” característica
“Prueba de Levene” (Homogeneidad de varianzas)
de interés)
Si: P-value < α , Varianzas desiguales
De la muestra (n), Si: P-value ≥ α , Varianzas iguales (homogéneas)
Calculamos: promedio
Y desvest
De las muestras (n1 y n2),
Calculamos: promedio1, promedio 2, desvest1 y desvest2
En todos los casos debemos aplicar la siguiente regla de decisión:

Se Rechaza Ho Si P-valor < α
No se Rechaza Ho Si P-valor ≥ α
parámetros
APLICACIÓN 1
Un analista compara dos métodos de enseñanza de Matemáticas básica; el

método tradicional (T) y el método moderno de enseñanza basado en
problemas (M). Una muestra aleatoria de 9 calificaciones finales con el método
T y otra muestra aleatoria de 10 calificaciones finales con el método M dieron
los siguientes resultados:
T 6 14 8 11 10 18 15 20 13
M 12 11 12 10 14 15 10 13 14 12
Se asume que las calificaciones finales son dos poblaciones independientes con distribución normal. Con un
nivel de significancia de 0,01, ¿es la calificación promedio del método tradicional menor a la calificación
promedio del método moderno?
parámetros
Solución
En el menú principal Datos, luego

Megastat.....
Hypothesis Test……
Comapre Two Independent Groups
Ingresamos los datos en Excel y seguimos
los pasos para la contrastación de la
hipótesis
parámetros
Prueba de Homogeneidad de Varianzas (Prueba de Levene)

Planteamos Ho: Var 1 = Var 2
la hipótesis H1: Var 1 ≠ Var 2
Nivel de Significancia α = 0.01
Ingresamos los datos, luego

activamos la opción: Test for
equality of variances
parámetros
2) Analizamos el p-value = 0.0080 < 0.01, entonces

rechazamos Ho, es decir debemos asumir que las
La prueba de Levene usa varianzas poblacionales son desiguales.
un estadístico F y
prueba si
Ho: las varianzas son
1) Observamos la salida correspondiente a
homogéneas la prueba de igualdad de varianzas.
H1: las varianzas son 3) Luego volvemos a realizar la
heterogéneas prueba de hipótesis para los
promedios, conociendo ya el
comportamiento de las
varianzas que son desiguales
parámetros
Realizamos la prueba de hipótesis para

los promedios:
Ho: U1 ≥ U2
H1: U1 < U2
Usando el nivel de significancia (α=0.01)
Al ingresar la información no
olvidar tener en cuenta que
utilizaremos el estadístico T
asumiendo varianzas
desiguales.
parámetros
Nota: también podemos analizar el IC donde

tenemos [-4.622 ; 5.578] el cual por la ley de
los signos estudiadas en el modulo anterior
nos indica que los promedios son iguales.
4° Observamos que el p-value es 0.6137 y lo

comparamos con el valor de significancia de la
prueba α = 0.01 teniendo: p-value=0.6137 > α =
0.01 por tanto Aceptamos Ho.
Interpretación: Existe suficiente
evidencia estadística para concluir
que la calificación promedio del
método tradicional No es menor a
la calificación promedio del
método moderno, con una
significancia del 1%.
parámetros
APLICACIÓN 2:
La compañía de perfumes “Esperanza S.A.” desarrolló una fragancia nueva que planea comercializar con el nombre de
Heavenly. Varios estudios de mercado indican que Heavenly tiene buen potencial de mercado; al departamento de
ventas de “Esperanza S.A.” le interesa saber si hay alguna diferencia entre las proporciones de mujeres jóvenes y
mayores que comprarían el perfume si saliera al mercado. Hay dos poblaciones independientes, una de mujeres
jóvenes y la otra, de mujeres mayores. A cada una de las mujeres muestreadas se le pidió oler el perfume e indicar si le
gusta lo suficiente para comprar un frasco o no le gusta. Los resultados se muestran a continuación:
Mujeres jóvenes Sí No No Sí No No No No No No
No No Sí No No No No Sí No No
Sí Sí No Sí No Sí No No No No
Mujeres mayores No No Sí No Sí No No Sí No No
No No Sí No No No No Sí No No
Con un nivel de significancia del 2%. Las mujeres jóvenes y mayores compran Heavenly en distintas
proporciones.
parámetros
Solución
Entramos a Datos-----Megastat
Luego Hypothesis Test
Compare Two Independent Proportions
Ingresamos los datos en Excel

dando valor 0:No y 1:Sí
parámetros
Conociendo previamente los datos correspondientes a las proporciones muestrales:

n1= 20 X1= 4 p1= X1/n1
n2=30 X2= 9 p2=X2/n2
parámetros

comparamos con el valor de significancia de la
prueba α = 0.02 teniendo: p-value=0.4297 > α =
0.02 por tanto Aceptamos Ho.

tenemos [-0.3849 ; 0.1849] el cual por la ley de
los signos estudiadas en el modulo anterior nos
indica que las proporciones son iguales.

que las mujeres jóvenes y mayores
compran Heavenly en iguales
proporciones, con una
parámetros
Evaluando lo aprendido
Aprendiendo de forma divertida con Genially
Estimados estudiantes repasamos lo aprendido respondiendo a los ítems propuestos a
través del siguiente link:
https://view.genial.ly/6358c016451fdb001ae29dba/interactive-content-copia-quiz-genial
parámetros
Conclusiones
1. El análisis del intervalo de confianza para la diferencia de dos parámetros, se realiza tomando
en cuenta los signos.
2. La Hipótesis nula siempre contiene a la igualdad. (mayor o igual; menor o igual; igual).
3. La hipótesis alterna NO contiene a la igualdad y son opuestas a la hipótesis nula. (menor; mayor;
diferente).
4. El estadístico de prueba para una estimación de intervalos y/o para una prueba de hipótesis
para diferencia de promedios, depende del tamaño de muestra y las varianzas conocidas o no;
cuando la muestra es pequeñas (n1 y n2 ≤ 30)se usa la distribución T, si es una muestra grande
(n1 y n2 > 30) se usa la distribución z
5. El estadístico de prueba para una estimación de intervalos y/o para una prueba de hipótesis
para diferencia de proporciones es la distribución z
6. La prueba de Levene prueba “Ho: Las varianzas son homogéneas” y se usa cuando se aplica un
intervalo de confianza o una prueba de hipótesis para la diferencia de medias cuando las
muestras son pequeñas y dependiendo de ello se elige el estadístico “t” adecuado
7. Se debe aplicar los 5 pasos para contrastar una hipótesis de diferencia de parámetros, teniendo
en cuenta que la regla de decisión es rechazar Ho si p-value es menor al nivel de significancia.
parámetros
Recordamos nuestro logro de aprendizaje...!!
Al culminar el estudio del módulo, el estudiante estará en capacidad de resolver casos tomando decisiones
en situaciones reales, aplicando los diferentes tipos de estimación interválica y pruebas de hipótesis con
información obtenida de dos muestras, utilizando el complemento Excel -Megastat.
Te invito a reflexionar
¿Lo lograste?
Seguro que sí..!!
Si tienes dudas recuerda enviar tus consultas a través
de Pregúntale al profesor o Mensajería interna y te
responderemos como máximo en 24 horas
Te invito a participar de la próxima clase:
PRUEBA CHI CUADRADO PARA LA INDEPENDENCIA

¿Fumar estará relacionado con ¿Están asociados el
desarrollar cáncer de pulmón? bienestar y la calidad
de vida?
¿Las habilidades blandas están

relacionadas con el éxito?
parámetros
Consultas
Realiza consultas a través del

chat o solicita al docente
activar el micrófono para
participar.
GRACIAS
Otros ejemplos desarrollados
Prueba de Hipótesis para uno y dos parámetros
APLICACIÓN 2
En la actualidad, la mayoría de quienes viajan por avión compra sus

boletos por Internet. Así, los pasajeros evitan la preocupación de cuidar
un boleto de papel, además de que las aerolíneas ahorran. No obstante,
en fechas recientes, las aerolíneas han recibido quejas relacionadas con
los boletos, en particular cuando se requiere hacer un enlace para
cambiar de línea. Para analizar el problema, una agencia de investigación
independiente tomó una muestra aleatoria de 20 aeropuertos y recogió
información relacionada con la cantidad de quejas que hubo sobre los
boletos durante marzo. A continuación se presenta la información:
APLICACIÓN 2
14 14 16 12 12 14 13 16 15 14
12 15 15 14 13 13 12 13 10 13
¿La agencia de investigación puede concluir que la cantidad media de quejas por
aeropuerto es menor que 15 al mes con un nivel de significancia de 5%?
SOLUCION
1° Plantear Ho: U ≥ 15 3° Identificar el estadístico a utilizar: Z o T

H1: U < 15
Ingresamos los datos en una
columna como se muestra
2° Establecer el nivel de significancia ( α )
α = 0.05
Seleccionamos la opción
data input
comparamos con el valor de significancia de la prueba
α = 0.01 teniendo: p_value=0.0001 < α = 0.05 por
tanto rechazamos Ho.
Interpretación: Existe suficiente evidencia estadística para concluir que el

promedio de la cantidad de quejas es menor a 15, al mes con una
Aplicación 4: Comercialización de arroz
Una firma comercializadora esta interesada en vender arroz embolsado por kilos que tenga el menor porcentaje de
granos quebrados. Recibe el informe de dos molineras A y B que afirman tener el mejor arroz embolsado con el más
bajo porcentaje de granos quebrados por kilo. Para tomar la decisión estadística se seleccionó una muestra aleatoria
de 11 y otra de 10 bolsas de arroz de un kilo de las molineras A y B, respectivamente resultando los siguientes
porcentajes de granos quebrados por kilo:
A 1.1 1.0 1.2 1.3 2.4 1.8 1.6 1.5 1.4 1.9 1.8
B 1.9 1.8 1.7 1.6 1.8 2.1 2.0 1.5 1.9 1.4
Se sabe que las poblaciones independientes de granos quebrados por kilo se distribuyen de manera normal con
varianzas iguales, con un nivel de significancia del 5% ¿se puede concluir que son iguales las medias de los porcentajes
de granos quebrados por kilos de las molineras A y B?.
En el menú principal Datos, luego Megastat.....
Hypothesis Test……
Solución Comapre Two Independent Groups
Ingresamos los datos en Excel y seguimos

los pasos para la contrastación de la
hipótesis
Seleccionamos la opción
data input
4° Observamos que el p-value es 0.1411 y
lo comparamos con el valor de
significancia de la prueba α = 0.05
teniendo: p_value=0.1411 > α = 0.05 por
tanto Aceptamos Ho.

evidencia estadística para
concluir que son iguales las medias de
los porcentajes de granos quebrados
por kilos de las molineras A y B con
una significancia del 5%.
Aplicación 7:
Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor para los
televidentes hombres que para las mujeres, pero, el personal de producción del programa piensa que es igual el porcentaje de
televidentes hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres
reveló que 120 hombres y 120 mujeres estaban viendo el programa especial de televisión. ¿Puede considerarse significativa la
diferencia al nivel del 1%?
Solución
4° Observamos que el p-value es 0.0058 y
lo comparamos con el valor de
significancia de la prueba α = 0.01
teniendo: p_value=0.0058 < α = 0.01 por
tanto Rechazamos Ho.

tenemos [0.0062 ; 0.1938] el cual por la ley de los
signos estudiadas en el modulo anterior nos indica
que la proporción del grupo 1 es mayor a la
proporción del grupo 2

evidencia estadística para concluir que
la proporción de hombres es mayor a
la proporción de mujeres, con una
Aplicación 8:
Se desea determinar si los pacientes que se

les realizó la prueba rápida presentan
diferente número promedio de días con los
síntomas del COVID-19 que las pacientes
que se les realizó la prueba molecular se
solicita tomar una decisión considerando la
información de la base de datos adjunta,
asumiendo un nivel de significación del 5%.
BASE DE DATOS
1° Plantear Ho: U1 = U2
H1: U1 ≠ U2
2° Establecer el nivel de significancia ( α )
α = 0.05
n1= 22
n2= 18
3° Identificar el estadístico a utilizar: T
Nota: En este caso no se indico si las varianzas

poblaciones son iguales o distintas por lo tanto
realizamos la prueba de Homogeneidad de Varianzas
(Prueba de Levene)
Prueba de Homogeneidad de Varianzas
Planteamos Ho: Var 1 = Var 2

la hipótesis H1: Var 1 ≠ Var 2
El nivel de significancia α= 0.05
n1= 22
n2= 18
Como significancia = 0.7248 > 0.05,

entonces se asumen varianzas iguales
Ahora realizamos la PH para los promedios teniendo en cuenta que las varianzas son iguales.
Ho: U1 = U2
H1: U1 ≠ U2
4° Observamos el p-value es y lo comparamos
con el valor de significancia de la prueba α
teniendo: p_value= 0.0775 > α = 0.05 por tanto
Aceptamos Ho.

que el numero promedio de días con
los síntomas de los pacientes que se
les realizo prueba rápida es el mismo
para los pacientes que se les realizo
prueba molecular, con una
© 2022 | Universidad Privada del Norte

Semana 11 - Videoconferencia

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Semana 11 - Videoconferencia

Cargado por

Copyright:

Formatos disponibles

Inferencia Estadística

Inicio : Lunes 29 de mayo a la 1:00 pm Revisa también la sección anuncios y en la semana 11 el

Al culminar el estudio del módulo, el estudiante estará en capacidad

de resolver casos tomando decisiones en situaciones reales,

aplicando los diferentes tipos de estimación interválica y pruebas de

hipótesis con información obtenida de dos muestras, utilizando el

complemento Excel -MegaStat.

2. Estimación de Intervalo de Confianza para la diferencia de medias casos Z y T

3. Prueba de Levene (Homogeneidad de Varianzas)

4. Estimación de Intervalo de Confianza para la diferencia de proporciones caso Z

5. Prueba de Hipótesis para la diferencia de medias, caso Z y T

6. Prueba de Hipótesis para la diferencia de proporciones, caso Z

Resumen α: nivel de significancia,

Para una muestra Para dos muestras

O dos grupos, comparar

IC para la media IC para la IC para la diferencia de IC para la diferencia de

Var cuantitativa Var cuantitativas Var cualitativas

𝑆2𝑝 = varianza ponderada

CASO 2: Varianzas 𝑺𝟐𝟏 y 𝑺𝟐𝟐 desconocidas pero desiguales (varianzas heterogéneas).

Intervalo de confianza para la diferencia de

Análisis del Intervalo de confianza para la diferencia de parámetros

La empresa Peruvian Center desea determinar si los trabajadores

X: Número de enfermedades de riesgo Variable cuantitativa

2do. Seleccionamos 4to. Activamos la prueba de

X: Número de enfermedades de riesgo Variable cuantitativa

Datos: 𝑛1 = 25, 𝑛2 = 15, NC: 98%, a = 2% = 0.02

Asumiendo varianzas iguales: Calculando los intervalos:

Sp2 = 0.5653 𝐼𝐶(𝜇1 − 𝜇2 ) = [−0.144; 1.051]

X: preferencia por el producto Variable cualitativa

1ro. Ingresamos la información de ambas muestras

𝐼𝐶(𝑝1 − 𝑝2 ) = [0.1474; 0.2526]

X: preferencia por el producto Variable cualitativa

0.8(1−0.8) 0.6 (1−0.6)

𝐼𝐶(𝑝1 − 𝑝2 ) = [0.1474; 0.2526]

Procedimiento de una prueba una hipótesis con MEGASTAT

Paso 1 Paso 2 Paso 3 Paso 4

H1: ≠ < >

Ho: P1 ≤ P2 P1 – P 2 ≤ 0 𝑥1 −𝑥2 − 𝜇1 −𝜇2

Diferencia de medias para muestras independientes

Ho: μ1 ≤ μ2 Estadístico de prueba: Z

Donde, la varianza mancomunada se detalla: Y los grados de libertad son:

Se rechaza Ho, con un riesgo α cuando valor-p < α

Estadístico de prueba: t de Student 𝑥1 −𝑥2 − 𝜇1 −𝜇2

Se rechaza Ho, con un riesgo α cuando valor-p < α

Diferencia de proporciones- muestras independientes

𝑝ҧ1 −𝑝ҧ2 −(𝑝1 −𝑝2 )

Para una muestra Para dos muestras

De la muestra De las muestras (n1 y n2),

En todos los casos debemos aplicar la siguiente regla de decisión:

Un analista compara dos métodos de enseñanza de Matemáticas básica; el

En el menú principal Datos, luego

Prueba de Homogeneidad de Varianzas (Prueba de Levene)

Ingresamos los datos, luego

2) Analizamos el p-value = 0.0080 < 0.01, entonces

Realizamos la prueba de hipótesis para

Usando el nivel de significancia (α=0.01)

Nota: también podemos analizar el IC donde

4° Observamos que el p-value es 0.6137 y lo

Ingresamos los datos en Excel

Conociendo previamente los datos correspondientes a las proporciones muestrales:

4° Observamos que el p-value es 0.4297 y lo

Nota: también podemos analizar el IC donde

Interpretación: Existe suficiente