Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estimación Interválica y
Prueba de hipótesis para la
diferencia de parámetros
Módulo 10
Probabilidad y Estadística
2023-1
Videoconferencia 11
Actividades – Semana 11
LOGRO DE LA SESIÓN
ÍNDICE
1. Introducción
7. Casos de estudio
8. Conclusiones
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
INTRODUCCIÓN
El sueldo promedio de
los hombres es igual
del sueldo promedio
de las mujeres
IC / Ho: U1= U2
El porcentaje de
hombres que trabajan
es igual al de mujeres
IC / Ho: P1 = P2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Intervalo de
confianza
para dos
muestras
Intervalo de confianza para la diferencia de medias, cuando n1 y n2 < 30 Intervalo de confianza para la diferencia de medias,
cuando n1 y n2 ≥ 30
CASO 1: Varianzas 𝑺𝟐𝟏 y 𝑺𝟐𝟐 desconocidas pero iguales (varianzas homogéneas).
ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2) ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2)
(ොp1 − pො 2) - Zo + 𝟏 − 𝐏
≤𝐏 𝟐 ≤ (ොp1 − pො 2) + Zo +
n1 n2 n1 n2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
1
REGLA DE DECISION PARA EL USO DE IC CON DOS POBLACIONES
Caso 1: Cuando el IC es de la forma [ + , + ] , entonces el primer parámetro es mayor que el segundo.
Caso 2: Cuando el IC es de la forma [ - , + ] , entonces los parámetros son iguales.
Caso 3: Cuando el IC es de la forma [ - , - ] , entonces el primer parámetro es menor que el segundo.
2
PRUEBA DE LEVENE
La prueba de Levene que otorga el MegaStat prueba si dos muestras provienen de poblaciones con
varianzas homogéneas.
Para tomar una decisión se compara el valor de Sig. que da el reporte del MegaStat con el valor del nivel
de significación (α)
3 REGLA DE DECISION:
Si: Valor - p < α , No se asumen varianzas iguales
Si: Valor - p ≥ α , Se asumen varianzas iguales .
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Ejemplo 1:
Datos: 𝑛1 = 25, 𝑛2 = 15, NC: 98%, a = 2% = 0.02 Como n1, n2 < 30, usamos la
Distribución T de Student
EN MEGASTAT: 2do
1ro
En la base de
datos de Excel
segmentamos
los datos de la 3ro
variable
número de
enfermedades
por género
Clic
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
4to 5to
Obtenemos el siguiente resultado:
1ro. Seleccionamos los
datos de ambos grupos 5to. Clic en OK
3ro. Ingresamos NC
y activamos display
25 − 1 0.812 + 15 − 1 0.642
1 1
Sp2 = IC μ1 − μ2 = 0.92 − 0.47 ∓ 2.4286 0.5653 +
25 + 15 − 2 25 15
Interpretando: Con un nivel de confianza del 98% la verdadera diferencia del número promedio de enfermedades de riesgo de los
trabajadores de género masculino y femenino, se encuentra contenido en [-0.144; 1.051]. Es decir el número promedio de
enfermedades de riesgo de los trabajadores de género masculino y femenino son iguales, por lo tanto no se debe llevar a cabo un
control de salud ocupacional adicional, pues ambos géneros presentan el mismo número medio de enfermedades de riesgo.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Ejemplo 2:
Una empresa pretende estimar la demanda que tendrá su producto y para ello encuesta a 500 jóvenes y 600 adultos,
quienes constituirían su mercado laboral potencial. De la gente joven 400 prefieren el producto, mientras que de la
gente adulta 360 manifiestan su preferencia por éste.
Con un nivel de confianza del 95%, ¿se puede afirmar que la preferencia del producto es igual para jóvenes y
adultos?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
𝑥 360
De la muestra 2 calculamos: 𝑝2 = 𝑛2 = 600
EN MEGASTAT: 2
1ro
2do
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
3ro 4to
Obtenemos el siguiente resultado:
3ro. Clic en OK
2do. Ingresamos NC
y activamos display
Datos: 𝑛1 = 500, 𝑛2 = 600, NC: 95%, a = 5% = 0.05 Hallamos: 𝑍1−𝛼/2 = 𝑍1−0.05/2 = 𝑍0.975 = 1.96
𝑥 400
De la muestra 1 calculamos: 𝑝1 = 𝑛1 = 500 = 0.8 En Excel = INV.NORM.ESTAND(0.975)
1
𝑥 360
De la muestra 2 calculamos: 𝑝2 = 𝑛2 = 600 = 0.6
2
ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2) ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2)
(ොp1 − pො 2) - Zo + 𝟏 − 𝐏
≤𝐏 𝟐 ≤ (ොp1 − pො 2) + Zo +
n1 n2 n1 n2
Interpretando: Con un nivel de confianza del 95%, la verdadera diferencia de la proporción de jóvenes y adultos que
prefieren el producto está contenida en [0.1472; 0.2526]. Por lo tanto, podemos afirmar que los jóvenes prefieren en
mayor proporción el producto que los adultos
No se puede afirmar que la preferencia del producto es igual para jóvenes y adultos.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
RECORDAMOS:
H0: = ≤
Decisión e
Ho: μ1 = μ2 μ1 - μ2 = 0 ( x1 − x 2 ) −(m1 − m 2 ) interpretación. o
Tc =
H1: μ1 ≠ μ2 o μ1 - μ2 ≠ 0 1 1
S c + Se acepta Ho
n1 n2
Prueba de hipótesis:
CASO 1.
Ho: μ1 = μ2 μ1 - μ2 = 0
H1: μ1 ≠ μ2 (caso bilateral) μ 1 - μ2 ≠ 0 Cuando n1,n2 son muestras grandes (ni ≥ 30), y las
varianzas poblacionales son conocidas:
( x1 − x 2 ) −(m1 − m 2 )
Ho: μ1 ≥ μ2 Zc =
12 22
H1: μ1 < μ2 (caso unilateral) +
n1 n2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
CASO 2.
Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas e iguales:
( x1 − x 2 ) −(m1 − m 2 )
Estadístico de prueba: t de Student Tc =
1 1
Sc +
n1 n2
( n −1) S 2
+ ( n −1) S 2 t( prob;n1 + n2 − 2 ) g .l
S c2 = 1 1 2 2
n1 + n2 − 2
CASO 3.
Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas y diferentes
n + n
1 2
r, representa los
r = 12 2 2
grados de
libertad
s12 s22
n n
1 + 2
n1 − 1 n2 − 1
Ho: P1 ≥ P2
H1: P1 < P2 (caso unilateral)
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Prueba de hipótesis
RESUMEN α: nivel de significancia, α = 100% - NC
Hipótesis para la Hipótesis para la Hipótesis para la diferencia de Hipótesis para la diferencia de
media (𝜇) proporción (𝑝) medias (𝜇1 − 𝜇2 ) proporciones (𝑝1 − 𝑝2 )
Var cuantitativa Var cualitativa Var cuantitativa Var cualitativas
APLICACIÓN 1
T 6 14 8 11 10 18 15 20 13
M 12 11 12 10 14 15 10 13 14 12
Se asume que las calificaciones finales son dos poblaciones independientes con distribución normal. Con un
nivel de significancia de 0,01, ¿es la calificación promedio del método tradicional menor a la calificación
promedio del método moderno?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Solución
Al ingresar la información no
olvidar tener en cuenta que
utilizaremos el estadístico T
asumiendo varianzas
desiguales.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
APLICACIÓN 2:
La compañía de perfumes “Esperanza S.A.” desarrolló una fragancia nueva que planea comercializar con el nombre de
Heavenly. Varios estudios de mercado indican que Heavenly tiene buen potencial de mercado; al departamento de
ventas de “Esperanza S.A.” le interesa saber si hay alguna diferencia entre las proporciones de mujeres jóvenes y
mayores que comprarían el perfume si saliera al mercado. Hay dos poblaciones independientes, una de mujeres
jóvenes y la otra, de mujeres mayores. A cada una de las mujeres muestreadas se le pidió oler el perfume e indicar si le
gusta lo suficiente para comprar un frasco o no le gusta. Los resultados se muestran a continuación:
Mujeres jóvenes Sí No No Sí No No No No No No
No No Sí No No No No Sí No No
Sí Sí No Sí No Sí No No No No
Mujeres mayores No No Sí No Sí No No Sí No No
No No Sí No No No No Sí No No
Con un nivel de significancia del 2%. Las mujeres jóvenes y mayores compran Heavenly en distintas
proporciones.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Solución
Entramos a Datos-----Megastat
Luego Hypothesis Test
Compare Two Independent Proportions
Evaluando lo aprendido
Aprendiendo de forma divertida con Genially
Estimados estudiantes repasamos lo aprendido respondiendo a los ítems propuestos a
través del siguiente link:
https://view.genial.ly/6358c016451fdb001ae29dba/interactive-content-copia-quiz-genial
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Conclusiones
1. El análisis del intervalo de confianza para la diferencia de dos parámetros, se realiza tomando
en cuenta los signos.
2. La Hipótesis nula siempre contiene a la igualdad. (mayor o igual; menor o igual; igual).
3. La hipótesis alterna NO contiene a la igualdad y son opuestas a la hipótesis nula. (menor; mayor;
diferente).
4. El estadístico de prueba para una estimación de intervalos y/o para una prueba de hipótesis
para diferencia de promedios, depende del tamaño de muestra y las varianzas conocidas o no;
cuando la muestra es pequeñas (n1 y n2 ≤ 30)se usa la distribución T, si es una muestra grande
(n1 y n2 > 30) se usa la distribución z
5. El estadístico de prueba para una estimación de intervalos y/o para una prueba de hipótesis
para diferencia de proporciones es la distribución z
6. La prueba de Levene prueba “Ho: Las varianzas son homogéneas” y se usa cuando se aplica un
intervalo de confianza o una prueba de hipótesis para la diferencia de medias cuando las
muestras son pequeñas y dependiendo de ello se elige el estadístico “t” adecuado
7. Se debe aplicar los 5 pasos para contrastar una hipótesis de diferencia de parámetros, teniendo
en cuenta que la regla de decisión es rechazar Ho si p-value es menor al nivel de significancia.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Al culminar el estudio del módulo, el estudiante estará en capacidad de resolver casos tomando decisiones
en situaciones reales, aplicando los diferentes tipos de estimación interválica y pruebas de hipótesis con
Te invito a reflexionar
¿Lo lograste?
Seguro que sí..!!
Si tienes dudas recuerda enviar tus consultas a través
de Pregúntale al profesor o Mensajería interna y te
responderemos como máximo en 24 horas
Te invito a participar de la próxima clase:
Consultas
14 14 16 12 12 14 13 16 15 14
12 15 15 14 13 13 12 13 10 13
¿La agencia de investigación puede concluir que la cantidad media de quejas por
aeropuerto es menor que 15 al mes con un nivel de significancia de 5%?
SOLUCION
α = 0.05
Seleccionamos la opción
data input
4° Observamos que el p-value es 0.0001 y lo
comparamos con el valor de significancia de la prueba
α = 0.01 teniendo: p_value=0.0001 < α = 0.05 por
tanto rechazamos Ho.
Una firma comercializadora esta interesada en vender arroz embolsado por kilos que tenga el menor porcentaje de
granos quebrados. Recibe el informe de dos molineras A y B que afirman tener el mejor arroz embolsado con el más
bajo porcentaje de granos quebrados por kilo. Para tomar la decisión estadística se seleccionó una muestra aleatoria
de 11 y otra de 10 bolsas de arroz de un kilo de las molineras A y B, respectivamente resultando los siguientes
porcentajes de granos quebrados por kilo:
A 1.1 1.0 1.2 1.3 2.4 1.8 1.6 1.5 1.4 1.9 1.8
B 1.9 1.8 1.7 1.6 1.8 2.1 2.0 1.5 1.9 1.4
Se sabe que las poblaciones independientes de granos quebrados por kilo se distribuyen de manera normal con
varianzas iguales, con un nivel de significancia del 5% ¿se puede concluir que son iguales las medias de los porcentajes
de granos quebrados por kilos de las molineras A y B?.
En el menú principal Datos, luego Megastat.....
Hypothesis Test……
Solución Comapre Two Independent Groups
Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor para los
televidentes hombres que para las mujeres, pero, el personal de producción del programa piensa que es igual el porcentaje de
televidentes hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres
reveló que 120 hombres y 120 mujeres estaban viendo el programa especial de televisión. ¿Puede considerarse significativa la
diferencia al nivel del 1%?
Solución
4° Observamos que el p-value es 0.0058 y
lo comparamos con el valor de
significancia de la prueba α = 0.01
teniendo: p_value=0.0058 < α = 0.01 por
tanto Rechazamos Ho.
α = 0.05
n1= 22
n2= 18
n1= 22
n2= 18
Ahora realizamos la PH para los promedios teniendo en cuenta que las varianzas son iguales.
Ho: U1 = U2
H1: U1 ≠ U2
4° Observamos el p-value es y lo comparamos
con el valor de significancia de la prueba α
teniendo: p_value= 0.0775 > α = 0.05 por tanto
Aceptamos Ho.