Está en la página 1de 61

Inferencia Estadística

Estimación Interválica y
Prueba de hipótesis para la
diferencia de parámetros

Módulo 10

Probabilidad y Estadística
2023-1

Videoconferencia 11
Actividades – Semana 11

Inicio : Lunes 29 de mayo a la 1:00 pm Revisa también la sección anuncios y en la semana 11 el


“Material Complementario – Semana 11” preparado
Cierre : Lunes 05 de junio a la 1:00 pm siempre pensando en ti.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

LOGRO DE LA SESIÓN

Al culminar el estudio del módulo, el estudiante estará en capacidad

de resolver casos tomando decisiones en situaciones reales,

aplicando los diferentes tipos de estimación interválica y pruebas de

hipótesis con información obtenida de dos muestras, utilizando el

complemento Excel -MegaStat.


Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

ÍNDICE

1. Introducción

2. Estimación de Intervalo de Confianza para la diferencia de medias casos Z y T

3. Prueba de Levene (Homogeneidad de Varianzas)

4. Estimación de Intervalo de Confianza para la diferencia de proporciones caso Z

5. Prueba de Hipótesis para la diferencia de medias, caso Z y T

6. Prueba de Hipótesis para la diferencia de proporciones, caso Z

7. Casos de estudio

8. Conclusiones
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
INTRODUCCIÓN

El sueldo promedio de
los hombres es igual
del sueldo promedio
de las mujeres
IC / Ho: U1= U2

El porcentaje de
hombres que trabajan
es igual al de mujeres
IC / Ho: P1 = P2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Resumen α: nivel de significancia,


Intervalos de Confianza (IC) 1- α = nivel de confianza

Para una muestra Para dos muestras

O dos grupos, comparar

IC para la media IC para la IC para la diferencia de IC para la diferencia de


(𝜇) proporción (𝑝) medias (𝜇1 − 𝜇2 ) proporciones (𝑝1 − 𝑝2 )

Var cuantitativa Var cuantitativas Var cualitativas


Var cualitativa
De la muestra Si n1 y n2 ≥ 30, Si n1 y n2 < 30, De las muestras (n1 y n2),
Si n ≥ 30, usar “Z” (n), Identificar x1 y x2 (nro de elementos
usar “z” usar “t” con característica de interés)
Identificar x
Si n < 30, usar “t” (nro de “Prueba de Levene” (Homogeneidad de varianzas)
elementos
Si: Valor-p < α , Varianzas desiguales
con
De la muestra (n), característica Si: Valor-p ≥ α , Varianzas iguales (homogéneas)
Calculamos: promedio de interés)
Y desvest De las muestras (n1 y n2),
Calculamos: promedio1, promedio 2, desvest1 y desvest2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Intervalo de
confianza
para dos
muestras

Intervalo de confianza para la diferencia de medias, cuando n1 y n2 < 30 Intervalo de confianza para la diferencia de medias,
cuando n1 y n2 ≥ 30
CASO 1: Varianzas 𝑺𝟐𝟏 y 𝑺𝟐𝟐 desconocidas pero iguales (varianzas homogéneas).

𝑆2𝑝 = varianza ponderada


𝜎12 𝜎22
1 1 n1 − 1 S12 + n2 − 1 S22 IC μ1 − μ2 = x1 − x2 ∓ 𝑧1−,α +
IC μ1 − μ2 = x1 − x2 ∓ t n α Sp2 + Sp2 = 2 𝑛1 𝑛2
1 +n2 −2, 2 n1 n2 n1 + n2 − 2

CASO 2: Varianzas 𝑺𝟐𝟏 y 𝑺𝟐𝟐 desconocidas pero desiguales (varianzas heterogéneas).


: debe ser redondeo por aproximación simple.
2
S12 S22
𝑆12 𝑆22 n1 + n2
IC 𝜇1 − 𝜇2 = 𝑥1 − 𝑥2 ∓ 𝑡𝜐,𝛼 + υ= 2 2
2 𝑛1 𝑛2 S12 S22
n1 n2
+
n1 − 1 n2 − 1

Intervalo de confianza para la diferencia de


proporciones

ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2) ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2)
(ොp1 − pො 2) - Zo + ෡𝟏 − 𝐏
≤𝐏 ෡𝟐 ≤ (ොp1 − pො 2) + Zo +
n1 n2 n1 n2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Análisis del Intervalo de confianza para la diferencia de parámetros

1
REGLA DE DECISION PARA EL USO DE IC CON DOS POBLACIONES
Caso 1: Cuando el IC es de la forma [ + , + ] , entonces el primer parámetro es mayor que el segundo.
Caso 2: Cuando el IC es de la forma [ - , + ] , entonces los parámetros son iguales.
Caso 3: Cuando el IC es de la forma [ - , - ] , entonces el primer parámetro es menor que el segundo.

2
PRUEBA DE LEVENE
La prueba de Levene que otorga el MegaStat prueba si dos muestras provienen de poblaciones con
varianzas homogéneas.
Para tomar una decisión se compara el valor de Sig. que da el reporte del MegaStat con el valor del nivel
de significación (α)

3 REGLA DE DECISION:
Si: Valor - p < α , No se asumen varianzas iguales
Si: Valor - p ≥ α , Se asumen varianzas iguales .
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Ejemplo 1:

La empresa Peruvian Center desea determinar si los trabajadores


de género masculino presentan mayor número medio de
enfermedades de riesgo que las de género femenino, con la
finalidad de proponer un control de salud ocupacional adicional
durante el año para el género que presenten mayor promedio de
número de enfermedades de riesgo. Se solicita tomar una decisión
considerando la información de la base de datos adjunta,
asumiendo un nivel de confianza del 98%. ¿A que género de
trabajadores se le debe brindar el control de salud ocupacional
adicional?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

X: Número de enfermedades de riesgo Variable cuantitativa


Intervalo de confianza para la diferencia de medias (m1 – m2)

Datos: 𝑛1 = 25, 𝑛2 = 15, NC: 98%, a = 2% = 0.02 Como n1, n2 < 30, usamos la
Distribución T de Student
EN MEGASTAT: 2do

1ro

En la base de
datos de Excel
segmentamos
los datos de la 3ro
variable
número de
enfermedades
por género
Clic
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

4to 5to
Obtenemos el siguiente resultado:
1ro. Seleccionamos los
datos de ambos grupos 5to. Clic en OK

3ro. Ingresamos NC
y activamos display

2do. Seleccionamos 4to. Activamos la prueba de


“t” porque n1, n2 < 30 homogeneidad de varianzas para
“asumiendo comprobar si las varianzas son iguales.
temporalmente“ que
las varianzas son
𝐼𝐶(𝜇1 − 𝜇2 ) = [−0.144; 1.051] Como significancia = 0.3556 > 0.02,
iguales
entonces se asumen varianzas iguales
Interpretando: Con un nivel de confianza del 98% la verdadera diferencia del número promedio de enfermedades de riesgo de los
trabajadores de género masculino y femenino, se encuentra contenido en [-0.144; 1.051]. Es decir el número promedio de enfermedades
de riesgo de los trabajadores de género masculino y femenino son iguales, por lo tanto no se debe llevar a cabo un control de salud
ocupacional adicional, pues ambos géneros presentan el mismo número medio de enfermedades de riesgo.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

X: Número de enfermedades de riesgo Variable cuantitativa


USANDO LA FÓRMULA:

Datos: 𝑛1 = 25, 𝑛2 = 15, NC: 98%, a = 2% = 0.02


De la muestra 1 calculamos: 𝑋ത1 = 0.92 y 𝑆1 = 0.81 (En Excel – PROMEDIO y DESVEST.M)
De la muestra 2 calculamos: 𝑋ത2 = 0.47 y 𝑆2 = 0.64 (En Excel – PROMEDIO y DESVEST.M)
Hallamos: 𝑡𝑛1+𝑛2−2,1−𝛼/2 = 𝑡25+15−2,1−0.02/2 = 𝑡38,0.99= 2.4286 En Excel = INV.T(0.99;38)

Asumiendo varianzas iguales: Calculando los intervalos:


2 2
n1 − 1 S1 + n2 − 1 S 2 1 1
Sp2 = IC μ1 − μ2 = x1 − x2 ∓ t n α Sp2 +
1 +n2 −2, 2 n1 n2
n1 + n2 − 2

25 − 1 0.812 + 15 − 1 0.642
1 1
Sp2 = IC μ1 − μ2 = 0.92 − 0.47 ∓ 2.4286 0.5653 +
25 + 15 − 2 25 15

Sp2 = 0.5653 𝐼𝐶(𝜇1 − 𝜇2 ) = [−0.144; 1.051]

Interpretando: Con un nivel de confianza del 98% la verdadera diferencia del número promedio de enfermedades de riesgo de los
trabajadores de género masculino y femenino, se encuentra contenido en [-0.144; 1.051]. Es decir el número promedio de
enfermedades de riesgo de los trabajadores de género masculino y femenino son iguales, por lo tanto no se debe llevar a cabo un
control de salud ocupacional adicional, pues ambos géneros presentan el mismo número medio de enfermedades de riesgo.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Ejemplo 2:
Una empresa pretende estimar la demanda que tendrá su producto y para ello encuesta a 500 jóvenes y 600 adultos,
quienes constituirían su mercado laboral potencial. De la gente joven 400 prefieren el producto, mientras que de la
gente adulta 360 manifiestan su preferencia por éste.
Con un nivel de confianza del 95%, ¿se puede afirmar que la preferencia del producto es igual para jóvenes y
adultos?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

X: preferencia por el producto Variable cualitativa


Intervalo de confianza para la diferencia de proporciones (p1 – p2)
Datos: 𝑛1 = 500, 𝑛2 = 600, NC: 95%, a = 5% = 0.05 𝑥
De la muestra 1 calculamos: 𝑝1 = 𝑛1 = 500
400
1

𝑥 360
De la muestra 2 calculamos: 𝑝2 = 𝑛2 = 600
EN MEGASTAT: 2

1ro

2do
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

3ro 4to
Obtenemos el siguiente resultado:

3ro. Clic en OK

1ro. Ingresamos la información de ambas muestras

2do. Ingresamos NC
y activamos display

𝐼𝐶(𝑝1 − 𝑝2 ) = [0.1474; 0.2526]


Interpretando: Con un nivel de confianza del 95%, la verdadera diferencia de la proporción de jóvenes y adultos que
prefieren el producto está contenida en [0.1472; 0.2526]. Por lo tanto, podemos afirmar que los jóvenes prefieren en
mayor proporción el producto que los adultos
No se puede afirmar que la preferencia del producto es igual para jóvenes y adultos.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

X: preferencia por el producto Variable cualitativa


USANDO LA FÓRMULA:

Datos: 𝑛1 = 500, 𝑛2 = 600, NC: 95%, a = 5% = 0.05 Hallamos: 𝑍1−𝛼/2 = 𝑍1−0.05/2 = 𝑍0.975 = 1.96
𝑥 400
De la muestra 1 calculamos: 𝑝1 = 𝑛1 = 500 = 0.8 En Excel = INV.NORM.ESTAND(0.975)
1

𝑥 360
De la muestra 2 calculamos: 𝑝2 = 𝑛2 = 600 = 0.6
2

ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2) ෝ1(1−ෝ
p p1) ෝ2(1−ෝ
p p2)
(ොp1 − pො 2) - Zo + ෡𝟏 − 𝐏
≤𝐏 ෡𝟐 ≤ (ොp1 − pො 2) + Zo +
n1 n2 n1 n2

0.8(1−0.8) 0.6 (1−0.6)


IC 𝑝1 − 𝑝2 = (0.8 − 0.6) ∓ 1.96 +
500 600

𝐼𝐶(𝑝1 − 𝑝2 ) = [0.1474; 0.2526]

Interpretando: Con un nivel de confianza del 95%, la verdadera diferencia de la proporción de jóvenes y adultos que
prefieren el producto está contenida en [0.1472; 0.2526]. Por lo tanto, podemos afirmar que los jóvenes prefieren en
mayor proporción el producto que los adultos
No se puede afirmar que la preferencia del producto es igual para jóvenes y adultos.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

RECORDAMOS:

Procedimiento de una prueba una hipótesis con MEGASTAT

Paso 1 Paso 2 Paso 3 Paso 4


Se plantea la Se selecciona Se identifica el Comparar p-valor con α (N.
hipótesis nula el nivel de estadístico de de significancia) y tomar la Se Rechaza H0 Si P-valor < α
y alternativa. significancia. prueba. decisión. No se Rechaza H0 Si P-valor ≥ α

H0: =  ≤

H1: ≠ < >


α Zc =
( x1 − x 2 ) −(m1 − m 2 )
  12  22 
 +
 n1 n2 

Paso 5
Se rechaza H0

Decisión e
Ho: μ1 = μ2 μ1 - μ2 = 0 ( x1 − x 2 ) −(m1 − m 2 ) interpretación. o
Tc =
H1: μ1 ≠ μ2 o μ1 - μ2 ≠ 0 1 1
S c  +  Se acepta Ho
 n1 n2 

Ho: P1 ≤ P2 P1 – P 2 ≤ 0 𝑥1 −𝑥2 − 𝜇1 −𝜇2


H1: P1 > P2 P1 – P 2 > 0 𝑇𝑐 =
𝑆2 2
1 + 𝑆2
𝑛1 𝑛2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Diferencia de medias para muestras independientes


Supongamos que disponemos de una muestra aleatoria de tamaño n1 y una muestra aleatoria de tamaño n2 independiente
de la anterior. Podemos construir contrastes de amplia aplicación, como se resume a continuación:

Prueba de hipótesis:
CASO 1.
Ho: μ1 = μ2 μ1 - μ2 = 0
H1: μ1 ≠ μ2 (caso bilateral) μ 1 - μ2 ≠ 0 Cuando n1,n2 son muestras grandes (ni ≥ 30), y las
varianzas poblacionales son conocidas:

Ho: μ1 ≤ μ2 Estadístico de prueba: Z


H1: μ1 > μ2 (caso unilateral)

( x1 − x 2 ) −(m1 − m 2 )
Ho: μ1 ≥ μ2 Zc =
  12  22 
H1: μ1 < μ2 (caso unilateral)  + 
 n1 n2 
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

CASO 2.
Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas e iguales:

( x1 − x 2 ) −(m1 − m 2 )
Estadístico de prueba: t de Student Tc =
1 1
Sc  + 
 n1 n2 

Donde, la varianza mancomunada se detalla: Y los grados de libertad son:

( n −1) S 2
+ ( n −1) S 2 t( prob;n1 + n2 − 2 ) g .l
S c2 = 1 1 2 2
n1 + n2 − 2

Se rechaza Ho, con un riesgo α cuando valor-p < α


Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

CASO 3.

Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas y diferentes

Estadístico de prueba: t de Student 𝑥1 −𝑥2 − 𝜇1 −𝜇2


𝑇𝑐 =
𝑆2 𝑆
1+ 2
2
𝑛1 𝑛2
Donde, los grados de libertad son:
2
s2
s  2

n + n 
1 2
r, representa los
r =  12 2  2
grados de
libertad
 s12   s22 
n  n 
 1 +  2
n1 − 1 n2 − 1

Se rechaza Ho, con un riesgo α cuando valor-p < α


Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Diferencia de proporciones- muestras independientes


Estadístico de prueba: Z

𝑝ҧ1 −𝑝ҧ2 −(𝑝1 −𝑝2 )


Prueba de hipótesis: 𝑍= 1 1
~𝑁(0,1)
ҧ
𝑝(1−𝑝)ҧ +
Ho: P1 = P2 P1 - P 2 = 0 𝑛1 𝑛2
H1: P1 ≠ P2 (caso bilateral)
X1
p1 =
n1 𝑥1 + 𝑥2
Ho: P1 ≤ P2 𝑝ҧ =
H1: P1 > P2 (caso unilateral) p2 =
X2 𝑛1 + 𝑛2
n2

Ho: P1 ≥ P2
H1: P1 < P2 (caso unilateral)
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros
Prueba de hipótesis
RESUMEN α: nivel de significancia, α = 100% - NC

Para una muestra Para dos muestras


O dos grupos, comparar

Hipótesis para la Hipótesis para la Hipótesis para la diferencia de Hipótesis para la diferencia de
media (𝜇) proporción (𝑝) medias (𝜇1 − 𝜇2 ) proporciones (𝑝1 − 𝑝2 )
Var cuantitativa Var cualitativa Var cuantitativa Var cualitativas

De la muestra De las muestras (n1 y n2),


(n), Si n1 y n2 ≥ 30, usar Si n1 y n2 < 30, usar Identificar x1 y x2 (n° de elementos con
Si n ≥ 30, usar “Z” Identificar x (n° característica de interés)
“z” “t”
de elementos
con
Si n < 30, usar “t” característica
“Prueba de Levene” (Homogeneidad de varianzas)
de interés)
Si: P-value < α , Varianzas desiguales
De la muestra (n), Si: P-value ≥ α , Varianzas iguales (homogéneas)
Calculamos: promedio
Y desvest
De las muestras (n1 y n2),
Calculamos: promedio1, promedio 2, desvest1 y desvest2

En todos los casos debemos aplicar la siguiente regla de decisión:


Se Rechaza Ho Si P-valor < α
No se Rechaza Ho Si P-valor ≥ α
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

APLICACIÓN 1

Un analista compara dos métodos de enseñanza de Matemáticas básica; el


método tradicional (T) y el método moderno de enseñanza basado en
problemas (M). Una muestra aleatoria de 9 calificaciones finales con el método
T y otra muestra aleatoria de 10 calificaciones finales con el método M dieron
los siguientes resultados:

T 6 14 8 11 10 18 15 20 13
M 12 11 12 10 14 15 10 13 14 12

Se asume que las calificaciones finales son dos poblaciones independientes con distribución normal. Con un
nivel de significancia de 0,01, ¿es la calificación promedio del método tradicional menor a la calificación
promedio del método moderno?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Solución

En el menú principal Datos, luego


Megastat.....
Hypothesis Test……
Comapre Two Independent Groups
Ingresamos los datos en Excel y seguimos
los pasos para la contrastación de la
hipótesis
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Prueba de Homogeneidad de Varianzas (Prueba de Levene)


Planteamos Ho: Var 1 = Var 2
la hipótesis H1: Var 1 ≠ Var 2
Nivel de Significancia α = 0.01

Ingresamos los datos, luego


activamos la opción: Test for
equality of variances
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

2) Analizamos el p-value = 0.0080 < 0.01, entonces


rechazamos Ho, es decir debemos asumir que las
La prueba de Levene usa varianzas poblacionales son desiguales.
un estadístico F y
prueba si
Ho: las varianzas son
1) Observamos la salida correspondiente a
homogéneas la prueba de igualdad de varianzas.
H1: las varianzas son 3) Luego volvemos a realizar la
heterogéneas prueba de hipótesis para los
promedios, conociendo ya el
comportamiento de las
varianzas que son desiguales
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Realizamos la prueba de hipótesis para


los promedios:
Ho: U1 ≥ U2
H1: U1 < U2

Usando el nivel de significancia (α=0.01)

Al ingresar la información no
olvidar tener en cuenta que
utilizaremos el estadístico T
asumiendo varianzas
desiguales.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Nota: también podemos analizar el IC donde


tenemos [-4.622 ; 5.578] el cual por la ley de
los signos estudiadas en el modulo anterior
nos indica que los promedios son iguales.

4° Observamos que el p-value es 0.6137 y lo


comparamos con el valor de significancia de la
prueba α = 0.01 teniendo: p-value=0.6137 > α =
0.01 por tanto Aceptamos Ho.
Interpretación: Existe suficiente
evidencia estadística para concluir
que la calificación promedio del
método tradicional No es menor a
la calificación promedio del
método moderno, con una
significancia del 1%.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

APLICACIÓN 2:
La compañía de perfumes “Esperanza S.A.” desarrolló una fragancia nueva que planea comercializar con el nombre de
Heavenly. Varios estudios de mercado indican que Heavenly tiene buen potencial de mercado; al departamento de
ventas de “Esperanza S.A.” le interesa saber si hay alguna diferencia entre las proporciones de mujeres jóvenes y
mayores que comprarían el perfume si saliera al mercado. Hay dos poblaciones independientes, una de mujeres
jóvenes y la otra, de mujeres mayores. A cada una de las mujeres muestreadas se le pidió oler el perfume e indicar si le
gusta lo suficiente para comprar un frasco o no le gusta. Los resultados se muestran a continuación:

Mujeres jóvenes Sí No No Sí No No No No No No
No No Sí No No No No Sí No No

Sí Sí No Sí No Sí No No No No
Mujeres mayores No No Sí No Sí No No Sí No No
No No Sí No No No No Sí No No
Con un nivel de significancia del 2%. Las mujeres jóvenes y mayores compran Heavenly en distintas
proporciones.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Solución

Entramos a Datos-----Megastat
Luego Hypothesis Test
Compare Two Independent Proportions

Ingresamos los datos en Excel


dando valor 0:No y 1:Sí
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Conociendo previamente los datos correspondientes a las proporciones muestrales:


n1= 20 X1= 4 p1= X1/n1
n2=30 X2= 9 p2=X2/n2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

4° Observamos que el p-value es 0.4297 y lo


comparamos con el valor de significancia de la
prueba α = 0.02 teniendo: p-value=0.4297 > α =
0.02 por tanto Aceptamos Ho.

Nota: también podemos analizar el IC donde


tenemos [-0.3849 ; 0.1849] el cual por la ley de
los signos estudiadas en el modulo anterior nos
indica que las proporciones son iguales.

Interpretación: Existe suficiente


evidencia estadística para concluir
que las mujeres jóvenes y mayores
compran Heavenly en iguales
proporciones, con una
significancia del 2%.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Evaluando lo aprendido
Aprendiendo de forma divertida con Genially
Estimados estudiantes repasamos lo aprendido respondiendo a los ítems propuestos a
través del siguiente link:

https://view.genial.ly/6358c016451fdb001ae29dba/interactive-content-copia-quiz-genial
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Conclusiones
1. El análisis del intervalo de confianza para la diferencia de dos parámetros, se realiza tomando
en cuenta los signos.
2. La Hipótesis nula siempre contiene a la igualdad. (mayor o igual; menor o igual; igual).
3. La hipótesis alterna NO contiene a la igualdad y son opuestas a la hipótesis nula. (menor; mayor;
diferente).
4. El estadístico de prueba para una estimación de intervalos y/o para una prueba de hipótesis
para diferencia de promedios, depende del tamaño de muestra y las varianzas conocidas o no;
cuando la muestra es pequeñas (n1 y n2 ≤ 30)se usa la distribución T, si es una muestra grande
(n1 y n2 > 30) se usa la distribución z
5. El estadístico de prueba para una estimación de intervalos y/o para una prueba de hipótesis
para diferencia de proporciones es la distribución z
6. La prueba de Levene prueba “Ho: Las varianzas son homogéneas” y se usa cuando se aplica un
intervalo de confianza o una prueba de hipótesis para la diferencia de medias cuando las
muestras son pequeñas y dependiendo de ello se elige el estadístico “t” adecuado
7. Se debe aplicar los 5 pasos para contrastar una hipótesis de diferencia de parámetros, teniendo
en cuenta que la regla de decisión es rechazar Ho si p-value es menor al nivel de significancia.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Recordamos nuestro logro de aprendizaje...!!

Al culminar el estudio del módulo, el estudiante estará en capacidad de resolver casos tomando decisiones

en situaciones reales, aplicando los diferentes tipos de estimación interválica y pruebas de hipótesis con

información obtenida de dos muestras, utilizando el complemento Excel -Megastat.

Te invito a reflexionar
¿Lo lograste?
Seguro que sí..!!
Si tienes dudas recuerda enviar tus consultas a través
de Pregúntale al profesor o Mensajería interna y te
responderemos como máximo en 24 horas
Te invito a participar de la próxima clase:

PRUEBA CHI CUADRADO PARA LA INDEPENDENCIA


¿Fumar estará relacionado con ¿Están asociados el
desarrollar cáncer de pulmón? bienestar y la calidad
de vida?

¿Las habilidades blandas están


relacionadas con el éxito?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis para la diferencia de
parámetros

Consultas

Realiza consultas a través del


chat o solicita al docente
activar el micrófono para
participar.
GRACIAS
Otros ejemplos desarrollados
Prueba de Hipótesis para uno y dos parámetros
APLICACIÓN 2

En la actualidad, la mayoría de quienes viajan por avión compra sus


boletos por Internet. Así, los pasajeros evitan la preocupación de cuidar
un boleto de papel, además de que las aerolíneas ahorran. No obstante,
en fechas recientes, las aerolíneas han recibido quejas relacionadas con
los boletos, en particular cuando se requiere hacer un enlace para
cambiar de línea. Para analizar el problema, una agencia de investigación
independiente tomó una muestra aleatoria de 20 aeropuertos y recogió
información relacionada con la cantidad de quejas que hubo sobre los
boletos durante marzo. A continuación se presenta la información:
APLICACIÓN 2

14 14 16 12 12 14 13 16 15 14
12 15 15 14 13 13 12 13 10 13
¿La agencia de investigación puede concluir que la cantidad media de quejas por
aeropuerto es menor que 15 al mes con un nivel de significancia de 5%?

SOLUCION

1° Plantear Ho: U ≥ 15 3° Identificar el estadístico a utilizar: Z o T


H1: U < 15
Ingresamos los datos en una
columna como se muestra
2° Establecer el nivel de significancia ( α )

α = 0.05
Seleccionamos la opción
data input
4° Observamos que el p-value es 0.0001 y lo
comparamos con el valor de significancia de la prueba
α = 0.01 teniendo: p_value=0.0001 < α = 0.05 por
tanto rechazamos Ho.

Interpretación: Existe suficiente evidencia estadística para concluir que el


promedio de la cantidad de quejas es menor a 15, al mes con una
significancia del 5%.
Aplicación 4: Comercialización de arroz

Una firma comercializadora esta interesada en vender arroz embolsado por kilos que tenga el menor porcentaje de
granos quebrados. Recibe el informe de dos molineras A y B que afirman tener el mejor arroz embolsado con el más
bajo porcentaje de granos quebrados por kilo. Para tomar la decisión estadística se seleccionó una muestra aleatoria
de 11 y otra de 10 bolsas de arroz de un kilo de las molineras A y B, respectivamente resultando los siguientes
porcentajes de granos quebrados por kilo:

A 1.1 1.0 1.2 1.3 2.4 1.8 1.6 1.5 1.4 1.9 1.8
B 1.9 1.8 1.7 1.6 1.8 2.1 2.0 1.5 1.9 1.4

Se sabe que las poblaciones independientes de granos quebrados por kilo se distribuyen de manera normal con
varianzas iguales, con un nivel de significancia del 5% ¿se puede concluir que son iguales las medias de los porcentajes
de granos quebrados por kilos de las molineras A y B?.
En el menú principal Datos, luego Megastat.....
Hypothesis Test……
Solución Comapre Two Independent Groups

Ingresamos los datos en Excel y seguimos


los pasos para la contrastación de la
hipótesis
Seleccionamos la opción
data input
4° Observamos que el p-value es 0.1411 y
lo comparamos con el valor de
significancia de la prueba α = 0.05
teniendo: p_value=0.1411 > α = 0.05 por
tanto Aceptamos Ho.

Interpretación: Existe suficiente


evidencia estadística para
concluir que son iguales las medias de
los porcentajes de granos quebrados
por kilos de las molineras A y B con
una significancia del 5%.
Aplicación 7:

Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor para los
televidentes hombres que para las mujeres, pero, el personal de producción del programa piensa que es igual el porcentaje de
televidentes hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres
reveló que 120 hombres y 120 mujeres estaban viendo el programa especial de televisión. ¿Puede considerarse significativa la
diferencia al nivel del 1%?
Solución
4° Observamos que el p-value es 0.0058 y
lo comparamos con el valor de
significancia de la prueba α = 0.01
teniendo: p_value=0.0058 < α = 0.01 por
tanto Rechazamos Ho.

Nota: también podemos analizar el IC donde


tenemos [0.0062 ; 0.1938] el cual por la ley de los
signos estudiadas en el modulo anterior nos indica
que la proporción del grupo 1 es mayor a la
proporción del grupo 2

Interpretación: Existe suficiente


evidencia estadística para concluir que
la proporción de hombres es mayor a
la proporción de mujeres, con una
significancia del 1%.
Aplicación 8:

Se desea determinar si los pacientes que se


les realizó la prueba rápida presentan
diferente número promedio de días con los
síntomas del COVID-19 que las pacientes
que se les realizó la prueba molecular se
solicita tomar una decisión considerando la
información de la base de datos adjunta,
asumiendo un nivel de significación del 5%.
BASE DE DATOS
1° Plantear Ho: U1 = U2
H1: U1 ≠ U2

2° Establecer el nivel de significancia ( α )

α = 0.05
n1= 22
n2= 18

3° Identificar el estadístico a utilizar: T

Nota: En este caso no se indico si las varianzas


poblaciones son iguales o distintas por lo tanto
realizamos la prueba de Homogeneidad de Varianzas
(Prueba de Levene)
Prueba de Homogeneidad de Varianzas

Planteamos Ho: Var 1 = Var 2


la hipótesis H1: Var 1 ≠ Var 2

El nivel de significancia α= 0.05

n1= 22
n2= 18

Como significancia = 0.7248 > 0.05,


entonces se asumen varianzas iguales

Ahora realizamos la PH para los promedios teniendo en cuenta que las varianzas son iguales.
Ho: U1 = U2
H1: U1 ≠ U2
4° Observamos el p-value es y lo comparamos
con el valor de significancia de la prueba α
teniendo: p_value= 0.0775 > α = 0.05 por tanto
Aceptamos Ho.

Interpretación: Existe suficiente


evidencia estadística para concluir
que el numero promedio de días con
los síntomas de los pacientes que se
les realizo prueba rápida es el mismo
para los pacientes que se les realizo
prueba molecular, con una
significancia del 5%.
© 2022 | Universidad Privada del Norte

También podría gustarte