Está en la página 1de 39

Inferencia Estadística

Estimación Interválica
y Prueba de hipótesis
para la diferencia de
parámetros
Módulo 10

Probabilidad y Estadística
2023-1
Videoconferencia 11
Actividades – Semana 11

Inicio : Lunes 24 de 0ctubre a la 1:00 pm


Cierre : Lunes 31 de octubre a la 1:00 pm Revisa también la sección anuncios y en la semana
11 el “Material para VDC” preparado siempre
pensando en ti.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

LOGRO DE LA SESIÓN
Al culminar el estudio del módulo, el

estudiante estará en capacidad de resolver

casos tomando decisiones en situaciones

reales, aplicando los diferentes tipos de

estimación interválica y pruebas de hipótesis

con información obtenida de dos muestras,

utilizando el complemento Excel -Megastat.


Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

ÍNDICE

1. Introducción
2. Estimación de Intervalo de Confianza para la diferencia de medias
casos Z y T
3. Prueba de Levene (Homogeneidad de Varianzas)
4. Estimación de Intervalo de Confianza para la diferencia de proporciones
caso Z
5. Prueba de Hipótesis para la diferencia de medias, caso Z y T
6. Prueba de Hipótesis para la diferencia de proporciones, caso Z
7. Casos de estudio
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros
INTRODUCC
IÓN

El sueldo
promedio de los
hombres es igual
del sueldo
promedio de las
mujeres
IC / Ho: U1= U2

El porcentaje de
hombres que
trabajan es igual
al de mujeres
IC / Ho: P1 = P2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Intervalo de
confianza
para dos
muestras

Intervalo de confianza para la diferencia de medias, cuando n1 y n2 Intervalo de confianza para la diferencia de
< 30 medias, cuando n1 y n2 ≥ 30
CASO 1: Varianzas y desconocidas pero iguales (varianzas
homogéneas).

√ 𝜎 21 𝜎 22
= varianza ponderada

IC ( μ1 − μ2 ) =( x 1 − x 2 ) ∓ t
n1 +n2 − 2,
α
2 √ S 2
p
( )
1 1 2 ( n 1 −1 ) S12+ ( n 2 −1 ) S 22
+
n1 n2 S p = n 1+ n2 −2
IC ( μ1 − μ2 ) =( x 1 − x 2 ) ∓ 𝑧
1 −,
α
2
+
𝑛1 𝑛2
CASO 2: Varianzas y desconocidas pero desiguales (varianzas
heterogéneas).
: debe ser redondeo por 2aproximación
S12 S 22
( )

2
simple.
2 +
𝑆1 𝑆2 n1 n2
IC ( 𝜇1 −𝜇 2 ) =( 𝑥1 − 𝑥 2 ) ∓𝑡 + υ=

( ) ( )
𝛼 2 2
𝜐,
2
𝑛1 𝑛2 S1
2
S2
2

n1 n2
+
n1 − 1 n2−1
Intervalo de confianza para la diferencia de
proporciones

) - Zo ≤ ) + Z o
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Análisis del Intervalo de confianza para la diferencia


de parámetros

1
REGLA DE DECISION PARA EL USO DE IC CON DOS
POBLACIONES
Caso 1: Cuando el IC es de la forma [ + , + ] , entonces el primer parámetro es mayor que el
segundo.
Caso 2: Cuando el IC es de la forma [ - , + ] , entonces los parámetros son iguales.

2
Caso 3: Cuando el IC es de la forma [ - , - ] , entonces el primer parámetro es menor que el
segundo.
PRUEBA DE LEVENE
La prueba de Levene que otorga el MegaStat prueba si dos muestras provienen de
poblaciones con varianzas homogéneas.
Para tomar una decisión se compara el valor de Sig. que da el reporte del MegaStat con el
valor del nivel de significación (α)

3
REGLA DE DECISION:
Si: Valor - p < α , No se asumen varianzas
iguales
Si: Valor - p ≥ α , Se asumen varianzas
iguales .
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Ejemplo 1:
La empresa Peruviam Center desea determinar si los
trabajadores de género masculino presentan mayor
número medio de enfermedades de riesgo que las de
género femenino, con la finalidad de proponer un control
de salud ocupacional adicional durante el año para el
género que presenten mayor promedio de número de
enfermedades de riesgo. Se solicita tomar una decisión
considerando la información de la base de datos adjunta,
asumiendo un nivel de confianza del 98%. ¿A que género
de trabajadores se le debe brindar el control de salud
ocupacional adicional?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

X: Número de enfermedades Variable cuantitativa


de riesgo
Intervalo de confianza para la diferencia de medias (m1 –
m2) Como n1, n2 < 30,
Datos: = 25, = 15, NC: 98%, a = 2% = 0.02
usamos la Distribución
EN MEGASTAT: 2do T de Student
1ro

En la base de
datos de
Excel
segmentamo 3ro
s los datos de
la variable
número de
enfermedade
s por género Clic
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

4to 5to
Obtenemos el siguiente
1ro. Seleccionamos
los datos de ambos 5to. Clic en resultado:
grupos OK

3ro. Ingresamos
NC y activamos
display

2do. 4to. Activamos la prueba de


Seleccionamos “t” homogeneidad de varianzas para
porque n1, n2 < 30 comprobar si las varianzas son
“asumiendo iguales.
temporalmente“ Como significancia = 0.3556 >
𝐼𝐶 ( 𝜇1 −𝜇 2)=[ −0 .144 ;1 . 051]
que las varianzas
0.02, entonces se asumen
son iguales
varianzas
Interpretando: Con un nivel de confianza del 98% la verdadera diferencia del iguales
número promedio de enfermedades
de riesgo de los trabajadores de género masculino y femenino, se encuentra contenido en [-0.144; 1.051]. Es decir el
número promedio de enfermedades de riesgo de los trabajadores de género masculino y femenino son iguales, por lo
tanto no se debe llevar a cabo un control de salud ocupacional adicional, pues ambos géneros presentan el mismo
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

X: Número de enfermedades Variable cuantitativa


de riesgo
USANDO LA FÓRMULA:

Datos: = 25, = 15, NC: 98%, a = 2% = 0.02


De la muestra 1 calculamos: (En Excel – PROMEDIO y DESVEST.M)
De la muestra 2 calculamos: (En Excel – PROMEDIO y DESVEST.M)
Hallamos: = 2.4286 En Excel = INV.T(0.99;38)

Asumiendo varianzas Calculando los intervalos:


iguales:
( n 1 −1 ) S1 + ( n 2 −1 ) S 22
( )
2
1 1
2
S = IC ( μ1 − μ2 ) =( x 1 − x 2 ) ∓ t α S 2p +
p
n 1+ n2 −2 n1 +n2 − 2,
2
n1 n2

2
S =
p
( 25 −1 ) 0 . 812 + ( 1 5 −1 ) 0 . 642
25+1 5 −2
IC ( μ1 − μ2 ) =( 0.92 − 0 . 4 7 ) ∓ 2. 4286 0 .5653
√ ( 1 1
+
25 1 5 )
.5653 𝐼𝐶 ( 𝜇1 −𝜇 2)=[ −0 .144 ;1 . 051]

Interpretando: Con un nivel de confianza del 98% la verdadera diferencia del número promedio de
enfermedades de riesgo de los trabajadores de género masculino y femenino, se encuentra contenido en [-0.144;
1.051]. Es decir el número promedio de enfermedades de riesgo de los trabajadores de género masculino y
femenino son iguales, por lo tanto no se debe llevar a cabo un control de salud ocupacional adicional, pues ambos
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Ejemplo 2:
Una empresa pretende estimar la demanda que tendrá su producto y para ello encuesta a 500
jóvenes y 600 adultos, quienes constituirían su mercado laboral potencial. De la gente joven 400
prefieren el producto, mientras que de la gente adulta 360 manifiestan su preferencia por éste.
Con un nivel de confianza del 95%, ¿se puede afirmar que la preferencia del producto es igual para
jóvenes y adultos?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

X: preferencia por el Variable cualitativa


producto
Intervalo de confianza para la diferencia de proporciones
(p1 – p2)
Datos: = 500, = 600, NC: 95%, a = 5% = 0.05 De la muestra 1 calculamos:
De la muestra 2 calculamos:

EN MEGASTAT:
1ro

2do
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

3ro 4to
Obtenemos el siguiente
resultado:
3ro. Clic en
OK
1ro. Ingresamos la información de ambas
muestras

2do. Ingresamos
NC y activamos
display

𝐼𝐶 ( 𝑝1 −𝑝 2 )=[ 0.1474 ; 0.2526 ]

Interpretando: Con un nivel de confianza del 95%, la verdadera diferencia de la proporción de


jóvenes y adultos que prefieren el producto está contenida en [0.1472; 0.2526]. Por lo tanto, podemos
afirmar que los jóvenes prefieren en mayor proporción el producto que los adultos
No se puede afirmar que la preferencia del producto es igual para jóvenes y adultos.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

X: preferencia por el Variable cualitativa


producto
USANDO LA FÓRMULA:

Datos: = 500, = 600, NC: 95%, a = 5% = 0.05 Hallamos: = 1.96


De la muestra 1 calculamos: En Excel = INV.NORM.ESTAND(0.975)
De la muestra 2 calculamos:

) - Zo ≤ ) + Z o

6) 1

𝐼𝐶 ( 𝑝1 −𝑝 2 )=[ 0.1474 ; 0.2526 ]

Interpretando: Con un nivel de confianza del 95%, la verdadera diferencia de la proporción de


jóvenes y adultos que prefieren el producto está contenida en [0.1472; 0.2526]. Por lo tanto,
podemos afirmar que los jóvenes prefieren en mayor proporción el producto que los adultos
No se puede afirmar que la preferencia del producto es igual para jóvenes y adultos.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Resumen Intervalos de Confianza (IC)


α: nivel de significancia,
1- α = nivel de confianza

Para una muestra Para dos muestras

O dos grupos, comparar

IC para la IC para la diferencia de IC para la diferencia de


IC para la media
proporción medias proporciones

Var Var cuantitativas Var cualitativas


Var cualitativa
cuantitativa De las muestras (n1 y n2),
De la Si n1 y n2 ≥ Si n1 y n2 <
Si n ≥ 30, usar “Z” muestra Identificar x1 y x2 (nro de
(n), 30, usar “z” 30, usar “t” elementos con característica de
Si n < 30, usar Identificar x “Prueba de Levene”interés)(Homogeneidad de
“t” (nro de varianzas)
elementos Si: Valor-p < α , Varianzas desiguales
De la muestra (n), con Si: Valor-p ≥ α , Varianzas iguales (homogéneas)
Calculamos: promedio característic
Y desvest a de De las muestras (n1 y n2),
interés) Calculamos: promedio1, promedio 2, desvest1 y desvest2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

RECORDAMOS:

Procedimiento de una prueba una hipótesis con MEGASTAT

Paso 1 Paso 2 Paso 3 Paso 4


Se plantea la Se selecciona Se Rechaza H0 Si P-valor
Se identifica el Comparar p-valor con α (N.
hipótesis nula el nivel de estadístico de de significancia) y tomar la <α
y alternativa. significancia. prueba. decisión. No se Rechaza H0 Si P-valor
≥α

α
H0 : =  ≤ ( x1  x 2 )  (1   2 )
Zc 
  12  22 
  
Paso 5
H1 : ≠ < >  n1 n2 
Se rechaza H0

Decisión e
Ho: μ1 = μ2 μ1 - μ2 = 0 ( x1  x 2 )  (1   2 ) interpretación. o
Tc 
1 1
H1: μ1 ≠ μ2 o μ1 - μ2 ≠ 0 S c    Se acepta Ho
 n1 n2 

Ho: P1 ≤ P2 P1 – P 2 ≤ 0
H1: P1 > P2 P1 – P 2 > 0
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Diferencia de medias para muestras


independientes
Supongamos que disponemos de una muestra aleatoria de tamaño n y una muestra aleatoria de tamaño n2 independiente
1

de la anterior. Podemos construir contrastes de amplia aplicación, como se resume a continuación:


Prueba de hipótesis:
CASO 1.
Ho: μ1 = μ2 μ1 - μ2 = 0
H1: μ1 ≠ μ2 (caso bilateral) μ1 - μ2 ≠ 0 Cuando n1,n2 son muestras grandes (ni ≥ 30), y
las varianzas poblacionales son conocidas:

Ho: μ1 ≤ μ2 Estadístico de prueba: Z


H1: μ1 > μ2 (caso unilateral)

( x1  x 2 )  (1   2 )
Ho: μ1 ≥ μ2 Zc 
  12  22 
H1: μ1 < μ2 (caso unilateral)   
 n1 n2 
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

CASO 2.
Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas e iguales:

( x1  x 2 )  (1   2 )
Estadístico de prueba: t de Student Tc 
1 1
Sc   
 n1 n2 

Donde, la varianza mancomunada se detalla: Y los grados de libertad son:

(n  1) S 2
 ( n  1) S 2 t( prob ;n1 n2  2 ) g .l
S c2  1 1 2 2
n1  n2  2

Se rechaza Ho, con un riesgo α cuando valor-p < α


Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

CASO 3.
Cuando n1 y n2 son muestras pequeñas (ni < 30) y las varianzas poblacionales son desconocidas y diferentes

Estadístico de prueba: t de Student

Donde, los grados de libertad son:


2
s 2
s  2

n n 
1 2
r, representa
r   12 2  2
los grados de
libertad
 s12   s22 
n  n 
 1   2
n1  1 n2  1

Se rechaza Ho, con un riesgo α cuando valor-p < α


Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Diferencia de proporciones- muestras independientes


Estadístico de prueba: Z

Prueba de hipótesis:

Ho: P1 = P2 P1 - P2 = 0
H1: P1 ≠ P2 (caso bilateral)
X1
p1 
n1 𝑥 1+ 𝑥 2
Ho: P1 ≤ P2 𝑝=
H1: P1 > P2 (caso unilateral) p2 
X2 𝑛 1+𝑛 2
n2

Ho: P1 ≥ P2
H1: P1 < P2 (caso unilateral)
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Prueba de hipótesis
RESUME α: nivel de significancia, α
100% - NC
=

N
Para una muestra Para dos
O dos muestras
grupos, comparar

VarHipótesis para
cuantitativa la Hipótesis
Var cualitativapara Var
la cuantitativa
Hipótesis para la diferencia de
Var cualitativas Hipótesis para la diferencia
media proporción medias proporciones
De la muestra De las muestras (n1 y n2),
(n), Identificar x1 y x2 (n° de elementos con
Identificar x característica de interés)
(n° de
elementos
con Si n1 y n2 ≥ 30, usar Si n1 y n2 < 30, usar
Si n ≥ 30, usar “Z” característica “z” “t”
de interés)
De la muestra (n),
Calculamos: promedio
Y desvest Si n < 30, usar “t”
De las muestras (n1 y n2), “Prueba de Levene” (Homogeneidad de varianzas)
Calculamos: promedio1, promedio 2, desvest1 y desvest2
Si: P-value < α , Varianzas desiguales
Si: P-value ≥ α , Varianzas iguales (homogéneas)
En todos los casos debemos aplicar la siguiente
regla de decisión:
Se Rechaza Ho Si P-valor < α
No se Rechaza Ho Si P-valor ≥ α
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

APLICACIÓN 1

Un analista compara dos métodos de enseñanza de Matemáticas


básica; el método tradicional (T) y el método moderno de enseñanza
basado en problemas (M). Una muestra aleatoria de 9 calificaciones
finales con el método T y otra muestra aleatoria de 10 calificaciones
finales con el método M dieron los siguientes resultados:

T 6 14 8 11 10 18 15 20 13
M 12 11 12 10 14 15 10 13 14 12

Se asume que las calificaciones finales son dos poblaciones independientes con distribución
normal. Con un nivel de significancia de 0,01, ¿es la calificación promedio del método tradicional
menor a la calificación promedio del método moderno?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Solución

En el menú principal Datos,


luego Megastat.....
Hypothesis Test……
Comapre Two Independent
Groups
Ingresamos los datos en Excel y
seguimos los pasos para la
contrastación de la hipótesis
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Prueba de Homogeneidad de Varianzas

Planteamos Ho: Var 1 = Var 2


Nivel de Significancia α=
la hipótesis H1: Var 1 ≠ Var 2
0.01

Ingresamos los datos, luego


activamos la opción: Test for
equality of variances
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

2) Analizamos el p-value = 0.0080 < 0.01,


entonces rechazamos Ho, es decir debemos
asumir que las varianzas poblacionales son
desiguales.

1) Observamos la salida
correspondiente a la prueba de 3) Luego volvemos a
igualdad de varianzas. realizar la prueba de
hipótesis para los
promedios, conociendo ya
el comportamiento de las
varianzas que son
desiguales
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Realizamos la prueba de hipótesis


para los promedios:
Ho: U1 ≥ U2
H1: U1 < U2

Usando el nivel de significancia


(α=0.01)

Al ingresar la información
no olvidar tener en cuenta
que utilizaremos el
estadístico T asumiendo
varianzas desiguales.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Nota: también podemos analizar el IC


donde tenemos [-4.622 ; 5.578] el cual
por la ley de los signos estudiadas en el
modulo anterior nos indica que los
promedios son iguales.
4° Observamos que el p-value es 0.6137 y
lo comparamos con el valor de
significancia de la prueba α = 0.01
teniendo: p-value=0.6137 > α = 0.01 por
tanto Aceptamos Ho. Interpretación: Existe
suficiente evidencia
estadística para concluir que la
calificación promedio del
método tradicional No es
menor a la calificación
promedio del método
moderno, con una significancia
del 1%.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

APLICACIÓN 2:
La compañía de perfumes “Esperanza S.A.” desarrolló una fragancia nueva que planea comercializar con
el nombre de Heavenly. Varios estudios de mercado indican que Heavenly tiene buen potencial de
mercado; al departamento de ventas de “Esperanza S.A.” le interesa saber si hay alguna diferencia entre
las proporciones de mujeres jóvenes y mayores que comprarían el perfume si saliera al mercado. Hay dos
poblaciones independientes, una de mujeres jóvenes y la otra, de mujeres mayores. A cada una de las
mujeres muestreadas se le pidió oler el perfume e indicar si le gusta lo suficiente para comprar un frasco
o no le gusta. Los resultados se muestran a continuación:
Mujeres jóvenes Si No No Si No No No No No No
No No Si No No No No Si No No

Si Si No Si No Si No No No No
Mujeres mayoresNo No Si No Si No No Si No No
No No Si No No No No Si No No
Con un nivel de significancia del 2%. Las mujeres jóvenes y mayores compran Heavenly en
distintas proporciones.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Solución

Entramos a Datos-----Megastat
Luego Hypothesis Test
Compare Two Independent Proportions

Ingresamos los datos en Excel


dando valor 0:No y 1:Si
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Conociendo previamente los datos correspondientes a las proporciones muestrales:


n1= 20 X1= 4 p1= X1/n1
n2=30 X2= 9 p2=X2/n2
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

4° Observamos que el p-value es 0.4297 y


lo comparamos con el valor de
significancia de la prueba α = 0.02
teniendo: p-value=0.4297 > α = 0.02 por
tanto Aceptamos Ho.

Nota: también podemos analizar el IC


donde tenemos [-0.3849 ; 0.1849] el cual
por la ley de los signos estudiadas en el
modulo anterior nos indica que las
proporciones son iguales.

Interpretación: Existe
suficiente evidencia
estadística para concluir que
las mujeres jóvenes y mayores
compran Heavenly en iguales
proporciones, con una
significancia del 2%.
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Evaluando lo aprendido
Aprendiendo de forma divertida con
Genially
Estimados estudiantes repasamos lo aprendido respondiendo a los ítems
propuestos a través del siguiente link:
https://view.genial.ly/6358c016451fdb001ae29dba/interactive-content-copia-
quiz-genial
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Conclusiones
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Recordamos nuestro logro de


aprendizaje...!!
Al culminar el estudio del módulo, el estudiante estará en capacidad de resolver casos tomando

decisiones en situaciones reales, aplicando los diferentes tipos de estimación interválica y

pruebas de hipótesis con información obtenida de dos muestras, utilizando el complemento

Excel -Megastat.

Te invito a reflexionar
¿Lo lograste?
Seguro que sí..!!
Si tienes dudas recuerda enviar tus
consultas a través de Pregúntale al
profesor o Mensajería interna y te
responderemos como máximo en 24
Te invito a participar de la próxima clase:

PRUEBA CHI CUADRADO PARA LA


INDEPENDENCIA
¿Fumar estará relacionado ¿Están asociados el
con desarrollar cáncer de bienestar y la
pulmón? calidad de vida?

¿Las habilidades blandas


están relacionadas con el
éxito?
Inferencia Estadística Estimación Interválica y Prueba de hipótesis
para la diferencia de parámetros

Consultas

Realiza consultas a través


del chat o solicita al
docente activar el
micrófono para participar.
© 2022 | Universidad Privada del
Norte

También podría gustarte