Está en la página 1de 29

INFERENCIA PARA

DATOS NUMÉRICOS
Teoría Básica de la Estadística
Cat: MSc. Inga. Guippsy Menéndez

SILENCIAR SUS MICRÓFONOS


POR FAVOR
PRUEBA DE HIPÓTESIS PARA 2 MUESTRAS
Muchas veces se debe decidir si la diferencia entre 2 medias muestrales
se puede atribuir al azar o si en realidad las 2 muestras provienen de
poblaciones con medias diferentes.

Ejemplo:
• Comparar la productividad de dos tipos de software
• Comparar la efectividad de un plan de salud (antes vs después)
• Comparar el rendimiento de 2 tipos de llantas
Se seleccionan muestras aleatorias de 2 poblaciones distintas para
determinar si son iguales las medias de la población.

Se deben considerar 2 casos:


• Muestras independientes
• Muestras dependientes
PRUEBA DE HIPÓTESIS PARA 2 MUESTRAS INDEPENDIENTES

Si Ⴟ1 y Ⴟ2 son las medias de 2 muestras aleatorias independientes, entonces


la distribución muestral de la diferencia entre las medias Ⴟ1 - Ⴟ2 tiene la
media µ1 - µ2 , la desviación estándar se calcula por medio de:
Donde σ1, σ2, µ1 y µ2 son las desviaciones y
medias de las 2 poblaciones muestreadas

Se plantea la hipótesis nula como: Ho: µ1 - µ2 = δ

Se plantea la hipótesis alternativa como cualquiera de las tres siguientes:


• H1: µ1 - µ2 < δ
• H1: µ1 - µ2 > δ
• H1: µ1 - µ2 ≠ δ
Donde δ es una constante determinada con base en muestras aleatorias e
independientes de tamaño n1 y n2. Lo mas frecuente es que δ=0.
Opción 1

Cuando las muestras son grandes (mayores de 30) y se conoce σ


poblacional, el estadístico de prueba a utilizar es el de la distribución z (zc:
valor calculado):

Los criterios de aceptación o rechazo son iguales a los de los criterios


utilizados en la prueba de hipótesis para una media.
PASOS PARA PROBAR UNA HIPÓTESIS

1 Se establece la hipótesis nula y la hipótesis alternativa

2 Se selecciona un nivel de significancia para la prueba

3 Se identifica el estadístico de prueba

4 Se formula una regla para tomar decisiones

Se llega a una decisión: se acepta o se rechaza la hipótesis


5 nula
EJEMPLO1: Un vendedor de equipo tecnológico quiere determinar si hay
diferencias en el consumo de este tipo de productos por parte de entre los
profesionales en ciencias económicas y profesionales en ingeniería, pues
ha tenido muy buena experiencia vendiendo equipos para el primer
profesional mencionado. Seleccionó una muestra al azar de 80
profesionales de ciencias económicas y 70 ingenieros, encontrando que
los primeros gastaron un promedio de Q1,250 en productos con una
σ=400. Los ingenieros gastaron en promedio Q980 con una σ=620.
¿Existe diferencia significativa al 1% de significancia entre ambas
poblaciones?

Población 1: Ciencias económicas


n1=80 Ⴟ1=1,250 σ1=400

Población 2: Ingeniería
n2=70 Ⴟ2=980 σ2=620
PASO 1: Se establece la hipótesis nula y la hipótesis alternativa
Se plantea la hipótesis nula: las 2 medias son iguales o que la diferencia es
cero Ho: µ1 - µ2 = 0 o Ho: µ1 = µ2

El promedio para económicas es mayor que para ingeniería, por lo tanto


H1: µ1 - µ2 > 0 (1,250-980 = 270)
PASO 2: Se selecciona un nivel de significancia para la prueba
Nivel de significancia es del 1% por lo tanto α=0.01

PASO 3: Se identifica el estadístico de prueba

Cuando se conoce σ, el estadístico de prueba es la distribución z (zc: valor


calculado), además δ=0

Zc = (1,250 – 980) / √[(400²/80)+(620²/70)]


zc = 3.12
PASO 4: Se formula una regla para tomar decisiones
Como H1: µ1 - µ2 > 0 la prueba es de una cola y se tiene la zona de rechazo
del lado derecho

Se calcula z de acuerdo a la tabla normal


z=2.33

Como zc=3.12 y z= 2.33, tenemos que:


|zc|>|z| → |3.12|>|2.33| → se rechaza Ho y se acepta H1
PASO 5: Se llega a una decisión, se acepta o se rechaza Ho
A un nivel de significancia del 1%, se rechaza la hipótesis nula Ho, existe
evidencia suficiente para considerar que el consumo de productos
tecnológicos por parte de entre los profesionales en ciencias económicas
es mayor que el de los profesionales de ingeniería.
EJEMPLO2: Un analista de inversiones requiere asesorar a un cliente con
respecto a los riesgos de invertir en las acciones de 2 compañías distintas.
Se Seleccionó una muestra al azar de 40 variaciones diarias en los precios
con una media de 2.8 y σ=1.2 de la compañía 1 y 50 variaciones diarias
en los precios con una media de 3.5 y σ=1.8 de la compañía 2. ¿Es esta
evidencia suficiente para considerar que el comportamiento de ambas
acciones es el mismo o son diferentes?

Población 1: Compañía 1
n1=40 Ⴟ1=2.8 σ1=1.2

Población 2: Compañía 2
n2=50 Ⴟ2=3.5 σ2=1.8
PASO 1: Se establece la hipótesis nula y la hipótesis alternativa
Se plantea la hipótesis nula: determinar si existe diferencia entre las medias
Ho: µ1 - µ2 = 0

La media para la compañía 1 es menor que para la compañía 2, por lo tanto


H1: µ1 - µ2 < 0 (2.8-3.5 = -0.7)
PASO 2: Se selecciona un nivel de significancia para la prueba
Nivel de significancia es del 5% por lo tanto α=0.05

PASO 3: Se identifica el estadístico de prueba

Cuando se conoce σ, el estadístico de prueba es la distribución z (zc: valor


calculado), además δ=0

Zc = (2.8 – 3.5) / √[(1.2²/40)+(1.8²/50)]


zc = -2.20
PASO 4: Se formula una regla para tomar decisiones
Como H1: µ1 - µ2 < 0 la prueba es de una cola y se tiene la zona de rechazo
del lado izquierdo

Se calcula z de acuerdo a la tabla normal


z=1.64

Como zc=-2.20 y z= 1.64, tenemos que:


|zc|>|z| → |-2.20|>|1.64| → se rechaza Ho y se acepta H1
PASO 5: Se llega a una decisión, se acepta o se rechaza Ho
A un nivel de significancia del 5%, se rechaza la hipótesis nula Ho, existe
evidencia suficiente para creer que el comportamiento de ambas
acciones no es el mismo, es decir son diferentes.
EJEMPLO3: Se hizo un estudio sobre el número de premios empresariales
por mes que los ejecutivos afirman que deben de ser reconocidos por la
empresa. Si 30 ejecutivos de una transnacional promediaron 11.9 premios
con una σ=2.1 y 40 ejecutivos de una nacional promediaron 8.2 premios
con una σ=1.8. Determine a un nivel de significancia del 5%, si la
diferencia entre los 2 promedios es de como máximo 3 premios.

Población 1: Transnacional
n1=30 Ⴟ1=11.9 σ1=2.1

Población 2: Nacional
n2=40 Ⴟ2=8.2 σ2=1.8
PASO 1: Se establece la hipótesis nula y la hipótesis alternativa
Se plantea la hipótesis nula: determinar si existe diferencia entre las medias
Ho: µ1 - µ2 = 3 Se sabe que δ<=3

La media para la transnacional es mayor que para la nacional, por lo tanto


H1: µ1 - µ2 > 3 (11.9 – 8.2 = 3.7)
PASO 2: Se selecciona un nivel de significancia para la prueba
Nivel de significancia es del 5% por lo tanto α=0.05

PASO 3: Se identifica el estadístico de prueba

Cuando se conoce σ, el estadístico de prueba es la distribución z (zc: valor


calculado)

Zc = ((11.9 – 8.2)-3) / √[(2.1²/30)+(1.8²/40)]


zc = 1.466
PASO 4: Se formula una regla para tomar decisiones
Como H1: µ1 - µ2 > 3 la prueba es de una cola y se tiene la zona de rechazo
del lado derecho

Se calcula z de acuerdo a la tabla normal


z=1.64

Como zc=1.466 y z= 1.64, tenemos que:


|zc|<|z| → |1.466|<|1.64| → se acepta Ho y se rechaza H1
PASO 5: Se llega a una decisión, se acepta o se rechaza Ho
A un nivel de significancia del 5%, se acepta la hipótesis nula Ho, existe
evidencia suficiente para decir que la diferencia es como máximo de 3
premios.
Opción 2

Cuando n1 o n2 o ambas son menores de 30 y se desconoce σ


poblacional, el estadístico de prueba a utilizar es el de la distribución t (tc:
valor calculado) siempre que se pueda suponer razonablemente que las
poblaciones son normales y que σ1 = σ2 = σ

Los grados de libertad se calculan: gl = n1 + n2 -2

Los criterios de aceptación o rechazo son iguales a los de los criterios


utilizados en la prueba de hipótesis para una media.
PASOS PARA PROBAR UNA HIPÓTESIS

1 Se establece la hipótesis nula y la hipótesis alternativa

2 Se selecciona un nivel de significancia para la prueba

3 Se identifica el estadístico de prueba

4 Se formula una regla para tomar decisiones

Se llega a una decisión: se acepta o se rechaza la hipótesis


5 nula
EJEMPLO1: Una empresa desea capacitar en gestión de proyectos a todos
sus profesionales. Del total de 15 empleados, 9 realizaron la capacitación
en modalidad presencial con una calificación promedio de 70.2 y una
desviación estándar muestral de 12.5 y 6 realizaron la capacitación en
modalidad virtual con una calificación promedio de 67.5 y una desviación
estándar muestral de 9.71. El departamento de recursos humanos desea
saber si una modalidad de estudio es más efectiva que la otra. Utilice un
nivel de significancia del 5%.
Población 1: Modalidad presencial
n1=9 Ⴟ1=70.2 s1=12.5
Población 2: Modalidad virtual
n2=6 Ⴟ2=67.5 s2=9.71

PASO 1: Se establece la hipótesis nula y la hipótesis alternativa


Se plantea la hipótesis nula: determinar si existe diferencia entre las medias
Ho: µ1 - µ2 = 0
La media para la modalidad 1 es mayor que para la modalidad 2, por lo tanto
H1: µ1 - µ2 > 0 (70.2 – 67.5 = 2.7)
PASO 2: Se selecciona un nivel de significancia para la prueba
Nivel de significancia es del 5% por lo tanto α=0.05

PASO 3: Se identifica el estadístico de prueba

Cuando se desconoce σ y las muestras son pequeñas, el estadístico de


prueba es la distribución t (tc: valor calculado) además δ=0

σ² = [(9 – 1)12.5² + (6-1)9.71²] / (9+6-2)


σ² = 132.42

tc = (70.2 – 67.5) / √[(132.42/9)+(132.42/6)]


tc = 0.45
PASO 4: Se formula una regla para tomar decisiones
Como H1: µ1 - µ2 > 0 la prueba es de una cola y se tiene la zona de rechazo
del lado derecho, además gl= n1+n2-2 = 9+6-2 → gl=13

Se calcula t de acuerdo a la tabla t de student


t=1.77

Como tc=0.45 y t= 1.77, tenemos que:


|tc|<|t| → |0.45|<|1.77| → se acepta Ho
PASO 5: Se llega a una decisión, se acepta o se rechaza Ho
A un nivel de significancia del 5%, se acepta la hipótesis nula Ho, se
puede decir que la diferencia entre los promedios de ambas modalidades
no es estadísticamente significativa
PRUEBA DE HIPÓTESIS PARA 2 MUESTRAS DEPENDIENTES

Si las poblaciones de donde se toman las muestras no son independientes


(caso de experimentos de “antes” y “después”) en las que los datos están
naturalmente apareados, se usa la prueba t para la diferencia de los datos
apareados.

Se plantea la hipótesis nula como: Ho: µd = 0, porque si µd que es el


promedio poblacional de las diferencias entre las 2 poblaciones es cero, es
porque, en promedio, las 2 poblaciones son iguales.

Se calculan las diferencias entre las 2 muestras, luego se denota como Ⴟd


al promedio de la diferencia de las 2 muestras, y se denota sd a la desviación
estándar de la diferencia de las 2 muestras.
Se plantea la hipótesis alternativa como cualquiera de las tres siguientes:
• H1: µd > 0 si Ⴟd > 0
• H1: µd < 0 si Ⴟd < 0
• H1: µd ≠ 0

El estadístico de prueba a utilizar es el de la distribución t (tc: valor calculado)


de acuerdo a la siguiente fórmula:

Los criterios de aceptación o rechazo son iguales a los de los criterios


utilizados en la prueba de hipótesis para una media.
PASOS PARA PROBAR UNA HIPÓTESIS

1 Se establece la hipótesis nula y la hipótesis alternativa

2 Se selecciona un nivel de significancia para la prueba

3 Se identifica el estadístico de prueba

4 Se formula una regla para tomar decisiones

Se llega a una decisión: se acepta o se rechaza la hipótesis


5 nula
EJEMPLO1: Se realiza un estudio mensualmente sobre los fallos de una
máquina en 10 plantas industriales que se realizó el plan piloto y se
encontró que el número de días de trabajo perdidos antes y después son
dados en la siguiente tabla. ¿Existe diferencia entre el número de fallos
antes y después del plan piloto? Utilice un nivel de significancia del 5%.
1 2 3 4 5 6 7 8 9 10
Antes 45 73 46 124 33 57 83 34 26 17
Después 36 60 44 118 35 50 77 29 24 18

Se calculan las diferencias:


1 2 3 4 5 6 7 8 9 10
Antes 45 73 46 124 33 57 83 34 26 17
Después 36 60 44 118 35 50 77 29 24 18
di 9 13 2 6 -2 7 6 5 2 -1

Con estas diferencias se calcula


Ⴟd=4.7 y sd=4.57

Además tenemos que n=10


PASO 1: Se establece la hipótesis nula y la hipótesis alternativa
Se plantea la hipótesis nula: determinar que no existe diferencia entre los
fallos Ho: µd = 0

Antes había más días perdidos que después, por lo tanto


H1: µd > 0 (Ⴟd=4.7 )
PASO 2: Se selecciona un nivel de significancia para la prueba
Nivel de significancia es del 5% por lo tanto α=0.05

PASO 3: Se identifica el estadístico de prueba

Para 2 muestras dependientes, el estadístico de prueba es la distribución t


(tc: valor calculado)
tc = 4.7 / (4.57 / √10)
tc = 3.25
PASO 4: Se formula una regla para tomar decisiones
Como H1: µd > 0 la prueba es de una cola y se tiene la zona de rechazo del
lado derecho, además gl= n1-1 = 10-1 → gl=9

Se calcula t de acuerdo a la tabla t de student


t=1.83

Como tc=3.25 y t= 1.83, tenemos que:


|tc|>|t| → |3.25|>|1.83| → se rechaza Ho y se acepta H1
PASO 5: Se llega a una decisión, se acepta o se rechaza Ho
A un nivel de significancia del 5%, se rechaza la hipótesis nula Ho, se
puede decir que existe evidencia suficiente para concluir que el plan
piloto funcionó y que antes había más días perdidos que después.
EJEMPLO2: La siguiente tabla muestra las cantidades producidas por hora
elaboradas por 8 costureras antes de recibir una capacitación y las
cantidades producidas luego de la misma. Pruebe a un nivel de
significancia del 5% que la capacitación ha sido efectiva.
1 2 3 4 5 6 7 8
Antes 5 8 7 6 9 7 12 8
Después 8 10 7 11 9 12 14 9

Se calculan las diferencias:


1 2 3 4 5 6 7 8
Antes 5 8 7 6 9 7 12 8
Después 8 10 7 11 9 12 14 9
di -3 -2 0 -5 0 -5 -2 -1

Con estas diferencias se calcula


Ⴟd=-2.25 y sd=1.98

Además tenemos que n=8


PASO 1: Se establece la hipótesis nula y la hipótesis alternativa
Se plantea la hipótesis nula: determinar que no existe diferencia entre el
antes y después Ho: µd = 0

Antes producían menos que después, por lo tanto


H1: µd < 0 (Ⴟd=-2.25 )
PASO 2: Se selecciona un nivel de significancia para la prueba
Nivel de significancia es del 5% por lo tanto α=0.05

PASO 3: Se identifica el estadístico de prueba

Para 2 muestras dependientes, el estadístico de prueba es la distribución t


(tc: valor calculado)
tc = -2.25 / (1.98 / √8)
tc = -3.21
PASO 4: Se formula una regla para tomar decisiones
Como H1: µd < 0 la prueba es de una cola y se tiene la zona de rechazo del
lado izquierdo, además gl= n1-1 = 8-1 → gl=7

Se calcula t de acuerdo a la tabla t de student


t=1.89

Como tc=-3.21 y t= 1.89, tenemos que:


|tc|>|t| → |-3.21|>|1.89| → se rechaza Ho y se acepta H1
PASO 5: Se llega a una decisión, se acepta o se rechaza Ho
A un nivel de significancia del 5%, se rechaza la hipótesis nula Ho, se
puede decir que existe evidencia suficiente para concluir que la
producción después de la capacitación es mayor que antes, por lo que la
capacitación fue efectiva.
LABORATORIO

También podría gustarte