Está en la página 1de 48

ESTADÍSTICA PARA LA INVESTIGACIÓN

MAESTRÍA EN ADMINISTRACIÓN
Y MARKETING
ESTADÍSTICA PARA LA INVESTIGACIÓN

Luis Zapatel Arriaga


Lic. Estadística MBA MDU
Email: lzapatel@crece.uss.edu.pe

www.posgradouss.edu.pe
Situación INSTRUMENTO
RECOLECCIÓN Y DE
CONCLUSIONES Y DISCUSIÓN DE
Problema RECOMENDACIONES RESULTADOS ORGANIZACIÓN DE RECOLECCION
INFORMACIÓN DE
INFORMACION
Problemática

ENFOQUE

OPERACIONALIZACIÓN
¡¿Qué
información
Antecedentes

VARIABLES

Base Teórica
(conocimiento) Obj. Especif. 1
se necesita?! Variable 1
OBJETIVO
Obj. Especif. 2
GENERAL Variable 2
Obj. Especif. 3
Variable 3

Proceso de Investigación
www.posgradouss.edu.pe
ESTADÍSTICA PARA LA INVESTIGACIÓN

VENTAS/POSICIO/C.S. VENTAS/POSICIO/C.S.
PRE TEST POS TEST
DEFICIENTE LOGRADO
(5) (16)

ESTRÉS ESTRÉS
PRE TEST POS TEST
ALTA BAJA
(35) (6)

MEJORA

www.posgradouss.edu.pe
ESTADÍSTICA PARA LA INVESTIGACIÓN

Sesión 7:
Prueba de Hipótesis

Luis Zapatel Arriaga


Lic. Estadística MBA MDU
Email: lzapatel@crece.uss.edu.pe
www.posgradouss.edu.pe
Creo que el porcentaje de Si deseamos contrastarla,
productos defectuosos es debe siempre definirse ANTES
del 5%
que se genere el análisis.

Una suposición sobre la


población, principalmente
sus parámetros:
– Media
– Varianza
– Proporción/Tasa
Creo que el promedio mensual de las
EXPORTACIONES será de $350 000 ¿Qué es una hipótesis?
www.posgradouss.edu.pe
«LA FABULA DEL INFIEL»
 Los datos pueden refutarla
 La que se acepta si las pruebas no indican
H0: Hipótesis nula lo contrario
- Es FIEL  Rechazarla por error tiene graves
consecuencias.

• H1: Hipótesis alternativa Lo que uno desea probar


No debería ser aceptada sin una gran evidencia
- Es INFIEL a favor.
Rechazarla por error tiene consecuencias menos
graves que la anterior

Fotos
Videos
SM S
Facebook
W h a t sA p p
www.posgradouss.edu.pe
Hipótesis
Suposición que hacemos con respecto a un parámetro de la población.

CUANTITATIVA 𝜇=𝑆/ 450 Parámetros


Población CUALITATIVA p  0 .75

Estimar, Cálcular,
Acercarse
¿¿Significativa??

CUALITATIVA 𝑥= 𝑆/ 446 Estimadores


Muestra
CUANTITATIVA
p  0.81

www.posgradouss.edu.pe
¿Qué es una hipótesis?
• Hipótesis: enunciado acerca de una población elaborada con el
propósito de ponerse a prueba.
• Ejemplos de hipótesis acerca de un parámetro de población son:
–La media mensual de ingresos para analistas de sistemas es $3625,
–El 20% de los CLIENTES se hallan insatisfechos.

¿Qué es una prueba de hipótesis?


Prueba de hipótesis: procedimiento basado en la evidencia muestral y
en la teoría de probabilidad que se emplea para determinar si la
hipótesis es un enunciado razonable y no debe rechazarse o si no es
razonable y debe ser rechazado.
www.posgradouss.edu.pe
Secuencia de desarrollo de una Prueba de Hipótesis

1. Definir el sistema de hipótesis.


2. Seleccionar el nivel de significancia (datos).
3. Seleccionar la prueba estadística y justificar su uso (indicaciones que se cumplen).
4. Establecer Región de Rechazo.
5. Desarrollar la prueba respectiva (cálculo)
6. Toma de decisión (RHo o No RHo).
7. Conclusión.

www.posgradouss.edu.pe
Definiciones

• Hipótesis nula H0: afirmación acerca del valor de un parámetro


poblacional.
• Hipótesis alterna H1: afirmación que se aceptará si los datos
muestrales proporcionan evidencia de que la hipótesis nula es falsa.
• Nivel de significancia (alfa α) : probabilidad de rechazar la hipótesis
nula cuando es verdadera.

www.posgradouss.edu.pe
Formulación de Hipótesis
Ejemplo 1: La nueva estrategia aumentó en S/ 300 millones las utilidades
Ejemplo 2: Los préstamos irrecuperables serán del 3% en el 2021

• H0: Hipótesis nula


–(Ej.1): La nueva estrategia no aumentó en S/ 300 millones las
utilidades . No especulativa

–(Ej.2): Los préstamos irrecuperables no serán del 3% en el 2021


• H1: Hipótesis alternativa
 (Ej.1): La nueva estrategia aumentó en S/ 300 millones las utilidades . Especulativa
 (Ej.2): Los préstamos irrecuperables serán del 3% en el 2021

www.posgradouss.edu.pe
Tipos de error al tomar Tipos de error al
una decisión contrastar hipótesis
Veredicto b Decisión
a
No rechazo Rechazo H0
Inocente Culpable Acepto H0
Acepto H1
R Error R Error de tipo
E E H0 I
Inocente OK Muy OK
A A verdadera
grave
L
Probabilidad α
L
I I Error de tipo
D
Error D II
Culpable Menos OK H0 falsa OK
A
A
grave
Probabilidad β
D D

 Para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error.
 Para reducir b, hay que aumentar el tamaño muestral.
www.posgradouss.edu.pe
Definiciones

• Error Tipo I: rechazar la hipótesis nula cuando en realidad es verdadera.


• Error Tipo II: aceptar la hipótesis nula cuando en realidad es falsa.
• Estadístico de prueba: valor obtenido a partir de la información muestral, se
utiliza para determinar si se rechaza o no la hipótesis.
• Valor crítico: el punto que divide la región de aceptación y la región de rechazo
de la hipótesis nula.

www.posgradouss.edu.pe
Identificación de hipótesis
• Hipótesis nula Ho • Hip. Alternativa H1
– La que contrastamos – Niega a H0 (y creemos que es ‘mejor’).

– Los datos pueden refutarla


– Los datos pueden mostrar evidencia a favor
– No debería ser rechazada sin una buena razón. – No debería ser aceptada sin una gran
evidencia a favor.
 α debe ser pequeño (en general de 0.001
hasta 0.05)
H 0 : p  50%  ,  ,
 SI P < 0.05, entonces rechazar Ho (p<α)
 p  50% , , 
 Rechazar hipótesis nula siendo verdadera
estamos cometiendo un error. (error tipo I)
H
 1 :
 No rechazar una hipótesis no prueba que sea
cierta. Podemos cometer error de tipo II

www.posgradouss.edu.pe
¿Quién es H0?

• Problema: ¿El IQ promedio en niños menores de 6 años es 72 Pts.?

• Solución:

– Traducir a lenguaje estadístico:   72


– Establecer su opuesto:   72
– Seleccionar la hipótesis nula H 0 :   72
– Elaborar la hipótesis alternativa H1 :   72
www.posgradouss.edu.pe
¿Quién es H0?

• Problema: ¿La proporción de clientes de Movistar insatisfechos es mayor al


0.5 en mujeres?
• P: proporción de mujeres insatisfechas
• Solución:
– Traducir a lenguaje estadístico: p  0.50
– Establecer su opuesto: p  0.50
– Seleccionar la hipótesis nula: H 0 : p  0.50
– Elaborar la hipótesis alternativa H1 : p  0.50
www.posgradouss.edu.pe
Son
demasiados...

No se si los
fumadores
pesarán como el
resto… unos 70Kg
(Ho: μ=70Kg)...

¡Gran
diferencia!

Muestra
aleatoria de X  85 kg Rechazo la
hipótesis
fumadores

Contrastando una hipótesis


www.posgradouss.edu.pe
Razonamiento básico

Si supongo que H0 es cierta...

¿qué hace un
científico cuando su Rechazo que H0
teoría no coincide con sea cierta.
sus predicciones?

  70
X  85

... el resultado del experimento sería improbable.


Sin embargo ocurrió.

www.posgradouss.edu.pe
Razonamiento básico

Si supongo que H0 es cierta...


•No hay evidencia contra Ho
¿Si una teoría hace
predicciones con •No se rechaza Ho
éxito, queda probado
que es cierta? •El experimento no es concluyente

•El contraste no es significativo

  70
X  72

... el resultado del experimento es coherente.

www.posgradouss.edu.pe
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Bilateral H0: μ = 70
H1: m ¹70
Reg. Crit. Reg. Crit.
a/2 a/2

Se RHo sí Zc e [-Z1- , Z1- ]


Unilateral Unilateral

Reg. Crit. Reg. Crit.


a a

H0: μ > 70 H0: μ < 70


H1: m < 70 H1: m>70
Se RHo sí Zc < -Z1- Se RHo sí Zc > Z1-

www.posgradouss.edu.pe
H0: μ < 70
H1: m>70

Unilateral

Reg. Crit.
a

Se RHo sí Zc > Z1-

www.posgradouss.edu.pe
Significación: p
Probabilidad de que la Ho sea verdadera a la luz de los resultados hallados en una
muestra aleatoria.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p < a

P a
No se rechaza
H0: m<70

P a
H0: m<70
X  72
H1: m>70
www.posgradouss.edu.pe
Significación: p

El contraste es estadísticamente significativo cuando p<a


Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

a P

Se rechaza H0: m <70

Se acepta H1: m>70 a P

X  85

 Si p < α (nivel de significancia), se rechaza H0.


 Si p > α (nivel de significancia), no se rechaza H0.
www.posgradouss.edu.pe
Resumen: a, p y criterio de rechazo
• Sobre a • Sobre p
– Es número pequeño, preelegido – Es conocido tras realizar el
al diseñar el experimento experimento

– Conocido a sabemos todo sobre – Conocido p sabemos todo sobre


la región crítica el resultado del experimento

Sobre el criterio de rechazo


Contraste significativo: Sí p < a Se RECHAZA Ho
www.posgradouss.edu.pe
Población con Distribución Población sin Distribución
ESTADÍSTICOS DE Normal Normal
PRUEBA ACERCA
DE LA MEDIA σ conocida σ desconocida
S→σ
σ conocida
σ desconocida
S→σ
POBLACIONAL x TLC
Zc  x   TLC x
() n > 30 x s/ n Zc 
/ n
Zc 
s/ n
Zc 
/ n
n < 30 tc 
x
Estadística No Paramétrica
s/ n
ESTADÍSTICOS
DE PRUEBA Si la muestra proviene de una población Estadísticas Zc 
p p
que sigue una distribución normal ó p(1  p)
ACERCA DE LA np > 5 y nq > 5….. Dist. normal n
PROPORCIÓN NOTA: No hemos descrito el procedimiento para pruebas de hipótesis con muestras
pequeñas donde intervienen proporciones poblacionales. En el caso de muestra
POBLACIONAL pequeña, la distribución muestral de se apega a la distribución Binomial, y en
consecuencia no se aplica la Distribución normal. Sin embargo, en la práctica casi
(P) nunca se llevan a cabo pruebas con muestras pequeñas para una proporción
poblacional.
Pruebas Paramétricas vs No Paramétricas
PARAMETRICAS -Distribución -Datos sin

NO PARAMETRICAS
Normal distribución
-Escala de normal
medición mínima -Escala nominal,
de Intervalo ordinal

Muestras Independientes
U Man Withney

Muestras Relacionadas
Wilcoxon

www.posgradouss.edu.pe
Prueba de Normalidad
 Ho: Los datos siguen una distribución Normal
 H1: Los datos No siguen una distribución Normal

Nivel de Confianza = 95% o su complemento


ALFA = 5%

Sí p < ALFA Rechazamos Ho

www.posgradouss.edu.pe
Prueba de Normalidad
H0 : La distribución de las frecuencias de la variable X sigue una distribución normal.
H1: La distribución de las frecuencias de la variable X no sigue una distribución normal.

Sí p < alfa Se Rechaza la Ho

Existen dos tipos de prueba:


Kolmogorov Smirnov cuando la muestra es mayor o igual de 50 (paramétrica).
Shapiro Wilk, cuando la muestra es menor que 50 (no paramétrica)

www.posgradouss.edu.pe
Prueba de Normalidad

www.posgradouss.edu.pe
Maestría en Psicología
Posgrado
Educativa

H0 : La distribución de las frecuencias de la variable X sigue una distribución normal.


H1: La distribución de las frecuencias de la variable X no sigue una distribución normal.

Nivel de confianza 95%


Nivel de Significancia (Alfa =5%)

P vs alfa
0.167 > 0.05 NO RHo

Sí p < alfa Se Rechaza la Ho


www.posgradouss.edu.pe
Maestría en Psicología
Posgrado
Educativa

H0 : La distribución de las frecuencias de la variable X sigue una distribución normal.


H1: La distribución de las frecuencias de la variable X no sigue una distribución normal.

Nivel de confianza 95%


Nivel de Significancia (Alfa =5%)

P vs alfa
0 < 0.05

Sí p < alfa Se Rechaza la Ho


www.posgradouss.edu.pe
Maestría en Psicología
Posgrado
Educativa

www.posgradouss.edu.pe
Secuencia de desarrollo de una Prueba de
Hipótesis

1. Definir el sistema de hipótesis.


2. Seleccionar el nivel de significancia (datos).
3. Seleccionar la prueba estadística y justificar su uso (indicaciones que se
cumplen).
4. Establecer Región de Rechazo.
5. Desarrollar la prueba respectiva (cálculo)
6. Toma de decisión (RHo o No RHo).
7. Conclusión.

www.posgradouss.edu.pe
9-13

Caso Cemento SOL


Los fabricantes de la bolsa de cemento SOL indican en su
etiqueta que el contenido de cada bolsa es de 42.5 Kg. Cada
hora se toma una muestra de 36 bolsas y se pesa el
contenido. La muestra de la última hora tiene un peso
medio de 42.6 Kg. con una desviación estándar de 0.35 Kg.

CASO A ¿Con un nivel de significancia de 0.05 podemos decir que el contenido promedio
no es de 42.5 Kg.?
CASO B ¿Sí la muestra indicara una media de 42.71 Kg., con una variabilidad de 0.37, será el contenido
promedio mayor a 42.5 Kg. con una confianza del 99%?

www.posgradouss.edu.pe
Paso 1: Paso 6 y 7: T. decisión y Conclusión
HO:   42.5 Kg. Como Z=1.71 Є [-1.96 ; 1.96], No RHo.
Con un 95% de confianza afirmamos que el contenido
H1:   42.5 Kg . promedio de cada bolsa es de 42.5 Kg., el proceso está
Paso 2: bajo control.
Seleccionar nivel de n  36
significancia. x  42.6 Kg
α = 0.05 S  0.35 CASO A
Paso 3: Determinar el Estad. Prueba:
x
Zc 
s/ n
Paso 4: Determinar la Región de Rechazo
Sí Z ɇ [-1.96 ; 1.96], RHo.
Paso 5: Cálculo del estadístico: a = 0.025 a = 0.025

x 42.6  42.5 µ=42.5 Kg


Z   1.71 -1.96 0 1.96
s/ n 0.35 / 36 1.71 Z
www.posgradouss.edu.pe
Paso 1: Paso 6 y 7: T. decisión y Conclusión
HO:   42.5 Kg. Como Z=3.41 > 2.33, RHo.
Con un 99% de confianza afirmamos que el contenido
H1:   42.5 Kg . promedio de cada bolsa es mayor a 42.5 Kg.
Paso 2:
Seleccionar nivel de n  36
significancia. x  42.71 CASO B
α = 0.01 S  0.37
Paso 3: Determinar el Estad. Prueba:
x
Zc 
s/ n
Paso 4: Determinar la Región de Rechazo
Sí Z > 2.33, RHo.
Paso 5: Cálculo del estadístico: a = 0.01
µ=42.5 Kg
x 42.71  42.5 2.33
Z   3.41 0 3.41
Z
s/ n 0.37 / 36
www.posgradouss.edu.pe
Caso SUNAT
En una muestra de 25 registros de locales clausurados por la SUNAT se detectó
un promedio de 4.8 días de demora para el pago de la multa y una desviación
estándar de 2 días. Suponga que los datos tienen distribución normal.

CASO A ¿Es posible concluir a partir de estos datos que la media de días para que se pague la multa
es diferente a 4 ? Empleé un α:0.05
CASO B ¿Es posible concluir a partir de estos datos que la media de la población es mayor a 4 días?
Sea α:0.05
1. Ho: µ = 4
H1: µ ≠ 4
2. α =0.05
Datos: n  25 x  4.8 S  2
3. Estadístico de prueba: Dado que…..
x
X sigue una distribución Normal,
no se conoce la desviación Estándar poblacional sino la muestral S,
tc 
s/ n
y n < 25.
www.posgradouss.edu.pe
1. Ho: µ = 4 CASO A ¿Es posible concluir a partir de estos datos que la media de
H1: µ ≠ 4 la población es diferente a 4 días por local? Sea α:0.05
2. α =0.05 3. Estadístico de prueba:
n  25 x
Como X Distrib. Normal, S, y n < 25. tc 
x  4 .8 S 2
s/ n

4. Región de Rechazo:
Tabla T Bilateral α = 0.05 y GL= 24 tα = 2.064
5. Cálculo del E.P.:
x 4 .8  4
tc   2
s/ n 2 / 25
a = 0.025 a = 0.025
6. Toma de decisión y Conclusión µ=4
-2.064 0 2.064
……. 2 T

Para determinar el valor de P, buscamos en la tabla el valor de significancia para el valor to=2 con 24 gl. El valor de P se encuentra entre 0.05 y
0.10, o sea 0.05<P<0.10. No rechazamos la Ho.
P es el área que le corresponde al valor t o (calculado) ver a continuación.

www.posgradouss.edu.pe
1. Ho: µ < 4 CASO B ¿Es posible concluir a partir de estos datos que la media
H1: µ > 4 de la población es mayor a 4 días por local? Sea α:0.05
2. α =0.05
n  25 3. Estadístico de prueba: x
x  4.8 S 2 Como X Distrib. Normal, S, y n < 25. tc 
s/ n
4. Región de Rechazo:
Tabla T Unilateral α = 0.05 y GL= 24 tα = 1.753
5. Cálculo del E.P.:
x 4 .8  4
tc   2
s/ n 2 / 25
6. Toma de decisión y Conclusión
……. a = 0.025 a = 0.05
µ=4
0 1.753 2
T

www.posgradouss.edu.pe
ESTADÍSTICA PARA LA INVESTIGACIÓN

Caso SOLGAS
SOLGAS hasta el 2019 tuvo una tasa de
balones de gas con sin defectos en su peso
del 15%. Actualmente se ha desarrollado un
nuevo método de llenado y se desea saber si
es más efectivo.

Sí se probó con 200 balones y se halló que en 45 no hubo defectos de


peso. Para 0.05 de significancia, ¿Se puede concluir que la nueva versión
es más efectiva?
www.posgradouss.edu.pe
• Paso 1: H 0 : p  0.15
H1 : p  0.15 Paso 6:Toma de decisión sobre H0
• Paso 2: α = 0.05 Como z = 2.97 >1.645, Ho se rechaza.
fi hi hi%
Sí 45 0.225 22.5%
𝑝 La nueva versión es más efectiva.

No 0.775 77.5%
p p
n = 200 1 100% Zc 
• Paso 3: Elección del estadístico de prueba: p(1  p)
n
• Paso 4: Determinación región de rechazo
(regla de decisión)
H0 se rechaza si z > 1.645
• Paso 5: Cálculo del Estad. Prueba:
45
 0.15 a = 0.05
z 200  2.97
(0.15 )(0.85 ) P=0.15
0 1.65 2.97 Z
200
www.posgradouss.edu.pe
ESTADÍSTICA PARA LA INVESTIGACIÓN

• Propuesto 1: Se quiere saber si el tiempo promedio para


realizar una evaluación en los estudiantes del VI ciclo de una
I.E. Pública es menor a 170 minutos. Para esto se selecciona
una muestra de 20 alumnos y se registra el tiempo,
encontrando una media de 150 minutos. y desviación
estándar 25 minutos. ¿Con un 99% de confianza que
podemos concluir?

• Propuesto 2: Se desea estimar si la proporción de niños


disléxicos en el Norte de Lima es igual a 0.53. Para esto, se
selecciona una muestra de 100 niños de esta zona y se
encuentra que 48 presentan tal condición. ¿Con 90% de
confianza, a que conclusión llegamos?
www.posgradouss.edu.pe
ESTADÍSTICA PARA LA INVESTIGACIÓN

www.posgradouss.edu.pe
Sea que:
•g.l.= 14
•Una cola
•Punto T =1.45
•Área (Alfa) está entre
[0.10 y 0.05]
•¡Interpolación!

www.posgradouss.edu.pe
Test no paramétricos para una sola muestra
• Prueba del Signo (Webster Pg 489- Lind Pg 681)
• Prueba de Rachas (Webster Pg 494-)
• Prueba U Mann Whitney IND (Webster Pg 498-)
• Prueba de rangos de Spearman (Webster Pg 503-)
• Prueba de Kruskal Wallis >3 DEP (Webster Pg 508-)

• Prueba de rangos con signo de Wilcoxon Muestras dependientes (Lind Pg 681)


• Prueba de Wilcoxon (U MannWhitney) de la suma de rangos Muestras
independientes (Lind Pg 695)
• Prueba de Kruskal-Wallis:análisis de la varianza por rangos (Lind Pg 699)
• Correlación por orden de rango (Lind Pg 704)
www.posgradouss.edu.pe
WEBSTER LIND

Prueba de los signos (Lind Pg 681) Ho: p = 0.5


-Uso de Aprox Binomial a Normal
Prueba del Signo (Webster Pg 489- -Prueba de Mediana Lind Pg 688)
Lind Pg 681) La mayoría de las pruebas de hipótesis que se realizaron hasta este punto
comprendieron la media de la población o una proporción. La prueba de los signos es
DEP = PAREADAS Ho: p = 0.5 una de las pocas pruebas con que se demuestra el valor de una mediana
Prueba de rangos con signo de Wilcoxon Muestras dependientes
(Lind Pg 690) T Depend
Prueba U Mann Whitney IND Prueba de Wilcoxon (U MannWhitney) de la suma de rangos
(Webster Pg 498-) Muestras Independientes (Lind Pg 695)

Prueba de rangos de Spearman


Correlación por orden de rango (Lind Pg 704)
(Webster Pg 503-) RELAC ENTRE VAR

Prueba de Kruskal Wallis > 3 IND Prueba de Kruskal-Wallis:análisis de la varianza por rangos (Lind
(Webster Pg 508-) Pg 699)

Prueba de Rachas (Webster Pg 494-)


ALEATOREIDAD EN LA MUESTRA

www.posgradouss.edu.pe
1. PRUEBA MEDIANA
2. PRUEBA SIGNOS
3. PRUEBA BINOMIAL
4. PRUEBA DE RANGOS CON SIGNOS DE WILCOXON

www.posgradouss.edu.pe
Referencias

Hernández, R. y Mendoza, C. Metodología de la investigación. Las rutas cuantitativa, cualitativa


y mixta. México: McGraw Hill. 2018
Malhotra Naresh K. Investigación de Mercados. Quinta Edición PEARSON EDUCACIÓN, México,
2008
Moya Calderón, R. (2019). Estadística descriptiva Conceptos y Aplicaciones. Lima: San Marcos.
Salgado (2007). Investigación cualitativa: diseños, evaluación del rigor metodológico y retos.

www.posgradouss.edu.pe

También podría gustarte