Está en la página 1de 22

Prueba de normalidad

Dr. Carlos Alberto Ligarda Samanez


Introducción
• Al empezar el análisis estadístico y después de la depuración de los
datos y la corrección de errores, debemos estudiar si el
comportamiento de nuestras variables numéricas sigue una
distribución normal.
• Esta característica es muy importante sobre todo en muestras
pequeñas (n<30), ya que muchos de los test estadísticos para su
correcta aplicación e interpretación, asumen normalidad en los datos.
Pruebas de bondad de ajuste
• Se utilizan para contrastar si los datos de la muestra pueden
considerarse que proceden de una determinada distribución o
modelo de probabilidad. Por ejemplo, cuando deseamos saber si los
datos que manejamos proceden de una distribución normal,
binomial, de Poisson, exponencial, etc.
• En definitiva, las pruebas de bondad de ajuste permiten verificar qué
tipo de distribución siguen nuestros datos y, por tanto, qué pruebas
(paramétricas o no paramétricas) podemos llevar a cabo en el
contraste estadístico.
Pruebas de bondad de ajuste para el contraste
de distribución normal:
1. Prueba de Kolmogorov-Smirnov (K-S).

2. Test de Lilliefors (prueba de corrección para Kolmogorov).

3. Prueba de gráficos: Histograma, Q-Q Plots.

4. Prueba de Shapiro-Wilks.
1. PRUEBA DE KOLMOGOROV-SMIRNOV
• Conocida como prueba K-S, es una prueba de significación estadística
para verificar si los datos de la muestra proceden de una distribución
normal. Se emplea para variables cuantitativas continuas y cuando el
tamaño muestral es mayor de 50.
2. TEST DE LILLIEFORS (PRUEBA DE CORRECCIÓN
PARA KOLMOGOROV-SMIRNOV)
• La prueba K-S para una muestra no es muy útil en la práctica, ya que
en la gran mayoría de las veces desconocemos cuál es la media y
desviación estándar de la población, y por tanto, se deben estimar
para la distribución teórica de comparación. Esto genera que la
prueba K-S sea muy conservadora, aceptando la hipótesis nula en la
mayoría de las ocasiones.
• Para solventar este problema Lilliefors tabuló el estadístico de
Kolmogorov-Smirnov para el caso más habitual en el que
desconocemos la media y la varianza poblacional y se estiman a
través de los datos muestrales.
3. PRUEBA DE GRÁFICOS: HISTOGRAMA, Q-Q
PLOTS
• Hasta ahora hemos visto como, a través de pruebas de significación
estadística, podemos determinar la bondad de ajuste de una muestra
a una distribución normal. Por otra parte, podemos hacer algo
parecido de una manera visual, mediante la observación de gráficos,
los cuales nos orientan sobre la normalidad o no de la muestra.
• El uso de gráficos presenta varias ventajas, como por ejemplo, la
sencillez de interpretación o la facilidad para obtener el diagrama a
través de los propios paquetes estadísticos. Sin embargo, el principal
inconveniente es la subjetividad de la interpretación visual, ya que al
contrario de las pruebas de significación estadística, las pruebas
gráficas no incluyen ningún valor de “p”.
4. PRUEBA DE SHAPIRO-WILKS
• Cuando el tamaño muestral es igual o inferior a 50 la prueba de
contraste de bondad de ajuste a una distribución normal es la prueba
de Shapiro-Wilks.
Ejercicios
• SHAPIRO WILK
• OBJETIVO
Determinar si una muestra aleatoria presenta distribución
normal. La lógica de la prueba se basa en las desviaciones que
presentan las estadísticas de orden de la muestra respecto a los
valores esperados de los estadísticos de orden de la normal
estándar.
SUPUESTOS
1. Una muestra
2. Observaciones independientes
3. Muestreo aleatorio
4. Variables en escala de intervalo o razón
TIPO DE HIPÓTESIS A PROBAR
• Ho: La muestra aleatoria tiene una distribución normal.
• Ha: La muestra aleatoria no tiene una distribución normal.
Ejemplo 1
• En un estudio, los efectos benéficos de la intervención se observaran
en el peso ganado (en kg.) al término de tres meses. El estudio se
realizó con una muestra aleatoria de siete individuos y los datos
obtenidos son los siguientes.
6, 1, -4, 8, -2, 5 y 0
• Antes de proceder a analizar los datos con pruebas de inferencia
estadística se desea corroborar si se distribuyen de manera normal.
Probar la hipótesis nula de que la distribución de la muestra es
normal.
SOLUCIÓN
Variable en escala de razón: peso ganado
• Paso 1.
Establecer las hipótesis a probar
Ho: La distribución de la muestra es normal.
Ha: La distribución de la muestra no es normal.
• Paso 2.
Elegir la prueba estadística
Dado que interesa probar que la muestra presenta distribución normal y se cuenta
con puntajes individuales y en escala de razón, y la muestra fue tomada de forma
aleatoria, se aplicará la prueba de Shapiro-Wilk.
• Paso 3. Especificar alfa
• Se empleará un α= 0.05
SOLUCIÓN
• Paso 4. Región de Rechazo
Todos los valores menores o iguales a Wt con un alfa de 0.05
• Paso 5. Decisión
• Para obtener el valor observado de W y tomar la decisión estadística
se aplica el procedimiento con la fórmula de W.

Obtener el estadístico
Calcular los datos necesarios para aplicar la fórmula de W como se
muestra en la siguiente tabla.
Ordenación Coeficiente (dato mayor
Puntaje de menor a para contraste - dato Coef*dif (b)
mayor S-W menor)
6 -4 36 0.6233 12 7.4796
1 -2 16 0.3031 8 2.4248
-4 0 4 0.1401 5 0.7005
8 1 1 0.0000
-2 5 9
5 6 16
0 8 36
2 118.00 10.6049

W = b^2/S^2 Wo = 0.9531
SOLUCIÓN
• Comparar el valor observado y el valor esperado aplicando la regla de decisión
Si Wo≤Wt,α∴Rechazamos Ho
0.9530 > 0.803
Dado que Wo > Wt ,α 0.05; podemos aceptar Ho
• Decisión estadística:
Dado que aceptamos Ho podemos decir que la distribución de la muestra es
normal.
• Conclusión:
Existe suficiente evidencia estadística para decir que los datos de la muestra
redistribuyen de manera normal, por lo tanto, se puede asumir que se cumple el
supuesto de normalidad y se puede proceder a analizar los datos con estadística
paramétrica.
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
VAR00001 ,179 7 ,200* ,953 7 ,761
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors

Sig = P-value = Valor P 0.761 > 0.05 (5%) nivel de significancia


Acepto Ho: los datos siguen distribución normal
Kolmogorov-Smirnov
• Este procedimiento es un test no paramétrico que permite establecer
si dos muestras se ajustan al mismo modelo probabilístico.
• Es un test válido para distribuciones continuas y sirve tanto para
muestras grandes como para muestras pequeñas. como parte de la
aplicación de este test, es necesario determinar la frecuencia
observada acumulada y la frecuencia teórica acumulada; una vez
determinadas ambas frecuencias, se obtiene el máximo de las
diferencias entre ambas.
• Se trata, por tanto, de comprobar si la muestra se ajusta o proviene
de una población con una determinada distribución de probabilidad.
Como se planteó en el esquema el test de K-S es más adecuado
cuando la muestra viene planteada en escala ordinal.
Determinar si los datos siguen una
distribución normal
• Ejercicio 1.
g de nutriente X
794
775
658
646
656
615
500
517
901
771
847
633
857
919
700
527
811
977
Determinar si los datos siguen una
distribución normal
• Ejercicio 2.
g de ganancia en peso Y
178
194
53
136
64
167
88
95
54
145
225
178
205
225
83
147
200
225

También podría gustarte