Está en la página 1de 4

¿Debe utilizarse el rango intercuartílico dividido por la desviación

estándar para evaluar la normalidad?


Desaconsejamos el uso de un diagnóstico de normalidad: el rango
intercuartílico dividido por la desviación estándar. Esta estadística ha sido
sugerida en varios libros de introducción a la estadística como un método para
evaluar la normalidad. A través de la simulación, exploramos la velocidad a la
que esta estadística converge a su distribución asintótica normal y el tamaño
real de las pruebas en función de la distribución asintótica en varios tamaños
de muestra. Mostramos que hay distribuciones no normales a partir de las
cuales este método no puede detectar una diferencia. Además, mostramos que
el poder de esta prueba para la normalidad es bastante pobre en comparación
con la prueba de Shapiro-Wilk.
1. INTRODUCCIÓN
En un texto de introducción a la estadística (McClave, Benson y Sinich 2011,
pág. 219), los autores sugieren un método para evaluar la normalidad. Este
método es el rango intercuartílico de la muestra (IQR) dividido por la desviación
estándar de la muestra, que denotamos como S. Indicaron si los datos son
aproximados.

No estábamos familiarizados con esta evaluación de la normalidad hasta la


enseñanza del texto citado anteriormente. Desde entonces hemos descubierto
que este método también fue presentado por Mendenhall y Sincich (2006),
Kokoska (2008) y otros. El problema fundamental con esta regla general es qué
tan cerca de 1.34 es aceptable para concluir la normalidad. La única forma real
de determinar qué está cerca es encontrar la distribución de la estadística.
En este artículo, demostramos que esta estadística no debe usarse como una
medida para determinar la "normalidad" de los datos. Específicamente,
abordamos qué tan rápido converge la estadística a su distribución asintótica y
otras distribuciones no normales que tienen un (F_1(0.75) — F-1(0.25))/cr
similar (donde F_1 es la función cuantil). También discutimos el poder de la
prueba donde está la hipótesis nula: los datos se distribuyen normalmente.
Cuando se compara con la prueba de normalidad de Shapiro-Wilk (Shapiro y
Wilk 1965), concluimos que el IQR/S no es una estadística que deba emplearse
como prueba formal o regla general informal.
2. COMPARACIONES DE CONVERGENCIA Y POTENCIA
En esta sección, observamos la distribución asintótica del estadístico IQR/S
dada una muestra de una distribución normal. A continuación, consideramos
qué tan rápido converge esta estadística a su distribución asintótica.
Señalamos que no existe un estándar para calcular el IQR de un conjunto de
datos. Hyndman y Fan (1996) identificaron nueve métodos para estimar
cuantiles. Usamos "Tipo 5" como se define en R (R Development Core Team
2011) y se denomina "Definición 5" en Hyndman y Fan (1996).

Para esta distribución asintótica, examinamos cuántas muestras se necesitan


para suponer que la distribución asintótica es un ajuste razonable. Usando la
simulación Monte Carlo en R, tomamos un millón de muestras de tamaño n y
estimamos los cuantiles de la distribución verdadera cuando el tamaño de la
muestra es igual a n. Los resultados se muestran en la Tabla 1. Las columnas
de la tabla contienen los cuantiles 0.025 y 0.975 con diferentes tamaños de
muestra. La columna "Est actual" contiene las estimaciones de Monte Carlo de
los cuantiles apropiados. Todas estas estimaciones de Monte Carlo tienen
intervalos de confianza del 95 % con anchos medios inferiores a 0,0015. La
columna "Asintótica" muestra los cuantiles 0.025 y 0.975 para la distribución
asintótica sugerida en la Ecuación (2). Claramente, a medida que n crece, los
límites de los resultados asintóticos convergen con los valores reales. Para un
tamaño de muestra de n = 10, existe una brecha bastante grande entre el límite
superior "Est real" y "Asintótico". Esta brecha se estrecha a medida que n
aumenta.
El desarrollo de una prueba de hipótesis para el estadístico IQR/.S' podría
hacerse de dos maneras. En primer lugar, se puede definir una prueba de nivel
aproximado de 0,05 con la región de rechazo situada a la derecha del cuantil
de 0,025 y a la izquierda del cuantil de 0,975 de la distribución asintótica en la
Tabla 1. La última columna de la Tabla 1, "Cobertura", muestra el porcentaje de
muestras de la distribución normal asintótica de IQR/S que no se rechazan. Se
podría desarrollar una prueba de nivel exacto de 0,05 para un tamaño de
muestra particular utilizando la simulación de Monte Carlo como con las
columnas "Est actual" en la Tabla.

La Figura 1 y la Tabla 1 muestran que usar la distribución asintótica para un


tamaño de muestra pequeño no sería apropiado. Más adelante mostramos que
independientemente de la prueba (exacta o aproximada), el estadístico IQR/.S'
no produce pruebas potentes. A continuación consideramos otras
distribuciones que tienen (F-1(0.75) — F-1(0.25))/er s 1.35, similar a la
distribución normal. El estadístico IQR/.S' no es capaz de distinguir de forma
fiable otras distribuciones que tengan este mismo ratio. En otras palabras, la
propiedad de (F-1(0.75) — F_1(.25))/ct r* 1.35 no es exclusiva de la distribución
normal. Por ejemplo, considere la distribución de Weibull (1.67, ß). Esta
distribución también tiene (F_1(0.75) —F_1(0.25))/o ~ 1.35. Por lo tanto, si
obtuviéramos una muestra de esta distribución, en promedio, esta estadística
no podría distinguirla de una normal, aunque esté sesgada a la derecha. Sin
embargo, si observa un gráfico Q-Q, puede haber una forma aparente de
distinguir la diferencia. La figura 2 muestra el gráfico Q-Q de una muestra de
tamaño n — 100 de una distribución de Weibull con IQR/.S' = 1,32. El gráfico
nos llevaría a concluir que estos datos tienen colas diferentes de una
distribución normal.
Para comparar el poder de esta prueba, observamos tres casos en los que la
distribución muestral no es normal. Nos preguntamos qué tan bien el
estadístico IQR/S rechaza la hipótesis nula de normalidad cuando los datos no
son normales. Usamos la prueba de Shapiro-Wilk (Shapiro y Wilk 1965) como
comparación, aunque hay muchas otras para elegir. Consideramos un caso en
el que la distribución de muestreo es sesgada, la distribución tiene colas
anchas y la distribución tiene (F~'(0.75) — F_1(0.25 (1) distribución para la
distribución asimétrica para el caso con colas pesadas una distribución con una
similar (F- La Tabla 2 muestra los resultados de y los casos de toros Wei con
tres di el poder de la prueba de Shapiro-Wilk en ambos casos, el IQR/5 t IQR/5
t IQR/5 el Shapiro-Wil es más poderoso que el IQR/5 La prueba /5 funciona
mejor cuando hay asimetría d. Sin embargo, estos resultados de normalidad no
son apropiados para un uso serio.

3. DISCUSIÓN
De la sección anterior, está claro que el IQR/S m para evaluar la normalidad
está severamente limitado en su presunción de aplicación, en la mayoría de los
casos, es mucho menos poderoso que las pruebas mulares de normalidad. El
poder de la prueba es bajo para que se pueda detectar cualquier no normalidad
en un gráfico histog Q-Q antes de que esta prueba sea lo suficientemente
sensible como para rechazar la hipótesis nula. Además, la estadística no puede
distinguir la diferencia entre la normal y otras distribuciones que tienen
proporciones similares (^"'(0.75) — F"'(0.25))/ct. Recomendamos que no se
defienda este método, especialmente en los libros de texto introductorios.

También podría gustarte