Está en la página 1de 7

La prueba de Shapiro & Wilk para verificar la

normalidad de un conjunto de datos proveniente


de muestras pequeas

1. Presentacin
En 1973 De Moivre, fue el primer matemtico que estableci la funcin de probabilidad que hoy
conocemos como distribucin normal.
De acuerdo a Gullon A. (1971), en general cualquier distribucin normal posee las siguientes
caractersticas:
a. El nmero de clases de la distribucin es n+1. Por tanto, infinito
b. Los intervalos de clase pueden ser tan pequeos como se desee. Por eso, su representacin
grfica viene dada por una curva, denominada curva normal.
c. La curva normal se aproxima asintticamente al eje de las abscisas
d. El intervalo total es ilimitado
e. La media y la mediana poseen el mismo valor y corresponden al mximo de la funcin o moda
f. Es simtrica respecto a la ordenada levantada por el punto de las abscisas correspondiente a la
media
g. Cada mitad de la curva tiene un punto de inflexin
h. La desviacin estndar corresponde al segmento limitado por el valor de la media y el punto de las
abscisas situado en la vertical de cualquiera de os puntos de inflexin de la curva
i. El coeficiente del tercer momento respecto de la media. Es decir, la asimetra es igual a cero
j. El coeficiente del cuarto momento respecto de la media. El valor de la kurtosis es igual a 3.
Se dice que una poblacin es normal respecto a una variable si la
distribucin de frecuencias respecto a esa variable en una muestra
aleatoria suficientemente grande, es superponible a la distribucin
que los matemticos y estadsticos llaman distribucin normal.
Grficamente la distribucin luce como la presentada en la figura 1.

Existen muchas comprobaciones que muestran que en el mundo biolgico, sociolgico, econmico, etc
se encuentran poblaciones que al extraer muestras para una variable especfica, la distribucin de
frecuencias es casi superponible a una curva normal. El parecido es tanto mayor cuanto mayor es el
tamao de la muestra.
Esto ha hecho que se diseen una enorme cantidad de pruebas y mtodos estadsticos basndose en el
comportamiento normal de las variables. Esta corriente de la estadstica ha recibido el nombre de
Estadstica Paramtrica.
Es frecuente encontrar en los textos de estadstica innumerables pruebas que requieren que las variables
a analizar sigan una distribucin normal. Esto es porque las mismas fueron creadas bajo este supuesto.
Por ejemplo la realizacin de un anlisis de varianza de dos vas requiere que los errores asociados a la
variable analizada sigan una distribucin normal para que la prueba de F sea correctamente aplicada.
Este aspecto es poco observado en muchos trabajos de investigacin y ha
dado lugar a anlisis errneos o bien a interpretaciones inadecuadas de los
resultados obtenidos.
Esta situacin nos ha motivado a escribir sobre el procedimiento a seguir para calcular una de las
pruebas estadsticas ms frecuentemente usadas para determinar si una variable cualquiera sigue una
distribucin normal.

2. Pruebas para verificar la normalidad


Existe una extensa lista de pruebas estadsticas diseadas para verificar la distribucin normal de un
conjunto de datos. Entre las ms populares podemos mencionar: Shapiro & Wilk, Anderson-Darling,
Darling-Pearson, Kolmogorov-Smirnov y X2 de bondad de ajuste.
Hemos decidido mostrar el procedimiento para la prueba de Shapiro & Wilk por su simplicidad y porque
tenemos disponibles varias aplicaciones electrnicas que nos permiten obtener rpidamente el
estadstico de prueba. Debemos aclarar que esta prueba se recomienda cuando el nmero de
observaciones es inferior a 2000. Para una mayor cantidad de datos resulta ms adecuada la prueba de
Kolmogorov-Smirnov.
Tambin necesitamos mencionar nuevamente que las variables sobre las que se requiere verificar su
distribucin normal deben estar medidas en al menos escala de intervalo.

3. La prueba de Shapiro & Wilk


La prueba W de Shapiro & Wilk data de 1965 y contempla de acuerdo a Fidelis G., C (2004) los
siguientes pasos :

a. Ordenar en forma ascendente las j observaciones para la variable que se estudia


b. Calcular

a partir de los datos del inciso a.

c. Si j es par, j = 2k , calcular:

Si j es impar, j = 2k + 1, entonces se omite la mediana de los datos xk+1 , y se


calcula el valor de b de acuerdo a la frmula (1).
d. Calcular el valor de W1, el estadstico de prueba
e. Comparar Wcal con el valor
presentan en la tabla 3). Si

de Wtab (los valores de Wtab se

Wcal es menor que Wtab se


rechaza la hiptesis de
normalidad de los datos. Si se
compara con un valor p terico digamos de 0.05, se dice que se rechaza la hiptesis de
normalidad de los datos si p-value calculado es menor que el valor terico.

4. Ejemplo de uso de la prueba de Shapiro & Wilk


Para explicar el desarrollo de la prueba de Shapiro & Wilk usaremos datos ficticios asociados al peso
expresado en libras de estudiantes universitarios, mostrados en la tabla 1. Se usan pocos datos para
facilitar la explicacin y clculo del estadstico de prueba.
Tabla 1: Peso en libras de 10 estudiantes universitarios
98

150

108

158

162

112

118

167

170

120

El procedimiento para calcular el estadstico de prueba W de la prueba de Shapiro & Wilks es el


siguiente:
a. Se ordenan los datos de manera ascendente: 98, 108, 112, 118, 120, 150, 158, 162, 167, 170
b. Se calculan las diferencias:

,es decir:

(98-136.3)2 +(108-136.3)2 +.... (170 - 136.3)=6856.1


c. Como es par,

,calcular

Se
tienen 5
valores tabulares para j = 10 y k=5. Los valores correspondientes se
muestran en la tabla 2. Para obtener valores de an+1 para otros casos
consultar la tabla 4 del anexo.

d. Se calcula el estadstico W

e.Se define la regla de decisin:


Como Wcal = 0.877 es mayor que Wtab = 0.842 se acepta la hiptesis de normalidad.
El valor 0.842 se ha encerrado con un crculo en la tabla 3 del anexo. Como se ha indicado en tanto ms
cercano a uno sea el valor del estadstico W mejor ajuste existe a la distribucin normal.

5. Referencias
Gonalves C., F. 2002. Estatstica. Universidade Estadual de Londrina. Brasil 304p. ISBN 85-7216-328-X.
Gullon, A. (1971) Introduccin a la Estadstica Aplicada. Departamento de Gentica, Facultad de
Ciencias. Universidad de Navarra. Alhambra. pp. 66-74.
Gutierrez, P. 2006. Normal. 1.0.2 beta, Freeware. [Programa de computadora] Laboratrio de
Ecotoxicologa. Universidad Caece. Buenos Aires Argentina. http://www.caece.edu.ar

6. Anexo