Está en la página 1de 2

Histogramas y normalidad de los datos

La mayora de los datos que representan nuestros procesos se ajustan a una distribucin
normal. Cuando hacemos el histograma de nuestros datos, nos esperamos ver que esta
distribucin tiene una curva suave conocida como la campana de Gauss. Pero a veces los
histogramas (o diagramas de frecuencia) presentan unas formas peculiares.
En el grfico siguiente podis apreciar 4 histogramas generados con 20 datos procedentes de
una distribucin normal estndar (media = 0, desviacin estndar = 1)

Histograma de una distribucin normal estndar con 20 datos
A pesar de ser normales, estos histogramas podran llevarnos a falsas conclusiones sobre la
normalidad de los datos.
De hecho, con solo 20 datos, un diagrama de puntos podra ser ms adecuado para ver la
dispersin de los datos (con toda su granularidad).

Diagrama de puntos - 20 datos
En cambio si aumentamos el n de datos, la forma del histograma se aproxima a
la campana de Gauss. A continuacin, se muestran 4 histogramas realizados con unos
datos procedentes de un distribucin normal estndar pero variando la cantidad de datos.

Histogramas de una distribucin normal
Los histogramas son una buena representacin grfica para ver la dispersin de los datos
pero es preferible un diagrama de puntoscuando la cantidad de datos no sobrepasa los 20.
Aprovecho este post para recordar que la nica manera de saber si unos datos se ajustan a
una distribucin normal es hacer un test de normalidad. El diagrama de probabilidad de
Minitab nos proporciona la representacin de los datos con una recta de Henry y nos da el p-
valor. De esta forma, con un p-valor > 0.05, podemos afirmar con un95% de
confianza que nuestros datos se ajustan a una distribucin normal.

También podría gustarte