Está en la página 1de 4

CURVA NORMAL

La curva normal o distribucin normal como tambin se le conoce, fue reconocida por primera vez por el francs Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por y . Con esta notacin, la densidad de la normal viene dada por la ecuacin:

Ecuacin 1:

Que determina la curva en forma de campana que tan bien conocemos. As, se dice que una caracterstica como sigue una distribucin normal de media y varianza , y se denota , si su funcin de densidad viene dada por la Ecuacin 1.

Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es proporcional al nmero de datos en el rango de valores correspondiente si, tal y como se muestra en la, en el eje horizontal se levantan perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas lneas indica la probabilidad de que la variable de inters, X, tome un valor cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se extienden asintticamente hacia los ejes, cuando una variable siga una distribucin normal, ser mucho ms probable observar un dato cercano al valor medio que uno que se encuentre muy alejado de ste. Propiedades de la distribucin normal: La distribucin normal posee ciertas propiedades importantes que conviene destacar: i. ii. Tiene una nica moda, que coincide con su media y su mediana. La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor entre y es tericamente posible. El rea total bajo la curva es, por tanto, igual a 1. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es igual a una desviacin tpica ( ). Cuanto mayor sea , ms aplanada ser la curva de la densidad. El rea bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estndar de la media es igual a

iii.

iv.

v.

0.95. En concreto, existe un 95% de posibilidades de observar un valor vi. comprendido en el intervalo . La forma de la campana de Gauss depende de los parmetros y . La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin.

Como se deduce de este ltimo apartado, no existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de media 0 y varianza 1. As, la expresin que define su densidad se puede obtener de la Ecuacin 1, resultando:

Es importante conocer que, a partir de cualquier variable X que siga una distribucin , se puede obtener otra caracterstica Z con una distribucin normal estndar, sin ms que efectuar la transformacin: Ecuacin 2: Esta propiedad resulta especialmente interesante en la prctica, ya que para una distribucin existen tablas publicadas a partir de las que se puede obtener de modo sencillo la probabilidad de observar un dato menor o igual a un cierto valor z, y que permitirn resolver preguntas de probabilidad acerca del comportamiento de variables de las que se sabe o se asume que siguen una distribucin aproximadamente normal. Consideremos, por ejemplo, el siguiente problema: supongamos que se sabe que el peso de los sujetos de una determinada poblacin sigue una distribucin aproximadamente normal, con una media de 80 Kg y una desviacin estndar de 10 Kg. Podremos saber cul es la probabilidad de que una persona, elegida al azar, tenga un peso superior a 100 Kg? Denotando por X a la variable que representa el peso de los individuos en esa poblacin, sta sigue una distribucin . Si su distribucin fuese la de una normal estndar podramos utilizar la Tabla 1 para calcular la probabilidad que nos interesa. Como ste no es el caso, resultar entonces til transformar esta caracterstica segn la Ecuacin 2, y obtener la variable:

para poder utilizar dicha tabla. As, la probabilidad que se desea calcular ser:

Como el rea total bajo la curva es igual a 1, se puede deducir que:

Esta ltima probabilidad puede ser fcilmente obtenida a partir de la Tabla 1, resultando ser . Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente de esa poblacin tenga un peso mayor de 100 Kg, es de 10.9772=0.0228, es decir, aproximadamente de un 2.3%. De modo anlogo, podemos obtener la probabilidad de que el peso de un sujeto est entre 60 y 100 Kg:

tomando a=-2 y b=2, podemos deducir que:

Por el ejemplo previo, se sabe que . Para la segunda probabilidad, sin embargo, encontramos el problema de que las tablas estndar no proporcionan el valor de para valores negativos de la variable. Sin embargo, haciendo uso de la simetra de la distribucin normal, se tiene que:

Finalmente, la probabilidad buscada de que una persona elegida al azar tenga un peso entre 60 y 100 Kg., es de 0.9772-0.0228=0.9544, es decir, aproximadamente de un 95%. Resulta interesante comprobar que se obtendra la misma conclusin recurriendo a la propiedad de la distribucin normal. No obstante, es fcil observar que este tipo de situaciones no corresponde a lo que habitualmente nos encontramos en la prctica. Generalmente no se dispone de informacin acerca de la distribucin terica de la poblacin, sino que ms bien el problema se plantea a la inversa: a partir de una muestra extrada al azar de la poblacin que se desea estudiar, se

realizan una serie de mediciones y se desea extrapolar los resultados obtenidos a la poblacin de origen. En un ejemplo similar al anterior, supongamos que se dispone del peso de n=100 individuos de esa misma poblacin, obtenindose una media muestral de Kg, y una desviacin estndar muestral Kg, querramos extraer alguna conclusin acerca del valor medio real de ese peso en la poblacin original. La solucin a este tipo de cuestiones se basa en un resultado elemental de la teora estadstica, el llamado teorema central del lmite. Dicho axioma viene a decirnos que las medias de muestras aleatorias de cualquier variable siguen ellas mismas una distribucin normal con igual media que la de la poblacin y desviacin estndar la de la poblacin dividida por . En

nuestro caso, podremos entonces considerar la media muestral , con lo cual, a partir de la propiedad se conoce que aproximadamente un 95% de los posibles valores de caeran dentro del intervalo . Puesto que los valores de y son desconocidos, podramos pensar en aproximarlos por sus anlogos mustrales, resultando . Estaremos, por lo tanto, un 95% seguros de que el peso medio real en la poblacin de origen oscila entre 75.6 Kg y 80.3 Kg. Aunque la teora

estadstica subyacente es mucho ms compleja, en lneas generales ste es el modo de construir un intervalo de confianza para la media de una poblacin.