Está en la página 1de 10

Distribucin Normal En estadstica y probabilidad Gauss o distribucin se llama distribucin a una de normal, distribucin las distribuciones de de

gaussiana,

probabilidad de variable continua que con ms frecuencia aparece aproximada en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro estadstico. Esta curva se conoce como campana de Gauss y es el grfico de una funcin gaussiana. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son:

caracteres morfolgicos de individuos como la estatura; caracteres fisiolgicos como el efecto de un frmaco; caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos;

caracteres psicolgicos como el cociente intelectual;

nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc.

La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es

aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal. Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos test estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad continuas y discretas.

Historia La distribucin normal fue presentada por primera vez por Abraham de Moivre en un artculo del ao 1733,2 que fue reimpreso en la segunda edicin de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximacin de la distribucin binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teora analtica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace. Laplace us la distribucin normal en el anlisis de errores de experimentos. El importante mtodo de mnimos cuadrados fue introducido por Legendreen

1805. Gauss, que afirmaba haber usado el mtodo desde 1794, lo justific rigurosamente en 1809 asumiendo una distribucin normal de los errores. El nombre de Gauss se ha asociado a esta distribucin porque la us con profusin cuando analizaba datos astronmicos3 y algunos autores le atribuyen un descubrimiento independiente del de De Moivre.4 Esta atribucin del nombre de la

distribucin a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler. El nombre de "campana" viene de Esprit Jouffret que us el trmino "bell surface" (superficie campana) por primera vez en 1872 para una distribucin normal bivariante de componentes independientes. El nombre de "distribucin normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.[cita requerida] A pesar de esta terminologa, otras distribuciones de probabilidad podran ser ms apropiadas en determinados contextos; vase la discusin sobre ocurrencia, ms abajo.

Propiedades Algunas propiedades de la distribucin normal son: 1. Es simtrica respecto de su media, ; 2. La moda y la mediana son ambas iguales a la media, ; 3. Los puntos de inflexin de la curva se dan para x = y x = + . 4. Distribucin de probabilidad en un entorno de la media: 1. en el intervalo [ - , + ] se encuentra comprendida,

aproximadamente, el 68,26% de la distribucin; 2. en el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de la distribucin; 3. por su parte, en el intervalo [ -3, + 3] se encuentra comprendida, aproximadamente, el 99,74% de la distribucin. Estas propiedades son de gran utilidad para el establecimiento

de intervalos de confianza. Por otra parte, el hecho de que prcticamente la totalidad de la distribucin se encuentre a tres desviaciones tpicas de la media justifica los lmites de las tablas empleadas habitualmente en la normal estndar. 5. Si X ~ N (, 2) y a y b son nmeros reales, entonces (aX + b) ~ N(a+b, a22).

6. Si X ~ N(x, x2) e Y ~ N(y, y2) son variables aleatorias normales independientes, entonces:

Su suma est normalmente distribuida con U = X + Y ~ N (x + y, x2 + y2) (demostracin). Recprocamente, si dos variables aleatorias independientes tienen una suma normalmente distribuida, deben ser normales (Teorema de Crmer).

Su diferencia est normalmente distribuida con .

Si las varianzas de X e Y son iguales, entonces U y V son independientes entre s.

La divergencia de Kullback Leibler,

Si

son

variables

aleatorias

independientes normalmente distribuidas, entonces:

Su producto

sigue una distribucin con densidad

dada por

donde modificada de segundo tipo.

es una funcin de Bessel

Su

cociente

sigue

una distribucin

de

Cauchy con

. De este modo la distribucin de Cauchy es un tipo especial de distribucin cociente. Si entonces libertad. Si entonces la media son variables normales estndar independientes, muestral y la varianza son variables normales estndar independientes, sigue una distribucin con n grados de

muestral

son

independientes. Esta propiedad caracteriza a las distribuciones normales y contribuye a explicar por qu el test-Fno es robusto respecto a la nonormalidad).

Estandarizacin de variables aleatorias normales Como consecuencia de la Propiedad 1; es posible relacionar todas las variables aleatorias normales con la distribucin normal estndar. Si ~ , entonces

es una variable aleatoria normal estndar:

La transformacin de una distribucin X ~ N(, ) en una N(0, 1) se llama normalizacin, estandarizacin o tipificacin de la variable X. Una consecuencia importante de esto es que la funcin de distribucin de una distribucin normal es, por consiguiente,

A la inversa, si entonces

es una distribucin normal estndar,

es una variable aleatoria normal tipificada de media

y varianza

La distribucin normal estndar est tabulada (habitualmente en la forma del valor de la funcin de distribucin ) y las otras distribuciones normales pueden obtenerse como transformaciones simples, como se describe ms arriba, de la distribucin estndar. De este modo se pueden usar los valores tabulados de la funcin de distribucin normal estndar para encontrar valores de la funcin de distribucin de cualquier otra distribucin normal.

Momentos Los primeros momentos de la distribucin normal son:


Nmero Momento Momento central Cumulante

Todos los cumulantes de la distribucin normal, ms all del segundo, son cero.

Los momentos centrales de orden superior (2k con = 0) vienen dados por la frmula

Desviacin tpica e intervalos de confianza Alrededor del 68% de los valores de una distribucin normal estn a una distancia < 1 (desviacin tpica) de la media, ; alrededor del 95% de los valores estn a dos desviaciones tpicas de la media y alrededor del 99,7% estn a tres desviaciones tpicas de la media. Esto se conoce como la "regla 68-95-99,7" o la "regla emprica". Para ser ms precisos, el rea bajo la curva campana entre n y + n en trminos de la funcin de distribucin normal viene dada por

donde erf es la funcin error. Con 12 decimales, los valores para los puntos 1-, 2-, hasta 6- son:

0,682689492137

0,954499736104

0,997300203937

0,999936657516

0,999999426697

0,999999998027

La

siguiente

tabla

proporciona

la

relacin

inversa

de

mltiples

correspondientes a unos pocos valores usados con frecuencia para el rea bajo la campana de Gauss. Estos valores son tiles para determinar intervalos de confianza para los niveles especificados basados en una curva

normalmente distribuida (o estimadores asintticamente normales):

0,80

1,28155

0,90

1,64485

0,95

1,95996

0,98

2,32635

0,99

2,57583

0,995

2,80703

0,998

3,09023

0,999

3,29052

0,9999

3,8906

0,99999

4,4172

donde el valor a la izquierda de la tabla es la proporcin de valores que caern en el intervalo dado y n es un mltiplo de la desviacin tpica que determina la anchura de el intervalo. Forma familia exponencial La distribucin normal tiene forma de familia exponencial biparamtrica con dos parmetros naturales, y 1/2, y estadsticos naturales X y X2. La forma cannica tiene como parmetros y y estadsticos suficientes y

Distribucin En estadstica, la distribucin (de Pearson), llamada Chi cuadrado o Ji cuadrado, es una distribucin de probabilidad continua con un parmetro representa los grados de libertad de la variable aleatoria que

donde

son

variables

aleatorias normales independientes de media cero tenga esta distribucin se

y varianza uno. El que la variable aleatoria representa habitualmente as: .

Es conveniente tener en cuenta que la letra griega al latn como chi1 y se pronuncia en castellano como ji.

se transcribe

Propiedades

Funcin de densidad Su funcin de densidad es:

donde

es la funcin gamma.

Funcin de distribucin acumulada Su funcin de distribucin es

donde

es la funcin gamma incompleta.

El valor esperado y la varianza de una variable aleatoria X con distribucin son, respectivamente, k y 2k Aplicaciones La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms conocida es la de la denominada prueba utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimacin de varianzas. Pero tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la distribucin t de Student. Aparece tambin en todos los problemas de anlisis de varianza por su relacin con la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin .