Está en la página 1de 15

Distribucin Normal

Historia
La distribucin normal fue presentada por primera vez por Abraham de Moivre en un artculo del ao 1733, que fue reimpreso en la segunda edicin de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximacin de la distribucin binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teora analtica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace. Laplace us la distribucin normal en el anlisis de errores de experimentos. El importante mtodo de mnimos cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el mtodo desde 1794, lo justific rigurosamente

en 1809 asumiendo una distribucin normal de los errores. El nombre de Gauss se ha asociado a esta distribucin porque la us con profusin cuando analizaba datos astronmicos y algunos autores le atribuyen un descubrimiento independiente del de De Moivre. Esta atribucin del nombre de la distribucin a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler. El nombre de "campana" viene de Esprit Jouffret que us el trmino "bell surface" (superficie campana) por primera vez en 1872 para una distribucin normal bivariante de componentes independientes. El nombre de "distribucin normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.[cita requerida] A pesar de esta terminologa, otras distribuciones de probabilidad podran ser ms apropiadas en determinados contextos; vase la discusin sobre ocurrencia, ms abajo Esta distribucin es frecuentemente utilizada en las aplicaciones estadsticas. Su propio nombre indica su extendida utilizacin, justificada por la frecuencia o normalidad con la que ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin. Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica tiene forma de campana.

En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus polgonos de frecuencias se

aproximan

una

curva

en

"forma

de

campana".

En resumen, la importancia de la distribucin normal se debe principalmente a que hay muchas variables asociadas a fenmenos naturales que siguen el modelo de la normal. Caracteres morfolgicos de individuos (personas, animales, plantas,) de una especie, p. ejm. Tallas, pesos, envergaduras, dimetros, permetros

Caracteres fisiolgicos, por ejemplo; efecto de una misma dosis de un frmaco, o de una misma cantidad de abono.

Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.

Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de adaptacin a un medio

Errores cometidos al medir ciertas magnitudes. Valores estadsticos maestrales, por ejemplo: la media. Otras distribuciones como la binomial o la de Poisson son aproximaciones normales Y en general cualquier caracterstica que se obtenga como suma de muchos factores.

Funcin De Densidad Empleando clculos bastante laboriosos, puede demostrarse que el modelo de la funcin de densidad que corresponde a tales distribuciones viene dando por la frmula

Funcin De Una Distribucin


Puede tomar cualquier valor (- ,+ ) Son ms probables los valores cercanos a uno central que llamados media Conforme nos separamos de ese valor , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simtrica).

Conforma nos separamos de ese valor , la probabilidad va decreciendo de forma ms o menos rpida dependiendo de un parmetro s , que es la desviacin tpica.

(x; media; desv_estndar; acum). X es el valor bajo el cual se encontrar el rea (probabilidad) deseada, Media es la media aritmtica de la distribucin, Desviacin estndar es la desviacin estndar de la distribucin y Acum es un valor lgico que determina la forma de la funcin. Si el argumento acum es VERDADERO, la funcin DISTR.NORM devuelve la funcin de distribucin acumulada. Si el argumento media = 0 y desv_estndar = 1, la funcin DISTR.NORM devuelve la distribucin normal estndar, DISTR.NORM.ESTAND. Es el modelo continuo ms utilizado en inferencia estadstica, dado que muchos fenmenos socio demogrfico y de otra ndole tienen un comportamiento acampanado y por ende cumplen la teora de la distribucin normal, sin embargo, es importante aclarar que antes de proceder a aplicar los mtodos sugeridos por la teora estadstica, es imprescindible identificar primero si en realidad los datos si se comportan como tal, es decir, se debe saber a ciencia cierta si los datos son aproximadamente acampanados, para ello se disponen de procedimientos descriptivos ya descritos, como son: el histograma, comparar las medidas de posicin relevantes (media, mediana y moda), calcular los coeficientes de asimetria y curtosis. Adems, de otras pruebas ms avanzadas como la de Smirnov Kolmogorov y la de Chapiro Wills. Si X se distribuye normal con parmetros m y s 2 , entonces se denota as,

X ~ N ( m , s 2) CARACTERISTICAS: Es simtrica, adems, de ser asinttica con respecto al eje X, es decir, no toca el eje. En ese caso las medidas de posicin son aproximadamente iguales. Es unimodal Si tomamos intervalos centrados en ?, se cumple: m ? se tiene aproximadamente el 68% de las observaciones. m 2? se tiene aproximadamente el 95% de las observaciones. m 3? se tiene aproximadamente el 99.73% de las observaciones. Para calcular cualquier otro porcentaje, se utilizan las tablas de la distribucin normal y/o las funciones del programa Excel. TEOREMA DE TIPIFICACION O ESTANDARIZACION. Si X ~ N ( m , s 2 ), entonces la variable aleatoria ~ N (0, 1) Esto se hace con el fin de uniformar las tablas y poder calcular todas las probabilidades requeridas, ya que si no se hace ste cambio de escala, se tendra que calcular la formula de la distribucin de densidad que implica calcular integrales y por tanto, se volvera inmanejable para un gran nmero de investigadores que no tienen formacin para ello. En la actualidad, se tiene la ayuda de software para su calculo. En el Excel [1] la funcin devuelve la probabilidad de una variable aleatoria continua siguiendo una distribucin acumulativa normal para la media y desviacin estndar especificadas. Esta funcin tiene un gran nmero de aplicaciones en estadstica, incluyendo las pruebas de hiptesis.

Ejemplo 1: El tiempo para realizar una intervencin quirrgica tiene un comportamiento aproximadamente normal, con media = 140 minutos y desviacin de 50 minutos. Calcule la probabilidad de que una intervencin quirrgica se demore: a) A lo sumo 100 minutos, b) Mnimo 200 minutos, c) Entre 110 y 190 y d) Mayor que 40 y menor de 240 y e) Cul es el tiempo requerido para que el 50% de las intervenciones terminen. Solucin manual: Sea X = tiempo que se demora una intervencin quirrgica X ~ N ( m , s 2 ); X ~ N (140, (50)2) Si no se realiza el cambio de variable a se tendra que calcular la integral, situacin poco prctica en la actualidad. Tipifiquemos: Z = ~ N (0, 1) a) P(x 100) = P = P ( Aparte de la parte operativa, es importante interpretar el nmero hallado. Es relativamente probable que la ciruga se demore menos de 100 minutos. = P = 0.2119 Valor de la tabla normal. b) P ( x 200) = 1 ? P (x < 200) Es poco probable que la una intervencin se demore ms de 200 minutos, ya que la probabilidad es de 0.1151, aproximndose al cero. =1?P=1-P = 1 ? P = 1 ? 0.8849 = 0.1151 Existe una probabilidad ligeramente mayor a la mitad de que la intervencin dure entre 110

y 190 minutos. c) P (110 < x < 190) = = P (Z < 1) ? P (Z -0.6) = 0.8413 ? 0.2743 = 0.567 d) P (40 < x < 240) = = P (-2 < Z < 2) = P (Z < 2) ? P (Z -2) = 0.9772 ? 0.0228 = 0.9544 Como se ve apenas lgico, es muy seguro que la intervencin dure entre 40 y 200 minutos, dado que el intervalo de tiempo es muy amplio. e) Para el caso en que se tiene la probabilidad y el inters es determinar el valor de x, el proceso es inverso, es decir, se busca el valor de Z y se despeja el de x. Para el caso se tiene: En ste caso, se busca la probabilidad (0.50) dentro de la tabla normal, encontrando el valor de 0.00. P(x x0) = 0.50 P (Z<(x0- m )/ s )= P (Z<(x0-140)/50)= 0.50 (x0-140)/50)= 0.00 probabilidad de la tabla normal. Al despejar x0 se tiene: Se requieren de 140 minutos para terminar el 50% de las intervenciones quirrgicas, con un poco ms de experiencia, dicho valor se deduce al observar que el 50% de las observaciones se encuentran por debajo de la media, de ah, la importancia de la figura para intuir, no slo el lugar del rea a encontrar, sino, la probabilidad. x0 = m + p(Z) * s x0 = 140 + 0.00 * 50 = 140.

Distribucin Normal La distribucin normal o gaussiana es la distribucin de probabilidad ms importante de la estadstica y corresponde a una variable aleatoria continua. Propiedades de la distribucin Normal Hay cuatro propiedades importantes que estn asociados con la distribucin normal: 1. Tiene forma de campana, por lo tanto es simtrica. 2. Todas sus medidas de tendencia central son idnticas. 3. La variable aleatoria asociada tiene un intervalo infinito 4. Es unimodal 5. El rea bajo la curva normal (rea que est entre la curva y la lnea base) y que contiene el 100%, o todos los casos en una distribucin normal dada.

Distribucin Normal estandarizada (Puntajes Z) Cualquiera variable aleatoria normal X se puede convertir en una variable aleatoria normal X X estndar Z mediante una frmula de transformacin. Z i s

En tanto que los datos originales de la variable aleatoria X tienen media estndar

y desviacin

, la variable aleatoria estandarizada Z siempre tiene media de cero y desviacin

estndar de uno. Ejemplo: El coeficiente intelectual de un grupo de estudiantes se distribuye en forma normal con un promedio de 100 y una desviacin estndar de 5. Qu porcentaje de los estudiantes tienen un coeficiente intelectual mayor de 110? 110 100 z 2.0 5

Dos desviaciones estndar corresponden a 47.72% por arriba de la media, lo que quiere decir que 50%-47.72%=2.28% de los estudiantes tienen un coeficiente intelectual mayor de 110.

Distribucin muestral En estadstica, la distribucin muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una poblacin. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parmetro de la poblacin. Mediante la distribucin muestral se puede estimar el error para un tamao de muestra dado.

Problemas resueltos de Distribucin Muestral

Pregunta 1 En el ltimo ao, el peso de los recin nacidos tiene una media de 3000 gr. Y desviacin estndar de 140 gr. Cul ser la probabilidad de que la media de una muestra de 100 recin nacidos sea superior a 3030 gr. ?

P( X > 3030) = P( (X - ) / /n < (3030-3000) /140/100) = P( Z < 2.14) = 0.9838

Pregunta 2

Una empresa elctrica fabrica focos que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas. Solucin:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062.

Pregunta 2

Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con una media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine: a. El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros. b. El nmero de medias muestrales que caen por debajo de 172 centmetros. Solucin: Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el denominador de Z para slo sustituirlo en cada inciso.

A)

(0.7607)(200)=152 medias muestrales

B)

b.

(0.0336)(200)= 7 medias muestrales

Pregunta 3 Se supone que la estatura de los chicos de 18 aos de cierta poblacin sigue una distribucin normal de media 162 cm y desviacin estndar de 12 cm. Se toma una muestra al azar de 100 de estos chicos encuestados y se calcula la media. Cul es la probabilidad de que esta media est entre 159 y 165 cm? =162 cm. =20 cm.

P( 159 < X <165) = P( (159-162) / 12/100< (X - ) / /n < (165-162) /12/100) = P( -2.5 < Z < 2.5) = P( Z < 2.5) - P( Z < - 2.5) = P( Z < 2.5) (1 - P( Z < 2.5)) = 2*P( Z < 2.5) -1 =2*(0.9938)) 1 = 0.9876

Pregunta 4 En una casa de retiro la edad de las personas tiene una media de 76 aos y una desviacin estndar de 10 aos. A) De qu tamao debe ser la muestra aleatoria de las personas, para tener una probabilidad del 9.94% de que la edad media sea inferior a 74 aos?

=76 aos =10 aos

P( X <74) = P( (X - ) / /n < (74-76)/10/n) =0.0994 = P( Z < Z0) = 0.0994 ENTONCES Z0 = - 1.32

(74-76)*/10/n = -1.32 OPERANDO -2*n/10 = -1.32 ENTONCES n = 6.6 POR LO TANTO n=43.6 APROXIMADAMENTE SE NECESITA 44 PERSONAS B) Si esta muestra se tom de un total de 500 personas. Determinar por debajo de qu valor se encuentra el 80% de las medias muestrales probabilidad del 9.94% de que la edad media sea inferior a 74 aos?

P( X <X0) = P( (X - ) / /n < (X0 76) /10/500) =0.80 = P( Z < Z0) = 0.80 ENTONCES Z0 = 0.85

(X0-76)*/10/500 = 0.85 OPERANDO X0= 76.38 ENTONCES SE ENCUENTRA POR DEBAJO DEL VALOR DE 76.38 Pregunta 5

Se sabe que los sueldos de los trabajadores de una empresa estn distribuidos normalmente con una media de $800. Se toma una muestra aleatoria de 25 trabajadores y se encuentra que hay una probabilidad del 5% de que la media muestral exceda los $866.

a)

Hallar la desviacin estndar de los sueldos

= $800 = ???

P( X > 866) = P( (X - ) / /n < (866 800) / /25) =0.05 = P( Z > 330/ ) = 0.05 ENTONCES 1- P( Z < 330/ )=0.05 P( Z < 330/ )=0.95 330/ =1.65 entonces =$200

B) Hallar la probabilidad de que un sueldo elegido aleatoriamente exceda los $770

P( X > 770) = P( (X - ) / > (770 800) /200) = P( Z > - 0.15) ENTONCES 1- P( Z < - 0.15) = 1-(1-P( Z < 0.15))= P( Z < 0.15)= 0.5596.

También podría gustarte