Está en la página 1de 5

BOLILLA 5: DISTRIBUCION NORMAL

Función de densidad para variables aleatorias continuas. Función de distribución acumulada.


Distribución Normal. Parámetros. Distribución Normal Estándar. Características de su
gráfica. Área bajo la curva Normal Estándar. Media y desvío estándar.

VARIABLE ALEATORIA CONTINUA. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

Una variable aleatoria es continua cuando al pasar de un valor a otro, toma todos los valores intermedios

Ejemplos de variables aleatorias continuas:


 Concentración de cierto nutriente en hojas.
 Contenidos de sales en agua de riego.
 Altura, diámetro, volumen, crecimiento de árboles de determinada especie.
 Longitud, peso, etc.

En el caso de variable aleatoria continua, la determinación de la probabilidad no es puntual como en el


caso de las variables aleatorias discretas, sino que ahora está definida en un intervalo y por lo tanto el cálculo de
probabilidad se debe efectuar dentro de ese intervalo.
Puesto que los valores posibles de X no son contables, no podemos hablar del i-ésimo valor de x y por lo
tanto p(xi) pierde significado. Lo que haremos es sustituir la función de probabilidad puntual p(x i) definida sólo
para x1, x2,... , por una función definida para todos los valores de x del intervalo.

Las condiciones p(xi ) y  p(xi ) = 1, se sustituyen por:

f x(x)  0 y =1

Asociaremos entonces, a esta variable aleatoria continua una función conocida como función de densidad
de probabilidad, fX(x).

Definición: La función de densidad de probabilidad (fdp) para una variable aleatoria continua X, es una
función f x(x) tal que:
1 fX(x)  0 para todo x perteneciente a R
2 =1
3 Para cualquier a y b, tal que - < a < b <  tenemos
b
P(a  x  b) =  a f(x) dx y P(X = xi)= 0 para todo xi  S.

Observaciones: Fundamentalmente queremos decir que si X es una variable aleatoria continua entonces X puede tomar
todos los valores de algún intervalo (c,d) donde c y d pueden ser -  y +  respectivamente.

P (a X  b) representa el área bajo la curva de la fdp f(x), entre a y b.

f(x)

x1=a x2=b x
Fig.5.1
La representación gráfica de la fdp, proporciona una representación visual de la distribución de probabilidad de
una variable aleatoria continua.
x2=a
La  x1=b f(x) dx representa el área bajo la curva representación gráfica de la función de densidad de probabilidad
f(x) entre x1 y x2.
Como la probabilidad puntual, en el caso continuo es: P(X =xi) = 0

 P (a  X  b) = P (a <X  b) = P (a X < b) = P (a< X < b)


FUNCIÓN DE DISTRIBUCIÓN ACUMULADA DE LA VARIABLE ALEATORIA

Se define la función Fx(x) como la probabilidad de que X sea menor o igual que algún xi en particular, o sea:
xᵢ
Fx(xi) = P ( X  xi ) = - f(x) dx ,

como Fx(x) es una probabilidad  0 Fx(x) 1 para todos los valores de X.

Existen diferentes modelos de probabilidad para las variables aleatorias continuas entre ellos:
 Distribución Normal
 “ Chi – cuadrado (2)
 “ “F”
 “ “t”

DISTRIBUCIÓN NORMAL

La distribución normal es una distribución para variable aleatoria continua, siendo ésta la que se adecua mejor
a una gran variedad de datos y por otra parte es la más desarrollada.

La misma se expresa matemáticamente por medio de la siguiente función:

f(x) 1 e-(x-)² / 2² ; - x  


 ( 2) 1/2

La distribución normal tiene como parámetros a  y , por lo tanto queda completamente definida si se conocen
dichos parámetros.
Gráficamente

-  +
Fig.5.2

Características de la distribución Normal

 Su gráfica es la de una curva simétrica (media = mediana = moda) respecto de la recta x =  ; teniendo la forma
acampanada.
 La amplitud de la curva representación gráfica de la función de distribución normal, varía entre - y +.
 El área encerrada por la curva y el eje ox es igual a 1.
 La curva normal tiene por asíntota al eje ox, o sea es asintótica al eje ox.
 El área sobre un intervalo (a,b), es igual a la probabilidad de que una observación se encuentre dentro de ese
intervalo, o sea, P(a<x<b).
 Cuanto mayor es la desviación de x respecto de , mayor será la diferencia (x-) por lo tanto menor será el valor de
la fdp, o sea menor es la densidad. Ello se debe al exponente negativo de e
 El valor máximo de fdp tiene abscisa igual al parámetro .
 Los puntos de inflexión de la curva tienen abscisa (-) y ( +).
 El área sobre el intervalo de extremos (-) y ( +) es aproximadamente igual al 68% del área total bajo la curva,
o sea P((-) < x < ( +))  0.68.

68%

- -  + +
Fig.5,3
Distribución normal estándar
La función de distribución de probabilidad Normal, es una función simétrica respecto a x = .

f(x) 1 e-(x- )² / 2² ; - x  


 ( 2) 2

f (x)

-  + x
Fig.5.4

Ahora bien, si hago el cambio de variable Z= (X -  )/

la nueva variable Z tiene distribución normal con media  = 0 y varianza 2=1,


f(z) 1 e- z² / 2 ; -  z  
(2) 1/2

f(z) toma el nombre de distribución normal estándar.


f (z)

- =0 + z
Fig. 5.5

El cambio de variable efectuado es una traslación de ejes de tal modo que el eje de simetría x =  se transforme
en x = 0.
Resumen: una variable X Normal con media  y varianza ² puede estandarizarse mediante la estandarización de la
variable X, o sea haciendo Z = (X -  )/ .
Dado un valor de la variable xi , el correspondiente valor de z i nos dice cuán alejado está xi de su media  y en
que dirección. Por ejemplo z = 1.5 significa que el correspondiente x está a 1.5 unidades a la derecha de .

La función de densidad de la distribución normal estándar Z es

f(z) 1 e-z² / 2 ; -  z  
(2) 1/2

La función de distribución acumulada es:


zᵢ
F(zi) = P [Zzi] == - f(z) dz

La notación usadas en el caso de la distribución normal con media  y varianza 2 es: X N (, 2)
Por lo tanto para la distribución normal estándar es: X N (0, 1)

Para determinar el área bajo la curva usaremos la Tabla de la Distribución Normal Estándar.
Sabemos que existe una distribución normal para cada par de valores  y 2, donde  es cualquier número y 2
es un número positivo, siendo ellos la media y la varianza de la distribución, respectivamente. Si fijamos  y hacemos
variar 2, obtenemos una flia de curvas con la misma media, pero diferentes varianzas.
Si por el contrario fijáramos 2 y hacemos variar , obtendremos también una flia de curvas, pero con la misma
forma pero diferente ubicación sobre eje ox.
Relación entre las Distribuciones Binomial y Normal

Si n es grande y ni p ni q están próximos a cero, la distribución binomial puede aproximarse estrechamente a


la distribución normal con variable estandarizada (o tipificada) z = (X-np)/(npq) 1/2. La aproximación es tanto mejor
conforme aumenta n, y en el límite es total. Esto último se ve claramente desde el momento que al aumentar n, el sesgo
y la curtosis de la distribución binomial se aproxima a los de la distribución normal.

Dist. Binomial Dist. Normal


Coef. de sesgo =(q - p) / (n p q)1/2 = 0
Coef. de curtosis = 3 + (1 – 6pq) / n p q = 3

En la práctica, la aproximación es muy buena si np y nq son superiores a 5.

Ej. Determinar la probabilidad entre 3 y 6 caras inclusive en 10 lanzamientos de una moneda utilizando a) la
distribución binomial, b) la aproximación normal de la distribución binomial
a) Se trata de un experimento binomial ya que es la repetición de 10 pruebas Bernoulli ( éxito= cara ;
fracaso= sello) con p(probabilidad de éxito) = ½
P(X=3)= C10,3 (1/2)3 (1/2)7 = 15/128
P(X=4)= C10,4 (1/2)4 (1/2)6 = 105/512
P(X=5)= C10,5 (1/2)5 (1/2)5 = 63/256
P(X=6)= C10,6 (1/2)6 (1/2)4 = 105/512
P(de 3 a 6 caras) = 15/128 + 105/512 + 63/256 + 105/512 = 99/128 = 0.7734

b) En este caso se trata de p y q no próximos a cero ya que p=0.5 y q=0.5, además se considera como
aceptable la aproximación a la normal si np y nq 5, y en este caso np= nq =10(½)=5.

Si consideramos a los datos como continuos, las 3 y 6 caras pueden considerarse como 2.5 a 6.5 caras. La media y la
varianza vendrán dadas por = np = 10(1/2)=5, 2 = npq = 10 (1/2)(1/2) = 2.5   = 1.58.

Ahora bien queremos calcular P(2.5  X  6.5), como consideramos a X distribuida normalmente entonces
estandarizaremos la variable para poder calcular la probabilidad pedida usando la Tabla.

Z = (X- 5)/ 1.58  X = Z 1.58 + 5

P( 2.5  Z 1.58 + 5  6.5) = P( -1.58Z0.95)


= P(0Z1.58) + P(0Z0.95) = 0.4429 + 0.3289
= 0.7718 que se aproxima bastante al verdadero valor 0.7734, la aproximación será mejor
para n > 10.

Relación entre las Distribuciones Binomial y de Poisson

En la distribución binomial, si n es grande, mientras que la probabilidad p de ocurrencia de un


suceso esta cerca de cero, de modo que q = (1-p) está cerca de 1, el suceso recibe el nombre de raro. En la práctica se
puede considerar un suceso como raro si el número de repeticiones de la prueba es mayor o igual a 50 (n  50) mientras
que np<5. En tales casos la distribución binomial se aproxima mucho a la distribución de Poisson con  = np.
Es tanto mejor la aproximación conforme aumenta n, y en el límite es total. Esto último se ve claramente desde el
momento que p0, q1 y al aumentar n, el sesgo y la curtosis de la distribución binomial se aproxima a los de la
distribución Poisson

Dist. Binonial Dist. Poisson


Coef. de sesgo =(q - p) / (n p q)1/2 = 1/()1/2
Coef. de curtosis = 3 + (1 – 6pq) / n p q = 3 + (1/)

Puesto que existe una relación entre la distribución binomial y normal, se deduce que hay también una relación
entre la distribución Poisson y normal. La distribución Poisson se aproxima a la normal con variable estandarizada
Z = (X - )/()1/2.

Ej Un 10% de los artículos producidos en un cierto proceso de fabricación resultan ser defectuosos . Determinar la
probabilidad de que en una muestra de 10 artículos elegidos al azar sean exactamente 2 los defectuosos, mediante a) la
distribución binomial, b) la aproximación de Poisson a la distribución binomial.
a) p( probabilidad de artículo defectuoso)= 0.1
P(2 defectuosos en 10)= C 10,2 (0.1)2 (0.9)8 = 0.1937

b)  = np = 10 (0.1) = 1
P(2 defectuosos en 10)= x e- / x! = 12 e-1/ 2!=0.1839

En general, la aproximación es buena si p0.1 y  = np  5.

También podría gustarte