Está en la página 1de 7

Tema 7.

- La distribución normal

LA DISTRIBUCIÓN NORMAL
Introducción.

La distribución normal es la distribución de probabilidades continua por antonomasia.


Se trata de la denominada “campana de Gauss” que fue introducida por el propio Gauss
(1797) como modelo para explicar la distribución de errores de observaciones astronómicas.
Gauss comprobó empíricamente que realizando un número grande n de mediciones de una
constante astronómica desconocida θ (distancia entre dos cuerpos celestes, tiempos de
rotación, intensidad luminosa, etc.) se obtenían mediciones cuya distribución muestral o
empírica parecía ajustarse bien a curvas del tipo

x−µ 2
− 21  σ 
f ( x) = 1 e , −∞ < x < ∞
2πσ

para valores apropiados de µ y de σ.


En otro orden de cosas, la distribución normal aparecerá también para modelar la
distribución de variables que miden características de interés de productos fabricados en serie:
El proceso de producción está programado para que la característica en cuestión de cada
artículo tome un valor ideal θ, pero distintas causas no controlables (variaciones
imperceptibles en la materia prima, en la tensión eléctrica, en las condiciones ambientales, en
el estado de ánimo del operario,...) hacen que el valor real de la característica no sea
precisamente θ, sino un valor más o menos próximo.
La justificación teórica del uso del modelo normal en situaciones como las descritas
anteriormente, vendrá de la mano del denominado “efecto límite central” que tendremos
ocasión de comentar más adelante. Por supuesto, esta justificación teórica deberá ir avalada
por las comprobaciones empíricas correspondientes. No tiene sentido asumir el riesgo de
aferrarse a un modelo teórico contrario a las evidencias empíricas.

Ejemplo: A continuación se muestran mediante un histograma las longitudes de 500 piezas


elegidas al azar de la población de piezas producidas en una planta metalúrgica. El valor
ideal de la longitud es 3 cm (media de la población) y la desviación típica 0.01 cm. En el
gráfico se incluye también el ajuste de los datos a una distribución normal.
Histograma de frecuencias ajustado
por una densidad normal

100

80

60
frecuencia

40

20

2.96 2.98 3.00 3.02 3.04

Longitud de piezas

36
Tema 7.- La distribución normal

Ejercicio: A partir de un calibrador y un objeto a calibrar, cada alumno de la clase efectúa la


medición del objeto, se anotan todos los resultados y se representa gráficamente la
distribución de frecuencias que se ajustará “razonablemente” a una curva del tipo
anteriormente citado. Experiencias parecidas se pueden extraer midiendo la longitud de un
muro, la capacidad de un envase, etc.

Definición: Se dice que una variable aleatoria X sigue la distribución normal de parámetros
(µ,σ), µ ∈ℜ, σ > 0 , y se representa X → N ( µ , σ ) , si la distribución de probabilidades de X está
dada por la función de densidad

f ( x) = 1
e
− 21 ( )
x−µ 2
σ
, −∞< x <∞.
2 πσ

Funciones de densidad de leyes normales N(0,1) Funciones de densidad de leyes normales N(0,1)
con distintas medias y varianza común N(1,1) con media común y distintas varianzas N(0,2)
N(2,1) N(0,3)
0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0

-5 -3 -1 1 3 5 -10 -6 -2 2 6 10
X X

Características numéricas de la distribución normal.

Mediante cálculos sencillos se pueden obtener las principales características numéricas de esta
distribución:
Media: EX=µ,
Mediana = Moda = µ.
Desviación típica: DT(X)=σ(X)=σ,
Varianza: Var(X)=σ2(X)=σ2.
Coeficiente de Asimetría=0 (independiente de µ y de σ).
Coeficiente de apuntamiento o Kurtosis = 3 (independiente de µ y de σ).

Tipificación de variables normales:

Definición: Se llama distribución normal típica o estándar a la distribución normal de media 0


y desviación típica 1, es decir N(0,1), cuya densidad es

−1x 2
f (x) = 1 e 2 , − ∞ < x < ∞.

37
Tema 7.- La distribución normal

Para calcular probabilidades bajo la curva normal estándar es de gran utilidad el manejo de la
función de probabilidad acumulada (función de distribución), denotada habitualmente como
Φ(x):
x − 12 t 2
Φ( x) = ∫ 1

e dt = P ( N (0,1) ≤ x), −∞ < x < ∞
−∞

Esta función está tabulada y permite de forma sencilla calcular la probabilidad de cualquier
intervalo bajo la curva normal estándar:

P (a < X < b) = P ( X < b) − p ( X < a ) = Φ(b) − Φ (a )

Nótese que la tabla sólo contiene los valores de Φ(x) para x>0. Para x<0 basta tener en cuenta
que la simetría de la ley normal implica que Φ(-x) = 1−Φ(x).

Función de densidad Funcion de distribución


1
F(x)

f(x) Φ (b)

P(a,b)=Φ (b)- Φ(a)


P(a,b)

Φ (a)
0
a b a b

Si X es una v.a. con distribución N(0,1) entonces, cualquiera que sean µ ∈ℜ, σ > 0 se
tiene que:
Y = µ + σX → N(µ, σ ) .

Recíprocamente, si Y es una v.a. con distribución N(µ,σ), entonces se cumple que

Y-µ
→ N( 0, 1) .
σ
Los resultados anteriores, nos van a permitir expresar sucesos definidos a través de una
variable normal cualquiera por medio de sucesos equivalentes definidos en términos de la
normal estándar. De este modo podremos calcular las probabilidades de dichos sucesos a
partir de las tablas de la ley normal estándar.
Así, para calcular P( a < X < b ) siendo X una variable con ley N(µ,σ) y − ∞ ≤ a, b ≤ ∞ ,
basta con tipificar la variable X:

 a - µ X - µ b - µ  b - µ  a - µ
P(a < X < b) = P < <  = Φ  − Φ 
 σ σ σ   σ   σ 

38
Tema 7.- La distribución normal

Ejemplo: Se sabe que la densidad X de ciertos ladrillos cuando se hornean a 125ºC es una
variable aleatoria normal con media 3.85 gr/cm3 y desviación típica 0.05 gr/cm3. Si los
límites de tolerancia son (3.75 gr/cm3 , 4.00 gr/cm3), hallar el porcentaje de ladrillos que se
salen de dicho intervalo.

Solución:

 3.75 - 3.85 X - µ 4 - 3.85  4 - 3.85  3.75 - 3.85


P(3.75 < X < 4) = P < <  = Φ  − Φ  = Φ(3) − Φ( −2) = 0.9759
 0.05 σ 0.05   0.05   0.05 
es decir, el 2.41% de la producción.
Ejemplo: Se sabe que los diámetros X de ciertas bolas de acero siguen una ley normal. Se
estima que el 5% de las bolas superan 5.01 mm y, por tanto, son defectuosas por ser
demasiado grandes. Análogamente, se estima que el 2.5% de las bolas tienen un diámetro por
debajo de 4.99 mm y son defectuosas por ser demasiado pequeñas. Obtener la media y la
distribución de X.

Solución: Por los datos del problema sabemos que:

 X − µ 5.01 − µ 
P( X > 5.01) = P >  = 0.05
 σ σ 
 X − µ 4.99 − µ 
P( X < 4.99) = P <  = 0.025
 σ σ 

A partir de las tablas de la distribución normal obtenemos las ecuaciones:


5.01 − µ
= 165
.
σ
4.99 − µ
= −196
.
σ

Resolviendo estas ecuaciones, obtenemos: µ=5.00086 mm y σ=0.00554 mm .

Una simple comprobación nos proporciona las probabilidades de los siguientes


intervalos de frecuente aparición en Cálculo de Probabilidades y en Estadística:
Si X es una v.a. con distribución N(µ,σ), entonces se tiene:

P( µ − σ < X < µ + σ ) = 0.6826


P( µ − 165 . σ ) = 0.90
. σ < X < µ + 165
P( µ − 196 . σ ) = 0.95
. σ < X < µ + 196
P( µ − 2σ < X < µ + 2σ ) = 0.9545
P( µ − 2.58σ < X < µ + 2.58σ ) = 0.99
P( µ − 3σ < X < µ + 3σ ) = 0.9973

A modo de ejercicio, es interesante comparar las probabilidades anteriores con las


acotaciones obtenidas a partir de la desigualdad de Chebyshev.

39
Tema 7.- La distribución normal

Combinaciones lineales de variables normales.

Una propiedad característica de la normalidad es que se conserva por transformaciones


lineales:
Si X1, ..., Xn son v.a. con distribuciones Xi → N ( µ i , σ i ), i = 1,..., n , y a0 , a1 ,..., an son
números reales cualesquiera, se tiene

a0 + a1 X1 +... + an Xn → N ( µ, σ )
donde
µ = a0 + a1µ1 +... + an µ n

y la desviación típica σ depende de las relaciones de dependencia entre las variables. En el


caso particular de que sean v.a. independientes, se tiene:

σ 2 = a12 σ12 +... + an2 σ 2n .

En particular, si X1, ..., Xn son v.a. independientes con distribución Xi → N ( µ i , σ i ),


i = 1,..., n , se tiene la siguiente distribución para la suma:

n  n n 
. ∑
i =1
X i → N  ∑ µi ,
 i =1
∑ σ i2  ,
i =1 

por lo que se dice que la ley normal es reproductiva respecto a los parámetros µ y σ2.

Si, además, X1, ..., Xn son v.a. independientes e igualmente distribuidas con distribución
común X i → N ( µ , σ ) , i = 1,..., n , la expresión anterior se convierte en:

n
∑ Xi − nµ
( ) , o bien
n

∑X
i =1
i → N nµ , nσ 2 i =1

→ N ( 0, 1) .

De especial interés en Estadística es el estudio de la distribución del promedio de


variables normales independientes e igualmente distribuidas:

n
 σ  X −µ
X = 1
n ∑X
i =1
i → N  µ ,  , o bien
 n
n
σ
→ N ( 0, 1) .

Ejemplo: Una máquina automática llena cajas de detergente en polvo. El contenido envasado
por caja es una v.a. con ley N(4 Kg, 0.0125 Kg), con independencia entre las distintas cajas.
Las cajas se empaquetan en lotes de 4 cajas. Hallar la probabilidad de que un lote contenga
menos de 15.950 Kg.

Solución: Llamemos Xi al contenido de la caja i, i=1,...,4, e Y= X1+...+ X4 al contenido total


del lote. Sabemos que la distribución de la v.a. Y es N(16 Kg, 0.025 Kg), De manera que

40
Tema 7.- La distribución normal

 Y - µ 15.95 - 16 
P(Y < 15.95) = P <  = Φ( − 2) = 1 − Φ( 2) = 0.02275 .
 σ 0.025 

El efecto límite central:

Con el nombre de “efecto límite central” se conoce el hecho de que cuando una
variable X es el resultado de la contribución de muchas causas Xi i = 1,..., n , que actúan
independientemente y que cada una de ellas tiene una contribución pequeña en el valor final
de la variable, el modelo normal suele ser un patrón razonable para el comportamiento de
dicha variable. La justificación matemática de este hecho se sustenta en el siguiente resultado
que es uno de los más importantes del Cálculo de Probabilidades:

Teorema Central del Límite (TCL): Si X1, ..., Xn son v.a. independientes con medias
µ i < ∞ y varianzas σ i2 < ∞ , i = 1,..., n , se tiene para n → ∞

n  n n 
∑X → N  ∑ µi , ∑σ
aprox .

i i
2  .
i =1  i =1 i =1 

En particular, si X1, ..., Xn son v.a. independientes e igualmente distribuidas con media
y varianza comunes µ < ∞ , σ 2 < ∞ , i = 1,..., n , la expresión anterior se convierte en:
n
∑ Xi − nµ aprox .
( )
n

∑X i =1
aprox .

→ N nµ , σ n , o bien → N ( 0, 1) .

i
i =1

En otras palabras, la distribución de la suma de muchas variables con cualquier


distribución (con media y varianza finitas), sea ésta discreta ó continua y tenga la forma que
tenga, tiene siempre una distribución aproximadamente normal. La calidad de la aproximación
es función del número n de variables que sumamos, pero también de las distribuciones de los
sumandos. Cuanto más próxima estén estas distribuciones de la normal, podremos justificar la
aproximación con valores más pequeños de n. En particular, sabemos que si las distribuciones
de los sumandos son normales, la normalidad se tiene de forma exacta y para cualquier n.

El teorema central del límite se puede expresar también en términos de los promedios
de las variables en lugar de las sumas:

X n − µ aprox .
→ N (µ , σ ) , o bien
n

∑X
aprox .

Xn = 1
→ N ( 0, 1) .
n
i =1
i n σ
n

41
Tema 7.- La distribución normal

Ejemplo: Un aparato electrónico funciona con la energía que le suministra una batería que
cuando se agota es sustituida instantáneamente por otra idéntica y así sucesivamente. Las
distintas baterías tienen un funcionamiento independiente unas de otras. Se desconoce la ley
de vida de las baterías, pero se estima que la vida media es de 8 horas con una desviación
típica de 2 horas. Obtener aproximadamente la probabilidad de que con 100 baterías se
pueda mantener funcionando el aparato electrónico durante un mes (30 días o 720 horas).

Solución: Llamemos Xi a la duración de la batería i, i=1,...,100, e Y= X1+...+ X100 a la


duración total de las 100 baterías. Aplicando el TCL se tiene que

( )
100
Y = ∑ X i → N 800,2 100
aprox .

i =1

con lo que la probabilidad pedida es , aproximadamente,

 Y - µ 720 - 800 
P(Y > 720) = P >  ≅ 1 − Φ( − 4) = Φ( 4) ≅ 1 .
 σ 400 

42

También podría gustarte