Está en la página 1de 8

LAS DISTRIBUCIONES NORMALES

Eusebio Gómez Sánchez-Manzano

consultaparaiso@eListas.net eusebio_gomez@mat.ucm.es

Índice
1. Hay muchas distribuciones normales 2

2. ¿Qué significa que una magnitud es normal? 2

3. La gráfica de una función de densidad normal 5

4. La distribución normal de parámetros 0 y 1 6

5. Averiguar áreas bajo otras densidades normales 6

6. ¿Por qué se habla tanto de la distribución normal? 8


LAS DISTRIBUCIONES NORMALES

Eusebio Gómez Sánchez-Manzano


consultaparaiso@eListas.net
eusebio_gomez@mat.ucm.es

Nos ha llegado una consulta, como miembro del grupo El Paraíso de las
Matemáticas 1 , titulada escuetamente “Distribución normal”, que satisfacemos
con el presente escrito. Esperemos que el escrito responda, al menos en un tanto
por ciento considerable, a la necesidad del consultante.

1. Hay muchas distribuciones normales


Hemos de comenzar diciendo que distribuciones normales hay muchas, a pe-
sar de que solamos utilizar con frecuencia, casi como un latiguillo, la expresión
“la distribución normal”. Se puede hablar, por ejemplo, de la distribución nor-
mal cuyo ‘parámetro’ µ es 2 y cuyo ‘parámetro’ σ es 0.5, y que se denota con
N(2, 0.5); también se puede hablar de la distribución normal cuyo parámetro µ
es 0 y cuyo parámetro σ es 1, y que se denota con N(0, 1); y así más.
Como vemos, hay dos cosas, que se llaman parámetros y se denotan habitual-
mente con las letras griegas µ (mu) y σ (sigma), que influyen en la determinación
de una distribución normal. Para cada asignación de valores que le demos al par
de parámetros (µ, σ) tenemos una distribución normal diferente, que se suele
denotar con N(µ, σ) .
Al parámetro µ le podemos asignar como valor cualquier número (real),
positivo o negativo; al parámetro σ le podemos asignar sólo números positivos.

2. ¿Qué significa que una magnitud es normal?


Si se nos dice que una magnitud aleatoria X sigue o tiene una distribución
N(µ, σ) (normal de parámetros µ y σ), ¿qué significa eso?
Significa lo siguiente:

Supongamos que se va a realizar un experimento que va a dar lugar a


la magnitud X; va a dar lugar a un número, que no podemos prede-
cir de antemano. Consideremos un subconjunto A cualquiera2 de la
recta real, fijado de antemano. La probabilidad de que el número que
1 http://www.matematicas.net
2 Desde el punto de vista estrictamente matemático, lo que vamos a decir no vale para todos

los subconjuntos de la recta real, pero sí vale para todos los conjuntos en los que pensamos
habitualmente. Para encontrar una excepción habría que hacer una construcción matemática
bastante artificiosa.

2
se obtenga caiga en el subconjunto A es igual al área que hay “sobre”
el subconjunto A y debajo de la gráfica de la función siguiente:
1 1 x−µ 2
fN(µ,σ) (x) = √ e− 2 ( σ ) . (1)
σ 2π
El área sobre el conjunto A es la integral en ese conjunto de la función
fN(µ,σ) , pero, como veremos, no vamos a tener que preocuparnos por el cálculo
de esa integral.
A la función fN(µ,σ) se la llama “función de densidad N(µ, σ)”.
Se comprueba, haciendo los correspondientes cálculos matemáticos, que la
esperanza o media de la magnitud X coincide con el parámetro µ y la desviación
típica de X coincide con el parámetro σ.
Se entenderá mejor todo lo anterior si lo aplicamos a un ejemplo. Suponga-
mos que en este momento empieza a germinar una semilla de un cierto arbusto,
una jara, pongamos por caso. ¿Qué altura tendrá esa jara cuando alcance su total
desarrollo? No lo sabemos: esa altura es una magnitud aleatoria. Llamemos X a
la altura, en metros, que tendrá la jara. Supongamos que un experto en jaras nos
dice que la magnitud X tiene una distribución N(2, 0.5) , una distribución normal
de parámetros µ = 2 y σ = 0.5. Esto significa que, cuando la jara se desarrolle y
observemos el número que indique su altura en metros, la probabilidad de que
este número caiga en un subconjunto A de la recta real es igual al área que hay
“sobre” el subconjunto A y debajo de la gráfica de la función siguiente:
1 1 x−2 2
fN(2,0.5) (x) = √ e− 2 ( 0. 5 ) ,
0.5 2π
que veremos gráficamente más adelante.
La función fN(2,0.5) es la “función de densidad N(2, 0.5)”.
La esperanza o media de la altura de la jara es µ = 2 metros y su desviación
típica es σ = 0.5 metros. Esto quiere decir, por un lado, que aunque las jaras
no son todas igual de altas, la altura media es de 2 m, y, por otro lado, que la
diferencia respecto de los 2 m de las alturas de las distintas jaras es, por término
medio, proxima a 0.5 m. 3
La gráfica de la función de densidad fN(2,0.5) es ésta:

0.5

0
0.5 1 1.5 2 2.5 3 3.5

3 Los números se han puesto sólo a modo de ilustración matemática y no pretenden ser del

todo realistas: de hecho, las jaras suelen ser un poco más bajas.

3
Vamos ahora a hablar de probabilidades de subconjutos A de la recta real.
Para empezar, consideremos como subconjunto A a toda la recta real. La proba-
bilidad de que el número que indique la altura de la jara caiga en este conjunto,
en la recta real, es el área que hay sobre toda la recta real y debajo de toda la
gráfica. Esta probabilidad es 1, y esta área, naturalmente, es 1. El área que hay
bajo cualquier función de densidad y sobre toda la recta real es siempre 1.
La siguiente figura nos sirve para comparar visualmente el área bajo la gráfica
de la función fN(2,0.5) con el área de un cuadrado de una unidad de lado.

0.5

0
0.5 1 1.5 2 2.5 3 3.5

Consideremos ahora como conjunto A el intervalo (−∞, 2) . El área que hay


sobre el intervalo (−∞, 2) es precisamente la probabilidad de que la altura de
la jara sea menor que 2 m. En la figura siguiente vemos, por la simetría de la
gráfica, que esta área es 0.5; esta probabilidad es 0.5.

0.5

0
0.5 1 1.5 2 2.5 3 3.5

Del mismo modo, la probabilidad de que la altura sea mayor que 2 m es el


área que hay sobre el intervalo (2, ∞) ; y esta probabilidad es también 0.5.
La probabilidad de que la altura de la jara caiga entre 2 m y 2.75 m es el
área que hay sobre el intervalo (2, 2.75) ; se trata de la zona marcada en la figura
siguiente.

4
1

0.5

0
0.5 1 1.5 2 2.5 3 3.5

Para averiguar esta última área tendremos que utilizar la tabla de la N(0, 1) ,
la normal de parámetros µ = 0 y σ = 1, tal como indicaremos más adelante.
Antes de pasar a ello, conviene que pongamos de manifiesto algunas propie-
dades de la gráfica de la densidad fN(2,0.5) , así como de las densidades normales
en general.

3. La gráfica de una función de densidad normal


En las figuras anteriores hemos representado la gráfica de la densidad fN(2,0.5) .
Vamos a tomarla como ejemplo representativo de las densidades normales y a
mostrar algunas de sus propiedades.
Observando las figuras anteriores, vemos que la gráfica tiene forma de cam-
pana. Además (se comprueban fácilmente los detalles matemáticos), tiene las
características siguientes:
- es positiva (toda la gráfica está por encima del eje x) y es continua;
- es simétrica respecto del punto x = 2; la campana está centrada en el
punto 2;
- tiene un único máximo, en x = 2;
- decrece a medida que nos alejamos del punto x = 2, tanto hacia la derecha
como hacia la izquierda;
- tiene dos puntos de inflexión; uno en 2 − 0.5 = 1.5 y otro en 2 + 0.5 = 2.5;
- es cóncava en el intervalo (1.5, 2.5) y es convexa en los intervalos (−∞, 1.5)
y (2.5, ∞) ;
- tiene como asíntota al eje real, tanto hacia la derecha como hacia a la
izquierda.
Todas las densidades normales fN(µ,σ) tienen propiedades similares a ésta.
Concretamente, tienen un máximo en x = µ y dos puntos de inflexión: uno en
µ − σ y otro en µ + σ.

5
4. La distribución normal de parámetros 0 y 1
Vamos a hablar ahora de la distribución N(0, 1) , la normal de parámetros
µ = 0 y σ = 1. Su media es 0 y su desviación típica es 1. Su densidad es
1 1 2
fN(0,1) (x) = √ e− 2 x .

Aquí tenemos su gráfica, junto con la de la densidad fN(2,0.5) .

0.5

0
-3 -2 -1 1 2 3

Vemos que también esta gráfica tiene forma de campana, aunque un poco
diferente de la anterior. Está centrada en x = 0 y es simétrica respecto de este
punto. Los puntos de inflexión están en -1 y 1; los puntos de inflexión están más
lejos del centro (el 0) que en el caso de la N(2, 0.5) . La campana es más baja
y más ancha que la de la N(2, 0.5) ; pero una cosa se compensa con la otra y el
área debajo de esta campana es la misma que debajo de la otra: es 1.
El área sobre el intervalo (−∞, 0) es 0.5; la misma que sobre el intervalo
(0, ∞) .
Hay una tabla que nos permite obtener el área sobre cualquier otro conjunto
debajo de la gráfica de la densidad fN(0,1) . [Suponemos que el lector posee esa
tabla y sabe utilizarla; si no es así, puede informarse de cualquier compañero;
no es muy difícil].

5. Averiguar áreas bajo otras densidades nor-


males
¿Cómo podemos utilizar la tabla de la N(0, 1) para averiguar áreas bajo otras
densidades normales, distintas de la N(0, 1) , como, por ejemplo, la N(2, 0.5)?
Utilizando el siguiente enunciado, muy importante:
Enunciado.- Si una magnitud aleatoria X tiene una distribución
N (µ, σ) y obtenemos de ella otra magnitud, que llamaremos Z, de
este modo
X −µ
Z= ,
σ
(esto es, a X se le resta su media y se divide por su desviación típi-
ca), entonces la nueva magnitud aleatoria Z tiene una distribución
N (0, 1) .

6
Para que se entienda bien lo que significa este enunciado, lo aplicamos a
nuestro ejemplo. Está empezando a germinar la semilla de la jara. Cuando sea
adulta mediremos su altura X en metros. [Recordamos que X es una magnitud
aleatoria, con distribución N(2, 0.5) ; su esperanza es 2 y su desviación típica es
0.5]. Al número que obtengamos, cuando midamos la jara, le restaremos 2 y a
lo que dé lo dividiremos por 0.5. Obtendremos así otro número. ¿Cuál va a ser
este número? No lo sabemos ahora: es otra magnitud aleatoria; llamémosla Z.
Pues bien, la distribución de esta magnitud aleatoria, Z, que así obtendremos,
es normal; su media es precisamente 0 y su desviación típica es 1; es una N(0, 1) .
Con este enunciado, y volviendo a la magnitud X, con distribución N(2, 0.5) ,
veamos ahora cómo podemos utilizar la tabla de la N(0, 1) para averiguar pro-
babilidades referentes a la magnitud X.
Para ello vamos a centrarnos sólo en el ejemplo que tenemos pendiente:
vamos a calcular P (X ∈ (2, 2.75)) , la probabilidad de que X caiga en el intervalo
(2, 2.75) . Esta probabilidad es el área que hay debajo de la gráfica de la densidad
fN(2,0.5) sobre el intervalo (2, 2.75) ; es la zona que hemos remarcado en la figura
de la página 5. Llamemos Z a la magnitud
X −2
Z= .
0.5
Sabemos que Z tiene una distribución N(0, 1) . Para lograr hacer intervenir la
magnitud Z en nuestro cáculo de P (X ∈ (2, 2.75)), contruimos esta cadena de
igualdades:

P (X ∈ (2, 2.75)) = P (2 < X < 2.75)


µ ¶
2−2 X −2 2.75 − 2
=P < <
0.5 0.5 0.5
= P (0 < Z < 1.5)
= P (Z ∈ (0, 1.5))

Así, llegamos a ver que la probabilidad que buscamos equivale a la probabilidad


P (Z ∈ (0, 1.5)) y ésta, a su vez, equivale al área que hay debajo de la gráfica
de la densidad fN(0,1) sobre el intervalo (0, 1.5) . Es interesante tomar nota de
esta igualdad de áreas:

El área que hay debajo de la gráfica de la densidad fN(2,0.5) sobre el


intervalo (2, 2.75) es igual que el área que hay debajo de la gráfica
de la densidad fN(0,1) sobre el intervalo (0, 1.5) .

La figura siguiente nos permite comparar visualmente estas dos áreas:

7
1

0.5

0
-3 -2.5 -2 -1.5 -1 -0.5 0.5 1 1.5 2 2.5 3 3.5

Con ayuda de la tabla de la N(0, 1) vemos que esta área, esta probabilidad,
es 0.4332.

6. ¿Por qué se habla tanto de la distribución


normal?
La distribución normal (y ya me he vuelto a utilizar el latiguillo del singular)
es muy usada en la teoría de la probabilidad y en la estadística por dos razones.
La primera razón es porque la distribución normal tiene propiedades mate-
máticas y estadísticas muy sencillas y útiles; y esto a pesar de que la expresión
matemática de su función de densidad (fórmula (1), página 3) pueda parecernos
un poco enrevesada.
La segunda, y más importante, razón es porque muchas magnitudes de nues-
tro mundo real (magnitudes físicas, geológicas, biométricas, psicológicas, so-
ciales, económicas) resulta que tienen una distribución normal. Ello se debe a
un teorema, llamado Teorema de límite central, que viene a decir lo siguiente:

Teorema del límite central.- Si una magnitud X es consecuen-


cia de un número muy grande de influencias, que se van suman-
do, y tales que ninguna de ellas tiene un efecto muy relevante en
comparación con las restantes, entonces la magnitud X tiene una
distribución normal.

Y estas circunstancias se dan mucho en el mundo real.