Está en la página 1de 9

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES

ALEATORIAS CONTINUAS

Distribución Normal o de Gauss

Introducción
Una de las distribuciones teóricas mejor estudiadas en los textos de estadística y más
utilizada en la práctica es la distribución normal, también llamada distribución
gaussiana. Su importancia se debe fundamentalmente a la frecuencia con la que distintas
variables asociadas a fenómenos naturales y cotidianos siguen, aproximadamente, esta
distribución. Caracteres morfológicos (como la talla o el peso),
o psicológicos (como el cociente intelectual) son ejemplos de variables de las que
frecuentemente se asume que siguen una distribución normal.
El uso extendido de la distribución normal en las aplicaciones estadísticas puede explicarse,
además, por otras razones. Muchos de los procedimientos estadísticos habitualmente
utilizados asumen la normalidad de los datos observados. Aunque muchas de estas técnicas
no son demasiado sensibles a desviaciones de la normal y, en general, esta hipótesis puede
obviarse cuando se dispone de un número suficiente de datos, resulta recomendable
contrastar siempre si se puede asumir o no una distribución normal. La simple exploración
visual de los datos puede sugerir la forma de su distribución. No obstante, existen otras
medidas, gráficos de normalidad y contrastes de hipótesis que pueden ayudarnos a decidir,
de un modo más riguroso, si la muestra de la que se dispone procede o no de una
distribución normal. Cuando los datos no sean normales, podremos o bien transformarlos o
emplear otros métodos estadísticos que no exijan este tipo de restricciones (los llamados
métodos no paramétricos).
A continuación se describirá la distribución normal, su ecuación matemática y sus
propiedades más relevantes, proporcionando algún ejemplo sobre sus aplicaciones a la
inferencia estadística.

Dato Histórico
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre
(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más
profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más
comúnmente, como la "campana de Gauss".
Definición

Se dice que la v.a continua X es una v.a. normal con parámetros  y  2 si su función de
densidad es:
1 x   
2

1 
2   

f ( x)  e ,   x  ......(1)
 2
Se denota X~ N (µ, σ²) y se dice X se distribuye normal con parámetros µ y σ²

Gráfica de la Distribución Normal

Propiedades de la distribución normal

La distribución normal posee ciertas propiedades importantes que conviene destacar:


a). La función siempre es positiva, f(x) > 0 para toda x.
1
b). Tiene una única moda, que coincide con su media y su mediana, cuyo valor es .
 2
c). La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre  y
 es teóricamente posible.
d). El área total bajo la curva es, igual a 1.
e). Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una
probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar
un dato menor.
f). La distancia entre la línea trazada en la media y el punto de inflexión (µ- σ y µ+σ) de la
curva es igual a una desviación típica (  ). Cuanto mayor sea  , más aplanada será la
curva de la densidad.
f). El área bajo la curva comprendido entre los valores situados aproximadamente a dos
desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de
posibilidades de observar un valor comprendido en el intervalo.
g). La forma de la campana de Gauss depende de los parámetros  y  . La media indica
la posición de la campana, de modo que para diferentes valores de la gráfica es
desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina
el grado de apuntamiento de la curva. Cuanto mayor sea el valor de  , más se
dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño
de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al
valor medio de la distribución.

Distribución Normal Estándar

Deduciendo de la última propiedad, no existe una única distribución normal, sino una
familia de distribuciones con una forma común, diferenciadas por los valores de su media y
su varianza. De entre todas ellas, la más utilizada es la distribución normal estándar, que
corresponde a una distribución de media 0 y varianza 1. Así, la expresión que define su
densidad se puede obtener de la Ecuación 1, resultando:

1 2
1 z
f ( z)  e 2 ,   z  ......(2)
2

Es importante conocer que, a partir de cualquier variable X  N (  ,  ) , se puede obtener


otra característica Z con una distribución normal estándar, sin más que efectuar la
x
transformación: z , donde z  N (0,1) .

Gráfica de la Distribución Normal Estándar

(-) 0 (+) Z

Ejercicios

1. Dada una distribución normal estándar, encuentre el área bajo la curva que está
a) a la izquierda de z = 1.43
b) a la derecha de z = -0.89
c) entre z = -2.16 y z = -0.65
d) a la izquierda de z = -1.39
e) a la derecha de z = 1.96
f) entre z = -0.48 y z = 1.74
Ejercicio
En una lechería la producción de leche por vaca tiene distribución normal con producción
media de 18 lt. y una varianza de 9 lt2, ¿Cuál es la probabilidad que una vaca elegida al
azar:
a) produzca menos de 12 litros.
b) tenga una producción entre 21 y 24 litros?
c) produzca entre 15 y 22 litros?
d) tenga una producción mayor a 25 litros?

Ejercicio
La longitud X, en milímetros, de las semillas de cierta planta sigue una distribución normal,
verificando P[X < 30] = 00975 y P[X < 10] = 00025 Se sabe que una semilla germinara si y
sólo si su longitud es superior a 15 milímetros.
(a) Calcular la probabilidad de que una semilla elegida aleatoriamente no germine.
(b) Si las semillas se empaquetan en cajas de 16 unidades, y a una floristería se envían 300
cajas, ¿En cuántas cajas cabe esperar que no germinen menos del 9 %?
Ejercicio
La altura de plantas de soja de la variedad Hood se distribuye aproximadamente
normal con media 55 cm y desviación estándar de 5.8 cm. Por otro lado, la altura de plantas
de yuyo colorado (Amaranthus sp.) invasora de este cultivo, también se distribuye en forma
normal con media 62 cm y desviación estándar de 3 cm. Si se decide aplicar un herbicida
usando un equipo a sogas:
a) ¿A qué altura debe disponerse la soga para eliminar el 90% de la maleza en este cultivo?
b) ¿Suponiendo que el herbicida no es selectivo, es decir mata por igual a toda planta que
toma contacto con la soga, ¿qué porcentaje de plantas de soja se perderá a la altura de soga
encontrada en el punto anterior?

Ejercicio
El caudal de un canal de riego medido en m3 /seg es una variable aleatoria con distribución
aproximadamente normal con media 3 m3 /seg. y desviación estándar 0.8 m3 /seg. A partir
de estas referencias calcular la probabilidad de los siguientes eventos: a) Evento A: que el
caudal en un instante dado sea a lo sumo de 2.4 m3 /seg. b) Evento B: que el caudal en un
instante dado esté entre 2.8 y 3.4 m3 /seg.
3. La vida promedio de cierto tipo de motor pequeño es 10 años con una desviación
estándar de dos años. El fabricante reemplaza gratis todos los motores que fallen dentro
del tiempo de garantía. Si está dispuesto a reemplazar sólo 3% de los motores que
fallan, ¿de qué duración debe ser la garantía que ofrezca? Suponga que la duración de
un motor sigue una distribución normal.

4. La resistencia a la tracción de cierto componente de metal se distribuye normalmente


con una media de 10000 kilogramos por centímetro cuadrado y una desviación estándar
de 100 kilogramos por centímetro cuadrado. Las mediciones se registran a los 50
kilogramos por centímetro cuadrado más cercanos.
a) ¿Qué proporción de estos componentes excede 10150 kilogramos por centímetro
cuadrado de resistencia a la tracción?
b) Si las especificaciones requieren de todos los componentes tengan resistencia a la
tracción entre 9800 y 10200 kilogramos por centímetro cuadrado inclusive, ¿qué
proporción de piezas esperaría que se descartará?
Importante

Las distribuciones “t” de Student, Chi cuadrado (  2 ) y F, se derivan de la distribución


Normal y están relacionadas con la teoría del muestreo pequeño n < 30.
Son muy importantes pues son la base de metodologías inferenciales, tales como Intervalos
de Confianza y Pruebas de Hipótesis.

Las variables “t”,  2 y F surgen de transformaciones de variables aleatorias en las que


están involucrados estadísticos muestrales, tales como la media y la varianza. En la
práctica, por lo tanto, no podemos decir por Ejemplo que el peso, la altura, etc., se
distribuyen según t”,  2 y F

DISTRIBUCIÓN DE STUDENT O DISTRIBUCIÓN “t”

¿Quién era Student? Pues en realidad Student no era el nombre o el apellido del
responsable de esta distribución de probabilidad, sino que era un seudónimo. El verdadero
nombre del creador de la t de Student es William Sealy Gosset, (1876 – 1937); era un
matemático y químico inglés.

En muchos casos se seleccionan de una población normal, muestras de tamaño pequeño n <
30 y  desconocido.

DEFINICIÓN

Una variable con distribución t de Student se define como el cociente entre una variable
normal estandarizada y la raíz cuadrada positiva de una variable  2 dividida por sus
grados de libertad.

La función de densidad de probabilidad de la variable aleatoria “t” está dada por:


  (v  1) / 2 
 ( v 1) / 2
t2 
h(t )  1  ,   t  
 (v / 2)  v  v 

Esta se conoce como la distribución t con grados de libertad.

CARACTERISTICAS

 La distribución se denomina distribución de Student o distribución “t”.


 Cada curva “t” tiene forma de campana con centro en 0.
v
 Es simétrica, con media 0, y variancia mayor que 1. Es decir:  2  ,v  2
v2
 Es más achatada que la normal y adopta diferentes formas, según el número de grados
de libertad.

 La variable t se extiende desde -  a +  .


 A medida que aumenta los (v = n -1, es decir v   ) grados de libertad la distribución
“t” se aproxima en su forma a una distribución normal estándar. Por lo que la curva “z”
recibe a veces el nombre de curva “t” con gl = grande “  ”.

 El parámetro de la distribución es (v = n-1) grados de libertad, originando una


distribución diferente para cada tamaño de muestra.

¿Cómo se deduce una distribución de “t”?

 Extraigo K muestras de tamaño n < 30.


 Calculo para cada muestra el valor de “t”.
 Grafique la distribución para cada tamaño muestral

Distribución “t” para diferentes grados de libertad (n-1)


Ejemplo:

a) Encuentre la probabilidad de –t0.025 < t < t0.05.

b) Encuentre k tal que P (k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15
que se selecciona de una distribución normal.

c) Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso


en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación
toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05,
queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene
una media de 518 gramos por milímetro y una desviación estándar de 40 gramos?
Suponga que la distribución de rendimientos es aproximadamente normal.

d) Calcular el percentil t0,95 y t0,25 en cada uno de los siguientes casos:

1. En una distribución t-Student con 3 grados de libertad.


2. En una distribución t-Student con 30 grados de libertad.
3. En una distribución t-Student con 52 grados de libertad.
4. En una distribución t-Student con 120 grados de libertad.