Está en la página 1de 8

Distribución normal

La línea verde corresponde a la distribución normal estándar


Función de densidad de probabilidad

Función de distribución de probabilidad


Parámetros
σ>0
Dominio
Función de densidad (pdf)
Función de distribución (cdf)
Media
Mediana
Moda
Varianza
Coeficiente de simetría 0
Curtosis 0
Entropía
Función generadora de momentos (mgf)
Función característica

En estadística y probabilidad se llama distribución normal, distribución de Gauss o


distribución gaussiana, a una de las distribuciones de probabilidad de variable continua
que con más frecuencia aparece aproximada en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica


respecto de un determinado parámetro. Esta curva se conoce como campana de
Gauss.

La importancia de esta distribución radica en que permite modelar numerosos


fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que
subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme
cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal
puede justificarse asumiendo que cada observación se obtiene como la suma de unas
pocas causas independientes.

De hecho, la estadística es un modelo matemático que sólo permite describir un


fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño
experimental, de ahí que al uso de la estadística en psicología y sociología sea
conocido como método correlacional.

La distribución normal también es importante por su relación con la estimación por


mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.

Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo


de la normal son:

caracteres morfológicos de individuos como la estatura;


caracteres fisiológicos como el efecto de un fármaco;
caracteres sociológicos como el consumo de cierto producto por un mismo grupo de
individuos;
caracteres psicológicos como el cociente intelectual;
nivel de ruido en telecomunicaciones;
errores cometidos al medir ciertas magnitudes;
etc.
La distribución normal también aparece en muchas áreas de la propia estadística. Por
ejemplo, la distribución muestral de las medias muestrales es aproximadamente
normal, cuando la distribución de la población de la cual se extrae la muestra no es
normal.[1] Además, la distribución normal maximiza la entropía entre todas las
distribuciones con media y varianza conocidas, lo cual la convierte en la elección
natural de la distribución subyacente a una lista de datos resumidos en términos de
media muestral y varianza. La distribución normal es la más extendida en estadística y
muchos tests estadísticos están basados en una supuesta "normalidad".

En probabilidad, la distribución normal aparece como el límite de varias distribuciones


de probabilidad continuas y discretas.

Entre las distribuciones a tratar en esta unidad serían:


1. Distribución Normal
2. Aproximación de la Normal a la Binomial
3. Exponencial

1. DISTRIBUCIÓN NORMAL.

Características:

a)      Es generada por una variable de tipo continuo, denominada x;


-¥< x < ¥
b)      La función que nos define esta distribución es:

1 2 2
f ( x ,  , 2 )   ( x   ) / 2
 2 -¥< x < ¥

Al dar a la función los valores de m , s2 y valores a x, obtendremos la


distribución en cuestión, la que tiene forma de campana, por lo que
también se le conoce como campana de Gauss. Hay un número infinito
de funciones de densidad Normal, una para cada combinación de m y s.
La media m mide la ubicación de la distribución y la desviación estándar
s mide su dispersión.
c) Es simétrica con respecto a su eje vertical.
d) Es asintótica con respecto a su eje horizontal; esto quiere decir que
jamás va a tocar el eje de las equis.
e) El área total bajo la curva es 1.
f) Sí sumamos a m ± s, se observará que aproximadamente el 68.26% de
los datos se encuentran bajo la curva, si sumamos a m ± 2s, el 95.44%
de los datos estará entre esos límites y si sumamos a m ± 3s, entonces el
99.74% de los datos caerá dentro de esos límites. Esta característica es a
la vez una forma empírica y rápida de demostrar si los datos que se
analizan tienen una distribución Normal; ya que para trabajar los datos con
esta distribución, debe verificarse que efectivamente así se distribuyen, ya
que de no hacerlo, las decisiones que en un momento dado se tomarán de
un análisis de los datos con la distribución Normal, serían erróneas.

¿Cómo se determinan probabilidades con la distribución Normal?


De acuerdo a como se trataron las distribuciones de probabilidad continuas
en la unidad III, lo más lógico es que la función f(x, m, s2), se integre entre
los límites de la variable x; esto es,
b

 f ( x , ,
2
p( a  x  b )  )dx
a

La integral anterior nos daría el área bajo la curva de la función, desde a


hasta b, que corresponde o es igual a la probabilidad buscada.
Debido a la dificultad que se presenta para integrar esta función cada vez
que sea necesario, lo que se hace es tipificar el valor de la variable x, esto
es, x se transforma en un valor de z, de la siguiente manera:
x
z  valor

Este valor de z es buscado en una tabla donde vienen áreas asociadas a


este valor, y haciendo uso de los valores tabulados, se determina la
probabilidad requerida. La tabla que es usada para calcular las
probabilidades es la que nos dá el área que se muestra a continuación:

0 Z
Ejemplos:
1.      El acero que se utiliza para tuberías de agua a menudo se recubre
internamente con un mortero de cemento para evitar la corrosión. En un
estudio de los recubrimientos de mortero de una tubería empleada en
un proyecto de transmisión de agua en California (Transportation
Engineering Journal, Noviembre de 1979) se especificó un espesor de
7/16 pulgadas para el mortero. Un gran número de mediciones de
espesor dieron una media de 0.635 pulgadas y una desviación
estándar de 0.082 pulgadas. Sí las mediciones de espesor, tenían una
distribución Normal, ¿qué porcentaje aproximado fue inferior a 7/16 de
pulgada?

Solución:
x = variable que nos define el espesor del mortero en pulgadas
m = 0.635 pulgadas
s = 0.082 pulgadas

X = 7/16
m=0.635

Z
7 / 16  0.635 0.4375  0.635
Z   2.4085  2.41
0.082 0.082

p(z = -2.41) = 0.492

p(x < 7/16 pulgadas) = 0.5- p(z = -2.41) = 0.5-0.492 = 0.008

Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un


espesor menor de 7/16 pulgadas

2.      Un tubo fluorescente estándar tiene una duración distribuida


Normalmente, con una media de 7,000 horas y una desviación estándar
de 1,000 horas. Un competidor ha inventado un sistema de iluminación
fluorescente compacto que se puede insertar en los receptáculos de
lámparas incandescentes. El competidor asegura que el nuevo tubo
compacto tiene una duración distribuida Normalmente con una media
de 7,500 horas y una desviación estándar de 1,200 horas. a. ¿Cuál tubo
fluorescente tiene mayor probabilidad de tener una duración mayor de
9,000 horas? b. ¿Cuál tubo tiene mayor probabilidad de tener una
duración de menos de 5,000 horas?

Solución:
a) Tubo 1
X1 = variable que nos define la duración en horas de un tubo fluorescente
m = 7,000 horas
s = 1,000 horas

Tubo 2
X2 = variable que nos define la duración del tubo fluorescente del
competidor
m = 7,500 horas
s = 1,200 horas

m=7000 X= 9000
9,000  7 ,000
z1   2.00
1,000 p(z1 = 2.00) = 0.4772

p(x1 > 9,000 horas) = 0.5 – p(z1 = 2.00) = 0.5 – 0.4772 = 0.0228

m=7500 X = 9000
9 ,000  7 ,500
z2   1.25
1,200 p(z2 = 1.25) = 0.3944

p(x2 > 9,000 horas) = 0.5 – p(z2 = 1.25) = 0.5 –0.3944 = 0.1056

Por tanto el tubo fluorescente del competidor tiene una probabilidad mayor
de durar más de 9,000 horas.

b)

X = 5000 m=7000

5,000  7 ,000
z1   2.00
1,000 p(z1 = -2.00) = 0.4772

p(x1 < 5,000 horas) = 0.5 – p(z1 = -2.00) = 0.5 – 0.4772 = 0.0228

X = 5000 m= 7500
5,000  7 ,500
z2   2.08
1,200 p(z2 = -2.08) = 0.4812

p(x2 < 5,000 horas) = 0.5 – p(z2 = - 2.08) = 0.5 – 0.4812 = 0.0188

Por tanto, el tubo fluorescente que tiene una mayor probabilidad de durar
menos de 5,000 horas es el del primer fabricante.
3.      La distribución de la demanda (en número de unidades por unidad de
tiempo) de un producto a menudo puede aproximarse con una
distribución de probabilidad Normal. Por ejemplo, una compañía de
comunicación por cable ha determinado que el número de interruptores
terminales de botón solicitados diariamente tiene una distribución
Normal, con una media de 200 y una desviación estándar de 50.
a)      ¿En qué porcentaje de los días la demanda será de menos de
90 interruptores?
b)      ¿En qué porcentaje de los días la demanda estará entre 225 y
275 interruptores?
c)      Con base en consideraciones de costos, la compañía ha
determinado que su mejor estrategia consiste en producir una
cantidad de interruptores suficiente para atender plenamente la
demanda en 94% de todos los días. ¿Cuantos interruptores
terminales deberá producir la compañía cada día?

Solución:
a) X = variable que nos indica el número de interruptores
demandados por día a una compañía de cable

m = 200 interruptores por día


s = 50 interruptores por día

X = 90 m = 200

90  200
z  2.20
50 p(z = - 2.20) = 0.4861

p(x < 90) = 0.5 – p(z = -2.20) = 0.5 – 0.4861 = 0.0139


Por tanto, 0.0139 x 100% = 1.39% de los días se tendrá una
demanda menor de 90 interruptores.

b)

m = 200 X2 = 275
X1 = 225
225  200
z1   0.50
50 p(z1= 0.50) = 0.1915

275  200
z2   1.50
50 p(z2 = 1.50) = 0.4332

p(225£ x ³ 275) = p(z2) – p(z1) = 0.4332 – 0.1915 = 0.2417

Por tanto, 0.2417 x 100% = 24.17% de los días se tendrá una


demanda entre 225 y 275 interruptores.

c)      En este caso se trata de determinar que valor toma x cuando se


pretende cumplir con el 94% de la demanda de todos los días.

Por tanto despejaremos de la fórmula de z;

94%

X=¿
m = 200

Z
x
Z
 ; x = m + zs

x = m + z(p = 0.44)s = 200 + z(p = 0.44)(50) =


= 200 + (1.55)(50) = 277.5 @ 278 interruptores terminales por día

¿cómo se obtiene el valor de z?

En la tabla buscamos la z que corresponde a una probabilidad de


0.44 y nos damos cuenta de que no existe un valor exacto de 0.44
por lo que tomamos los valores de área más cercanos; luego,

z(p = 0.4394) = 1.50; z(p = 0.4406) = 1.60

Por tanto si interpolamos, encontramos que el valor de z para una


probabilidad de 0.44 es de 1.55, y es el valor que se sustituye en la
ecuación.

¿Cuál es la razón de usar un área de 0.44 en lugar de una de 0.94


para buscar en la tabla el valor de z?
Es muy simple, la tabla que estamos usando es una tabla que solo
trabaja con áreas que son definidas de la media hasta el valor de x y
x puede estar tanto del lado derecho de la media, como del lado
izquierdo de la media, es por esto que el área a utilizar es de 0.44
que se encuentra al lado derecho de la media.
 

También podría gustarte