Está en la página 1de 15

DISTRIBUCIÓN NORMAL O CAMPANA DE GAUSS-LAPLACE

Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su
extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a
parecerse en su comportamiento a esta distribución.

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de
campana.

En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de  p  y valores
de  n  cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una curva en "forma de
campana".

En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables
asociadas a fenómenos naturales que siguen el modelo de la normal

 Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p.ejm. tallas,
pesos, envergaduras, diámetros, perímetros,...
 Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma
cantidad de abono.
 Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos,
puntuaciones de examen.
 Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio,...
 Errores cometidos al medir ciertas magnitudes.
 Valores estadísticos muestrales, por ejemplo : la media.
 Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ...
 Y en general cualquier característica que se obtenga como suma de muchos factores. 

FUNCIÓN DE DENSIDAD

Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de densidad que
corresponde a tales distribuciones viene dado por la fórmula

Representación gráfica de esta función de densidad 


La distribución normal queda definida por dos parámetros, su media y su desviación típica y la representamos
así 

FUNCIÓN DE DISTRIBUCIÓN

 Puede tomar cualquier valor (- ¥, + ¥)


 Son más probables los valores cercanos a uno central que llamamos media  m
 Conforme nos separamos de ese valor m , la probabilidad va decreciendo de igual forma a derecha e
izquierda (es simétrica).
 Conforme nos separamos de ese valor m, la probabilidad va decreciendo de forma más o menos rápida
dependiendo de un parámetro s , que es la desviación típica.

 
F(x) es el área sombreada de esta gráfica

 
TIPIFICACIÓN

Por tanto su función de densidad es

y su función de distribución es

siendo la representación gráfica de esta función

a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal


tipificada.

Característica de la distribución normal tipificada (reducida, estándar)

 No depende de ningún parámetro


 Su media es 0, su varianza es 1 y su desviación típica es 1.
 La curva  f(x)  es simétrica respecto del eje OY
 Tiene un máximo en este eje
 Tiene dos puntos de inflexión en  z =1 y  z = -1

Aproximación de la Binomial por la Normal (Teorema de De Moivre) :

Demostró que bajo determinadas condiciones (para n grande y tanto p como q no estén próximos a cero) la
distribución Binomial  B(n, p) se puede aproximar mediante una distribución normal

Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto más próximo sea   p  a  0.5, tanto mejor
será la aproximación realizada. Es decir, basta con que se verifique

gracias a esta aproximación es fácil hallar probabilidades binomiales, que para valores grandes de  n  resulten
muy laboriosos de calcular.

Hay que tener en cuenta que para realizar correctamente esta transformación de una variable discreta
(binomial) en una variable continua (normal) es necesario hacer una corrección de continuidad.
 

MANEJO DE TABLAS. CASOS MÁS FRECUENTES.

La distribución de la variable  Z  se encuentra tabulada

 
 

DISTRIBUCIÓN DE POISSON

Para entender la Distribución de Poisson, vamos analizar un ejemplo


detenidamente. Supongamos que se tiene una tabla rectangular de madera, de 1
metro por 1 metro, pintada con un recubrimiento sobre cuya superficie se
presentan aleatoriamente pequeños defectos. Estos defectos podrían ser por
ejemplo partículas muy pequeñas de pigmento que no fueron bien molidas al
fabricar la pintura. Se desea calcular la probabilidad de que aparezcan estos
defectos y para ello podríamos subdividir la superficie en zonas rectangulares mas
pequeñas y de igual tamaño:

Tenemos la superficie dividid en 4 zonas rectangulares de igual tamaño.


Observamos que en algunas zonas aparece un defecto superficial y en otras no.
Vamos a hacer las siguientes suposiciones:

 En cada zona sólo puede aparecer 1 defecto.


 Si la probabilidad de que aparezca un defecto en todo el área es p, la
probabilidad de que aparezca un defecto en una zona es p/4.

Entonces, utilizando la Distribución Binomial podemos calcular la probabilidad de


que en nuestra superficie aparezcan 0, 1, 2, 3, 4 defectos:
El promedio de defectos en la superficie total será:

Pero sabemos que en realidad en cada zona podrían aparecer más de 1 defecto.
Esto hace inexacto nuestro cálculo. Podríamos hacer el cálculo más exacto si
subdividimos las zonas:

Dividimos cada zona en 4 y ahora tenemos 16 zonas. La probabilidad de tener 1


defecto en una zona es p/16 con lo que podemos entonces calcular la probabilidad
de tener 0, 1, 2, 3, ...., 16 defectos en el área total:

Y el promedio de defectos en la superficie resulta ser el mismo que antes: 

Aún así podrían aparecer más defectos por zona, por lo que si dividimos
nuevamente cada zona en 4 tendríamos 64 zonas y ahora la probabilidad de tener
1 defecto en una zona sería p/64

La probabilidad de tener 0, 1, 2, 3, ....., 64 defectos en la superficie total sería:

Y nuevamente el promedio de defectos en la superficie es p.


Lo que estamos haciendo es ir aumentando n al mismo tiempo que disminuye p en
igual proporción y de ese modo, el promedio de defectos en la superficie
total n.p se mantiene constante. Como vimos, al suponer que en cada subzona
sólo puede haber 1 defecto o ningún defecto estamos cometiendo un error. Este
error se hace cada vez menor, porque a medida que subdividimos el area total se
hace menos probable que en una subzona aparezca más de un defecto. Si
continuamos subdividiendo el área indefinidamente, la fórmula binomial nos dará la
probabilidad de obtener 0, 1, 2, 3, ... n defectos, con n tendiendo a infinito.

En el límite, la fórmula binomial tiende a la fórmula de Poisson:

donde x es la variable aleatoria y  el parámetro de la distribución de Poisson. En


el límite, el producto de n por p, , es igual al parámetro de la distribución:   

El número de defectos x en la superficie total es una variable aleatoria discreta que


puede tomar valores 0, 1, 2, 3, 4, ... y cuya distribución de probabilidades se
conoce como Distribución de Poisson.

Se puede observar que la curva de la función de Poisson es asimétrica, como la


binomial. El promedio y la varianza de esta variable aleatoria son iguales al
parámetro de la distribución:

Por lo que, la desviación standard es:


La distribución de Poisson tiene una propiedad cuyas consecuencias son muy
importantes para el Control Estadístico de Procesos. Supongamos que se
tienen m variables aleatorias de Poisson:

Si w es una combinación lineal de tales variables:

Entonces w es una variable aleatoria de Poisson con parámetro:

Esto es muy importante porque podemos imaginar el producto fabricado por un


proceso (Una licuadora, una computadora, un televisor, etc.) como una superficie
en la que se pueden producir múltiples defectos, y donde el número de cada tipo
de defecto es una variable aleatoria de Poisson. Entonces, la propiedad
mencionada nos permite tratar la suma de todos los tipos de defectos como una
variable aleatoria de Poisson. Esto se utiliza para el control del Número de
Defectos en un producto (Gráficos C).

Supongamos ahora que tenemos un gran lote de artefactos, por ejemplo


licuadoras. Tomamos una muestra de m = 5 unidades y medimos el número total
de defectos en las 5 unidades. Si obtuvimos x 1, x2, x3, ... xm defectos en cada
unidad, el número total de defectos será:

El número promedio de defectos por unidad será:

y es una variable aleatoria discreta que puede tomar valores 0, 1/m, 2/m, 3/m, ...
etc.
¿Cuál es la varianza de y?

La varianza de xi es  cualquiera que sea el subindice i, porque todas las x i tienen


la misma distribución; por lo tanto:

Este es un importante resultado que se utilizará para calcular la varianza en los


Gráficos U.

DISTRIBUCION JI-CUADRADA (X2)

En realidad la distribución ji-cuadrada es la distribución muestral de s 2. O sea que si se extraen todas


las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la
distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X 2. Si

se elige una muestra de tamaño n de una población normal con varianza  , el estadístico:

tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de libertad y


se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por:

donde n es el tamaño de la muestra, s2 la varianza muestral y   la varianza de la población de donde
se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente expresión:

Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 son mayores o iguales que 0.


2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número infinito
de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha;
esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).

La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) =
(gl-2).

La función de densidad de la distribución X2 esta dada por:

para x>0

La tabla que se utilizará para estos apuntes es la del libro de probabilidad y estadística de Walpole, la
cual da valores críticos   (gl) para veinte valores especiales de  . Para denotar el valor crítico de
2
una distribución X  con gl grados de libertad se usa el símbolo   (gl); este valor crítico determina a
2
su derecha un área de   bajo la curva X  y sobre el eje horizontal. Por ejemplo para encontrar
2
X 0.05(6) en la tabla se localiza 6 gl en el lado izquierdo y  a o largo del lado superior de la
misma tabla.

Cálculo de Probabilidad

El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber como se va a
comportar la varianza o desviación estándar en una muestra que proviene de una distribución normal.
Estimación de la Varianza

Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.

Al despejar esta fórmula la varianza poblacional nos queda:

Los valores de X2 dependerán de nivel de confianza que se quiera al cual le llamamos  . Si nos
ubicamos en la gráfica se tiene:

Ensayo de Hipótesis para la Varianza de una Población Normal

En la mayoría de los casos se tiene el problema de desconocer la varianza o desviación estándar de la


población, en donde las distribuciones son normales. Si se desea probar una hipótesis acerca de la
varianza se puede hacer utilizando las medidas estadísticas con las que se construyó el intervalo de

confianza  , esto es con la distribución Ji- cuadrada.

Error tipo II ó 

El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán
algunos ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la
tabla de la distribución Ji-cuadrada.

DISTRIBUCIÓN GEOMÉTRICA O DE PASCAL

    La distribución geométrica es un modelo adecuado para aquellos procesos en los que se repiten
pruebas hasta la consecución del éxito a resultado deseado y tiene interesantes aplicaciones en los
muestreos realizados de esta manera . También implica la existencia de una dicotomía de posibles
resultados y la independencia de las pruebas entre sí.
Proceso experimental del que se puede hacer derivar

Esta distribución se puede hacer derivar de un proceso experimental puro o de Bernouilli en el que
tengamos las siguientes características

· El proceso consta de un número no definido de pruebas o experimentos separados o separables. El


proceso concluirá cuando se obtenga por primera vez el resultado deseado (éxito).

· Cada prueba puede dar dos resultados mutuamente excluyentes : A y no A

· La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un resultado no A es q 


siendo (p + q = 1).

Las probabilidades p y q son constantes en todas las pruebas ,por tanto , las pruebas ,son
independientes (si se trata de un proceso de "extracción" éste se llevará a , cabo con devolución del
individuo extraído) .

· (Derivación de la distribución). Si en estas circunstancias aleatorizamos de forma que tomemos como


variable aleatoria X = el número de pruebas necesarias para obtener por primera vez un éxito o
resultado A , esta variable se distribuirá con una distribución geométrica de parámetro p.

                                                                                           

Obtención de la función de cuantía

    De lo dicho anteriormente , tendremos que la variable X es el número de pruebas necesarias para la
consecución del primer éxito. De esta forma la variables aleatoria toma valores enteros a partir del
uno ;í 1,2,………ý

    La función de cuantía P(x) hará corresponder a cada valor de X la probabilidad de obtener el primer
éxito precisamente en la X-sima prueba. Esto es , P(X) será la probabilidad del suceso obtener X-1
resultados "no A" y un éxito o resultado A en la prueba número X teniendo en cuenta que todas las
pruebas son independientes y que conocemos sus probabilidades tendremos:

                          
dado que se trata de sucesos independientes y conocemos las probabilidades

                                             

                                                luego la función de cuantía quedaría 


 

            Algunos autores consideran la


aleatorización como "número de pruebas
anteriores al primer éxito". De esta manera el
conseguir el éxito a la primera sería X=0 . En la
siguiente representación gráfica de la función de
cuantía de la geométrica puede apreciarse este
tipo de aleatorización , sin embargo nosotros
preferimos , por razones prácticas, utilizar la
aleatorización antes comentada

Función de distribución

        En base a la función de cuantía se puede expresar la función de distribución de la siguiente


manera. 

                                              desarrollando la expresión tendríamos

                           de donde          

La Función Generatriz de Momentos (F.G.M.) quedaría:

                                          

                                            

                          

por  lo que queda establecida que la F.G.M. tiene la expresión        


En base a la FGM podemos obtener la media y varianza:

Así                    

                              Haciendo t =0 tendríamos que            

        La varianza sería      

                                     

Haciendo t =0 tendríamos que 

                 De esta manera                

                                                               Luego 

    La moda es el valor de la variable que tiene asociada mayor probabilidad el valor de su función de
cuantía es el mayor. Es fácil comprobar (véase simplemente la representación gráfica anterior)
que   .Por lo tanto la media de la distribución geométrica es siempre 1.

En cuanto a la mediana Me será aquel valor de la variable en el cual la función de distribución toma el valor
0,5. Así

                                                        

                                por lo que 

También podría gustarte