Está en la página 1de 13

UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

TEMA

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD


Contenidos
8.1. Introducción
8.2. Distribución uniforme continua
8.3. Distribución normal (DN)
8.3.1.Generalidades
8.3.2.Propiedades del modelo normal
8.4. Distribución normal tipificada (DNT)
8.4.1.Generalidades
8.4.2.Propiedades de la distribución de probabilidad normal tipificada
8.4.2.1. Funciones de probabilidad de la VAZ
8.4.2.2. Media y varianza de la VAZ
8.4.3. Tablas probabilísticas de la DNT
8.4.4. Aplicaciones de la DNT para el cálculo de probabilidades
8.4.5. Ajustamiento del modelo normal
8.5. Aplicación de la distribución de probabilidades normal tipificada a
variables aleatorias discretas
8.5.1. Corrección por continuidad
8.5.2. Aproximación a la distribución binomial
8.5.3. Aproximación a la distribución de Poisson

8.1. INTRODUCCIÓN
En el capítulo anterior se presentaron algunos modelos específicos para modelar la
distribución de variables aleatorias discretas, caracterizada porque sus posibles valores constituyen un
conjunto finito o infinito contable. Este capítulo estará destinado a las distribuciones continuas de
probabilidad, es decir, cuando los posibles valores de la variable aleatoria pertenecen a un intervalo
completo sobre la recta numérica, de modo que la probabilidad de que la variable aleatoria continua
(VAC) tome un determinado valor es nula , P(X=x)=0. Entre los modelos de probabilidad para variables
aleatorias continuas (VAC) desarrollados, en este curso se hará mención a las siguientes: uniforme,
normal, normal tipificada, exponencial, gamma y otras derivadas como la distribución t de
Student, la F de Snedecor y Ji cuadrado.

Sin embargo este capítulo estará focalizado a los dos primeros de estos modelos
probabilísticos, aunque el énfasis se pondrá en la distribución de probabilidades normal tipificada o
distribución “zeta” que está asociada a un tipo general de variable, la variable Z, por su amplio uso en el
estudio de numerosos fenómenos aleatorios de interés que trascienden al del campo de aplicación de
las carreras de la Facultad de Ciencias Agrarias. El abordaje al estudio será análogo al ya visto para los
modelos de probabilidad de VAD. Se discutirán las propiedades de cada modelo y se aplicarán a una
variada problemática para proporcionar una idea y comprensión suficiente de la utilidad del modelo para
utilizar estos modelos de manera apropiada.

8.2. DISTRIBUCIÓN UNIFORME CONTINUA


Una de las distribuciones continuas más simples, es la distribución uniforme continua. Esta
distribución se caracteriza por una función de densidad que es “plana”, y por ello la probabilidad es
uniforme para cualquiera de los infinitos intervalos cerrados, [a, b], que pueden ser definidos en el
recorrido que tiene la variable. Aunque las aplicaciones del modelo uniforme continuo no son tan
abundantes como acontece con las otras distribuciones que se presentan en este capítulo, se la utilizará
por su sencillez para iniciar el tratamiento de las distribuciones continuas.

Def. 8.1 La función de densidad de la variable aleatoria uniforme continua X en el intervalo [α, β] es
1
f ( x; α , β ) = , α ≤x≤β
β −α

f ( x; α , β ) = 0 para cualquier otro caso

Debido a la naturaleza simple de la función de densidad, el cálculo de probabilidades resulta sencillo.

51
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
A continuación se muestra la representación gráfica de la función de densidad (Fig. 8.1), para
una variable aleatoria uniforme en el intervalo [1,3,] con un valor de ordenada constante igual a = 1/2 .
Se debe notar que esta función forma un rectángulo, con base b-a y altura constante 1/(b-a), de ahí que
a menudo se la llama también distribución rectangular. Su aplicación, se basa en la suposición de
que la probabilidad de caer en un intervalo de longitud fija [a,b] es constante.

f (x)

1
2

x
0 1 3

Figura 8.1 Función de densidad para una variable aleatoria en el intervalo [1,3]

8.3. DISTRIBUCIÓN NORMAL (DN)


8.3.1.Generalidades

La distribución normal o Gausiana1 es indudablemente la más importante y la de mayor uso de


todas las distribuciones de probabilidad. Se la considera la piedra angular para resolver el cálculo de
probabilidades vinculado a cualquier tipo de fenómeno. La distribución normal es de vital importancia en
estadística por tres razones principales:
1º) Numerosos fenómenos naturales, sociales y psicológicos parecen seguirla. Todos
ellos se caracterizan porque los mecanismos subyacentes son desconocidos por la enorme
cantidad de variables incontrolables que los determinan, pero en una gran cantidad de casos se
ha comprobado empíricamente que el modelo normal expresa fielmente el patrón de
comportamiento en masa de observaciones que se corresponden con la suma del efecto de
varias causas independientes entre sí. Algunos ejemplos específicos incluyen datos
meteorológicos tales como la temperatura y la precipitación pluvial, mediciones efectuadas en
organismos vivos (talla y peso), en educación calificaciones en pruebas de actitud, mediciones
físicas , errores de instrumentación y otras desviaciones de las normas establecidas, etc. Sin
embargo, hay que ser cautelosos a la hora de usar dogmáticamente un modelo de probabilidad
normal, dado que su errónea utilización puede llevar a errores muy serios. Es posible que una
distribución normal proporcione de manera razonable una buena aproximación alrededor de la
media de una variable aleatoria; sin embargo, puede resultar inapropiada para valores extremos
que se encuentren en cualquier dirección. Por ejemplo, si se diseña una tela antigranizo para
resistir una cierta cantidad de presión por impactos de granizo, suponiendo que la resistencia se
encuentra distribuida normalmente alrededor de un valor promedio, y el diseño se hace con
base en esta suposición, el material puede llegar a tener un comportamiento muy diferente
frente a valores máximos de presión. Durante el siglo XIX se empleó de manera extensa,
cuando los científicos observaron que los errores, al llevar a cabo mediciones físicas,
frecuentemente seguían un patrón que sugería→ la distribución normal.
2º) se puede utilizar para aproximar varias distribuciones discretas de probabilidad y de
esta manera evitar molestos cálculos (cálculos aproximados de probabilidad).
3º) Proporciona la base para la Inferencia estadística clásica por su relación con el teorema del
límite central, que será desarrollado en el capítulo siguiente.

8.3.2.Propiedades del modelo normal


Si se recuerda al presentar la VAC, se indicó que para representar el modelo matemático de
probabilidad correspondiente se ha adoptado la función de densidad de probabilidad (f.d.p),
representada en forma general por f(x).

Definición 8.1.
Se dice que una variable aleatoria X se encuentra normalmente distribuida con media µ y varianza σ2,
si su función de densidad de probabilidad f(x) o f.d.p., está dada por

1
Esta distribución debe su nombre de “normal” al hecho de que modela el comportamiento de la gran mayoría de
las VAC que interesa estudiar para comprender la naturaleza, y el de “gaussiana” en honor a Johann Carl Friedrich
Gauss (1777-1855), quien fue un matemático, astrónomo y físico alemán que la citó en un artículo que publicó en
1809. Sin embargo el modelo específico o función de densidad de probabilidad de la distribución normal, fue
descubierto por el francés Abraham de Moivre en 1733 como una forma límite de la función de probabilidad
binomial (n→ ∞), posteriormente fue estudiada por Laplace.

52
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

 1  x − µ 2 
−   
1  2  σ  
f ( x) = N ( x; µ , σ ) = e ;
2π σ
Siendo: - ∞ < x< ∞ ; - ∞ < µ < ∞ ; σ > 0
Donde:
e y π son constantes matemáticas (e ≅ 2,71828, π ≅ 3,14159)
µ y σ, son los parámetros de la distribución normal y por tanto en definitiva, quienes determinan en
forma completa la función de densidad de probabilidad. Como se verá posteriormente estos
parámetros son la media y la desviación típica de X, respectivamente.

Siguiendo con la notación introducida para VAD, se puede escribir para la variable aleatoria
normal que X ~ N(x; µ,σ σ). Debe notarse que al ser µ y σ los valores paramétricos, cada vez que se
especifica una combinación particular de µ y σ, se tiene una distribución de probabilidad normal
diferente. Se desprende entonces que el número posible de curvas normales es infinito. Algunos
ejemplos se muestran en el gráfico 8.1, donde en (a) hay tres curvas que tienen diferente centrado pero
su dispersión es idéntica y, lo contrario acontece en (b). Es importante notar con relación a las
propiedades de forma, que en cualquier caso la distribución tiene forma campanular y es simétrica, pero
el tipo de curtosis no es único.
f(x)
f(x)

µ=4 µ=5 µ=6


µ=6

(a) (b)

Gráfico 8.1. Gráficas de la función de densidad normal para diferentes valores de µ y σ.


(a) diferente centrado e idéntica dispersión,(b) idéntico centrado y diferente dispersión

f(x)

Gráfico 8.2. Distribuciones campanulares, con diferentes coeficientes de curtosis

Si se obtienen las dos primeras derivadas de N(x; µ, σ) con respecto a x, y se igualan a cero, se
tiene: 1º) que el valor máximo de N(x; µ , σ) ocurre cuando x =µ y 2º) que los valores de x = µ + σ son
los valores de abscisas que se corresponden con los puntos de inflexión de la curva.

Definición 8.2
La media de una variable aleatoria continua se encuentra definida por:

E(X ) = ∫−∞
x f ( x ) dx
reemplazando f(x) por su igual, se tiene que la media de una distribución de probabilidad
normal es

1 [−( x − µ ) ]dx
∫ xe
2
/ 2σ 2
E( X ) =
2π σ −∞

Definición 8.3
La probabilidad de que una variable aleatoria normalmente distribuida X tome un valor menor o igual
a un valor específico x, está dada por la función de distribución acumulada (f.d.a)

53
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
x
1 [−(t −µ ) ] dt
∫e
2
/ 2σ 2
F ( x) =
2π σ −∞

El siguiente cuadro resume varias propiedades teóricas interesantes de la distribución normal.

Función de densidad de probabilidad Parámetros


 1  x− µ 2  µ ; -∞ < µ < ∞
−   
1  2  σ   σ ; σ > 0
N ( x, µ ,σ ) = e donde - ∞ < x < ∞ -∞ < x < ∞
2πσ
Recorrido
Desviación Recorrido Coeficiente Curtosis
Media varianza interdecílic
media intercuantílico asimetría relativa
o
µ σ2 0,7979 σ 1,35 σ 2,56 σ 0 3

1. La curva normal tiene forma de campana


2. Es simétrica con respecto a la media de distribución, y la media resulta igual a la mediana.
3. El recorrido de la variable es - ∞ < X < ∞ .
4. Cada distribución normal está completamente especificada por su media y desviación típica; existe
una distribución normal diferente para cada combinación de media y desviación típica.
5. El área total bajo la curva normal tiene valor unitario (función de probabilidad)
6. El área bajo la curva, comprendida entre dos puntos a y b, resulta igual a la probabilidad de que una
variable distribuida normalmente tome un valor que pertenezca a ese intervalo.
7. Dado que existe un número ilimitado de valores en el intervalo que va de - ∞ < X < ∞ , la
probabilidad de que una variable aleatoria distribuida con normalidad sea exactamente igual a cualquier
valor puntual es cero. Por lo tanto, las probabilidades para valores puntuales de una VAC son nulas,
siempre hay que asociar la idea de que el valor puntual pertenece a un intervalo de valores [a, b], y
que por ende hay que calcular la probabilidad del intervalo.
8. El área bajo la curva, entre la media y cualquier otro punto, es una función del número de
desviaciones estándar que el punto se encuentra respecto a la media.

En la práctica se observará que, la distribución de los datos de una muestra obtenida a partir de
una población que se supone distribuida normalmente, presenta aspectos que recuerdan a la
distribución campanular (curva en forma de campana):
a) el polígono tiende a tener una apariencia más o menos simétrica.
b) los valores de la media y la mediana ( x , x d ) difieren entre sí.
c) El valor del rango intercuartílico puede diferir ligeramente de 1,33 desviaciones estándar.
d) El recorrido o amplitud no es infinito, sino que por lo general se encontrará que el intervalo
definido por tres desviaciones típicas por encima y por debajo de la media ( x ± 3s), abarca casi al
100% de los valores observados de x. De este modo, se puede establecer la siguiente relación
que resulta útil para tener una estimación rápida de la desviación típica, s ≅ recorrido / 6.

Como un caso pertinente obsérvese la figura 8.3 que representa el histograma de frecuencias
relativas y el polígono para la distribución de frecuencia según los valores del espesor, en pulgadas, de
10,000 arandelas de bronce. Los datos en masa parecen satisfacer las primeras dos propiedades
teóricas de la distribución normal (campanular, simétrica) pero, el recorrido dista mucho de ser infinito.
Físicamente es imposible que la variable aleatoria de interés, el espesor de una arandela, tenga valores
iguales a cero o inferiores, así como que sea exageradamente grande porque estará fuera de
especificación y no se podrá utilizar. Esta situación se da con frecuencia al analizar casos reales.

Tabla 8.1. Espesores de 10.000 arandelas de


bronce fabricadas por una compañía

Gráfico 8.3. Histograma de frecuencias relativas y polígono


54
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
del espesor de 10.000 arandelas de bronce

8.4. DISTRIBUCIÓN NORMAL TIPIFICADA (DNT)


8.4.1.Generalidades

En realidad la distribución normal generalizada es una “familia” de distribuciones infinitamente


grande, hay una para cada combinación posible de la media y la desviación típica. En consecuencia,
será inútil intentar elaborar tablas que satisfagan tantas necesidades como las que tengan los posibles
usuarios. Por otra parte, la fórmula para la distribución normal no es muy adecuada para calcular las
probabilidades frente a cada situación práctica. Existe, sin embargo, una alternativa sencilla que evita
estos problemas.

El problema de trabajar con una familia infinita de distribuciones normales se puede evitar
completamente, utilizando valores relativos en lugar del valores reales. Esto equivale a utilizar como
punto de referencia la media y, la desviación típica como una medida de la desviación del valor de la
variable original respecto al punto de referencia. Este nuevo escalamiento se conoce como Escala Z, o
transformación Z.

Definición 8.4
Se define a la variable aleatoria Z como:
X −µ
Z=
σ

Notar que X es una V.A, y la función de una V.A resulta otra V.A, se tiene que Z es una V.A. cuyos
valores son conocidos como desvíos normales tipificados o simplemente, los desvíos z.

8.4.2.Propiedades de la distribución de probabilidad normal tipificada

Cualquier variable aleatoria normal X puede ser convertida en una variable normal tipificada Z.
Mientras que la variable aleatoria X tiene una media de µ x y desviación típica σx, la variable aleatoria
tipificada Z siempre tendrá una media µz = 0 y una desviación estándar σz = 1. En otras palabras, si
X se encuentra normalmente distribuida con media µ y desviación estándar σ, entonces Z = (x - µ) /σ
también se encuentra normalmente distribuida, pero en este caso con media cero y desviación típica
unitaria.

Definición 8.5.
Al sustituir en la fórmula 7.1. resulta que la función de densidad de probabilidad de una variable
normal típica Z es
2

1 − z2
f ( z;0,1) = e

Luego
P( X ≤ x) ≡ P( Z ≤ z ) y:

Fx ( x; µ , σ ) ≡ Fz ( z;0,1)

Donde Fz (z; 0,1) es la distribución de distribución acumulativa de la función de probabilidad normal


tipificada.

En el Gráfico 8.4 se proporciona la gráfica de la función de distribución para la variable aleatoria


normal tipificada Z

55
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Z
Gráfico 8.4. Función de distribución acumulativa de la normal tipificada Z

En el gráfico 8.5 se muestran comparativamente las funciones f(z) y F(z). Notar que:
a) en el caso de f(z) las probabilidades están dadas en el gráfico por las áreas bajo la curva
normal,
b) en el caso de la F(z) estas probabilidades se encuentran en las ordenadas del gráfico

(a) (b)
Gráfico 8.5. Áreas bajo la f.d.p normal y ordenadas de la f.d.p.a normal

Para saber cómo aplicar la ecuación de transformación (definición 8.4) y usar los resultados, a
continuación se da el problema siguiente: Supóngase que un consultor está estudiando cuanto tiempo
necesitarían los obreros de la fábrica para ensamblar cierta pieza en la planta de automóviles Volvo. A
partir de datos históricos se determinó que el tiempo (en segundos) estaba distribuido normalmente con
una media µx de 75 segundos y una desviación típica σx de 6 segundos. Algunas aplicaciones útiles de
esta información son:

1) Valores de X transformados a valores de Z: de la figura 8.6 se observa que a cada


medición x (dato medido) le corresponde una medición z (desvío normal tipificado), obtenida aplicando la
ecuación de transformación (definición 8.4). Así según la figura 8.6 el tiempo de 81 segundos que
necesita un obrero para completar la tarea equivale a una unidad tipificada, z=1, es decir, se aleja una
desviación típica por encima de la media, puesto que
81 − 75
z= =1
6
Mientras que, los 57 segundos que necesita el obrero para montar la pieza equivale a 3 unidades
tipificadas (es decir, se aleja de la media 3 desviaciones típicas) por debajo de la media porque
57 − 75
z= = −3
6

Gráfico 8.6. Relación entre la escala de una VA distribuida normalmente (X) y, la escala de la VA
normal tipificada (Z)

56
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
El signo del d.n.t.: Obsérvese que los desvíos normales tipificados z tienen signo negativo en el
caso de valores de variable menores que la media, y signo positivo para valores mayores que la media.
Por lo tanto, la desviación típica se ha convertido en la unidad de medición. En otras palabras 81
segundos, es 6 segundos más (una desviación típica, σ = 6) que el tiempo promedio de 75 segundos,
mientras que un tiempo de 57 segundos es 18 segundos menos (es decir, 3 desviaciones típicas, 3σ)
que el tiempo promedio: en el primer caso, el “tiempo de montaje más lento que el promedio”) y, en el
segundo, ese “tiempo es más rápido”.

2) Valores de Z llevados a valores de X: Es necesario también ser capaces de trabajar en


orden inverso, pasando de los valores de d.n.t. a valores reales. Por ejemplo, se quiere saber qué
valor real sería el equivalente de z = +2. Suponiendo que se conoce la media y la desviación típica,
y suponiendo que la distribución es normal, la conversión asume la forma
Valor real = µ + zσ

A continuación se dan algunos ejemplos de lo anterior. Dado X ~ N (x; 20, 1)


Z zσ x = µ + zσ
-3 -3 20 – 3 = 17
-2 -2 20 – 2 = 18
-1 -1 20 – 1 = 19
0 0 20 – 0 = 20
1 1 20 + 1 = 21
2 2 20 + 2 = 22
3 3 20 + 3 = 23

Existe una gran ventaja en pensar y trabajar con valores relativos. En lugar de tener que emplear
una familia ilimitada de distribuciones normales, se puede utilizar una única distribución, la distribución
normal tipificada, para transformar los valores de cualquier VA normal en una sola variable Z. El
resultado de la transformación (zi) indicará a cuántas desviaciones estándar está el valor considerado de
la media de distribución. Esto permite determinar varias probabilidades con base en la curva normal,
mediante el uso de una tabla única de probabilidades.

Dado un intervalo definido por dos valores de zi, las áreas comprendidas entre f(z) y el eje de
abscisas, reciben el nombre de áreas normales. Existen diferentes tablas para hallar el valor de éstas
áreas: algunas consideran intervalos del tipo -∞ < Z < zi, donde zi puede ser +∞ (acumulan áreas hasta
el caso del área total bajo la curva normal tipificada, o sea hasta el valor de probabilidad 1), en tanto en
otras zi puede tomar valores cuando más iguales a cero (acumulan áreas y cuando más considera la
mitad del área bajo la curva normal tipificada, o sea hasta el valor de probabilidad 0,5), y aprovecha la
propiedad de simetría para obtener las otras probabilidades. En nuestro caso, utilizaremos la tabla de
valores de la función de distribución acumulada F(z), que cubre el intervalo -3,5 < Z < 3,5.

Regla empírica de la normal (comparar con Chebychev)

Si una variable está distribuida normalmente, entonces


• el 68,26% de los datos caen dentro de los límites µ±0,674σ (alrededor del 68% de sus
valores quedarán dentro de una desviación típica de la media
• el 95,46% de los datos caen dentro de los límites µ±1,96σ (alrededor del 95,5% caerá
dentro de dos desviaciones típica de la media
• el 99,73% de los datos caen dentro de los límites µ±2,576σ (alrededor del 99% quedarán
dentro de tres desviaciones típicas de la media.
Esta idea se ilustra en el gráfico 8.7. Esto es cierto independientemente de que la media y la
desviación estándar presenten una determinada distribución normal, esto se cumple en el caso de
todas las distribuciones normales.

Gráfico 8.7. Área bajo una curva normal dentro de 1, 2 y 3 desviaciones típicas de la media.
(µ + σ ; µ + 2σ ; µ + 3 σ )

57
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
8.4.3. Tablas probabilísticas de la DNT

La estructura de una tabla típica de la Función de distribución de probabilidades acumuladas,


puede ser la siguiente:
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
.
.
.
0.0 0.5000
.
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998

Es decir, que la tabla se refiere a los valores de la función de distribución (probabilidades


acumuladas) de la variable aleatoria Z, P ( Z ≤ z i ) , es decir que contiene los valores de probabilidad de
que la variable aleatoria tipificada Z tome un valor que sea menor o igual a un z dado. Por ejemplo
P ( Z ≤ 0,0) = 0,50 .

Existen dos formas de utilizarla:


1º caso: interesa averiguar valores de probabilidad. Se entra en la tabla con los valores de d.n.t.,
zi por filas con el valor entero y el primer decimal y el segundo decimal por la columna, y se lee el valor
de probabilidad acumulado hasta ese zi.
z
1
∫ exp(−t
2
P ( Z ≤ z ) = Fz ( z;0;1) = / 2)dt
2π −∞
2º caso: se busca averiguar el valor de un percentil. Se entra con valores de probabilidad
acumulada y se lee el valor de z.

8.4.4. Aplicaciones de la DNT para el cálculo de probabilidades

1º CASO: Sea el ejemplo de la planta de automóviles Volvo. Determinar la probabilidad de que un


obrero seleccionado en forma aleatoria:
a) necesite entre 75 y 81 segundos para terminar la tarea
b) pueda montar la pieza en menos de 75 segundos ó en más de 81
c) pueda montar un pieza de 69 a 81 segundos

a) Dado que la media es de 75 segundos y la desviación típica es 6 segundos, en otras palabras se


está preguntando ¿cuál es la probabilidad de que el tiempo del trabajador se encuentre entre la
media de la planta y una desviación típica por encima de la misma?

1° paso: Usando la ecuación de transformación los valores de la variable original, 75 y 81 segundos,


son transformados a valores de d.n.t., resultando:
z1 = (75-75)/6 y z2 = (75-81)/6, esto es igual a 0 y 1, respectivamente.

2° paso: queda hallar los valores de F(z) correspondientes, y hacer la diferencia


P(75<X<81) = P(0<Z<1) = 0,8413 – 0,5000 = 0,3413

Gráfico 8.8. Determinación de P(75<X<81) = P(0<Z<1)

b) Para determinar la probabilidad de que un obrero ensamble la pieza en menos de 75 segundos o en


más de 81, se puede razonar como sigue: los eventos indicados son mutuamente excluyentes, por lo
tanto:
P(X<75 ó X>81) = P(Z<0 ó Z>1) = 0,5000 + 0,1587 = 0,6587

O bien por el teorema del evento complementario esa probabilidad, la probabilidad buscada se
calcula, a partir del resultado obtenido en a) como
P(X<75 ó X>81) = P(Z<0 ó Z>1) = 1 – 0,3413 = 0,6587
58
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Gráfico 8.9. Determinación de P(X<75 ó X>81)

c) En este último caso, se pide determinar la probabilidad de que un obrero aleatoriamente


seleccionado pueda terminar la pieza de 69 a 81 segundos, es decir, P(69 ≤ x ≤ 81). En la figura se
observa que uno de los valores de interés está por encima del tiempo de montaje medio de 75
segundos, mientras que el otro valor está por debajo de él. Puesto que la fórmula de transformación
(8.3) solo permite determinar probabilidades desde un valor de interés hasta la media, se puede
obtener la probabilidad deseada en tres pasos:

1º) Determinar la probabilidad desde la media hasta 81 segundos.


2º) Determinar la probabilidad desde la media hasta 69 segundos.
3º) Sumar los dos resultados mutuamente excluyentes. Esto es :

P(69 ≤ x ≤ 81)= P(- 1 ≤ z ≤ 1)= 0,3413 + 0,3413 = 0,6826

x − µx x − µx
z= = −1.00 z= = +1.00
σx σx

Gráfico 8.10. Determinación de P(69 ≤ X ≤ 81)

Se supondrá ahora que el consultor llevó a cabo el mismo estudio de tiempos y movimientos en
una planta de automóviles BMW, donde los obreros estaban entrenados para montar la pieza mediante
un método diferente y usando equipo diferente. Se considerará que en esta planta se determinó que el
tiempo para realizar la tarea estaba distribuido normalmente con una media µ x de 60 segundos y
desviación estándar σx de 3 segundos. En la figura 8.11 se observa que, independientemente del valor
de µx y σx, se llega a una distribución de Z (la distribución normal tipificada es única).

Procedimiento general para hallar la probabilidad de un intervalo P(x1 < X < x2)
(xi − µ x )
1°) Calcular los valores de z como z i =
σx
2°) Obtener las probabilidades F(zi) en la tabla

3°) Hacer la diferencia P(z1 < Z < z2 ) = F(z2) – F(z1)

X ∼ N(x; 60, 3)

X ∼ N(x; 75, 62)

Z ∼ N(z; 0, 1)

Gráfico 8.11
59
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

2° CASO: La demanda mensual de cierto producto alimenticio se encuentra aproximada por una variable
aleatoria normal con media de 200 y desviación estándar igual a 40 unidades. ¿Qué tan grande debe ser
el intervalo disponible a principio de un mes para que la probabilidad de que la existencia se agote no
sea mayor de 0,05?

De la información dada se tiene que: X ∼ N(x;200 , 40) ; es decir que “la VA se distribuye normalmente
con µ=200 y σ2 = 402 ”

Lo que se desea obtener es el valor del percentil 95, esto es x0,95, para el nivel de inventario a
principio del mes, de manera tal que la probabilidad de que la demanda exceda a x0,95 (existencias
agotadas) no sea mayor de 0,05.
P(X > x0,95 ) = 0.05
P(X > x0,95 ) = 0.95
De lo anterior se sigue que:
P[Z ≤ (x0.95 – 200/ 40] = 0.95 o
P(Z ≤ z0.95 ) = Fz (z0.95 ;0, 1) = 0.95

Donde z0.95 = (x0.95 – 200)/40 es el valor cuantil correspondiente a la variable aleatoria normal
estándar. Para obtener z0.95 de la tabla D, primero se busca la probabilidad más cercana a 0.95. Una vez
que se encuentra ese valor, se toma los correspondientes valores del renglón y la columna y se interpola
para encontrar el valor deseado de z0.95 . Por ejemplo, z0.95 tiene un valor aproximado de 1.645 y dado
que z0.95 = (x0.95 – 200)/40, z0.95 tiene un valor de 265.8. Esto significa que el intervalo a principio de cada
mes no debe ser menor de 266 unidades para que la probabilidad de agotar las existencias no sea
mayor de 0.05.

8.4.5. Ajustamiento del modelo normal

Ejemplo 8.1. La primera columna de la tabla 8.2. Contiene los intervalos de respuestas correctas para la
prueba de matemáticas (SAT); la segunda columna, el correspondiente número de calificaciones
observadas para el período 1998-1999, la tercera columna, las frecuencias relativas, las restantes,
información con respecto a si las calificaciones para la prueba de matemáticas obtenida por hombres
estaba distribuida normalmente con media 491 y desviación estándar igual a 120.

Mientras que, de manera aparente, existe una similitud entre las frecuencias teóricas y las
observadas, queda aún por contestar la pregunta acerca de cuándo puede rechazarse o no (consulte
Inferencia, prueba de bondad de ajuste) la hipótesis de que las calificaciones de la prueba de
matemáticas se distribuyeron normalmente con media 491 y desviación estándar igual a 120. Como se
mencionó, siempre es importante verificar lo que ocurre en los extremos de la distribución observada.
Por ejemplo, se sabe que para la prueba de matemáticas es imposible obtener calificaciones para los
eventos X < 200 y X > 800. Sin embargo, si X ∼ N (x;491, 120), las correspondientes probabilidades
son
P( X < 200) = 0.0075 y P(X > 800) = 0.005.

Tabla 8.2. Calificaciones obtenidas en la prueba de matemáticas (SAT) por los estudiantes del tercer año en el
ciclo 1998-1997.
Número de
Frecuencia Probabilidad Función de Número
respuestas Número de Intervalo normal
relativa del intervalo distribución esperado
correctas exámenes estándar
<200 0 0,0000 (-∞ - -2,425) 0,0076 0,0076 3634,27
(200 – 249) 3423 0,0072 (-2,425 - -2,01) 0,0146 0,0222 6981,62
(250 – 299) 18434 0,0385 (-2,01 - -1,59) 0,0337 0,0559 16115,18
(300 – 349) 39913 0,0835 (-1,59 - -1,18) 0,0631 0,1190 30173,98
(350 – 399) 51603 0,1079 (-1,18 - -0,76) 0,1046 0,2236 50018,90
(400 – 449) 61691 0,1290 (-0,76 - -0,34) 0,1433 0,3669 68525,18
(450 – 499) 72186 0,1510 (-0,34 - 0,075) 0,1630 0,5299 77945,49
(500 – 549) 72814 0,1523 (0,075 - 0,49) 0,1580 0,6879 75554,49
(550 – 599) 58304 0,1219 (0,49 - 0,91) 0,1307 0,8186 62499,81
(600 – 649) 46910 0,0981 (0,91 - 1,325) 0,0888 0,9074 42463,54
(650 – 699) 30265 0,0633 (1,325 - 1,74) 0,0517 0,9591 24772,78
(700 – 749) 16246 0,0340 (1,74 - 2,16) 0,0255 0,9846 12193,92
(750 – 800) 6414 0,0134 (2,16 - 2,575) 0,0104 0,9950 4973,21
>800 0 0,0000 (2,575 - ∞) 0,0050 1,0000 2390,97
Totales 478193 1,0000 0,9874 478193,00

60
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

8.5. LA DISTRIBUCIÓN NORMAL COMO APROXIMACIÓN DE DIVERSAS


DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
8.5.1. Corrección por continuidad

En la sección anterior se demostró la importancia de la función de densidad de probabilidad


normal debido a los numerosos fenómenos que parecen seguirla o cuyas distribuciones se pueden
aproximar mediante ella. En esta sección se demostrará otro aspecto importante de la distribución
normal, como se puede usar para aproximar varias funciones de distribución de probabilidad discretas
importantes como son : binomial, hipergeométrica y Poisson.

Necesidades de la corrección para el ajuste por continuidad (o corrección de medio intervalo, + 0,5)

Hay dos razones importantes para utilizar aquí corrección para el ajuste por continuidad.
1º) Recuerde que una variable aleatoria discreta sólo puede tener valores específicos, mientras
que una variable aleatoria continua, usada para aproximarla, puede tener cualquier valor dentro de un
intervalo en torno a esos valores específicos. Por lo tanto, cuando se utiliza la distribución normal para
obtener valores aproximados de probabilidad a los que dan las funciones de distribución discreta
(binomial, Poisson), es más probable que se obtengan mejores aproximaciones si se utiliza la corrección
para el ajuste por continuidad.

2º) Recuerde que en una distribución continua (como la normal), la probabilidad de obtener un
valor en particular de una variable aleatoria es cero. Por otra parte, cuando se usa la distribución normal
para aproximar una distribución discreta se puede emplear la corrección para el ajuste por falta de
continuidad con el fin de aproximar la probabilidad de un valor específico de la distribución discreta.

Ejemplo 8.2. Considere un experimento en el cual se lanza al aire 12 veces una moneda y se observa el
número de caras. Se desea calcular la probabilidad de obtener exactamente 4 caras.
La idea de que una VAC se puede utilizar para obtener valores aproximados de probabilidad se
demuestra con la escala que se presenta a continuación.

x
2.5 3 3.5 4 4.5 5 5.5

El punto medio del intervalo creado es el valor x, en este caso x=4 → P(3,5 < X < 4,5)
La corrección para el ajuste por falta de continuidad requiere sumar o restar 0,5 al valor o
valores de la variable aleatoria discreta X, según sea necesario. Por lo tanto, para usar la distribución
normal para aproximar la probabilidad de obtener exactamente 4 caras (es decir, X=4), se determinaría
el área bajo la curva normal desde X=3,5 hasta X=4,5, los límites inferior y superior de 4. Más aún, para
determinar la probabilidad aproximada de observar por lo menos 4 caras, se encontraría el área bajo la
curva normal desde X=4,5 y por debajo, puesto que, en un intervalo, 4,5 es el límite superior de X.
Cuando se utiliza la distribución normal para aproximar funciones de distribución de probabilidad
discreta de nuevo se observa que la semántica es importante. Para determinar la probabilidad
aproximada de observar menos de 4 caras, ser debe encontrar el área bajo la curva normal desde X=3,5
y por debajo; para determinar la probabilidad aproximada de observar desde 4 más de 4 caras, se debe
encontrar el área bajo la curva normal desde X=4,5 y por encima; y para determinar la probabilidad
aproximada de observar desde 4 hasta 7 caras, se debe encontrar el área bajo la curva normal desde
X=3,5 hasta X=7,5.

8.5.2. Aproximación a la distribución binomial

Anteriormente se dijo que al distribución binomial será simétrica (al igual que la distribución
normal) siempre que ¶= 0,5. Cuando ¶≠0,5 la distribución binomial no será simétrica. Sin embargo,
mientras más cerca se encuentre ¶ de 0,5 y mayor sea el número de observaciones de muestra n, la
distribución se vuelve más simétrica.

Por otra parte, mientras mayor sea el número de observaciones en la muestra, resulta más
tedioso calcular las probabilidades de éxito exactas mediante el uso de la fórmula binomial.
Afortunadamente, como la muestra es grande se puede utilizar la distribución normal para aproximar las
probabilidades de éxito exactas que, de lo contrario, se tendrían que obtener mediante complejos
cálculos.

Como regla práctica, esta aproximación normal se puede usar cada vez que se cumplan las
dos condiciones siguientes:

1. El producto de los dos parámetros c y π es igual o excede a 5.


2. El producto c.(1 –π) es igual o excede a 5.

61
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

Recuerde que la media y la desviación típica de la distribución binomial se obtiene mediante


µx = cπ y σ x = cπ (1 − π )
Al sustituir el la fórmula
x − cπ
z=
cπ (1 − π )

Por lo que, una n suficientemente grande, la variable aleatoria z sigue una distribución en forma
aproximadamente normal.
Por consiguiente, para encontrar las probabilidades aproximadas correspondientes a los
valores de la variable aleatoria discreta X se tiene

xα − cπ
z=
cπ (1 − π )

Ejemplo 8.3. Para demostrar lo anterior, suponemos que en el control de calidad de la elaboración de
latas para conserva se obtiene en forma aleatoria una muestra de n=1.600 latas de un proceso
constante de producción en el cual el 8% de las latas producidas son defectuosas. ¿Cuál es la
probabilidad de que en una muestra así haya no más de 150 latas defectuosas?
Bajo la distribución binomial la probabilidad de obtener no más de 150 latas defectuosas consiste
de todos los eventos, incluyendo 150 defectuosas, es decir,
P(X ≤ 150 )= P(X=0) + P(X =1)+ ...+ P(X =150)
Y la probabilidad real se puede calcular laboriosamente a partir de
1.600 
150

x =0 
∑ 
x 
(0,08) x (0,92)1.600− x

puesto que tanto cπ = (1.600)(0,08) =128, como c(1 –π) = (1.600)(0,92) = 1.472 son mayores que 5, se
puede usar la distribución normal para aproximar la binomial:
xα − cπ 150.5 − 128 22,5
z= = = = +2.07
cπ (1 − π ) (1.600)(0,08)(0,92) 10,5

En este caso, xα , el número ajustado de éxitos, es de 150,5, por lo tanto la probabilidad


aproximada de que X no exceda a este valor corresponde, en la escala Z estandarizada, a un valor de
no más de + 2,07. En la figura 8.12 se muestra:

P(X ≤ 150,5) = P(Z ≤ 2,07) = 0,9808

Área = 0,9808

Gráfico 8.12. Aproximación de la distribución binomial.

Obtención de una aproximación de probabilidad para un valor individual

Suponga que ahora se desea calcular la probabilidad de obtener exactamente 150 latas
defectuosas.
P (149,5 ≤ X ≤ 150,5) =
P (1,98 ≤ Z ≤ 2,07 ) =
F ( z = 2,07 ) − F ( z = 1,98 ) =
0,9808 − 0,9761 = 0,0047

Gráfico 8.13. Aproximación de una probabilidad binomial exacta.

62
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
8.5.3. Aproximación a la distribución de Poisson

La distribución normal también se puede utilizar para aproximar el modelo de Poisson, siempre
que el λ, el número esperado de éxitos, iguale o exceda a 5. Puesto que le valor de la media y la
varianza de una distribución de Poisson son iguales, se tiene
µx = λ y σx = λ
al sustituir,
x−λ
z=
λ
por lo que, para una n suficientemente grande, la variable aleatoria z tiene una distribución
aproximadamente normal.

Por lo tanto, para determinar las probabilidades aproximadas que corresponden a los valores de
la variable aleatoria discreta X se tiene

( xα − λ )
z=
λ
donde λ= número de éxitos esperados o media de la distribución de Poisson
σx= desviación de la distribución de Poisson.
xα= número ajustado de éxitos, x, para la variable aleatoria discreta X, de modo que
xα=x–0.5 o xα = x + 0.5, según se necesite.
Las probabilidades aproximadas de éxito se obtienen de la tabla de áreas normales, aplicando el
criterio de continuidad.

63
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012

También podría gustarte