Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEMA
8.1. INTRODUCCIÓN
En el capítulo anterior se presentaron algunos modelos específicos para modelar la
distribución de variables aleatorias discretas, caracterizada porque sus posibles valores constituyen un
conjunto finito o infinito contable. Este capítulo estará destinado a las distribuciones continuas de
probabilidad, es decir, cuando los posibles valores de la variable aleatoria pertenecen a un intervalo
completo sobre la recta numérica, de modo que la probabilidad de que la variable aleatoria continua
(VAC) tome un determinado valor es nula , P(X=x)=0. Entre los modelos de probabilidad para variables
aleatorias continuas (VAC) desarrollados, en este curso se hará mención a las siguientes: uniforme,
normal, normal tipificada, exponencial, gamma y otras derivadas como la distribución t de
Student, la F de Snedecor y Ji cuadrado.
Sin embargo este capítulo estará focalizado a los dos primeros de estos modelos
probabilísticos, aunque el énfasis se pondrá en la distribución de probabilidades normal tipificada o
distribución “zeta” que está asociada a un tipo general de variable, la variable Z, por su amplio uso en el
estudio de numerosos fenómenos aleatorios de interés que trascienden al del campo de aplicación de
las carreras de la Facultad de Ciencias Agrarias. El abordaje al estudio será análogo al ya visto para los
modelos de probabilidad de VAD. Se discutirán las propiedades de cada modelo y se aplicarán a una
variada problemática para proporcionar una idea y comprensión suficiente de la utilidad del modelo para
utilizar estos modelos de manera apropiada.
Def. 8.1 La función de densidad de la variable aleatoria uniforme continua X en el intervalo [α, β] es
1
f ( x; α , β ) = , α ≤x≤β
β −α
51
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
A continuación se muestra la representación gráfica de la función de densidad (Fig. 8.1), para
una variable aleatoria uniforme en el intervalo [1,3,] con un valor de ordenada constante igual a = 1/2 .
Se debe notar que esta función forma un rectángulo, con base b-a y altura constante 1/(b-a), de ahí que
a menudo se la llama también distribución rectangular. Su aplicación, se basa en la suposición de
que la probabilidad de caer en un intervalo de longitud fija [a,b] es constante.
f (x)
1
2
x
0 1 3
Figura 8.1 Función de densidad para una variable aleatoria en el intervalo [1,3]
Definición 8.1.
Se dice que una variable aleatoria X se encuentra normalmente distribuida con media µ y varianza σ2,
si su función de densidad de probabilidad f(x) o f.d.p., está dada por
1
Esta distribución debe su nombre de “normal” al hecho de que modela el comportamiento de la gran mayoría de
las VAC que interesa estudiar para comprender la naturaleza, y el de “gaussiana” en honor a Johann Carl Friedrich
Gauss (1777-1855), quien fue un matemático, astrónomo y físico alemán que la citó en un artículo que publicó en
1809. Sin embargo el modelo específico o función de densidad de probabilidad de la distribución normal, fue
descubierto por el francés Abraham de Moivre en 1733 como una forma límite de la función de probabilidad
binomial (n→ ∞), posteriormente fue estudiada por Laplace.
52
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
1 x − µ 2
−
1 2 σ
f ( x) = N ( x; µ , σ ) = e ;
2π σ
Siendo: - ∞ < x< ∞ ; - ∞ < µ < ∞ ; σ > 0
Donde:
e y π son constantes matemáticas (e ≅ 2,71828, π ≅ 3,14159)
µ y σ, son los parámetros de la distribución normal y por tanto en definitiva, quienes determinan en
forma completa la función de densidad de probabilidad. Como se verá posteriormente estos
parámetros son la media y la desviación típica de X, respectivamente.
Siguiendo con la notación introducida para VAD, se puede escribir para la variable aleatoria
normal que X ~ N(x; µ,σ σ). Debe notarse que al ser µ y σ los valores paramétricos, cada vez que se
especifica una combinación particular de µ y σ, se tiene una distribución de probabilidad normal
diferente. Se desprende entonces que el número posible de curvas normales es infinito. Algunos
ejemplos se muestran en el gráfico 8.1, donde en (a) hay tres curvas que tienen diferente centrado pero
su dispersión es idéntica y, lo contrario acontece en (b). Es importante notar con relación a las
propiedades de forma, que en cualquier caso la distribución tiene forma campanular y es simétrica, pero
el tipo de curtosis no es único.
f(x)
f(x)
(a) (b)
f(x)
Si se obtienen las dos primeras derivadas de N(x; µ, σ) con respecto a x, y se igualan a cero, se
tiene: 1º) que el valor máximo de N(x; µ , σ) ocurre cuando x =µ y 2º) que los valores de x = µ + σ son
los valores de abscisas que se corresponden con los puntos de inflexión de la curva.
Definición 8.2
La media de una variable aleatoria continua se encuentra definida por:
∞
E(X ) = ∫−∞
x f ( x ) dx
reemplazando f(x) por su igual, se tiene que la media de una distribución de probabilidad
normal es
∞
1 [−( x − µ ) ]dx
∫ xe
2
/ 2σ 2
E( X ) =
2π σ −∞
Definición 8.3
La probabilidad de que una variable aleatoria normalmente distribuida X tome un valor menor o igual
a un valor específico x, está dada por la función de distribución acumulada (f.d.a)
53
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
x
1 [−(t −µ ) ] dt
∫e
2
/ 2σ 2
F ( x) =
2π σ −∞
En la práctica se observará que, la distribución de los datos de una muestra obtenida a partir de
una población que se supone distribuida normalmente, presenta aspectos que recuerdan a la
distribución campanular (curva en forma de campana):
a) el polígono tiende a tener una apariencia más o menos simétrica.
b) los valores de la media y la mediana ( x , x d ) difieren entre sí.
c) El valor del rango intercuartílico puede diferir ligeramente de 1,33 desviaciones estándar.
d) El recorrido o amplitud no es infinito, sino que por lo general se encontrará que el intervalo
definido por tres desviaciones típicas por encima y por debajo de la media ( x ± 3s), abarca casi al
100% de los valores observados de x. De este modo, se puede establecer la siguiente relación
que resulta útil para tener una estimación rápida de la desviación típica, s ≅ recorrido / 6.
Como un caso pertinente obsérvese la figura 8.3 que representa el histograma de frecuencias
relativas y el polígono para la distribución de frecuencia según los valores del espesor, en pulgadas, de
10,000 arandelas de bronce. Los datos en masa parecen satisfacer las primeras dos propiedades
teóricas de la distribución normal (campanular, simétrica) pero, el recorrido dista mucho de ser infinito.
Físicamente es imposible que la variable aleatoria de interés, el espesor de una arandela, tenga valores
iguales a cero o inferiores, así como que sea exageradamente grande porque estará fuera de
especificación y no se podrá utilizar. Esta situación se da con frecuencia al analizar casos reales.
El problema de trabajar con una familia infinita de distribuciones normales se puede evitar
completamente, utilizando valores relativos en lugar del valores reales. Esto equivale a utilizar como
punto de referencia la media y, la desviación típica como una medida de la desviación del valor de la
variable original respecto al punto de referencia. Este nuevo escalamiento se conoce como Escala Z, o
transformación Z.
Definición 8.4
Se define a la variable aleatoria Z como:
X −µ
Z=
σ
Notar que X es una V.A, y la función de una V.A resulta otra V.A, se tiene que Z es una V.A. cuyos
valores son conocidos como desvíos normales tipificados o simplemente, los desvíos z.
Cualquier variable aleatoria normal X puede ser convertida en una variable normal tipificada Z.
Mientras que la variable aleatoria X tiene una media de µ x y desviación típica σx, la variable aleatoria
tipificada Z siempre tendrá una media µz = 0 y una desviación estándar σz = 1. En otras palabras, si
X se encuentra normalmente distribuida con media µ y desviación estándar σ, entonces Z = (x - µ) /σ
también se encuentra normalmente distribuida, pero en este caso con media cero y desviación típica
unitaria.
Definición 8.5.
Al sustituir en la fórmula 7.1. resulta que la función de densidad de probabilidad de una variable
normal típica Z es
2
1 − z2
f ( z;0,1) = e
2π
Luego
P( X ≤ x) ≡ P( Z ≤ z ) y:
Fx ( x; µ , σ ) ≡ Fz ( z;0,1)
55
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
Z
Gráfico 8.4. Función de distribución acumulativa de la normal tipificada Z
En el gráfico 8.5 se muestran comparativamente las funciones f(z) y F(z). Notar que:
a) en el caso de f(z) las probabilidades están dadas en el gráfico por las áreas bajo la curva
normal,
b) en el caso de la F(z) estas probabilidades se encuentran en las ordenadas del gráfico
(a) (b)
Gráfico 8.5. Áreas bajo la f.d.p normal y ordenadas de la f.d.p.a normal
Para saber cómo aplicar la ecuación de transformación (definición 8.4) y usar los resultados, a
continuación se da el problema siguiente: Supóngase que un consultor está estudiando cuanto tiempo
necesitarían los obreros de la fábrica para ensamblar cierta pieza en la planta de automóviles Volvo. A
partir de datos históricos se determinó que el tiempo (en segundos) estaba distribuido normalmente con
una media µx de 75 segundos y una desviación típica σx de 6 segundos. Algunas aplicaciones útiles de
esta información son:
Gráfico 8.6. Relación entre la escala de una VA distribuida normalmente (X) y, la escala de la VA
normal tipificada (Z)
56
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
El signo del d.n.t.: Obsérvese que los desvíos normales tipificados z tienen signo negativo en el
caso de valores de variable menores que la media, y signo positivo para valores mayores que la media.
Por lo tanto, la desviación típica se ha convertido en la unidad de medición. En otras palabras 81
segundos, es 6 segundos más (una desviación típica, σ = 6) que el tiempo promedio de 75 segundos,
mientras que un tiempo de 57 segundos es 18 segundos menos (es decir, 3 desviaciones típicas, 3σ)
que el tiempo promedio: en el primer caso, el “tiempo de montaje más lento que el promedio”) y, en el
segundo, ese “tiempo es más rápido”.
Existe una gran ventaja en pensar y trabajar con valores relativos. En lugar de tener que emplear
una familia ilimitada de distribuciones normales, se puede utilizar una única distribución, la distribución
normal tipificada, para transformar los valores de cualquier VA normal en una sola variable Z. El
resultado de la transformación (zi) indicará a cuántas desviaciones estándar está el valor considerado de
la media de distribución. Esto permite determinar varias probabilidades con base en la curva normal,
mediante el uso de una tabla única de probabilidades.
Dado un intervalo definido por dos valores de zi, las áreas comprendidas entre f(z) y el eje de
abscisas, reciben el nombre de áreas normales. Existen diferentes tablas para hallar el valor de éstas
áreas: algunas consideran intervalos del tipo -∞ < Z < zi, donde zi puede ser +∞ (acumulan áreas hasta
el caso del área total bajo la curva normal tipificada, o sea hasta el valor de probabilidad 1), en tanto en
otras zi puede tomar valores cuando más iguales a cero (acumulan áreas y cuando más considera la
mitad del área bajo la curva normal tipificada, o sea hasta el valor de probabilidad 0,5), y aprovecha la
propiedad de simetría para obtener las otras probabilidades. En nuestro caso, utilizaremos la tabla de
valores de la función de distribución acumulada F(z), que cubre el intervalo -3,5 < Z < 3,5.
Gráfico 8.7. Área bajo una curva normal dentro de 1, 2 y 3 desviaciones típicas de la media.
(µ + σ ; µ + 2σ ; µ + 3 σ )
57
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
8.4.3. Tablas probabilísticas de la DNT
O bien por el teorema del evento complementario esa probabilidad, la probabilidad buscada se
calcula, a partir del resultado obtenido en a) como
P(X<75 ó X>81) = P(Z<0 ó Z>1) = 1 – 0,3413 = 0,6587
58
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
x − µx x − µx
z= = −1.00 z= = +1.00
σx σx
Se supondrá ahora que el consultor llevó a cabo el mismo estudio de tiempos y movimientos en
una planta de automóviles BMW, donde los obreros estaban entrenados para montar la pieza mediante
un método diferente y usando equipo diferente. Se considerará que en esta planta se determinó que el
tiempo para realizar la tarea estaba distribuido normalmente con una media µ x de 60 segundos y
desviación estándar σx de 3 segundos. En la figura 8.11 se observa que, independientemente del valor
de µx y σx, se llega a una distribución de Z (la distribución normal tipificada es única).
Procedimiento general para hallar la probabilidad de un intervalo P(x1 < X < x2)
(xi − µ x )
1°) Calcular los valores de z como z i =
σx
2°) Obtener las probabilidades F(zi) en la tabla
X ∼ N(x; 60, 3)
Z ∼ N(z; 0, 1)
Gráfico 8.11
59
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
2° CASO: La demanda mensual de cierto producto alimenticio se encuentra aproximada por una variable
aleatoria normal con media de 200 y desviación estándar igual a 40 unidades. ¿Qué tan grande debe ser
el intervalo disponible a principio de un mes para que la probabilidad de que la existencia se agote no
sea mayor de 0,05?
De la información dada se tiene que: X ∼ N(x;200 , 40) ; es decir que “la VA se distribuye normalmente
con µ=200 y σ2 = 402 ”
Lo que se desea obtener es el valor del percentil 95, esto es x0,95, para el nivel de inventario a
principio del mes, de manera tal que la probabilidad de que la demanda exceda a x0,95 (existencias
agotadas) no sea mayor de 0,05.
P(X > x0,95 ) = 0.05
P(X > x0,95 ) = 0.95
De lo anterior se sigue que:
P[Z ≤ (x0.95 – 200/ 40] = 0.95 o
P(Z ≤ z0.95 ) = Fz (z0.95 ;0, 1) = 0.95
Donde z0.95 = (x0.95 – 200)/40 es el valor cuantil correspondiente a la variable aleatoria normal
estándar. Para obtener z0.95 de la tabla D, primero se busca la probabilidad más cercana a 0.95. Una vez
que se encuentra ese valor, se toma los correspondientes valores del renglón y la columna y se interpola
para encontrar el valor deseado de z0.95 . Por ejemplo, z0.95 tiene un valor aproximado de 1.645 y dado
que z0.95 = (x0.95 – 200)/40, z0.95 tiene un valor de 265.8. Esto significa que el intervalo a principio de cada
mes no debe ser menor de 266 unidades para que la probabilidad de agotar las existencias no sea
mayor de 0.05.
Ejemplo 8.1. La primera columna de la tabla 8.2. Contiene los intervalos de respuestas correctas para la
prueba de matemáticas (SAT); la segunda columna, el correspondiente número de calificaciones
observadas para el período 1998-1999, la tercera columna, las frecuencias relativas, las restantes,
información con respecto a si las calificaciones para la prueba de matemáticas obtenida por hombres
estaba distribuida normalmente con media 491 y desviación estándar igual a 120.
Mientras que, de manera aparente, existe una similitud entre las frecuencias teóricas y las
observadas, queda aún por contestar la pregunta acerca de cuándo puede rechazarse o no (consulte
Inferencia, prueba de bondad de ajuste) la hipótesis de que las calificaciones de la prueba de
matemáticas se distribuyeron normalmente con media 491 y desviación estándar igual a 120. Como se
mencionó, siempre es importante verificar lo que ocurre en los extremos de la distribución observada.
Por ejemplo, se sabe que para la prueba de matemáticas es imposible obtener calificaciones para los
eventos X < 200 y X > 800. Sin embargo, si X ∼ N (x;491, 120), las correspondientes probabilidades
son
P( X < 200) = 0.0075 y P(X > 800) = 0.005.
Tabla 8.2. Calificaciones obtenidas en la prueba de matemáticas (SAT) por los estudiantes del tercer año en el
ciclo 1998-1997.
Número de
Frecuencia Probabilidad Función de Número
respuestas Número de Intervalo normal
relativa del intervalo distribución esperado
correctas exámenes estándar
<200 0 0,0000 (-∞ - -2,425) 0,0076 0,0076 3634,27
(200 – 249) 3423 0,0072 (-2,425 - -2,01) 0,0146 0,0222 6981,62
(250 – 299) 18434 0,0385 (-2,01 - -1,59) 0,0337 0,0559 16115,18
(300 – 349) 39913 0,0835 (-1,59 - -1,18) 0,0631 0,1190 30173,98
(350 – 399) 51603 0,1079 (-1,18 - -0,76) 0,1046 0,2236 50018,90
(400 – 449) 61691 0,1290 (-0,76 - -0,34) 0,1433 0,3669 68525,18
(450 – 499) 72186 0,1510 (-0,34 - 0,075) 0,1630 0,5299 77945,49
(500 – 549) 72814 0,1523 (0,075 - 0,49) 0,1580 0,6879 75554,49
(550 – 599) 58304 0,1219 (0,49 - 0,91) 0,1307 0,8186 62499,81
(600 – 649) 46910 0,0981 (0,91 - 1,325) 0,0888 0,9074 42463,54
(650 – 699) 30265 0,0633 (1,325 - 1,74) 0,0517 0,9591 24772,78
(700 – 749) 16246 0,0340 (1,74 - 2,16) 0,0255 0,9846 12193,92
(750 – 800) 6414 0,0134 (2,16 - 2,575) 0,0104 0,9950 4973,21
>800 0 0,0000 (2,575 - ∞) 0,0050 1,0000 2390,97
Totales 478193 1,0000 0,9874 478193,00
60
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
Necesidades de la corrección para el ajuste por continuidad (o corrección de medio intervalo, + 0,5)
Hay dos razones importantes para utilizar aquí corrección para el ajuste por continuidad.
1º) Recuerde que una variable aleatoria discreta sólo puede tener valores específicos, mientras
que una variable aleatoria continua, usada para aproximarla, puede tener cualquier valor dentro de un
intervalo en torno a esos valores específicos. Por lo tanto, cuando se utiliza la distribución normal para
obtener valores aproximados de probabilidad a los que dan las funciones de distribución discreta
(binomial, Poisson), es más probable que se obtengan mejores aproximaciones si se utiliza la corrección
para el ajuste por continuidad.
2º) Recuerde que en una distribución continua (como la normal), la probabilidad de obtener un
valor en particular de una variable aleatoria es cero. Por otra parte, cuando se usa la distribución normal
para aproximar una distribución discreta se puede emplear la corrección para el ajuste por falta de
continuidad con el fin de aproximar la probabilidad de un valor específico de la distribución discreta.
Ejemplo 8.2. Considere un experimento en el cual se lanza al aire 12 veces una moneda y se observa el
número de caras. Se desea calcular la probabilidad de obtener exactamente 4 caras.
La idea de que una VAC se puede utilizar para obtener valores aproximados de probabilidad se
demuestra con la escala que se presenta a continuación.
x
2.5 3 3.5 4 4.5 5 5.5
El punto medio del intervalo creado es el valor x, en este caso x=4 → P(3,5 < X < 4,5)
La corrección para el ajuste por falta de continuidad requiere sumar o restar 0,5 al valor o
valores de la variable aleatoria discreta X, según sea necesario. Por lo tanto, para usar la distribución
normal para aproximar la probabilidad de obtener exactamente 4 caras (es decir, X=4), se determinaría
el área bajo la curva normal desde X=3,5 hasta X=4,5, los límites inferior y superior de 4. Más aún, para
determinar la probabilidad aproximada de observar por lo menos 4 caras, se encontraría el área bajo la
curva normal desde X=4,5 y por debajo, puesto que, en un intervalo, 4,5 es el límite superior de X.
Cuando se utiliza la distribución normal para aproximar funciones de distribución de probabilidad
discreta de nuevo se observa que la semántica es importante. Para determinar la probabilidad
aproximada de observar menos de 4 caras, ser debe encontrar el área bajo la curva normal desde X=3,5
y por debajo; para determinar la probabilidad aproximada de observar desde 4 más de 4 caras, se debe
encontrar el área bajo la curva normal desde X=4,5 y por encima; y para determinar la probabilidad
aproximada de observar desde 4 hasta 7 caras, se debe encontrar el área bajo la curva normal desde
X=3,5 hasta X=7,5.
Anteriormente se dijo que al distribución binomial será simétrica (al igual que la distribución
normal) siempre que ¶= 0,5. Cuando ¶≠0,5 la distribución binomial no será simétrica. Sin embargo,
mientras más cerca se encuentre ¶ de 0,5 y mayor sea el número de observaciones de muestra n, la
distribución se vuelve más simétrica.
Por otra parte, mientras mayor sea el número de observaciones en la muestra, resulta más
tedioso calcular las probabilidades de éxito exactas mediante el uso de la fórmula binomial.
Afortunadamente, como la muestra es grande se puede utilizar la distribución normal para aproximar las
probabilidades de éxito exactas que, de lo contrario, se tendrían que obtener mediante complejos
cálculos.
Como regla práctica, esta aproximación normal se puede usar cada vez que se cumplan las
dos condiciones siguientes:
61
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
Por lo que, una n suficientemente grande, la variable aleatoria z sigue una distribución en forma
aproximadamente normal.
Por consiguiente, para encontrar las probabilidades aproximadas correspondientes a los
valores de la variable aleatoria discreta X se tiene
xα − cπ
z=
cπ (1 − π )
Ejemplo 8.3. Para demostrar lo anterior, suponemos que en el control de calidad de la elaboración de
latas para conserva se obtiene en forma aleatoria una muestra de n=1.600 latas de un proceso
constante de producción en el cual el 8% de las latas producidas son defectuosas. ¿Cuál es la
probabilidad de que en una muestra así haya no más de 150 latas defectuosas?
Bajo la distribución binomial la probabilidad de obtener no más de 150 latas defectuosas consiste
de todos los eventos, incluyendo 150 defectuosas, es decir,
P(X ≤ 150 )= P(X=0) + P(X =1)+ ...+ P(X =150)
Y la probabilidad real se puede calcular laboriosamente a partir de
1.600
150
x =0
∑
x
(0,08) x (0,92)1.600− x
puesto que tanto cπ = (1.600)(0,08) =128, como c(1 –π) = (1.600)(0,92) = 1.472 son mayores que 5, se
puede usar la distribución normal para aproximar la binomial:
xα − cπ 150.5 − 128 22,5
z= = = = +2.07
cπ (1 − π ) (1.600)(0,08)(0,92) 10,5
Área = 0,9808
Suponga que ahora se desea calcular la probabilidad de obtener exactamente 150 latas
defectuosas.
P (149,5 ≤ X ≤ 150,5) =
P (1,98 ≤ Z ≤ 2,07 ) =
F ( z = 2,07 ) − F ( z = 1,98 ) =
0,9808 − 0,9761 = 0,0047
62
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012
UNIDAD II: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD
8.5.3. Aproximación a la distribución de Poisson
La distribución normal también se puede utilizar para aproximar el modelo de Poisson, siempre
que el λ, el número esperado de éxitos, iguale o exceda a 5. Puesto que le valor de la media y la
varianza de una distribución de Poisson son iguales, se tiene
µx = λ y σx = λ
al sustituir,
x−λ
z=
λ
por lo que, para una n suficientemente grande, la variable aleatoria z tiene una distribución
aproximadamente normal.
Por lo tanto, para determinar las probabilidades aproximadas que corresponden a los valores de
la variable aleatoria discreta X se tiene
( xα − λ )
z=
λ
donde λ= número de éxitos esperados o media de la distribución de Poisson
σx= desviación de la distribución de Poisson.
xα= número ajustado de éxitos, x, para la variable aleatoria discreta X, de modo que
xα=x–0.5 o xα = x + 0.5, según se necesite.
Las probabilidades aproximadas de éxito se obtienen de la tabla de áreas normales, aplicando el
criterio de continuidad.
63
Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2012