Documentos de Académico
Documentos de Profesional
Documentos de Cultura
COMPETENCIA DESARROLLAR
Identifica las funciones de distribución de probabilidad continuas para la solución de problemas de aplicación.
ACTIVIDADES DE APRENDIZAJE
Presentar en plenaria, mediante grupos de trabajo, la definición, características y proceso de cálculo de las
distribuciones investigadas.
Resolver ejercicios y problemas donde se aplique las diferentes distribuciones de probabilidad continuas.
6.1 INTRODUCCIÓN
Un momento de reflexión sobre variables aleatorias que se encuentran en el mundo real
debe convencernos de que no todas las variables aleatorias de interés son discretas. El
número de días que llueve en un periodo de n días es una variable aleatoria discreta
porque el número de días debe tomar uno de los n+1 valores 0,1,2,..., o n . Ahora
considere la lluvia diaria en un punto geográfico específico. En teoría, con equipo de
medición de precisión perfecta, la cantidad de lluvia podría tomar cualquier valor entre 0
y 15 centímetros. En consecuencia, cada uno del número incontable e infinito de puntos
del intervalo (0,15) representa un valor posible distinto de la cantidad de lluvia en un
día. Una variable aleatoria que puede tomar cualquier valor en un intervalo se denomina
continua y el propósito de este apartado es estudiar distribuciones de probabilidad para
variables aleatorias continuas. La producción de un antibiótico en un proceso de
fermentación es una variable aleatoria continua, al igual que la duración de vida útil, en
años, de una máquina de inyección de plástico.
La distribución de probabilidad para una variable aleatoria discreta siempre puede darse
al asignar una probabilidad no negativa a cada uno de los posibles valores que la variable
pueda tomar. En todo caso, por supuesto, la suma de todas las probabilidades que
asignamos debe ser igual a 1. Por desgracia, la distribución de probabilidad para una
variable aleatoria continua no puede ser especificada en la misma forma. Es
matemáticamente imposible asignar probabilidades diferentes de cero a todos los puntos
de un intervalo de recta al tiempo que se satisface el requisito de que las probabilidades
de los distintos valores posibles ascienden a 1 .
En consecuencia, debemos desarrollar
un método diferente para describir la
distribución de probabilidad para una
variable aleatoria continua.
Varias propiedades importantes de distribuciones continuas de probabilidad son comparables a sus similares
discretas. Así como la suma de probabilidades discretas (o la suma de las frecuencias relativas) es igual a 1 y la
probabilidad de que x caiga en cierto intervalo puede hallarse al sumar las probabilidades en ese intervalo, las
distribuciones de probabilidad tienen las características que se detallan a continuación.
Considere la probabilidad de que x sea igual a algún valor en particular, por ejemplo a. Como no hay área
arriba de un solo punto, por ejemplo x=a , en la distribución de probabilidad para una variable aleatoria
continua, nuestra definición implica que la probabilidad es 0 .
Esta sección se dedica a describir y mostrar aplicaciones de la distribución normal. La distribución normal es
muy importante por tener muchas aplicaciones y un amplio uso en la inferencia estadística.
6.1.1 DISTRIBUCIÓN NORMAL
La distribución de probabilidad continua más importante en todo el campo de la estadística es la distribución normal . Su gráfica,
denominada curva normal, es la curva con forma de campana, la cual describe de manera aproximada muchos fenómenos que
ocurren en la naturaleza, la industria y la investigación. Por ejemplo, las mediciones físicas en áreas como los experimentos
meteorológicos, estudios de la precipitación pluvial y mediciones de partes fabricadas a menudo se explican más que
adecuadamente con una distribución normal. Además, los errores en las mediciones científicas se aproximan muy bien mediante
una distribución normal. En 1733, Abraham DeMoivre desarrolló la ecuación matemática de la curva normal, la cual sentó las
bases sobre las que descansa gran parte de la teoría de la estadística inductiva. La distribución normal a menudo se denomina
distribución gaussiana en honor de Karl Friedrich Gauss (1777-1855), quien también derivó su ecuación a partir de un estudio de
errores en mediciones repetidas de la misma cantidad.
Donde:
π=3.14159
e=2.71828
Las siguientes son observaciones importantes acerca de las características de las distribuciones normales.
1 Toda la familia de distribuciones normales se diferencia por medio de dos parámetros: la media μ y la desviación estándar σ .
2 El punto más alto de una curva normal se encuentra sobre la media, la cual coincide con la mediana y la moda.
3 La media de una distribución normal puede tener cualquier valor: negativo, positivo o cero. A continuación se muestran tres
distribuciones normales que tienen la misma desviación estándar, pero diferentes medias. (−10,0y20) .
4 La distribución normal es simétrica, siendo la forma de la curva normal al lado izquierdo de la media, la imagen especular de la
forma al lado derecho de la media. Las colas de la curva normal se extienden al infinito en ambas direcciones y en teoría jamás
tocan el eje horizontal. Dado que es simétrica, la distribución normal no es sesgada; su sesgo es cero.
5 La desviación estándar determina qué tan plana y ancha es la curva normal. Desviaciones estándar grandes corresponden a
curvas más planas y más anchas, lo cual indica mayor variabilidad en los datos. A continuación se muestran dos curvas normales
que tienen la misma media pero distintas desviaciones estándar.
6 Las probabilidades correspondientes a la variable aleatoria normal se dan mediante áreas bajo la curva normal. Toda el área
bajo la curva de una distribución normal es 1 . Como esta distribución es simétrica, el área bajo la curva y a la izquierda de la
media es 0.50 y el área bajo la curva y a la derecha de la media es 0.50 .
7 Los porcentajes de los valores que se encuentran en algunos intervalos comúnmente usados son:
68.3% de los valores de una variable aleatoria normal se encuentran más o menos una desviación estándar de la media.
95.4% de los valores de una variable aleatoria normal se encuentran más o menos dos desviaciones estándar de la media.
99.7% de los valores de una variable aleatoria normal se encuentran más o menos tres desviaciones estándar de la media.
Una variable aleatoria que tiene una distribución normal con una media cero y desviación estándar de uno tiene una
distribución normal estándar . Para designar esta variable aleatoria normal se suele usar la letra z . La figura que se muestra
es la gráfica de la distribución normal estándar. Esta distribución tiene el mismo aspecto general que cualquier otra
distribución normal, pero tiene las propiedades especiales, μ=0 y σ=1 .
A continuación se da la fórmula que se emplea para convertir cualquier variable aleatoria x con media μ y desviación
estándar σ en la variable aleatoria normal estándar z .
Para la distribución normal estándar ya se encuentran calculadas las áreas bajo la curva normal y se cuenta con tablas que dan
estas áreas y que se usan para calcular las probabilidades. Estas tablas se encuentran en el anexo A.
Ejemplo
Dada una distribución normal estándar, calcule el área bajo la curva que se localiza:
a. a la izquierda de z=1.63
b. a la derecha de z=1.84
c. entre z=-1.97 y z=0.86
Solución:
a) El área está sombreada en la figura. Como la tabla 1 del archivo adjunto a esta sección da áreas bajo la curva normal a la
izquierda de un valor especificado de z , sólo se necesita hallar el valor tabulado para z=1.63 . Baje por la columna izquierda de
la tabla hasta z=1.6 y en sentido horizontal en la parte superior de la tabla hasta la columna marcada 0.03 . La intersección de
esta combinación de renglón y columna da el área 0.9484 , que es P(z=1.63) .
b) El área en la figura a la derecha de z = 1.84 es igual a 1 menos el área en la tabla del anexo A a la izquierda de z = 1.84,
a saber:
1–0.9671=0.0329
c) El área en la figura entre z=–1.97 y z=0.86 es igual al área a la izquierda de z=0.86 menos el área a la izquierda de z=–1.97 .
A partir de la tabla del anexo A encontramos que el área que se desea es:
0.8051–0.0244=0.7807
Dada una distribución normal estándar, calcule el valor de k tal que:
a) P(Z>k)=0.3015
b) P(k<Z<−0.18)=0.4197
Solución:
a) En la figura vemos que el valor k que deja un área de 0.3015 a la derecha debe dejar entonces un área de 0.6985 a la
izquierda; es decir el complemento de 0.3015 . De la tabla del anexo A se sigue que k=0.52 .
b)En la tabla del anexo A observamos el área total a la izquierda de –0.18 es igual a 0.4286 . En la figura vemos que el área
entre k y –0.18 es 0.4197 , de manera que el área a la izquierda de k debe ser 0.4286 – 0.4197=0.0089 . Por lo tanto, a partir
de la tabla del anexo A tenemos k=–2.37 .
Ejemplo
Una persona con una buena historia crediticia tiene una deuda promedio de $15015 (Business Week, 20 de marzo de 2006).
Suponga que la desviación estándar es de $3540 y que los montos de las deudas están distribuidos normalmente.
A ¿Cuál es la probabilidad de que la deuda de una persona con buena historia crediticia sea mayor a $18000 ?
B ¿De que la deuda de una persona con buena historia crediticia sea de menos de $10000 ?
C ¿De que la deuda de una persona con buena historia crediticia esté entre $12000 y $18000 ?
D ¿De cuanto debe ser la deuda de una persona para que se encuentre entre el 10% de las personas con buen historial
crediticio mas endeudadas?
Z=0.86
¿Cuál es la probabilidad de que la deuda de una persona con buena historia crediticia sea mayor a $18000 ?
P(12000<X<18000)=P(−0.87<Z<0.86)
Buscando en tablas encontramos que la probabilidad de Z1 es:
Para hallar la probabilidad de el área sombreada de la figura 6.1.1.17 tenemos que restar la
probabilidad de Z2 menos la probabilidad de Z1 es decir: 0.8051−0.1922=0.6129
Por lo tanto el porcentaje de que una persona con buen historial crediticio tenga una deuda
entre 12000 y 18000 es de 61.29%
D ¿De cuanto debe ser la deuda de una persona para que se encuentre entre el 10% de las personas con buen historial crediticio
mas endeudadas?
d) De acuerdo con la figura, el área bajo la curva a la izquierda de la cantidad desconocida de deudas debe ser 0.90 ; es decir el
área sombrea que equivaldría al 10% de personas mas endeudadas. De manera que primero se debe encontrar el valor de z
que deja un área de 0.90 en el extremo de la cola izquierda de la distribución normal estándar.
Según la tabla de probabilidad normal estándar z=1.28 deja el valor más cercano 0.90 en el extremo de la cola izquierda. Por
tanto, z=1.28 es el valor de la variable aleatoria normal estándar que corresponde a las personas más endeudadas en la
distribución normal de Business Week. Para hallar el valor de x que corresponde a z=1.28 , se tiene:
z=x−μσ=1.28
x=μ+1.28σ
x=15015+(1.28∗3450)=19431
Por lo tanto una persona debe tener por lo menos una deuda de $19431 para estar dentro del 10% de personas mas
endeudadas.
6.1.2 APROXIMACIÓN DE UNA BINOMIAL POR UNA NORMAL
Por lo que se planteara un teorema que nos permitirá utilizar áreas bajo la curva
normal para aproximar propiedades binomiales cuando n es suficientemente grande,
quedando de la siguiente manera:
Por lo tanto, en estas condiciones B(n,p) se puede aproximar por N(np, 𝑛𝑝𝑞) .
Además, tendremos en cuenta la corrección por continuidad, este factor se introduce
debido a que se está usando una distribución continua para aproximar una
distribución discreta para ello nos podemos apoyar en la siguiente tabla:
Ejemplo
La confiabilidad de un fusible eléctrico es la probabilidad de que un fusible, escogido al azar de la producción, funcione bajo
sus condiciones de diseño. Una muestra aleatoria de 1000 fusibles se probó y se observaron x = 27 defectuosos. Calcule:
a) La probabilidad aproximada de observar 27 o más defectuosos, suponiendo que la confiabilidad de un fusible es 0.98.
La probabilidad de 27 o más fusibles defectuosos, es P(x≥27) . Como se esta interesado en la región del lado derecho como se
muestra en la figura 6.1.2.1 tenemos que:
Es apropiado usar la aproximación normal a la probabilidad
binomial porque np=1000(0.02)=20 y nq=1000(0.98)=980 son P(x≥27)≈P(z≥1.46)=1−0.9279=0.0721
mayores a 5 . El área normal empleada para aproximar P(x≥27)
es el área bajo la curva normal a la derecha de 26.5, de modo
que todo el rectángulo para x=27 está incluido, como se
muestra también en la tabla anterior en el numeral 5. Entonces,
el valor de z correspondiente a x=26.5 es:
b) La probabilidad de tener menos de 23 fusibles defectuosos.
La probabilidad de tener menos de 23 fusibles defectos es: P(x < 23), numeral dos de la tabla anterior.
Por lo que la aproximación quedaría de la siguiente manera:
P(x≤23)≈P(z≤0.54)=0.7054