Está en la página 1de 23

TEMA 6 VARIABLES ALEATORIAS CONTINUAS

COMPETENCIA DESARROLLAR
Identifica las funciones de distribución de probabilidad continuas para la solución de problemas de aplicación.

ACTIVIDADES DE APRENDIZAJE

Buscar en diferentes fuentes de información las distribución Normal.

Presentar en plenaria, mediante grupos de trabajo, la definición, características y proceso de cálculo de las
distribuciones investigadas.

Resolver ejercicios y problemas donde se aplique las diferentes distribuciones de probabilidad continuas.
6.1 INTRODUCCIÓN
Un momento de reflexión sobre variables aleatorias que se encuentran en el mundo real
debe convencernos de que no todas las variables aleatorias de interés son discretas. El
número de días que llueve en un periodo de n días es una variable aleatoria discreta
porque el número de días debe tomar uno de los n+1 valores 0,1,2,..., o n . Ahora
considere la lluvia diaria en un punto geográfico específico. En teoría, con equipo de
medición de precisión perfecta, la cantidad de lluvia podría tomar cualquier valor entre 0
y 15 centímetros. En consecuencia, cada uno del número incontable e infinito de puntos
del intervalo (0,15) representa un valor posible distinto de la cantidad de lluvia en un
día. Una variable aleatoria que puede tomar cualquier valor en un intervalo se denomina
continua y el propósito de este apartado es estudiar distribuciones de probabilidad para
variables aleatorias continuas. La producción de un antibiótico en un proceso de
fermentación es una variable aleatoria continua, al igual que la duración de vida útil, en
años, de una máquina de inyección de plástico.
La distribución de probabilidad para una variable aleatoria discreta siempre puede darse
al asignar una probabilidad no negativa a cada uno de los posibles valores que la variable
pueda tomar. En todo caso, por supuesto, la suma de todas las probabilidades que
asignamos debe ser igual a 1. Por desgracia, la distribución de probabilidad para una
variable aleatoria continua no puede ser especificada en la misma forma. Es
matemáticamente imposible asignar probabilidades diferentes de cero a todos los puntos
de un intervalo de recta al tiempo que se satisface el requisito de que las probabilidades
de los distintos valores posibles ascienden a 1 .
En consecuencia, debemos desarrollar
un método diferente para describir la
distribución de probabilidad para una
variable aleatoria continua.

Supongamos que se tiene un conjunto


de mediciones en una variable
aleatoria continua y que crea un
histograma de frecuencia relativa para
describir la distribución de las mismas.
Para un pequeño número de
mediciones, se puede usar un
pequeño número de clases; entonces,
a medida que se recolecten más y más
mediciones, se pueden usar más
clases y reducir el ancho de clase. El
perfil del histograma cambiará
ligeramente, casi todo el tiempo
haciéndose cada vez más irregular,
como se muestra en la figura 6.1.
Cuando el número de mediciones se
hace muy grande y los anchos de clase
se hacen muy angostos, el histograma
de frecuencia relativa aparece cada
vez más como la curva suave que
aparece en la figura 6.1.1 d). Esta
curva suave describe la distribución de
probabilidad de la variable aleatoria
continua.
Una variable aleatoria continua puede tomar cualquiera de un número infinito de valores de la recta real. La
distribución de probabilidad es creada al distribuir una unidad de probabilidad a lo largo de la recta. La
profundidad o densidad de la probabilidad, que varía con x , puede ser descrita por una fórmula matemática
f(x) , llamada distribución de probabilidad o función de densidad de probabilidad para la variable aleatoria x .

Varias propiedades importantes de distribuciones continuas de probabilidad son comparables a sus similares
discretas. Así como la suma de probabilidades discretas (o la suma de las frecuencias relativas) es igual a 1 y la
probabilidad de que x caiga en cierto intervalo puede hallarse al sumar las probabilidades en ese intervalo, las
distribuciones de probabilidad tienen las características que se detallan a continuación.

El área bajo una distribución continua de probabilidad es igual a 1.


La probabilidad de que x caiga en un intervalo particular, por ejemplo de a a b , es igual al área bajo la curva
entre los dos puntos a y b .
También hay una diferencia importante entre variables aleatorias discretas y continuas.

Considere la probabilidad de que x sea igual a algún valor en particular, por ejemplo a. Como no hay área
arriba de un solo punto, por ejemplo x=a , en la distribución de probabilidad para una variable aleatoria
continua, nuestra definición implica que la probabilidad es 0 .

Esta sección se dedica a describir y mostrar aplicaciones de la distribución normal. La distribución normal es
muy importante por tener muchas aplicaciones y un amplio uso en la inferencia estadística.
6.1.1 DISTRIBUCIÓN NORMAL
La distribución de probabilidad continua más importante en todo el campo de la estadística es la distribución normal . Su gráfica,
denominada curva normal, es la curva con forma de campana, la cual describe de manera aproximada muchos fenómenos que
ocurren en la naturaleza, la industria y la investigación. Por ejemplo, las mediciones físicas en áreas como los experimentos
meteorológicos, estudios de la precipitación pluvial y mediciones de partes fabricadas a menudo se explican más que
adecuadamente con una distribución normal. Además, los errores en las mediciones científicas se aproximan muy bien mediante
una distribución normal. En 1733, Abraham DeMoivre desarrolló la ecuación matemática de la curva normal, la cual sentó las
bases sobre las que descansa gran parte de la teoría de la estadística inductiva. La distribución normal a menudo se denomina
distribución gaussiana en honor de Karl Friedrich Gauss (1777-1855), quien también derivó su ecuación a partir de un estudio de
errores en mediciones repetidas de la misma cantidad.

Una variable aleatoria continua X que tiene la distribución en


forma de campana se denomina variable aleatoria normal . La
ecuación matemática para la distribución de probabilidad de la
variable normal depende de los dos parámetros μ y σ , su
media y su desviación estándar, respectivamente. Por ello, se
denotan los valores de la densidad de X por n (x;μ,σ) .
DISTRIBUCIÓN NORMAL
La densidad de la variable aleatoria normal X , con media μ y varianza σ2 , es

Donde:

π=3.14159
e=2.71828

Las siguientes son observaciones importantes acerca de las características de las distribuciones normales.

1 Toda la familia de distribuciones normales se diferencia por medio de dos parámetros: la media μ y la desviación estándar σ .
2 El punto más alto de una curva normal se encuentra sobre la media, la cual coincide con la mediana y la moda.
3 La media de una distribución normal puede tener cualquier valor: negativo, positivo o cero. A continuación se muestran tres
distribuciones normales que tienen la misma desviación estándar, pero diferentes medias. (−10,0y20) .
4 La distribución normal es simétrica, siendo la forma de la curva normal al lado izquierdo de la media, la imagen especular de la
forma al lado derecho de la media. Las colas de la curva normal se extienden al infinito en ambas direcciones y en teoría jamás
tocan el eje horizontal. Dado que es simétrica, la distribución normal no es sesgada; su sesgo es cero.
5 La desviación estándar determina qué tan plana y ancha es la curva normal. Desviaciones estándar grandes corresponden a
curvas más planas y más anchas, lo cual indica mayor variabilidad en los datos. A continuación se muestran dos curvas normales
que tienen la misma media pero distintas desviaciones estándar.
6 Las probabilidades correspondientes a la variable aleatoria normal se dan mediante áreas bajo la curva normal. Toda el área
bajo la curva de una distribución normal es 1 . Como esta distribución es simétrica, el área bajo la curva y a la izquierda de la
media es 0.50 y el área bajo la curva y a la derecha de la media es 0.50 .
7 Los porcentajes de los valores que se encuentran en algunos intervalos comúnmente usados son:
68.3% de los valores de una variable aleatoria normal se encuentran más o menos una desviación estándar de la media.
95.4% de los valores de una variable aleatoria normal se encuentran más o menos dos desviaciones estándar de la media.
99.7% de los valores de una variable aleatoria normal se encuentran más o menos tres desviaciones estándar de la media.
Una variable aleatoria que tiene una distribución normal con una media cero y desviación estándar de uno tiene una
distribución normal estándar . Para designar esta variable aleatoria normal se suele usar la letra z . La figura que se muestra
es la gráfica de la distribución normal estándar. Esta distribución tiene el mismo aspecto general que cualquier otra
distribución normal, pero tiene las propiedades especiales, μ=0 y σ=1 .

A continuación se da la fórmula que se emplea para convertir cualquier variable aleatoria x con media μ y desviación
estándar σ en la variable aleatoria normal estándar z .

Para la distribución normal estándar ya se encuentran calculadas las áreas bajo la curva normal y se cuenta con tablas que dan
estas áreas y que se usan para calcular las probabilidades. Estas tablas se encuentran en el anexo A.
Ejemplo
Dada una distribución normal estándar, calcule el área bajo la curva que se localiza:

a. a la izquierda de z=1.63
b. a la derecha de z=1.84
c. entre z=-1.97 y z=0.86
Solución:
a) El área está sombreada en la figura. Como la tabla 1 del archivo adjunto a esta sección da áreas bajo la curva normal a la
izquierda de un valor especificado de z , sólo se necesita hallar el valor tabulado para z=1.63 . Baje por la columna izquierda de
la tabla hasta z=1.6 y en sentido horizontal en la parte superior de la tabla hasta la columna marcada 0.03 . La intersección de
esta combinación de renglón y columna da el área 0.9484 , que es P(z=1.63) .
b) El área en la figura a la derecha de z = 1.84 es igual a 1 menos el área en la tabla del anexo A a la izquierda de z = 1.84,
a saber:

1–0.9671=0.0329
c) El área en la figura entre z=–1.97 y z=0.86 es igual al área a la izquierda de z=0.86 menos el área a la izquierda de z=–1.97 .
A partir de la tabla del anexo A encontramos que el área que se desea es:

0.8051–0.0244=0.7807
Dada una distribución normal estándar, calcule el valor de k tal que:

a) P(Z>k)=0.3015
b) P(k<Z<−0.18)=0.4197
Solución:
a) En la figura vemos que el valor k que deja un área de 0.3015 a la derecha debe dejar entonces un área de 0.6985 a la
izquierda; es decir el complemento de 0.3015 . De la tabla del anexo A se sigue que k=0.52 .
b)En la tabla del anexo A observamos el área total a la izquierda de –0.18 es igual a 0.4286 . En la figura vemos que el área
entre k y –0.18 es 0.4197 , de manera que el área a la izquierda de k debe ser 0.4286 – 0.4197=0.0089 . Por lo tanto, a partir
de la tabla del anexo A tenemos k=–2.37 .
Ejemplo
Una persona con una buena historia crediticia tiene una deuda promedio de $15015 (Business Week, 20 de marzo de 2006).
Suponga que la desviación estándar es de $3540 y que los montos de las deudas están distribuidos normalmente.

A ¿Cuál es la probabilidad de que la deuda de una persona con buena historia crediticia sea mayor a $18000 ?
B ¿De que la deuda de una persona con buena historia crediticia sea de menos de $10000 ?
C ¿De que la deuda de una persona con buena historia crediticia esté entre $12000 y $18000 ?
D ¿De cuanto debe ser la deuda de una persona para que se encuentre entre el 10% de las personas con buen historial
crediticio mas endeudadas?

a) x=18000 μ=15015 σ=3450

Truncando tenemos entonces que:

Z=0.86
¿Cuál es la probabilidad de que la deuda de una persona con buena historia crediticia sea mayor a $18000 ?

Obteniendo una probabilidad de 0.8051 ; como estamos interesado en


el área del lado derecho de la curva entonces sacamos el complemento
de la probabilidad, es decir 1−0.8051=0.1949 . Entonces 19.49% de las
personas con buena historia crediticia tienen una deuda mayor a 18000
.
¿De que la deuda de una persona con buena historia crediticia sea de menos de $10000?

b) x=10000 μ=15015 σ=3450

truncando tenemos entonces que: Z=−1.45


¿De que la deuda de una persona con buena historia crediticia esté entre $12000 y $18000 ?
La distribución de la deuda se ilustra Por lo tanto:

P(12000<X<18000)=P(−0.87<Z<0.86)
Buscando en tablas encontramos que la probabilidad de Z1 es:

Y la probabilidad acumulada de Z2 es:

Los valores de Z que corresponden a X1=12000 y


X2=18000 son:

Para hallar la probabilidad de el área sombreada de la figura 6.1.1.17 tenemos que restar la
probabilidad de Z2 menos la probabilidad de Z1 es decir: 0.8051−0.1922=0.6129
Por lo tanto el porcentaje de que una persona con buen historial crediticio tenga una deuda
entre 12000 y 18000 es de 61.29%
D ¿De cuanto debe ser la deuda de una persona para que se encuentre entre el 10% de las personas con buen historial crediticio
mas endeudadas?

d) De acuerdo con la figura, el área bajo la curva a la izquierda de la cantidad desconocida de deudas debe ser 0.90 ; es decir el
área sombrea que equivaldría al 10% de personas mas endeudadas. De manera que primero se debe encontrar el valor de z
que deja un área de 0.90 en el extremo de la cola izquierda de la distribución normal estándar.
Según la tabla de probabilidad normal estándar z=1.28 deja el valor más cercano 0.90 en el extremo de la cola izquierda. Por
tanto, z=1.28 es el valor de la variable aleatoria normal estándar que corresponde a las personas más endeudadas en la
distribución normal de Business Week. Para hallar el valor de x que corresponde a z=1.28 , se tiene:

z=x−μσ=1.28
x=μ+1.28σ
x=15015+(1.28∗3450)=19431
Por lo tanto una persona debe tener por lo menos una deuda de $19431 para estar dentro del 10% de personas mas
endeudadas.
6.1.2 APROXIMACIÓN DE UNA BINOMIAL POR UNA NORMAL

En la sección 5 se presentó la distribución binomial discreta. Recuerde que un


experimento binomial consiste en una serie de n ensayos idénticos e independientes,
habiendo para cada ensayo dos resultados posibles, éxito o fracaso. La probabilidad
de éxito en un ensayo es la misma que en cualquier otro de los ensayos y se denota p
. La variable aleatoria binomial es el número de éxitos en n ensayos y lo que se quiere
saber es la probabilidad de x éxitos en n ensayos.

La evaluación de una función de probabilidad binomial, a mano o con una


calculadora, se dificulta cuando el número de ensayos es muy grande. En los casos en
que np≥5 y nq≥5 , la distribución normal proporciona una aproximación a las
probabilidades binomiales que es fácil de usar. Cuando se usa la aproximación normal
a la binomial, en la definición de la curva normal μ=np y 𝜎 = 𝑛𝑝𝑞 .

Por lo que se planteara un teorema que nos permitirá utilizar áreas bajo la curva
normal para aproximar propiedades binomiales cuando n es suficientemente grande,
quedando de la siguiente manera:

conforme n→∞ , es la distribución normal estándar


n(z;0,1) .

Por lo tanto, en estas condiciones B(n,p) se puede aproximar por N(np, 𝑛𝑝𝑞) .
Además, tendremos en cuenta la corrección por continuidad, este factor se introduce
debido a que se está usando una distribución continua para aproximar una
distribución discreta para ello nos podemos apoyar en la siguiente tabla:
Ejemplo
La confiabilidad de un fusible eléctrico es la probabilidad de que un fusible, escogido al azar de la producción, funcione bajo
sus condiciones de diseño. Una muestra aleatoria de 1000 fusibles se probó y se observaron x = 27 defectuosos. Calcule:
a) La probabilidad aproximada de observar 27 o más defectuosos, suponiendo que la confiabilidad de un fusible es 0.98.

Truncando el valor y buscando en tablas tenemos que z=1.46


es 0.9279 .

La probabilidad de 27 o más fusibles defectuosos, es P(x≥27) . Como se esta interesado en la región del lado derecho como se
muestra en la figura 6.1.2.1 tenemos que:
Es apropiado usar la aproximación normal a la probabilidad
binomial porque np=1000(0.02)=20 y nq=1000(0.98)=980 son P(x≥27)≈P(z≥1.46)=1−0.9279=0.0721
mayores a 5 . El área normal empleada para aproximar P(x≥27)
es el área bajo la curva normal a la derecha de 26.5, de modo
que todo el rectángulo para x=27 está incluido, como se
muestra también en la tabla anterior en el numeral 5. Entonces,
el valor de z correspondiente a x=26.5 es:
b) La probabilidad de tener menos de 23 fusibles defectuosos.

La probabilidad de tener menos de 23 fusibles defectos es: P(x < 23), numeral dos de la tabla anterior.
Por lo que la aproximación quedaría de la siguiente manera:

El área que interesa es del lado izquierdo por lo que entonces:

P(x≤23)≈P(z≤0.54)=0.7054

También podría gustarte