Está en la página 1de 17

Dr. C. Ing. José A.

Vilalta Alonso 1

Estadística I. Tema 2. Probabilidades. Variables Aleatorias.

Variables aleatorias Exponencial y Normal. Cálculo de Probabilidades

Objetivo:

Calcular e interpretar, de manera creativa, probabilidades asociadas a variables aleatorias


Exponencial y Normal.

Bibliografía:

1. Walpole, R.; Myers, R.; Myers S. (2008). Probabilidad y Estadística para Ingenieros.
Parte I, capítulo 6, pp. 145-170. Sexta Edición, Editorial Félix Varela, La Habana,
Cuba.

2. Rodríguez, Hilario. (2009). Tablas y Resúmenes Estadísticos. Editorial Félix Varela,


La Habana, Cuba.

Introducción.

En la clase anterior se estudiaron dos (aunque se mencionaron tres) de las variables alea-
torias discretas más utilizadas y de mucha importancia en varias áreas del conocimiento
de la Ingeniería Industrial, que son las variables aleatorias con distribuciones de probabi-
lidad Binomial y Poisson.

Hoy se estudiarán los fundamentos de las variables aleatorias continuas Exponencial y


Normal, esta última, probablemente, la más conocida y utilizada en disímiles campos.

Recordemos que las variables aleatorias continuas son variables que toman valores en un
intervalo y que a sus leyes o distribuciones de probabilidad se le llaman funciones de den-
sidad probabilísticas.

Variable aleatoria Exponencial y su función de densidad probabilística.

La variable aleatoria Exponencial es de mucho uso en la Ingeniería Industrial, particular-


mente en los estudios de la abilidad de productos y en la teoría de colas.

Además, esta variable está muy relacionada con la variable Poisson, por lo que general-
mente se dene una variable Exponencial como:

X: Tiempo que transcurre entre dos éxitos consecutivos Poisson.

La notación usada para especicar una variable Exponencial es:

X ∼ e(λ) o e(x; λ)

La función de densidad probabilística Exponencial puede denirse, a partir de esta rela-


ción con la variable Poisson como:
Dr. C. Ing. José A. Vilalta Alonso 2

f (x) = λe−λx para x > 0

Siendo e=2.71828. . .

El cálculo de probabilidades asociadas a esta variable se hace integrando la función expo-


nencial entre los límites denidos por la probabilidad que se desea calcular. En la práctica
esto se convierte en que:

P (X ≥ x) = e−λx

P (X ≤ x) = 1 − e−λx

P (x1 ≤ X ≤ x2 ) = e−λx1 − e−λx2

Valor esperado y varianza de la variable Exponencial.

1
E(X) = λ

1
V (X) = λ2

Las variables que tienen un comportamiento Exponencial tienen una importante propie-
dad conocida como pérdida de la memoria. Esta propiedad se puede expresar de la
siguiente manera:

P (X > t + s/X > s) = P (X > t) (1)

Es decir, si usted quiere calcular la probabilidad de que el tiempo que transcurre entre dos
éxitos consecutivos Poisson sea mayor que un determinado valor t, el resultado obtenido
será independiente del tiempo ya transcurrido desde que ocurrió el último éxito.

Ejemplo 1: A una estación de servicio llegan los clientes a razón de 0,5 clientes como
promedio por minutos, en el horario comprendido entre las 8 am y las 12 m, según una
ley Poisson.

a. Calcule la probabilidad de que transcurra más de 1 minuto sin que llegue un cliente.

b. Si ya ha transcurrido un minuto sin que llegue un cliente cuál es la probabilidad de


que transcurra otro minuto sin llegar clientes.

c. ¾Cuál es el tiempo medio que transcurre entre la llegada de dos clientes consecutivos?

X: Cantidad de clientes que llegan a la estación en un minuto

X ∼ P (λ = 0, 5)
Dr. C. Ing. José A. Vilalta Alonso 3

Y: tiempo que transcurre entre la llegada de dos clientes sucesivamente

Y ∼ e(λ = 0, 5)

a. P (X > 1) = e−0,5 = 0, 6065

b. P (X > 2/x > 1) = P (X > 1) = 0, 6065 teniendo en cuenta la propiedad de pérdida


de la memoria.

c. E(X) = 1/0, 5 = 2 Como promedio transcurren dos minutos entre dos llegadas
consecutivas de clientes.

Variable aleatoria Normal y su función de densidad probabilística.

La variable aleatoria Normal es, con casi absoluta certeza, el tipo de variable más uti-
lizada. Esto se debe a que muchas variables en la vida real tienen un comportamiento
probabilístico normal, a que bajo determinadas condiciones muchas variables pueden ser
tratadas como variables con distribución normal aunque originalmente no lo sean y, en
consecuencia, muchos de los métodos clásicos de la estadística tienen como requisito para
su aplicación que la variable objeto de estudio siga este tipo de distribución.

Esto hace que en muchas otras asignaturas de la carrera sea de amplio uso el estudio de
variables con distribuciones Normal.

La función de densidad probabilística Normal (también llamada gaussiana) tiene la si-


guiente forma:

1 (X−µ)2
f (x) = √ e− 2σ2 (2)
σ 2π

Denida en el intervalo −∞ ≤ X ≤ ∞

Los parámetros de una variable y su distribución Normal son la media o promedio (µ) y
2
la varianza (σ ) o su desviación típica o estándar (σ ).

La manera más común de representar una variable Normal es:

X ∼ N (µ; σ 2 ), que se lee como que X es una variable que tiene distribución Normal con
2
media µ y varianza σ .

También pudiera escribirse como: n(x; µ, σ 2 ), con el mismo signicado.

La representación gráca de la distribución Normal es la llamada curva o campana Normal


o de Gauss, la que queda completamente denida una vez que se especican los paráme-
2
tros µ y σ .
Dr. C. Ing. José A. Vilalta Alonso 4

Figura 1: La función Normal, con media µ y varianza σ2.

A continuación se presentan algunas situaciones de interés:

Figura 2: Distribuciones Normales con la misma desviación típica y medias diferentes.

Figura 3: Distribuciones Normales con la misma media y diferentes desviaciones típicas


(σ1 < σ2 ).

Como puede apreciarse mientras mayor es la desviación típica (σ ) de la variable más acha-
tada es la curva, representando la mayor dispersión de los valores de la variable respecto
Dr. C. Ing. José A. Vilalta Alonso 5

a la media o valor esperado.

El área bajo la curva entre dos valores de X es la probabilidad de que la variable tome
valores en ese intervalo, como se muestra en la gura 4.

Figura 4. Representación gráca la probabilidad asociada a una variable Normal.

La gura 4a representa la probabilidad (área sombreada) de que la variable X tome valo-


res menores que a (P (X < a)) y la 4b la probabilidad de que X tome valores entre a y b
(P (a < X < b)).

Como el área bajo la curva sobre el eje X representa la probabilidad de que la variable X
tome valores en determinado intervalo entonces, como es lógico pensar, el área total bajo
la curva es igual a uno.

Note que si se quisiera calcular la probabilidad de que, por ejemplo, X = a (P (X = a))


el resultado sería cero, ya que las variables continuas toman valores en un intervalo, y
no en el punto y desde el punto de vista gráco puede verse que el área bajo la curva es
despreciable.

Esto último implica, tanto desde el punto de vista teórico como práctico, que la utilización
del signo igual (=) es irrelevante en el caso de las variables continuas y particularmente
en el caso de la normal:

P (X ≥ a) = P (X > a)
P (X ≤ a) = P (X < a)
Dr. C. Ing. José A. Vilalta Alonso 6

Una explicación muy interesante relacionada con este asunto puede encontrarse en el libro
55 Respuestas a Dudas Típicas de Estadística de los profesores Roberto Behar y Pere
Grima. Para ello debe buscar la respuesta a la pregunta 15, en el capítulo Distribuciones
de probabilidad.

Es muy importante el hecho de que la función de densidad probabilística Normal, o senci-


llamente curva normal, es simétrica respecto a la media o valor esperado µ. Esto implica
que la P (X < µ) = P (X > µ) = 0, 5. Esta característica de la curva normal puede
apreciarse en la gura 1.

Otra característica importante de la función de densidad probabilística Normal está re-


lacionada con el porcentaje de elementos de la población contenidos en determinados
intervalos, así:

Aproximadamente el 68 % de la población se encuentra entre µ±σ

Aproximadamente el 95 % de la población se encuentra entre µ ± 2σ

Aproximadamente el 99,74 % de la población se encuentra entre µ ± 3σ

Esta característica es muy importante por su utilización en las decisiones que se toman
en determinados métodos estadísticos que se basan en la misma. Además, nos ayuda a
comprender el signicado de la desviación típica. La gura 5 representa esta situación.

Figura 5: Curva Normal con parámetros µ y σ2.

Variable Normal estándar o típica Z.

Para cumplir con varios objetivos, entre ellos facilitar el cálculo de probabilidades asocia-
das a variables normales, se dene la variable Normal estándar o típica Z.

X −µ
Z= (3)
σ

Puede demostrarse que si X es una variable Normal con media µ y varianza σ2, entonces:

Z ∼ N (µ = 0; σ 2 = 1)
Dr. C. Ing. José A. Vilalta Alonso 7

Debe quedar claro que no es una cuestión de nombres o letras. La denominación X se re-
ere a cualquier variable con distribución Normal que tenga media y varianzas diferentes
de cero y uno respectivamente.

La variable Z se representa en la gura 6. A este proceso de convertir una variable X


Normal en una variable Z se le llama tipicación o estandarización.

Figura 6: La variable Normal estándar o típica Z.

En el libro Tablas y Resúmenes Estadísticos, página 19, se presenta la tabla de la dis-


tribución Normal. Esta tabla permite calcular la probabilidad de que la variable normal
estándar tome valores mayores que un determinado valor positivo de Z.

En la gura 7 se presenta una vista parcial de la tabla.

Figura 7: Vista parcial de la tabla de la distribución Normal.

Ejemplo 2: Suponga que se tiene una variable X con distribución Normal con media 10
y varianza 4.

X ∼ N (µ = 10; σ 2 = 4)

Calcule la probabilidad de que:


Dr. C. Ing. José A. Vilalta Alonso 8

a. X >11

X −µ 11 − 10
P (X > 11) = P ( > ) = P (Z > 0, 5) = 0, 3085 (4)
σ 2

b. X >11,5

X −µ 11, 5 − 10
P (X > 11, 5) = P ( > ) = P (Z > 0, 75) = 0, 2266 (5)
σ 2

Note que para encontrar el valor 0,75 debe buscar por la izquierda el valor 0,7 y completar
la segunda cifra decimal por la parte superior de la tabla. Esto lo puede observar en la
gura 7.

Ejemplo 3: Se conoce que el peso de las bolsas llenas de un producto a la salida de la


línea de llenado es una variable normalmente distribuida con media de 170 g y desviación
típica de 4g. Si se selecciona al azar una bolsa, calcule la probabilidad de que su peso sea:

a. 168 g

b. Más de 170 g

c. Más de 171 g

d. Menos de 169 g

e. Más de 168 g

f. Entre 168 y 172 g

Respuestas.

X: peso de una bolsa

X ∼ N (µ = 170; σ 2 = 16)

a. P(X = 168) = 0

b. P(X>170) = 0,5

Note que en estos casos no fue necesario tipicar, es decir convertir la variable X en una
variable Z porque las probabilidades no se calcularon, sino que se usó el conocimiento
que se tiene sobre las características de la función de densidad probabilística normal para
llegar a los resultados.
Dr. C. Ing. José A. Vilalta Alonso 9

De todas maneras, en el caso del inciso b, si se decidiera tipicar y calcular la probabilidad


se llegaría al mismo resultado.

c. P (X > 171)
X −µ 171 − 170
P (X > 171) = P ( > ) = P (Z > 0, 25) = 0, 4013 (6)
σ 4

El área sombreada en la gura 8 representa la probabilidad calculada. Observe que la


probabilidad es algo menor que 0,5.

Figura 8: Distribución normal estándar. P (Z > 0, 25)

d. P (X < 169)
X −µ 169 − 170
P (X < 169) = P ( < ) = P (Z < −0, 25) (7)
σ 4
Esta probabilidad no puede ser buscada directamente en la tabla. Se requiere una pequeña
transformación. Observe lo que se ha representado en la gura 9.

Figura 9: Distribución normal estándar. Simetría respecto a la media (µ = 0)


Dr. C. Ing. José A. Vilalta Alonso 10

Debido a que la curva normal es simétrica respecto a su media se cumple que:

P (X < 0, 25) = P (X > 0, 25) = 0,4013

Por lo tanto:

X −µ 169 − 170
P (X < 169) = P ( < ) = P (Z < −0, 25) = P (Z > 0, 25) = 0, 4013 (8)
σ 4
e. P (X > 168)
X −µ 168 − 170
P (X > 168) = P ( > ) = P (Z > −0, 5) (9)
σ 4

Esta probabilidad tampoco puede obtenerse directamente de la tabla. Para ello se hará
una transformación, partiendo de la idea representada en la gura 10.

Figura 10. Distribución Normal estándar. Área por encima de -0.5.

Analizando el gráco de la gura 10 se observa que la probabilidad solicitada puede cal-


cularse como:

P (Z > −0, 5) = 1 − P (Z < −0, 5)

Pero teniendo en cuenta la simetría de la curva Normal, como ya se vio:

P (Z < −0,5) = P (Z > 0, 5)

Por lo que:

P (X > 168) = P (Z > −0, 5) = 1 − P (Z > 0, 5) = 1 − 0, 3085 = 0, 6915 (10)

f. P (168 < X < 172)


Dr. C. Ing. José A. Vilalta Alonso 11

168 − 170 X −µ 172 − 170


P (168 < X < 172) = P ( < < ) = P (−0, 5 < Z < 0, 5) (11)
4 σ 4
La gura 11 muestra la probabilidad que se quiere calcular, representada en el área som-
breada.

Figura 11: Distribución Normal estándar. Área entre -0,5 y 0,5.

Teniendo en cuenta todo lo analizado para los casos anteriores puede concluirse que:

P (168 < X < 172) = P (−0, 5 < Z < 0, 5) = 1 − 2P (Z > 0, 5) = 1 − 2(0, 3085) = 0, 3830
(12)
Las probabilidades calculadas en el ejemplo le van a permitir, a partir de su cuidadoso
estudio, ser capaz de calcular cualquier otra que se le pueda presentar. Debe tener muy
en cuenta tres aspectos. La probabilidad que tiene que calcular, las características de la
curva normal y las de la tabla de la que dispone.

Con el uso de Minitab se pueden calcular estas probabilidades, haciendo uso de la siguien-
te secuencia:

Calc >Probability Distributions >Normal >Cumulative probability.

Solo que en ese caso Minitab devuelve la probabilidad acumulada hasta un cierto valor:
P (X < x)

Se reitera que no es objetivo de este curso el cálculo de probabilidades usando Minitab o


cualquier otro software.

Obtención de valores de la variable a partir de la probabilidad.

En ocasiones no interesa calcular las probabilidades asociadas a un conjunto de valores


de X, sino que el interés está en calcular el valor de X asociado a una determinada pro-
babilidad de ocurrencia.
Dr. C. Ing. José A. Vilalta Alonso 12

Esto se trata de realizar el proceso inverso al que se realizó para el cálculo de las proba-
bilidades. Veamos un ejemplo.

Ejemplo 4: Para el problema planteado en el ejemplo 3:

a. ¾Cuál es, aproximadamente, el peso mínimo del 5 % de las bolsas más pesadas?

Una representación gráca, como la que se presenta en la gura 12 puede contribuir a


resolver el problema.

Figura 12: Distribución Normal. El 5 % de bolsas más pesadas.

El área sombreada representa el 5 % de las bolsas más pesadas. En término de probabili-


dades lo que está representado en la gura puede escribirse como:

P (X > Xa ) = 0, 05

Pero la tabla de que se dispone es para la variable Normal estándar Z, por lo que es
necesario tipicar:

X −µ xa − 170 xa − 170
P( > ) = P (Z > ) = 0, 05 (13)
σ 4 4

Por lo que:

xa − 170
(14)
4

Será igual al valor de Z que acumule por encima de él una probabilidad de 0,05. Es decir,
Z0,05 .

Buscando en la tabla, ver gura 13, puede verse que Z0,05 ≈ 1, 64 :

xa − 170
Z0,05 = ≈ 1, 64 (15)
4
Dr. C. Ing. José A. Vilalta Alonso 13

Figura 13: Tabla de la distribución Normal.

Despejando el valor de Xa se obtiene que:

Xa ≈ 176, 6g

b. ¾Cuál es, aproximadamente, el peso máximo del 10 % de las bolsas menos pesadas?

Demos un vistazo a la gura 14 donde se ha representado esta situación:

Figura 14: Distribución Normal. El 10 % de las bolsas menos pesadas.

Al igual que en el caso anterior el área sombreada representa ahora el 10 % de las bolsas
menos pesadas. En término de probabilidades lo que está representado en la gura puede
escribirse como:

P (X < Xa ) = 0, 10

Tipicando:
Dr. C. Ing. José A. Vilalta Alonso 14

X −µ xa − 170 xa − 170
P( < ) = P (Z < ) = 0, 10 (16)
σ 4 4
xa −170
Pero observe que es negativo, por ser Xa < 170. Por lo tanto, para poder entrar
4
a la tabla habría que invertirlo, teniendo en cuenta la propiedad de simetría. Quedaría
como sigue:

xa − 170 170 − xa
P (Z < ) = P (Z > ) = 0, 10 (17)
4 4

Buscando en la tabla, ver gura 13, se obtiene:

170 − xa
Z0,10 = ≈ 1, 28 (18)
4

Y despejando el valor de Xa se obtiene:

Xa ≈ 164, 9

Ejercicio 1: ¾Cuál sería, aproximadamente, el peso mínimo del 50 % de las bolsas más
pesadas? ¾Y el peso máximo del 50 % de las bolsas menos pesadas?

Media o promedio muestral.

Suponga que se toma una muestra de tamaño n. Pudiera denirse, en ese caso, la variable
aleatoria:

X̄ :media o promedio de la muestra

Puede demostrarse fácilmente que si:

X ∼ N (µ; σ 2 ), entonces:

2
X̄ ∼ N (µ; σn )

Es decir, media muestral tiene la misma media o promedio de la variable original (µ),
σ2 σ
pero tiene una menor varianza ( ) y por lo tanto una desviación típica que es √ .
n n

La gura 15 muestra la relación entre la curva Normal de una variable X y la correspon-


diente a la X̄ para un determinado tamaño de muestra n.
Dr. C. Ing. José A. Vilalta Alonso 15

Figura 15. Distribuciones de las variables X (Normal, µ = 170yσ = 4) y X̄ para n=16


(Normal, µ = 170 y σ = 1).

Observe la menor variabilidad de la variable X̄ , característica que es muy utilizada por


las ventajas que tiene, en algunas técnicas estadísticas, como es el caso de los grácos de
control, utilizados como parte del arsenal de técnicas para el control de la calidad.

Por lo tanto, para convertir la variable X̄ en una variable Z, mediante la tipicación, sería
necesario la siguiente operación:

X̄ − µ
Z= (19)
√σ
n

Ejemplo 5: Considerando el problema que se viene desarrollando desde el ejemplo 3,


considere que se quiere tomar una muestra de 16 bolsas al azar. Calcule la probabilidad
de que el peso promedio de ellas sea mayor que 171 g.

Recordando:

µ = 170 σ = 4 n = 16

X̄ − µ 171 − 170
P (X̄ > 171) = P ( > ) = P (Z > 1) = 0, 1587 (20)
√σ 4
n 4
Dr. C. Ing. José A. Vilalta Alonso 16

Combinación lineal de variables aleatorias Normales.

Una utilización muy importante de la distribución Normal está condicionada por las si-
guientes dos características:

1. Si X se distribuye normalmente cualquier transformada lineal: Y = a + bX, sigue


una distribución Normal.

2. Si X y Y son dos variables independientes que se distribuyen normalmente, su suma


W=X+Y se distribuye también normalmente.

Ejemplo 6: Considere una caja en la que se envasan 4 productos del mismo tipo. El peso
de cada producto es una variable Normal con media 100 g y desviación típica de 3 g. El
peso de la caja vacía también es una variable Normal con media 10g y desviación típica de
1 g. Calcule la probabilidad de que al seleccionar una caja aleatoriamente este pese más
de 415 g. Suponga que el peso de cada producto y de la caja son variables independientes.

Xi : peso de producto i

Y: peso de la caja vacía

W: peso de la caja llena

W = X1 + X2 + X3 + X4 + Y

Xi ∼ N (100; 9)

Y ∼ N (10; 1)

µw = 100 + 100 + 100 + 100 + 10 = 410

σw2 = 9 + 9 + 9 + 9 + 1 = 37

W ∼ N (410; 37)

W − µW 415 − 410
P (W > 415) = P ( > √ ) = P (Z > 0, 82) = 0, 2061 (21)
σW 37

El Teorema Central del Límite.

Ahora dedicaremos un breve espacio a comentar uno de los resultados más importantes
en los que se sustenta buena parte de la teoría estadística: el Teorema Central del Límite.

No vamos a abordarlo en todo su rigor teórico. Solo haremos referencia a la conclusión


que de él se obtiene.
Dr. C. Ing. José A. Vilalta Alonso 17

El Teorema Central del Límite postula que, en condiciones muy generales respeto a
las distribuciones de los sumandos, la suma de variables aleatorias independientes tiende
a distribuirse normalmente a medida que aumenta el número de sumandos. Esto justi-
ca, en alguna medida, el amplio uso de la distribución Normal en las aplicaciones de la
estadística.

En la práctica esto es muy útil porque implica que se puede modelar la variable aleatoria
media muestral (X̄ ) por medio de la distribución Normal, aun cuando la población origi-
nal de donde se extrae la muestra tenga otra distribución distinta a la Normal, exigiendo
para su aplicación un conjunto no muy fuerte de restricciones que, en la práctica se suelen
cumplir, entre ellos que el tamaño de la muestra sea relativamente grande.

Aproximación Normal a la Binomial.

Aunque el cálculo de probabilidades para variables con distribución Binomial es muy sen-
cillo a partir del uso de las tablas disponibles o con la utilización de un gran número de
softwares, hay una estrecha relación entre la variable Binomial y la Normal, que permite
que, bajo determinadas condiciones, pueda usarse la distribución Normal como aproxima-
ción de la Binomial. Esto es un resultado práctico del Teorema Central del Límite.

En el libro de texto, epígrafe 6.5 del capítulo 6, se aborda esta problemática que los in-
teresados pueden consultar.

En esencia se trata de la utilización de la distribución Normal para calcular probabilidades


binomiales siempre que la probabilidad de éxito p no sea cercana a 1 o a 0. Se logra muy
buena aproximación n es grande o para valores pequeños de n si p es cercana a 0,5. Un
buen criterio es que si np o nq son mayores o iguales a 5 la aproximación será muy buena.

Por supuesto, considerando que la variable Normal es continua y la Binomial es discreta


se hace necesario hacer alguna corrección, llamada corrección de continuidad para salvar
esta diferencia.

En la siguiente clase se comenzará el estudio del tema de estadística inferencial, una de


las partes centrales que componen esta asignatura.

También podría gustarte