Está en la página 1de 35

Capítulo 3

Variables Aleatorias. Distribuciones

de Probabilidad

3.1. Introducción
En este capítulo deniremos dos de los conceptos más importantes de la Estadística. Nos referimos
a los conceptos de variable aleatoria y el de distribución de probabilidad de una variable aleatoria.
Estos conceptos serán muy utilizados al aplicar las técnicas inferenciales que estudiaremos más
adelante.
En el capítulo anterior habíamos denido como experimento aleatorio a una secuencia de activi-
dades diseñadas para obtener información de interés para el investigador y que tiene las siguientes
propiedades:

Puede realizarse tantas veces como se quiera bajo las mismas condiciones
Se sabe cuales son los resultados posibles
Antes de realizar una repetición no se sabe cuál de los resultados ocurrirá

Al conjunto de todos los resultados posibles del experimento lo llamamos espacio muestral y lo
simbolizamos en general con la letra S . También denimos como evento a cualquier subconjunto
de S .
Todo experimento aleatorio puede denir cierto tipo de variables que se utilizan para describir
numéricamente los eventos de su espacio muestral. Estas variables reciben el nombre de variables
aleatorias.
Damos a continuación una primera denición de variable aleatoria.
Denición 3.1. Cuando los valores que toma una variable son el resultado de algún proceso en el
que interviene el azar, la variable recibe el nombre de variable aleatoria.

Supongamos que se lanza una moneda tres veces y estamos interesados en el número de caras
obtenidas en los tres lanzamientos.. El espacio muestral de este experimento es, como ya sabemos:
S = {CCC, CC+, C + C, +CC, C + +, +C+, + + C, + + +}

donde C es el resultado obtener cara y + es el resultado obtener cruz.


Consideremos la siguiente variable

X = Número de caras obtenidas en tres lanzamientos de una moneda

Los valores que puede tomar la variable X son los siguientes:

67
X = 0 que se identica con el evento A1 = {+ + +}. (No se obtuvieron caras)
X = 1 que se identica con el evento A2 = {C + +, +C+, + + C}. (Se obtuvo una cara)
X = 2 que se identica con el evento A3 = {CC+, C + C, +CC}. (Se obtuvieron dos caras)
X = 3 que se identica con el evento A4 = {CCC}. (Se obtuvieron tres caras)

Por lo tanto, la variable X puede tomar los siguientes valores: X = 0, 1, 2, 3.


Además, ara una variable aleatoria X , la expresión (X = x) representa un evento del espacio S .
Como puede verse la variable aleatoria X asigna un número real a cada evento del espació muestral.
Además, siendo los valores que toma la variable

X =Número de caras obtenidas en tres lanzamiento de una moneda

el resultado de un proceso en el que interviene el azar, la variable X es una variable aleatoria.


De acuerdo con esta nueva información, podemos dar una denición más formal del concepto de
variable aleatoria.
Denición 3.2. Una variable aleatoria es una función X : S → ℜ que asigna un número real a
cada evento de de un espacio muestral denido por un experimento aleatorio.

En general, las variables aleatorias se designan con las últimas letras del abecedario en mayúsculas
como por ejemplo X, Y, W, Z etc. y sus valores con las respectivas minúsculas.
Siguiendo con el ejemplo en el que denimos la variable aleatoria

X = Número de caras obtenidas en los tres lanzamientos de una moneda

y como una consecuencia de la relación que se establece entre los eventos de S y números reales,
podemos calcular la probabilidad de cada uno de los valores de X .
Asumiendo que los resultados son igualmente probables tendremos:
1
Pr(X = 0) = Pr(A1 ) = 8
3
Pr(X = 1) = Pr(A2 ) = 8
3
Pr(X = 2) = Pr(A3 ) = 8
1
Pr(X = 3) = Pr(A4 ) = 8

En general, las variables aleatorias pueden clasicarse como discretas y continuas.


Comenzaremos estudiando las características y propiedades de las variables aleatorias discretas
dejando para un poco más adelante el estudio de las continuas.

3.2. Variables aleatorias discretas


Comenzamos el análisis de las variables aleatorias discretas mediante la siguiente denición.
Denición 3.3. Si una variable aleatoria solo puede tomar un número nito o innito contable
de valores separados entre sí por alguna cantidad, la variable aleatoria recibe el nombre de discreta.

Es decir, si X es una variable aleatoria discreta, sus valores posibles se puede anotar de la siguiente
manera: x1 , x2 , ..., xi , ... etc. En el caso nito, la lista termina, en el caso innito, la lista continua
indenidamente.
La variable aleatoria

X = Número de caras obtenidas en tres lanzamientos de una moneda

68
es discreta y nita pues X = 0, 1, 2, 3.
Supongamos que de una línea de producción se selecciona aleatoriamente un producto hasta en-
contrar el primer defectuoso.
La variable aleatoria de interés para este caso es:

X = Número de extracciones realizadas hasta encontrar el primer defectuoso

Los valores posibles de esta variable son X = 1, 2, 3, ...etc, donde (X = 1) signica que se obtuvo el
primer defectuoso en la primera extracción, (X = 2), se obtuvo el primer defectuoso en la segunda
extracción, etc. En teoría, la lista de valores de la variable X no tiene límite.
Por lo tanto, X es una variable aleatoria discreta e innita.
Denición 3.4. La distribución de probabilidad de una variable aleatoria discreta es una tabla,
un gráco, una fórmula o cualquier otro medio que sirva para especicar todos los valores de la
variable junto con sus respectivas probabilidades.

En la Tabla (3.1) se muestra la forma tabular de la distribución de probabilidad de una variable


aleatoria discreta genérica.

X p(x) = Pr(X = x)
x1 p(x1 )
x2 p(x2 )
.. ..
. .
xn p(xn )

Tabla 3.1: Distribución de probabilidad de X

En la primera columna de la Tabla (3.1) se listan los valores de la variable X y en la segunda sus
probabilidades.
Para la variable aleatoria X del ejemplo que consiste en arrojar tres veces una moneda, su distri-
bución de probabilidad en forma tabular se muestra en la Tabla (3.2)

X p(x) = Pr(X = x)
0 1/8
1 3/8
2 3/8
3 1/8

Tabla 3.2: Distribución de probabilidad de X

Otra forma de presentar la distribución de probabilidad de la variable aleatoria

X = Número de caras obtenidas en los tres lanzamientos de una moneda

es mediante la Fórmula (3.1) que presentamos a continuación:


 
3! 1
p(x) = Pr(X = x) = con X = 0, 1, 2, 3 (3.1)
x!(n − x)! 8
donde 3! = 3 × 2 × 1 recibe el nombre de factorial de 3, y n es el igual al número de ensayos.
En general, el factorial de un número entero no negativo se dene de la siguiente manera:

n! = n(n − 1)(n − 2)...3 × 2 × 1

Por ejemplo, 5! = 5 × 4 × 3 × 2 × 1 = 120.

69
Algunas propiedades de la función factorial son las siguientes:

0! = 1
1! = 1

Vamos a comprobar ahora que la Fórmula (3.1) puede utilizarse también para calcular las proba-
bilidades de la variable X .
Por ejemplo, cuando (X = 0)
   
3! 1 3! 1 1
p(0) = Pr(X = 0) = = =
0!(3 − 0)! 8 3! 8 8

Cuando (X = 1)    
3! 1 3! 1 3
p(0) = Pr(x = 1) = = =
1!(3 − 1)! 8 2! 8 8

El resto de las probabilidades se pueden calcular de la misma manera.


La función p(x), que se utiliza para calcular la probabilidad de los valores de una variable aleatoria
discreta recibe el nombre de función de probabilidad.
También puede emplearse un diagrama de barras como el de la Figura (3.1) para presentar la
distribución de probabilidad de la variable X.
En el eje horizontal se registran los valores de la variable, y en el vertical sus respectivas probabi-
lidades.

Figura 3.1: Distribución de probabilidad de X

En cualquier caso, deben cumplirse dos requisitos para que una tabla, una fórmula un gráco o
cualquier mecanismo puedan considerarse como la distribución de probabilidad de una variable
aleatoria discreta.
Estos requisitos son los siguientes:

0 ≤ p(x) ≤ 1
P
x p(x) = 1

¾Cómo podemos relacionar las ideas de variable aleatoria y de distribución de probabilidad con los
conceptos que hemos desarrollado anteriormente, más precisamente en el Capítulo 1?
Supongamos que se lanza efectivamente tres veces una moneda un número grande de veces y se
registra el número X de caras observadas en cada lanzamiento.
El gráco de barras de frecuencias relativas para el conjunto de valores X = 0, 1, 2, 3 tendrá barras
cuyas alturas aproximadas serían 1/8, 3/8, 3/8 y 1/8.

70
De hecho, si fuera posible repetir el experimento un número muy grande de veces, la distribución
de frecuencias relativas de la variable X se vería muy parecida a el gráco de barras de la Figura
(3.1).
Podemos decir entonces que la distribución de probabilidad de la variable aleatoria discreta pro-
porciona un modelo para su distribución de frecuencias.

3.3. Valor esperado y varianza de una variable aleatoria dis-


creta
Hemos visto que la distribución de probabilidad de una variable aleatoria discreta proporciona un
modelo para su distribución de frecuencias relativas.
Por lo tanto, es de esperarse que cada distribución de probabilidad tenga asociada medidas similares
a las medidas descriptivas que se han denido para las distribuciones de frecuencias. Ciertamente
esto es así.
Comenzamos deniendo una medida teórica que es equivalente al concepto de media o promedio
de un conjunto de observaciones.
Esta medida recibe el nombre de valor esperado o esperanza de una variable aleatoria.
Denición 3.5. Sea X una variable aleatoria discreta que toma los valores x1 , x2 , ..., xn con
probabilidades p(x1 ), p(x2 ), ..., p(xn ). El valor esperado de X se dene de la siguiente manera:
n
(3.2)
X
E(X) = µ = xi p(xi ) = x1 p(x1 ) + x2 p(x2 ) + ... + xn p(xn )
i=1

¾Cómo se puede interpretar el concepto de valor esperado de una variable aleatoria? Veamos el
siguiente ejemplo.
Supongamos que dos jugadores A y B se enfrentan en un juego que consiste en lanzar una moneda
al aire. Si sale cara A gana un peso, pero si sale cruz A pierde un peso.
La variable aleatoria que representa la ganancia de A en el juego se puede denir de la siguiente
manera:

X =Ganancia de A en el juego de arrojar una moneda

Los valores que puede tomar X son los siguientes:

X = 1, −1

Si la moneda está balanceada, la probabilidad de obtener cara será igual a la de obtener cruz. La
distribución de probabilidad de X se muestra en la Tabla (3.3)

X p(x) = Pr(X = x)
-1 0,5
1 0,5

Tabla 3.3: Distribución de probabilidad de X

Por lo tanto, el valor esperado de X o ganancia esperada del jugar A es

E(X) = −1(0, 5) + 1(0, 5) = 0

Esto quiere decir que si A juega un gran número de veces el juego, en promedio, no perderá ni
ganará ninguna suma de dinero.
Volvamos nuevamente al experimento que consiste en arrojar tres veces una moneda balanceada.

71
El espacio muestral de este experimento lo hemos denido de la siguiente manera:

S = {CCC, CC+, C + C, +CC, C + +, +C+, + + C, + + +}

La distribución de probabilidad de la variable aleatoria

X = Número de caras obtenidas en los tres lanzamientos de una moneda

se muestra en la Tabla (3.2).


Por lo tanto, el valor esperado de X es el siguiente
       
1 3 3 1
E(X) = µ = 0 +1 +2 +3 = 1, 5
8 8 8 8
Suponga ahora que una variable aleatoria discreta X puede tomar los valores x1 , x2 , ..., xN todos
con igual probabilidad. Es decir: Pr(x1 ) = Pr(x2 ) = · · · = Pr(xn ) = N1 dado que se tienen N
valores posibles de la variable.
La distribución de probabilidad de X se muestra en la Tabla (3.4).

X p(x) = Pr(X = x)
x1 1/N
x2 1/N
.. ..
. .
xN 1/N

Tabla 3.4: Distribución probabilidad de X

Por lo tanto, la media o valor esperado de X es :


     
1 1 1 x1 + x2 + · · · + xn
E(X) = µ = x1 + x2 + · · · + xN =
N N N N
Pero esta última expresión no es más que la media o promedio de una población de N observaciones.
Por lo tanto, la media o promedio que denimos en el Capítulo 1 no es más que un caso particular
del valor esperado de una variable en la cual todos sus valores tienen igual probabilidad.
Dicho de otra manera, el valor esperado de una variable aleatoria es una media ponderada por
probabilidades. Las ponderaciones indican el peso que tiene cada valor de la variable en el conjunto
de valores.
Pero la media o valor esperado no es el único parámetro que caracteriza a una variable aleatoria
discreta.
Denición 3.6. Sea X una variable aleatoria que toma los valores x1 , x2 ..., xn con probabilidades
p(x1 ), p(x2 ), ..., p(xn ) respectivamente, la varianza de X se dene de la siguiente manera:
n
(3.3)
X
σ2 = (xi − µ)2 p(xi ) = (x1 − µ)2 p(x1 ) + (x2 − µ)2 p(x2 ) + · · · + (xn − µ)2 p(xn )
i=1

donde µ es la media o valor esperado de X .

Consideremos nuevamente el ejemplo de arrojar tres veces una moneda equilibrada. La varianza
de la variable aleatoria

X = Número de caras obtenidas en los tres lanzamientos de una moneda

se calcula de la siguiente manera:

72
       
1 3 3 1
σ 2 = (0 − 1, 5)2 + (1 − 1, 5)2 + (2 − 1, 5)2 + (3 − 1, 5)2 = 0, 75
8 8 8 8

La desviación estándar de una variable


√ aleatoria discreta se dene como igual a la raíz cuadrada
positiva de la varianza. O sea: σ = σ 2 .

Para los datos de nuestro ejemplo σ = 0, 75 = 0, 866.
Sea X una variable aleatoria discreta que toma los valores x1 , x2 , ..., xN todos con igual probabili-
dad. Entonces, la varianza de X es
     
2 2 1 2 1 2 1
σ = (x1 − µ) + (x2 − µ) + · · · + (xn − µ)
N N N
Por lo tanto:

(x1 − µ)2 + (x2 − µ)2 + · · · + (xn − µ)2


σ2 =
N
¾Qué conclusiones pueden obtenerse a partir de este último resultado?

3.4. Distribución de probabilidad acumulada


En muchas situaciones prácticas será necesario calcular la probabilidad de una variable aleatoria
X tome un valor menor o igual a un número real x0 .
La probabilidad de que X ≤ x0 se escribe F (x0 ) = Pr(X ≤ x0 ).
La función F (x0 ) recibe el nombre de función de distribución de probabilidad acumulada o función
de distribución.
Denición 3.7. Sea X una variable aleatoria discreta, la función

(3.4)
X
F (x0 ) = Pr(X ≤ x0 ) = p(xi ) = p(x1 ) + p(x2 ) + · · · + p(x0 )
x

recibe el nombre de función de distribución de probabilidad acumulada o simplemente función de


distribución.
Ejemplo 3.1. Considere el experimento lanzar tres veces una moneada balanceada y la variable
aleatoria X = Número de caras obtenidas en los tres lanzamientos de una moneda. Halar la función
de distribución de `probabilidad acumulada F (x).
Solución
En la Tabla (3.2) se presenta la distribución de probabilidad de la variable X .
Por lo tanto:
Si X ≤ 0, entonces

1
F (0) = Pr(X ≤ 0) =
8
Si X ≤ 1, entonces

1 3 4
F (1) = Pr(X ≤ 1) = p(0) + p(1) = + =
8 8 8
Si X ≤ 2, entonces

4 3 7
F (2) = Pr(X ≤ 2) = p(0) + p(1) + p(2) = + =
8 8 8

73
Finalmente, si X ≤ 3, entonces
7 1
F (3) = Pr(X ≤ 3) = p(0) + p(1) + p(2) + p(3) = + =1
8 8

Supongamos ahora que se quiera calcular Pr(X ≤ 0, 5).


Si se procede aplicando la denición de distribución de probabilidad acumulada se obtiene:
1 1
F (0, 5) = Pr(X ≤ 0, 5) = p(0) + p(0, 5) = +0=
8 8

dado que (X = 0, 5) no es un valor posible de la variable aleatoria.


Supongamos ahora que se quiera calcular Pr(X ≤ 4). Por lo tanto

F (4) = Pr(X ≤ 4) = 1 + 0 = 1

dado que (X = 4) tampoco es un valor posible de la variable.


La distribución de probabilidad de X y su función de distribución de probabilidad acumulada F (x)
de presentan en la Tabla (3.5).

X p(x) = Pr(X = x) F (x) = Pr(X ≤ x)


0 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 1

Tabla 3.5: Distribución de probabilidad acumulada de X

En la Figura (3.2) se muestra el grácos de F (x).

Figura 3.2: Función de distribución F (x)

Note la forma escalonada de la gráca de la función F (x).


Algunas propiedades de la función de distribución de una variable discreta X son las siguientes:

lı́mx→−∞ F (x) = 0

lı́mx→+∞ F (x) = 1

Si x1 < x2 entonces F (x1 ) ≤ F (x2 ) para cualquier par de números reales x1 y x2

74
3.5. Variable aleatorias continuas
Hemos visto al principio de este capítulo que las variables aleatorias se pueden clasicar como
discretas y continuas.
En las secciones anteriores analizamos las características y propiedades más importantes de las
variables aleatorias discretas.
En lo que sigue efectuaremos un análisis similar para las variables aleatorias continuas.
Comenzamos el estudio de las variables aleatorias continuas con la siguiente denición.
Denición 3.8. Una variable aleatoria es continua si puede tomar cualquier valor en un intervalo
real de valores posibles.
Supongamos que el administrador de control de calidad de una empresa dedicada a la fabricación
de productos de iluminación realiza un experimento consiste en seleccionar aleatoriamente una
lámpara de luz hogareña en una línea de producción y registrar el tiempo de duración de la
lámpara antes de fallar. La variable aleatoria
X =Tiempo de duración de la lámpara hogareña antes de fallar

es una variable aleatoria continua porque puede asumir, al menos en teoría, cualquier valor en el
intervalo 0 y 200 horas (valores hipotéticos)
Los experimentos que resultan en mediciones denen variables aleatorias continuas.
Existen algunas diferencias importantes en el tratamiento de las variables aleatorias discretas y
continuas. Estas diferencias siempre se deben tener en cuenta cuando se las analiza.
Recordemos que para una variable aleatoria discreta se puede calcular Pr(X = x), es decir, la
probabilidad de que la variable tome cierto valor especíco x.
Para las variables aleatorias continuas, el caso es muy distinto ya que la misma puede tomar
cualquier valor dentro de un intervalo real de la recta numérica.
Como en el intervalo real de valores posibles de la variable existen innitos valores, para calcular
Pr(X = x) aplicando la denición clásica de probabilidad, deberíamos dividir el número de veces
que ocurre el evento x por un número innito de valores. Debido a ello, el cociente siempre será
igual a cero.
x
Recuerde que un cociente como tiende a cero cuando el denominador crece sin límite.
n
En lugar de esto, debemos pensar en términos de calcular la probabilidad de que una variable
aleatoria continua tome un valor dentro de un intervalo de valores posible, es decir, calcular Pr(a ≤
X ≤ b).
Para describir las distribuciones discretas de probabilidad presentamos el concepto de función de
probabilidad p(x).
Esta función permite calcular la probabilidad de que una variable aleatoria discreta X tome un
valor especíco, es decir, p(x) = Pr(X = x).
En el caso continuo, la contraparte de la función de probabilidad es la función de densidad de
probabilidad representada por f (x) y denida de la siguiente manera:
Denición 3.9. Una función f (x) es una función de densidad de probabilidad de una variable
aleatoria continua X si cumple con las siguientes condiciones:

1. f (x) ≥ 0
 +∞
2. −∞ f (x)dx =1
b
3. Pr(a ≤ x ≤ b) = a
f (x)dx

Observación 3.1. Como f (x) ≥ 0 entonces Pr(a ≤ x ≤ b) = ab f (x)dx representa el área compren-
dida entre el gráco de f (x), la recta de los valores de X , y las rectas verticales x = a y x = b. Es
decir, para las variables aleatorias continuas, área y probabilidad son dos conceptos equivalentes.

75
En la Figura (3.3) se muestran grácamente las tres condiciones para que una función f (x) pueda
considerarse como la densidad de probabilidad de una variable aleatoria continua X .

Figura 3.3: Función de densidad de probabilidad f (x)

Algunas de las propiedades más importantes de la densidad de probabilidad f (x) de una variable
aleatoria continua X se presentan en el siguiente resultado:
Teorema 3.1. Si X es una variable aleatoria continua con densidad de probabilidad f (x), entonces
a
1. Pr(a ≤ X ≤ a) = a
f (x)dx = 0, es decir Pr(x = a) = 0
b
2. Pr(a ≤ X ≤ b) = a
f (x)dx = Pr(a < X < b)

Ejemplo 3.2. Sea X una variable aleatoria continua con densidad de probabilidad
(
x2
3 −1 < x < 2
f (x) =
0 en otro caso

1. Vericar que f (x) cumple con las dos primeras condiciones de la denición de densidad de
probabilidad
2. Calcular Pr(0 < X ≤ 1)

Solución
En la Figura (3.4) se muestra el gráco de f (x).

Figura 3.4: Densidad de probabilidad f (x)

76
Primer punto
La primera condición para que f (x) a sea la densidad de probabilidad de la variable aleatoria X
es que f (x) ≥ 0, es decir, las imágenes en su dominio de denición deben ser siempre no negativas.
Esta condición se cumple por la denición misma de la función f (x) pues en el intervalo (−1 < X < 2),
f (x) se dene como un polinomio de segundo grado con ordenada al origen igual a cero.
Por lo tanto f (x) > 0 para todos los valores de X en dicho intervalo.
En el resto de los valores de X en su dominio de denición resulta f (x) = 0. De esta manera se
verica el cumplimiento de la primera condición.
 +∞
La segunda condición establece que −∞ f (x)dx = 1
Como la función esta denida por tramos, debemos calcular la integral también por tramos.
Procediendo de esta manera obtendremos:
 +∞  −1  2  +∞
1 2
f (x)dx = 0dx + x dx + 0dx
−∞ −∞ 3 −1 2

O sea
 +∞  2
1 1  3 2 1
f (x)dx = x2 dx = x −1 = (8 + 1) = 1
−∞ 3 −1 9 9
Se cumple la segunda condición.

Segundo punto
A partir de la tercera condición de la denición de densidad de probabilidad:
 1
1 1 2 1
Pr(0 < X < 1) = x2 dx = (1 − 03 ) =
3 0 9 9
Téngase presente este resultado pues lo volveremos a calcular por otro método un poco más ade-
lante.

3.6. Función de probabilidad acumulada


Como en el caso discreto, en algunas situaciones prácticas será necesario calcular la probabilidad
de que un variable aleatoria continua X tome un valor menor o igual al número real x0 .
Para ello denimos la función de probabilidad acumulada para una variable aleatoria continua de
la siguiente manera:.
Denición 3.10. Sea X una variable aleatoria continua con densidad de probabilidad f (x). La
función
 x0
F (x0 ) = Pr(X ≤ x0 ) = f (t)dt para −∞ < x0 < ∞ (3.5)
−∞

donde f (t) es la función de densidad de probabilidad de la variable aleatoria X parametrizada en


t recibe el nombre de función de probabilidad acumulada o simplemente función de distribución de
la variable X .

Algunas de las propiedades de F (x) son las siguientes:

lı́mx→−∞ F (x) = 0

lı́mx→+∞ F (x) = 1

77
Si x1 < x2 entonces F (x1 ) ≤ F (x2 ) para cualquier par de números reales x1 y x2

Otras propiedades de F (x) son las siguientes:


Teorema 3.2. Si f (x) y F (x) son respectivamente las funciones de densidad de probabilidad y
función de probabilidad acumulada de una variable aleatoria continua X , entonces:
b
1. Pr(a ≤ X ≤ b) = a
f (x)dx = F (b) − F (a)

2. f (x) = dF (x)
dx en los valores de X donde exista la derivada.
Ejemplo 3.3. Para la función de densidad f (x) del Ejemplo (3.2) encuentre F (x) y úsela para
evaluar Pr(0 < X ≤ 1).

Solución
Si X ≤ −1  x
f (x) = 0 ⇒ F (x) = 0dt = 0
−∞

Si −1 < X < 2   x
−1 x
x3 + 1

1 2 1 3
F (x) = 0dt + t dt = t =
−∞ 3 −1 9 −1 9

Si X ≥ 2
 −1  2  +∞  2  2
1 2 1 3 1
F (x) = 0dt + t dt + 0dt = t = t2 dt
−∞ 3 −1 2 9 −1 3 −1

Luego
 2
1 1  3 2 1
F (x) = t2 dt = t −1 = (8 + 1) = 1
3 −1 9 9
Por lo tanto 
0
 x ≤ −1
1
F (x) = (x3 + 1) −1 < x < 2
9
1 x≥2

Podemos utilizar F (x) para calcular probabilidades. Por ejemplo


13 + 1 03 + 1 1
Pr(0 < X ≤ 1) = F (1) − F (0) = − =
9 9 9

En la Figura (3.5) se muestra la gráca de F (x).

Figura 3.5: Función de distribución de probabilidad acumulada F (x)

78
3.7. Valor esperado y varianza de una variable aleatoria con-
tinua
Denimos a continuación dos de las medidas descriptivas numéricas más importantes que caracte-
rizan a toda variable aleatoria continua. Se trata de la media o valor esperado y su varianza.
Denición 3.11. Sea X una variable aleatoria continua con función de densidad f (x), su media
o valor esperado se denen de la siguiente manera:
 +∞
µ= xf (x)dx (3.6)
−∞

Puede verse que se trata de una denición muy parecida a la del valor esperado de una variable
aleatoria discreta solo que en lugar de sumatorias se utilizan integrales.
Denición 3.12. Sea X una variable aleatoria con densidad de probabilidad f (x), la varianza de
X se dene de la siguiente manera:

 +∞
σ2 = (x − µ)2 f (x)dx (3.7)
−∞

donde µ es su media o valor esperado.


La desviación√estándar de la variable X se dene como la raíz cuadrada positiva de la varianza,
es decir σ = σ 2 .
Ejemplo 3.4. Suponga que una variable aleatoria X tiene la siguiente densidad de probabilidad:
(
0, 05 0 ≤ X ≤ 20
f (x) =
0 en cualquier otro caso

calcular su valor esperado y su varianza.

Solución
Aplicando la denición de media o valor esperado de una variable aleatoria continua
 20  20
E(X) = µ = x(0, 05)dx = 0, 05 xdx
0 0

Por lo tanto

0, 05  2 20 0, 05
E(X) = µ = x 0 = (202 − 02 ) = 10
2 2
De acuerdo con la denición de varianza de una variable aleatoria
 20
σ2 = (x − 10)2 (0, 05)dx
0

Luego
 20 20
(x − 10)3

σ 2 = 0, 05 (x − 10)2 dx = 0, 05 = 33, 33
0 3 0

Por lo tanto σ = 33, 33 = 5, 77.

79
3.8. Modelos de distribución de probabilidad. Variables alea-
torias discretas
Analicemos los siguientes experimentos y sus resultados correspondientes:

Primer experimento
Se lanza una moneda al aire tres veces y se registran los resultados obtenidos
Variable de interés: X = Número de caras obtenidas en los tres lanzamientos
Espacio muestral: S1 = {CCC, CC+, C + C, +CC, C + +, +C+, + + C, + + +}
Valores de la variable: X = 0, 1, 2, 3

Segundo experimento
Se seleccionan tres artículos al azar y se los clasica como defectuoso (D) o no defectuoso
(N )

Variable de interés: Y = Número de artículos defectuosos en una muestra de tamaño tres


Espacio muestral: S2 = {DDD, DDN, DN D, N DD, DN N, N DN, N N D, N N N }
Valores de la variable: Y = 0, 1, 2, 3

Pueden verse claramente las similitudes de los dos experimentos y sus resultados.
Sería muy tedioso, y llevaría mucho tiempo estudiar en forma individual las propiedades de variables
aleatorias generadas por experimentos aleatorios de características muy parecidas como los dos
anteriores.
Debido a ello, se han desarrollado modelos de distribuciones de probabilidad que describen expe-
rimentos con características similares y que además generan a variables aleatorias con idénticas
propiedades.
Comenzamos analizando algunos de los modelos de distribución de probabilidad para variables
aleatorias discretas más utilizados en Administración y Economía.

3.8.1. Distribución Binomial


La distribución Binomial es el modelo adecuado para describir experimentos con las siguientes
características:

1. El experimento consiste en realizar n pruebas idénticas


2. Cada prueba tiene dos posibles resultados denominados arbitrariamente E (éxito) y F (fracaso)
3. La probabilidad de éxito Pr(E) = p y la probabilidad de fracaso Pr(F ) = 1 − p = q se
mantienen constantes a lo largo de todas las pruebas. Note que p + q = 1
4. Los resultados de las pruebas son independientes

Los experimentos aleatorios con estas características reciben el nombre de experimentos binomiales.
Para un experimento Binomial la variable aleatoria de interés es la siguiente:

X = Número de éxitos obtenidos en los n ensayos binomiales

80
Sus valores son los siguientes: X = 0, 1, ..., n.
¾Cómo se interpretan los valores de la variable? Por ejemplo si (X = 0) signica que se realizaron
las n pruebas y no se obtuvo ningún éxito, si (X = 1) signica que se realizaron n pruebas y se
obtuvo un éxito, etc.
Es posible demostrar que si una variable aleatoria X tiene distribución Binomial, su función de
probabilidad es la siguiente:

n!
p(x) = Pr(X = x) = px q n−x (3.8)
x!(n − x)!

Además, si X una variable aleatoria con distribución Binomial, entonces E(X) = np y σ 2 = npq .

Además σ = npq .
Los números n y p reciben el nombre de parámetros de la distribución. Para cada combinación de
sus valores se tiene una distribución Binomial diferente.
Si una variable aleatoria discreta X tiene distribución Binomial de parámetros n y p se escribe
X ∼ B(n, p).
Por ejemplo, suponga que X ∼ B(n = 5, p = 0, 25).
Los valores que puede tomar esta variable son X = 0, 1, 2, 3, 4, 5
La función de probabilidad de X para n = 5 y p = 0, 25

5!
p(x) = Pr(X = x) = (0, 25)x (0, 75)5−x
x!(5 − x)!

Entonces, si (X = 0)

5!
p(0) = Pr(X = 0) = (0, 25)0 (0, 75)5 = 0, 237
0!(5 − 0)!

Si (X = 1)

5!
p(1) = Pr(X = 1) = (0, 25)1 (0, 75)4 = 0, 395
1!(5 − 4)!

Se puede proceder de la misma manera para encontrar las probabilidades de los restantes valores
de la variable.
En la Tabla (3.6) se muestra el resultado nal.

X p(x) = Pr(X = x)
0 0,237
1 0,395
2 0,263
3 0,087
4 0,014
5 0,001

Tabla 3.6: Distribución Binomial n = 5, p = 0, 25

En la Figura (3.6) se presenta la distribución de la variable X ∼ B(n = 5; p = 0, 25).

81
Figura 3.6: Distribución de probabilidad de X ∼ B(n = 5; p = 0.25)

Puede verse que el gráco de la distribución de probabilidad de X ∼ B(n = 5; p = 0, 25) es sesgado


a derecha.
Ahora bien, suponga que X ∼ B(n = 5, p = 0, 5). Es decir, mantenemos igual el número de intentos
pero cambiamos la probabilidad de éxito.
Como en el ejemplo anterior, calculemos las probabilidades de ocurrencia de cada uno de los valores
de X .
Para n = 5 y p = 0, 5 la función de probabilidad es:

5!
p(x) = Pr(X = x) = (0, 5)x (0, 5)n−x
x!(5 − x)!

además X = 0, 1, 2, 3, 4, 5 como en el ejemplo anterior.


Por lo tanto, si (X = 0)

5!
p(0) = Pr(X = 0) = (0, 5)0 (0, 5)5 = 0, 031
0!(5 − 0)!

Si (X = 1)

5!
p(1) = Pr(X = 1) = (0, 50)(0, 5)4 = 0, 156
1!(5 − 1)!

Procediendo de manera semejante se pueden encontrar las probabilidades de los restantes valores
de X .
Los resultados se presentan en la Tabla (3.7).

X p(x) = Pr(X = x)
0 0,031
1 0,156
2 0.312
3 0,315
4 0,156
5 0,031

Tabla 3.7: Distribución Binomial n = 5, p = 0, 5

En la Figura (3.7) se muestra la distribución de X ∼ B(n = 5, p = 0, 5) en forma gráca.

82
Figura 3.7: Distribución de probabilidad de X ∼ B(n = 5; p = 0.5)

Puede verse que el gráco de la distribución de probabilidad de X ∼ B(n = 5, p = 0, 5) es simétrico.


En los ejemplos precedentes tenemos el mismo número de ensayos, n = 5, pero distintas probabi-
lidades de éxito, p = 0, 25 en un caso y p = 0, 5 en el otro. vemos pues que cambiando uno o los
dos parámetros se tiene una distribución Binomial diferente.
En el ejemplo que sigue se muestra cuál es la utilidad práctica de este modelo.
Ejemplo 3.5. Una fábrica de lámparas eléctricas produce con un 10 % de unidades defectuosas.
Se selecciona una muestra de 10 lámparas. ¾Cuál es la probabilidad de encontrar

1. Ninguna defectuosa
2. Cuatro defectuosas
3. Como máximo 2 defectuosas

Solución
Asumimos que X tiene distribución Binomial.
Variable aleatoria:

X = Número de lámparas defectuosas en una muestra de 10

Valores posibles: X = 0, 1, 2, 3, . . . , 10. Además: n = 10 y p = 0, 10.

Primer punto

10!
p(0) = Pr(X = 0) = (0, 10)0 (0, 90)10−0 = 0, 348
0!(10 − 0)!

Segundo punto

10!
p(4) = Pr(X = 4) = (0, 10)4 (0, 90)10−4 = 0, 011
4!(10 − 4)!

Tercer punto

Pr(X ≤ 2) = Pr(X = 0) + Pr(X = 1) + Pr(X = 2) = 0, 9298

Este último resultado se obtiene aplicando reiteradamente de la función de probabilidad binomial.

83
Además E(X) = np = 10(0, 10) = 1 y σ 2 = npq = 10(0, 10)(0, 90) = 0, 90.

Finalmente, σ = 0, 90 = 0, 948.
Debe tenerse muy en cuenta que el uso del modelo binomial solo debe llevarse a cabo si se cumplen
las condiciones de un experimento binomial.
Un punto clave es el que arma que la probabilidad de éxito debe permanecer constante de ensayo
a ensayo, condición que no siempre se cumple.
Si el experimento consiste en tomar muestras de una población, el modelo binomial se puede aplicar
cuando la muestra se toma con reposición de una población nita.
Si se selecciona la muestra de esta manera, la probabilidad de éxito permanecerá constante.
Sin embargo, en la práctica suele ser más lógico tomar muestras sin reposición de poblaciones nita.
De esta manera se evita la posibilidad de analizar dos veces la misma unidad.
En estos casos debe tenerse mucho cuidado al aplicar la distribución Binomial.
Existe un consenso general de cuando el tamaño de la población es por lo menos 20 veces el
tamaño de la muestra, es posible utilizar la distribución Binomial aún cuando la muestra se tome
sin reposición de una población nita.
De esta manera se asegura que la probabilidad de éxito se mantendrá aproximadamente constante.
Resumiendo:
Si se toman muestras sin reposición de una población nita, la distribución Binomial podrá
utilizarse siempre y cuando N ≥ 20n o equivalentemente Nn ≤ 0, 05 siendo n el tamaño de la
muestra y N el tamaño de la población
La cantidad n
recibe el nombre de fracción de muestreo.

N

Ejemplo 3.6. En una provincia de 1.000.000 de habitantes estudios de mercado anteriores han
determinado que el 40 % de la población consume determinada marca de yerba mate. Se toma una
muestra sin reposición de 10 personas. ¾Cuál es la probabilidad de que 3 personas consuman la
marca de esta yerba?

Solución
Como Nn ≤ 0, 05 se puede utilizar el modelo Binomial aún cuando la muestra se toma sin reemplazo.
Variable de interés:

X = Número de personas que consumen la marca de yerba en una muestra de tamaño 10

Valores posibles: X = 0, 1, 2, . . . , 10.


Parámetros de la distribución: p = 0, 40 y q = 1 − 040 = 0, 60.
Se pide calcular p(3) = Pr(X = 3).
Función de probabilidad

10
p(x) = Pr(X = x) = (0, 40)x (0, 60)10−x
x!(10 − x)!
Por lo tanto:

10!
p(3) = Pr(X = 3) = (0, 40)3 (0, 60)7 = 0, 2150
3!(10 − 3)!

3.8.2. Distribución Hipergeométrica


La distribución Hipergeométrica es otro de los modelos de distribución de probabilidad para varia-
bles aleatorias discretas más utilizadas en la práctica. Por ejemplo, el control estadístico de calidad
en las empresas hacen un uso intensivo de esta distribución.
La experiencia que genera una variable aleatoria hipergeométrica tiene las siguientes características:

84
1. El experimento consiste en extraer al azar y sin reposición n unidades observacionales de una
conjunto de N unidades, Ne de las cuales resultan éxito y Nf = N − Ne resultan fracaso
2. La probabilidad de obtener un éxito no permanece constante
3. Los resultados de las pruebas no son independientes
La variable aleatoria de interés en un experimento con estas propiedades es la siguiente:
X = Número de resultados éxitos en una muestra de n elementos

Los valores que puede asumir X son los siguientes:


X = 0, 1, 2, ..., mínimo valor entre n y Ne

Por ejemplo, si en una población existen Ne = 50 éxitos y n = 10, el conteo de los valores de la
variable aleatoria puede ir hasta n = 10.
En otro caso, si n = 50 pero Ne = 5 el conteo de los valores de la variable aleatoria puede ir a los
sumo hasta 5 a pesar de que la muestra es de 50 unidades observacionales.
Puede demostrarse que la función de probabilidad de una variable aleatoria con distribución Hi-
pergeométrica es la siguiente:
Ne Nf
 
p(x) = Pr X = x) = x
N
n−x
 (3.9)
n

En la Fórmula (3.9) aparecen expresiones como Nxe o n−x Nf


que reciben el nombre de números
 

combinatorios.
En genera, si n y x son dos números enteros no negativos tales que n ≥ x , la expresión nx recibe


el nombre de número combinatorio y se dene de la siguiente manera:


 
n n!
=
x x!(n − x)!

Por ejemplo, si n = 5 y x = 3, entonces


 
5 5! 5! 120
= = = = 10
3 3!(5 − 3)! 3!(2!) 6(2)

Otra forma de expresar el número combinatorio x es la siguiente: n Cx .


n


Algunas de las medidas descriptivas numéricas que caracterizar una variable aleatoria con distri-
bución hipergeométrica son las siguientes:
Media o valor esperado:  
Ne
E(X) = n
N
Varianza:
   
2 Ne Ne N −n
V (X) = σ = n 1−
N N N −1

Desviación estándar: σ = σ2 .
En estas fórmulas
N = Número de unidades observacionales de la población
Ne = Número de éxitos en las N unidades observacionales
Nf = 1 − Ne = Número de fracasos en las N unidades observacionales

85
n = Número de unidades seleccionadas en la muestra

X = Número de éxitos en las n unidades seleccionadas


 
El factor N −n
N −1 en la varianza de la variable X recibe el nombre de factor de corrección para
poblaciones nitas.
Note que el factor de corrección para poblaciones nitas tiene a uno si N es muy grande respecto
del tamaño de la muestra n. Es decir:
 
N −n
lı́m =1
N →∞ N −1

como puede vericarse aplicando las técnicas estándar del cálculo de límites.
De ser así, puede prescindirse del factor corrección en el cálculo de la varianza resultando
  
Ne Ne
σ2 = n 1−
N N
.Una forma práctica de determinar si N es lo sucientemente grande respecto del tamaño de la
muestra es que se cumplan algunas de las siguientes condiciones equivalentes: N ≥ 20n o bien
N ≤ 0, 05.
n

Vemos a continuación la utilidad práctica de la distribución Hipergeométrica.


Ejemplo 3.7. Al auditar 87 cuentas por pagar en una compañía, se toma una muestra de 10
de las 87 cuentas sin reposición. De las 87 cuentas, 13 tienen errores. Encuentre la probabilidad
de que en dicha muestra, 2 contengan errores. Calcular además el valor esperado, la varianza y
la desviación estándar de la variable aleatoria número de cuentas con errores en una muestra de
tamaño 10.

Solución
Datos: N = 87, n = 10, Ne = 13 y Nf = 87 − 13 = 74.
Variable aleatoria:

X =Número de cuentas con errores en una muestra de 10 cuentas

Valores posibles: X = 0, 1, 2, ..., 10


Por lo tanto:
13 74
 
2 8
Pr(X = 2) = p(2) = 87
 = 0, 294
10

Por otro lado: E(X) = 10 13



87 = 1, 49
 
Además: σ 2 = 10 13 13 87−10
 
87 1− 87 87−1 = 1, 137 ⇒ σ = 1, 066

3.8.3. Distribución de Poisson


La distribución de Poisson proporciona un modelo adecuado para calcular la probabilidad de
ocurrencia de eventos por unidad de área, volumen, tiempo, etc.
El número de personas que ingresan a un banco cada hora en busca de algún servicio, el número
de accidentes laborales en una plante fabril cada mes, el número de errores por páginas cometidas
por una persona el transcribir un largo documento con la computadora, etc. son variables alea-
torias cuya distribución de probabilidad se pueden modelar, bajo ciertas condiciones, mediante la
distribución de Poisson.
Las características de un experimento de Poisson son las siguientes:

86
1. El experimento consiste en contar el número X de veces que ocurre un evento particular por
unidad de medida (tiempo, área, volumen, etc.)
2. La probabilidad de que un evento ocurra por unidad de medida es la misma para todas las
unidades
3. El número de eventos que ocurren en una unidad de medida es independiente de los que
ocurren en otra unidad de medida
4. El número promedio o esperado de eventos por unidad de medida es constante y se denota
con la letra griega λ (letra griega landa)
En general, una variable aleatoria de Poisson se dene de la siguiente manera:
X = Número de ocurrencias de un evento por unidad de medida

La función de probabilidad de de una variable con distribución de Poisson es la siguiente:

e−λ λx
p(x) = Pr(X = x) = con X = 0, 1, 2, ... (3.10)
x!
donde λ es el número medio de eventos por unidad de medida.
Puede demostrarse que la media o valor esperado, la varianza√ y la desviación estándar de una
variable de Poisson son E(X) = λ, V (X) = σ 2 = λ y σ = λ respectivamente.
Para cada valor de λ se tiene un distribución de Poisson diferente, es decir, λ es el único parámetro
del modelo.
Ejemplo 3.8. Suponga que el número promedio de llamadas telefónicas que llegan a una central
telefónica es de 0, 5 llamadas por minuto. Hallar la probabilidad de que:
1. En un minuto no lleguen llamadas
2. En un minuto lleguen más de tres llamadas
3. En tres minutos lleguen menos de cinco llamadas
Solución

Primer punto
Variable aleatoria:
X = Número de llamadas que ingresan a la central cada minuto

De acuerdo con los datos del problema λ = 0, 5.


Por lo tanto:
e−0,5 (0, 5)0
Pr(X = 0) = p(0) = = 0, 606
0!
Es decir, la probabilidad de que en un minuto no ingresen llamadas es 0, 606.

Segundo punto
Se pide calcular Pr(X > 3). Como Pr(X > 3) y Pr(X ≤ 3) son eventos complementarios se cumple
la siguiente relación:

Pr(X > 3) + Pr(X ≤ 3) = 1 ⇒ Pr(X > 3) = 1 − Pr(X ≤ 3)


Por lo tanto:

0, 50 0, 51 0, 52 0, 53
 
−0,5
Pr(X > 3) = 1 − e + + + = 1 − 0, 998 = 0, 002
0! 1! 2! 3!

87
Tercer punto
Variable aleatoria:
Y = Número de llamadas que ingresan a la central cada tres minutos

El número medio de llamadas cada tres minutos se calcula de la siguiente manera. Si en un minuto
ingresan 0, 5 llamadas, en tres minutos ingresarán

3 × 0, 5
λ1 = = 1, 5
1
Es decir, se espera que ingresen λ1 = 1, 5 llamadas cada tres minutos.
Luego:

1, 50 1, 51 1, 54
 
−1,5
Pr(Y < 5) = e + + ··· + = 0, 981
0! 1! 4!
aplicando reiteradamente el modelo de Poisson.

3.9. Modelos de densidad de probabilidad para variables alea-


torias continuas
Como en el caso de las variables aleatorias discretas, existen modelos de densidad de probabilidad
que pueden utilizarse para describir las propiedades de variables aleatorias continuas con ciertas
propiedades.
Una de ellas es la distribución Normal de múltiples aplicaciones teóricas y prácticas.
En la sección siguiente deniremos la densidad de probabilidad Normal de una variable aleato-
ria continua, analizaremos sus propiedades y veremos algunas de sus aplicaciones prácticas más
importantes.

3.9.1. La distribución Normal


Teóricamente, la distribución Normal puede obtenerse a partir de la distribución Binomial cuando
el número de intentos se hace muy grande.
Es decir, la distribución Binomial tiende a la distribución Normal cuando n tiende a innito.
Sin embargo, la importancia de la distribución Normal va mucho más allá que la de proporcionar
aproximaciones a la distribución Binomial.
Muchos fenómenos en Administración y Economía generan variables que pueden modelarse apro-
ximadamente por medio de la distribución Normal.
Comenzamos su estudio con la denición de la distribución de probabilidad Normal:
Denición 3.13. Se dice que una variable aleatoria X tiene distribución Normal si su densidad
de probabilidad es
1 (x−µ)2
f (x) = √ e− 2σ2 (3.11)
σ 2π
donde x yµ son dos números reales cualesquiera y σ > 0.
Puede demostrarse que si X es una variable aleatoria con distribución Normal, entonces E(X) = µ
y V (X) = σ 2 .
La media y la varianza son cantidades que caracterizan la distribución. Para cada combinación de
valores posibles de µ y σ 2 se tendrá una densidad de probabilidad diferente.
Supongamos que X una variable aleatoria con distribución de probabilidad Normal, entonces:

88
f (x) > 0
La gráca de la función de densidad de probabilidad Normal es simétrica y con forma de
campana. El valor de µ está en el centro de la distribución mientras que σ es una medida
de la dispersión de los valores de la variable X respecto de µ. En la Figura (3.8) muestra el
gráco típico la densidad de probabilidad Normal para una variable X con esta distribución

Figura 3.8: Distribución Normal de probabilidad


 +∞
−∞
f (x)dx = 1

El valor máximo de f (x) ocurre cuando x = µ siendo en valor del extremo √1


σ 2π
b
Pr(a ≤ X ≤ b) = a
f (x)dx
Para una variable X con distribución Normal se cumple que
ˆ El intervalo [µ − σ < X < µ + σ] contiene aproximadamente el 68 % de las observaciones
de la variable
ˆ El intervalo [µ − 2σ < X < µ + 2σ] contiene aproximadamente el 95 % de las observa-
ciones de la variable
ˆ El intervalo [µ − 3σ < X < µ + 3σ] contiene aproximadamente el 99 % de las observa-
ciones de la variable
Para cualquier variable aleatoria que tenga distribución Normal
ˆ Pr(µ − σ < X < µ + σ) = 0, 68 aproximadamente
ˆ Pr(µ − 2σ < X < µ + 2σ) = 0, 95 aproximadamente
ˆ Pr(µ − 3σ < X < µ + 3σ) = 0, 99 aproximadamente

Si una variable aleatoria X tiene distribución Normal con media µ y varianza σ 2 se escribe X ∼
N (µ, σ 2 ).
Hemos dicho que para cada valor de µ y de σ 2 existe una distribución Normal diferente.
En la Figura (3.9) se muestran los grácos de algunas variables con distribución Normal para
distintas combinaciones de los valores de µ y σ 2
Note que a medida que aumenta la varianza de la distribución la curva se hace más aplanada.
Una vez que se han presentados las principales características de la distribución Normal, el siguiente
paso es determinar como se calculan probabilidades con esta densidad de probabilidad.
En principio, si una variable aleatoria X tiene distribución Normal y es necesario calcular Pr(a ≤
X ≤ b), deberíamos proceder de la siguiente manera:
 b
Pr(a ≤ X ≤ b) = f (x)dx
a

89
Figura 3.9: Distribuciones normales para distintas medias y varianzas

donde f (x) es la densidad de probabilidad Normal.


Sin embargo, existe un inconveniente técnico que impide proceder de esta manera. Resulta que la
función f (x) no tiene primitiva, es decir no existe una función F (x) tal que dFdx(x) = f (x).
Por lo tanto, no se pueden aplicar las técnicas estándar de integración. Debemos buscar un camino
alternativo. Pero para ello debemos realizar algunas deniciones adicionales previas.

3.9.2. Distribución Normal Estándar


Hemos visto que la distribución Normal es en realidad una familia de distribuciones en la que un
miembro particular de la la familia se distingue de otro según los valores de los parámetros µ y σ 2 .
El miembro más importante de la familia es la distribución Normal Estándar cuya media vale cero
(µ = 0) y su varianza es igual a uno (σ 2 = 1).
Es común simbolizar la distribución Normal Estándar con la letra Z para diferenciarla de las
restantes posibilidades. Es decir Z ∼ N (0, 1).
Con estas simplicaciones, la distribución de probabilidad Normal Estándar se dene de la siguiente
manera:

1 2
f (z) = √ e−(z /2) (3.12)

donde z es cualquier número real.
Entonces, para calcular la probabilidad de que Z tome un valor entre z0 y z1 , es decir, para
calcular Pr(z0 ≤ Z ≤ z1 ) debería realizarse el siguiente cálculo:
 z1
1 2
Pr(z0 ≤ Z ≤ z1 ) = √ e−z /2 dz
z0 2π

Por fortuna este cálculo no es necesario porque existen tablas disponibles que proporcionan los
resultados de todas las integraciones en las que se pueda estar interesados.
En la Figura (3.10) prestamos una de estas tablas.
La tabla suministra los valores de:
 z0
F (z0 ) = Pr(Z ≤ z0 ) = f (z)dz
−∞

90
Figura 3.10: Tabla de probabilidades. Distribución Normal Estándar

Se reconocerá a F (z) como la función de densidad de probabilidad acumulada de la variable


aleatoria Z .
Por ejemplo,supongamos que se quiera calcular la probabilidad de que Z sea menor o igual a 0, 54.
Es decir, se quiere calcular Pr(Z ≤ 0, 54).
Se debe proceder de la siguiente manera:

1. Se ubica en la primera columna de la tabla el valor más cercano a Z = 0, 54 que en este caso
es 0, 5
2. En la primera la de la tabla se ubica el valor de Z tal que 0, 5 + Z = 0, 54. En este caso es
z = 0, 04
3. En la intersección de la la rotulada con el valor 0, 5 y la columna rotulada con el valor 0, 04
se obtiene la probabilidad correspondiente que en este caso es 0, 7054. Es decir, F (0, 54) =
Pr(Z ≤ 0, 54) = 0, 7054

En la parte superior izquierda de la tabla se muestra el valor de F (0, 54) = Pr(Z ≤ 0, 54) = 0, 7054.
En la parte superior derecha se graca el área acumulada desde −∞ hasta z0 = 0, 54.
Veamos algunos ejemplos adicionales.
Ejemplo 3.9. Para la variable aleatoria Z con distribución Normal Estándar calcular las siguien-
tes probabilidades:

1. Pr(Z ≤ 2)
2. Pr(−2, 74 ≤ Z ≤ 1, 53)
3. Pr(Z ≥ 0, 5)

Solución

Primer punto
De acuerdo con la equivalencia de área y probabilidad para las variables aleatorias continuas
debemos calcular el área bajo la gráca de f (z) desde −∞ hasta z0 = 2.
El área buscada se muestra en la Figura (3.11).
¾Como se procede? En la primera columna de nuestra tabla se busca el valor z = 2. Como no hay
que agregar nada a este valor, la probabilidad buscada esta en la intersección de la la de z = 2 y
la columna 0, 00. Por lo tanto Pr(Z ≤ 2) = F (2) = 0, 9772.

91
Figura 3.11: Probabilidad de que Z sea menor o igual a 2

Segundo punto
El área o probabilidad buscada se muestra en la Figura (3.12).

Figura 3.12: Probabilidad de que Z se encuentre comprendido entre −2, 54 y 1, 53

Se pide calcular
Pr(−2, 74 ≤ Z ≤ 1, 53) = Pr(Z ≤ 1, 53) − Pr(Z ≤ −2, 74) = F (1, 53) − F (−2, 74)
Por lo tanto

Pr(−2, 74 ≤ Z ≤ 1, 53) = 0, 9370 − 0, 003 = 0, 9339

Tercer punto
La probabilidad buscada se muestra en la Figura (3.13).
Como Pr(Z ≥ 0, 5) y Pr(Z ≤ 0, 5) son eventos complementarios podemos escribir

Pr(Z ≥ 0, 5) + Pr(Z ≤ 0, 5) = 1
Por lo tanto

Pr(Z ≥ 0, 5) = 1 − Pr(Z ≤ 0, 5)
Luego

Pr(Z ≥ 0, 5) = 1 − 0, 6915 = 0, 3085

92
Figura 3.13: Probabilidad de que Z sea mayor o igual a 0, 5

3.9.3. Aplicaciones de la distribución Normal


Hasta el momento solo hemos analizado como calcular probabilidades para una variable con dis-
tribución Normal Estándar.
¾Como calcular probabilidades para una variable aleatoria con una distribución Normal cualquiera?
Es decir, ¾como calcular probabilidades para una variable aleatoria X si X ∼ N (µ, σ 2 ) donde µ es
cualquier número real y σ 2 es cualquier número real positivo?
Para ello se deben transformar los valores de la variable X en sus valores correspondientes Z .
Esta transformación se realiza a partir de la siguiente fórmula:

X −µ
Z= (3.13)
σ
donde µ y σ son la media y la desviación aleatoria de la variable aleatoria X .
Es decir, si a todos los valores de la variable aleatoria X se le resta su media µ y a ese resul-
tado se lo divide por su desviación estándar σ , los valores de X se transforman en sus valores Z
correspondientes.
A este proceso se lo denomina estandarización o tipicación de la variable aleatoria X . Este proceso
se muestra grácamente en la Figura (3.14).

Figura 3.14: Proceso de estandarización o de tipicación de la variable X ∼ N (µ, σ 2 )

En la Figura (3.14) se indica que:

93
Al realizar la diferencia X − µ obtenemos una nueva variable aleatoria normal con media
cero ( se cambia el origen)
Al dividir esta diferencia por σ se cambia la escala de medición obteniéndose la variable Z
que como sabemos tiene medios cero y varianza igual a uno

Veamos como se procede con en el siguiente ejemplo.


Ejemplo 3.10. Suponga que la variable aleatoria X tiene distribución Normal con media µ = 10
y varianza σ 2 = 6, 25. Calcular Pr(X ≤ 11).

Solución
En primer lugar ese transforma X = 11 en su correspondiente valor Z .
Lo hacemos de la siguiente manera:

x−µ 11 − 10
z= = √ = 0, 4
σ 6, 25
Por lo tanto
Pr(X ≤ 11) = Pr(Z ≤ 0, 4)

Por lo tanto

Pr(X ≤ 11) = Pr(Z ≤ 0, 4) = 0, 6554

Aunque su importancia en el campo de la Estadística es indiscutible, no existe ninguna variable


aleatoria que tenga exactamente distribución Normal.
Sin embargo, muchas de las variables que ocurren en Administración y Economía tienen distribución
aproximadamente Normal.
Por lo tanto, este modelo de densidad de probabilidad puede utilizarse para estudiar las propiedades
de muchas variables de interés práctico.
Ejemplo 3.11. Los ingresos mensuales de los gerentes de una gran empresa siguen aproximada-
mente una distribución Normal con una media de 18.600 dólares y una desviación estándar de
2.700 dólares. Encuentre la probabilidad de que un gerente seleccionado al azar tenga:

1. Un ingreso mensual inferior a 15.000 dolares


2. Un ingreso mensual superior a 21.000 dolares

Solución
Variable aleatoria:

X = Ingresos mensuales de los gerentes de la empresa

Además X ∼ N (µ = 18.600; σ = 2.700)

Primer punto
Se pide calcular Pr(X ≤ 15.000)
Primero estandarizamos X = 15.000
15.000 − 18.000
z= = −1, 33
2.700

Por lo tanto:
Pr(Z ≤ 15.000) = Pr(Z ≤ −1, 33) = 0, 091

94
Segundo punto
Se quiere calcular Pr(X ≥ 21.000)
Como la tabla de probabilidades para la distribución Normal que utilizaremos sólo calcula Pr(x ≤
21.000) procederemos de la siguiente manera.
Por propiedad de eventos complementarios:

Pr(X ≥ 21.000) + Pr(X < 21.000) = 1

O sea

Pr(X ≥ 21.000) = 1 − Pr(X < 21.000)

Estandarizando X = 21.000 obtenemos


21.000 − 18.000
z= = 0, 89
2.700

Por lo tanto

Pr(X ≥ 21.000) = Pr(Z ≥ 0, 89) = 1 − Pr(Z < 0, 89) = 1 − 0, 8133 = 0, 1867

Existen otros modelos de distribución de probabilidad para variables aleatorias continuas que sirven
para la solución de múltiples problemas de Estadística aplicada a la Administración y Economía.
Algunos de estos modelos son la distribución t de Student, la distribución χ2 (Chi-cuadrado), la
distribución F de Fisher y otras más. Estos modelos de densidad de probabilidad serán analizadas
oportunamente.

3.10. Funciones de variables aleatorias


En general, si X es una variable aleatoria (discreta o continua), toda función Y = g(X) es también
una variable aleatoria.
Por ejemplo, si X es una variable aleatoria discreta entonces Y = 2X − 1, también es una variable
aleatoria discreta.
Siendo g(X) un variable aleatoria, estará caracterizada por su valor medio o esperado, su varianza
y su desviación estándar.
Comenzamos deniendo estos parámetros para variables aleatorias discretas.
Denición 3.14. Sea X una variable aleatoria discreta con función de probabilidad p(x) y sea
Y = g(X) una función de X . La media o valor esperado de Y = g(X) se dene de la siguiente
manera:
n
(3.14)
X
E(Y ) = µy = g(xi )p(xi )
i=1

mientras que la varianza se dene así:


n
(3.15)
X 2
V (Y ) = σy2 = [g(xi ) − µy ] p(xi )
i=1

La desviación
q estándar de g(X) se dene como la raíz cuadrada positiva de su varianza, es decir
σy = σy2 .

95
X p(x) = Pr(X = x)
4 1/12
5 1/12
6 1/4
7 1/4
8 1/6
9 1/6

Tabla 3.8: Datos para el Ejemplo 3.12

Ejemplo 3.12. Suponga que en una estación de servicios el número X de automóviles que pasan
por una máquina lavadora automática los días viernes tiene la distribución de probabilidad que se
presenta en la Tabla (3.8)
Sea Y = 2X − 1 la variable aleatoria que representa el pago que recibe el operador de la máquina.
Encuentre la ganancia esperada del operario en ese período de tiempo en particular.

Solución
Consideremos la variable aleatoria

X = Número de automóviles que pasan por el lavadero los días viernes

De acuerdo con denición de valor esperado para una función de una variable aleatoria tendremos:
n
X n
X
µy = g(xi )p(xi ) = (2xi − 1)p(xi )
i=1 i=1

Por lo tanto
           
1 1 1 1 1 1
µy = 7 +9 + 11 + 13 + 15 + 17 = 12, 67 dólares
12 12 4 4 6 6
Por lo tanto, el ingreso esperado del operador de la máquina de lavado será 12, 67 dólares para los
días viernes.
Hemos denido el valor esperado y la varianza de una función de una variable aleatoria X discreta.
Se pueden dar deniciones equivalentes en el caso de que X sea una variable aleatoria continua.
Denición 3.15. Sea X una variable aleatoria continua con densidad de probabilidad f (x) y sea
Y = g(X) una función de X . La media o valor esperado de Y se dene de la siguiente manera:
 +∞
E(Y ) = µy = g(x)f (x)dx (3.16)
−∞

mientras que la varianza de Y se dene así:


 +∞
V (Y ) = σy2 =
2
[g(x) − µy ] f (x)dx (3.17)
−∞

Además σy = V (Y ).
p

Ejemplo 3.13. Sea X una variable aleatoria continua con la siguiente densidad de probabilidad
(
x2
3 −1 < x < 2
f (x) =
0 en cualquier otro caso

Encontrar el valor esperado y la varianza de Y = g(X) = 3X .

96
Solución
La media o valor esperado de Y la calculamos de la siguiente manera:
 +2  +2
x2
 
E(Y ) = µy = 3x dx = x3 dx
−1 3 −1

Por lo tanto
+2
1 4 1 4  15
E(Y ) = µy = x = 2 − (−1)4 = = 3, 75
4 −1 4 4
La varianza de Y se calcula de la siguiente manera:
 +2 2 
x2
 
15
V (Y ) = σy2 = 3x − dx
−1 4 3
Aplicando las reglas de la integral denida se obtiene
459
V (Y ) = = 5, 73
80

La desviación estándar de Y es σy = 5, 73 = 2, 39

3.11. Propiedades del valor esperado y de la varianza de una


variable aleatoria
Las siguientes propiedades del valor esperado y de la varianza se cumplen tanto si X es una variable
aleatoria discreta o continua.
Nosotros demostraremos algunas propiedades considerando que X es una variable aleatoria con-
tinua. Las demostraciones de las mismas propiedades para una variable aleatoria discreta son
parecidas solo que en lugar de utilizar integrales se utilizan sumatorias.

3.11.1. Propiedades del valor esperado


Sea X un variable aleatoria continua con densidad de probabilidad f (x),entonces:
Si k es una constante, entonces E(k) = k
E(kX) = kE(X) siendo k un constante
E(X + k) = E(X) + k
Si X1 , X2 , ..., Xn son n variables aleatorias, entonces E(X1 + X2 + · · · + xn ) = E(X1 ) +
E(X2 )+· · · + E(Xn )

Demostramos algunas de estas propiedades

Primera propiedad
Si k es una constante, entonces E(k) = k
Demostración
Aplicando la denición de valor esperado, de la denición de densidad de probabilidad y propie-
dades de la integral denida se tiene que
 +∞  +∞
E(k) = kf (x)dx = k f (x)dx = k(1) = k
−∞ −∞

97
Segunda propiedad
Si k es una constante entonces E(kX) = kE(X)
Demostración
Si X es una variable aleatoria, se sabe que kX también lo es. Por lo tanto, por la denición del
valor esperado de función de una variable aleatoria y por propiedades de la integral denida se
tiene que  
+∞ +∞
E(kX) = (kx)f (x)dx = k xf (x) = kE(X)
−∞ −∞

Tercera propiedad
Si X es una variable aleatoria y k una constante, entonces E(X + k) = E(X) + k
Demostración
Nuevamente, Si X es una variable aleatoria, X + k también es una variable aleatoria. Por lo tanto:
 +∞  +∞  +∞
E(X + k) = (x + k)f (x)dx = xf (x)dx + kf (x)dx = E(X) + k
−∞ −∞ −∞

3.11.2. Propiedades de la varianza


Si X es una variable aleatoria continua con densidad de probabilidad f (x), entonces

V (X) ≥ 0
V (k) = 0
V (kX) = k 2 V (X)
V (X + k) = V (X)

Como en el caso del valor esperado, demostraremos algunas de estas propiedades.

Primera propiedad
Si X es una variable aleatoria, entonces V (X) ≥ 0.
Demostración
Como sabemos, la denición de la varianza de una variable aleatoria continua es
 +∞
V (X) = (x − µ)2 f (x)dx
−∞

Como el término (x − µ) siempre es mayor o igual a cero y que por denición f (x) ≥ 0, entonces
2

V (X) ≥ 0.

Segunda propiedad
Si k es una constante entonces V (k) = 0
Demostración
Hemos demostrado que E(k) = k, por lo tanto
 +∞
V (k) = (k − k)f (x)dx = 0
−∞

y la propiedad queda demostrada.

98
Tercera propiedad
Si X es una variable aleatoria y k una constante, entonces V (kX) = k2 V (X)
Demostración
Sabemos que si X es una variable aleatoria y k una constante, entonces E(kX) = kE(X). Por lo
tanto:
 +∞
2
V (kX) = [kx − E(kx)] f (x)dx
−∞

 +∞  +∞
2 2
[kx − kE(X)] f (x)dx = [k {x − E(X)}] f (x)dx
−∞ −∞

 +∞  +∞ h i
2 2
[k {x − E(X)}] f (x)dx = k 2 {x − E(x)} f (x)dx
−∞ −∞

 +∞ h i  +∞
2 2 2
k {x − E(x)} f (x)dx = k {x − E(X)} f (x)dx = k 2 E(X)
−∞ ∞

En el ejemplo siguiente demostraremos otra de las propiedades de la varianza de una variable


aleatoria muy utilizada en la práctica.
Ejemplo 3.14. Sea X una variable aleatoria, demostrar que σ 2 = E X 2 − µ2 siendo µ su valor


esperado.

Demostración
Demostramos la propiedad para una variable aleatoria continua. Sabemos que
 +∞
σ2 = (x − µ)2 f (x)dx
−∞

Desarrollando el cuadrado
 +∞
2
x2 − 2xµ + µ2 f (x)dx

σ =
−∞

Aplicando propiedades de la integral denida


 +∞  +∞  +∞
σ2 = x2 f (x)dx − 2µ xf (x)dx + µ2 f (x)dx
−∞ −∞ −∞

Luego
 +∞
2
σ = xp(x) − 2µ2 + µ2 = E(X 2 ) − µ2
−∞

Por lo tanto σ 2 = E(X 2 ) − µ2 o de forma equivalente E(X 2 ) − [E(X)]2 como se quería demostrar.

3.12. Funciones lineales de variables aleatorias


Veremos a continuación un caso especial de funciones de variables aleatorias, las funciones lineales
o combinaciones lineales de variables aleatorias.

99
Denición 3.16. Sean X1 , X2 , ..., Xn un conjunto de variables aleatorias y k1 , k2 , ..., kn igual
cantidad de números reales, entonces, la variable aleatoria
n
(3.18)
X
Y = k1 X1 + k2 X2 + ... + kn Xn = ki Xi
i=1

recibe el nombre de función lineal de las variables Xi .

Por ejemplo, si X1 y X2 son dos variables aleatorias discretas o continuas y k1 = 2 y k2 =


−3,entonces Y = 2X1 − 3X2 es una combinación lineal o función lineal de las variable X1 y X2 .
Analizamos seguidamente otro ejemplo con un resultado muy importante.
Sean X1 , X2 , ..., Xn n variables aleatoria (discretas o continuas) y los escalares k1 = k2 = · · · =
kn = n1 .
Entonces, si aplicamos la denición de función lineal de un conjunto de variables aleatoria se obtiene
     
1 1 1 X1 + X2 + · · · + Xn
X̄ = k1 X1 + k2 X2 + · · · + kn Xn = X1 + X2 + · · · + Xn =
k k k n

Es decir

X1 + X2 + · · · + Xn
X̄ =
n
La variable aleatoria X̄ recibe el nombre de media muestral.
Como veremos más adelante, la variable aleatoria media muestral es muy utilizada en los proceso
inferenciales.
Enunciamos sin demostración la siguientes propiedades de una combinación lineal de variables
aleatorias.
Teorema 3.3. Sean X1 , X2 , ..., Xn variables aleatorias con medias o valores esperados µ1 , µ2 , ..., µn
y varianzas σ12 , σ22 , ..., σn2 respectivamente. Entonces:

E(α1 X1 + α2 X2 + ... + αn Xn ) = α1 µ1 + α2 µ2 + · · · + αn µn

Si las Xj son independientes, V ar(α1 X1 + α2 X2 + ... + αn Xn ) = α12 σ12 + α22 σ22 + · · · + αn2 σn2
Ejemplo 3.15. Una estación de servicios vende tres clases de combustibles, común, extra y súper
a 1,20; 1,35 y 1,50 dólares por litro. Representemos por X1 , X2 y X3 las cantidades de combustible
vendidos (en litros) cierto día. Supongamos que las venteas de los distintos tipos de los combustibles
son independientes. Además, se sabe que µ1 = 1.000, µ2 = 500 y µ3 = 300 y que además σ1 =
100, σ2 = 80 y σ3 = 50. Hallar el ingreso medio esperado diario por la venta de combustible.
Determinar la varianza y la desviación estándar del ingreso.

Solución
De acuerdo con los datos, la función ingreso se puede denir de la siguiente manera Y = 1, 20X1 +
1, 35X2 + 1, 50X2 .
Por lo tanto, el ingreso esperado diario por las ventas de combustible será:
E(Y ) = 1, 20µ1 + 1, 35µ2 + 1, 50µ3 = 1, 20 × 1.000 + 1, 35 × 500 + 1, 50 × 300 = $2.325
Por otro lado
V (Y ) = σy2 = (1, 20)2 × (1.000)2 + (1, 35)2 × (80)2 + (1, 50)2 × (50)2 = 31.689

por lo tanto, σy = 31.689 = 178 aproximadamente.
Par nalizar con esta unidad enunciamos, sin demostración el siguiente teorema cuyo resultado
es sumamente importante en la aplicación de las técnicas inferenciales que estudiaremos en los
capítulos siguientes.

100
Teorema 3.4. Si X1 , X2 , ..., Xn son variables aleatorias independientes cada una con distribución
Normal (posiblemente con medias y/o varianzas diferentes), entonces, cualquier combinación lineal
de estas variables también tendrá distribución Normal.
Ejemplo 3.16. Tenga en cuenta los resultados del Ejemplo (3.15). Suponga además que las Xj
tienen distribución Normal. Calcular la probabilidad de que el ingreso sea mayor a 2.500 dólares.

Solución
Los datos para la solución para este ejemplo son los siguientes: µy = 2.325 y σy = 178 dólares.
Por lo tanto
Pr(Y > 2.500) = 1 − Pr(Y ≤ 2.500)

El valor estandarizado de 2.500 se encuentra de la siguiente manea:

2.500 − 2.325
z= = 0, 98
178
Luego

Pr(Z > 0, 98) = 1 − Pr(0, 98) = 1 − 0, 8365 = 0, 1635

101

También podría gustarte