Está en la página 1de 32

Captulo 3

Variables aleatorias

3.1 Definicin, tipos


En ocasiones de un experimento aleatorio slo nos interesar conocer ciertas caractersticas del mismo.
En estos casos nos bastar con conocer la distribucin o modelo de probabilidad de cada caracterstica.

Ejemplo 21 Si queremos estudiar la suma de dos dados lanzados uno tras otro, de los 36 resultados
(a, b), estudiaremos los 11 posibles resultados a + b. Si ninguno de los dados est trucado, nuestro
modelo de probabilidad ser:
1

36
si a + b = 2

2
si a + b = 3
36
P ( Suma sea ) = ..

.


1
36
si a + b = 12

Si quisiramos estudiar tambin cunto distan, es decir |ab|, tendramos 6 resultados: 0, 1, 2, 3, 4


5, con distribucin de probabilidad dada por:
6

36
si |a b| = 0


10
si |a b| = 1
36
P ( Distancia sea ) = ..

.


2
36
si |a b| = 5

Para ambas caractersticas estamos utilizando el mismo modelo de probabilidad sobre el espacio mues-
tral de 36 sucesos elementales: = {(1, 1), (1, 2), . . . , (6, 5), (6, 6)}. Y este modelo de probabilidad
nos permite calcular el modelo para ambas caractersticas (o cualquier otra asociada al experimento).

Definicin 3.1.1. Una variable aleatoria X es una funcin X : R, que a cada elemento del
espacio muestral le hace corresponder un nmero real.

La idea recogida en esta definicin es que para cada suceso elemental, , el valor X()
representa la caracterstica que queremos estudiar.

41
42 CAPTULO 3. VARIABLES ALEATORIAS

Ejemplo 22 En el experimento del lanzamiento sucesivo de dos dados, estamos considerando las
siguientes variables aleatorias:

X = suma de los dados ;


Y = diferencia (en valor absoluto) de ambos dados .

A partir de ellas podemos definir distintos sucesos aleatorios. Por ejemplo:

A1 = { : X() = 5} ; A2 = { : X() > 7} ;


A3 = { : Y () 4} ; A4 = { : (X Y )() = 6} .

Y nos interesar conocer la probabilidad de los diferentes sucesos correspondientes a una variable
aleatoria, es decir, su modelo o funcin de probabilidad.

Definicin 3.1.2. Sea X : R una variable aleatoria. Si A es un subconjunto de R, definimos:

P (A) = P (X A) := P ({ : X() A}) .

Ejemplo 23 De los tres primeros sucesos del ejemplo anterior, considerando que los dados no estn
trucados, tenemos que:
4 1 5+4+3+2+1 15 5 2 17 7
P (A1 ) = = ; P (A2 ) = = = ; P (A3 ) = 1 = ; P (A4 ) =
36 9 36 36 12 36 18 36
que hemos calculado con las siguientes igualdades, evidentes:

P (A2 ) = P (X > 7)) = P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) + P (X = 12)
P (A3 ) = P ((Y 4)) = 1 P ((Y = 5)) .

Obsrvese el abuso de notacin, P (X > x) en lugar de P (X() > x) por ejemplo, que utilizaremos,
para simplificar, siempre que est claro lo que queremos decir. Por ltimo, los casos = (a, b) en que
se verifica (X Y )() = 6 son los siete siguientes: (3, 3), (3, 4), (4, 3), (3, 5), (5, 3), (3, 6) y (6, 3).

3.2 Funcin de masa o de densidad, funcin de distribucin


Definicin 3.2.1. La funcin de distribucin de una variable aleatoria se define como:

F (x) = P ((, x]) = P ({ : X() x}) para todo x R .

Propiedades de las funciones de distribucin

1. lm F (x) = 0;
x

2. lm F (x) = 1;
x

3. si x1 < x2 , entonces F (x1 ) F (x2 );


3.2. FUNCIN DE MASA O DE DENSIDAD, FUNCIN DE DISTRIBUCIN 43

4. F es continua por la derecha, es decir:


lm F (x + h) = F (x) .
h0+

Es fcil, dada una funcin de distribucin, calcular la probabilidad de diferentes tipos de inter-
valos de la recta real. Basta tomar la definicin, P ((, x]) = F (x) y las propiedades generales de
cualquier funcin de distribucin. Denotaremos por
F (x ) = lm+ P ((, x h]) = P ((, x)) .
h0

Se tienen as las siguientes identidades:


P ((a, b]) = P ((, b]) P ((, a]) = F (b) F (a)
P ((a, b)) = P ((, b)) P ((, a]) = F (b ) F (a)
P ([a, b]) = P ((, b]) P ((, a)) = F (b) F (a )
P ({b}) = ((, b]) P ((, b)) = F (b) F (b ) = salto de F en el punto b .
La ltima de ellas nos dice que si la funcin de distribucin, F , tiene un salto en un punto, la
probabilidad de ese punto es positiva.
Ya hemos dicho que al estudiar una variable aleatoria nos interesar conocer su funcin de proba-
bilidad. La funcin de distribucin caracteriza completamente la de probabilidad. Ahora bien, para
los casos ms interesantes de variables aleatorias que trataremos, hay herramientas ms sencillas que
la funcin de distribucin para conocer el reparto de probabilidad. stas son: la funcin de masa,
para una variable aleatoria discreta; la funcin de densidad, si la variable aleatoria es continua.

3.2.1 Variables aleatorias discretas


Definicin 3.2.2. Una variable aleatoria, X, se dice discreta cuando slo puede tomar un nmero
finito o numerable de valores x1 , . . . , xn , . . . .
La funcin de probabilidad de una variable aleatoria discreta X queda totalmente caracterizada
por su funcin de masa, que nos da la probabilidad de cada uno de esos posibles valores:
P (X = xi ) = P ({xi }) = P (xi ) = P ({ : X() = xi }) i = 1, 2, 3, . . . , n, . . . .
P
Se sigue de la definicin que P (xi ) = 1. La funcin de distribucin de una variable aleatoria
i
discreta tiene forma de escalera:

F (x)

x1 x2 x3 x
Obsrvese que la funcin de distribucin, F (x), es no decreciente (por qu?).
44 CAPTULO 3. VARIABLES ALEATORIAS

Ejemplo 24 Calcular la funcin de masa y la funcin de distribucin de la variable aleatoria


X =suma de los dados, en el experimento de tirar sucesivamente dos dados no trucados.
Solucin: El espacio muestral tiene 36 elementos:

= {(1, 1), (1, 2), . . . , (6, 5), (6, 6)} .

La variable aleatoria X, es una funcin del espacio muestral en R que slo toma los 11 valores en-
teros: 2, 3, . . . , 12. Puesto que los dados no estn trucados, los sucesos elementales son equiprobables,
y as:
1
P ({(a, b)}) = , para cualquier (a, b) .
36
Puesto que podemos contar cuntos elementos de hay en cada uno de los sucesos X = 2, X = 3,
. . . , X = 12, conocemos la funcin de masa de la variable X. La siguiente tabla de valores, determina
completamente la funcin de masa de X:

xi 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
P (X = xi )
36 36 36 36 36 36 36 36 36 36 36

Obsvese que
1+2+3+4+5+6+5+4+3+2+1
= 1.
36
Por su parte la funcin de distribucin, F : R [0, 1], viene dada por:

F (x) = 0 si x < 2 , F (x) = 1 si x 12

y para 2 x < 12, va subiendo de 0 a 1 paulatinamente creando una grfica con escalones horizontales
entre cada dos enteros consecutivos, con los saltos en cada entero determinados por la funcin de
masa (dibujar la grfica).

3.2.2 Variables aleatorias continuas


Definicin 3.2.3. Una variable aleatoria, X, se dice continua cuando puede tomar cualquiera
de los valores de un intervalo. La funcin de probabilidad de una variable aleatoria continua queda
caracterizada por su funcin de densidad, que es una funcin f : R R verificando:

1. f (x) 0, para todo x R;


Z
2. f (x) dx = 1.
R

La probabilidad de un suceso, A, relativo a una variable aleatoria continua, X, con funcin de


densidad f se calcula mediante la frmula:
Z
P (A) = f (x) dx
A
3.2. FUNCIN DE MASA O DE DENSIDAD, FUNCIN DE DISTRIBUCIN 45

Conviene resaltar que para una variable aleatoria continua X, los sucesos unitarios, A = {t}, tienen
probabilidad 0 pues: Z
P ({t}) = f (x) dx = 0 .
{t}

Este hecho viene a decir que si X es una variable aleatoria continua, la probabilidad de que X tome
un valor particular es nula: P (X = t) = P ({t}) = 0. Como consecuencia, la funcin de distribucin
no tiene saltos, es decir, es continua.
La funcin de distribucion se obtiene a partir de la funcin de densidad:
Z x
F (x) = P ((, x]) = f (t) dt .

Adems, en los puntos en que F (x) es derivable:

f (x) = F 0 (x) .

Ejemplo 25 Sea un segmento OA de longitud 5. Cul es la probabilidad de que un punto B,


situado al azar en OA, se encuentre en un segmento CD de OA? Cul es la funcin de densidad de
la distancia OB?
Solucin: El conjunto de sucesos es no numerable. La probabilidad de que B sea un punto
cualquiera del segmento CD, es nula. La probabilidad de que B est sobre CD se define mediante
la razn de las longitudes: CD/OA. Modelizaremos el experimento tomando OA sobre el intervalo
[0, 5] de la recta real:
B

U q

O=0 C D A=5

Podemos definir la funcin de distribucin de la variable aleatoria continua X =distancia OB,


de manera que sea igual a 1 cuando B est en A:
Z 5
f (x) dx = 1 .
0

Puesto que el punto B se sita al azar en el intervalo OA, la distribucin es uniforme sobre OA, es
decir, la funcin de densidad es constante, y as:

(
0 si x < 0
0 si x / [0, 5] Z x1 x
f (x) = 1 = F (x) = dt = si x [0, 5]
si x [0, 5]
0 5 5
5 1 si x 5 .

f (x) F (x)
1
5

x x
46 CAPTULO 3. VARIABLES ALEATORIAS

3.3 Esperanza: media y varianza


Con frecuencia de los experimentos aleatorios que estudiemos, podremos realizar un estudio es-
tadstico previo. Para ello, se toma cierta muestra, realizando varias veces el experimento, y se
recogen datos sobre distintas caractersticas del mismo. El objetivo ltimo es adaptar, para las dis-
tintas caractersticas del experimento (variables aleatorias), modelos de probabilidad tericos que
nos permitan predecir el comportamiento real (su probabilidad) de estas caractersticas. De los datos
tomados se calcularn ciertas medidas que nos darn idea de la distribucin de cada una de las
caractersticas objeto de estudio.
Destacamos entre stas la media (medida de centralizacin), la varianza y la desviacin
tpica (medidas de dispersin). En esta seccin definiremos los conceptos anlogos a estas medidas
de la Estadstica.

Definicin 3.3.1. Dada una variable aleatoria discreta, X, con funcin de masa P (xi ), i = 1, 2, . . . ,
se define su media o esperanza como:
X
= E[X] = xi P (xi ) .
i

De manera anloga, si X es una variable aleatoria continua, con funcin de densidad f (x), se
define su media o esperanza como:
Z
= E[X] = xf (x) dx .
R

Pasemos a las medidas de dispersin (en el captulo de Estadstica vimos la utilidad de estas
medidas).

Definicin 3.3.2. La varianza de una variable aleatoria discreta, X, con funcin de masa P (xi )
y media se define como:
X
2 = V [X] = E[(X )2 ] = (xi )2 P (xi ) .
i

Anlogamente, la varianza de una variable aleatoria continua, X, con funcin de densidad f (x)
media se define como:
Z
= V [X] = E[(X ) ] = (x )2 f (x) dx .
2 2
R

La desviacin tpica, , de una variable aleatoria se define como la raz cuadrada positiva de
su varianza.

Ejercicio 1 Demostrar, en los casos discreto y continuo, la siguiente identidad para la varianza de
una variable aleatoria:
2 = E[X 2 ] 2
3.3. ESPERANZA: MEDIA Y VARIANZA 47

Solucin: Si X es una variable aleatoria discreta con funcin de masa P (xi ), desarrollando el
cuadrado y simplificando, se obtiene:
X
2 = (xi )2 P (xi )
i
X
= (x2i 2xi + 2 )P (xi )
i
X X X
= x2i P (xi ) 2 xi P (xi ) + 2 P (xi )
i i i
2 2 2 2 2
= E[X ] 2 + = E[X ] .

En el caso continuo, desarrollando el cuadrado y simplificando, se obtiene:


Z
2
= (x )2 f (x) dx
R
Z Z Z
2 2
= x f (x) dx 2 xf (x) dx + f (x) dx
R R R
= E[X 2 ] 22 + 2 = E[X 2 ] 2 .

Ejemplos
Ejemplo 26 Una persona participa en un concurso de televisin con las siguientes reglas:

Si contesta correctamente a una pregunta con cinco respuestas posibles (slo una correcta) gana
10 000e.

En caso contrario se le propone una segunda pregunta con tres respuestas posibles (slo una
correcta). Si acierta gana 1 000e.

Si tampoco acierta la segunda respuesta, se le propone una tercera con dos respuestas posibles
(slo una correcta). Si acierta no gana nada, pero si falla debe pagar 500e.

El juego termina cuando la persona acierta o tras fallar la tercera pregunta. Si un concursante contesta
al azar, calclese:

a) probabilidad de que obtenga una respuesta correcta;

b) la ganancia esperada;

c) E[X] y V [X], siendo X el nmero de preguntas propuestas al concursante.

Solucin: Sea Ai el suceso el concursante responde correctamente la cuestin i-sima, i = 1, 2, 3.


Los sucesos A1 , A2 y A3 son independientes.
a) La probabilidad de que una respuesta sea correcta es:

1 1 4 1 4 2 11
P (A1 ) + P (A2 )P (Ac1 ) + P (A3 )P (Ac1 )P (Ac2 ) = + + = .
5 3 5 2 5 3 15
48 CAPTULO 3. VARIABLES ALEATORIAS

b) Sea Y la variable aleatoria ganancia. Es claro que esta variable toma los valores:

1
y1 = 10 000 con P (y1 ) = ;
5
4 1 4
y2 = 1 000 con P (y2 ) = = ;
5 3 15
4 2 1 4
y3 = 0 con P (y3 ) = = ;
5 3 2 15
4 2 1 4
y3 = 500 con P (y3 ) = = .
5 3 2 15
Por tanto, la ganancia esperada es:
1 4 4 4
E[Y ] = 10 000 + 1 000 +0 500 = 2 133.33e .
5 15 15 15

c) La variable aleatoria X puede tomar los valores:

1
x1 = 1 con P (X = 1) = P (A1 ) = ,
5
1 4 4
x2 = 2 con P (X = 2) = P (A2 )P (Ac1 ) = = ,
3 5 15
2 4 8
x3 = 3 con P (X = 3) = P (Ac2 )P (Ac1 ) = = .
3 5 15
As:
3
X 1 4 8 35
= E[X] = xi P (xi ) = 1 +2 +3 = = 2.33 ;
i=1
5 15 15 15
3
X
2 2
V [X] = E[X ] = x2i P (xi ) 2
i=1
2
1 4 8 35
= 1 +4 +9
5 15 15 15
91 1225 1365 1225 140 28
= = = = = 0.622 .
15 225 225 225 45

Ejemplo 27 La longitud de ciertos tornillos en centmetros se distribuye segn la funcin de densi-


dad: ( 3
(x 1)(3 x) si x [1, 3]
f (x) = 4
0 si x
/ [1, 3] .

i) Calclese E[X] y [X].

ii) Si los tornillos son vlidos slo si su longitud est entre 1.7 y 2.4 cm., calclese la probabilidad
de que un tornillo sea vlido.
3.4. VARIAS VARIABLES 49

Solucin: i) Aplicamos directamente las frmulas a la variable aleatoria continua X =longitud del
tornillo, que tiene funcin de densidad f (x):
Z 3 Z
3 3 3
E[X] = x(x 1)(3 x) dx = (3x + 4x2 x3 ) dx
1 4 4 1
3 3 4 1
= (9 1) + (27 1) (81 1)
4 2 3 4
3 104 3 8
= 12 + 20 = = 2 ;
4 3 4 3
Z 3
3 3 1
E[X 2 ] = (3x2 + 4x3 x4 ) dx = (27 1) + (81 1) (243 1)
4 1 4 5
3 242 3 28 21
= 26 + 80 = =
4 5 4 5 5
21 1
2 [X] = E[X 2 ] 2 = 4=
5 5
r
1 5
[X] = = = 0.447 .
5 5

ii) Nos piden calcular P (1.7 < x < 2.4), que, por definicin, es:
Z 2.4 Z 2.4
3
P (1.7 < x < 2.4) = f (x) dx = (3 + 4x x2 ) dx
1.7 4 1.7
3 1
= 3(2.4 1.7) + 2(2.42 1.72 ) (2.43 1.73 )
4 3
3 1 1
= 2.1 + 5.74 8.911 = 10.92 8.911
4 3 4
2.009
= = 0.50225 .
4

3.4 Varias variables


En un mismo experimento aleatorio podemos considerar distintas variables aleatorias: X1 , X2 , . . . .
En ocasiones interesar considerar sucesos determinados por valores referidos a varias de ellas, en cuyo
caso tendremos que mezclar adecuadamente la informacin de las variables individuales.
En el mejor de los casos la informacin de cada variable no influir en la de las dems. Diremos
que estamos ante variables independientes. Cuando esto no sea as, tendremos una relacin entre
ellas ms o menos fuerte. La covarianza de dos variables aleatorias es un nmero que nos mide
esta posible relacin.

Definicin 3.4.1. (Vectores aleatorios) Un vector aleatorio (o variable aleatoria de dimensin n)


es una funcin
(X1 , . . . , Xn ) : Rn .
que a cada elemento del espacio muestral le hace corresponder n nmeros reales X1 (), . . . , Xn ().
50 CAPTULO 3. VARIABLES ALEATORIAS

Ejemplo 28 En el experimento tirar dos dados perfectos sucesivamente, se considera el vector


aleatorio
(X, Y ) : R2
que dado un elemento = (a, b) nos devuelve:
(X, Y )() = (a + b, |a b|) .

En el concurso televisivo del Ejemplo 26, se considera el vector aleatorio


(X, Y ) : R2
que a cada elemento del espacio muestral, , le asocia:
(X, Y )() = ( preguntas propuestas al concursante , ganancia del concursante ) .

En la produccin de tornillos del Ejemplo 27, consideramos el vector aleatorio


(X, Y, Z) : R3
que al tomar cada tornillo , nos dice:
(X, Y, Z)() = ( su longitud , dimetro de la cabeza , longitud de la rosca ) .

En lo que sigue definiremos los conceptos anlogos al caso de una variable aleatoria para vectores
aleatorios de dimensin 2. El caso ndimensional es la generalizacin natural del de dimensin 2.
Adems, al considerar vectores aleatorios de la forma:
(X, Y ) : R2
podremos hacer representaciones sobre el plano, ganando en claridad a la hora de asimilar los con-
ceptos.

Definicin 3.4.2. Si A es un subconjunto de R2 descrito como conjunto de posibles valores del vector
aleatorio (X, Y ) : R2 , definimos:
P (A) = P ((X, Y ) A) = P ({ : (X(), Y ()) A}) .

Definicin 3.4.3. La funcin de distribucin de un vector aleatorio (X, Y ) se define como:


F (x, y) = P ({(s, t) R2 : s x, t y})
= P ({ : X() x, Y () y}) para todo (x, y) R2 .

Las propiedades de las funciones de distribucin de un vector aleatorio son, en cierto modo,
parecidas al caso de una variable. Sin embargo son menos manejables, de manera que utilizaremos
las funciones de masa conjunta o de densidad conjunta, para el clculo de probabilidades.

Ejercicio 2 Calcular la funcin de distribucin del vector aleatorio


(X, Y ) : R2
correspondiente al concurso televisivo del Ejemplo 28.
3.4. VARIAS VARIABLES 51

3.4.1 Densidad conjunta


Definicin 3.4.4. Un vector aleatorio (X, Y ) es discreto cuando slo puede tomar un nmero
finito o numerable de valores. El modelo de probabilidad conjunta de un vector aleatorio
(X, Y ) discreto queda caracterizado por la funcin de masa conjunta:

P (X = xi , Y = yj ) = P ({ : X() = xi , Y () = yj }) i = 1, . . . , m ; j = 1, . . . , n .

Cuando est claro por el contexto, utilizaremos la siguiente notacin: pi,j = P (X = xi , Y = yj ).


La funcin de masa conjunta suele presentarse con una tabla de doble entrada:
Y
X y1 yj yn
x1
.. ..
. .
xi pi,j
.. ..
. .
xm

Ejemplo 29 Para el concurso televisivo descrito en el Ejemplo 26, calcular la funcin de masa del
vector aleatorio determinado por:
(X, Y )() = ( preguntas propuestas al concursante , ganancia del concursante ).
Solucin: Este vector aleatorio puede tomar 3 4 = 12 valores, tomando la primera componente
3 posibles valores, y 4 la segunda. La siguiente tabla nos representa la funcin de masa conjunta:
Y
X 500 0 1 000 10 000
1
1 0 0 0
5
4
2 0 0 0
15
4 4
3 0 0
15 15
En el caso de vectores aleatorios, aparte de la distribucin conjunta, hay otras distribuciones
tambin muy interesantes: las distribuciones marginales y las condicionadas.

Definicin 3.4.5. Las distribuciones marginales de un vector aleatorio (X, Y ) son las que se
obtienen al considerar cada caracterstica por separado. As tenemos:
Distribucin marginal de X: es de tipo discreto y su funcin de masa marginal viene
dada por:
n
X
P (X = xi ) = P (X = xi , Y = yj ) , i = 1, . . . , m .
j=1

Distribucin marginal de Y : es de tipo discreto y su funcin de masa marginal viene


dada por:
m
X
P (Y = yj ) = P (X = xi , Y = yj ) , j = 1, . . . , n .
i=1
52 CAPTULO 3. VARIABLES ALEATORIAS

Obsrvese que, de la definicin, es fcil obtener cada distribucin marginal si la funcin de masa
conjunta viene representada por una tabla de doble entrada: basta en cada caso sumar por filas o
por columnas.

Ejemplo 30 Las distribuciones marginales del ejemplo anterior se obtienen a partir de la tabla como
se indica:
Y
X 500 0 1 000 10 00 P (X = xi ) FX (xi )
1 1 1
1 0 0 0
5 5 5
4 4 7
2 0 0 0
15 15 15
4 4 8
3 0 0 1
15 15 15
4 4 4 1
P (Y = yj )
15 15 15 5
4 8 4
FY (yj ) 1
15 15 5

3.4.2 Covarianza
Antes de pasar a las distribuciones condicionadas conviene definir: covarianza e independencia.

Definicin 3.4.6. La covarianza entre dos variables aleatorias discretas X e Y se define como:

Cov(X, Y ) = E (X E[X])(Y E[Y ])
Xm Xn
= (xi E[X])(yj E[Y ])P (X = xi , Y = yj ) .
i=1 j=1

Decimos que X e Y estn incorreladas, cuando Cov(X, Y ) = 0.


Se define, tambin, el coeficiente de correlacin lineal de (X, Y ) como:

Cov(X, Y )
r= .
[X][Y ]

Este coeficiente verifica que 1 r 1, y sirve para estudiar la existencia de una posible relacin
lineal entre X e Y : digamos Y = aX + b para ciertos coeficientes a, b R. Si r = 1 r = 1, existe
tal relacin lineal. Su utilidad quedar ms clara en los captulos sobre Estadstica.

Ejercicio 3 Demostrar la siguiente frmula:

Cov(X, Y ) = E[XY ] E[X] E[Y ] .


3.4. VARIAS VARIABLES 53

Solucin: Desarrollando el sumatorio y usando las propiedades de las funciones de distribucin


conjunta y marginales, tenemos:
m X
X n
Cov(X, Y ) = (xi E[X])(yj E[Y ])P (X = xi , Y = yj )
i=1 j=1
Xm X n m
X X
n
= xi yj P (X = xi , Y = yj ) E[Y ] xi P (X = xi , Y = yj )
i=1 j=1 i=1 j=1
n
X X
m m X
X n
E[X] yj P (X = xi , Y = yj ) + E[X]E[Y ] P (X = xi , Y = yj )
j=1 i=1 i=1 j=1
Xm n
X
= E[XY ] E[Y ] xi P (X = xi ) E[X] yj P (Y = yj ) + E[X]E[Y ]
i=1 j=1
= E[XY ] E[Y ]E[X] E[X]E[Y ] + E[X]E[Y ] = E[XY ] E[X]E[Y ] .

3.4.3 Independencia
Definimos a continuacin la independencia de variables aleatorias discretas, de manera anloga a la
definicin de independencia de sucesos.
Definicin 3.4.7. Dos variables aleatorias discretas, X e Y , se dicen independientes cuando:
P (X = xi , Y = yj ) = P (X = xi ) P (Y = yj ) para i = 1, . . . , m ; j = 1, . . . , n .
Surge, de manera directa, la siguiente propiedad:
Si X e Y son variables aleatorias discretas independientes entonces

E[XY ] = E[X] E[Y ] .

En particular son incorreladas, es decir: Cov(X, Y ) = 0 .


Ejercicio 4 Demostrar la propiedad anterior.
Solucin: Supongamos que X e Y son independientes, es decir:
P (X = xi , Y = yj ) = P (X = xi ) P (Y = yj ) ,
para i = 1, . . . , m ; j = 1, . . . , n. Calculemos la esperanza de la variable producto X Y :
m X
X n
E[XY ] = xi yj P (X = xi , Y = yj )
i=1 j=1
m X
X n
= xi yj P (X = xi ) P (Y = yj )
i=1 j=1
m
X X
n
= xi P (X = xi ) yj P (Y = yj )
i=1 j=1
X
m
= E[Y ] xi P (X = xi ) = E[Y ]E[X] .
i=1
54 CAPTULO 3. VARIABLES ALEATORIAS

En particular Cov(X, Y ) = E[XY ] E[X]E[Y ] = 0, en otras palabras, X e Y son incorreladas


siempre que sean independientes.

Ejercicio 5 Calcular la covarianza de las variables aleatorias X = nmero de preguntas propuestas


al concursante e Y = ganancia de un concursante, del Ejemplo 26.
Solucin: De la tabla de las funciones de masa conjunta y marginales del vector (X, Y ) vemos que
no son independientes, pues, por ejemplo:
4 8 4 4
P (X = 3, Y = 0) = mientras que P (X = 3) P (Y = 0) = 6= .
15 15 15 15
Con los datos de la tabla calculamos:
1 4 8 35 7
E[X] = 1 +2 +3 = =
5 15 15 15 3
1 4 4 4 32 000 6 400
E[Y ] = 10 000 + 1 000 +0 500 = =
5 15 15 15 15 3
1 4 4 4 32 000 6 400
E[XY ] = 1 10 000 + 2 1 000 +30 + 3 (500) = =
5 15 15 15 15 3
6 400 7 6 400 7 6 400 25 600
de donde: Cov(X, Y ) = E[XY ] E[X]E[Y ] = = 1 =
3 3 3 3 3 9

3.4.4 Densidades condicionadas


Finalizamos esta seccin con el concepto de probabilidad condicionada.

Definicin 3.4.8. La distribucin de la variable aleatoria X, condicionada por un valor fijo, yj , de


la variable aleatoria Y , viene dada por la funcin de masa condicionada:
P (X = xi , Y = yj )
P (X = xi | Y = yj ) = , i = 1, . . . , m .
P (Y = yj )

Es fcil comprobar que si X e Y son independientes, las distribuciones condicionadas coinciden


con las distribuciones marginales correspondientes:
P (X = xi , Y = yj )
P (X = xi | Y = yj ) =
P (Y = yj )
P (X = xi ) P (Y = yj )
= = P (X = xi ) , i = 1, . . . , m .
P (Y = yj )

Y, anlogamente, para Y : P (Y = yj | X = xi ) = P (Y = yj ), j = 1, . . . , n.

3.4.5 Vectores aleatorios continuos


Definicin 3.4.9. Un vector aleatorio (X, Y ) es continuo cuando toma valores en un subconjunto
no discreto de R2 ; por ejemplo: un cuadrado, un rectngulo, un tringulo, un crculo, un sector
circular, . . . .
El modelo de probabilidad conjunta de un vector aleatorio (X, Y ) continuo queda carac-
terizado por la funcin de densidad conjunta, que es una funcin f : R2 R, verificando:
1. f (x, y) 0 para todo (x, y) R2 ;
3.4. VARIAS VARIABLES 55
ZZ
2. f (x, y) dx dy = 1.
R2

La probablidad de cualquier suceso A R2 relativo al vector aleatorio continuo (X, Y ), se calcula


por la frmula: ZZ
P (A) = f (x, y) dx dy .
A

Definicin 3.4.10. Las distribuciones marginales de un vector aleatorio (X, Y ) son las que
se obtienen al considerar cada caracterstica por separado. As tenemos:
Distribucin marginal de X: es de tipo continuo y su funcin de densidad marginal
viene dada por: Z
f (x) = f (x, y) dy , para todo x R .
R

Distribucin marginal de Y : es de tipo continuo y su funcin de densidad marginal


viene dada por: Z
f (y) = f (x, y) dx , para todo y R .
R

Definicin 3.4.11. La covarianza entre dos variables aleatorias continuas X e Y se define como:
ZZ

Cov(X, Y ) = E (X E[X])(Y E[Y ]) = (x E[X])(y E[Y ])f (x, y) dx dy .
R2

Decimos que X e Y estn incorreladas, cuando Cov(X, Y ) = 0. El coeficiente de corre-


lacin lineal de (X, Y ) se define como:
Cov(X, Y )
r= .
[X][Y ]
Ejercicio 6 Demostrar la igualdad: Cov(X, Y ) = E[XY ] E[X]E[Y ].

Definicin 3.4.12. Dos variables aleatorias continuas, X e Y , se dicen independientes si:


f (x, y) = f (x)f (y) para cualesquiera x R, y R .

Se tienen, tambin, la siguiente propiedad:


Si X e Y son variables aleatorias continuas independientes entonces

E[XY ] = E[X] E[Y ] .

En particular son incorreladas, es decir: Cov(X, Y ) = 0 .


Definicin 3.4.13. La distribucin de la variable aleatoria X, condicionada por un valor fijo, y, de
la variable aleatoria Y , viene dada por la funcin de densidad condicionada:
f (x, y)
f (x | y) = f (x | Y = y) = , para todo x R .
f (y)
Obsrvese que es necesario que f (y) > 0. Intuitivamente, esto quiere decir que estamos condicio-
nando por un valor de Y potencialmente observable.
56 CAPTULO 3. VARIABLES ALEATORIAS

Es fcil comprobar que si X e Y son independientes, las distribuciones condicionadas coinciden


con las distribuciones marginales correspondientes:

f (x)f (y) f (x)f (y)


f (x | y) = = f (x) , para todo x R ; f (y | x) = = f (y), para todo y R .
f (y) f (x)

Ejercicio 7 La funcin de densidad conjunta de dos variables aleatorias continuas es:



k(x + xy) si x (0, 1), y (0, 1)
f (x, y) =
0 en otro caso.

1) Cul es el valor de k?

2) Calcular la densidad marginal, la esperanza y la varianza de cada variable.

3) Son variables independientes?

4) Calcular la covarianza.

Solucin: 1) Puesto que es una funcin de densidad hemos de tener integral total 1. Integrando
tenemos:
ZZ Z 1Z 1
f (x, y) dx dy = k (x + xy) dx dy
R2 0 0
Z 1 Z 1 Z 1
1
= k x (1 + y) dy dx = k x (1 0) + ( 0) dx
0 2
Z 1 0 0
3k 3k 1 3k 4
= x dx = 0 = = k = .
2 0 2 2 4 3

2) Las densidades marginales sern:


Z
f (x) = f (x, y) dy
R
Z 1
4 4x 1
ahora bien: x(1 + y) dy = (1 0) + ( 0) = 2x
3 3 2
0
2x si x (0, 1)
de donde: f (x) =
0 en otro caso;
Z
f (y) = f (x, y) dx
R
Z 1
4 4(1 + y) 1 2
ahora bien: (1 + y)x dx = 0 = (1 + y)
3 3 2 3
(0 2
(1 + y) si y (0, 1)
de donde: f (y) = 3
0 en otro caso.
3.5. SUMA DE VARIABLES INDEPENDIENTES 57

Con las densidades marginales calculamos los parmetros pedidos de cada variable:
Z 1 1 2
X = E[X] = x 2x dx = 2 0 =
0 3 3
Z 1
1 1
E[X 2 ] = x2 2x dx = (1 0) =
0 2 2
2 1 4 1
X = E[X 2 ] 2X = =
2 9 18
Z 1
2 21 1 5
Y = E[Y ] = y (1 + y) dy = + =
0 3 3 2 3 9
Z
2 1 2 21 1 7
E[Y 2 ] = y (1 + y) dy = + =
3 0 3 3 4 18
7 25 13
Y2 = E[Y 2 ] 2Y = =
18 81 162

3) La densidad conjunta es el producto de las marginales:


f (x, y) = f (x) f (y)
y, por tanto, son variables independientes.
4) Al ser variables independientes, directamente son incorreladas, es decir: Cov(X, Y ) = 0.

3.5 Suma de variables independientes


Es especialmente ventajoso considerar variables que se distribuyen de manera independiente pues
combinndolas linealmente se obtienen otras variables cuyas distribuciones se conocen a partir de las
primeras.
En la Estadstica Descriptiva que hemos tratado en el Captulo 1, es interesante que las muestras
recogidas nos sirvan para inferir la distribucin de cierta cualidad en determinada poblacin. Para
ello tomamos medidas numricas de la muestra. Si cada dato muestral es representativo de la cualidad
(o variable aleatoria) a inferir, nos gustara, por ejemplo, que la media muestral fuese representativa
de la media de dicha cualidad (se dice de la media poblacional); y as con el resto de las medidas:
varianza, desviacin tpica, mediana, . . .
Si consideramos a cada muestra, de tamao N , como un valor concreto de un vector aleatorio
(X1 , X2 , . . . , XN ), con cada componente la misma variable, el requisito de independencia de las Xi
simplifica tanto los clculos como el anlisis.
Definicin 3.5.1. Dadas n variables aleatorias X1 , X2 , . . . , Xn decimos que son variables aleatorias
independientes igualmente distribuidas, en adelante v.a.i.i.d., si todas siguen el mismo modelo de
probabilidad, digamos Xi X, y son independientes dos a dos.
Ejercicio 8 Probar que si X1 , X2 , . . . , Xn son v.a.i.i.d. con distribucin comn Xi X, = E(X)
y 2 = V (X) entonces:
E(X1 + X2 + + Xn ) = n , V (X1 + X2 + + Xn ) = n 2 .

= 1 X1 + X2 + + Xn entonces (X)
Es ms si X = y V (X)
= 2 /n.
n
58 CAPTULO 3. VARIABLES ALEATORIAS

Podemos, por ltimo, tratar el caso ms general de combinaciones lineales de variables aleato-
rias independientes. Basta enunciar los resultados para dos variables. Los presentamos en forma de
ejercicio:

Ejercicio 9 Sean X e Y dos variables aleatorias independientes, y consideremos la nueva variable


T = aX + bY (con a, b R). Entonces:

E(T ) = aE(X) + bE(Y ) , V (T ) = a2 V (X) + b2 V (Y ) .

Cerramos la seccin con la observacin de que si no se tiene independencia (ni tan siquiera
incorrelacin) entre las variables, la covarianza juega un papel importante en la frmula de la varianza
de la combinacin (ver el problema 1).

Problemas
1. Demuestra las siguientes propiedades de esperanzas y varianzas de variables aleatorias:

(a) E[kX] = kE[X].


(b) E[X + Y ] = E[X] + E[Y ].
(c) V [kX] = k 2 V [X].
(d) Si X e Y son incorreladas: E[XY ] = E[X]E[Y ].
X
(e) V [X1 + + Xn ] = V [X1 ] + + V [Xn ] + 2 Cov(Xi , Xj ).
i<j

(f) Si X1 , . . . , Xn son variables aleatorias incorreladas:

V [X1 + + Xn ] = V [X1 ] + + V [Xn ] .

(g) V [X Y ] = V [X] + V [Y ] 2Cov(X, Y ).


(h) Si X e Y son variables aleatorias incorreladas: V [X Y ] = V [X] + V [Y ].

2. Dadas las variables aleatorias independientes X e Y con funciones de densidad f y g respecti-


vamente, dadas por:
( y
2x si 0 x 1 si 0 y 2
f (x) = g(y) = 2
0 en otro caso; 0 en otro caso;

calcula:

i) E[X + Y ];
ii) E[2X 3Y + 5];
iii) E[2XY ];
iv) V [4X 2Y 3];
v) V [2X + 3Y ].
3.5. SUMA DE VARIABLES INDEPENDIENTES 59

3. En un experimento aleatorio el suceso A ocurre con probabilidad 0.2. Se realiza el experimento


tres veces y se define la variable aleatoria X = nmero de veces que ha ocurrido A en las tres
pruebas que se suponen independientes.

(a) Calcular E[X] y V [X].


(b) Representar grficamente la funcin de distribucin de X.
(c) Calcular P (X > 2) a partir de la funcin de distribucin.

4. La variable aleatoria X est distribuida de tal forma que su funcin de densidad determina con
los ejes un tringulo rectngulo con ngulo recto en el origen y base sobre el intervalo (0, 1).
Calcula sus funciones de densidad y distribucin, la esperanza, , la desviacin tpica, , y la
probabilidad de que X ( , + ).

5. Un semforo est verde para los coches durante un minuto y medio, y rojo durante 15 segundos.
Suponiendo que un automovilista llega al semforo con igual probabilidad en cualquier instante,
calclese el tiempo medio de espera.

6. Una diana est formada por tres crculos concntricos de radios 10, 20 y 30 cm. respectivamente.
Si se cae en el crculo central se obtienen 5 puntos, 3 puntos si se cae en la primera corona
y 1 punto al caer en la tercera corona. La probabilidad de que un tiro caiga en cada zona es
proporcional al rea de la misma (y ningn tiro cae fuera de la diana). Si se efectan cuatro
disparos, calclese:

(a) la puntuacin esperada;


(b) la probabilidad de la puntuacin total se mayor que 17.

7. Un examen consta de 5 temas numerados. Para elegir un tema al azar, se propone lanzar un
dado; si sale de 1 a 5, el nmero del tema es el resultado del dado; si sale 6 se vuelve a tirar
hasta que sale de 1 a 5. Sabemos que el dado est trucado de tal manera que la probabilidad
de que salga el nmero 2 es 2/7 y la probabilidad de cualquier otro nmero es 1/7. Sea X la
variable aleatoria que representa el tema seleccionado finalmente. Halla la probabilidad de que
X valga 1 (que nos interesa especialmente ya que el tema 1 es el nico que hemos estudiado).

8. El vector aleatorio (X, Y ) tiene una distribucin de probabilidad dada por:

P (X = 0, Y = 1) = 0.3 ; P (X = 1, Y = 1) = 0.1 ; P (X = 2, Y = 1) = 0.1 ;


P (X = 0, Y = 2) = 0.1 ; P (X = 1, Y = 2) = 0.2 ; P (X = 2, Y = 2) = 0.2 .

Calclese:

(a) Las distribuciones marginales y condicionadas;


(b) las esperanzas de cada variable, y la de XY ;
(c) las varianzas de cada variable y Cov(X, Y );
(d) el coeficiente de correlacin lineal.
60 CAPTULO 3. VARIABLES ALEATORIAS

9. La vida til de cierto producto perecedero es una variable aleatoria con funcin de densidad
x
e si x > 0
f (x) =
0 en otro caso.
Si X1 y X2 representan la vida til de dos unidades de dicho producto, seleccionadas al azar,
calclese P (X1 2, 1 X2 3).
10. Dado el vector aleatorio (X, Y ) y la funcin

k(x + y) si 0 x 2 0 y 2x x2
f (x, y)
0 en otro caso.
(a) Determnese k para que f (x, y) sea su funcin de densidad.
(b) Calcular P (0 X 1).
11. Las etiquetas de cierta bebida pueden tener un premio de forma que en cada 1000 etiquetas
hay 500 correspondientes a intntelo otra vez, 300 con premio de 5 euros, 150 con premios de
10 euros, 40 con premios de 50 euros y 10 con premios de 100 euros. Una persona compra una
botella que cuesta 10 euros.
(a) Si X es la variable aleatoria correspondiente al beneficio obtenido por el comprador, cul
es la distribucin de X?
(b) Cul es el beneficio esperado del comprador?
(c) Cul es la probabilidad de perder dinero?
(d) Si se sabe que el comprador ha ganado dinero, cul es la probabilidad de que le haya
tocado una etiqueta de 100 euros?
12. En una ciudad hay una proporcin p de personas que fuman. Se define una variable aleatoria
X que toma el valor 1 si al preguntar a una persona seleccionada aleatoriamente responde que
es fumador, y toma el valor 0 si responde que no lo es.
(a) En funcin de p calcula la esperanza de X e interpreta el valor obtenido.
(b) Calcula la varianza de X en funcin de p. Para qu valor de p es mxima la varianza?
(c) Si se pregunta a n personas seleccionadas aleatoriamente con reemplazamiento, y la variable
aleatoria Y representa el nmero de fumadores entre los n seleccionados, calcula la esperanza
y la varianza de Y .
13. Sea X una variable aleatoria continua con funcin de densidad

k(1 + x), si x (0, 2)
f (x) =
0, si x
/ (0, 2)
(a) Calcula la constante k.
(b) Calcula la probabilidad de que X tome valores entre 0 y 1.
(c) Sabiendo que X es mayor que 1, cul es la probabilidad de que sea menor que 1.5?
(d) Calcula P{|X E(X)| > 0.2}
14. El tiempo de vida activa de un plaguicida (en das) es una variable aleatoria X con funcin de
densidad 1 1 x
e 500 , si x 0
f (x) = 500
0, si x < 0
3.5. SUMA DE VARIABLES INDEPENDIENTES 61

(a) Calcula el valor m tal que la probabilidad de que X sea menor o igual que m es 0.5.
Interpreta el resultado obtenido.
(b) Si al cabo de 800 das el plaguicida ya no estaba activo, cul es la probabilidad de que
tras 600 das todava lo estuviera?

15. El vector aleatorio (X, Y ) tiene una distribucin uniforme en el cuarto de crculo de centro
(0, 0) y radio r correspondiente al primer cuadrante. Obtnganse las densidades conjunta y
marginales de X e Y , y estudiar si son variables independientes.

16. Una pareja decide encontrarse en un lugar prefijado entre las tres y las cuatro de la tarde, de
forma que el primero que llegue slo esperar al otro durante 15 minutos. Suponiendo que los
momentos de llegada de ambos al lugar son independientes y se distribuyen uniformemente
entre las tres y las cuatro, calclese la probabilidad de que no se encuentren.

17. Una fbrica produce una pieza en dos calidades diferentes: el 60 % de la produccin es de
calidad A. La duracin (en aos) de una pieza de esta calidad viene dada por la funcin de
densidad x
e si x > 0
fA (x) =
0 en el resto.
El 40 % restante es de calidad B. La duracin viene dada, en este caso, por la funcin de
densidad 2x
2e si x > 0
fB (x) =
0 en el resto.
(a) Calcula la probabilidad de que una pieza de calidad A dure ms de 1 ao.
(b) Si tomamos una pieza al azar de toda la produccin, cul es la probabilidad de que dure
ms de 1 ao?
(c) Si tomamos una pieza al azar de toda la produccin, y observamos que dura ms de 1 ao,
cul es la probabilidad de que sea de calidad A?

18. Una empresa suministra energa elctrica a travs de dos lneas de alta tensin A y B. En la
siguiente tabla se muestran las probabilidades conjuntas pij = P {X = xi , Y = yj }, para las
variables X nmero de fallos mensuales en la lnea A e Y nmero de fallos mensuales en
la lnea B.

Y
X 0 1 2 3 4
0 0.20 0.15 0.05 0.04 0.02
1 0.20 0.06 0.08 0.03 0.01
2 0.06 0.02 0.02 0 0
3 0.04 0.02 0 0 0

(a) Calcula las distribuciones marginales de X e Y .


(b) Calcula la distribucin del nmero de fallos que se producen en la lnea B en un mes en que
no se produce ningn fallo en la lnea A. Cul es el nmero esperado de fallos en este caso?
(c) Son independientes los fallos en las dos lneas?
62 CAPTULO 3. VARIABLES ALEATORIAS

19. Dos caractersticas, X e Y , son variables aleatorias con funcin de densidad conjunta:

kye2x ey si x > 0, y > 0
f (x, y) =
0 en el resto.

(a) Hallar el valor de k. Son independientes X e Y ?


(b) Calcular la esperanza de X.

20. Dos sustancias, A y B, se encuentran en la sangre en cantidades X e Y , respectivamente. Estas


cantidades varan de un individuo a otro. La densidad conjunta de ambas es:
2 2
xy si 0 < x < 3, 0 < y < 3
f (x, y) = 81
0 en el resto.

Calclese:

(a) la densidad marginal de Y y la esperanza de Y ;


(b) la probabilidad de que, en un individuo tomado al azar, haya ms sustancia A que B.
Captulo 4

Modelos de probabilidad

4.1 Modelos discretos


4.1.1 Pruebas de Bernoulli
Definicin 4.1.1. Una prueba de Bernoulli es un experimento aleatorio cuyos posibles resul-
tados se agrupan en dos conjuntos excluyentes que llamaremos xito (E) y fracaso (F ), con
respectivas probabilidades: p = P (E) y 1 p = P (F ).

Ejemplos 31 En el lanzamiento de una moneda podemos tomar E = { Cara } y F = { Cruz }.


Si la moneda no est trucada, p = 21 .
En una poblacin se elige al azar una persona y consideramos los sucesos E = { altura 1.80}
y F = { altura < 1.80}. La probabilidad de xito depender de la distribucin de la variable altura
en la poblacin.
En el lanzamiento de un dado podemos tomar E = {6} y F = {1, 2, 3, 4, 5}. Si el dado es
perfecto, p = 61 ; si est trucado y, por ejemplo, el 2 tiene probabilidad doble que cualquiera de los
dems resultados, p = 17 .

La distribucin de Bernoulli es el modelo ms sencillo obtenido a partir de pruebas de Bernoulli.

Definicin 4.1.2. Realizada una prueba de Bernoulli con P (E) = p se considera la variable aleatoria

1 si obtenemos xito
X=
0 si obtenemos fracaso

La funcin de masa es: P (X = 0) = 1 p y P (X = 1) = p. Los parmetros esperanza y varianza de


una variable X con distribucin de Bernoulli son:

E[X] = p , V [X] = p (1 p) ;

obtenidos ambos de manera sencilla a partir de la definicin. Para abreviar escribiremos X B(1; p)
para indicar que X es una variable aleatoria con distribucin de Bernoulli con esperanza p.

63
64 CAPTULO 4. MODELOS DE PROBABILIDAD

4.1.2 Distribucin binomial


Definicin 4.1.3. Supongamos que realizamos n pruebas de Bernoulli independientes, con P (E) = p
en cada prueba. Sea X la variable nmero de xitos obtenidos en las n pruebas. Llamamos dis-
tribucin binomial a la distribucin de esta variable X. Denotaremos por B(n; p) la distribucin
binomial de parmetros n = nmero de pruebas de Bernoulli y p = P (E) en cada prueba.
Si X sigue una distribucin B(n; p), escribiremos X B(n; p), y su funcin de masa es:

n i
P (X = i) = p (1 p)ni , i = 0, 1, 2, . . . , n .
i

Obsrvese que si tomamos una prueba de Bernoulli con p(E) = p, y consideramos la variable X
con valores 1 si xito, 0 si fracaso, entonces X B(1; p).
Tambin, si tomamos n variables Xi independientes, todas y cada una de ellas siguiendo la misma
distribucin B(1; p), entonces la variable

X = X1 + X2 + + Xn

sigue una distribucin B(n; p). En particular, la esperanza y la varianza de X B(n; p) son:

E[X] = n p , V [X] = n p (1 p) ;

puesto que p = E[Xi ] y p (1 p) = V [Xi ] para cada una de las variables independientes que
sumamos.

4.1.3 Otros modelos basados en pruebas de Bernoulli


Definicin 4.1.4. Realizamos pruebas de Bernoulli independientes con la misma distribucin dada
por P (E) = p. La distribucin geomtrica de parmetro p es la de la variable aleatoria:

X = nmero de pruebas hasta el primer xito.

Su funcin de masa es:

P (X = j) = (1 p)j1 p , j = 1, 2, 3, . . . .

Se puede probar que:


1 1p
E[X] = ; V [X] = .
p p2

Ejercicio 1 Demostrar que si X sigue una distribucin geomtrica de parmetro p, entonces

1
E[X] = .
p
4.1. MODELOS DISCRETOS 65

Solucin: Por definicin se tiene:

E[X] = 1 p + 2 (1 p) p + 3 (1 p)2 p + 4 (1 p)3 + 5(1 p)4 +



= p 1 + 2(1 p) + 3(1 p)2 + 4 (1 p)3 + 5(1 p)4 +

= p 1 + (1 p) + (1 p)2 + (1 p)3 + (1 p)4 +
+ (1 p) + (1 p)2 + (1 p)3 + (1 p)4 +
+ (1 p)2 + (1 p)3 + (1 p)4 +
+ (1 p)3 + (1 p)4 +

+ (1 p)4 +
1 1 p (1 p)2 (1 p)3 (1 p)4
= p + + + + +
p p p p p
1
= 1 + (1 p) + (1 p)2 + (1 p)3 + (1 p)4 + = .
p

Definicin 4.1.5. Consideramos pruebas de Bernoulli independientes con la misma distribucin


dada por p = P (E). Para cada nmero fijo r, se define la variable

X = nmero de pruebas hasta el rsimo xito .

Decimos que la variable X sigue una distribucin binomial negativa de parmetros r y p,


X BN (r; p), y su funcin de masa viene dada por:

r+j1 r
P (X = r + j) = p (1 p)j , j = 0, 1, 2, . . . .
j

La distribucin BN (r; p) para r = 1 es una geomtrica. De hecho, si realizamos pruebas de


Bernoulli con p = P (E), hasta conseguir r xitos y se definen las variables:

Xi = nmero de pruebas entre el (i 1)simo xito y el isimo, i = 1, 2, . . . , r

cada Xi es una geomtrica de parmetro p. Entonces

X = X1 + X2 + Xr

sigue una distribucin BN (r; p). As vemos que si X BN (r; p) entonces:

r r(1 p)
E[X] = ; V [X] = .
p p2

4.1.4 Distribucin de Poisson


Supongamos que estamos interesados en estudiar el nmero de xitos obtenidos en un nmero grande
de pruebas independientes de Bernoulli, teniendo una probabilidad pequea de xito en cada prueba.
Es razonable pensar que la distribucin venga dada como lmite de una distribucin B(n; p) con
n , p 0. De hecho si se tiene cierto control sobre el producto np, digamos np <
66 CAPTULO 4. MODELOS DE PROBABILIDAD

cuando n y p 0, podemos calcular el lmite. Surge as la distribucin de Poisson de parmetro


> 0 definida por la funcin de masa:

j e
P (X = j) = , j = 0, 1, 2, . . . .
j!

Si X Poisson(), informalmente, se obtiene: E[X] = lm n p = y V [X] = lm np(1 p) = .


Usaremos la distribucin de Poisson cuando estemos estudiando un modelo binomial, B(n ; p),
con un nmero grande de pruebas, cada una con probabilidad de xito pequea. A ttulo orientativo,
sustituiremos la B(n ; p) por una Poisson(), con = np, cuando n 30 y p 0.1.
Es fcil comprobar que la funcin dada arriba es una funcin de masa puesto que:

X X X
j e j
P (X = j) = =e = e e = 1 .
j=0 j=0
j! j=0
j!

Ejercicio 2 Demostrar que el lmite cuando n , p 0, con np , de la funcin de masa de


una B(n; p) es la funcin de masa de una distribucin de Poisson con parmetro , en otras palabras
si np cuando n y p 0:

n j j e
lm p (1 p)nj = , cuando n , p 0 .
j j!

Solucin: :

n j n(n 1)(n 2) (n j + 1) j (1 p)n
lm p (1 p)nj = lm p
j j! (1 p)j

1 j 1 2 j1 (1 p)n
= lm n 1 1 1 pj
j! n n n (1 p)j

1 1 2 j1 (1 p)n
= lm 1 1 1 (n p)j
j! n n n (1 p)j
1 e j e
= 1 j = .
j! 1 j!

4.2 Modelos continuos


4.2.1 Distribucin uniforme
Definicin 4.2.1. Decimos que una variable aleatoria X sigue una distribucin uniforme en
un intervalo (a, b) de la recta real, X U (a, b), si su funcin de densidad es:

1
f (x) = si x (a, b) , f (x) = 0 en otro caso.
ba
a+b 1
Si X U (a, b) entonces = E[X] = y 2 = V [X] = (b a)2 .
2 12
4.2. MODELOS CONTINUOS 67

4.2.2 Distribucin exponencial


Definicin 4.2.2. Una variable aleatoria X se dice que sigue una distribucin exponencial de
parmetro > 0, X Exp(), si su funcin de densidad es

f (x) = ex si x > 0 , f (x) = 0 si x 0 .

Si X Exp() entonces:
1 1
= E[X] = , 2 = V [X] = .
2

4.2.3 Distribucin Normal


Definicin 4.2.3. De una variable aleatoria X diremos que sigue una distribucin normal de
media y desviacin tpica , X N(; ), si su funcin de densidad es:
1 (x)2
f (x) = e 22 , para todo x R .
2
Si X N(; ) entonces:
E[X] = , V [X] = 2 .

La funcin de densidad de una distribucin N (; ) tiene propiedades muy interesantes:


1. Su grfica es simtrica respecto a la media :

de manera que: P (X < a) = P (X > + a), para todo a > 0.


X
2. Si X N(; ) y Z = entonces Z N(0; 1). En esta situacin, nos referiremos al cambio

X
de variable Z = , como tipificacin de la variable X N(; ), y a la correspondiente

Z N(0; 1) como la distribucin normal tipificada.
La tipificacin de cualquier normal, X N(; ), nos permitir calcular la probabilidad de un
suceso correspondiente a ella a partir de la tabla de la distribucin normal tipificada N(0; 1).
As, por ejemplo, si X N(; ) entonces:
a b b a
P (a < X < b) = P <Z< = FZ FZ ,

donde Z N(0; 1) y FZ (z) = P (Z z) es su funcin de distribucin, cuyos valores vienen
dados por una tabla.
68 CAPTULO 4. MODELOS DE PROBABILIDAD

3. La distribucin B(n; p) tiende a una distribucin normal cuando n y p es fijo. As si


estamos con una distribucin binomial con n grande, la podremos aproximar por una normal
N (; ) con parmetros:
p
= n p , = n p (1 p) .
A ttulo orientativo es aconsejable realizar esta sustitucin cuando n 30 y 0.1 < p < 0.9.

4. Si X1 N(1 ; 1 ), X2 N(2 ; 2 ), . . . , Xn N(n ; n ) son variables independientes enton-


ces:
q
X = X1 + X2 + + Xn N( = 1 + 2 + + n ; = 12 + 22 + + n2 )
q
Y = X1 X2 N( = 1 2 ; = 12 + 22 ) .

Problemas
1. En una cadena de produccin dos robots funcionan conectados, respectivamente, a cinco y seis
ordenadores independientes entre s, de manera que en un tiempo dado t de funcionamiento
falla un ordenador del primer robot (resp. segundo) con probabilidad 0.1 (resp. 0.2). Calclense
las probabilidades de que en un tiempo t de funcionamiento fallen:
(a) un ordenador del primer robot;
(b) al menos un ordenador del primer robot;
(c) cinco ordenadores del segundo robot;
(d) no ms de cinco ordenadores del segundo robot;
(e) exactamente dos ordenadores del primer robot y tres del segundo;
(f) tres ordenadores ms del primero que del segundo robot.

2. Un lote de piezas contiene una proporcin p de defectuosas. Para realizar un control de calidad
se seleccionan n piezas y se denomina X el nmero de piezas defectuosas encontradas.
(a) Calclese P (X = 0).
(b) Si p = 0.1, cul debe ser el nmero de piezas, n, examinadas para tener P (X = 0) < 0.05?
(c) Si n = 40, para qu valores de p es P (X = 0) < 0.01?
(d) Si se examinan n = 80 piezas y se encuentran dos defectuosas, cul es la proporcin ms
verosmil de piezas defectuosas en el lote total: el 1 %, el 4 % el 7 %?

3. En una poblacin se sabe que, en promedio, uno de cada 20 habitantes tiene telfono mvil.
Cul es la probabilidad de que al realizar una encuesta, el cuarto encuestado sea el primero
con telfono mvil?

4. Se extraen una a una con reemplazamiento cartas de una baraja espaola. Calclese la proba-
bilidad de obtener 5 cartas que no sean oros antes de obtener el tercer oro.
4.2. MODELOS CONTINUOS 69

5. El dueo de una ferretera, extrae al azar 50 tornillos de cada lote que recibe. Si en la muestra no
encuentra ms de 3 defectuosos, se queda el lote, en caso contrario lo rechaza. Un representante
le enva un lote que contiene un 10 % de tornillos defectuosos, cul es la probabilidad de que
acepte el lote?

6. En cierto tramo de una carretera la probabilidad de que un coche supere la velocidad mxima
permitida es 0.0001. Si recorren ese tramo 20000 coches, calclese la probabilidad de que
(a) ninguno supere la velocidad mxima permitida;
(b) a lo sumo 5 superen la velocidad mxima permitida.

7. Se ha observado el nmero de fallos cometidos en un folio por un mecangrafo en un tiempo


fijado. Estos fallos se han anotado en la siguiente tabla:

nmero de fallos 0 1 2 3 4 5
frecuencia 42 30 16 12 4 1

Ajstese una distribucin de Poisson y calclese la probabilidad de que en un folio seleccionado


al azar, de entre los escritos por este mecangrafo, aparezcan ms de tres fallos.

8. Se sabe que la demanda de un producto de consumo sigue una distribucin normal de media
95 y desviacin tpica 7. Calclese:
(a) la probabilidad de que la demanda sea menor que 97;
(b) la probabilidad de que la demanda sea mayor que 99;
(c) la probabilidad de que la demanda est entre 92 y 96;
(d) la mnima cantidad disponible necesaria para poder atender la demanda con una proba-
bilidad no menor que 0.95 .

9. En cierto pas, el 20 % de la poblacin se muestra preocupada por el incremento de las emisiones


de dixido de carbono. Se hace una encuesta a 15 personas.
(a) Cul es la probabilidad de que ninguna de ellas est preocupada por el incremento de las
emisiones de dixido de carbono?
(b) Halla la probabilidad de que no haya ms de tres personas preocupadas.
(c) Calcula la probabilidad de que al menos tres personas entre las 15 estn preocupadas.
(d) Cul es la esperanza y la desviacin tpica del nmero de personas preocupadas entre las
15? Si en lugar de al 20 %, slo al 2 % de los habitantes del pas les preocupa el problema,
cmo cambian la esperanza y la desviacin tpica?

10. Consideramos un experimento aleatorio consistente en tirar 400 veces una moneda.
(a) Halla la probabilidad aproximada de que el nmero de caras obtenido est comprendido
entre 160 y 190.
(b) Halla el intervalo (a, b) centrado en 200, tal que la probabilidad aproximada de que el
nmero de caras obtenido est en dicho intervalo sea 0.95.
70 CAPTULO 4. MODELOS DE PROBABILIDAD

11. Un zologo estudia cierta especie de ratones de campo. Para ello, captura ejemplares de ratones
en un bosque en el que la proporcin de ratones de campo de la especie que le interesa es p.
(a) Si p = 0.3, calcula la probabilidad de que entre 6 ejemplares capturados haya al menos 2
de la especie que le interesa.
(b) Si p = 0.05, calcula la probabilidad de que entre 200 ejemplares capturados, haya exacta-
mente 3 de la especie que le interesa.
(c) Si p = 0.4, calcula la probabilidad de que entre 200 ejemplares capturados, haya entre 75
y 110 de la especie que le interesa.
(d) Cul es el nmero medio de ejemplares que tendr que capturar hasta encontrar uno de
la especie que le interesa, si p = 0.2 ?

12. Se supone que el nmero de bacterias por cm3 de agua en un estanque es una variable aleatoria
X con distribucin de Poisson de parmetro = 0.5.
(a) Cul es la probabilidad de que en un cm3 de agua del estanque no haya ninguna bacteria?
(b) En 40 tubos de ensayo se toman muestras de agua del estanque (1 cm3 de agua en cada
tubo). Qu distribucin sigue la variable Y que representa el nmero de tubos de ensayo,
entre los 40, que no contienen bacterias? Calcula P (Y 20).
(c) Si sabemos que en un tubo hay bacterias, cul es la probabilidad de que haya menos de
tres?

13. En el sur de California se produce, en promedio, un terremoto al ao de magnitud 6.1 o mayor


en la escala de Richter1 . Se supone que el nmero de terremotos al ao en esta zona sigue un
proceso de Poisson.
(a) Cul es la probabilidad de que se produzcan ms de dos terremotos en cinco aos?
(b) Cul es la probabilidad de que haya un periodo de 15 meses sin que haya terremotos?
(c) Cul es la probabilidad de que haya que esperar ms de tres aos y medio para que se
produzcan dos terremotos?

14. La probabilidad de que una pieza tenga un fallo durante el primer ao de funcionamiento es
0.001. Halla la probabilidad de que, entre 2000 piezas, presenten un fallo (a) exactamente tres,
(b) ms de 2.
1

Escala Ritcher
Magnitud Efectos del terremoto
menos de 3.5 Generalmente no se siente, pero es registrado
3.55.4 A menudo se siente, pero slo causa daos menores
5.56.0 Ocasiona daos ligeros a edificios
6.16.9 Puede ocasionar daos severos en reas muy pobladas
7.07.9 Terremoto mayor. Causa graves daos
8 mayor Gran terremoto. Destruccin total a comunidades cercanas

Fuente: http://www.angelfire.com/ri/chterymercalli
4.2. MODELOS CONTINUOS 71

15. La variable X expresa el tiempo en segundos que tarda una depuradora en filtrar 10 mm3 de
agua y sigue una distribucin exponencial con media 10. Calcula la probabilidad de que tarde
entre tres y doce segundos en depurar 10 mm3 .
16. Para estudiar la viabilidad econmica de una mina de carbn, consideramos la variable aleatoria
X=Kilogramos de carbn obtenidos por tonelada de mineral. Supongamos que, en cierta mina,
X sigue una N( = 150; = 25).
(a) Calcula la probabilidad de que, en una tonelada de mineral, el contenido de carbn sea
superior a 130 kg.
(b) Calcula la probabilidad de que, en 2 toneladas de mineral extradas independientemente,
la diferencia en el contenido de carbn sea inferior a 30 kg.
(c) Extraemos independientemente 100 toneladas de mineral. Calcula la probabilidad de que
en ms de 80 de ellas el contenido de carbn sea superior a 130 kg.
17. En una fbrica, se estn produciendo cuerdas con cierta fibra sinttica. La resistencia a la
tensin de estas cuerdas sigue una distribucin N( = 30; = 2).

(a) Cul es el porcentaje de cuerdas cuya resistencia a la tensin est entre 28 y 32?
(b) En un pedido de 200 cuerdas, cul es la probabilidad de que ms de 140 presenten una
resistencia a la tensin entre 28 y 32?
(c) En un pedido de 250 cuerdas, cul es la probabilidad de que alguna presente una resis-
tencia inferior a 25?

18. Un fabricante produce varillas y recipientes para insertar las varillas. Ambos tienen secciones
circulares. Los dimetros de las varillas siguen una distribucin N( = 1; = 0.2); los dimetros
de los recipientes siguen una distribucin N ( = 1.05; = 0.15). Un ingeniero selecciona al
azar una varilla y un recipiente. Cul es la probabilidad de que la varilla pueda insertarse en
el recipiente?
19. Para analizar si las aguas prximas a la costa estn contaminadas cuando se produce una marea
negra por el hundimiento de un petrolero, se analizan varias muestras con un test que se divide
en tres pruebas independientes. Los resultados varan aleatoriamente de unas muestras a otras
y se sabe que siguen distribuciones normales dadas por:
X = resultados de la primera prueba del test, X N(7; 1)
Y = resultados de la segunda prueba del test, Y N(5; = 2)
Z = resultados de la tercera prueba del test, Z N(6; 1)
Se elige una muestra al azar. Contesta a las siguientes preguntas:
(a) Si el resultado final del test es el promedio de los valores que se obtienen en las tres
pruebas, cul es la probabilidad de que el resultado del test sea superior a 5?
(b) Cul es la probabilidad de que el resultado de las tres pruebas sea superior a 5?
20. Una compaa de petrleo tiene un contrato para vender grasa en envases de 500 gramos. La
cantidad de grasa que la mquina de llenado pone en los envases sigue una Normal con la media
que el encargado elija y = 25. Qu valor medio deber elegir el encargado si la compaa no
desea que le rechacen ms del 2 % de los envases por tener un peso por debajo de lo especificado?
72 CAPTULO 4. MODELOS DE PROBABILIDAD

21. Una mquina de envasado llena sacos de fertilizante de aproximadamente 30 kg. La cantidad
de fertilizante por saco sigue una distribucin N ( = 30; = 1).
(a) Se desea que la cantidad de fertilizante por saco est entre 29 y 31 kg. Calcula la proba-
bilidad de que la cantidad est dentro de esos lmites.
(b) Una empresa realiza un pedido de 80 de estos sacos de fertilizante. Calcular la probabilidad
de que ms de 50 estn dentro de los lmites indicados.

22. La permeabilidad intrnseca del hormign producido en una fbrica qumica sigue una distri-
bucin N ( = 40; = 5). Se reciben 60 remesas de hormign.
(a) Cul es la probabilidad de que alguna remesa tenga una permeabilidad intrnseca inferior
a 30?
(b) El 30 % de las remesas de hormign enviadas a un almacn tiene una permeabilidad que
sigue una N ( = 40; = 5). El 70 % de las remesas restantes tiene una permeabilidad
que sigue una N ( = 45; = 10). Cul es el porcentaje total de remesas que tienen una
permeabilidad inferior a 35?

También podría gustarte