Estadistica 04

Capı́tulo 4
Distribuciones de probabilidad
”No aprendemos porque seamos inteligentes,

somos inteligentes cuando aprendemos”.
Fernando Alberca
Variable aleatoria. Distribuciones de probabilidad discretas y continuas.
Caracterı́sticas de una distribución. Tipificar una variable.
Desigualdad de Tchebychev.
Vector aleatorio. Distribución de probabilidad conjunta.
• Distribuciones de probabilidad marginales y condicionadas.
• Variables aleatorias independientes.
Ejercicios.
1
2 4. Distribuciones de probabilidad
4.1. Variable aleatoria. Distribución de probabi-

lidad.
Si el fenómeno real que se observa está gobernado por el azar, su modelo es el
espacio de probabilidad (Ω, A, P ) asociado.
A partir de aquı́, y puesto que nuestro interés se suele centrar en el estudio
de cierta caracterı́stica de dicho fenómeno, la expresamos mediante una función
numérica
X : Ω −→ R
w −→ x
cuyos valores dependen del azar y, por ello, la llamamos variable aleatoria.
Ejemplo 4.1.1. Si el experimento aleatorio consiste en ”lanzar dos monedas” y X

describe el número de caras obtenidas, entonces
w CC CX XC XX
X 2 1 1 0
Sin embargo, no toda función X : Ω −→ R puede ser una v.a. Para ello es
suficiente que cualquier información relativa a X se corresponda, en definitiva, con
algún suceso asociado al experimento aleatorio en estudio. En efecto, cuando obser-
vamos que X ha tomado valores en un conjunto B ⊂ R, entonces puede ocurrir que
el conjunto
(
∈A ⇒ ∃ P (A) = P [X ∈ B]
{w ∈ Ω / X(w) ∈ B} = [X ∈ B] = A
∈
/A ⇒ ∄ P (A) = P [X ∈ B]
En consecuencia, sólo cuando para cualquier conjunto B ⊂ R sea [X ∈ B] ∈ A

será posible hacer predicciones respecto a la variable aleatoria X.
Ejemplo 4.1.2. Sea (Ω, P(Ω), P ) con Ω = {CC, CX, XC, XX}, el espacio de pro-
babilidad del experimento ”lanzar dos monedas” y X la función que describe el núme-
ro de caras obtenidas,
Alicia M. Juan González

Ing. Industrial, Grupos A-B, Curso 2020/21
4.1. Variable aleatoria. Distribución de probabilidad 3
w CC CX XC XX
X 2 1 1 0
entonces
1
[X = 0] = {XX} ∈ P(Ω) ⇒ ∃P [X = 0] = P ({XX}) =
4
2
[X = 1] = {CX, XC} ∈ P(Ω) ⇒ ∃P [X = 1] = P ({CX, XC}) =
4
1
[X = 2] = {CC} ∈ P(Ω) ⇒ ∃P [X = 2] = P ({CC}) =
4
y ası́, X es una v.a. sobre dicho espacio de probabilidad. Sin embargo, si el espacio de
probabilidad fuese (Ω, A, P ) con A = {∅, Ω, {CC}, {CX, XC, XX}} y X describiese
nuevamente el número de caras obtenidas, entonces
[X = 0] = {XX} ∈
/A ⇒ ∄P [X = 0]
y, por tanto, X no serı́a una v.a. sobre dicho espacio de probabilidad.
Definición: Una variable aleatoria (v.a.) es una función X definida sobre un

espacio de probabilidad (Ω, A, P ) si, y sólo si
∀B ⊂ R [X ∈ B] ∈ A
o, lo que es equivalente,
∀x ∈ R [X ≤ x] = {w ∈ Ω / X(w) ≤ x} ∈ A
Una vez definida una v.a. X sobre el espacio de probabilidad (Ω, A, P ) asociado
al fenómeno aleatorio en estudio, para describirla o conocerla no es suficiente saber
qué valores toma, debemos saber además la probabilidad con que lo hace. Cuando
éste es el caso, conocemos el comportamiento probabilı́stico de la v.a. X, y decimos
que conocemos su ley o distribución de probabilidad, L(X). Con este objetivo,
se introduce la siguiente

Definición: Dada una v.a. X sobre un espacio de probabilidad (Ω, A, P ), su

función de distribución de probabilidad (f.d.p.) es la función FX : R −→ R
monótona no decreciente, contı́nua a la derecha y acotada entre 0 y 1, definida por
∀x ∈ R FX (x) = P [X ≤ x] (4.1)
El significado de las propiedades que caracterizan a la f.d.p. FX es el siguiente:
1. FX es monótona no decreciente porque si x < y ⇒ FX (x) ≤ FX (y)
2. FX es continua a la derecha: ∀x ∈ R FX (x+ ) = lı́my→x+ FX (y) = FX (x)
3. ∀x ∈ R 0 ≤ FX (x) ≤ 1. De hecho,
FX (−∞) = lı́m FX (x) = 0 y FX (+∞) = lı́m FX (x) = 1

x→−∞ x→+∞
Propiedad 4.1.1. ∀a, b ∈ R con a ≤ b,
P [a < X ≤ b] = FX (b) − FX (a) (4.2)
Dem. Puesto que a ≤ b, entonces [X ≤ a] ⊂ [X ≤ b]. De hecho,
[X ≤ b] = [X ≤ a] ∪ [a < X ≤ b]
con lo cual,
P [X ≤ b] = P [X ≤ a] + P [a < X ≤ b]
FX (b) = FX (a) + P [a < X ≤ b]
Como consecuencia de (4.2), se deduce
P [a < X < b] = FX (b− ) − FX (a)

P [a ≤ X < b] = FX (b− ) − FX (a− )
P [a ≤ X ≤ b] = FX (b) − FX (a− )

4.2. Distribuciones de probabilidad discretas 5
La relación (4.2) establece, en definitiva, que la distribución de probabilidad de

la v.a. X queda determinada por su función de distribución FX ,
L(X) ⇐⇒ FX
Si SX es el soporte, es decir, el conjunto de valores que puede tomar la v.a. X,

distinguimos dos casos:
Variable aleatoria discreta, cuando SX es un conjunto finito o contable de

valores distintos, SX = {x1 , x2 , . . . , xn }. Por ejemplo, el número de veces que
un novato intenta golpear una pelota de golf, antes de lograrlo.
Variable aleatoria continua, en caso contrario. Por ejemplo, la cantidad de

lluvia caı́da al dı́a sobre cierta región.
que dan lugar a las distribuciones de probabilidad discretas o continuas, respectiva-

mente.
Definición: Dada una v.a. X, su cuantil de orden p (0 < p < 1) es el valor

xp de la v.a. que verifica
P [X ≤ xp ] ≥ p y P [X ≥ xp ] ≥ 1 − p (4.3)
pero, dado que la primera desigualdad da lugar a FX (xp ) ≥ p y de la segunda se

deduce que
FX (xp ) ≤ p + P [X = xp ]
se tiene, de forma equivalente que el cuantil xp de orden p verifica
p ≤ FX (xp ) ≤ p + P [X = xp ] (4.4)
4.2. Distribuciones de probabilidad discretas.

Si X es una v.a. discreta sobre un espacio de probabilidad (Ω, A, P ), que toma los
valores SX = {x1 , x2 , . . . , xn }, entonces la función pX sobre R que nos proporciona

la probabilidad de que la v.a. X tome el valor x, es decir,

(
> 0 x ∈ SX
pX (x) = P [X = x] (4.5)
=0 x∈ / SX
se conoce como función masa de probabilidad (f.m.p.) o función de cuantı́a de

la v.a. X. Su representación gráfica es el diagrama o gráfico de barras.
En consecuencia, su f.d.p. FX viene dada por
X
FX (x) = P [X ≤ x] = pX (xi ) (4.6)
xi ≤x
xi ∈SX
y es una función escalonada, cuyos saltos o puntos de discontinuidad a la izquierda

son los del soporte SX , y el valor del salto en cada punto lo determina la función
masa.
Ejemplo 4.2.3. Si X es el número de caras al lanzar dos monedas, entonces


x pX (x) 

 0 x<0

0 1  1 0≤x<1

4 4
F (x) =
1 1  3 1≤x<2
2 

 4
1
1 x≥2

2 4

La f.m.p. pX tiene entonces las siguientes propiedades:
1. pX (x) ≥ 0, y
P
2. x∈SX pX (x) = 1
Además, estas propiedades la caracterizan, es decir, cualquier función numérica f

que satisfaga ambas propiedades es la función masa de alguna v.a. discreta, y puede
enunciarse el siguiente

4.2. Distribuciones de probabilidad discretas 7
Teorema: La distribución de probabilidad de una v.a. discreta X queda carac-

terizada tanto por su función masa pX como por su función de distribución FX , es
decir,
L(X) ⇐⇒ pX ⇐⇒ FX
Ejemplo 4.2.4. Sea F : R −→ R definida por




 0 x<0

0, 70 0≤x<1






 0, 90


 1≤x<2
F (x) 0, 95 2≤x<3





 0, 98 3≤x<4

0, 99 4≤x<5






1 x≥5

Es inmediato que F es función monótona no decreciente, continua a la derecha y aco-

tada entre 0 y 1, esto es, F es una f.d.p. En su gráfica, que dejamos como ejercicio,
el alumno podrá observar que es escalonada, con saltos en los puntos {0, 1, 2, 3, 4, 5}
y el valor del salto en cada punto es
x 0 1 2 3 4 5
p(x) = F (x) − F (x− ) 0, 70 0, 20 0, 05 0, 03 0, 01 0, 01 1
Ası́ pues, p es la f.m. de alguna v.a. X cuyo soporte es SX = {0, 1, 2, 3, 4, 5}.
• Esperanza matemática: Si X es una v.a. discreta, con f.m.p. {pX (x); x ∈

SX } y soporte SX = {x1 , x2 , . . . , xn }, su esperanza matemática, valor medio o pro-
medio es el valor n
X
E[X] = xi pX (xi ) = µ (4.7)
i=1
Función de una variable aleatoria discreta.

Sea X una v.a. discreta con soporte SX = {x1 , x2 , . . . , xn }. Si Y = g(X) entonces
Y es también una v.a. discreta con soporte SY = {yi ; i = 1, 2, . . . , m}, donde yi =

g(xi ) para cada i y f.m.p. {pY (yi ); i = 1, 2, . . . , m}, donde
pY (yi ) = P [Y = yi ] = P [g(X) = yi ] = P [X = g −1 (yi )] = pX (g −1 (yi ))
y su esperanza matemática puede calcularse directamente, si conocemos su distri-

bución de probabilidad
X
E[Y ] = yi pY (yi )
yi ∈SY
o bien indirectamente, utilizando la distribución de probabilidad de la v.a. X,

X
E[Y ] = E[g(X)] = g(xi ) pX (xi )
xi ∈SX
Ejemplo 4.2.5. Si X es la v.a. con distribución de probabilidad
X -3 -1 3 5
pX (k) 0,3 0,1 0,2 0,4
y definimos la v.a. Y = X 2 , entonces SY = {1, 9, 25} con f.m.p.
pY (1) = pX (−1) = 0, 1
pY (9) = pX (−3) + pX (3) = 0, 5
pY (25) = pX (5) = 0, 4
La esperanza matemática de la v.a. Y puede calcularse directamente,
E[Y ] = 1 × 0, 1 + 9 × 0, 5 + 25 × 0, 4 = 14, 6
o bien indirectamente,
E[Y ] = E[g(X)] = (−3)2 × 0, 3 + (−1)2 × 0, 1 + 32 × 0, 2 + 52 × 0, 4 = 14, 6
4.3. Distribuciones de probabilidad continuas.

Una v.a. X sobre un espacio de probabilidad (Ω, A, P ) es continua cuando existe
una función fX : R −→ R, conocida como densidad de probabilidad de la v.a.
X, tal que

4.3. Distribuciones de probabilidad continuas 9
1. fX (x) ≥ 0, y
R +∞
2. −∞
fX (x) dx = 1
de tal manera que su f.d.p. queda determinada por

Z x
FX (x) = P [X ≤ x] = fX (u) du (4.8)
−∞
y recı́procamente, es decir, cualquier función numérica f que satisfaga ambas pro-

piedades es la densidad de alguna v.a. continua.
Puesto que la integral de una función no negativa puede interpretarse como un
área, la 2a propiedad indica que el ”área total bajo la curva de la densidad fX es 1”,
y (4.8) nos indica que FX (x) es el área de la curva de la densidad a la izquierda del
punto x.
De (4.2) se deduce que
Z b
∀a ≤ b P [a < X ≤ b] = FX (b) − FX (a) = fX (x) dx (4.9)
a
con lo cual,
Z b
−
P [X = b] = P [b ≤ X ≤ b] = FX (b) − FX (b ) = fX (x) dx = 0 ∀b ∈ R
b
y esto significa que FX es una función continua, esto es, carece de saltos y, por tanto,
únicamente tiene sentido determinar la probabilidad de que la v.a. tome valores en
algún intervalo. De hecho,
P [a < X ≤ b] = P [a ≤ X ≤ b] = P [a ≤ X < b] = P [a < X < b]

De (4.8) se deduce, entonces, la relación recı́proca según la cual, si x es un punto de

continuidad de la densidad de probabilidad fX , entonces
fX (x) = FX′ (x) (4.10)
y de ambas relaciones, (4.8) y (4.10), se deduce, al igual que en el caso discreto el

siguiente
Teorema: La distribución de probabilidad de una v.a. continua X queda ca-
racterizada de forma equivalente por su densidad de probabilidad fX como por su
función de distribución, es decir,
L(X) ⇐⇒ fX ⇐⇒ FX
Ejemplo 4.3.6. Si X es v.a. continua con densidad


 0 x<0
( 
1 0≤x≤1

f (x) = F (x) = x 0≤x<1
0 otro caso 

 1 x≥1
• Esperanza matemática: Si X es una v.a. continua con densidad de proba-

bilidad fX (x) y soporte SX = {x; fX (x) > 0}, entonces el valor
Z +∞
E[X] = xfX (x)dx = µ (4.11)
−∞
es la esperanza matemática, valor medio o promedio de la v.a. X, cuando éste es

finito.
Función de una variable aleatoria continua.

Sea X una v.a. continua con densidad de probabilidad fX (x) y soporte SX =
{x; fX (x) > 0}. Si Y = g(X), entonces puede ocurrir que

4.3. Distribuciones de probabilidad continuas 11
• SY = g(SX ) sea un conjunto ”contable”, en cuyo caso Y es v.a. discreta con

f.m.p. dada por
Z
pY (y) = P [Y = y] = P [g(X) = y] = P [X ∈ By ] = fX (x)dx
[X∈By ]
donde By = {x ∈ SX ; g(x) = y} y
P
E[Y ] = y∈SY y pY (y)
Ejemplo 4.3.7. Sea X la v.a. con densidad

2x
f (x) = 0<x<5
25
y definimos la v.a. (
−2 X ≤ 1
Y =
1 X >1
entonces Y es v.a. discreta con f.m.p.
1
2x 1
Z
pY (−2) = P [Y = −2] = P [X ≤ 1] = dx =
0 25 25
5
2x 24
Z
pY (1) = P [Y = 1] = P [X > 1] = dx =
1 25 25
y
22
E[Y ] = −2 × pY (−2) + 1 × pY (1) =
25
• SY = g(SX ) sea un conjunto ”no contable”, en cuyo caso Y es v.a. continua
con densidad de probabilidad

 fX (h(y)) dh(y) y ∈ SY
dy
fY (y) =
 0 otro caso
siendo x = g −1 (y) ≡ h(y). La esperanza matemática de la v.a. Y puede calcularse

directamente, Z +∞
E[Y ] = yfY (y)dy
−∞
o bien indirectamente,
Z +∞
E[Y ] = E[g(X)] = g(x)fX (x)dx
−∞

Ejemplo 4.3.8. Sea X la v.a. del ejemplo anterior y definamos la v.a. Y = X 2 − 3.

Puesto que
SX = {x; 0 < x < 5} ⇒ SY = {y; −3 < y < 22}
y
p
y = g(x) = x2 − 3 ⇒ x = h(y) = + y+3
con lo cual
 √
2h(y) dh(y) 2 y+3 √1 1

25 dy = 25 2 y+3
= 25
−3 < y < 22
fY (y) =
 0 otro caso
y el cálculo directo de su esperanza matemática serı́a

Z 22
1 19
E[Y ] = y dy =
−3 25 2
mientras que el indirecto, serı́a
5
2x 19
Z
E[Y ] = E[g(X)] = (x2 − 3) dx =
0 25 2
4.4. Caracterı́sticas de una distribución.

Dada una v.a. X ya sea discreta o continua, toda la información proporcionada
por su distribución de probabilidad puede resumirse mediante ciertas cantidades
numéricas que nos permiten, además, comparar entre diversas variables aleatorias.
Dada una v.a. X, el momento de orden k de su distribución de probabilidad
es el valor αk , cuando existe, definido por
 P
 x∈SX xk pX (x)
 X discreta
k
αk = E[X ] = (4.12)
 R +∞ xk f (x) dx

X continua
−∞ X
Un caso particular es α1 = E[X], la esperanza matemática de la v.a. X, que

describe la tendencia central o centro de su distribución de probabilidad y, cuando
existe, se suele representar por µ,
α1 = E[X] = µ

4.4. Caracterı́sticas de una distribución 13
Propiedad de la esperanza matemática: Es un operador lineal, esto es, si
Y =a+bX ⇒ E[Y ] = E[a + b X] = a + b E[X]
Otras caracterı́sticas de la tendencia central son:
La mediana (Me) es el cuantil de orden 0,5. Cuando, en particular, X es v.a.

1
continua, entonces la mediana es solución de la ecuación
1
FX (Me) =
2
La moda es el valor (o valores) Mo más probable de la v.a. Cuando, en

particular, X es v.a. continua, entonces la moda es el valor (o valores) de la
variable que maximiza la densidad de probabilidad:
f ′ (x) = 0 y f ′′ (x) < 0 ⇒ x = Mo
Conocida la media µ, el momento central de orden k de la distribución de

probabilidad de X es el valor µk , cuando existe, definido por
 P
 x∈SX (x − µ)k pX (x)
 X discreta
k
µk = E[(X − µ) ] = (4.13)
 R +∞ (x − µ)k f (x) dx

X continua
−∞ X
Un caso particular es µ2 conocido como varianza de la distribución de probabi-

lidad de X y que representamos por σ 2 ,
µ2 = V ar[X] = σ 2
Propiedades de la varianza:
1. V ar[a] = 0
2. Transformación lineal: Si Y = a + b X ⇒ V ar[Y ] = b2 V ar[X]

1
Cuando X es v.a. continua (P [X = xp ] = 0), la expresión (4.4) se reduce a p ≤ FX (xp ) ≤ p,
esto es, el cuantil xp de orden p es solución de la ecuación FX (xp ) = p.

3. Los momentos centrales pueden obtenerse a partir de los momentos ordinarios

y viceversa. En particular,
σ 2 = E[(X − µ)2 ] = E[X 2 ] − (E[X])2 (4.14)
Si V ar[X] = σ 2 , entonces σ(≥ 0), conocida como desviación tı́pica, es una

medida de la dispersión o separación de los valores de la variable X con respecto a
su valor central µ.
Cuanto mayor sea σ, menos representativa es la media µ como valor central de la

distribución de probabilidad de una v.a.
No obstante, el coeficiente de variación de Pearson definido por

σ
CV = (×100)
µ
es el que nos proporciona una buena medida de la representatividad de la media. Ası́,
cuando CV = 0 %, la representatividad es máxima (no hay dispersión, σ = 0). En
general, coeficientes de variación superiores al 30 % indican baja representatividad
de la media, y por debajo del 20 % la representatividad puede considerarse buena.
Ejemplo 4.4.9. Sea X la v.a. que describe el número de neumáticos con baja presión
de un automóvil seleccionado al azar. a) ¿Cuál de las siguientes funciones de los
valores de X puede ser una distribución de probabilidad? Razona tu respuesta.
X 0 1 2 3 4
P[X=k] 0,3 0,2 0,1 0,05 0,05
P[X=k] 0,4 0,1 0,1 0,1 0,3
P[X=k] 0,4 0,1 0,2 0,1 0,3
b) Conocida la distribución de probabilidad de X, ¿cuál es la probabilidad de que

el número de neumáticos con baja presión sean, como mucho, dos?, ¿cuál es la
probabilidad de que algún neumático tenga la presión baja?, c) Determina el número
medio de neumáticos con baja presión y, analiza la representatividad del promedio
obtenido.

Sol. a) La única función de probabilidad que satisface las dos propiedades de

toda f.m.p. es la de la segunda fila pues
4
X
P [X = k] ≥ 0 ∀k = 0, 1, 2, 3, 4 y P [X = k] = 1
k=0
b) Ası́, si
X 0 1 2 3 4
P[X=k] 0,4 0,1 0,1 0,1 0,3
entonces la probabilidad de que el número de neumáticos con baja presión sean, como
mucho, dos, viene dada por
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] = 0, 6
y la probabilidad de que algún neumático tenga la presión baja es
P [X 6= 0] = 1 − P [X = 0] = 1 − 0, 4 = 0, 6
c) Si, para mayor comodidad, realizamos los cálculos utilizando la siguiente tabla,
X P[X=k] k P [X = k] k 2 P [X = k]
0 0,4 0 0
1 0,1 0,1 0,1
2 0,1 0,2 0,4
3 0,1 0,3 0,9
4 0,3 1,2 4,8
1,8 6,2
entonces, el número medio de neumáticos de baja presión es µ = E[X] = 1, 8, y
σ 2 = E[X 2 ] − (E[X])2 = 6, 2 − 3, 24 = 2, 96 ⇒ σ = 1, 72
1, 72
CV = = 0, 95 ⇒ 95 %
1, 8
lo que indica una mala representatividad del promedio obtenido. Conviene, por tanto,
recurrir a otras medidas de la tendencia central. Ası́, la moda es 0 (Mo=0), porque
es el valor más probable, mientras que para calcular la mediana, consideramos la
tabla

X P[X=k] F (k) = P [X ≤ k]
0 0,4 0,4
1 0,1 0,5
2 0,1 0,6
3 0,1 0,7
4 0,3 1
y dado que

P [X ≤ k] ≥ 0, 5 ⇒ k=1 


y ⇒ Me = 1, 5


P [X ≥ k] ≥ 0, 5 ⇒ k=2 
Ejemplo 4.4.10. Si la variable aleatoria X que describe la profundidad (cms) de

la capa de bioturbación del sedimento de cierta región tiene una densidad de proba-
bilidad
(
x

k 3
+1 6 < x < 20
f (x) =
0 otro caso
a) ¿cuál es la probabilidad de que la profundidad observada sea a lo sumo de 10

cms?, b) ¿cuál es la profundidad promedio de la capa de bioturbación?, c) ¿cuál es
la probabilidad de que la profundidad observada se encuentre a 1 desviación tı́pica
de su valor promedio?, d) ¿cuál el la profundidad mediana? Explica su significado,
e) ¿cuál el la profundidad más probable?.
Sol. a) En primer lugar, determinamos el valor que ha de tomar ”k” para que
f (x) sea una densidad de probabilidad,
20 20 x 20 x 3
Z Z Z
f (x)dx = 1 ⇔ k + 1 dx = k + 1 dx = 1 ⇔ k=
6 6 3 6 3 224
Se tiene ası́, que

(
3 x

224 3
+1 6 < x < 20
f (x) =
0 otro caso

y la probabilidad de que la profundidad observada sea a lo sumo de 10 cms viene

dada por
10
3 x 11
Z
P [X ≤ 10] = + 1 dx = = 0, 1964 ⇒ 19, 64 %
6 224 3 56
b) La profundidad promedio de la capa de bioturbación viene dada por
Z 20 Z 20
3 x 673
E[X] = xf (x)dx = x + 1 dx = = 14, 02 cms
6 6 224 3 48
c) Se trata de determinar la probabilidad
P [|X − µ| ≤ σ] = P [µ − σ ≤ X ≤ µ + σ]
para lo cual hemos de calcular la desviación tı́pica σ. Puesto que

Z 20 Z 20
2 3
x 1695
2 2
E[X ] = x f (x)dx = x + 1 dx =
6 6 224 3 8
entonces
σ 2 = V ar[X] = E[X 2 ] − (E[X])2 = 15, 29 ⇒ σ = 3, 91 cms
con lo cual,
P [µ − σ ≤ X ≤ µ + σ] = P [10, 11 ≤ X ≤ 17, 93]

Z 17,93
3 x
= + 1 dx = 0, 59535 ⇒ 59, 54 %
10,11 224 3
d) Puesto que la mediana es el valor de la v.a. que satisface la ecuación F (x) = 12 ,

determinamos la f.d.p.


 0 x<0

3 x2
F (x) = 224 6
+ x − 12 6 ≤ x < 20


1 x ≥ 20

y si
(
x2 14, 46

3 1
+ x − 12 = ⇔ x2 + 6x − 296 = 0 ⇒ x=
224 6 2 −20, 46

de donde, Me = 14, 46 cms, lo que significa que es igual de probable que la profun-
didad de la capa de bioturbación sea inferior a los 14,46 cms como superior a dicha
cantidad.
e) Finalmente, la profundidad más probable nos la proporciona la moda de la
distribución, que es solución del sistema

1
f ′ (x) = 0 ⇔ 224
= 0 absurdo 


y

f ′′ (x) < 0

⇔ 0<0 absurdo 
pero, puesto que el sistema no tiene solución, la moda no existe.
Tipificar una variable aleatoria.

Dada una v.a. X con media µ y desviación tı́pica σ conocidas, ”tipificarla”
consiste en transformarla en la v.a. Z definida por
X −µ
Z= (4.15)
σ
con lo cual,
µZ = E[Z] = 0 y V ar[Z] = 1
y ası́, la variable ”tipificada” Z, es siempre una v.a. de media nula y desviación

tı́pica unidad.
La tipificación es una herramienta útil cuando queremos ”comparar” valores de
v.a. distintas evitando las unidades de medida.
Ejemplo 4.4.11. Los móviles de la marca Nokia tienen una duración media de 6
años con una desviación tı́pica de 3 meses, mientras que los de la marca Motorola
tienen una duración media de 5 años con una desviación tı́pica de 10 meses. Si
Pedro tiene un Nokia que le ha durado 7 años y 2 meses, y Pilar tiene un Motorola
que le ha durado 7 años y 5 meses, ¿qué móvil ha durado más?
Sol. Si X describe la duración del Nokia y Y la del Siemens, entonces
2
2 7+ 12
−6 14
X =7+ ⇒ ZX = 3 = = 4, 67
12 12
3

5
5 7+ 12
−5 29
Y =7+ ⇒ ZY = 10 = = 2, 9
12 12
10
y, dado que ZX > ZY , el Nokia de Pedro ha durado, en términos relativos, más que
el de Pilar.
Caracterı́sticas de forma.
Sirven para describir la forma de la distribución de probabilidad de la v.a. y son
el coeficiente de asimetrı́a y el coeficiente de apuntamiento.
Una v.a. X o su distribución se dice que es simétrica cuando, gráficamente, lo es
respecto a su tendencia central, es decir, su diagrama de barras (en el caso discreto)
o la curva de la densidad (en el caso continuo) son simétricos respecto a la recta
x = µ.
Cuando una distribución es simétrica, todos los momentos centrales de orden
impar son nulos,
µk = 0 k = 3, 5, 7, 9, . . .
En particular, el coeficiente de asimetrı́a de Fisher, definido por

µ3
γ1 = (4.16)
σ3
que indica la intensidad de la asimetrı́a. Lo recı́proco, en cambio, no es cierto, es
decir, si γ1 = 0, no puede asegurarse que la distribución sea simétrica.
Cuando la distribución no es simétrica, el signo del coeficiente γ1 indica el sentido
de la misma. Ası́,
Distribución asimétrica negativa (o de cola izquierda) : µ3 < 0 ⇔ γ1 < 0
Distribución asimétrica positiva (o de cola derecha) : µ3 > 0 ⇔ γ1 > 0
γ1 < 0 γ1 = 0 γ1 > 0

El coeficiente de apuntamiento o curtosis es el grado de concentración de

la distribución en el centro frente a las colas, de tal manera que diremos que cuanto
mayor sea la concentración, mayor será el apuntamiento, se define por
µ4
γ2 = −3 (4.17)
σ4
y se distinguen tres tipos de distribuciones:
platicúrtica o aplastada: γ2 < 0
mesocúrtica: γ2 = 0
leptocúrtica o puntiaguda: γ2 > 0
4.5. Desigualdad de Chebychev.

Cuando desconocemos la distribución de probabilidad de una v.a. X pero sabe-
mos que su varianza σ 2 es finita, entonces su esperanza matemática µ también lo
es y, por tanto, es lógico pensar que es poco probable que la v.a. tome valores muy
alejados de µ, su valor central. Esta idea se confirma formalmente en
Desigualdad de Chebychev:
σ2
∀ǫ > 0 P [ |X − µ| > ǫ ] ≤ 2
ǫ
Si ǫ = kσ, con k > 0, la desigualdad queda
1
P [ |X − µ| > k σ ] ≤
k2
esto es, la probabilidad de que la v.a. X tome un valor que se esté a más de k
desviaciones tı́picas de su media µ no excede de 1/k 2 , o equivalentemente,
1
P [ |X − µ| ≤ k σ ] ≥ 1 −
k2

4.6. Distribución de probabilidad conjunta 21
la probabilidad de que X caiga a una distancia máxima de k desviaciones tı́picas de

su media µ es, como mı́nimo, de 1 − (1/k 2 ).
Ejemplo 4.5.12. Sabiendo únicamente que X es una v.a. cuya media es 25 y su

desviación tı́pica es 2, determina aproximadamente a) la probabilidad de que la v.a.
no exceda del valor 35, b) la probabilidad de que la v.a. supere el valor 20.
Sol. Podemos utilizar la desigualdad de Tchebychev para estimar dichas proba-
bilidades. Ası́,
1
P [|X − µ| ≤ k σ] = P [µ − k σ ≤ X ≤ µ + k σ] ≥ 1 −
k2
a) Para calcular P [X ≤ 35], hacemos
µ + k σ = 35 ⇔ 25 + k × 2 = 35 ⇔ k=5
con lo cual,
1
P [|X − µ| ≤ 5 σ] = P [15 ≤ X ≤ 35] ≥ 1 − = 0, 96 ⇒
25
P [15 ≤ X ≤ 35] = P [X ≤ 35] − P [X < 15] ≥ 0, 96 ⇒
P [X ≤ 35] ≥ 0, 96 + P [X < 15] ≥ 0, 96
es decir, la probabilidad de que X no exceda de 35 es al menos del 96 %.

b) Para calcular P [X ≥ 20], hacemos
µ − k σ = 20 ⇔ 25 − k × 2 = 20 ⇔ k = 2, 5
y
1
P [|X − µ| ≤ 2, 5 σ] = P [20 ≤ X ≤ 30] ≥ 1 − = 0, 84
6, 25
Dado que
P [X ≥ 20] ≥ P [20 ≤ X ≤ 30] ≥ 0, 84
la probabilidad de que X exceda de 20 es al menos del 84 %.

4.6. Distribución de probabilidad conjunta.

• Caso discreto: Si X e Y son dos v.a. discretas sobre un espacio de proba-
bilidad (Ω, A, P ), se llama función masa de probabilidad ”conjunta” de X e Y a la
función pX,Y sobre R2 definida por
pX,Y (x, y) = P [X = x, Y = y] (4.18)
Si las v.a. X e Y toman los valores SX,Y = {(xi , yj ); i = 1, . . . , k, j = 1, . . . , m}

entonces la f.m.p. conjunta se caracteriza por las propiedades siguientes:
1. 
 > 0 (x, y) ∈ SX,Y
pX,Y (x, y)
 = 0 (x, y) ∈
/ SX,Y
2.
k X
X m
pX,Y (xi , yj ) = 1
i=1 j=1
y su representación formal es una ”tabla de doble entrada” en la que los distintos

valores de una variable se disponen por filas, los de la otra por columnas, y la
probabilidad conjunta del par (xi , yj ),
pX,Y (xi , yj ) ≡ pi,j
en la casilla intersección de la i-ésima fila con la j-ésima columna,

Y
X y1 y2 ... ym
x1 p1,1 p1,2 ... p1,m
x2 p2,1 p2,2 ... p2,m
.. .. .. .. ..
. . . . .
xk pk,1 pk,2 ... pk,m
La función de distribución de probabilidad ”conjunta” de X e Y es la función
FX,Y sobre R2 definida por
X X
FX,Y (x, y) = P [X ≤ x, Y ≤ y] = pX,Y (xi , yj ) (4.19)
xi ≤x yj ≤y

La distribución de probabilidad conjunta de las variables X y Y queda determinada,

de forma equivalente, tanto por su f.m.p. conjunta pX,Y como por su f.d.p. conjunta
FX,Y , es decir,
L(X, Y ) ⇐⇒ pX,Y ⇐⇒ FX,Y
La distribución de probabilidad conjunta determina las distribuciones mar-

ginales, que son las distribuciones de probabilidad de cada una de las v.a. X y
Y.
Y
X y1 y2 ... yj ... ym pX (·)
x1 p1,1 p1,2 ... p1,j ... p1,m pX (x1 )
x2 p2,1 p2,2 ... p2,j ... p2,m pX (x2 )
.. .. .. .. .. .. .. ..
. . . . . . . .
xi pi,1 pi,2 ... pi,j ... pi,m pX (xi )
.. .. .. .. .. .. .. ..
. . . . . . . .
xk pk,1 pk,2 ... pk,j ... pk,m pX (xk )
pY (·) pY (y1 ) pY (y2 ) ... pY (yj ) ... pY (ym ) 1
m
X
pX (x) = pX,Y (x, yj ) (4.20)
j=1
k
X
pY (y) = pX,Y (xi , y) (4.21)
i=1
La distribución de probabilidad conjunta y las distribuciones de probabilidad

marginales determinan las distribuciones de probabilidad condicionadas, que
son las distribuciones de probabilidad de una variable, dado un valor de la otra:
Si pX (xi ) > 0, entonces la distribución de probabilidad condicionada de Y ,

dado que X = xi , existe y viene dada por
pX,Y (xi , yj )
pY |X (yj |xi ) = j = 1, . . . , m (4.22)
pX (xi )

Su esperanza matemática queda determinada por

m
X
E[Y |X = xi ] = yj pY |X (yj |xi )
j=1
Análogamente, si pY (yj ) > 0, entonces la distribución condicionada de X,

dado que Y = yj , existe y viene dada por
pX,Y (xi , yj )
pX|Y (xi |yj ) = i = 1, . . . , k (4.23)
pY (yj )
Su esperanza matemática queda determinada por

k
X
E[X|Y = yj ] = xi pX|Y (xi |yj )
i=1
Ejemplo 4.6.13. Determina a) P [X ≥ 2, Y ≥ 2], b) la probabilidad de que la v.a.

X tome el valor 1, c) la probabilidad de que la v.a. Y tome el valor 3, si la v.a. X
ha tomado el valor 1, d) el valor esperado de Y , sabiendo que X = 2, siendo (X, Y )
un v.a. con f.m.p. conjunta
p(x, y) 1 2 3 4
1 0,1 0 0,1 0
2 0,3 0 0,1 0,2
3 0 p 0 0
P P
Sol. Puesto que x y p(x, y) = 1, entonces p = 0, 2 y
XX
P [X ≥ 2, Y ≥ 2] = p(x, y) = 0, 5
x≥2 y≥2
b) Si determinamos la distribución marginal de X, entonces
p(x, y) 1 2 3 4 pX (·)
1 0,1 0 0,1 0 0,2
2 0,3 0 0,1 0,2 0,6
3 0 0,2 0 0 0,2

P [X = 1] = pX (1) = p(1, 1) + p(1, 2) + p(1, 3) + p(1, 4) = 0, 2
c)
pX,Y (1, 3) 0, 1
P [Y = 3|X = 1] = pY |X (3|1) = = = 0, 5
pX (1) 0, 2
d) La distribución de probabilidad condicionada de Y , cuando X = 2 viene dada
por la f.m.p.
pX,Y (2, j)
P [Y = j|X = 2] = pY |X (j|2) = j = 1, 2, 3, 4
pX (2)
1 2 3 4
0,3 0 0,1 0,2
pY |X (j|2) 0,6 0,6 0,6 0,6
con lo cual, el valor esperado de Y , dado que X = 2 es

3 1 2 14
E[Y |X = 2] = 1 × +2×0+3× +4× = = 2, 33
6 6 6 6
• Caso continuo: Si X e Y son dos v.a. continuas sobre un espacio de probabi-
lidad (Ω, A, P ), se llama densidad de probabilidad ”conjunta” de X y Y a la función
fX,Y : R2 −→ R tal que
1. fX,Y (x, y) ≥ 0, ∀(x, y) ∈ R2 , y
2. Z +∞ Z +∞
fX,Y (x, y) dx dy = 1
−∞ −∞
y su función de distribución de probabilidad ”conjunta” FX,Y queda determinada por

Z x Z y
FX,Y (x, y) = P [X ≤ x, Y ≤ y] = fX,Y (u, v) du dv (4.24)
−∞ −∞
La distribución de probabilidad conjunta de las variables X y Y queda determinada,

de forma equivalente, tanto por su densidad de probabilidad conjunta fX,Y como por
su f.d.p. conjunta FX,Y , es decir,
L(X, Y ) ⇐⇒ fX,Y ⇐⇒ FX,Y

En consecuencia,
Z bZ d
P [a ≤ X ≤ b, c ≤ Y ≤ d] = fX,Y (x, y) dx dy (4.25)
a c
Las densidades de probabilidad ”marginales” quedan determinadas por

Z +∞
fX (x) = fX,Y (x, y) dy (4.26)
−∞
Z +∞
fY (y) = fX,Y (x, y) dx (4.27)
−∞
y las densidades de probabilidad ”condicionadas” quedan determinadas por
fX,Y (x, y)
fY |X (y|x) = si fX (x) > 0 (4.28)
fX (x)
fX,Y (x, y)
fX|Y (x|y) = si fY (y) > 0 (4.29)
fY (y)
en cuyo caso, las esperanzas matemáticas condicionadas vienen dadas por
Z Z
E[Y |X = x] = yfY |X (y|x)dy y E[X|Y = y] = xfX|Y (x|y)dx
SY |X=x SX|Y =y
Ejemplo 4.6.14. Una compañı́a dulcera distribuye bolsas de chicles que contienen
dos sabores: menta y fresa. Si los pesos (kg) de cada tipo de chicles, que varı́an de
una bolsa a otra, se distribuyen conjuntamente con una densidad de probabilidad
dada por
(
24xy 0 < x, y < 1, x+y <1
f (x, y) =
0 resto
Determina a) el porcentaje de bolsas en las que el peso de cada tipo de chicles es

inferior a 0,5 kg, b) el peso medio de cada bolsa de chicle, c) Si los chicles de fresa
pesan 300 gr, ¿cuál es la probabilidad de que el peso de los de menta supere los 600
gr?, ¿cuál serı́a el peso medio de los de menta?.
Sol. Si (X, Y ) son las v.a. que describen los pesos de los chicles de menta y
fresa, respectivamente, entonces el soporte conjunto de ambas variables aleatorias
viene dado por

y
1
1 x
a) el porcentaje de bolsas en las que el peso de cada tipo de chicles es inferior a 0,5
kgviene dado por la probabilidad
1 1
3
Z Z
2 2
P [X ≤ 0, 5, Y ≤ 0, 5] = 24xy dy dx =
0 0 8
b) para calcular el peso medio de cada bolsa de chicle debemos calcular E[X + Y ]
que podemos obtener teniendo en cuenta que E[X + Y ] = E[X] + E[Y ]. Para ello,
determinaremos, primero, las distribuciones de probabilidad marginales, dadas por
las densidades marginales y, en segundo lugar, las esperanzas matemáticas de cada
una de ellas. Ası́,
(R 1−x
0
24xy dy = 12x(1 − x)2 0<x<1
fX (x) =
0 resto
con lo cual,
1
2
Z
E[X] = 12x2 (1 − x)2 dx =
0 5
Análogamente,
(R 1−y
0
24xy dx = 12y(1 − y)2 0<y<1
fY (y) =
0 resto
y nuevamente,
1
2
Z
E[Y ] = 12y 2(1 − y)2 dy =
0 5
Finalmente, el peso medio de cada bolsa es
4
E[X + Y ] = E[X] + E[Y ] = ⇒ 0, 8 kg
5
c) Si Y = 0, 3, entonces la probabilidad de que el peso de los de menta supere los
600 gr (0,6 kg), viene dada por la probabilidad condicionada
P [X > 0, 6|Y = 0, 3] = 1 − P [X ≤ 0, 6|Y = 0, 3] = 1 − FX|Y (0, 6|0, 3)

donde FX|Y (0, 6|0, 3) es la función de distribución de probabilidad condicionada de

la v.a. X|Y = 0, 3 cuya densidad de probabilidad es
fX,Y (x, 0, 3) 24 × x × 0, 3 2x
fX|Y (x|0, 3) = = 2
=
fY (0, 3) 12 × 0, 3 × 0, 7 0, 72
para 0 < x + 0, 3 < 1 ⇔ 0 < x < 0, 7, esto es,
(
2x
0,72
0 < x < 0, 7
fX|Y (x|0, 3) =
0 resto
Ası́,
0,6 0,6 2
2x 6
Z Z
FX|Y (0, 6|0, 3) = fX|Y (x|0, 3) dx = dx = = 0, 7347
0 0 0, 72 7
y
P [X > 0, 6|Y = 0, 3] = 1 − 0, 7347 = 0, 2653 ⇒ 26, 53 %
Finalmente, el peso medio de los chicles de menta, cuando los de fresa pesan 300 gr
es
0,7
2x 1, 4
Z
E[X|Y = 0, 3] = x 2
dx = = 0, 47 kg
0 0, 7 3
Variables aleatorias independientes.

Dos v.a. X e Y sobre un espacio de probabilidad (Ω, A, P ) se dice que son
independientes cuando
∀B1 , B2 ⊂ R P [X ∈ B1 , Y ∈ B2 ] = P [X ∈ B1 ] · P [Y ∈ B2 ] (4.30)
lo que significa que
∀(x, y) ∈ R2 FX,Y (x, y) = FX (x) · FY (y) (4.31)
esto es, la f.d.p. conjunta FX,Y es el producto de las f.d.p. marginales FX y FY .

Si las v.a. X y Y son discretas con f.m.p. conjunta pX,Y y f.m.p. marginales pX
y pY , respectivamente, entonces (4.31) es equivalente a
∀(x, y) ∈ R2 pX,Y (x, y) = pX (x) · pY (y) (4.32)

4.7. Ejercicios 29
Si las v.a. X y Y son continuas con densidad de probabilidad conjunta fX,Y y

densidades marginales fX y fY , respectivamente, entonces (4.31) es equivalente a
∀(x, y) ∈ R2 fX,Y (x, y) = fX (x) · fY (y) (4.33)
Propiedades 4.6.1. Si X y Y son v.a. ”independientes” sobre (Ω, A, P ) entonces
1. E[X × Y ] = E[X] × E[Y ]
2. V ar[X + Y ] = V ar[X] + V ar[Y ]
La independencia, sus caracterizaciones (4.32) y (4.33) y propiedades pueden

extenderse a un conjunto arbitratrio de variables aleatorias.
Ejemplo 4.6.15. Analiza a) si las v.a. X y Y del Ejemplo 4.6.13 son independien-
tes, b) si el peso de los chicles de fresa y de menta del ejemplo anterior son v.a.
independientes.
Sol. a) Es suficiente comprobar que el producto de las f.m.p. marginales pX y
pY coindice con la f.m.p. conjunta pX,Y ,
p(x, y) 1 2 3 4 pX (·)
1 0,1 0 0,1 0 0,2
2 0,3 0 0,1 0,2 0,6
3 0 0,2 0 0 0,2
pY (·) 0,4 0,2 0,2 0,2
Puesto que, por ejemplo,
pX (1) · pY (1) = 0, 2 × 0, 4 6= 0, 1 = pX,Y (1, 1)
podemos afirmar que las v.a. no son independientes.

b) Es suficiente comprobar que el producto de las densidades de probabilidad
marginales fX y fY coincida con la densidad de probabilidad conjunta fX,Y . Ası́,
puesto que
fX (x) · fY (y) = 12x(1 − x)2 12y(1 − y)2 6= 24xy = fX,Y (x, y)
podemos afirmar que los pesos no son independientes.

4.7. Ejercicios.
12. Sean las distribuciones de probabilidad discrestas con f.m.p. dadas por: a)
P [X = k] = c(5 − k) para k = 0, 1, 2, 3, 4, b) P [X = k] = ck 2 /5 para k = 1, 2, 3, 4, 5
Determina en cada caso: ¿qué valor debe tomar c?, las probabilidades de los sucesos
P [X = 4], P [X ≤ 3], P [X < 3], P [X ≥ 2], P [X > 2]; la función de distribución y
utilı́zala para calcular las probabilidades anteriores; la media, mediana y moda.
14. Un fabricante de ordenadores recibe tarjetas en lotes de diez y se seleccionan

dos tarjetas de cada lote para ser inspeccionadas. Si cada lote tiene dos tarjetas
defectuosas, determina a) la función de distribución de probabilidad de la v.a. X
que describe el número de tarjetas defectuosas observado entre las inspeccionadas,
b) su media, mediana, moda y desviación tı́pica.
20. La distribución de probabilidad de la variable aleatoria X que describe el

número de coches vendidos semanalmente por cierto concesionario es
X 0 1 2 3 4 5 6 7 8
P [X = k] 0,04 0,04 p 0,11 0,30 0,23 0,10 0,05 0,03
a) ¿Cuál es el número medio de coches vendidos semanalmente?, ¿Qué es lo más

probable? b) ¿Cuál es la probabilidad de que el número de coches vendidos en una
semana sea superior a 2 pero inferior a 5?, ¿Cuál es el número máximo de coches
vendidos semanalmente con una probabilidad del 50 %?, c) Si a mitad de una semana
el número de coches vendidos es menor que 3, ¿cuál es la probabilidad de que al
terminar la semana superemos la media?.
23. Una caja contiene 10 transistores, de los cuales 2 están defectuosos. Se escoge
un transistor al azar y se prueba hasta conseguir uno no defectuoso, ¿cuál es el
número medio de transistores escogidos?.
46. La distribución de la cantidad de grava (en toneladas) vendida por una

empresa de materiales para la construcción a lo largo de una semana es una variable

4.7. Ejercicios 31
aleatoria X con densidad de probabilidad

(
k 1 − x12 1 < x < 10

f (x) =
0 otro caso
a) ¿Cuál es la probabilidad de que en una semana se venda más de 4 toneladas?, b)

¿Qué cantidad de grava esperamos vender semanalmente?, c) Determina la media-
na de dicha distribución y explica su significado, d) ¿Qué cantidad de grava debe
tener disponible la empresa para que la probabilidad de poder satisfacer la deman-
da semanal sea del 95 %?, e) Sabiendo que la venta de grava es similar cada dı́a y
que a mitad de semana, la empresa ha vendido menos de 2,5 toneladas, ¿cuál es la
probabilidad de que al final de la semana la venta de grava supere las 4 toneladas?.
50. En cierta explotación agrı́cola, el peso (kg) de los melones es una v.a. X con
densidad de probabilidad f (x) = kx para 2 < x < 4. a) ¿Cuál es el peso medio de
los melones?, b) ¿cuál es la probabilidad de que un melón elegido al azar pese más
de 3 kgs?, ¿cuál es la probabilidad de que un melón elegido al azar pese entre 2 y
3,5 kgs?, c) ¿cuál es el peso mı́nimo que debe tener un melón para estar entre los
más pesados?.
53. Si X es la variable aleatoria que describe la temperatura (o C) a la que tiene

lugar cierta reacción quı́mica, y su densidad de probabilidad viene dada por
1
f (x) = (k − x2 ) −1<x<2
9
a) ¿Cuál es la temperatura más probable?, b) ¿Cuál es la temperatura a la que se
espera tenga lugar la reacción?, c) ¿Cuál es la probabilidad de que la temperatura
observada se sitúe a una desviación tı́pica de su valor medio?, d) Si la temperatura
que se está observando ya es superior a 0o C, ¿cuál es la probabilidad de que no
alcance el 1o C?.
57. En el siguiente circuito, todas las componentes funcionan de manera inde-

pendiente unas de otras. Si la duración (en miles de horas) de cualquiera de ellas
es una variable aleatoria con densidad de probabilidad dada por f (x) = 2e−2x para

x > 0, a) ¿Cuál es la vida o duración media de una componente?, b) ¿Cuál es la

probabilidad de que una componente funcione más de 600 horas?, c) ¿Cuál es la
probabilidad de que el sistema funcione más de 600 horas?.
C1 C3 C4
b
C7
C2 C5 C6
61. La superficie en hectáreas (Ha) de las fincas de los socios de una cooperativa
x+1
en una región del Sur, se distribuye según la función de densidad, f (x) = 48
para 1 < x < 9. a) ¿Cuál es la superficie media de las fincas de esta cooperativa?
¿y su desviación tı́pica?, b) ¿Cuál es la probabilidad de que una finca tenga una
superficie superior a 6 Ha?, c) ¿Cuál es la superficie máxima del 25 % de las fincas
más pequeñas?.
76. Sea X la v.a. que describe el número de tornados observados anualmente en

un determinado Estado. Si el promedio anual es de 0,5 con una desviación tı́pica de
0,2, ¿podrı́a considerarse raro registrar más de 2 tornados en un mismo año?.
252. Cierto supermercado tiene una caja de salida común y una caja de salida
rápida. Si X es el número de clientes que esperan en la caja común en un momen-
to particular del dı́a, Y es el número de clientes en la caja rápida en ese mismo
momento, y la f.m.p. conjunta de (X, Y ) viene dada por
0 1 2 3
0 0, 08 0, 07 0, 04 0, 00
1 0, 06 0, 15 0, 05 0, 04
2 0, 05 0, 04 0, 10 0, 06
3 0, 00 0, 03 0, 04 p
4 0, 00 0, 01 0, 05 0, 06

4.7. Ejercicios 33
a) ¿Cuál es la probabilidad de que haya exactamente un cliente en cada cola?, b)

¿Cuál es la probabilidad de que haya el mismo número de clientes en cada cola?, c)
¿Cuál es la probabilidad de que haya, por lo menos, dos clientes más en una cola que
en la otra?, d) ¿Cuál es la probabilidad de que el número total de clientes de las dos
colas sea exactamente cuatro?, ¿por lo menos cuatro?, e) ¿Cuál es el número medio
de clientes en la caja común? y ¿ en la caja rápida? f) Si el número de clientes en
la caja común es 2, ¿cuál es el número medio de clientes en la caja rápida?, g) Si
el número de clientes en la caja rápida es 1, ¿cuál es el número más probable de
clientes en la caja común?, ¿y el número medio?, h) Analiza si el número de clientes
en cada cola puede considerarse independiente.
253. Un restaurante dispone de una ventanilla A para pedidos desde el au-

tomóvil, y otra ventanilla B para pedidos de personas a pie. En un dı́a seleccionado
al azar, X es la proporción del tiempo que la ventanilla A está de servicio (es decir,
atiende a un cliente o está en espera), Y es la proporción del tiempo que la ventanilla
B está de servicio. Si la densidad de probabilidad conjunta de (X, Y ) es
(
6
5
(x + y 2 ) 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
f (x, y) =
0 otro caso
a) ¿Cuál es la probabilidad de que ninguna ventanilla esté ocupada más de una cuar-
ta parte del tiempo?, b) ¿Cuál es la probabilidad de que la ventanilla A esté ocupada
más de la mitad del tiempo?, c) ¿Qué ventanilla está, en promedio, más tiempo de
servicio?, d) Si la proporción del tiempo de servicio de la ventanilla A es del 75 %,
¿cuál es la proporción promedio del tiempo de servicio de la ventanilla B?, e) ¿Existe
alguna relación entre los tiempos de servicio en ambas ventanillas?.
261. Una urna contiene 3 bolas rojas y 2 blancas. Se extraen dos bolas. Si X es la
v.a. que indica que la primera bola es roja, esto es, X = 1 si la 1a bola es roja, pero
X = 0, si la 1a bola es blanca; y Y es la v.a. que indica que la 2a bola es roja, determi-
na a) la f.d.p. conjunta, b) la probabilidad del suceso −1 < X ≤ 1, −1 1

2
< Y < 2
,
c) las distribuciones de probabilidad marginales, medias y varianzas, d) averigua si
las v.a. X y Y son independientes.

262. Si (X, Y ) es un vector aleatorio con densidad de probabilidad conjunta,

f (x, y) = k[1 + xy(x2 − y 2)] para |x| ≤ 1 y |y| ≤ 1. Determina: a) el valor de k, b)
las distribuciones marginales, su esperanzas matemáticas y desviaciones tı́picas, c)
la distribución de probabilidad condicionada de X, dado que Y = 0, su esperanza
matemática, d) la distribución de probabilidad condicionada de Y , dado que X =
1/2, su esperanza matemática, e) averigua si las v.a. X y Y son independientes.
263. Dado el vector aleatorio discreto (X, Y ) con f.m.p. conjunta p(x, y) = k|x +
y| para x, y = −2, −1, 0, 1, 2, determina a) la probabilidad del suceso [X ≤ 1, Y < 1],
b) las probabilidades P [X = 1], P [Y = −1], c) el valor esperado de X, cuando
Y = 2, d) la distribución de probabilidad de la v.a. |X −Y | y calcula la probabilidad
P [|X − Y | ≤ 1].


Estadistica 04

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica 04

Cargado por

Copyright:

Formatos disponibles

Capı́tulo 4

”No aprendemos porque seamos inteligentes,

Variable aleatoria. Distribuciones de probabilidad discretas y continuas.

Caracterı́sticas de una distribución. Tipificar una variable.

Vector aleatorio. Distribución de probabilidad conjunta.

• Distribuciones de probabilidad marginales y condicionadas.

• Variables aleatorias independientes.

4.1. Variable aleatoria. Distribución de probabi-

Ejemplo 4.1.1. Si el experimento aleatorio consiste en ”lanzar dos monedas” y X

En consecuencia, sólo cuando para cualquier conjunto B ⊂ R sea [X ∈ B] ∈ A

Alicia M. Juan González

y, por tanto, X no serı́a una v.a. sobre dicho espacio de probabilidad.

Definición: Una variable aleatoria (v.a.) es una función X definida sobre un

Alicia M. Juan González

Definición: Dada una v.a. X sobre un espacio de probabilidad (Ω, A, P ), su

El significado de las propiedades que caracterizan a la f.d.p. FX es el siguiente:

1. FX es monótona no decreciente porque si x < y ⇒ FX (x) ≤ FX (y)

2. FX es continua a la derecha: ∀x ∈ R FX (x+ ) = lı́my→x+ FX (y) = FX (x)

FX (−∞) = lı́m FX (x) = 0 y FX (+∞) = lı́m FX (x) = 1

Propiedad 4.1.1. ∀a, b ∈ R con a ≤ b,

P [a < X ≤ b] = FX (b) − FX (a) (4.2)

Dem. Puesto que a ≤ b, entonces [X ≤ a] ⊂ [X ≤ b]. De hecho,

Como consecuencia de (4.2), se deduce

P [a < X < b] = FX (b− ) − FX (a)

Alicia M. Juan González

La relación (4.2) establece, en definitiva, que la distribución de probabilidad de

Si SX es el soporte, es decir, el conjunto de valores que puede tomar la v.a. X,

Variable aleatoria discreta, cuando SX es un conjunto finito o contable de

Variable aleatoria continua, en caso contrario. Por ejemplo, la cantidad de

que dan lugar a las distribuciones de probabilidad discretas o continuas, respectiva-

Definición: Dada una v.a. X, su cuantil de orden p (0 < p < 1) es el valor

pero, dado que la primera desigualdad da lugar a FX (xp ) ≥ p y de la segunda se

se tiene, de forma equivalente que el cuantil xp de orden p verifica

4.2. Distribuciones de probabilidad discretas.

Alicia M. Juan González

la probabilidad de que la v.a. X tome el valor x, es decir,

se conoce como función masa de probabilidad (f.m.p.) o función de cuantı́a de

y es una función escalonada, cuyos saltos o puntos de discontinuidad a la izquierda

Ejemplo 4.2.3. Si X es el número de caras al lanzar dos monedas, entonces

La f.m.p. pX tiene entonces las siguientes propiedades:

Además, estas propiedades la caracterizan, es decir, cualquier función numérica f

Alicia M. Juan González

Teorema: La distribución de probabilidad de una v.a. discreta X queda carac-

Ejemplo 4.2.4. Sea F : R −→ R definida por

Es inmediato que F es función monótona no decreciente, continua a la derecha y aco-

Ası́ pues, p es la f.m. de alguna v.a. X cuyo soporte es SX = {0, 1, 2, 3, 4, 5}.

• Esperanza matemática: Si X es una v.a. discreta, con f.m.p. {pX (x); x ∈

Función de una variable aleatoria discreta.

Alicia M. Juan González

g(xi ) para cada i y f.m.p. {pY (yi ); i = 1, 2, . . . , m}, donde

pY (yi ) = P [Y = yi ] = P [g(X) = yi ] = P [X = g −1 (yi )] = pX (g −1 (yi ))

y su esperanza matemática puede calcularse directamente, si conocemos su distri-

o bien indirectamente, utilizando la distribución de probabilidad de la v.a. X,

Ejemplo 4.2.5. Si X es la v.a. con distribución de probabilidad

y definimos la v.a. Y = X 2 , entonces SY = {1, 9, 25} con f.m.p.

La esperanza matemática de la v.a. Y puede calcularse directamente,

E[Y ] = E[g(X)] = (−3)2 × 0, 3 + (−1)2 × 0, 1 + 32 × 0, 2 + 52 × 0, 4 = 14, 6

4.3. Distribuciones de probabilidad continuas.

Alicia M. Juan González

de tal manera que su f.d.p. queda determinada por

y recı́procamente, es decir, cualquier función numérica f que satisfaga ambas pro-

P [a < X ≤ b] = P [a ≤ X ≤ b] = P [a ≤ X < b] = P [a < X < b]

Alicia M. Juan González