Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones de probabilidad
Desigualdad de Tchebychev.
Ejercicios.
1
2 4. Distribuciones de probabilidad
w CC CX XC XX
X 2 1 1 0
Sin embargo, no toda función X : Ω −→ R puede ser una v.a. Para ello es
suficiente que cualquier información relativa a X se corresponda, en definitiva, con
algún suceso asociado al experimento aleatorio en estudio. En efecto, cuando obser-
vamos que X ha tomado valores en un conjunto B ⊂ R, entonces puede ocurrir que
el conjunto
(
∈A ⇒ ∃ P (A) = P [X ∈ B]
{w ∈ Ω / X(w) ∈ B} = [X ∈ B] = A
∈
/A ⇒ ∄ P (A) = P [X ∈ B]
Ejemplo 4.1.2. Sea (Ω, P(Ω), P ) con Ω = {CC, CX, XC, XX}, el espacio de pro-
babilidad del experimento ”lanzar dos monedas” y X la función que describe el núme-
ro de caras obtenidas,
w CC CX XC XX
X 2 1 1 0
entonces
1
[X = 0] = {XX} ∈ P(Ω) ⇒ ∃P [X = 0] = P ({XX}) =
4
2
[X = 1] = {CX, XC} ∈ P(Ω) ⇒ ∃P [X = 1] = P ({CX, XC}) =
4
1
[X = 2] = {CC} ∈ P(Ω) ⇒ ∃P [X = 2] = P ({CC}) =
4
y ası́, X es una v.a. sobre dicho espacio de probabilidad. Sin embargo, si el espacio de
probabilidad fuese (Ω, A, P ) con A = {∅, Ω, {CC}, {CX, XC, XX}} y X describiese
nuevamente el número de caras obtenidas, entonces
[X = 0] = {XX} ∈
/A ⇒ ∄P [X = 0]
∀B ⊂ R [X ∈ B] ∈ A
o, lo que es equivalente,
∀x ∈ R [X ≤ x] = {w ∈ Ω / X(w) ≤ x} ∈ A
Una vez definida una v.a. X sobre el espacio de probabilidad (Ω, A, P ) asociado
al fenómeno aleatorio en estudio, para describirla o conocerla no es suficiente saber
qué valores toma, debemos saber además la probabilidad con que lo hace. Cuando
éste es el caso, conocemos el comportamiento probabilı́stico de la v.a. X, y decimos
que conocemos su ley o distribución de probabilidad, L(X). Con este objetivo,
se introduce la siguiente
∀x ∈ R FX (x) = P [X ≤ x] (4.1)
3. ∀x ∈ R 0 ≤ FX (x) ≤ 1. De hecho,
[X ≤ b] = [X ≤ a] ∪ [a < X ≤ b]
con lo cual,
P [X ≤ b] = P [X ≤ a] + P [a < X ≤ b]
FX (b) = FX (a) + P [a < X ≤ b]
L(X) ⇐⇒ FX
P [X ≤ xp ] ≥ p y P [X ≥ xp ] ≥ 1 − p (4.3)
p ≤ FX (xp ) ≤ p + P [X = xp ] (4.4)
1. pX (x) ≥ 0, y
P
2. x∈SX pX (x) = 1
x 0 1 2 3 4 5
p(x) = F (x) − F (x− ) 0, 70 0, 20 0, 05 0, 03 0, 01 0, 01 1
X -3 -1 3 5
pX (k) 0,3 0,1 0,2 0,4
pY (1) = pX (−1) = 0, 1
pY (9) = pX (−3) + pX (3) = 0, 5
pY (25) = pX (5) = 0, 4
E[Y ] = 1 × 0, 1 + 9 × 0, 5 + 25 × 0, 4 = 14, 6
o bien indirectamente,
1. fX (x) ≥ 0, y
R +∞
2. −∞
fX (x) dx = 1
y (4.8) nos indica que FX (x) es el área de la curva de la densidad a la izquierda del
punto x.
De (4.2) se deduce que
Z b
∀a ≤ b P [a < X ≤ b] = FX (b) − FX (a) = fX (x) dx (4.9)
a
con lo cual,
Z b
−
P [X = b] = P [b ≤ X ≤ b] = FX (b) − FX (b ) = fX (x) dx = 0 ∀b ∈ R
b
y esto significa que FX es una función continua, esto es, carece de saltos y, por tanto,
únicamente tiene sentido determinar la probabilidad de que la v.a. tome valores en
algún intervalo. De hecho,
L(X) ⇐⇒ fX ⇐⇒ FX
donde By = {x ∈ SX ; g(x) = y} y
P
E[Y ] = y∈SY y pY (y)
y
p
y = g(x) = x2 − 3 ⇒ x = h(y) = + y+3
con lo cual
√
2h(y) dh(y) 2 y+3 √1 1
25 dy = 25 2 y+3
= 25
−3 < y < 22
fY (y) =
0 otro caso
α1 = E[X] = µ
1
FX (Me) =
2
µ2 = V ar[X] = σ 2
Propiedades de la varianza:
1. V ar[a] = 0
Ejemplo 4.4.9. Sea X la v.a. que describe el número de neumáticos con baja presión
de un automóvil seleccionado al azar. a) ¿Cuál de las siguientes funciones de los
valores de X puede ser una distribución de probabilidad? Razona tu respuesta.
X 0 1 2 3 4
P[X=k] 0,3 0,2 0,1 0,05 0,05
P[X=k] 0,4 0,1 0,1 0,1 0,3
P[X=k] 0,4 0,1 0,2 0,1 0,3
b) Ası́, si
X 0 1 2 3 4
P[X=k] 0,4 0,1 0,1 0,1 0,3
entonces la probabilidad de que el número de neumáticos con baja presión sean, como
mucho, dos, viene dada por
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] = 0, 6
P [X 6= 0] = 1 − P [X = 0] = 1 − 0, 4 = 0, 6
c) Si, para mayor comodidad, realizamos los cálculos utilizando la siguiente tabla,
X P[X=k] k P [X = k] k 2 P [X = k]
0 0,4 0 0
1 0,1 0,1 0,1
2 0,1 0,2 0,4
3 0,1 0,3 0,9
4 0,3 1,2 4,8
1,8 6,2
entonces, el número medio de neumáticos de baja presión es µ = E[X] = 1, 8, y
σ 2 = E[X 2 ] − (E[X])2 = 6, 2 − 3, 24 = 2, 96 ⇒ σ = 1, 72
1, 72
CV = = 0, 95 ⇒ 95 %
1, 8
lo que indica una mala representatividad del promedio obtenido. Conviene, por tanto,
recurrir a otras medidas de la tendencia central. Ası́, la moda es 0 (Mo=0), porque
es el valor más probable, mientras que para calcular la mediana, consideramos la
tabla
X P[X=k] F (k) = P [X ≤ k]
0 0,4 0,4
1 0,1 0,5
2 0,1 0,6
3 0,1 0,7
4 0,3 1
y dado que
P [X ≤ k] ≥ 0, 5 ⇒ k=1
y ⇒ Me = 1, 5
P [X ≥ k] ≥ 0, 5 ⇒ k=2
20 20 x 20 x 3
Z Z Z
f (x)dx = 1 ⇔ k + 1 dx = k + 1 dx = 1 ⇔ k=
6 6 3 6 3 224
P [|X − µ| ≤ σ] = P [µ − σ ≤ X ≤ µ + σ]
con lo cual,
y si
(
x2 14, 46
3 1
+ x − 12 = ⇔ x2 + 6x − 296 = 0 ⇒ x=
224 6 2 −20, 46
de donde, Me = 14, 46 cms, lo que significa que es igual de probable que la profun-
didad de la capa de bioturbación sea inferior a los 14,46 cms como superior a dicha
cantidad.
e) Finalmente, la profundidad más probable nos la proporciona la moda de la
distribución, que es solución del sistema
1
f ′ (x) = 0 ⇔ 224
= 0 absurdo
y
f ′′ (x) < 0
⇔ 0<0 absurdo
Ejemplo 4.4.11. Los móviles de la marca Nokia tienen una duración media de 6
años con una desviación tı́pica de 3 meses, mientras que los de la marca Motorola
tienen una duración media de 5 años con una desviación tı́pica de 10 meses. Si
Pedro tiene un Nokia que le ha durado 7 años y 2 meses, y Pilar tiene un Motorola
que le ha durado 7 años y 5 meses, ¿qué móvil ha durado más?
Sol. Si X describe la duración del Nokia y Y la del Siemens, entonces
2
2 7+ 12
−6 14
X =7+ ⇒ ZX = 3 = = 4, 67
12 12
3
5
5 7+ 12
−5 29
Y =7+ ⇒ ZY = 10 = = 2, 9
12 12
10
y, dado que ZX > ZY , el Nokia de Pedro ha durado, en términos relativos, más que
el de Pilar.
Caracterı́sticas de forma.
Sirven para describir la forma de la distribución de probabilidad de la v.a. y son
el coeficiente de asimetrı́a y el coeficiente de apuntamiento.
Una v.a. X o su distribución se dice que es simétrica cuando, gráficamente, lo es
respecto a su tendencia central, es decir, su diagrama de barras (en el caso discreto)
o la curva de la densidad (en el caso continuo) son simétricos respecto a la recta
x = µ.
Cuando una distribución es simétrica, todos los momentos centrales de orden
impar son nulos,
µk = 0 k = 3, 5, 7, 9, . . .
γ1 < 0 γ1 = 0 γ1 > 0
mesocúrtica: γ2 = 0
Desigualdad de Chebychev:
σ2
∀ǫ > 0 P [ |X − µ| > ǫ ] ≤ 2
ǫ
Si ǫ = kσ, con k > 0, la desigualdad queda
1
P [ |X − µ| > k σ ] ≤
k2
esto es, la probabilidad de que la v.a. X tome un valor que se esté a más de k
desviaciones tı́picas de su media µ no excede de 1/k 2 , o equivalentemente,
1
P [ |X − µ| ≤ k σ ] ≥ 1 −
k2
1
P [|X − µ| ≤ k σ] = P [µ − k σ ≤ X ≤ µ + k σ] ≥ 1 −
k2
µ + k σ = 35 ⇔ 25 + k × 2 = 35 ⇔ k=5
con lo cual,
1
P [|X − µ| ≤ 5 σ] = P [15 ≤ X ≤ 35] ≥ 1 − = 0, 96 ⇒
25
µ − k σ = 20 ⇔ 25 − k × 2 = 20 ⇔ k = 2, 5
y
1
P [|X − µ| ≤ 2, 5 σ] = P [20 ≤ X ≤ 30] ≥ 1 − = 0, 84
6, 25
Dado que
P [X ≥ 20] ≥ P [20 ≤ X ≤ 30] ≥ 0, 84
1.
> 0 (x, y) ∈ SX,Y
pX,Y (x, y)
= 0 (x, y) ∈
/ SX,Y
2.
k X
X m
pX,Y (xi , yj ) = 1
i=1 j=1
Y
X y1 y2 ... yj ... ym pX (·)
x1 p1,1 p1,2 ... p1,j ... p1,m pX (x1 )
x2 p2,1 p2,2 ... p2,j ... p2,m pX (x2 )
.. .. .. .. .. .. .. ..
. . . . . . . .
xi pi,1 pi,2 ... pi,j ... pi,m pX (xi )
.. .. .. .. .. .. .. ..
. . . . . . . .
xk pk,1 pk,2 ... pk,j ... pk,m pX (xk )
pY (·) pY (y1 ) pY (y2 ) ... pY (yj ) ... pY (ym ) 1
m
X
pX (x) = pX,Y (x, yj ) (4.20)
j=1
k
X
pY (y) = pX,Y (xi , y) (4.21)
i=1
pX,Y (xi , yj )
pY |X (yj |xi ) = j = 1, . . . , m (4.22)
pX (xi )
pX,Y (xi , yj )
pX|Y (xi |yj ) = i = 1, . . . , k (4.23)
pY (yj )
p(x, y) 1 2 3 4
1 0,1 0 0,1 0
2 0,3 0 0,1 0,2
3 0 p 0 0
P P
Sol. Puesto que x y p(x, y) = 1, entonces p = 0, 2 y
XX
P [X ≥ 2, Y ≥ 2] = p(x, y) = 0, 5
x≥2 y≥2
p(x, y) 1 2 3 4 pX (·)
1 0,1 0 0,1 0 0,2
2 0,3 0 0,1 0,2 0,6
3 0 0,2 0 0 0,2
c)
pX,Y (1, 3) 0, 1
P [Y = 3|X = 1] = pY |X (3|1) = = = 0, 5
pX (1) 0, 2
d) La distribución de probabilidad condicionada de Y , cuando X = 2 viene dada
por la f.m.p.
pX,Y (2, j)
P [Y = j|X = 2] = pY |X (j|2) = j = 1, 2, 3, 4
pX (2)
1 2 3 4
0,3 0 0,1 0,2
pY |X (j|2) 0,6 0,6 0,6 0,6
2. Z +∞ Z +∞
fX,Y (x, y) dx dy = 1
−∞ −∞
En consecuencia,
Z bZ d
P [a ≤ X ≤ b, c ≤ Y ≤ d] = fX,Y (x, y) dx dy (4.25)
a c
fX,Y (x, y)
fY |X (y|x) = si fX (x) > 0 (4.28)
fX (x)
fX,Y (x, y)
fX|Y (x|y) = si fY (y) > 0 (4.29)
fY (y)
en cuyo caso, las esperanzas matemáticas condicionadas vienen dadas por
Z Z
E[Y |X = x] = yfY |X (y|x)dy y E[X|Y = y] = xfX|Y (x|y)dx
SY |X=x SX|Y =y
Ejemplo 4.6.14. Una compañı́a dulcera distribuye bolsas de chicles que contienen
dos sabores: menta y fresa. Si los pesos (kg) de cada tipo de chicles, que varı́an de
una bolsa a otra, se distribuyen conjuntamente con una densidad de probabilidad
dada por
(
24xy 0 < x, y < 1, x+y <1
f (x, y) =
0 resto
y
1
1 x
a) el porcentaje de bolsas en las que el peso de cada tipo de chicles es inferior a 0,5
kgviene dado por la probabilidad
1 1
3
Z Z
2 2
P [X ≤ 0, 5, Y ≤ 0, 5] = 24xy dy dx =
0 0 8
b) para calcular el peso medio de cada bolsa de chicle debemos calcular E[X + Y ]
que podemos obtener teniendo en cuenta que E[X + Y ] = E[X] + E[Y ]. Para ello,
determinaremos, primero, las distribuciones de probabilidad marginales, dadas por
las densidades marginales y, en segundo lugar, las esperanzas matemáticas de cada
una de ellas. Ası́,
(R 1−x
0
24xy dy = 12x(1 − x)2 0<x<1
fX (x) =
0 resto
con lo cual,
1
2
Z
E[X] = 12x2 (1 − x)2 dx =
0 5
Análogamente,
(R 1−y
0
24xy dx = 12y(1 − y)2 0<y<1
fY (y) =
0 resto
y nuevamente,
1
2
Z
E[Y ] = 12y 2(1 − y)2 dy =
0 5
Finalmente, el peso medio de cada bolsa es
4
E[X + Y ] = E[X] + E[Y ] = ⇒ 0, 8 kg
5
c) Si Y = 0, 3, entonces la probabilidad de que el peso de los de menta supere los
600 gr (0,6 kg), viene dada por la probabilidad condicionada
Ası́,
0,6 0,6 2
2x 6
Z Z
FX|Y (0, 6|0, 3) = fX|Y (x|0, 3) dx = dx = = 0, 7347
0 0 0, 72 7
y
P [X > 0, 6|Y = 0, 3] = 1 − 0, 7347 = 0, 2653 ⇒ 26, 53 %
Finalmente, el peso medio de los chicles de menta, cuando los de fresa pesan 300 gr
es
0,7
2x 1, 4
Z
E[X|Y = 0, 3] = x 2
dx = = 0, 47 kg
0 0, 7 3
∀B1 , B2 ⊂ R P [X ∈ B1 , Y ∈ B2 ] = P [X ∈ B1 ] · P [Y ∈ B2 ] (4.30)
Ejemplo 4.6.15. Analiza a) si las v.a. X y Y del Ejemplo 4.6.13 son independien-
tes, b) si el peso de los chicles de fresa y de menta del ejemplo anterior son v.a.
independientes.
Sol. a) Es suficiente comprobar que el producto de las f.m.p. marginales pX y
pY coindice con la f.m.p. conjunta pX,Y ,
p(x, y) 1 2 3 4 pX (·)
1 0,1 0 0,1 0 0,2
2 0,3 0 0,1 0,2 0,6
3 0 0,2 0 0 0,2
pY (·) 0,4 0,2 0,2 0,2
Puesto que, por ejemplo,
4.7. Ejercicios.
12. Sean las distribuciones de probabilidad discrestas con f.m.p. dadas por: a)
P [X = k] = c(5 − k) para k = 0, 1, 2, 3, 4, b) P [X = k] = ck 2 /5 para k = 1, 2, 3, 4, 5
Determina en cada caso: ¿qué valor debe tomar c?, las probabilidades de los sucesos
P [X = 4], P [X ≤ 3], P [X < 3], P [X ≥ 2], P [X > 2]; la función de distribución y
utilı́zala para calcular las probabilidades anteriores; la media, mediana y moda.
X 0 1 2 3 4 5 6 7 8
P [X = k] 0,04 0,04 p 0,11 0,30 0,23 0,10 0,05 0,03
23. Una caja contiene 10 transistores, de los cuales 2 están defectuosos. Se escoge
un transistor al azar y se prueba hasta conseguir uno no defectuoso, ¿cuál es el
número medio de transistores escogidos?.
50. En cierta explotación agrı́cola, el peso (kg) de los melones es una v.a. X con
densidad de probabilidad f (x) = kx para 2 < x < 4. a) ¿Cuál es el peso medio de
los melones?, b) ¿cuál es la probabilidad de que un melón elegido al azar pese más
de 3 kgs?, ¿cuál es la probabilidad de que un melón elegido al azar pese entre 2 y
3,5 kgs?, c) ¿cuál es el peso mı́nimo que debe tener un melón para estar entre los
más pesados?.
C1 C3 C4
b
C7
C2 C5 C6
61. La superficie en hectáreas (Ha) de las fincas de los socios de una cooperativa
x+1
en una región del Sur, se distribuye según la función de densidad, f (x) = 48
para 1 < x < 9. a) ¿Cuál es la superficie media de las fincas de esta cooperativa?
¿y su desviación tı́pica?, b) ¿Cuál es la probabilidad de que una finca tenga una
superficie superior a 6 Ha?, c) ¿Cuál es la superficie máxima del 25 % de las fincas
más pequeñas?.
252. Cierto supermercado tiene una caja de salida común y una caja de salida
rápida. Si X es el número de clientes que esperan en la caja común en un momen-
to particular del dı́a, Y es el número de clientes en la caja rápida en ese mismo
momento, y la f.m.p. conjunta de (X, Y ) viene dada por
0 1 2 3
0 0, 08 0, 07 0, 04 0, 00
1 0, 06 0, 15 0, 05 0, 04
2 0, 05 0, 04 0, 10 0, 06
3 0, 00 0, 03 0, 04 p
4 0, 00 0, 01 0, 05 0, 06
261. Una urna contiene 3 bolas rojas y 2 blancas. Se extraen dos bolas. Si X es la
v.a. que indica que la primera bola es roja, esto es, X = 1 si la 1a bola es roja, pero
X = 0, si la 1a bola es blanca; y Y es la v.a. que indica que la 2a bola es roja, determi-
na a) la f.d.p. conjunta, b) la probabilidad del suceso −1 < X ≤ 1, −1 1
2
< Y < 2
,
c) las distribuciones de probabilidad marginales, medias y varianzas, d) averigua si
las v.a. X y Y son independientes.
263. Dado el vector aleatorio discreto (X, Y ) con f.m.p. conjunta p(x, y) = k|x +
y| para x, y = −2, −1, 0, 1, 2, determina a) la probabilidad del suceso [X ≤ 1, Y < 1],
b) las probabilidades P [X = 1], P [Y = −1], c) el valor esperado de X, cuando
Y = 2, d) la distribución de probabilidad de la v.a. |X −Y | y calcula la probabilidad
P [|X − Y | ≤ 1].