Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Repaso de convergencia de
sucesiones de variables aleatorias
1.1. Introducción
también hemos llamado media (pero en este caso, poblacional). Para evitar confusiones,
límites de medias, como las leyes de los grandes números (LGN) y el teorema central del
límite (TCL).
En los capítulos anteriores se han estudiado distintos aspectos de las v.a. n-dimensiona-
cuestiones básicas, para casos restringidos de sucesiones de v.a.. Consideramos casi exclu-
sivamente el caso mas sencillo de sucesiones de v.a., aquel en que las componentes son vaiid.
matemático de la sucesión de v.a. como v.a. 1-dimensional, y solo hacemos unos comen-
tarios al respecto. Es su…ciente considerar v.a. n-dimensionales, para las que estudiamos
1
el comportamiento cuando n tiende a in…nito de funciones de ellas, la media básicamente.
Por ello, haremos solo una mención de las cuestiones mas técnicas, sobre la “convergencia
casi segura” y la “ley fuerte de los grandes números”, sin hacer un estudio mas profundo.
Las cuestiones que se estudian son fundamentales, desde un punto de vista tanto teórico
Por la novedad y variedad de las nociones y resultados estudiados, el asunto tiene cierta
complejidad.
Sin embargo, la aplicación principal, que no única, de lo que se estudiará en este capí-
tulo, y de la que se ocupan la mayoría de los ejercicios, se puede resumir en una sola frase:
No importa cual sea la distribución, común, de las variables, solo es necesario que tengan
va a consistir en expresar el problema en términos de una suma o una media de vaiid (que
será lo más complicado del ejercicio), y hacer cálculos mediante la aproximación normal.
una formulación sencilla. En el apartado 2 se demuestra una versión simple de las LGN,
que sirve como muestra del tipo de resultados que son estas LGN, y en el apartado 3 se
Los apartados 4 y 5 son los más teóricos. Se presenta el contexto matemático que
permite una formulación precisa de los resultados. Se exponen algunas generalidades sobre
2
complementa los comentarios hechos en el apartado 3.
Incluimos en esta introducción algunos resultados que son triviales, pero que deben
2
E [S] = n , V [S] = n , (1.2)
2
E X = y V X = =n : (1.3)
P P
E [S] = E [ ni=1 Xi ] = ni=1 E [Xi ] = n y (1.4)
P P P
V [S] = V [ ni=1 Xi ] = ni=1 V [Xi ] + Cov = n 2
+0=n 2
, (1.5)
1 1 1
E X =E S = E [S] = n = y (1.6)
n n n
2 2
1 1 1 2
V X =V S = V [S] = n = . (1.7)
n n n2 n
3
- Por último, obsérvese que si las vaiid Xi son B (1; p) (Bernoulli), entonces la
P
suma S = ni=1 Xi es el número total de éxitos (de variables que toman el valor 1), y la
P
media X = n1 ni=1 Xi es la proporción de éxitos en las n repeticiones: una media de
alguna v.a., entonces según vamos repitiendo el experimento más y más veces la media de
Ya desde el siglo XVII, para estudiar esta cuestión algunos investigadores en probabili-
y otros experimentos.
matemática de este hecho empírico. Estos resultados se reunen con el nombre de leyes de
Lema 1. (desigualdad de Chevichev) Sea Z una v.a. con EZ y V [Z] …nitas. Para todo
4
de Z. Sea = EZ. Se tiene que
h i Z 1
V [Z] = E (Z )2 = (z )2 f (z)dz (1.10)
1
Z Z
2
= (z ) f (z)dz + (z )2 f (z)dz (1.11)
fz : (z )2 <"2 g fz : (z )2 "2 g
Z n o
0+ "2 f (z)dz = "2 P (Z )2 "2 , (1.12)
fz : (z )2 "2 g
n o
V [Z]
y por tanto P (Z )2 "2 "2
. De aquí se obtiene el resultado:
n o n o
V [Z]
P fjZ j < "g = P (Z )2 < "2 = 1 P (Z )2 "2 1 "2
. (1.13)
Sean X1 ; X2 ; : : : v.a. asociadas a las sucesivas repeticiones. Por ejemplo, los resultados del
lanzamiento de un dado, o la longitud de las varillas metálicas producidas por una máquina.
Proposición 2. (ley débil de los grandes números) Sean X1 ; X2 ; : : : vaiid con espe-
y V Xn = 2 =n:
2
P Xn <" 1 . (1.15)
n"2
2
lm P Xn <" lm 1 =1 0=1, (1.16)
n!1 n!1 n"2
y, puesto que la probabilidad no puede ser mayor que 1, la desigualdad en (1.16) tiene que
5
Obsérvese que Xn <" = " < Xn <" = " < Xn < +" .
Esta ley débil de los grandes números ha sido objeto de diversas generalizaciones,
obteniéndose distintas leyes de los grandes números (algunas de las cuales se presentan
Por ejemplo, las empresas aseguradoras saben, aproximadamente, en vista de los datos
de años anteriores, cual es la proporción de clientes que van a sufrir un accidente, y pueden
hacer una previsión de los pagos que van a tener que realizar por ese motivo. Siempre, por
En este caso, podemos asociar una v.a. de Bernoulli Xi a cada asegurado, que vale 1 en
una aproximación sobre el valor que va a tomar X, y de aquí sobre el número total de
P
accidentes S = i Xi . Cuanto mayor es el número de asegurados, mejor es la predicción
para X.
Por otra parte, la proposición 2 se puede obtener como corolario del teorema central del
límite, según se comprueba en el ejemplo 12. Para este caso con varianza …nita, el TCL es un
re…namiento de la ley débil de los grandes números. La ley débil (proposición 2) establece
que X n tiende a concentrar toda la probabilidad mas cerca de cuanto mas grande es n, y
el TCL (teorema 11) explica además de qué modo se distribuye esta probabilidad: se tiene
p
que la distribución de X n es aproximadamente N ( ; = n) si n es grande.
sulta necesario conocer su distribución para poder aplicar los procedimientos estadísticos
En este apartado realizamos algunos cálculos para sumas de vaiid de Bernoulli. En este
6
caso, la suma tiene distribución conocida, es binomial. En otros casos de sumas de vaiid
Aun en el caso simple de la distribución binomial, los cálculos son laboriosos, cuando no
en 100 repeticiones sea menor o igual que 0:37. Sea Y B(100; 0:4) el número de éxitos.
Realizar este cálculo supone un gran número de operaciones y, además, los factoriales
involucrados toman un valor muy grande. Se tiene que 70! > 10100 , y la calculadora presenta
un mensaje de error porque no admite valores tan grandes. No obstante, con algunas
(1.17) de un modo rápido. Sin embargo, es innecesario realizar tantos cálculos. Mediante
el TCL obtendremos, de un modo muy sencillo, una muy buena aproximación para (1.17).
Este resultado proporciona una aproximación para la binomial, con n grande, mediante
una normal.
El uso de esta aproximación para el cálculo de (1.17) muestra su utilidad. El valor exacto
7
Sin embargo, puesto que vamos a aproximar una binomial, que es discreta, mediante
una normal, que es continua, conviene hacer una corrección en el cálculo. Obsérvese que
denomina corrección por continuidad. La idea consiste en aproximar para cada y entero la
p
probabilidad P fY = yg por P y 21 < N 40; 24 < y + 12 . Con ello, obtenemos:
n p o n o
37:5
p 40
P fY 37g ' P N 40; 24 37:5 = P N (0; 1) 24
= 0:3050 ,
Obsérvese que el cálculo aproximado es mucho más rápido que el cálculo exacto, y
pensar) que la moneda está equilibrada? Para dar una respuesta, calcula, de un modo
aproximado, la probabilidad de que al lanzar 100 veces una moneda equilibrada se obtenga
el dato observado, una proporción de caras igual a 0:68 en los 100 lanzamientos, y la
entonces deberíamos poner en duda que la moneda esté realmente equilibrada. Vamos a
Y Y 50 67:5 50
P 100 0:68 = P fY 68g = P fY 67:5g = P 5 5 (1.20)
4
' P fN (0; 1) 3:5g = 2:33 10 = 0:000233 . (1.21)
8
De cualquier modo, es altamente improbable obtener una proporción tan alta de caras
(X1 ; : : : ; Xn ). Los resultados que estudiaremos, leyes de los grandes números y teorema
práctico de estos resultados es que esos límites nos sirven como aproximación de lo que
Damos unos breves apuntes sobre el contexto matemático en el que se formulan estos
probabilidad ( ; A; P ) ,
Las v.a. son funciones, y podemos agrupar la sucesión de funciones X1 ; X2 ; : : : en una única
función
X = (X1 ; X2 ; : : :) . (1.23)
Del mismo modo que una v.a. n-dimensional toma valores en Rn , que es el conjunto de
reales.
(n
El conjunto de n-uplas de números reales, Rn , es el producto cartesiano R R, y
9
R R . Podemos denotar este conjunto de sucesiones de números reales por R1 ó
RN :
De este modo, X es una función de…nida sobre con valores en R1 dada por
Del mismo modo que una variable n-dimensional tiene una distribución conjunta, también
Vamos a considerar en este capítulo el caso en que X1 ; X2 ; : : : son vaiid, esto es,
además una matriz de “probabilidades (condicionadas) de transición”. Otros casos son mas
y se denota por
d
Xn ! X . (1.27)
10
Expresa que las distribuciones individuales unidimensionales de X1 ; X2 ; : : : se acercan a la
Calculamos G(x) = l mn!1 Fn (x) y comprobamos que G(x) = F (x) para todo x en el
que F es continua.
Si x 2, entonces Fn (x) = 0 para todo n (puesto que x 2 < 2 + n1 en este caso). Por
tanto, G(x) = 0 si x 2.
1 1 n!1
Si x > 2, entonces existe n0 tal que x > 2 + n para n > n0 (puesto que n ! 0). Por
1 d
Ejercicio 5. Sea Xn 2 n. Comprueba que Xn ! 2. (En este caso se obtiene que
2.- Sean X; X1 ; X2 ; : : : variables aleatorias discretas con soporte en los enteros, tales
11
3.- Sean X; X1 ; X2 ; : : : variables aleatorias continuas, tales que las funciones de densidad
Este resultado permite aproximar una B(n; p) con n grande y p pequeño mediante
una Poisson P(np). Recuérdese que ya obtuvimos otra aproximación de la B(n; p), como
normal. De aquí que, siendo válida la aproximación de la B(n; p) con n grande y p pequeño
mediante una Poisson P(np), también es cierto que si n es su…cientemente grande para que
interesante porque explica por qué la distribución de Poisson está asociada a distintos
fenómenos aleatorios. Por ejemplo, el número de personas que llegan a una tienda en un
12
La explicación es clara si tenemos en cuenta que en ambos fenómenos la distribución
puede ser entendida como una B(n; p) con n muy grande y p muy pequeño: hay muchos
clientes potenciales y cada uno tiene una probabilidad muy pequeña de acudir a la tienda, o,
hay muchas particulas que pueden desintegrarse, cada una con probabilidad muy pequeña.
unas de otras, con la misma probabilidad (dada por la tasa de desintegración del elemento
considerado), el número de partículas es inmenso, y cada una tiene una probabilidad ex-
vida media).
y se denota por
p
Xn ! X . (1.34)
Expresa que la variable Xn X concentra, tan cerca del cero como se quiera, una parte
13
En particular,
p
Xn + Yn ! X + Y , (1.35)
p
Xn Yn ! X Y , (1.36)
p
Xn Yn ! XY . (1.37)
p d
Xn ! X ) Xn ! X , y (1.38)
d p
Xn ! k ) Xn ! k . (1.39)
Por tanto, para el caso de convergencia en distribución a una degenerada, se tiene que
d p
Xn ! k () Xn ! k . (1.40)
se cumple.
d
Comprueba que Xn ! X pero Xn no converge en probabilidad a X.
Solución: Todas las variables Xn y X tienen la misma distribución, B(1; 1=2), y por
d
tanto Xn ! X de un modo trivial. Las Xn son todas la misma variable, pero diferente de X,
y por tanto
14
1.5.3. Convergencia casi segura
Se dice que la sucesión de variables aleatorias X1 ; X2 ; : : : converge casi seguro (o, con
c:s:
y se denota por Xn ! X .
c:s: p
Xn ! X ) Xn ! X . (1.44)
Además, las convergencias en probabilidad consecuencia de las LGN son hacia v.a.
ca”.
15
cuando n tiende a in…nito, siendo X1 ; X2 ; : : : una sucesión de variables aleatorias. A lo largo
de los últimos siglos se han ido obteniendo distintos resultados sobre la convergencia de
X n , con distinto grado de generalidad y en distintos contextos (por ejemplo, con variables
dos. Enunciamos sin demostración algunos otros de estos resultados, denominados generica-
mente leyes de los grandes números. La ley débil se re…ere a convergencia en probabilidad,
y la ley fuerte se re…ere a convergencia casi segura. A su vez, hay distintas versiones de
Teorema 8. (ley débil de los grandes números) Si X1 ; X2 ; : : : son vaiid con esperanza
p d
Obsérvese que, por (1.40), se tiene que X n ! si y solo si X n ! (la distribución de
Obsérvese que este teorema mejora la proposición 2, puesto que aquí no se impone que
p
V [Xn ] sea …nita. Para que se dé la convergencia X n ! no hace falta que la varian-
Teorema 9. (ley débil de los grandes números) Sea X1 ; X2 ; : : : una sucesión de varia-
P P
bles aleatorias con esperanza …nita y sea Yn = n1 ni=1 Xi n1 ni=1 E[Xi ]. Una condición
p
necesaria y su…ciente para que Yn ! 0 es que
Yn 2
lm E =0. (1.47)
n!1 1 + Yn 2
la validez del teorema sería inabordable de un modo empírico. Lo que empezó siendo una
por los matemáticos, mediante razonamiento lógico, obteniéndose no solo éste, sino además
un amplio abanico de resultados a lo largo del tiempo que son de gran utilidad práctica.
16
Presentamos ahora otra generalización del teorema 8, pero en un sentido diferente a la
Teorema 10. (ley fuerte de los grandes números). Si X1 ; X2 ; : : : son vaiid con esperanza
Este teorema hace obsoleto el teorema 8, que hacía a su vez obsoleta la proposición
2. Ésto, en lo que respecta a la relación lógica entre ellos. Sin embargo, habitualmente la
para entender qué supone en la práctica cualquier resultado del tipo P (A) = p.
proporción (frecuencia relativa) de éxitos para una cantidad creciente de repeticiones (por
proporción de éxitos.
Mediante una operación muy sencilla, podemos extender esta interpretación frecuen-
17
Consideremos una expresión del tipo
P (A) = p . (1.49)
- que la duración de una bombilla sea mayor de 150 horas, con p = 1 F (150), siendo
v.a. de Bernoulli que nos indica si ha ocurrido A o no: sea Z la v.a. que vale 1 si al realizar
P fZ = 1g = P (A) = p (1.50)
(y P fZ = 0g = 1 p).
compuesto.
Se veri…ca que Z1 ; : : : ; Zn son vaiid B(1; p). La proporción de veces que ocurre A en las
n repeticiones es
n
1X
Z= Zi , (1.51)
n
i=1
d
y por la LDGN se tiene que Z ! p , y por tanto, si obtuvieramos muchas repeticiones inde-
valga 2=6, quiere decir que si realizáramos n (grande) lanzamientos del dado, entonces en
18
aproximadamente dos sextas partes (un tercio) de los lanzamientos obtendríamos un 3 ó
un 4.
apartado 1.3 ya se presentaron algunos ejemplos que mostraban el interés de obtener esta
distribución, y ya se hizo referencia a la solución aportada por el teorema central del límite
En este apartado presentamos el enunciado preciso y general del TCL para vaiid, válido
para v.a. de Bernoulli entre otras. Existen versiones mas generales del TCL, por ejemplo
Teorema 11. (teorema central del límite) Consideremos vaiid X1 ; X2 ; : : : con esperanza
Xn d
p !Z . (1.52)
= n
de X n tipi…cada es aproximadamente N (0; 1), lo que nos permite hacer cálculos aproxi-
19
de X n suele ser de difícil manejo, y la aproximación proporcionada por el TCL es de gran
utilidad.
grande an es tan cercano a a como queramos. De un modo similar, puesto que X n tipi…cada
mas grande sea n mas cercana es la distribución a la de la N (0; 1), y mejor la aproximación
en los cálculos.
cuanto mas lejano esté p de 1=2 (mas cerca de 0 ó de 1), y se requieren valores mas grandes
X np
Si Zn = = n
es aproximadamente N (0; 1), entonces, puesto que transformadas li-
p
X n es aproximadamente N ( ; = n) . (1.53)
p
Sn es aproximadamente N n ; n . (1.54)
d
Utilizamos también el símbolo “ A” en vez de “!”, para denotar la convergencia en
X np
distribución. Por ejemplo, el resultado (1.52) se expresa como = n
AN (0; 1) , y se lee
X np
del siguiente modo: “ = n
es asintóticamente N (0; 1)”.
p p
Xn AN ( ; = n) y Sn AN (n ; n) . (1.55)
20
p
Estas expresiones se leen como “X n es asintóticamente N ( ; = n)” y “Sn es asintóti-
p
camente N (n ; n)”. Obsérvese que los parámetros de la distribución asintótica son
o n-dimensionales.
teorema 11. Solamente se exponen las ideas principales de la demostración, omitiendo los
Por el TCL, cuanto mas grande es n mas cercana es la distribución de X=npn a la N (0; 1),
p
siendo N (0; 1) en el límite. Además, l mn!1 " n = 1, y se obtiene que
n p o
X np "
lm P Xn <" = lm P = n
< n = P fjN (0; 1)j < 1g = 1 . (1.57)
n!1 n!1
Obsérvese que aunque la distribución límite en (1.57) no hubiera sido la N (0; 1), sino
21
mente la proposición 2. El teorema 11 es un re…namiento de la proposición 2: la proposición
establece que
P Xn <" (1.58)
Ejemplo 13. Se lanza una moneda 100 veces. Calcula la probabilidad de obtener (incluidos
a) Entre 40 y 60 caras.
b) Entre 45 y 55 caras.
c) Entre 47 y 53 caras.
mente la distribución del número de caras, binomial, mediante una normal. Aquella apro-
ximación es consecuencia del teorema 11, pero en el apartado 1.3 no se explicaba por qué.
Lo hacemos ahora, expresando este número de caras como suma de vaiid de Bernoulli.
lanzamiento i-ésimo y vale 0 si sale cruz. Se tiene que X1 ; : : : ; Xn son vaiid B(1; p). Puesto
que no se dice nada en contrario, suponemos que la moneda está equilibrada, y entonces
2
p = P fXi = 1g = 1=2 , = p = 1=2 y = p(1 p) = 1=4 . (1.59)
Pn
Se tiene que S = i=1 Xi (binomial) es el número de caras. La v.a. S es suma de vaiid
el apartado 1.3 se hicieron algunos cálculos que indican que la aproximación es buena en
22
a) Mediante aproximación normal, con la corrección por continuidad, obtene-
mos
es el caso en todos los apartados de este ejemplo, la formulación resulta algo más concisa
expresando las desigualdades utilizando la función valor absoluto. Así es como lo haremos
se tiene que
b)
5:5
P f45 S 55g = P fjS n j < 5:5g ' P jN (0; 1)j < (1.69)
5
c)
3:5
P f47 S 53g = P fjS n j < 3:5g ' P jN (0; 1)j < (1.71)
5
23
Ejercicio 14. Se lanza una moneda 1.000 veces. Calcula, de un modo aproximado, la
probabilidad de obtener
a) entre 400 y 600 caras, b) entre 450 y 550 caras, c) entre 470 y 530 caras.
pedidas en términos de X, y resulta que las expresiones del ejemplo coinciden con las del
El hecho de que las probabilidades calculadas en el ejercicio sea mayores que las del ejemplo,
ley débil de los grandes números establece que la distribución de X = X n converge a una
cuanto mas grande es n. Ésto también está en relación con el hecho de que E X n = =
p
1=2 y la desviación típica X n = = n vale 0:05 con n = 100 y vale 0:0158, que es
A1 = [0:4; 0:6], A2 = [0:45; 0:55] y A3 = [0:47; 0:53]. Puesto que 1=2 2 Ai para i = 1; 2; 3, y
l m P X n 2 Ai = 1 . (1.74)
n!1
Ejemplo 15. Consideremos una urna con bolas marcadas con los números 1, 2, 3 y 4, con la
misma cantidad de bolas de cada número. Sea A el suceso “obtener una bola marcada con un
3”en la extracción (al azar) de una bola. Se realizan n extracciones con reemplazamiento.
24
a) Con n = 400, calcula la probabilidad de que T esté entre 0:2 y 0:4.
c) Calcula n tal que la probabilidad de que T esté entre 0:23 y 0:27 valga 0:9.
ésima extracción y vale 0 en otro caso. Se tiene que X1 ; : : : ; Xn son vaiid B(1; p), con
b) Se tiene que
X c
P X 1=4 < c = P X <c =P p < p (1.81)
= n = n
1 0:8
y entonces P fN (0; 1) > 46:19 cg = 2 = 0:1. Buscando en el cuerpo de la tabla
de la N (0; 1) el valor mas cercano a 0:1 se obtiene P fN (0; 1) > 1:28g = 0:1003. Por
tanto, debe ser 46:19 c = 1:28, y de aquí c = 0:0277. Hemos obtenido entonces que
25
c) Se tiene que
P 0:23 < X < 0:27 = P X 1=4 < 0:02 = P X < 0:02 (1.84)
X 0:02 p
=P p < p ' P jN (0; 1)j < 0:04619 n (1.85)
= n = n
p
=1 2P N (0; 1) > 0:04619 n = 0:9 , (1.86)
p 1 0:9
y entonces P fN (0; 1) > 0:04619 ng = 2 = 0:05. Buscando en la tabla de la N (0; 1)
Ejemplo 16. Sean X1 ; : : : ; Xn vaiid con esperanza = 7:6 y desviación típica = 5:4.
a) Con n = 400, calcula P 7:1 < X < 8:4 y P 7:1 < X < 8:1 .
y podemos utilizar la función valor absoluto en las expresiones, pero en el primer caso no
es así.
7:1 X 8:4
P 7:1 < X < 8:4 = P p < p < p (1.87)
= n = n = n
X 0:5
P 7:1 < X < 8:1 =P X 7:6 < 0:5 = P p < p (1.91)
= n = n
26
b) Se tiene que
X c
P X <c =P p < p (1.93)
= n = n
1 0:95
y entonces P fN (0; 1) > 3:704 cg = 2 = 0:025. Buscando en la tabla de la N (0; 1)
se obtiene P fN (0; 1) > 1:96g = 0:025. Por tanto, debe ser 3:704 c = 1:96, y de aquí
c = 0:529.
c) Se tiene que
X 0:35
P X 7:6 < 0:35 = P X < 0:35 = P p < p (1.96)
= n = n
p p
' P jN (0; 1)j < 0:06481 n =1 2P N (0; 1) > 0:06481 n = 0:95 , (1.97)
p
y entonces P fN (0; 1) > 0:06481 ng = 0:025. Buscando en la tabla de la N (0; 1) se
p
obtiene P fN (0; 1) > 1:96g = 0:025. Por tanto, debe ser 0:06481 n = 1:96, y de aquí
n = 915 .
27