Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Jimena Blaiotta D.N.I. 29905968 jblaiotta@yahoo.com.ar Guido Spano 933, Lanus C.P. 1824 L.U.298/02 Pablo Delieutraz D.N.I. 25227711 pdelieutraz@yahoo.com.ar M. T. de Alvear 1265, Cap. Fed. C.P. 1058 L.U. 229/99
ndice
1. Introduccin 2. Deniciones Bsicas 3. Aproximacin normal de la distribucin binomial
3.1. Primera versin del Teorema Central del Lmite. . . . . . . . . . 3.2. Uso de la aproximacin normal a la binomial. . . . . . . . . . . . 4.1. Suma de variables aleatorias independientes . . . . . . . . 4.2. Herramientas utilizadas por Laplace . . . . . . . . . . . . 4.2.1. Mtodo de Laplace para aproximar integrales . . . 4.2.2. Funciones caractersticas . . . . . . . . . . . . . . . 4.3. La deduccin de la aproximacin a la distribucin normal . . . . . . . . . . . . . . . . . . . .
2 2 3
3 4 6 6 6 6 7
5.1. Simon Denis Poisson (1824) . . . . . . . . . . . . . . . . . . . . 5.2. Peter Gustav Lejeune Dirichlet (1846) . . . . . . . . . . . . . . . 5.3. Augustin Louis Cauchy (1853) . . . . . . . . . . . . . . . . . . .
9 9 9
10 11 12 13 14 15
7.1. El Teorema Central del Lmite para variables dependientes . . . 7.2. El Teorema Central del Lmite para vectores aleatorios . . . . . .
14
1. Introduccin
El Teorema Central de Lmite no es un nico teorema, sino que consiste en un conjunto de resultados acerca del comportamiento de la distribucin de la suma (o promedio) de variables aleatorias. Con Teorema Central del Lmite nos referiremos a todo teorema en el que se arma, bajo ciertas hiptesis, que la distribucin de la suma de un nmero muy grande de variables aleatorias se aproxima a una distribucin normal. El trmino Central, debido a Poly (1920), signica fundamental, o de mportancia central, este describe el rol que cumple este teorema en la teora de probabilidades. Su importancia radica en que este conjunto de teoremas desvelan las razones por las cuales, en muchos campos de aplicacin, se encuentran en todo momento distribuciones normales, o casi normales. Un ejemplo tpico de este hecho es el caso de los errores de medida. Con respecto a este tema, Laplace propuso una hiptesis que parece ser plausible. Considera el error total como una suma de numerosos errores elementales muy pequeos debidos a causas independientes. Es casi indudable que varias causas independientes o casi independientes contribuyen al eror total. As por ejemplo, en las observaciones astronmicas, pequeas variaciones de temperatura, corrientes irregulares de aire, vibraciones de edicios y hasta el estado de los rganos de los sentidos de un observador, pueden considerarse como algunas pocas de dichas causas numerosas. El Teorema Central del Lmite es obra de muchos grandes matemticos. Dentro de la historia del Teorema Central del Lmite Laplace ocupa un lugar fundamental: a pesar de que nunca enunci formalmente este resultado, ni lo demostr rigurosamente, a l le debemos este importante descubrimeiento.
2. Deniciones Bsicas
Esta seccin tiene como objetivo establecer la terminologia y deniciones bsicas para evitar interrupciones posteriores y lograr una lectura ms uda. Una variable aleatoria (v.a.) X se dice Bernoulli si su funcin de probabilidad esta dada por: p(0) = P (X = 0) = 1 p p(1) = P (X = 1) = p para algn p (0, 1) Supongamos que se realizan n ensayos independientes, y que en cada uno se tienen dos resultados posibles: xito y fracaso. Supongamos tambin que p es la probabilidad de xito de cada ensayo. Si X representa el nmero de xitos que ocurren en los n ensayos, entonces X se dice una variable aleatoria binomial (o que tiene distribucin binomial) con parmetros (n, p) Obs. 1: una variable aleatoria Bernoulli es simplemente una binomial de parmetros (1, p)
Denicin 1
Denicin 2
Obs. 2: una v.a. binomial de parmetros (n, p) es la suma de n variables aleatorias Bernoulli con probabilidad p = P (Xi = 1) Obs. 3: si X es una variable aleatoria binomial con parmetros (n, p) notaremos b(k ; n, p) = P (X = k )
Denicin 3
Denicin 4
1 (x) = 2
e 2 t dt
1 2
Denicin 5
X (t) = E(eitX ) =
eitx dF (x)
El momento de orden n es E(X n ) El momento absoluto de orden n es E(|X |n ) El n-simo momento centrado de X es el momento de orden n de X E(X ), es decir E((X E(X ))n ) .
Denicin 6
3 tervalo k < Kn tal que Kn /n2 0, entonces para todo > 0 y n sucientemente grande se cumple: ak 1 < <1+ (1) h(kh)
donde
ak = b(k + m; n, p)
con q < p
1 npq
h=
Este teorema se puede enunciar de una forma ms clara, aunque menos precisa de la siguiente forma2 :
b(k ; n, p)
u2 1 e 2 2npq
(2)
np donde u = k npq Nota: observar que el k al que hace referencia el teorema 3.1 no es el mismo que el de la frmula (2)
P X =
v =1
b(v ; n, p) =
k=m
ak
donde X es una variable aleatoria con distribucin binomial de parmetros n y p, y m es el trmino central. Dentro de los lmites de aplicacin del teorema 3.1 obtenemos una buena aproximacin cuando reeplazamos ak por h(kh). Esta cantidad puede interpretarse como el rea de un rectngulo de altura (kh), cuya base es un intervalo de longitud h con centro en kh. Como es habitual, reeemplazamos el rea del rectngulo por el rea correspondiente situada entre el eje x y la grca de ; como es sabido, el error que se comete es despreciable en el lmite cuando h 0. Cuando y son enteros, llegamos a la aproximacin
1 1 P X ( m + )h ( m )h 2 2
Sin embargo en la formulacin nal es preferible reemplazar z1 =
np npq ; np npq
el error que se comete con esta aproximacin tiende obviamente a z2 = cero junto con h. Por lo tanto hemos demostrado el siguiente
2 Esta aproximacin es buena cuando npq 30
La relacin de lmite adquiere una forma ms agradable si reemplazamos el trmino X por X np X = npq As podemos poner (3) como
P z1 X z2 (z2 ) (z1 )
Observacin: al usar la aproximacin normal a la distribucin binomial, estamos aproximando la distribucin de una variable aleatoria discreta con la distribucin de una variable aleatoria continua. Por lo tanto hay que tener algn cuidado con los puntos extremos del intervalo considerado. Por ejemplo, para una variable aleatoria continua, P (X = 3) = 0, mientras que para una variable aleatoria discreta esta probabilidad puede ser positiva. Se ha encontrado que la siguiente correccin para continuidad mejora la aproximacin anterior:
P (X = k )
P (k
1 2
1 X k+ 2 ) 1 2
P (a X b)
P (a
X b+ 1 2)
APROXIMAR!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
Teorema 4.1 Sean X1 , . . . , Xn variables aleatorias independientes, identicamente distribuidas (iid) y acotadas, discretas o absolutamente continuas. Y sean = E(X1 ) y 2 = Var(X1 ). Si n es sucientemente grande, vale la siguiente aproximacin:
1 P (n + r1 n X1 + . . . + Xn n + r2 n) 2
r2 r1
1 t22 e 2 dt
Observar que el teorema de De Moivre-Laplace es un caso muy particular del teorema 4.1 si pensamos a la variable aleatoria binomial X como suma de variables aleatorias independientes Bernoulli Xi .
haber establecido explcitamente las hiptesis, como tampoco haber dado una demostracin totalmente rigurosa, a l se debe este importante descubrimiento
3 A menudo nos referiremos a este teorema como el T.C.L. de Laplace, ya que, a pesar de no
(s + 1) =
0
ex xs dx
donde s es el "gran parmetro". La idea bsica del "mtodo de aproximacin laplaciano"es la siguiente: Sea f el integrando que depende de un "gran parmetro", y supongamos que f tiene un nico mximo muy pronunuciado de manera tal que la integral sobre un intervalo pequeo alrededor de este mximo contribuye considerablemente al resultado de la integral. Entonces se puede esperar que la funcin f sea asintticamente igual a una funcin de la forma
f (a)e(xa)
2k
...
si f alcanza su mximo en x = a. Basado en esta idea, el mtodo de Laplace consiste en desarrollar en series apropiadas alrededor de la abscisa del mximo. En el caso de muchas frmulas probabilsticas este mtodo de aproximacin funcionaba bastante bien. En su artculo de 1774, Laplace trat problemas de aproximacin con un estilo analtico muy parecido al de Euler. En su trabajo posterior dej el estilo euleriano y desarroll, inuenciado por el anlisis algebraico de Lagrange, un estilo especial algoritmico-algebraico trabajando principalmente con desarrollos en series formales. La deduccin de Laplace del T.C.L. fue escrita en este estilo.
Mostraremos la esencia de su procedimiento, en el caso especial de variables aleatorias idntica y simetricamente distribuidas X1 , . . . , Xn las cuales toman los k valores m (m es un nmero natural dado y k = m, . . . , m) con las respectivas probabilidades pk = pk . Para calcular la probabilidad
n
Pj = P
i=1
Xi =
j m
(nm j nm)
m
Laplace utiliz la funcin generatriz T (t) = k=m pk tk . Debido a la independencia de las variables Xi (presupuesta tacitamente por Laplace) Pj es igual al coeciente de tj en [T (t)]n despus de desarrollar el producto. La ejecucin directa de este mtodo es complicada. Laplace introdujo el truco de sustituir la variable t por eix (donde i2 = 1). De esta forma surgen, para un caso particular, lo que hoy llamamos funciones caractersticas. Usando la igualdad
1 2
se deduce
eitx eisx dx = ts
m
(t, s Z)
n
1 Pj = 2
ijx k=m
pk eikx
dx
pk eikx
k=m
Pj = 1 2
1 2
eijx
k=m
pk eikx
dx =
n
eijx
k=m
pk (1 k 2 x2
ik 3 x3 + 6
dx
m k=m
pk k 2
Pj =
1 2
eijx 1
m2 2 x2 + 2
dx
La expansin formal de 7
=: logz
z = e
m2 2 nx2 2
4 4 nx4 8
= e
m2 2 nx2 2
Despus de la sustisucin x =
y n
resulta
2 2 nx2 2
Pj =
1 2 n
n n
y m ij n
m4 4 nx4 + dy 8
Para una aproximacin con n grande, ignoramos, al igual que Laplace algunos trminos, y al mismo tiempo cambiamos los lmites de integracin, obteniendo:
Pj
1 2 n
y m ij n
2 2 nx2 2
dy
m 2n
e 2m2 2 n
j2
La suma de esta ltima expresin desde r1 n hasta r2 n, que puede ser aproximada por una integral, da lugar a una aproximacin para P r1 n Xi r2 n
que se corresponde con el enunciado del teorema 4.1. Segn Laplace es posible generalizar a variables absolutamente continuas suponiendo que m es "innitamente grande". Su intento por demostrar esta importante proposicin no resiste un anlisis riguroso moderno y, por otra parte, no se puede hacer esta demostracin en forma rigurosa.
f (x) =
1 (1 + x2 )
no se aproxima a una distribucin normal, an cuando la cantidad de sumandos sea muy grande. Obviamente, alguna de las hiptesis del que hoy conocemos como teorema de Laplace (teorema 4.1), no se cumple. Se puede demostrar facilmente que la E(Xi ) no existe. Poisson, tambin observ que estos casos no se encuentran en la prctica. Las variables aleatorias con funcin de densidad f jugaran un rol muy importante en el trabajo posterior de Cauchy, es por este motivo que hoy lleva su nombre.
Teorema 6.1 (Liapunov) Sean (Xk )kN v.a. independientes cuyos tres primeros
momentos existen, y sean: mk = E(Xk ), 2 = Var(Xk ) < ak = E((Xk mk )3 )momento centrado de tercer orden bk = E(|Xk mk |3 )momento centrado absoluto de tercer orden Llamemos
n n 2 k k=1
sn :=
Bn :=
bk
k=1
l m
Bn =0 sn
(4)
entonces
l m Fn (x) = (x)
mk )
sn
Observacin: si las v.a. (Xk )kN son identicamente distribudas, entonces la condicin de Liapunov se cumple. En efecto, en este caso son iguales todos los desvos k (llamemos = k ), y tambin son iguales todos los momentos bk (llamemos b = bk ), entonces resulta
sn = n 3 Bn = b 3 n
Luego
3 1 b Bn = l m = 0 n sn n 6 n l m
4 Markov seal a continuacin que se puede demostrar tambin el teorema de Liapunov por el mtodo de los momentos.
10
Aunque para variables identicamente distribudas la condicin de Liapunov se cumple, observemos que no se puede deducir el teorema de Laplace a partir del teorema de Liapunov, ya que puede existir
+
x2 dF (x)
pero
|x|3 dF (x) = +
|x|2+ dF (x) = +
> 0.
Liapunov tambin ha demostrado el T.C.L. con hiptesis ms dbiles. Para esto supuso la existencia, en lugar del tercer momento, del momento de orden 2 + ( > 0) y en lugar de la condicin de Liapunov exigi
n
l m
Bn ( ) =0 sn
1 2+
(5)
donde
Bn ( ) =
k=1
E |Xk mk |2+
Teorema 6.2 (Lindeberg) Sean X1 , X2 , . . . , Xk , . . . variables aleatorias independientes, cuyas medias k =E(Xk ) y desvos k = Var(Xk ) existen. Llamemos
n
sn :=
k=1
2 k
> 0 , se cumple la
l m
1 s2 n
n
k=1 |x|> sn
x2 dFk (x) = 0
(6)
entonces
l m Gn (x) = (x)
k )
sn
11
En los libros modernos de probabilidad, este teorema se demuestra usando funciones caractersticas. Lindeberg en su demostracin no las utiliz. Observacin: de la condicin de Liapunov (4) se deduce la condicin de Lindeberg (6), en efecto:
1 s2 n
n
k=1 |x|>
1 x dFk (x) 2 s sn n
2
n
k=1
Bn sn
La condicin de Lindeberg tambin se puede deducir a partir de (5). Por lo tanto para demostrar el teorema de Liapunov, basta demostrar el teorema de Lindeberg (para una demostracin ver Rnyi [7]).
Xk n n
Para la demostracin de este teorema, necesitamos el siguiente lema previo que enunciamos sin demostracin. Lema: Si la sucesin de funciones caractersticas (n (t)) converge en cada punto t a una funcin (t) continua en algn intervalo |t| < , entonces la sucesin Fn (x) de las correspondientes funciones de distribucin converge a la funcin de distribucin F (x) que corresponde a la funcin caracterstica (t). Demostracin del Teorema 6.3. Todas las variables Xk tienen la misma distribucin, por lo tanto tambin tienen la misma funcin caracterstica X (t). Adems: E(Xk ) = 0 y Var(Xk ) = 2 Debido a las dos siguientes propiedades: 1. Si X e Y son variables aleatorias independientes, entonces:
aX (t) = X (at)
(7)
1 X (t) = 1 2 t2 + o(t2 ) 2
12
(8)
t2 t2 +o 2n n t2 n
donde t tenemos:
n
l m no
=0
(9)
Sea
u=
Entonces
t2 t2 +o 2n n t2 t2 +o 2n n t2 t2 + no 2 n
Usando el lema previo, queda demostrado el teorema. Lindeberg (1922) di la primera demostracin rigurosa de un teorema ms general (teorema 6.2) que contiene al teorema 6.3, en efecto: si todas las variables Xk tienen la misma distribucin, con desvo nito , tenemos
+
F (x) = Fk (x),
x2 dF (x) = 2
y sn = n
De donde
1 n s2 n l m
x2 dFk (x) =
k=1 |x|> sn
1 l m 2 n
x2 dFk (x) = 0
|x|> sn
El teorema 6.3 es bsicamente una reformulacin del T.C.L. de Laplace (quien no di una demostracin rigurosa as como tampoco estableci claramente las hiptesis del teorema). Lvy en su demostracin del teorema 6.3 (1930-1935) reinvent la tcnica de las funciones caractersticas. Existen razones histricas de que Lvy no conoca el trabajo de Laplace: los libros franceses de esa poca (Bertrand (1889-1907), Poincar (1896-1912), Borel (1909-1924)) no mencionaban a Laplace ni a las funciones caractersticas, de hecho Lvy dud en usarlas en su trabajo debido a las crticas de Borel.
l m m ax (
k )=0 sn
l m Fn (x) = (x)
1 n s2 n l m
n
k=1 |x|> sn
rias independientes cuyas varianzas existen, y sea Gk (x) la funcin de distribucin de de Xk , =E(Xk ), k = Var(Xk ), llamemos Fn (x) a la funcin de distribucin de
Sn
n k=1 (Xk
k )
sn
donde sn =
k=1
l m max1kn (
k )=0 sn
l m Fn (x) = (x)
(x k )2 dGk (x) = 0
k=1 |xk |> sn
Teorema 6.5 (Teorema) Sean X1 , X2 , . . . , Xk , . . . variables aleatorias independientes uniformemente acotadas, es decir: existe una constante a > 0 tal que k P(|Xk | a) = 1
y supongamos que Var(Xk ) = 0 k . Entonces l m Fn (x) l m s2 n =
n n
14
15
Referencias
[1] Julie Xiuyu Cong: Historical Development of Central Limit Theorem ; 2003 [2] W. Feller: Introduccin a la teora de las probabilidades y sus aplicaciones ; Limusa, 1996 [3] H. Fischer: The Central Limit Theorem from Laplace to Cauchy ; 2000 [4] M. Fisz: Probability Theory and Mathematical Statistics ; John Wiley & Sons, Inc., 1963 [5] P. Meyer: Probabilidad y aplicaiones estadsticas ; Fondo Educativo Interamericano, S.A., 1963 [6] F. Mosteller; R. Rourke; G. B. Thomas, Jr: Probability and Statistics ; Addison-Wesley Publishing Company, Inc., 1961 [7] A. Rnyi: Clculo de Probabilidades ; Editorial Revert, S.A., 1976 [8] S. Ross: A First Course in Probability ; Prentice Hall, Inc., cuarta ed., 1994 [9] J. V. Uspensky: Introduction to Mathematical Probability ; Mc Graw-Hill Book Company London, 1937
16