Está en la página 1de 27

Captulo 3

Funciones Medibles e Integracion


3.1. Introduccion
Sea X :

donde

es el recorrido de X, es decir, para todo

existe con X() =

.
X determina la funcion
X
1
: P(

) P()
denida por
X
1
(A

) = { : X() A

} = {X A

}
para A

.
Propiedades.
(i) X
1
() = , X
1
(

) = .
(ii) X
1
(A
c
) = (X
1
(A

))
c
de modo que X
1
(

) = X
1
(A

).
(iii) X
1
(
tT
A

t
) =
tT
X
1
(A

t
), X
1
(
tT
A

t
) =
tT
X
1
(A

t
).
Veamos la demostracion de (ii)
X
1
(A
c
) X() A
c
X() / A

/ X
1
(A

) (X
1
(A

))
c
.
Si C

P(

) es una coleccion de subconjuntos de

, denimos
X
1
(C

) = {X
1
(C

) : C

}.
Proposicion 3.1 Si F

es una -algebra de subconjuntos de

entonces X
1
(F

) es una -algebra de
subconjuntos de .
Demostracion. Usando las propiedades de X
1
,
(i)

X
1
(

) = X
1
(F

).
(ii) A

(A

)
c
F

. Por lo tanto si X
1
(A

) X
1
(F

) tenemos (X
1
(A

))
c
= X
1
((A

)
c
)
X
1
(F

).
(iii) Si X
1
(A

n
) X
1
(F

) entonces
n
X
1
(A

n
) = X
1
(
n
A

n
) X
1
(F

) porque
n
A

n
F

32 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Proposicion 3.2 Si C

es una coleccion de subconjuntos de

entonces
X
1
((C

)) = (X
1
(C

)).
Demostracion. Por la proposicion 3.1, X
1
((C

)) es una -algebra y X
1
(C

) X
1
((C

)) porque
C

(C

) y por minimalidad
(X
1
(C

)) X
1
((C

)).
Para ver el recproco denimos
F

= {B

P(

) : X
1
(B

) (X
1
(C

))}.
Entonces F

es una -algebra ya que


(i)

porque X
1
(

) = (X
1
(C

)).
(ii) Si A

entonces (A

)
c
F

ya que
X
1
(A
c
) = (X
1
(A

))
c
(X
1
(C))
si X
1
(A

) (X
1
(C

)).
(iii) Si B

n
F

entonces X
1
(B

n
) (X
1
(C

)), por lo tanto


X
1
(
n
B

n
) =
n
X
1
(B

n
) (X
1
(C

))
Por denicion, X
1
(F

) (X
1
(C

)). Ademas C

porque X
1
(C

) (X
1
(C

)). Como F

es una
-algebra, (C

) F

y por lo tanto
X
1
((C

)) X
1
(F

) (X
1
(C

)).

3.2. Funciones Medibles


Denicion 3.1 Sean (, F) y (

, F

) dos espacios medibles. Una funcion X :

es medible si
X
1
(F

) F. En este caso escribimos X F/F

o X F si esta claro cual es la -algebra F

.
Observacion 3.1 1. En Teora de Probabilidad se dice que X es una variable aleatoria.
2. La medibilidad de X no implica que X(A) F

para todo A F. Por ejemplo, si F

= {,

}
entonces toda funcion X :

es medible, cualquiera sea F, pero si A F y X(A) es un


subconjunto no vaco y propio de

entonces X(A) / F

.
3. Si (, F) es un espacio medible y X : R
n
, decimos que X es (Borel) medible si X es medible
cuando tomamos la -algebra de los borelianos B
n
como -algebra en R
n
. Si es un subconjunto
de R
k
o es R
k
y decimos que X es Borel medible, suponemos que F = B
k
.
Ejemplo 3.1
Si A B la funcion 1
A
(x) es una funcion medible.
Proposicion 3.3 Sea X : (, F) (

, F

) y supongamos que F

= (C

), entonces X es medible si y
solo si X
1
(C) F.
3.2. FUNCIONES MEDIBLES 33
Demostracion.
X
1
(C) F (X
1
(C

)) F
y en consecuencia
X
1
((C

)) = X
1
(F

) = (X
1
(C

)) F.

Ejemplo 3.2
Una funcion continua X de R
k
en R
n
es medible porque si O es la clase de los conjuntos abiertos de R
n
,
entonces para todo A O se tiene que X
1
(A) es abierto y por lo tanto esta en B
k
.
Ejemplo 3.3
Para mostrar que una funcion X : R es Borel medible, es suciente mostrar que { : X() > c} F
para todo real c. Porque si C es la clase de conjuntos (c, ), c R, entonces (C) = B. Los conjuntos
{ : X() > c} se pueden reemplazar por { : X() c}, { : X() < c} o { : X() c}.
Denicion 3.2 Sea (, F, P) un espacio de probabilidad y X : (, F) (

, F

) una variable aleatoria.


Denimos la funcion P
X
= P X
1
en F

por
P
X
(A

) = P X
1
(A

) = P(X
1
(A

)).
P
X
es una probabilidad sobre (

, F

) que se conoce como la medida inducida por, la distribucion o la


ley de X
Para vericar que P
X
es una medida de probabilidad sobre F

observamos que
1. P
X
(

) = P() = 1.
2. P
X
(A

) 0, A

.
3. Si (A

n
)
n1
son disjuntos 2 a 2 entonces
P
X
(
n
A

n
) = P(
n
X
1
(A

n
)) =

n
P(X
1
(A

n
)) =

n
P
X
(A

n
)
porque (X
1
(A

n
))
n1
son disjuntos en F.
Si X toma valores en R su distribucion P
X
es una probabilidad en R caracterizada por su funcion de
distribucion F
X
(x) = P
X
((, x]) = P(X x). Decimos que F
X
es la funcion de distribucion de X. Si
F
X
tiene una densidad f
X
decimos que es la densidad de X.
Proposicion 3.4 La composicion de funciones medibles es medible.
Demostracion. Sean X : (E, E) (F, F) y Y : (F, F) (G, G) dos funciones medible. Sea A G
entonces
(Y X)
1
(A) = X
1
(Y
1
(A)).
Como Y es medible, B = Y
1
(A) F. Como X es medible, X
1
(B) E.
Proposicion 3.5 Si X, Y son funciones medibles, tambien lo son X + Y, X Y, X Y, X Y y
X/Y (Y = 0).
34 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Demostracion. Ejercicio.
Dada una funcion X denimos X
+
y X

por
X
+
() = max{0, X()}, X

() = mn{0, X()}.
entonces X() = X
+
() X

() y |X()| = X
+
() + X

() y ambas funciones X
+
y X

son no-
negativas.
Corolario 3.1 Las funciones X
+
, X

y |X| son medibles.


Demostracion. Ejercicio.
Corolario 3.2 Si X = (X
1
, . . . , X
k
) es un vector aleatorio y g : R
k
R es medible, entonces g(X) es
medible. En particular, si g es continua entonces es medible y el resultado vale.
Demostracion. Ejercicio.
Ejemplos 3.4
k

i=1
x
i
,
1
k
k

i=1
x
i
, sup
1ik
x
i
,
k

i=1
x
i
,
k

i=1
x
2
i
son todas funciones continuas de R
k
en R.
Otro ejemplo interesante es la proyeccion
i
: R
k
R denida por

i
(x
1
, . . . , x
k
) = x
i
.

i
es continua y si X = (X
1
, . . . , X
k
) es un vector aleatorio entonces
i
(X) = X
i
es una variable aleatoria.
Proposicion 3.6 X = (X
1
, . . . , X
k
) es un vector aleatorio si y solo si X
i
es una variable aleatoria para
i = 1, . . . , k.
Demostracion. El ejemplo anterior muestra que la condicion es necesaria. Para el recproco comenzamos
con
B
k
= (S
k
)
donde S
k
es la clase de los rectangulos abiertos en R
k
. Sean X
1
, . . . , X
k
variables aleatorias y B =
I
1
I
k
un rectangulo de lados I
1
, . . . , I
k
. Entonces
X
1
(B) =
k

i=1
X
1
i
(I
i
).
Como cada X
i
es una variable aleatoria, X
1
i
(I
i
) B
k
, de modo que X
1
(B) B
k
y X
1
(S
k
) B
k
. En
consecuencia X
1
es medible.
Proposicion 3.7 X = (X
1
, X
2
, . . . ) es una sucesi on aleatoria si y solo si para cada i 1 la i-esima
componente X
i
es una v.a. Ademas, X es una sucesion aleatoria si y solo si (X
1
, . . . , X
k
) es un vector
aleatorio para todo k.
Demostracion. Ejercicio.
Proposicion 3.8 Sean X
1
, X
2
, . . . funciones medibles denidas sobre (, F), entonces
3.3. -

ALGEBRAS GENERADAS POR FUNCIONES 35


(i) supX
n
, nf X
n
, lmsup X
n
, lminf X
n
son funciones medibles.
(ii) Si X
n
() X() para todo , X es una funcion medible.
(iii) El conjunto en el cual la sucesion (X
n
) converge es medible.
Demostracion. (i) {X
n
} F porque X
n
es medible. Por lo tanto {sup
n
X
n
} =
n
{X
n
}
esta en F, para todo y en consecuencia sup
n
X
n
es medible. De manera similar {nf
n
X
n
} =

n
{X
n
} F e nf
n
X
n
es medible. Como consecuencia lminf X
n
y lmsup
n
X
n
son medibles.
(ii) Es consecuencia de (i) porque lmX
n
= lmsup
n
X
n
= lminf X
n
.
(iii) Tenemos
{ : lm
n
X
n
() existe }
c
= { : lminf X
n
() < lmsup X
n
()}
=
_
rQ
{lminf X
n
< r < lmsupX
n
}
=
_
rQ
{[lminf X
n
< r] [lmsupX
n
r]
c
} B.
Observacion 3.2 Observamos que la clase de las funciones medibles no es cerrada si la operaciones
anteriores se realizan una cantidad no-numerable de veces. Es decir si A no es numerable y f

: R
es medible para cada A, no es necesariamente cierto que
f() = sup
A
f

()
sea medible. Por ejemplo, si A [0, 1] es un conjunto no medible y ponemos
f

() =
_
1 si =
0 si =
entonces para cada A, f

es M-medible pero
sup
A
f

() = 1
A
()
no es medible.
3.3. -

Algebras Generadas por Funciones


Denicion 3.3 Sea X : (, F) (R, B) una variable aleatoria. La -algebra generada por X, (X), se
dene como
(X) = X
1
(B).
Equivalentemente,
(X) = {{X A}, A B}.
En general, si X : (, F) (

, F

) denimos (X) = X
1
(F).
Si G F es una sub--algebra de F decimos que X es medible respecto a G si (X) G.
Si para cada t T tenemos X
t
: (, F) (

, F

) denimos
(X
t
, t T) = (
tT
(X
t
))
la menor -algebra que contiene a todas las (X
t
).
36 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Ejemplos 3.5
1. Si X() = 32 para todo entonces
(X) = {{X B}, B B} = (, } = {, }
2. Sea X = 1
A
para alg un A B. X toma valores en {0, 1} y
X
1
({0}) = A
c
, X
1
({1}) = A,
y por lo tanto (X) = {, , A, A
c
}.
Denicion 3.4 Una funcion es simple si es medible y toma un n umero nito de valores.
Si X toma valores a
1
, . . . a
k
, denimos
A
i
= X
1
({a
i
}) = {X = a
i
}.
Entonces {A
i
, i = 1, . . . , k} es una particion de y podemos representar a X como
X =
k

i=1
a
i
1
A
i
y
(X) = (A
1
, . . . , A
k
) = {
iI
A
i
: I {i, . . . .k}}.
Proposicion 3.9 Sea X una funcion medible y C una clase de subconjuntos de R tales que (C) = B.
Entonces
(X) = ({X B} : B C)
Demostracion.
({X B} : B C} = (X
1
(B), B C} = (X
1
(C))
= X
1
((C)) = X
1
(B) = (X).

El siguiente teorema es fundamental para la denicion de la integral de Lebesgue.


Teorema 3.1 (de Aproximacion) Dada una funcion medible y no negativa X : R
+
, existe una
sucesion creciente de funciones simples no negativas X
n
: R
+
tales que X
n
X.
Demostracion. Para todo entero positivo n denimos
Q
p,n
= { :
p 1
2
n
X() <
p
2
n
}, p = 1, . . . , 2
2n
Q
0,n
=
2
2n
p=1
Q
p,n
= { : X() 2
n
}
Entonces, como X es F-medible, Q
p,n
F y los conjuntos Q
p,n
, p = 0, 1, . . . , 2
2n
forman una particion
de . Denimos
X
n
() =
_
p1
2
n
para Q
p,n
, p = 1, 2, . . . , 2
2n
2
n
para Q
0,n
.
Esta funcion es simple y tenemos que
0 X
n
X.
3.4. INTEGRALES 37
Si Q
p,n
entonces o bien Q
2p1,n+1
o Q
2p,n+1
y en consecuencia
X
n
() = X
n+1
() o X
n
() +
1
2
n+1
= X
n+1
().
Ademas, si Q
0,n
entonces X
n
() = 2
n
X(), y en consecuencia Q
0,n+1
o Q
p,n+1
para
alg un p 2
2n+1
+ 1. En cualquier caso X
n+1
() X
n
(). Por lo tanto para todo entero n
X
n
() X
n+1
() para todo ,
y la sucesion de funciones simples (X
n
) es creciente.
Si X() es nita, entonces para 2
n
> X() tenemos que
0 X() X
n
() < 2
n
y en consecuencia X
n
() X() cuando n . Por otro lado, si X() = entonces para todo n,
X
n
() = 2
n
, y de nuevo tenemos que X
n
() X() cuando n .
3.4. Integrales
3.4.1. Funciones Simples No Negativas
Si X() =

n
i=1
c
i
1
A
i
() con c
i
0, i = 1, . . . , n, denimos
_
X d =
n

i=1
c
i
(A
i
).
Esta suma siempre esta denida, aunque su valor puede ser +, ya que todos los terminos son no-
negativos, y se conoce como la integral de X respecto a , el valor esperado o la esperanza de X. Tomamos
la convencion de que si x
i
= 0 y (A
i
) = entonces c
i
(A
i
) = 0. Como la representacion de una funcion
simple no es unica, debemos vericar que la denicion es independiente de la representacion que usemos.
Supongamos que
X() =
n

i=1
c
i
1
A
i
() =
m

j=1
d
j
1
B
j
(),
como ambas colecciones de conjuntos son particiones de tenemos que
(A
i
) =
m

j=1
(A
i
B
j
) y (B
j
) =
n

i=1
(A
i
B
j
). (3.1)
Ademas, si A
i
B
j
no es vaco, tiene al menos un elemento y X() = c
i
= d
j
. Por lo tanto
n

i=1
c
i
(A
i
) =
n

i=1
m

j=1
c
i
(A
i
B
j
) =
n

i=1
m

j=1
d
j
(A
i
B
j
) =
m

j=1
d
j
(B
j
).
Si tenemos dos funciones simples no-negativas
X() =
n

i=1
c
i
1
A
i
(), Y () =
m

j=1
d
j
1
B
j
(),
38 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
podemos usar las representaciones
X =
n

i=1
m

j=1
c
i
1
A
i
B
j
(), Y =
m

j=1
n

i=1
d
j
1
A
i
B
j
(),
en terminos de la particion A
i
B
j
. Ahora la funcion simple X +Y tiene la representacion
X +Y =
n

i=1
m

j=1
(c
i
+d
j
)1
A
i
B
j
y
_
(X +Y ) d =
n

i=1
m

j=1
(c
i
+d
j
)(A
i
B
j
)
=
n

i=1
m

j=1
c
i
(A
i
B
j
) +
n

i=1
m

j=1
d
j
(A
i
B
j
)
=
n

i=1
c
i
(A
i
) +
m

j=1
d
j
(B
j
)
=
_
X d +
_
Y d
de modo que la integral de funciones simples no-negativas es aditiva. Es inmediato ademas que si
0, 0 y X, Y son funciones simples no-negativas entonces
_
(X +Y ) d =
_
X d +
_
Y d
de modo que la integracion es lineal en la clase de las funciones simples no-negativas. Tambien es facil
ver que si X, Y son funciones simples y X Y entonces
_
X d
_
Y d.
3.4.2. Funciones Medibles No-Negativas
Dada una funcion medible no-negativa X : R
+
, sabemos que existe una sucesion creciente de
funciones simples no-negativas X
n
tales que X
n
X. La integral
_
X
n
d esta denida para todo n y es
creciente, por lo tanto tiene un lmite, que puede ser +. Denimos
_
X d = lm
n
_
X
n
d.
Tenemos que vericar que esta denicion no depende de la sucesion (X
n
) de funciones simples aprox-
imantes.
Proposicion 3.10 Sea (X
n
) una sucesion creciente de funciones simples no-negativas y X = lm
n
X
n

Y donde Y es simple y no-negativa. Entonces
lm
n
_
X
n
d
_
Y d. (3.2)
Demostracion. Sea Y =

k
i=1
c
i
1
E
i
. Si
_
Y d = , para alg un entero i, 1 i k, tal que c
i
>
0, (E
i
) = +. Entonces para cualquier jo con 0 < < c
i
, denimos los conjuntos
A
n
= { : X
n
() + > Y ()} (3.3)
3.4. INTEGRALES 39
La sucesion de conjuntos A
n
E
i
, n 1, es monotona creciente y converge a E
i
, y por lo tanto (A
n

E
i
) cuando n . Por otro lado
_
X
n
d
_
X
n
1
A
n
E
i
d (c
i
)(A
n
E
i
) (n ).
Por lo tanto (3.2) vale si
_
Y d = . Supongamos ahora que esta integral es convergente y sea
A = { : Y () > 0} =
i:c
i
>0
E
i
.
Como Y es simple, c = mn
c
i
>0
c
i
> 0 y (A) < . Supongamos que > 0 y denimos A
n
de nuevo por
(3.3). Entonces
_
X
n
d
_
X
n
1
A
n
A
d
_
(Y )1
A
n
A
d
=
_
Y 1
A
n
A
d (A
n
A)
_
Y 1
A
n
d (A).
Como (A
n
E
i
) (E
i
) para cada i, podemos evaluar las integrales como sumas nitas y encontrar
un entero n
0
= n
0
() tal que
_
X
n
d
_
Y d (A) para n n
0
,
y hemos establecido (3.2) tambien en el caso
_
Y d < .
Veamos ahora que la denicion de la integral no depende de la sucesion aproximante. Supongamos
que tenemos dos sucesiones crecientes de funciones simples (X
n
) y (Y
m
) que convergen a la funcion X.
Para cada m jo tenemos
X = lm
n
X
n
Y
m
,
y por la proposicion anterior,
lm
n
_
X
n
d
_
Y
m
d.
Haciendo ahora m ,
lm
n
_
X
n
d lm
m
_
Y
m
d.
Un argumento similar demuestra que la desigualdad en sentido contrario tambien vale y por lo tanto
lm
n
_
X
n
d = lm
m
_
Y
m
d.
Por lo tanto la integral esta bien denida para funciones medibles no-negativas. Como consecuencia
de la linealidad de la integral para funciones simples, tenemos que si 0, 0 entonces
_
(X +Y ) d =
_
X d +
_
Y d.
De acuerdo a nuestra denicion, si X 0 es medible,
_
X d puede ser nita o +. Decimos que
una funcion medible X 0 es integrable con respecto a la medida si
_
X d < .
Hay dos razones por las cuales una funcion de este tipo puede no ser integrable. O bien existe una
funcion simple Y X para la cual
_
Y d = , lo que implica la existencia de un c > 0 para el cual
{ : X() > c} = +, o bien es posible que
_
Y d < para todas las funciones simples tales que
Y X (lo que implica que { : X() > c} < , para todo c > 0) pero, para cualquier sucesion Y
n
de
funciones simples que converja a X,
_
Y
n
d + cuando n .
40 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
3.4.3. Funciones Medibles Integrables.
Sabemos que si X : R

es medible, tambien lo son X


+
, X

y tenemos X = X
+
X

. Si ambas
funciones X
+
y X

son integrables, decimos que X es integrable y denimos


_
X d =
_
X
+
d
_
X

d.
Usamos la notacion L
1
(, F, ) o L
1
() para la clase de funciones integrables y la notacion
_
X() (d) =
_
X() d() =
_
X d
para la integral.
Si (, F, P) es un espacio de probabilidad y X : R es una variable aleatoria integrable llamamos
esperanza a su integral y escribimos
E(X) =
_
X() dP().
3.4.4. Varianza y Covarianza
Sea X : R una variable aleatoria y supongamos que X
2
L
1
, que escribimos como X L
2
.
Denimos la varianza de X como
Var(X) = E(X E(X))
2
y tambien usamos la notacion
2
X
para ella. Por la linealidad de la esperanza tenemos
Var(X) = E(X
2
) (E(X))
2
.
La raz cuadrada de la varianza
X
=
_
Var(X) se conoce como la desviacion tpica de la variable
aleatoria.
Si X, Y L
2
denimos
Cov(X, Y ) = E[(X E(X))(Y E(Y ))],
y de nuevo por linealidad
Cov(X, Y ) = E(XY ) E(X) E(Y ).
Observamos que si X = Y , entonces Cov(X, Y ) = Var(X).
La covarianza es una medida de la dependencia lineal entre dos variables aleatorias, pero su valor
depende de las unidades en las cuales expresemos las variables. Para obtener una medida normalizada
de la dependencia lineal entre dos variables, dividimos la covarianza entre las desviaciones tpicas de las
variables. Este parametro se conoce como la correlacion entre X e Y :
(X, Y ) =
Cov(X, Y )

Y
Si Cov(X, Y ) = 0 decimos que X e Y no estan correlacionadas. Demostraremos mas adelante que
|(X, Y )| 1.
La covarianza es una funcion bilineal: Si X
1
, . . . , X
k
y Y
1
, . . . , Y
m
son variables aleatorias en L
2
,
entonces para cualesquiera constantes a
1
, . . . , a
k
y b
1
, . . . , b
m
Cov
_
k

i=1
a
i
X
i
,
m

j=1
b
j
Y
j
_
=
k

i=1
m

j=1
a
i
b
j
Cov(X
i
, Y
j
). (3.4)
3.5. PROPIEDADES DE LA INTEGRAL 41
Para ver esto, podemos suponer, sin perdida de generalidad, que E(X
i
) = E(Y
j
) = 0 para i = 1, . . . , k; j =
1, . . . , m. Entonces
Cov
_
k

i=1
a
i
X
i
,
m

j=1
b
j
Y
j
_
= E
_
k

i=1
a
i
X
i
m

j=1
b
j
Y
j
_
=
k

i=1
m

j=1
a
i
b
j
E(X
i
Y
j
)
=
k

i=1
m

j=1
a
i
b
j
Cov(X
i
, Y
j
)
Un caso especial de esta formula se usa para calcular la varianza de la suma de variables X
1
, . . . , X
n
en L
2
. Tenemos
Var
_
n

i=1
X
i
_
= Cov
_
n

i=1
X
i
,
n

j=1
X
j
_
=
n

i=1
n

j=1
Cov(X
i
, X
j
).
Dividimos el conjunto de ndices en los casos i = j e i = j y obtenemos
Var
_
n

i=1
X
i
_
=
n

i=1
Cov(X
i
, X
i
) + 2
n

1i<jn
Cov(X
i
, X
j
)
=
n

i=1
Var(X
i
) + 2
n

1i<jn
Cov(X
i
, X
j
).
En particular si Cov(X
i
, X
j
) = 0 para i = j, es decir, si las variables no estan correlacionadas, entonces
Var
_
n

i=1
(X
i
)
_
=
n

i=1
Var(X
i
).
3.4.5. Integral sobre un conjunto medible.
Si A F denimos
_
A
X d =
_
X1
A
d
siempre que esta integral este bien denida. Por lo tanto
_
A
X d esta denida si X1
A
es medible y
no-negativa o si X1
A
es medible e integrable. Decimos que X es integrable en A si X1
A
es integrable.
Es inmediato que
_

X d =
_
X d.
Observamos que si E F con (E) = 0, entonces cualquier funcion X : R

es integrable sobre E y
_
E
X d = 0.
3.5. Propiedades de la Integral
Teorema 3.2 Sea (, F, ) un espacio de medida, A, B son conjuntos en F y X : R

, Y : R

son dos funciones integrables con respecto a . Entonces X es integrable sobre A, X + Y y |X| son
integrables y
1. Si A B = ,
_
AB
X d =
_
A
X d +
_
B
X d.
42 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
2. X es nita c.s.
3.
_
(X +Y ) d =
_
X d +
_
Y d.
4.

_
X d


_
|X| d.
5. Para cualquier c R, cX es integrable y
_
cX d = c
_
X d.
6. X 0
_
X d 0; X Y
_
X d
_
Y d.
7. Si X 0 y A B,
_
A
X d
_
B
X d.
8. Si X 0 y
_
X d = 0, entonces X = 0 c.s.
9. X = Y c.s.
_
X d =
_
Y d.
10. Si Z : R

es F-medible y |Z| X, entonces h es integrable.


Demostracion.
Si X : R
+
es medible, no-negativa e integrable y 0 Y X con Y : R
+
medible, sigue de
la denicion de la integral de funciones medibles no-negativas que Y es integrable. Como para cualquier
A F, 1
A
es medible,
0 X
+
1
A
X
+
y 0 X

1
A
X

y en consecuencia si X es integrable sobre tambien lo es sobre cualquier conjunto medible A.


(1) Si A, B son disjuntos, 1
AB
= 1
A
+1
B
, y por lo tanto
X
+
1
AB
= X
+
1
A
+X
+
1
B
, X

1
AB
= X

1
A
+X

1
B
y como sabemos que la propiedad que queremos demostrar es valida para funciones medibles no-negativas
tenemos
_
AB
X d =
_
X
+
1
AB
d
_
X

1
AB
d
=
_
X
+
1
A
d
_
X

1
A
d +
_
X
+
1
B
d
_
X

1
B
d
=
_
A
X d +
_
B
X d
ya que todos los terminos son nitos.
(2) Si X no es nita c.s., entonces al menos uno de los conjuntos
A
1
= { : X() = +}, A
2
= { : X() = }
tiene medida positiva. Supongamos que (A
1
) > 0 entonces se tiene de la denicion que
_
X
+
d = +
lo que implica que X no es integrable.
(3) Ya hemos visto que esta propiedad vale para funciones no-negativas. Si X
1
, X
2
son no-negativas y
X = X
1
X
2
entonces X
1
+X

= X
2
+X
+
y usando (3) para funciones no-negativas obtenemos
_
X
1
d +
_
X

d =
_
X
2
d +
_
X
+
d
de modo que
_
X d =
_
X
1
d
_
X
2
d.
El resultado general se obtiene observando que para X, Y nitas,
X +Y = (X
+
+Y
+
) (X

+Y

)
3.5. PROPIEDADES DE LA INTEGRAL 43
y en consecuencia
_
(X +Y ) d =
_
(X
+
+Y
+
) d
_
(X

+Y

) d
=
_
X
+
d
_
X

d +
_
Y
+
d
_
Y

d
=
_
X d +
_
Y d
Finalmente usamos (3) con la funcion |X| = X
+
X

para deducir que |X| es integrable y


_
|X| d =
_
X
+
d +
_
X

d.
(4) Tenemos

_
X d

_
X
+
d
_
X


_
X
+
d +
_
X

d =
_
|X| d.
(5) Si c = 0, cX = 0 y
_
cX d = 0 = c
_
X d. Si c > 0 entonces
(cX)
+
= cX
+
, (cX)

= cX

,
y el resultado es valido porque ya lo demostramos para funciones medibles no-negativas. De manera
similar, si c < 0
(cX)
+
= cX

, (cX)

= cX
+
,
_
cX d =
_
(cX)
+
d
_
(cX)

d = (c)
_
X

d +c
_
X
+
d = c
_
X d.
(6) La primera armacion es cierta por la denicion. Si X Y , entonces X = Y +(XY ) y (XY ) 0.
Por (3) tenemos
_
X d =
_
Y d +
_
(X Y ) d
_
Y d.
(7) es consecuencia de (6) ya que X1
A
X1
B
.
(8) Si{ : X() > 0} tiene medida positiva, por la continuidad de la medida existe un entero n tal que,
si A = { : X() > 1/n}, se tiene que (A) > 0. Pero n
1
1
A
X1
A
X, de modo que
_
X d
1
n
_
1
A
d =
1
n
(A) > 0.
Por lo tanto, si X 0 y
_
X d = 0, necesariamente { : X() > 0} = 0.
(9) Si X = Y c.s. entonces X
+
= Y
+
, X

= Y

c.s. En la construccion de la sucesion aproximante en


el teorema 3.1, los conjuntos Q
p,s
para las funciones X
+
y Y
+
tendran todos la misma medida. Por lo
tanto hay funciones simples X
n
X
+
, Y
n
Y
+
tales que
_
X
n
d =
_
Y
n
d, n = 1, 2, . . .
y por lo tanto se tiene que
_
X
+
d =
_
Y
+
d. De manera similar
_
X

d =
_
Y

d.
(10) Si |Z| X entonces 0 Z
+
X, 0 Z

X. Usando (6) tenemos que tanto


_
Z
+
d como
_
Z

d son nitos y por lo tanto Z es integrable.


44 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Ejemplo 3.6
Sea = [0, 1] y la medida de Lebesgue. Sea X() = 1
Q[0,1]
. Sabemos que (Q) = 0 de modo que
(X = 0) = 1 = ([0, 1] Q).
Por lo tanto
_
X d =
_
0 d = 0.
Corolario 3.3 Si X : R

es acotada, medible y se anula fuera de un conjunto E F con (E) < ,


entonces X es integrable con respecto a .
Demostracion. Si |X| K, entonces la funcion simple K1
E
es integrable y la integrabilidad de X sigue
ahora de (9).
Observacion 3.3 Si F es completa respecto a , entonces podemos modicar (9) de la siguiente manera:
Si X : R

es integrable y Y : R

es tal que X = Y c.s., entonces Y es integrable y


_
X d =
_
Y d.
Hay un recproco de la armacion anterior: Si X y Y son integrables y
_
E
X d =
_
E
Y d para todo E F,
entonces X = Y c.s. Para ver esto supongamos que es falso, de modo que {x : X() = Y ()} > 0.
Entonces al menos uno de los conjuntos {x : X() > Y ()}, {x : X() < Y ()} tiene medida positiva.
Supongamos que es el primero, por la continuidad de la medida existe un entero n tal que
E
n
= { : X() Y () +
1
n
}, (E
n
) > 0.
Pero entonces
_
E
n
X d
_
E
n
Y d >
1
n
(E
n
) > 0
lo que es una contradiccion y por lo tanto demuestra el resultado.
3.5.1. Desigualdades de Markov y Chebychev
Proposicion 3.11 (Desigualdad de Markov) Sea X L
1
(, F, P) una variable aleatoria. Para cualquier
> 0,
P(|X| ) E(|X|)/.
Demostracion. Observamos que
1
{
|X|

1}

|X|

1
{
|X|

1}

|X|

.
Tomando esperanza se obtiene el resultado.
Corolario 3.4 (Desigualdad de Chebychev) Si X L
2
() es una variable aleatoria,
P(|X E(X)| ) Var(X)/
2
.
Demostracion. Usando la desigualdad de Markov
P(|X E(X)| ) = P(|X E(X)|
2

2
) E(X E(X))
2
/
2
= Var(X)/
2
.

3.6. LAS INTEGRALES DE LEBESGUE Y DE LEBESGUE-STIELTJES 45


3.6. Las Integrales de Lebesgue y de Lebesgue-Stieltjes
Hemos denido la integral sobre un espacio de medida abstracto (, F, ) aunque historicamente se
consider o primero el espacio (R, M, ) donde denota la medida de Lebesgue denida sobre los conjuntos
Lebesgue-medibles M.
Si E M y f es Lebesgue-medible es usual escribir
_
E
f(x) dx en lugar de
_
E
f d. En particular si
E es un intervalo con extremos a, b, escribimos
_
b
a
f(x) dx. Observamos que como la medida de Lebesgue
de un punto es cero, no importa si incluimos los extremos en el intervalo o no. En particular, a puede ser
y b puede ser + de modo que
_

f(x) dx quiere decir


_
R
f d =
_
f d.
Es importante observar que la integral sobre un intervalo innito se dene directamente, ya que un
intervalo de este tipo es medible, y no como lmite de integrales sobre intervalo nitos.
Usar la medida de Lebesgue-Stieltjes que se obtiene a partir de una funcion de Stieltjes F en lugar
de usar la medida de Lebesgue es equivalente a trabajar en el espacio de medida (R, M(F),
F
), donde

F
es la medida de Lebesgue-Stieltjes que denimos en el captulo anterior y M(F) es la -algebra de
los conjuntos medibles respecto a

F
. Usamos las notaciones
_
E
f(x) dF(x) o
_
E
f(x) d
F
(x).
En este caso la medida de un punto puede ser distinta de cero y por lo tanto al integrar sobre
un intervalo es necesario especicar si se incluyen los extremos o no. Por esto no usamos la notacion
_
b
a
f(x)dF(x) a menos que sepamos que F es continua.
Como las -algebras de conjuntos medibles son completas con respecto a las medidas de Lebesgue o
de Lebesgue-Stieltjes, vemos que si f : R R

es integrable y f = g c.s., entonces g : R R

tambien
es integrable.
Caso Particular
Llamamos
x
a la medida de Dirac en el punto x:

x
(A) =
_
1 si x A,
0 si x / A.
es una medida de probabilidad denida en P(R). Si x
n
, n 1 es una sucesion de n umeros reales y p
n
,
n 1 es una sucesion de n umeros reales positivos entonces
(A) =

n=1
p
n

x
n
(A)
dene una medida de Lebesgue-Stieltjes concentrada en el conjunto numerable {x
n
, n 1}. Si

p
n
< ,
la medida es nita y si

p
n
= 1 es una medida de probabilidad.
Si f : R R es una funcion cualquiera entonces
_
f d =

n=1
p
n
f(x
n
).
En el caso particular p
n
= 1 para todo n y f(x) = x, obtenemos la serie

x
n
, de modo que la teora
de series absolutamente convergentes de n umeros reales es un caso particular de la integral de Riemann-
Stieltjes.
3.7. Integrales y Lmites
Ahora podemos considerar los teoremas sobre la continuidad del operador de integracion.
46 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Teorema 3.3 (Teorema de Convergencia Monotona) Sea X
n
: R
+
, n 1 una sucesion
creciente de funciones medibles no-negativas con X
n
() X() para todo , entonces
lm
n
_
X
n
d =
_
X d,
es decir, si X es integrable, las integrales
_
X
n
d converge a
_
X d, mientras que si X no es integrable
o bien X
n
es integrable para todo n y
_
X
n
d + cuando n , o existe un entero N tal que X
N
no es integrable de modo que
_
X
n
d = + para n N.
Demostracion. Para cada n = 1, 2, . . . escogemos una sucesion creciente X
n,k
, k 1 de funciones
simples no-negativas que converge a X
n
y denimos Y
k
= max
nk
X
n,k
. Entonces (Y
k
) es una sucesion
no-decreciente de funciones simples no-negativas y Y = lm
k
Y
k
es una funcion medible no-negativa. Pero
X
n,k
Y
k
X
k
X para n k (3.5)
de modo que X
n
Y X, y si hacemos n vemos que X = Y . Usando la propiedad (6) del teorema
3.2 y (3.5) obtenemos
_
X
n,k
d
_
Y
k
d
_
X
k
d para n k.
Para n jo, hacemos k . Por la denicion de la integral
_
X
n
d
_
Y d lm
k
_
X
k
d.
Haciendo ahora n obtenemos
lm
n
_
X
n
d
_
Y d lm
k
_
X
k
d.
Como los dos extremos de la desigualdad son iguales, tenemos
lm
n
_
X
n
d =
_
Y d =
_
X d.

Corolario 3.5 Sea X


n
: R, n 1 una sucesion de funciones medibles tales que X
n
X y
_
X
1
d > . Entonces
_
X
n
d
_
X d.
Demostracion. Supongamos que X 0. Sea Y
n
= X
n
X = Y . Entonces para todo n,
0
_
Y d
_
Y
n
d < +.
Pero 0 Y
1
Y
n
Y
1
Y , y por el teorema anterior
_
(Y
1
Y
n
) d
_
(Y
1
Y ) d < +.
Como estas integrales son nitas, podemos restarlas de
_
Y
1
d y obtenemos
_
Y
n
d
_
Y d
_
X
n
d
_
X d.
3.7. INTEGRALES Y L

IMITES 47
En el caso general tenemos X
+
n
X
+
y X

n
X

con
_
X

d < +, y por lo anterior tenemos


_
X
+
n
d
_
X
+
d, + >
_
X

n
d
_
X

d 0.
En consecuencia
_
X
n
d
_
X d

Corolario 3.6 Si X
n
0, n 1 son funciones medibles no-negativas, entonces
_
_

n=1
X
n
_
d =

n=1
_
X
n
d
Demostracion. Tenemos
_
_

n=1
X
n
_
d =
_
_
lm
k
k

n=1
X
n
_
d = lm
k
_
_
k

n=1
X
n
_
d
= lm
k
k

n=1
_
X
n
d =

n=1
_
X
i
d

Corolario 3.7 Si X es integrable entonces, para A F,


_
A
X d 0 cuando (A) 0.
Demostracion Denimos
X
n
=
_
X si |X| n,
n si |X| > n.
Entonces |X
n
| es creciente y converge a |X
n
| cuando n . Por el teorema 3.2 |X| es integrable y
_
|X
n
| d
_
|X| d
cuando n . Dado > 0 escogemos N tal que
_
|X| d <
_
|X
n
| d +
1
2

para n N. Entonces si A F es tal que (A) < /2N, tenemos, por el teorema 3.2,

_
A
X d


_
A
|X| d =
_
A
|X
N
| d +
_
A
(|X| |X
N
|) d
<
1
2
+
_
(|X| |X
N
|) d < .

48 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Teorema 3.4 (Fatou) Si (X
n
) es una sucesion de funciones medibles que esta acotada inferiormente
por una funcion integrable, entonces
_
lminf
n
X
n
d lminf
n
_
X
n
d.
Demostracion. Como (X
n
) esta acotada por debajo por una funcion integrable Y podemos suponer,
sin perdida de generalidad, que X
n
0 para todo n. Para Z
n
= X
n
Y 0 c.s. y
_
Z
n
d =
_
X
n
d
_
Y d, lminf Z
n
= lminf X
n
Y c.s.
Ponemos Y
n
=nf
kn
X
k
entonces Y
n
es una sucesion creciente de funciones medibles y
lm
n
Y
n
= lminf
n
X
n
.
Como X
n
Y
n
para todo n
lminf
n
_
X
n
d lm
n
_
Y
n
d =
_
lm
n
Y
n
d =
_
lminf
n
X
n
d,
por el teorema 3.3.
Corolario 3.8 Si (X
n
) es una sucesion de funciones medibles que esta acotada superiormente por una
funcion integrable, entonces
_
lmsup
n
X
n
d lmsup
n
_
X
n
d.
Demostracion. Esto se puede demostrar por un metodo similar al del teorema anterior, o puede deducirse
del teorema anterior poniendo Y
n
= X
n
.
Como consecuencia de los dos resultados anteriores, si (X
n
) es una sucesion de funciones medibles
acotada superior e inferiormente por funciones integrables tenemos
_
lminf
n
X
n
d lminf
n
_
X
n
d lmsup
n
_
X
n
d
_
lmsup
n
X
n
d.
Ejemplo 3.7
Consideremos el espacio de probabilidad ([0, 1], B, ), donde es la medida de Lebesgue y denimos
X
n
= n
2
1
(0,1/n)
.
Para todo [0, 1] se tiene que 1
(0,1/n)
() 0, de modo que X
n
0. Sin embargo
E(X
n
) = n
2
1
n
= n ,
y por lo tanto
E(lminf
n
X
n
) = 0 < lminf
n
E(X
n
) =
y
E(lmsup
n
X
n
) = 0 < lmsup
n
E(X
n
) = .
3.7. INTEGRALES Y L

IMITES 49
Teorema 3.5 (de Convergencia Dominada, Lebesgue) (i) Si Y : R
+
es integrable, (X
n
) es
una sucesion de funciones medibles de en R

tal que |X
n
| Y para n 1, y X
n
X cuando n ,
entonces X es integrable y
_
X
n
d
_
X d cuando n .
(ii) Supongamos que Y : R
+
es integrable, a < b +, y para cada t (a, b), X
t
es
medible de en R

. Entonces si |X
t
| Y para todo t (a, b) y X
t
X cuando t a
+
o t b

,
entonces X es integrable y
_
X
t
d
_
X d.
Demostracion. (i) Primero probamos un caso especial con X
n
0 y X
n
0 cuando n . En este
caso podemos usar el teorema 3.4 y el corolario para obtener
lmsup
_
X
n
d
_
lmsupX
n
d =
_
0 d = 0
=
_
lminf X
n
d lminf
_
X
n
d lmsup
_
X
n
d.
Por lo tanto el lmite existe y vale 0.
En el caso general ponemos Z
n
= |X
n
X|, entonces 0 Z
n
2Y , 2Y es integrable y Z
n
es medible
con Z
n
0 cuando n . Pero entonces

_
X
n
d
_
X d


_
|X
n
X| d 0 cuando n ,
y X es integrable por el teorema 3.2.
(ii) Supongamos, por ejemplo, que X
t
X cuando t a
+
, entonces podemos aplicar la parte anterior
del teorema a X
n
= X
t
n
, donde (t
n
) es una sucesion en (a, b) que converge a a. Como X = lmX
n
, tenemos
_
X
n
d
_
X d.
Pero el lado derecho es independiente de la sucesion (t
n
), de modo que
_
X
t
d converge al lmite
_
X d
cuando t a, t (a, b).
Como consecuencia de los teoremas sobre lmites tenemos las siguiente propiedades
Proposicion 3.12 1. Si X 0 y {A
n
, n 1} es una sucesion de eventos disjuntos
_

n
A
n
X d =

n=1
_
A
n
X d. (3.6)
2. Si X L
1
y {A
n
, n 1} es una sucesion monotona de eventos con A
n
A entonces
_
A
n
X d
_
A
X d (3.7)
Demostracion. Para ver (1) tenemos
_

n
A
n
X d =
_
X1

n
A
n
d =
_

n
X1
A
n
d
=

n
_
X1
A
n
d =

n
_
A
n
X d.
(2) es consecuencia directa del Teorema de Convergencia Monotona.
50 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Teorema 3.6 a) Si X, Y L
2
(, F, P) entonces X Y L
1
(, F, P) y
| E(XY )|
_
E(X
2
) E(Y
2
)
_
1/2
(3.8)
(b) L
2
L
1
y si X L
2
entonces (E(X))
2
E(X
2
).
(c) L
2
es un espacio lineal: X, Y L
2
, , R entonces X +Y L
2
.
La desigualdad (3.8) se conoce como la desigualdad de Cauchy-Schwarz.
Demostracion. (a) Tenemos |XY | X
2
+ Y
2
de modo que X, Y L
2
X Y L
1
. Para x R
tenemos
0 E[(X +Y )
2
] =
2
E[X
2
] + 2E[XY ] + E[Y
2
] (3.9)
el discriminante de la ecuacion cuadratica en es
_
4[(E(XY ))
2
E(X
2
) E(Y
2
)]
_
1/2
y como la ecuacion siempre es no-negativa,
(E(XY ))
2
E(X
2
) E(Y
2
) 0
(b) Sea X L
2
, como X = X 1 y 1 L
2
con E(1
2
) = 1 se obtiene el resultado por (a).
(c) Sean X, Y L
2
. Para , constantes
(X +Y )
2
2
2
X
2
+ 2
2
Y
2
L
1
y por lo tanto X +Y L
2
y L
2
es un espacio vectorial.
3.8. Cambio de Variables
Teorema 3.7 (Cambio de Variable) Sea X : (, F) (

, F

) una funcion medible y sea una


medida en F. Sea
X
= X
1
la medida inducida por X en (

, F

), f : (

, F

) (R

, B

) y A F

.
Entonces
_
X
1
(A)
f(X()) d() =
_
A
f(

) d
X
(

). (3.10)
Esto quiere decir que si alguna de las integrales existe, tambien existe la otra y ambas son iguales.
Demostracion. Si f es la funcion indicadora de un conjunto B, la ecuacion (3.10) dice que
(X
1
(A) X
1
(B)) =
X
(A B)
que es cierta por la denicion de
X
. Si f es una funcion simple no-negativa: f =

n
1
c
i
1
B
i
, entonces
_
X
1
(A)
f(X()) d() =
n

i=1
c
i
_
X
1
(A)
1
B
i
(X()) d()
=
n

i=1
c
i
_
A
1
B
i
(

) d
X
(

)
=
_
A
f(

) d
X
(

)
Si f es una funcion medible no-negativa, sea f
1
, f
2
, . . . una sucesion creciente de funciones simples no-
negativas que converge a f. Entonces, por lo que hemos probado,
_
X
1
(A)
f
n
(X()) d() =
_
A
f
n
(

) d
X
(

)
3.8. CAMBIO DE VARIABLES 51
y usando el Teorema de Convergencia Monotona obtenemos el resultado.
Finalmente, si f = f
+
f

es cualquier funcion medible, hemos probado que el resultado es valido


para f
+
y f

. Si, por ejemplo,


_
X
1
(A)
f
+
(X()) d() < entonces
_
A
f(

) d
X
(

) < , y en
consecuencia si una de las integrales existe, tambien existe la otra y ambas valen lo mismo.
Sea X una v.a. sobre el espacio de probabilidad (, F, P). Recordemos que la distribucion de X es
la medida P
X
= P X
1
en (R, B) denida por P
X
(A) = P X
1
(A) = P(X A), para A B. La
funcion de distribucion de X es F
X
(x) = P
X
((, x]) = P(X x). El teorema de cambio de variables
nos permite calcular la integral abstracta
E(X) =
_

X dP
como
E(X) =
_
R
xdP
X
(x).
que es una integral en R.
Corolario 3.9 (i) Si X es una v.a. integrable entonces
E(X) =
_
R
xdP
X
(x)
(ii) Sea X : (, F) (

, F

) una variable aleatoria con distribucion P


X
y sea g : (

, F

) (R
+
, (R
+
))
una funcion medible no-negativa. La esperanza de g(X) es
E(g(X)) =
_

g(X()) dP() =
_

g(

) dP
X
(

).
Demostracion. Para ver (i) basta observar que (

, F

) = (R, B), f(x) = x, y A =

. (ii) es inmediato
a partir del teorema de cambio de variable.
3.8.1. Densidades
Sea X : (, F) (R
k
, B
k
) un vector aleatorio con distribucion P
X
. Decimos que X, P
X
o F
X
es
absolutamente continua si existe una funcion f : (R
k
, B
k
) (R
+
, B(R
+
)) tal que
P
X
(A) =
_
A
f(x) dx
donde dx es la medida de Lebesgue.
Proposicion 3.13 Sea g : (R
k
, B
k
) (R
+
, B(R
+
)) una funcion medible no-negativa. Sea X un vector
aleatorio con f.d. F. Si F es absolutamente continua con densidad f, la esperanza de g(X) es
E(g(X)) =
_
R
k
g(x)f(x) dx.
Demostracion. Ejercicio.
52 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
3.9. Comparacion con la Integral de Riemann
Vimos en el ejemplo 3.6 que si f es el indicador del conjunto de racionales en [0, 1] entonces f no
es integrable seg un Riemann pero si lo es seg un Lebesgue y su integral vale 0. En este caso existe otra
funcion g que satisface f = g c.s., que es integrable seg un Riemann y cuya integral vale lo mismo que la
de f. Esta funcion es g(x) = 0 para todo x [0, 1]. Veremos a continuacion un ejemplo de una funcion
que es integrable seg un Lebesgue pero no seg un Riemann, a pesar de ser acotada y estar denida en un
intervalo acotado, y para la cual no existe ninguna funcion Riemann integrable g con f = g c.s.
Ejemplo 3.8
Comenzamos por construir un conjunto boreliano A (0, 1] tal que 0 < (A) < 1 y tal que para
cualquier subintervalo J de (0, 1] se tiene que (A J) > 0. Para ello sea {r
1
, r
2
, . . . } una enumeracion
de los racionales en (0, 1). Sea > 0 dado y para cada n escogemos un intervalo I
n
= (a
n
, b
n
) tal que
r
n
I
n
(0, 1) y (I
n
) = b
n
a
n
< 2
n
. Ponemos A =
n1
I
n
, entonces 0 < (A) < .
Como A contiene a los racionales de (0, 1), es denso en este conjunto. Por lo tanto A es un conjunto
abierto y denso con medida menor que . Si J es un subintervalo abierto de (0, 1) entonces J intersecta
a alguno de los I
n
y en consecuencia (A I) > 0.
Si B = (0, 1) A entonces 1 < (B) < 1. El conjunto B no contiene ning un intervalo, de hecho
es un conjunto nunca denso (Todo intervalo contiene un subintervalo que no contiene puntos de B). Sin
embargo, su medida es casi 1.
Tomamos ahora f = 1
A
y supongamos que g = f c.s. y que J
n
es una descomposicion de (0, 1] en
subintervalos. Para ver que g no es integrable seg un Riemann basta demostrar que J
n
contiene puntos
x
n
, y
n
tales que

n
g(x
n
)(J
n
) (A) < 1 =

n
g(y
n
)(J
n
). (3.11)
Si (J
n
A) = 0 escogemos x
n
en el conjunto J
n
{f = g}, que es un conjunto de medida (J
n
) > 0.
Entonces g(x
n
) = f(x
n
) 1. En el caso contrario, escogemos x
n
en el conjunto (J
n
A) {f = g}, un
conjunto de medida (J
n
A) > 0. Entonces g(x
n
) = f(x
n
) = 0. Si

denota la suma sobre los ndices


n para los cuales (J
n
A) = 0 entonces la suma de la izquierda en (3.11) es

g(x
n
)(J
n
)

(J
n
) =

(J
n
A) (A).
Para hallar los y
n
observamos que por la construccion de A,
(J
n
A {f = g}) = (J
n
A) > 0.
Por lo tanto para alg un y
n
J
n
A se tiene g(y
n
) = f(y
n
) = 1 y de aqui se obtiene la segunda desigualdad
de (3.11).
Usaremos la notacion
_
b
a
f(x) dx para la integral de Riemann de f en [a, b] y
_
[a,b]
f(x) d(x) para la
integral de Lebesgue.
Para la demostracion del proximo teorema vamos a usar la siguiente denicion para la integral de
Riemann, que no es la usual, pero es sencillo demostrar que ambas son equivalentes. Para cualquier entero
n dividimos I
0
= (a, b] en 2
n
intervalos semiabiertos
I
n,i
= (a
n,i1
, a
n,i
], i = 1, 2, . . . , 2
n
.
Denimos
m
n,i
=nf{f(x) : x I
n,i
}; M
n,i
= sup{f(x) : x I
n,i
}
g
n
(x) =
_
m
n,i
si x I
n,i
,
0 si x / I
0
;
h
n
(x) =
_
M
n,i
si x I
n,i
,
0 si x / I
0
.
3.9. COMPARACI

ON CON LA INTEGRAL DE RIEMANN 53


Entonces para todo entero n y x I
0
,
g
n
(x) f(x) h
n
(x).
(g
n
) es una sucesion creciente de funciones simples mientras que (h
n
) es decreciente. Si denimos
g = lm
n
g
n
, h = lm
n
h
n
,
entonces g f h. Ademas tenemos
_
(a,b]
g(x) d(x) = lm
n
_
(a,b]
g
n
(x) d(x) = lm
n
b a
2
n
2
n

i=1
m
n,i
:= lm
n
s
n
,
_
(a,b]
h(x) d(x) = lm
n
_
(a,b]
h
n
(x) d(x) = lm
n
b a
2
n
2
n

i=1
M
n,i
:= lm
n
S
n
.
Decimos que f es integrable seg un Riemann en [a, b] si y solo si
lm
n
s
n
= lm
n
S
n
y en este caso el lmite com un es
_
b
a
f(x) dx.
Teorema 3.8 Una funcion acotada f : [a, b] R es integrable seg un Riemann si y solo si el conjunto de
puntos E [a, b] en los cuales X es discontinua tiene medida 0: (E) = 0. Cualquier funcion f : [a, b] R
que sea integrable seg un Riemann, es integrable seg un Lebesgue y su integral tiene el mismo valor.
Demostracion.
Si f es continua en x (a, b) entonces g(x) = h(x). Recprocamente si g(x) = h(x) y x no esta en D,
donde D es el conjunto numerable de extremos de los intervalos I
n,i
, entonces f es continua en x.
Si
_
b
a
f(x) dx existe,
_
[a,b]
g(x) d(x) =
_
b
a
f(x) dx =
_
[a,b]
h(x) d(x).
Por el teorema 3.2 (8) y teniendo en cuenta que g f h, tenemos que g = h c.s. Como el conjunto
E de puntos donde f es discontinua esta contenido en D {x : g(x) = h(x)}, tenemos que (E) = 0.
Ademas, como la medida de Lebesgue es completa, f es M-medible y por las propiedades de la integral
de Lebesgue,
_
[a,b]
f(x) d(x) =
_
[a,b]
g(x) d(x) =
_
b
a
f(x) dx.
Recprocamente si el conjunto E satisface (E) = 0, esto implica que g(x) = h(x) c.s., y por las
propiedades de la integral obtenemos
_
[a,b]
g(x) d(x) =
_
[a,b]
h(x) d(x)
de modo que f es integrable.
El teorema anterior nos muestra que una funcion integrable seg un Riemann tiene que ser continua
c.s., en cambio tenemos ejemplos de funciones que son discontinuas en todo punto y sin embargo son
integrables seg un Lebesgue. Sin embargo, en cierto sentido estas ultimas pueden ser aproximadas por
funciones muy regulares, es decir por funciones que pueden ser diferenciadas innitas veces.
54 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Teorema 3.9 Dada cualquier funcion f : R R

integrable y cualquier > 0, existe un intervalo nito


(a, b) y una funcion acotada g : R R tal que g(x) se anula fuera de (a, b), es innitamente diferenciable
para todo real x y
_
|f(x) g(x)| d(x) < .
Demostracion. Hacemos la demostracion en cuatro etapas.
(i) Primero hallamos un intervalo nito [a, b] y una funcion medible y acotada f
1
que se anule fuera
de [a, b] tal que
_
|f(x) f
1
(x)| d(x) <
1
4
.
Para hacer esto consideramos la sucesion de funciones
g
n
(x) =
_

_
f(x) si |x| n y |f(x)| n,
n si |x| n y f(x) > n,
n si |x| n y f(x) < n,
0 si |x| > n.
Entonces g
n
(x) f(x) para todo x y |g
n
| |f|. Por el Teorema de Convergencia Dominada tenemos
que
_
|f(x) g
n
(x)| d(x) 0 cuando n
de modo que podemos jar N sucientemente grande y poner f
1
(x) = g
N
(x).
(ii) El siguiente paso es aproximar f
1
por una funcion simple f
2
que se anule fuera de [a, b] y satisfaga
_
|f
2
(x) f
1
(x)| d(x) <
1
4
.
Esto es posible porque hemos denido la integral como lmite de funciones simples.
(iii) Una funcion simple es la suma nita de multiplos de funciones indicadoras. Si cada funcion
indicadora puede aproximarse por la funcion indicadora de un n umero nito de intervalos disjuntos,
tenemos que f
2
puede aproximarse por f
3
, una funcion escalera de la forma
f
3
(x) =
n

i=1
c
i
1
J
i
(x),
donde cada J
i
es un intervalo nito y
_
|f
2
(x) f
3
(x)| d(x) <
1
4
.
Para ver que esto es posible comenzamos con un conjunto acotado Lebesgue-medible E y > 0. Hallamos
un conjunto abierto G con E G y tal que (GE) < /2. A partir de la union numerable de intervalos
abiertos disjuntos que forman a G escogemos una cantidad nita que forman el conjunto G
0
tal que
(GG
0
) < /2. Entonces tenemos que (EG
0
) < de modo que
_
R
|1
E
(x) 1
G
0
(x)| d(x) < .
(iv) Finalmente para obtener la funcion innitamente diferenciable g tal que
_
|g(x) f
3
(x)| d(x) <
1
4
.
3.10. FUNCIONES DE DISTRIBUCI

ON 55
es suciente encontrar una funcion de este tipo para una de las componentes 1
J
i
(x) de f
3
. Supongamos
que J = (a, b) y 0 < 2 < b a. Ponemos

a,
(x) =
_
exp{1/[(x a)
2

2
]} para |x a| < ,
0 para |x a| .
Si c
1

=
_

a,
(x) dx, sea h(x) = c

_
x

[
a,
(t)
b,
(t)] dt. Es facil vericar que h es innitamente
diferenciable y
_
|1
J
(x) h(x)| d(x) < 4,
ya que 0 h(x) 1 para todo x y {x : 1
J
(x) = h(x)} esta contenido en los dos intervalos (a , a +)
y (b , b +).
Hemos enunciado el resultado de aproximacion para funciones reales, pero un teorema similar es cierto
para funciones en R
k
, en cuyo caso la funcion aproximante tiene derivadas parciales de todos los ordenes.
3.10. Funciones de Distribucion
Sea F una funcion de distribucion. Como F es monotona sabemos que tiene a lo sumo una cantidad
numerable de discontinuidades. Sea {a
j
} la coleccion de los puntos donde ocurren los saltos de la funcion
F y sea {b
j
} el tama no de los saltos respectivos, es decir
F(a
j
) F(a

j
) = b
j
.
Consideremos la funcion
F
d
(x) =

j
b
j

a
j
(x)
que representa la suma de todos los saltos de F en la semirecta (, x]. Esta funcion es creciente,
continua por la derecha con
F
d
() = 0, F
d
(+) 1.
Por lo tanto F
d
es una funcion creciente y acotada.
Teorema 3.10 Sea F
c
(x) = F(x) F
d
(x). Entonces F
c
es positiva, creciente y continua.
Demostracion. Sea x < x

, entonces
F
d
(x

) F
d
(x) =

x<a
j
x

b
j
=

x<a
j
x

[F(a
j
) F(a

j
)]
F(x

) F(x)
Por lo tanto F
d
y F
c
son ambas crecientes, y si ponemos x = vemos que F
d
F, de modo que F
c
es
positiva. Por otro lado F
d
es continua por la derecha porque cada funcion
a
j
lo es y la serie que dene
F
d
converge uniformemente en x. Por la misma razon
F
d
(x) F
d
(x

) =
_
b
j
si x = a
j
,
0 en otro caso.
Pero esta relacion tambien es cierta si reemplazamos F
d
por F, por la denicion de a
j
y b
j
, de modo que
para todo x:
F
c
(x) F
c
(x

) = F(x) F(x

) F
d
(x) F
d
(x

) = 0.
Como ya sabemos que F
c
es continua por la derecha, esto demuestra que es continua.
56 CAP

ITULO 3. FUNCIONES MEDIBLES E INTEGRACI

ON
Teorema 3.11 Sea F una f.d. Supongamos que existe una funcion continua G
c
y otra funcion G
d
de la
forma
G
d
(x) =

j
b

j
(x)
donde {a

j
} es una sucesion de n umeros reales y

j
|b

j
| < , tal que
F = G
c
+G
d
,
entonces
G
c
= F
c
, G
d
= F
d
,
donde F
c
y F
d
se denen como antes.
Demostracion. Si F
d
= G
d
entonces o bien los conjuntos {a
j
} y {a

j
} no son identicas o podemos
cambiar las etiquetas en las sucesiones de modo que a

j
= a
j
para todo j pero b

j
= b
j
para alg un j. En
cualquier caso tenemos que al menos para un j y a = a
j
o a

j
,
[F
d
( a) F
d
( a

)] [G
d
( a) G
d
( a

)] = 0.
Como F
c
G
c
= G
d
F
d
, esto implica que
[F
c
( a) G
c
( a)] [F
c
( a

) G
c
( a

)] = 0,
lo cual contradice el hecho de que F
c
G
c
es una funcion continua. En consecuencia F
d
= G
d
y F
c
= G
c
.

Denicion 3.5 Una f.d. F que se puede representar como


F =

j
b
j

a
j
se llama una f.d. discreta. Una f.d. que es continua en todo punto se dice continua.
Supongamos que F
c
= 0, F
d
= 0 en la descomposicion de la f.d. F, entonces podemos poner = F
d
()
de modo que 0 < < 1,
F
1
=
1

F
d
, F
2
=
1
1
F
c
,
y escribimos
F = F
1
+ (1 )F
2
. (3.12)
Vemos que podemos descomponer a F como una combinacion convexa de una f.d. discreta y una f.d.
continua. Si F
c
0, entonces F es discreta y ponemos = 1, F
1
F, F
2
0. Si F
d
0, entonces F es
continua y ponemos = 0, F
1
0, F
2
F, y en cualquier caso la ecuacion 3.12 vale. Resumimos estos
resultados en el siguiente teorema.
Teorema 3.12 Toda f.d. puede escribirse como la combinacion convexa de una f.d. continua y una f.d.
discreta. Esta descomposicion es unica.
3.10. FUNCIONES DE DISTRIBUCI

ON 57
3.10.1. Funciones Absolutamente Continuas y Singulares
Denicion 3.6 Una funcion F es absolutamente continua si existe una funcion integrable f tal que para
todo a < b
F(b) F(a) =
_
b
a
f(t) dt.
Es posible demostrar que en este caso F tiene derivada que es igual a f c.s. En particular, si F es una
f.d., entonces
f 0 c.s. y
_

f(t) dt = 1.
Recprocamente, si f satisface las condiciones anteriores, la funcion F denida por
F(x) =
_
x

f(t) dt
es una f.d. que es absolutamente continua.
Denicion 3.7 Una funcion F es singular si no es identicamente cero y F

existe y es igual a cero c.s.


En el siguiente teorema presentamos algunos resultados sobre funciones reales que no demostraremos.
Las demostraciones se pueden hallar en el libro de Billingsley.
Teorema 3.13 Sea F una funcion creciente y acotada con F() = 0 y sea F

su derivada (cuando
exista). Las siguientes proposiciones son validas.
a) Si S denota el conjunto de x R para los cuales F

(x) existe y 0 F

(x) < , entonces (S


c
) = 0.
b) F

es integrable y para todo a < b


_
b
a
F

(t) dt F(b) F(a).


c) Si denimos
F
ac
(x) =
_
x

(t) dt, F
s
(x) = F(x) F
ac
(x),
entonces F

ac
= F

c.s., de modo que F

s
= F

ac
= 0 c.s. y en consecuencia F
s
es singular si no
es identicamente cero.
Denicion 3.8 Cualquier funcion positiva f que sea igual a F

c.s. es una densidad. F


ac
es la parte
absolutamente continua y F
s
la parte singular de F.
Es claro que F
ac
es creciente y F
ac
F. Por el teorema anterior tenemos que si a < b,
F
s
(b) F
s
(a) = F(b) F(a)
_
b
a
f(t) dt 0.
En consecuencia F
s
tambien es creciente y F
s
F. Por lo tanto tenemos el siguiente teorema.
Teorema 3.14 Toda f.d. F se puede escribir como combinacion convexa de tres f.d., una discreta, otra
continua singular y la tercera absolutamente continua. Esta descomposicion es unica

También podría gustarte