Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1: El algoritmo EM
Sesin 4
Doctorado en Estadstica
Contenidos
Introduccion
Un ejemplo inspirador
El algortitmo EM
Introduccion
I II III IV
El algoritmo EM
Introduccin
El algoritmo EM (Expectation-Maximization) es una tecnica de
optimizacion originalmente introducida por Dempster, Laird and
Rubin (1977), en su publicacin Maximum Likelihood from Incomplete Data via the EM Algorithm. Se utiliza en estadstica
para encontrar estimadores de verosimilitud maxima (VM) de parmetros en modelos probabilsticos que dependen de variables no
observables (datos perdidos).
El algoritmo EM alterna pasos de esperanza (paso E), donde se calcula la esperanza de la verosimilitud mediante la
inclusin de variables latentes como si fueran observables,
y un paso de maximizacin (paso M), donde se calculan estimadores de VM de los parmetros mediante la maximizacin
de la verosimilitud esperada del paso E.
Los parmetros que se encuentran en el paso M se usan para
comenzar el paso E siguiente, y as el proceso se repite.
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 4/30
Un ejemplo inspirador
I II III IV
El algoritmo EM
1 1
+
2 4
x1
1 1
4 4
x2
1 1
4 4
x3
donde n = x1 + x2 + x3 + x4 y 0 1.
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 6/30
x4
.
I II III IV
El algoritmo EM
Estimacin analtica
La funcin de log-verosimilitud es
l() = log(L(|x)) = log(g(x|)),
l() x1 log(2 + ) + (x2 + x3 ) log(1 ) + x4 log().
Al derivar l() con respecto a se tiene
x1
x2 + x3 x4
l() =
+ .
2+
1
Resolviendo el sitema
l() = 0, lo cual equivale a la ecuacin
2
cuadrtica l () = n + (2x2 + 2x3 x1 + x4 ) 2x4 = 0 y
despejando se obtiene el EVM de .
p
(2x2 + 2x3 x1 + x4 ) + (2x2 + 2x3 x1 + x4 )2 + 8nx4
b
M V =
.
2n
IEUV
Estadstica computacional
15-10-2014 7/30
I II III IV
El algoritmo EM
IEUV
Estadstica computacional
15-10-2014 8/30
I II III IV
El algoritmo EM
f ((j) )
a[(j) ]2 + b(j) + c
=
.
(j)
f 0 ((j) )
2a(j) + b
197[(j) ]2 15(j) 68
.
394(j) 15
IEUV
Estadstica computacional
15-10-2014 9/30
I II III IV
El algoritmo EM
Iteracin j
(j)
j = |(j) (j1) |
l (j )
0
1
2
3
4
5
0,500000000
0,644230769
0,627071500
0,626821551
0,626821498
0,626821498
0,144230769
0,017159269
0,000249949
0,000000053
0,000000000
-26,2500000000000
4,0980954142012
0,0580047808911
0,0000123075082
0,0000000000006
0,0000000000000
Por ejemplo,
2 150,5068
197[(0) ]2 15(0) 68
= 0, 50 197[0,50]
= 0, 644230769
394(0) 15
3940,5015
197[0,644230769]2 150,64423076968
= 0, 627071500
0, 644230769
3940,64423076915
(1) = (0)
(2) =
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 10/30
El algortitmo EM
I II III IV
El algoritmo EM
IEUV
Estadstica computacional
15-10-2014 12/30
I II III IV
El algoritmo EM
f (x, z|)
.
g(x|)
IEUV
Estadstica computacional
15-10-2014 13/30
I II III IV
El algoritmo EM
es decir,
log g(x|) = log L(|x) = log Lc (|x, Z) log k(Z|, x)
Para un valor 0 , calculando esperanza con respecto a k(Z|, x)
y utilizando la desigualdad de Jensen, se tiene
log L(|x) = E0 [log Lc (|x, Z)] E0 [log k(Z|, x)] .
| {z } |
{z
} |
{z
}
Datos obs.
Datos completos
Datos perdidos
Al maximizar log L(|x) se debe ignorar el termino asociado solo
a los datos perdidos.
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 14/30
I II III IV
El algoritmo EM
Iteraciones
El valor esperado de la log-verosimilitud se denota por
Q(|0 , x) = E0 [log Lc (|x, Z)].
El algoritmo EM comienza maximizando en cada iteracin
Q(|0 , x).
Si b(1) = arg max Q(|0 , x), entonces b(0) b(1) .
Se obtienen secuencias de estimadores {b(j) }, donde
b(j) = arg m
ax Q(|b(j1) , x).
Este esquema iterativo, en cada paso contiene un calculo de
esperanza y maximizacin.
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 15/30
I II III IV
El algoritmo EM
El algoritmo
Se comienza con una valor inicial b(0) fijado por el investigador.
Repita.
1 Calcule (paso E)
Q(|b(m) , x) = Eb
(m)
y establecer m = m + 1.
Los parmetros que se encuentran en el paso M se usan para
comenzar el paso E siguiente, y as el proceso se repite. Es decir,
se fija el punto b(m+1) = b(m) .
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 16/30
I II III IV
El algoritmo EM
1 1
+
2 4
x1
1
(1 )
4
.
4
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 18/30
I II III IV
El algoritmo EM
z1 z2
x2 +x3 x4
1
(1 )
2
4
4
4
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 19/30
I II III IV
El algoritmo EM
.
k(z|, x) =
=
1
g(x|)
y2
+2
+2
El nucleo de la distribucin condicional de los datos perdidos z,
dado los datos observados x es
k(z|, x)
p = +2
y por lo tanto
E(Z2 ) =
mrodriguezgallardo@gmail.com
IEUV
x1
.
+2
Estadstica computacional
15-10-2014 20/30
I II III IV
El algoritmo EM
Ejemplo: La etapa E
Primero la log-verosimilitud completa es
log Lc (|x, Z) = log f (x, Z|) = (Z2 +x4 ) log()+(x2 +x3 ) log(1).
La esperanza sera
Eb
(m)
(m)
= Eb
(m)
Por lo tanto,
Q(|b(m) , x) =
(m) x1
log() + x4 log() + (x2 + x3 ) log(1 ),
(m) + 2
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 21/30
I II III IV
El algoritmo EM
Ejemplo: la etapa M
Se deriva Q con respecto al parmetro y se iguala a cero
Q(|b(m) , x)
=
(m) x1
(m) +2
+ x4
x2 + x3
= 0.
1
(m) x1
(m) +2
(m) x1
(m) +2
+ x4
+ x2 + x3 + x4
b(m+1) =
mrodriguezgallardo@gmail.com
125(m)
(m) +2
125(m)
(m) +2
+ 34
=
+ 72
IEUV
159(m) + 68
.
197(m) + 144
Estadstica computacional
15-10-2014 22/30
I II III IV
El algoritmo EM
Ejemplo: la estimacin
La EVM mediante el algoritmo EM es de bEM = 0, 626821498.
Iteracin j
(j)
j = |(j) (j1) |
1
2
3
4
5
6
7
8
9
10
11
12
0,500000000
0,608247423
0,624321050
0,626488879
0,626777322
0,626815632
0,626820719
0,626821394
0,626821484
0,626821496
0,626821498
0,626821498
0,108247423
0,016073628
0,002167829
0,000288443
0,000038310
0,000005087
0,000000675
0,000000090
0,000000012
0,000000002
0,000000000
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 23/30
I II III IV
El algoritmo EM
IEUV
Iteracin j
(j)
1
2
3
4
5
...
149
148
150
148
151
0.6080664
0.6243003
0.6263641
0.6269785
0.6267242
...
0.6268228
0.6271139
0.6267015
0.6268587
0.6268609
La EVM estimada
mediante el algoritmo EMMC es de
bb
M C = 0,6268609.
Estadstica computacional
15-10-2014 24/30
I II III IV
El algoritmo EM
IEUV
Estadstica computacional
15-10-2014 25/30
I II III IV
El algoritmo EM
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 26/30
I II III IV
El algoritmo EM
IEUV
Estadstica computacional
15-10-2014 27/30
I II III IV
El algoritmo EM
mrodriguezgallardo@gmail.com
IEUV
Estadstica computacional
15-10-2014 28/30
I II III IV
El algoritmo EM
summary(xdata)
Min. 1st Qu.
1.680
2.740
Median
3.275
mrodriguezgallardo@gmail.com
Max.
4.330
Estadstica computacional
15-10-2014 29/30
Fin sesin 4
Gracias por asistir a esta presentacin