Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción al Boosting
Algoritmo AdaBoost
Referencias Bibliográficas
4. Receiver operating characteristic (ROC) curve for the 200 feature classifier.
Curva ROC para un clasificador con 200
features.
Figure 10. Output of our face detector on a number of test images from the MIT + CMU test set.
Introducción al Boosting
Algoritmo AdaBoost
Referencias Bibliográficas
P1
Weak
learner c1
Z
α1
P2
Weak c2
learner α2 Σ ĉB (x)
Z αB
…
cB
PB Weak
learner
Z
Yh p i
H = 2 (t (1 − t )
t
X 2
≤ exp −2 γt
t
Comparación de error de prueba entre algoritmos C4.5 Vs. Boosting Decision Stumps, y
Boosting C4.5 respectivamente [Freund and Schapire, 1999].
T
X
H(x) = αt ht (x)
t=1
∂e−f (x)H(x)
= −f (x)e−f (x)H(x)
∂H(x)
= e−H(x) P(f (x) = +1|x) + eH(x) P(f (x) = −1|x) = 0
Resolviendo
Dado que
Para t = 1, . . . , T:
1. Entrenar la hipótesis débil ht : X → {−1, +1} utilizando la distribución Dt
Obtener H(x) = Ti=1 αi hi (x).
P
h i
`exp (Ht−1 + ht |D) = Ex∼D e−f (x)(Ht−1 (x)+ht (x))
f (x)2 ht (x)2
" !#
≈ Ex∼D e−f (x)Ht−1 (x)
1 − f (x)ht (x) +
2
1
= Ex∼D e−f (x)Ht−1 (x) 1 − f (x)ht (x) +
2
h i
`exp (f , αt ht |Dt ) =Ex∼Dt e−f (x)αt ht (x)
=Ex∼Dt e−αt I(f (x) = ht (x)) + eαt I(f (x) , ht (x))
∂`exp (f , αt ht |Dt )
= − e−αt (1 − t ) + eαt t = 0
∂αt
cuya solución es
1 1 − t
αt = ln
2 t