Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Xj ≤ θ y Xj > θ
Mitad pura
Decimos que una mitad es “pura” si contiene principalmente observaciones de una clase,
en cuyo caso no continuamos con las divisiones; de lo contrario, continuamos diviendo.
1.0
● ● ● ●●● ●
● ●●
●● ● ● ●● ●● ● ●●
● ●●● ● ●
●●● ● ● ● ● ●●● ● ● ● ● ●●
●● ● ●
● ● ● ●● ● ●●
● ●● ● ● ● ●
● ●
● ●● ● ● ● ●●● ● ●
● ● ●● ●
● ● ●
● ●
● ●
● ● ● ●●● ● ● ● ●
0.8
● ● ● ● ● ● ●
●
●
●
●● ● ● ●● ●● ● ●● ● ●
● ● ●● ● ● ● ● ● ●
● ● ● ●● ● ● ●● ● ● ●
● ●
● ● ●
● ● ● ● ● ●● ●●
● ● ● ● ●● ●
●
● ● ●●
●
● ● ●● ● ●●
●● ● ●● ●
● ● ●● ●● ●● ●
● ●●●●
● ●● ●
●●
0.6
● ●●●
●● ● ● ● ● ●
●● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ●
●● ● ●● ● ● ●
x2
●● ● ● ●
●● ●
●● ●● ●
● ● ● ●● ● ● ●● ● ● ●
●
●● ●●● ● ●● ●●
●
●● ● ● ● ●
●
● ● ● ● ●
0.4
● ● ● ●
● ● ●●● ● ●●
●● ● ● ●● ● ● ● ●●● ● ●
●
●● ●● ● ●● ● ●● ●● ● ●
● ●● ● ●● ● ● ● ● ● ● ●
●
● ●
● ●
●
● ●● ● ● ●● ● ●●
●
●● ● ● ● ● ●●
● ● ● ● ● ● ●
● ●● ●● ● ● ●
0.2
●
● ● ● ● ● ● ● ●
● ●
● ● ● ●● ● ● ●
●●● ●
●● ● ●● ● ● ●
● ● ●
●● ● ● ● ● ● ● ● ●● ● ●
●
●
● ●● ●●● ● ● ● ● ●
●● ● ● ● ●● ● ● ●● ● ● ●
● ● ●
● ● ● ● ●● ● ●● ● ●● ● ●● ● ● ●
● ● ●
0.0
● ● ● ●● ● ● ●
x1
0.8
● ● ● ●
● ● ●
60/0 x.2>=0.4993 x.2< 0.598 ●
● ● ●
● ●
● ● ● ●● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
● ●● ● ●● ● ●
●
● ● ● ● ●●● ●
●● ● ● ● ●
●
● ●● ●● ● ●
● ● ● ●
● ● ● ● ● ● ● ● ●
● ●
●● ● ● ● ● ● ●● ●● ● ●
● ●●● ●●
● ● ●● ●
0.6
● ● ●●
● ● ● ● ●
● ● ● ● ● ● ●
● ● ●
● ● ●● ● ● ●
●● ● ● ●
● ●●● ● ● ● ●
● ●
●
x2
● ●
● ● ● ● ●
● ●
●● ● ●
●
● ● ● ●● ● ●● ● ● ●
x.1< 0.5998 ●
●● ● ● ●
●
0 ● ● ● ● ● ●
● ● ●●
●
● ●●
●
●
● ● ●
0.4
● ● ● ●
148/0 ● ●● ● ●●
● ● ●
●●
● ● ● ● ● ●● ● ●
●● ● ● ●● ●● ●● ●
● ● ● ● ●● ●● ● ● ● ●
●
●
● ● ● ●
●● ● ●
● ● ● ●
● ●● ●
● ● ● ● ● ●
● ●
●
●● ● ●
● ● ● ● ● ● ●
● ●● ● ● ● ●
0.2
● ● ● ● ● ●● ●
●
● ● ● ● ● ●●
● ● ●
●●●● ●● ● ● ●
● ● ● ● ●
● ● ● ● ●
●● ●
● ● ● ●● ● ●
● ●● ● ● ●
●● ● ● ●
● ● ●● ●
●● ● ● ●
●● ● ● ● ● ●
0 1 ● ● ● ● ●● ● ●● ● ●● ●● ●
●
● ● ●
● ● ● ● ● ●● ●●
0.0
● ● ●
39/0 0/71
0 1
101/0 0/81 0.0 0.2 0.4 0.6 0.8 1.0
x1
Inferencia
I Luego clasificamos un nuevo punto x ∈ Rp mediante
f̂ tree (x) = cj si x ∈ Rj .
(k)
nj
p̂k (Rj ) = ,
nj
(k)
donde nj corresponde al número de puntos en la región Rj que son de la clase k.
ej = 1 − p̂cj (Rj )
El algoritmo CART procede de arriba a abajo en el árbol según la siguiente regla (avara):
1.0
● ● ● ●●● ●
● ●●
●● ● ● ●● ●● ● ●●
● ●●● ● ●
●●● ● ●
1. Seleccione la división que produce la mayor ●●
● ● ●
● ●●
●● ●
●●● ● ● ●
●● ●
●
●
●
● ●
●●
●
● ●
●
● ●
●●
● ● ● ●●● ● ● ● ●
● ●
reducción en el error de clasificación (considere ● ●●
● ●
●
● ●
●
● ●●●
●
● ● ● ●
0.8
● ● ● ● ● ●
● ●
●
●
●● ● ● ●● ●● ● ●● ● ●
● ● ●● ● ● ● ● ●
todos los features) ● ●
● ●
●
●
●
● ● ● ● ● ●●
●
●● ●● ●
●●
● ●●
●
● ● ●
●
●● ●
●● ●●
●
●
●●
● ●
●
● ●
●
●
● ● ●●
●
● ● ● ● ●● ● ●●●
●● ●●●●
● ●● ●
0.6
● ● ● ● ●●●
2. Continúe de esta manera hasta que el criterio de ●
●●● ●
● ●
●
● ●
●● ●
●● ●
● ●
● ● ● ●
●
●
●●
●
●
●
● ●
● ●
● ●
●
x2
●● ● ● ●
●● ● ●
terminación haya sido alcanzado ●
●● ●
● ●
●
●●
●
●
●● ●●● ●
● ●
●● ●● ● ●
●
●
●
●●
●
●
●
● ● ●
● ●
●●
0.4
● ● ● ● ●
● ●●● ● ●●
●● ● ● ●● ● ● ● ●●● ● ●
●
●● ●● ● ●● ● ●● ●● ● ●
●●● ● ●● ● ● ● ● ● ● ●
●● ●
● ●
●
● ●● ● ● ●● ● ● ●
●
●● ● ● ● ● ●●
● ● ● ● ● ●
Criterio de terminación: utilizaremos el número mı́nimo ● ●● ●● ●
●
● ●
0.2
● ● ● ●
● ● ● ● ● ● ● ● ●
●●● ● ● ● ●● ● ●
●● ● ●● ● ● ● ●
de instancias de entrenamiento asignados a cada hoja: ●●
●
● ● ●
●
●
● ● ● ●
●● ●●● ● ●
●
●
●
●
●● ● ●
● ●● ● ●
● ●
●● ● ● ●● ● ● ●
●
● ● ● ● ●● ● ●● ● ●● ● ●● ● ●
●●
● ● ●
0.0
● ● ● ●● ● ● ●
Si el conteo de instancias es menor al mı́nimo, la divi- 0.0 0.2 0.4 0.6 0.8 1.0
sión no es aceptada. x1
argmin (e1 + e2 )
j,θ
No, para dividir una región Rm en la variable j, realmente solo debemos considerar nm
divisiones posibles (o nm − 1 divisiones)
● ●
● ●
● ●
0.8
0.8
● ●
● ●
● ●
● ●
● ●
0.6
0.6
● ●
● ●
x2
x2
● ●
0.4
0.4
● ● ● ●
● ●
● ●
0.2
0.2
● ●
● ●
● ●
● ●
0.0
0.0
● ●
0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0
x1 x1
ej = 1 − p̂cj (Rj )
donde
1 X
cj = yi
nj
xi ∈Rj
Usamos ahora la función de pérdida cuadrática para decidir que región dividir.