Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema-7 Arboles
Tema-7 Arboles
Curso 200203
Tema 7: Aprendizaje de
arboles
de decisi
on
Jos
e A. Alonso Jim
enez
Miguel A. Guti
errez Naranjo
Francisco J. Martn Mateos
Jos
e L. Ruiz Reina
Universidad de Sevilla
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.1
Contenido
x
Arboles
de decisi
on
El algoritmo ID3
Entropa e informaci
on
Ejemplos
B
usqueda y sesgo inductivo
Sobreajuste y ruido
Poda
Otras cuestiones
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.2
Arboles
de decisi
on
x
Ejemplos de
arboles de decisi
on
Color
Verde
Soleado
Alta
IA2 200203
Forma
Nublado
+
Normal
Tamao
Lluvia
Grande
Humedad
Azul
Rojo
Cielo
Viento
Fuerte
Debil
Cc Ia
Pequeo
Redondo
Cuadrado
Tamao
Grande
Pequeo
Aprendizaje de
arboles de decisi
on
7.3
Arboles
de decisi
on
x
Arboles
de decisi
on
u
Representaci
on de una funci
on objetivo
Disyunci
on de reglas proposicionales:
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.4
Aprendizaje de
arboles de decisi
on
x
Objetivo: aprender un
arbol de decisi
on consistente con los ejemplos
u
Cielo
Sol
Sol
Nubes
Lluvia
Lluvia
Lluvia
Nubes
Sol
Sol
Lluvia
Sol
Nubes
Nubes
Lluvia
IA2 200203
Temperatura
Alta
Alta
Alta
Suave
Baja
Baja
Baja
Suave
Baja
Suave
Suave
Suave
Alta
Suave
Humedad
Alta
Alta
Alta
Alta
Normal
Normal
Normal
Alta
Normal
Normal
Normal
Alta
Normal
Alta
Viento
Debil
Fuerte
Debil
Debil
Debil
Fuerte
Fuerte
Debil
Debil
Debil
Fuerte
Fuerte
Debil
Fuerte
Cc Ia
Jugar tenis
+
+
+
+
+
+
+
+
+
-
Ej.
O1
O2
O3
O4
O5
O6
Color
Rojo
Azul
Rojo
Verde
Rojo
Verde
Forma
Cuadrado
Cuadrado
Redondo
Cuadrado
Redondo
Cuadrado
Tamano
Grande
Grande
Pequeno
Pequeno
Grande
Grande
Clase
+
+
+
-
Aprendizaje de
arboles de decisi
on
7.5
Algoritmo ID3
x
Cc Ia
Aprendizaje de
arboles de decisi
on
7.6
C
omo saber qu
e atributo clasifica mejor?
x
log2
|D|
|D| |D|
|D|
donde P y N son, resp., los subconjuntos de ejemplos positivos y negativos de D
Ent(D) =
u
x
Notaci
on: Ent([p+, n]), donde p = |P | y n = |N |
Intuici
on:
u
Teora de la Informaci
on: cantidad media de informaci
on (en bits) necesaria para
codificar la clasificaci
on de un ejemplo de D
Ejemplos:
u
9
5
5
9
log2 14
14
log2 14
= 0.94
Ent([9+, 5]) = 14
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.7
Ganancia de informaci
on
x
|Dv |
Ent(Dv )
|D|
Ganancia de informaci
on esperada despu
es de usar un atributo A:
Ganancia(D, A) = Ent(D)
X
vV alores(A)
|Dv |
Ent(Dv )
|D|
En el algoritmo ID3, en cada nodo usamos el atributo con mayor ganancia de informaci
on (considerando los ejemplos correspondientes al nodo)
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.8
D:[9+,5]
E=0.940
Humedad
Viento
Alta
Normal
[6+,1]
E=0.592
[3+,4]
E=0.985
Debil
[3+,3]
E=1.00
[6+,2]
E=0.811
Ganancia(D,Viento)=
Ganancia(D,Humedad)=
0.94(7/14)0.985(7/14)0.592=0.151
0.94(8/14)0.811(6/14)1=0.048
D:[9+,5]
E=0.940
D:[9+,5]
E=0.940
Cielo
Temperatura
Soleado
[2+,3]
E=0.970
Nubes
[4+,0]
E=0
Lluvia
[3+,2]
E=0.970
Ganancia(D,Cielo)=
0.94(5/14)0.97(4/14)0(5/14)0.97=0.246
IA2 200203
Fuerte
Cc Ia
Alta
[2+,2]
E=1
Suave
[4+,2]
E=0.918
Baja
[3+,1]
E=0.811
Ganancia(D,Temperatura)=
0.94(4/14)1(6/14)0.918(4/14)0.811=0.029
Aprendizaje de
arboles de decisi
on
7.9
Selecci
on del atributo para el nodo raiz:
u
7
7
Ganancia(D, Humedad) = 0.94 14
0.985 14
0.592 = 0.151
8
6
Ganancia(D, V iento) = 0.94 14
0.811 14
1 = 0.048
5
4
5
Ganancia(D, Cielo) = 0.94 14
0.970 14
0 14
0.970 = 0.246 (mejor atributo)
6
4
4
1 14
0.918 14
0.811 = 0.02
Ganancia(D, T emperatura) = 0.94 14
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.10
Arbol
parcialmente construido:
Cielo
Soleado
Nubes
{D1,D2,D8,D9,D11}
{D3,D7,D12,D13}
[2+,3]
[4+,0]
?
IA2 200203
Cc Ia
Lluvia
{D4,D5,D6,D10,D14}
[3+,2]
?
Aprendizaje de
arboles de decisi
on
7.11
Selecci
on del atributo para el nodo Cielo = Sol:
DSol = {D1, D2, D8, D9, D11} con entropa Ent([2+, 3]) = 0.971
3
2
u Ganancia(D
Sol , Humedad) = 0.971 5 0 5 0 = 0.971 (mejor atributo)
2
2
1
u Ganancia(D
Sol , T emperatura) = 0.971 5 0 5 1 5 0 = 0.570
2
3
u Ganancia(D
Sol , V iento) = 0.971 5 1 5 0.918 = 0.019
u
Selecci
on del atributo para el nodo Cielo = Lluvia:
DLluvia = {D4, D5, D6, D10, D14} con entropa Ent([3+, 2]) = 0.971
2
3
u Ganancia(D
Lluvia , Humedad) = 0.971 5 1 5 0.918 = 0.820
2
3
u Ganancia(D
Lluvia , T emperatura) = 0.971 5 0.918 5 1 = 0.820
3
2
u Ganancia(D
Lluvia , V iento) = 0.971 5 0 5 0 = 0.971 (mejor atributo)
u
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.12
Arbol
finalmente aprendido:
Cielo
Soleado
IA2 200203
Nublado
Humedad
Alta
Lluvia
Normal
+
Cc Ia
Viento
Fuerte
Debil
+
Aprendizaje de
arboles de decisi
on
7.13
Selecci
on del atributo para el nodo raiz:
u
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.14
Arbol
parcialmente construido:
Color
Rojo
Verde
{O1,O3,O5}
{O4,O6}
{O2}
[2+,1]
[0+,2]
[1+,0]
IA2 200203
Azul
Cc Ia
Aprendizaje de
arboles de decisi
on
7.15
Selecci
on del atributo para el nodo Color = Rojo:
u
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.16
Arbol
finalmente aprendido:
Color
Rojo
Azul
Verde
Tamao
Grande
Pequeo
+
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.17
B
usqueda y sesgo inductivo
x
B
usqueda en un espacio de hip
otesis
u
Espacio de hip
otesis completo
Un u
nico
arbol candidato en cada paso
Sesgo inductivo
u
Se prefieren
arboles m
as cortos sobre los m
as largos
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.18
Repetici
on de este proceso
u
Curva de aprendizaje
Estratificaci
on: cada clase correctamente representada en el entrenamiento y en la
prueba
Validaci
on cruzada
u
Dividir en k partes, y hace k aprendizajes, cada uno de ellos tomando como prueba
una de las partes y entrenamiento el resto. Finalmente hacer la media de los
rendimientos.
En la pr
actica: validaci
on cruzada, con k = 10 y estratificaci
on
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.19
Sobreajuste y ruido
u
Una hip
otesis h H sobreajusta los ejemplos de entrenamiento si existe h0 H que
se ajusta peor que h a los ejemplos pero act
ua mejor sobre la distribuci
on completa
de instancias.
El
arbol aprendido en este caso sera (sobrejustado a los datos):
Color
Rojo
Color
Rojo
Azul
Grande
+
IA2 200203
Tamao
Pequeo
Cc Ia
Tamao
Grande
Verde
Azul
Verde
Pequeo
Forma
Redondo
Cuadrado
Aprendizaje de
arboles de decisi
on
7.20
Sobreajuste y ruido
x
Atributos que en los ejemplos presentan una aparente regularidad pero que no son
relevantes en realidad
Podar el
arbol a posteriori
Transformaci
on a reglas, podado de las condiciones de las reglas
Las podas se producen siempre que reduzcan el error sobre un conjunto de prueba
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.21
Podado de
arboles
x
1.
2.
3.
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.22
Otra cuestiones pr
acticas del algoritmo ID3
x
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.23
Bibliografa
x
IA2 200203
Cc Ia
Aprendizaje de
arboles de decisi
on
7.24