Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Amul Arboles de Decision
Amul Arboles de Decision
Arboles de decisión
Decision Trees
• Nodo de hoja / terminal: Los nodos sin hijos (sin división adicional) se
llaman Hoja o nodo terminal.
Ganancia de información
Ganancia de información
• Qué sucede en estos ejemplos donde vemos resultados con alta y baja
ganancia de información
Entropía
Entropía
Entropía
Entropía
Entropía
Entropía
• El procedimiento es el siguiente:
• Se define un conjunto de preguntas q del tipo:
=& < 0, 8 = 1, … ) y 0 ∈ (−∞, +∞)
• Para cada pregunta se calcula la disminución de impureza o entropía que
implica y se escoge aquella pregunta que maximice la impureza resultante
medida por
Δ1 ,, D = 1 , − )' 1 ,( − )) 1 ,)
siendo )' , )) las proporciones de las observaciones del nudo t que irán a los
nudos resultantes de responder “Sí” a la pregunta q (nudo ,( ) y responder
“No” (nudo ,) )
Medidas de selección de atributos
Entropía
Gini
F* G = ∑-
+", I+ J − I+ = ∑ $
&"# E& − E&
.
= ∑ $
&"# E& − ∑ $
(E
&"# &
.
)=1- ∑ $ .
&"# & )
(E
Medidas de selección de atributos
Gini