Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Decisión
ID3
Contenido
Árbol de decisión:
Nodos no terminales: test. (sobre valores de atributos)
Arcos: valores.
Nodos terminales: clase de decisión.
Riesgo:{alto, moderado, bajo}
Ingresos
Alta Baja
Alto Moderado
Espacio de hipótesis:
Conjunto de todos los árboles de decisión o de todas las
funciones booleanas.
Dados
Descripción de Instancias, X, (atributos, valores).
Descripción de las Hipótesis, H (espacio de árboles de
decisión).
Concepto objetivo, c : X {0,1}.
Ejemplos positivos y negativos, D, pares (<x, c(x)>).
Determinar
Hipótesis h de H / h(x) = c(x) para todo x de X.
Historia
Desconocida
Mala Buena
No Adecuados No Adecuados
Ingresos
Alta Baja
Alto Moderado
6+, 4- 6+, 4-
atributo A atributo B
Universo mensajes
M={m1, m2... ...mn}
con probabilidad p(mi), i=1,2... ...n
I(D)
Resto(A)
Resto(Ingresos):
Espacio de hipótesis:
Conjunto de todos los árboles de decisión o de todas las
funciones booleanas.
BPA-ID3:
Primero en anchura, partiendo de árbol vacío,
incrementando profundidad.
Encuentra árbol de menor profundidad consistente con D.
Bias BPA-ID3
Preferir el árbol de menor profundidad.
Justificación
Muy eficiente (reducción búsqueda)
Tiende a encontrar “buenos árboles”
Justificación adicional:
Es razonable esperar que las hipótesis más simples
generalicen mejor (clasifiquen mejor los ejemplos no
vistos) pues es razonable esperar que contengan menos
atributos irrelevantes.
¡Validación experimental! (¿más simple = más pequeña?).
Ingresos
Alta Baja
Alto Moderado
Ingresos
Adecuados
No Desconocida Mala Buena Desconocida Mala Buena
Alta Baja
Alto Moderado