Los árboles de decisión son una de las técnicas de Machine learning
más utilizadas. El objetivo es crear un modelo que prediga el valor o clase de una observación a partir de reglas de decisión obtenidas de datos anteriores. El uso es tan amplio que diferentes profesionales utilizan esta herramienta para generar estrategias de negocios, así como otros la utilizan para realizar diagnósticos médicos.
El modelo está formado por una serie de decisiones lógicas similares
a las de un diagrama de flujo. El árbol comienza con un nodo llamado “nodo raíz”, en este y en los nodos internos se toman las decisiones basado en diferentes atributos, las ramas indican las decisiones tomadas. Al final del árbol de decisión se encuentran los nodos terminales, que representan el resultado de seguir una combinación de decisiones. Alternativamente, el nodo terminal puede tener asociada una probabilidad de que el valor meta tome cierto valor.
Esta técnica puede ser utilizada para predecir variables categóricas y
continuas, y suelen ser llamados árboles de clasificación y regresión respectivamente. Con el fin de tener más claro el concepto, a continuación se presenta un ejemplo de un banco que utiliza un árbol de decisión para decidir si le debería ofrecer un préstamo a una persona. La estrategia para construir un árbol de decisión es un método heurístico llamado partición recursiva. La idea es que conforme se avance en el árbol de decisión se formen grupos cada vez más uniformes,en donde predomine una clase o un valor. En el ejemplo anterior estos grupos son; personas a las que fue acertado ofrecerles un préstamo y las que no. De esta manera, se encuentran patrones que son utilizados para realizar predicciones con aplicantes nuevos.
Definición de Árbol de Decisión
Técnica que permite analizar decisiones secuenciales basada en el uso de
resultados.
Los árboles de decisión se pueden usar para generar sistemas expertos,
búsquedas binarias y árboles de juego.
Las ventajas de un árbol de decisión son:
Facilita la interpretación de la decisión adoptada.
Proporciona un alto grado de comprensión del conocimiento utilizado en la
toma de decisiones.
Explica el comportamiento respecto a una determinada tarea de decisión.
Reduce el número de variables independientes.
Es una magnifica herramienta para el control de la gestión empresarial.
Árboles de Decisión Binarios
-En un árbol de decisión los nodos internos almacenan preguntas y las hojas almacenan posibles respuestas finales. En función de las respuestas a las preguntas de los nodos internos, se va describiendo un camino en el árbol que va desde la raíz hasta una hoja que contendrá la conclusión del sistema. Para ilustrar la operación de un árbol de decisión consideremos las siguientes heurísticas en la selección del vino apropiado para servir con un alimento:
• SI el plato principal es carne roja
• ENTONCES servir vino tinto • SI el plato principal es ave y es pavo • ENTONCES servir vino tinto • SI el plato principal es ave y no es pavo • ENTONCES servir vino blanco • SI el plato principal es pescado • ENTONCES servir vino blanco
Árboles de Decisión con Varias Ramas
Los árboles de decisión binarios dificultan la representación dificultan la
representación de una decisión que permita un conjunto de respuestas o casos.
Un nodo de decisión capaz de permitir ramas múltiples daría una solución
más directa.
Árboles de Decisión que Aprenden
Un árbol de decisión con aprendizaje es un árbol con decisión en el que si la conclusión a la que se llega es errónea (desde el punto de vista del usuario) se pasa a un proceso de aprendizaje en el que, con ayuda del usuario, se modifica el árbol para que considere la nueva posibilidad.
En este caso consideraremos árboles de decisión binarios, es decir, tales
que las posibles respuestas a las preguntas almacenadas en los nodos internos son "si" o "no".