Está en la página 1de 4

Diagrama de árbol de decisión

Figura Nombre Significado

Nodo de Indica una decisión que se


Qué es un diagrama de árbol de decisión decisión tomará

¿Cuáles son tus necesidades de creación de


árbol de decisión? Nodo de Muestra múltiples
probabilidad resultados inciertos
¿Qué es un árbol de decisión?

Un árbol de decisión es un mapa de los


posibles resultados de una serie de decisiones Ramificacion Cada ramificación indica
relacionadas. Permite que un individuo o una es un posible resultado o
organización comparen posibles acciones alternativas acción
entre sí según sus costos, probabilidades y
beneficios. Se pueden usar para dirigir un Alternativa Muestra una alternativa
intercambio de ideas informal o trazar un rechazada que no estaba
algoritmo que anticipe matemáticamente la seleccionada
mejor opción.

Un árbol de decisión, por lo general, comienza Nodo Indica un resultado


con un único nodo y luego se ramifica en terminal definitivo
resultados posibles. Cada uno de esos
resultados crea nodos adicionales, que se
ramifican en otras posibilidades. Esto le da
una forma similar a la de un árbol. Símbolos de los árboles de decisión

Hay tres tipos diferentes de nodos: nodos de Los árboles de decisión también se pueden
probabilidad, nodos de decisión y nodos dibujar con símbolos de diagramas de flujo,
terminales. Un nodo de probabilidad, que a algunas personas les parecen más
representado con un círculo, muestra las fáciles de leer y comprender.
probabilidades de ciertos resultados. Un nodo
de decisión, representado con un cuadrado, Cómo dibujar un árbol de decisión
muestra una decisión que se tomará, y un
nodo terminal muestra el resultado definitivo Para dibujar un árbol de decisión, primero
de una ruta de decisión. debes elegir un medio. Puedes dibujarlo a
mano en un papel o una pizarra, o puedes
usar un software de árboles de decisión. En
cualquier caso, te mostramos los pasos que
debes seguir:
1. Comienza con la decisión principal. Dibuja decisión a los beneficios esperados. Los
un pequeño recuadro para representar este beneficios esperados son iguales al valor total
punto, luego dibuja una línea desde el de todos los resultados que puedan derivar de
recuadro hacia la derecha para cada posible esa decisión, y cada valor se multiplica por la
solución o acción. Etiquétalas correctamente. probabilidad de que ocurra. A continuación te
mostraremos cómo nosotros calcularíamos
2. Agrega nodos de decisión y estos valores para el ejemplo descrito
probabilidad para expandir el árbol del anteriormente:
siguiente modo:
Al identificar cuál es el resultado más
 Si otra decisión es necesaria, dibuja deseable, es importante tener en cuenta las
otro recuadro. preferencias de utilidad del encargado de
 Si el resultado es incierto, dibuja un tomar la decisión. Por ejemplo, algunos
círculo (los círculos representan prefieren opciones de bajo riesgo, mientras
nodos de probabilidad). que otros están dispuestos a correr riesgos si
 Si el problema está resuelto, déjalo en el beneficio es mayor.
blanco (por ahora).
Al usar tu árbol de decisión acompañado por
Desde cada nodo de decisión, dibuja un modelo de probabilidad, puedes
soluciones posibles. Desde cada nodo de emplearlo para calcular la probabilidad
probabilidad, dibuja líneas que representen condicional de un evento o la probabilidad de
los resultados posibles. Si deseas analizar tus que suceda, en el caso de que otro evento
opciones de forma numérica, incluye la ocurra. Para hacerlo, simplemente empieza
probabilidad de cada resultado y el costo de con el evento inicial, luego sigue la ruta desde
cada acción. ese evento hasta el evento objetivo, y
multiplica la probabilidad de cada uno de esos
3. Continúa con la expansión hasta que cada eventos juntos.
línea alcance un extremo, lo que significa que
no hay más decisiones que tomar o resultados De este modo, un árbol de decisión se puede
probables que considerar. Luego, asigna un emplear como un diagrama de árbol
valor a cada resultado posible. Puede ser una tradicional, que traza las probabilidades de
puntuación abstracta o un valor financiero. determinados eventos, como lanzar una
Agrega triángulos para indicar los extremos. moneda dos veces.

Ventajas y desventajas
Con un árbol de decisión completo, ya estás
listo para comenzar a analizar la decisión que Los árboles de decisión siguen siendo
enfrentas. populares por razones como las siguientes:

Ejemplo de análisis de un árbol de decisión  Son muy fáciles de entender


 Pueden ser útiles con o sin datos
Al calcular la utilidad o el valor esperado de fehacientes, y cualquier dato
cada decisión en el árbol, puedes minimizar el requiere una preparación mínima
riesgo y maximizar la probabilidad de obtener  Se pueden agregar nuevas opciones a
un resultado deseado. los árboles existentes
 Su valor al seleccionar la mejor de
Para calcular la utilidad esperada de una numerosas opciones
decisión, solo debes restar el costo de esa
 Se combinan fácilmente con otras A veces la variable predicha será un número
herramientas de toma de decisiones real, como un precio. Los árboles de decisión
con resultados posibles, infinitos y continuos
Sin embargo, los árboles de decisión pueden se llaman "árboles de regresión".
volverse excesivamente complejos. En esos
casos, un diagrama de influencia más Para una mayor precisión, se suelen combinar
compacto puede ser una buena alternativa. múltiples árboles con métodos de
Los diagramas de influencia se enfocan en los ensamblado:
objetivos, las entradas y las decisiones
fundamentales.  Bagging (Ensamblado) crea múltiples
árboles de decisión haciendo un
Árboles de decisión en minería de datos y remuestreo de los datos de origen,
aprendizaje automático luego hace que los árboles voten para
llegar a un consenso.
Un árbol de decisión también puede usarse  Un clasificador de selva
para ayudar a crear modelos predictivos aleatoria consiste en múltiples
automatizados, que puedan emplearse en el árboles diseñados para aumentar la
aprendizaje automático, la minería de datos y tasa de clasificación.
las estadísticas. Conocido como "el  Los árboles ampliados se pueden
aprendizaje basado en árboles de decisión", usar en árboles de clasificación y de
este método toma en consideración las regresión.
observaciones sobre un elemento para  Los árboles en una Selva aleatoria
predecir su valor. (Rotation Forest) se entrenan
mediante el uso del análisis de
En estos árboles de decisión, los nodos componentes principales (ACP) en
representan datos en lugar de decisiones. una porción aleatoria de los datos.
Este tipo de árbol también se conoce como
"árbol de clasificación". Cada ramificación Un árbol de decisión se considera ideal
contiene un conjunto de atributos o reglas de cuando representa la mayor cantidad de
clasificación asociadas a una etiqueta de clase datos con el menor número de niveles o
específica, que se halla al final de la preguntas. Los algoritmos diseñados para
ramificación. crear árboles de decisión optimizados
incluyen CART, ASSISTANT, CLS y ID3/4/5. Un
Estas reglas, también conocidas como "reglas árbol de decisión también se puede generar
de decisión", se pueden expresar en una mediante la creación de reglas de asociación,
cláusula "Si... entonces...". Cada valor de ubicando la variable objetivo a la derecha.
datos o decisión forma una cláusula, de tal
manera que, por ejemplo, "si las condiciones Cada método debe determinar cuál es la
1, 2 y 3 se cumplen, entonces el resultado X mejor forma de dividir los datos en cada nivel.
será el resultado definitivo con certeza Y". Los métodos comunes para hacerlo incluyen
la medición de la impureza de Gini, la
Cada dato adicional ayuda a que el modelo obtención de información y la reducción de
prediga de forma más precisa a qué conjunto variaciones.
finito de valores pertenece el asunto en
cuestión. Esa información se puede usar
posteriormente como una entrada en un
modelo más grande de toma de decisiones.
Emplear los árboles de decisión en el
aprendizaje automático tiene numerosas
ventajas:

 El costo del uso del árbol para


predecir los datos disminuye con
cada punto de datos adicional.
 Funciona para los datos numéricos o
categóricos.
 Puede modelar problemas con
múltiples resultados.
 Usa un modelo de caja blanca (lo que
hace que los resultados sean fáciles
de explicar).
 La fiabilidad de un árbol se puede
cuantificar y poner a prueba.
 Tiende a ser preciso
independientemente de si viola las
suposiciones de los datos de origen.

Pero también tienen algunas desventajas:

 Cuando se presentan datos


categóricos con múltiples niveles, la
información obtenida se inclina a
favor de los atributos con mayoría de
niveles.
 Los cálculos pueden volverse
complejos al lidiar con la falta de
certezas y numerosos resultados
relacionados.
 Las conjunciones entre nodos se
limitan a AND, mientras que los
gráficos de decisión admiten nódulos
relacionados mediante OR.

También podría gustarte