Está en la página 1de 10

ING.

FABRICIO JAVIER RIVADENEIRA ZAMBRANO

ESTUDIANTES:

BRAVO COBEA LUIS HUMBERTO


CAICEDO VILA INGRID VANESSA
HERNNDEZ VALENCIA TALO CRISTOPHER

9NB
DECISION TREES (RBOL DE DECISIONES)

Un rbol de decisin es un mapa de los posibles resultados de una serie de elecciones relacionadas.
Permite a un individuo u organizacin evaluar las posibles acciones entre s en funcin de sus costos,
probabilidades y beneficios. Se pueden usar para generar discusiones informales o para trazar un
algoritmo que prediga matemticamente la mejor opcin.

Un rbol de decisin generalmente comienza con un solo nodo, que se bifurca en posibles
resultados. Cada uno de esos resultados conduce a nodos adicionales, que se ramifican hacia otras
posibilidades. Esto le da una forma arborescente.
Hay tres tipos diferentes de nodos:

Nodos aleatorios
Nodos de decisin
Nodos finales

Un nodo aleatorio, representado por un crculo, muestra las probabilidades de ciertos


resultados. Un nodo de decisin, representado por un cuadrado, muestra una decisin a tomar, y
un nodo final muestra el resultado final de un camino de decisin.

Los rboles de decisin tambin se pueden dibujar con smbolos de diagrama de flujo, que algunas
personas encuentran ms fcil de leer y comprender.
Smbolos del rbol de decisiones

Forma Nombre Sentido

Indica una decisin que debe


Nodo de decisin
tomarse

Muestra mltiples resultados


Nodo Chance
inciertos

Cada rama indica posible


Ramas Alternativas
resultado o accin

Muestra una opcin que no fue


Alternativa rechazada
seleccionada

Inicia un resultado final


Nodo punto final
Proceso para crear un rbol de decisin

Se utiliza un conjunto de datos de entrenamiento (training) para crear el rbol.


Se utiliza un conjunto de datos de validacin para reducir la complejidad del
rbol y generalizarlo (proceso de poda o pruning)
Eliminar el problema del overfitting
Tres conjuntos de datos obtenidos de particionar el conjunto de datos original.
Entrenamiento: 40%
Validacin: 30%
Prueba: 30%
Algoritmos ms comunes para rboles de decisin

CART (classification and regression trees) CART comenz como un enorme programa en
Fortran que escribi Jerry Friedman y que sirvi para contrastar las ideas contenidas en el libro.
Evita el paso de optimizacin global que se usa en las reglas del C4.5, genera una lista de decisin
sin restricciones usando el procedimiento de divide y vencers.
La tabla de decisin est integrada por cuatro secciones:
Identificacin de condiciones
Entradas de condiciones
Identificacin de acciones
Entradas de acciones de la siguiente tabla.
C4.5 El C4.5 acaba con muchas de las limitaciones del ID3. Permite trabajar con valores continuos
para los atributos, separando los posibles resultados en dos ramas en funcin de un umbral. Los
rboles son menos frondosos porque cada hoja no cubre una clase en particular sino una
distribucin de clases. El C4.5 genera un rbol de decisin a partir de los datos mediante particiones
realizadas recursivamente, segn la estrategia de profundidad-primero (depth-first).

CHAID (chi square automatic induction) CHAID, o deteccin automtica de interacciones


mediante chi-cuadrado (del ingls Chi-squared Automatic Interaction Detection), es un mtodo de
clasificacin para generar rboles de decisin mediante estadsticos de chi-cuadrado para identificar
divisiones ptimas.
Los campos objetivo y de entrada pueden ser continuos o categricos. Los nodos pueden dividirse
en dos o ms subgrupos en cada nivel. Todos los campos ordinales utilizados en el modelo deben
disponer de almacenamiento numrico (no en cadenas).
1R (OneR) Es un algoritmo sencillo que sin embargo funciona de forma parecida a complejos
rboles de decisin.

ID3 Induction of Decision Trees En este rbol los nodos intermedios son atributos de los
ejemplos presentados, las ramas representan valores de dichos atributos y los nodos finales son los
valores de la clase, como ya vimos al hablar de los rboles de decisin binarios.
El ID3 construye rboles de decisin a partir de un conjunto de ejemplos. Estos ejemplos o tuplas
estn constituidos por un conjunto de atributos y un clasificador o clase. Los dominios de los
atributos y de las clases deben ser discretos.
Bibliografa
Bellosta, C. J. (s.f.). Anlisis y Decisin. Recuperado el 11 de 2017, de
http://analisisydecision.es/sobre-la-historia-de-cart-y-rpart/
Villena, J. (s.f.). Minera de datos. Recuperado el 11 de 2017, de
http://www.it.uc3m.es/jvillena/irc/practicas/03-04/18.mem.pdf

También podría gustarte