Está en la página 1de 3

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN

Facultad de Ingeniería Mecánica y Eléctrica

Unidad de aprendizaje:
Topicos Selectos de Ciencias de la Ingeniería 3.

Actividad 1.1:
Realizar una investigación del tema “Arboles de
decisión”.

Integrantes:
Nombre Matricula
José Diego Espinosa García 1958290

San Nicolás de los Garza, N. L.


Introducción

La fase de análisis en minería de datos es crucial para obtener información valiosa de


grandes conjuntos de datos. Entre las técnicas más utilizadas en esta fase se encuentran las
predictivas, las cuales permiten realizar pronósticos y descubrir patrones que ayudan a tomar
decisiones estratégicas en diversos campos.

Este reporte se centra en las técnicas predictivas basadas en árboles de decisión, una
herramienta poderosa para la clasificación y regresión. Abordaremos la terminología básica,
la clasificación de los árboles de decisión y sus diferentes tipos, con el objetivo de
comprender mejor su funcionamiento y aplicaciones.

a. Terminología Básica

Nodo: Representa una pregunta o decisión en el árbol.

Rama: Cada posible respuesta a una pregunta en un nodo.

Hoja: Nodo final del árbol que representa una clase o valor de predicción.

Entropía: Medida de la incertidumbre en un conjunto de datos.

Ganancia de información: Medida de la mejora en la pureza de un conjunto de datos


después de dividirlo en subconjuntos.

Poda: Técnica para evitar el sobreajuste del árbol de decisión.

b. Clasificación de los Árboles de Decisión

Árboles de decisión binarios: Permiten realizar clasificaciones dicotómicas (sí/no)

Árboles de decisión multirrama: Permiten realizar clasificaciones con múltiples categorías.

Árboles de regresión: Se utilizan para predecir valores numéricos continuos

c. Tipos de Árboles de Decisión


ID3: Uno de los algoritmos más clásicos para la construcción de árboles de decisión.

C4.5: Una mejora del algoritmo ID3 que maneja mejor la información faltante y atributos
categóricos con valores múltiples.

CART: Algoritmo que utiliza la técnica de poda para evitar el sobreajuste.

Random Forest: Algoritmo que combina múltiples árboles de decisión para mejorar la
precisión de la predicción.

Conclusiones

Los árboles de decisión son una herramienta poderosa para la fase de análisis en minería de
datos. Su flexibilidad y capacidad para visualizar el proceso de toma de decisiones los
convierten en una opción popular para diversas aplicaciones.

Es importante destacar que la elección del tipo de árbol de decisión y su configuración


dependen del problema específico que se desea resolver. Se recomienda explorar diferentes
algoritmos y técnicas de poda para obtener el mejor rendimiento en cada caso.

Referencias

Maria P. M. (1984). Mineria de Datos Atraves de Ejemplos

Quinlan, J. R. (1993). C4.5: Programs for machine learning. Morgan Kaufmann Publishers.

Rokach, L., & Maimon, O. (2008). Data mining with decision trees: Theory and applications.
World Scientific Publishing Company.

También podría gustarte