Está en la página 1de 2

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS

FACULTAD DE INGENIERÍA
INGENIERÍA CATASTRAL Y GEODESIA
INTELIGENCIA ARTIFICIAL APLICADA AL TERRITORIO 025 - 61
JOHN EDWIN SUAREZ MEJIA
CÓDIGO: 20142025144

Relatoría 4 Clase 13 de octubre 2020

El tema de la clase fue desarrollado por Camila Ayala, Diego Nieto, Laura Bravo y
Camilo Tiria quienes abordaron la metodología y el uso de los árboles de decisión
a partir del algoritmo C4.5 y C5.0.

El algoritmo C5.0 fue desarrollado por un investigador de ciencias de la computación


en minería de datos y teoría de decisiones llamado J. Ross Quinlan, quien también
desarrollo el algoritmo ID3 en 1986 y posteriormente el C4.5 en 1993 los cuales son
versiones anteriores, el algoritmo cuenta con varias mejoras en comparación a sus
anteriores versiones como velocidad de procesamiento y otras. Además, cuenta con
el Boosting, el cual consiste en la creación de múltiples clasificadores o múltiples
árboles de decisión para ejecutar el mejor resultado a través de la mayor ganancia
de información.

De esta forma la familia TDIDT la cual describe un comportamiento de decisión en


forma descendente guiada por la información de frecuencia de los ejemplos, pero
no por el orden en particular en que se dan los ejemplos. En cuanto al algoritmo ID3
se mencionó que se desarrolla a partir de la ganancia de información como el criterio
de división y deja de crecer cuando las instancias pertenecen a un valor único de
una característica de destino. El algoritmo Greedy que es otro método de esta
familia de algoritmos se utiliza generalmente para resolver problemas de
optimización, en este proceso una vez tomada la decisión, esta no vuelve a
replantearse en el futuro por ultimo son algoritmos rápidos y fáciles de implementar,
es importante entender los conceptos que se emplean en el algoritmo como tal, en
este caso el algoritmo C4.5 el cual construye su decisión a partir de un grupo de
datos de entrenamiento de la misma forma en que lo hace ID3, pero
fundamentándose en la entropía de la información, esta característica permite elegir
el mejor atributo para formar el árbol y algo no menos importante es la ganancia la
cual corresponde a la diferencia entre el estado actual y el siguiente estado luego
de aplicar cierto atributo.

Después de realizar la contextualización teórica se presentaron algunos artículos


en los cuales se desarrolló la metodología C5.0 en un caso de estudio que pretendía
evaluar el crédito de los bancos el cual tenía como fin clasificar los potenciales
clientes del banco en la modalidad de crédito, continuando con la sección práctica
de la clase se realizó un ejercicio el cual involucraba el uso del software RStudio y
se establecieron pasos de desarrollo del mismo, de este modo se pudo establecer
una de las fortalezas de los modelos C5.0, y es la robustez al no presentar
problemas con el volumen de los datos ni por perdida de información en la base de
datos. Este modelo C5.0 sirve para modelos de regresión y clasificación, por ello el
Ingeniero Catastral y Geodesta puede encontrar en él una herramienta útil y fuerte
en los diferentes campos de acción, como se pudo evidenciar en el artículo expuesto
por el profesor Edwin Robert el cual se enfocó en el análisis de valor de algunas
UPZ de la ciudad haciendo uso de esta metodología.

También podría gustarte