Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Inteligencia Artificial
Avanzada
Integrantes:
Anglica Espinoza
Marvin Agila
Rodrigo Granda
Introduccin
Los rboles de clasificacin, es uno de los mtodos de
aprendizaje inductivo supervisado no paramtrico
bastante utilizado, estos se destacan por su sencillez
y pueden utilizarse en diversas reas
Hay que mencionar que el anlisis de clasificacin
basados en rboles de decisin que realizan los
sistemas son tcnicas de explotacin de datos (data
mining) que consisten en estudiar grandes masas de
datos con el fin de descubrir patrones no triviales.
En este trabajo analizamos la aplicacin de algunas
tcnicas de Aprendizaje Automtico [10] a la Minera
de Datos, y en particular en los algoritmos ID3 y C4.5
desarrollados por Quinlan, pertenecientes a la misma.
Ventajas y Desventajas
HERRAMIENTAS
WEKA. Es un entorno para experimentacin de
anlisis de datos que permite aplicar, analizar y
evaluar las tcnicas ms relevantes de anlisis de
datos, principalmente las provenientes del
aprendizaje automtico. Utiliza archivos de texto
plano para describir los datos puede trabajar con
una amplia variedad de archivos de datos incluido
el suyo propio.
RAPIDMINER. Es similar a WEKA en el flujo de
conocimiento de procesos de minera de datos las
rutinas son vistas como secuencial operadores.
Utiliza XML para describir operador rboles en el
proceso de KD.
DESARROLLO
IMPLEMENTACION
Se ha escogido los siguientes datos:
Descripcin de variables.
Las variables utilizadas para la
realizacin de
anlisis de
asignacin de crditos se muestran a continuacin.
Trabajos Relacionados
Anlisis de la asignacin de Crdito. En este trabajo se
enfoca a las instituciones financieras que ofrecen productos
de crdito, enfrentan el problema de clasificar a sus clientes a
travs de un anlisis, con el fin de establecer medidas que
permitan mitigar el riesgo de crdito.
rboles de clasificacin: una metodologa para el
anlisis de crisis bancarias. En este trabajo comparamos el
poder clasificatorio del rbol construido bajo determinadas
especificaciones con el que se obtiene aplicando el anlisis
logit, en el estudio de los determinantes de las crisis bancarias
ocurridas en la ltima dcada del siglo pasado.
Rating de pequeas y medianas empresas mediante
rboles de clasificacin. En este trabajo se puede ver que
mediante el algoritmo CART como construye el rbol y clasifica
los nuevos casos de clasificacin,
como los conceptos,
principios y procedimientos para la elaboracin y aplicacin de
un modelo de calificacin de crdito haba sido plenamente
desarrollada
CONCLUSIONES
En base al anlisis realizada entre las dos
herramientas se puede observar que Rapidminer
se acopla a las necesidades del usuario en lo
referente a la visualizacin de los datos ya que
posee tres vistas Meta Data View, Data View, Plot
View.
La herramienta WEKA nicamente permite
exportar solo un formato de archivo (.arff )
mientras que Rapidminer puede
exportar
diferentes tipos de archivo como (.arff, .access,
.bibtex, .dbase, .aml(.data), .excel entre otros).
Se ah podido demostrar la gran utilidad que tiene
los algoritmos de clasificacin al aplicarla a un
caso real.
BIBLIOGRAFIA
[1] Edgar Acua ,CLASIFICACIN USANDO
ARBOLES DE DECISION visitada el 5 de mayo
del2009.
http://math.uprm.edu/~edgar/clasifall9.pdf
[2]Srta. Magdalena SERVENTE ALGORITMOS
TDIDT APLICADOS A LAMINERIA DE DATOS
INTELIGENTE FEBRERO 2002
http://laboratorios.fi.uba.ar/lsi/serventetesisingenieriainformatica.pdf
[3] Jos Manuel Rojo Abun, RBOLES DE
CLASIFICACIN Y REGRESIN,
http://estadistica.ieg.csic.es/tutoriales/PDF/Ans
werTree.pdf