Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
Estas tareas basadas en arboles de decisión son unas de las más utilizadas ya que poseen
unos modelos que por su simplicidad se les facilidad su entendimiento. En realidad, para
hallar esta métrica no se necesitan datos, sino las estadísticas reunidas de los registros en
los cuales se combinan los atributos en condición de atributos clases con los algoritmos de
clasificación de árboles los cuales son: ID3, C4.5, Y CART.
Abstract
These tasks based on decision trees are one of the most used ones because they have some
models that by their simplicity they ease their understanding. In fact, to find this metric no
data is needed, but the collected statistics of the records in which the attributes are
combined in the condition of attributes classes with tree classification algorithms which are:
ID3, C 4.5, and CART.
Introducción
El conjunto de ejemplos deberá estar conformado por una serie de tuplas de valores, cada
uno de ellos denominados atributos, en el que uno de ellos, ( el atributo a clasificar ) es el
objetivo, el cual es de tipo binario ( positivo o negativo, sí o no, válido o inválido, etc. ).
De esta forma el algoritmo trata de obtener las hipótesis que clasifiquen ante nuevas
instancias, si dicho ejemplo va a ser positivo o negativo.
Los elementos son: Nodos: Los cuales contendrán atributos, Arcos: Los cuales contienen
valores posibles del nodo padre, Hojas: Nodos que clasifican el ejemplo como positivo o
negativo. “
“La minería de datos consta de diferentes tareas, cada una de las cuales puede considerarse
como un tipo de problema a ser resuelto por un algoritmo de minería de datos, afirma
Adamo (2001) y Hernández, Ramírez & Ferri (2005), donde la tarea de clasificación por
arboles de Decisión es una de ellas.
Se han propuesto varias alternativas para dar con las soluciones para aquellos problemas.
Para Wang, lyer & Scott (1998), el cálculo del valor de la métrica que permite seleccionar,
en cada nodo, el atributo que tenga una mayor potencia para clasificar sobre el conjunto
de valores del atributo clase, es la parte más costosa del algoritmo utilizado. Los algoritmos
ID3 (Quinlan, 1986) y c4.5 (Quinlan, 1993) utilizan como métrica, para seleccionar el
atributo candidato en cada nodo del árbol, la reducción de la entropía denominada
ganancia de información, Para el cálculo de estas métricas, no se necesitan los datos en sí,
sino las estadísticas acerca del número de registros en los cuales se combinan los atributos
condición con el atributo clase. Un operador algebraico relacional para clasificación basado
en arboles de decisión debe facilitar estas combinaciones, que conjuntamente con
operadores agregados, permita el cálculo de estas métricas. “
Materiales y métodos
Descripción: Conceptos
-Caso 2: En este caso se usa el modelo para clasificar. Inicialmente, se estima la exactitud
del modelo utilizando un conjunto de tuplas de la base de datos, generalmente
diferente al de entrenamiento, cuya clase es conocida, denominado conjunto de
prueba, según afirman Witten & Frank (2000). A cada tupla de este conjunto, consideran
Han & Kamber (2001), se le denomina ejemplo de prueba.
1.2 Clasificación de los árboles de decisión
La clasificación por aboles de decisión es, probablemente, el modelo más utilizado y por
su simplicidad y facilidad para su entendimiento, de acuerdo con Han & Kamber (2001)
y Sattler & Dunemann (2001). El conocimiento obtenido en el proceso de aprendizaje
se representa mediante un árbol en el cual cada nodo interior contiene una pregunta
sobre un atributo concreto (con un hijo por cada posible respuesta) y cada hoja se
refiere a una decisión (una clasificación). Durante la etapa de construcción del árbol, en
forma recursiva, cada conjunto de datos se divide en subconjuntos de acuerdo a un
criterio de particionamiento es la parte de la construcción del árbol que mayor tiempo
consume (Sattler & Dunemann, 2011).
3. Pruebas
Se realizaron 3 pruebas para los diferentes tipos de algoritmos, ID3, C4.5, Y CART.
ID3
C4.5
CART
5. Discusión o análisis de resultado
En esta fase podemos ver la importancia de los algoritmos en los procesos de
clasificación, generación de árboles a la hora de tomar la mejor decisión en
clasificación. implementando métodos y técnicas para la realización de procesos
inteligentes, representando así el conocimiento y el aprendizaje, con el propósito de
automatizar tareas.
6. Conclusión
Es de mucha importancia conocer los Algoritmos como arboles de decisión, en el
área de inteligencia artificial, ya que nos ofrecen unos excelentes métodos de
clasificación y toma de decisiones muy exactas en cuanto a los procesos que
requerimos.
7. Agradecimientos
Ante mano agradecerles a las fuentes como internet (google, wiki,) y otras fuentes
por permitirle conseguir la información requerida para poder desarrollar este
articulo
8. Referencias Bibliográficas
httpwww.itnuevolaredo.edu.mxtakeyasapuntesInteligencia%20ArtificialApuntestar
eas_alumnosC4.5C4.5(2005-II-B).pdf
http://www.sc.ehu.es/ccwbayes/docencia/mmcc/docs/t10arboles.pdf
Mitchell, T.M. Machine Learning (McGraw-Hill, 1997)
https://www.uv.es/capgeminiuv/documents/UX_Sprint.pdf
http://www.itnuevolaredo.edu.mx/takeyas/apuntes/Inteligencia%20Artificial/Apu
ntes/tareas_alumnos/C4.5/C4.5(2005-II-B).pdf
http://ceal.fing.uncu.edu.ar/data_mining/Algoritmos/algoritmo1.pdf
http://mineriac45.blogspot.com/
1. Rokach, Lior; Maimon, O. (2008). Data mining with decision trees: theory and
applications. World Scientific Pub Co Inc. ISBN 978-9812771711.
2. ↑ Quinlan, J. R., (1986). Induction of Decision Trees. Machine Learning 1: 81-106,
Kluwer Academic Publishers
3. ↑ Saltar a:a b c d Breiman, Leo; Friedman, J. H.; Olshen, R. A.; Stone, C. J.
(1984). Classification and regression trees. Monterey, CA: Wadsworth &
Brooks/Cole Advanced Books & Software.
9. Anexo
9.1 Información adicional al formato