Documentos de Académico
Documentos de Profesional
Documentos de Cultura
y la Minería de datos
Máster en Ingeniería Mecatrónica
Escuela Politécnica Superior
Jaén, 2023
De los datos al conocimiento
Ng & Soo. Numsense! Data science for the layman. Autoedición. 2017.
¿Cómo funciona el algoritmo Decision Tree?
@data
8,4,0.6,30,4,8,1,2,2.88,2.437
8,4,0.9,45,8,10,1.1,3,2,3.21
8,4,1.2,60,12,12,1.2,4,2.2,3.76
8,6,0.6,30,8,10,1.1,4,1.84,2.5
Crear un archivo para
WEKA desde Excel
• Excel:
– Configurar el excel con “.” en lugar de “,”
– Guardar el archivo como “csv”
• WordPad:
– Sustituir “;” por “,”
El Explorer de Weka
• Preprocess: visualización y preprocesado de
los datos (aplicación de filtros)
• Classify: algoritmos de clasificación y
regresión
• Cluster: algoritmos de agrupación
• Associate: algoritmos de asociación
• Select Attributes: selección de atributos
• Visualize: visualización de los datos por
parejas de atributos
Algoritmos más Utilizados
Según Witten, Frank y Hall (desarrolladores de WEKA), los
algoritmos más usados son:
• K-means → Clustering
• C4.5 (J48) → Clasificación
• SVM → Aprendizaje Estadístico
• Apriori → Análisis de Asociaciones
• EM → Aprendizaje Estadístico
• PageRank → Link Mining
• Adaboost → Ensemble Learning
• kNN → Clasificación
• Naive Bayes → Clasificación
• CART → Clasificación
Actividad