Está en la página 1de 7

METODOLOGÍAS

PARA PROYECTOS
DE ML
LINA MARCELA ZABALA ESTRADA -ADMINISTRACION EN SALUD -5
SEMESTRE
METODOLOGIA KDD
 Metodología que se compone por 5 etapas:
1. Selección
2. preprocesamiento
3. transformación
4. minería de datos
5. evaluación e implantación

PUNTO 1
METODOLOGIA KDD
Selección Reprocesamiento Transformación Minería de datos Evaluación e
implantación

Es la identificación ES la etapa de la Esta etapa permite Esta etapa tiene Esta etapa permite
del conocimiento limpieza ,permite la busqueda de como objetivo la interpretar los
relevante y analizar la calidad características útiles búsqueda y patrones
prioritario , define de los datos , se pata representar los descubrimiento de descubrieses u
las metas del seleccionan datos dependiendo patrones posiblemente
proceso KDD. estrategias de del proceso. insospechados y de retorna alas
Permite crear el manejo de datos Se usan métodos interés, aplicando anteriores etapas
conjunto de datos desconocidos , de reducción o tareas de para posterior
objeto . datos nudos datos transformación de descubrimiento iteraciones. Puede
En una etapa de duplicados y dimensiones que como clasificación . incluir visualización
descubrimiento . genera técnicas permiten simplificar de datos de
para su remplazo una tabla de una patrones extraídos
(usuario o analista) base de datos
horizontal vertical
METODOLOGIA semma
SEMMA comprende cinco fases:
1. Sample
2. Explore
3. Modify
4. Model
5. Assess
Proceso de selección, exploración y
modelamiento de grandes cantidades
De datos para descubrir patrones de
Negocios desconocidos
METODOLOGIA SEMMA
Sample Explore Modify Model Assess
Muestreo Explorar Modificar Modelo Evaluar

Permite al Permite la Esta fase procede a Esta fase es


extracción de un exploración de la Esta fase involucra moldear el conjunto establecer una
conjunto de datos , muestra la modificación de de dato relación entre las
logrando una seleccionada , esta los datos que van permitiendo al variables objeto del
muestra fase permite el hacer ingresados al software realizar estudio y las
representativa análisis de los formato adecuado una búsqueda variables
sobre la que se va a datos, se realiza el mejorándola completa de explicativas, de
llevar el análisis . uso de definición del combinaciones de manera tal que
herramientas de mismo datos que posibiliten inferir el
IMPORTANTE visualización o ayudarán a valor de las mismas
GENERAR EL NIVEL diferentes técnicas predecir los con un nivel de
DE CONFIANZA estadísticas para la resultados confianza
exploración. esperados de determinado
manera confiable
s
REFERENCIAS DE BUSQUEDA :
 https://disi.unal.edu.co/~eleonguz/cursos/md/presentaciones/Sesion5_Metodologias.
pdf
 https://core.ac.uk/download/pdf/301040544.pdf
 https://ediciones.ucc.edu.co/index.php/ucc/catalog/download/36/40/230?inline=1
#:~:text=Etapas%20del%20proceso%20kdd,-
El%20proceso%20KDD&text=Preprocesamiento%2Flimpieza.&text=Transformaci%C3%B
3n%2Freducci%C3%B3n.&text=Miner%C3%ADa%20de%20datos%20(data%20mining).
&text=Interpretaci%C3%B3n%2Fevaluaci%C3%B3n
¿Cual metodología le parece mejor entre CRISP-
DM, KDD y SEMMA? y sustente su repuesta.

Respuesta:
En este momento me parece que la mejor metodología
de ML es SEMMA, permite el descubrimiento de patrones
que pueden llevar conseguir conclusiones para la toma
de decisiones.
Me interesa la facilidad de trabajar con muestras
representativas de la información objeto , lo que
permitirá generar segmentos de datos que generan
información la cual puede concluir varios hipótesis .
PUNTO 2

También podría gustarte