Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PARA PROYECTOS
DE ML
LINA MARCELA ZABALA ESTRADA -ADMINISTRACION EN SALUD -5
SEMESTRE
METODOLOGIA KDD
Metodología que se compone por 5 etapas:
1. Selección
2. preprocesamiento
3. transformación
4. minería de datos
5. evaluación e implantación
PUNTO 1
METODOLOGIA KDD
Selección Reprocesamiento Transformación Minería de datos Evaluación e
implantación
Es la identificación ES la etapa de la Esta etapa permite Esta etapa tiene Esta etapa permite
del conocimiento limpieza ,permite la busqueda de como objetivo la interpretar los
relevante y analizar la calidad características útiles búsqueda y patrones
prioritario , define de los datos , se pata representar los descubrimiento de descubrieses u
las metas del seleccionan datos dependiendo patrones posiblemente
proceso KDD. estrategias de del proceso. insospechados y de retorna alas
Permite crear el manejo de datos Se usan métodos interés, aplicando anteriores etapas
conjunto de datos desconocidos , de reducción o tareas de para posterior
objeto . datos nudos datos transformación de descubrimiento iteraciones. Puede
En una etapa de duplicados y dimensiones que como clasificación . incluir visualización
descubrimiento . genera técnicas permiten simplificar de datos de
para su remplazo una tabla de una patrones extraídos
(usuario o analista) base de datos
horizontal vertical
METODOLOGIA semma
SEMMA comprende cinco fases:
1. Sample
2. Explore
3. Modify
4. Model
5. Assess
Proceso de selección, exploración y
modelamiento de grandes cantidades
De datos para descubrir patrones de
Negocios desconocidos
METODOLOGIA SEMMA
Sample Explore Modify Model Assess
Muestreo Explorar Modificar Modelo Evaluar
Respuesta:
En este momento me parece que la mejor metodología
de ML es SEMMA, permite el descubrimiento de patrones
que pueden llevar conseguir conclusiones para la toma
de decisiones.
Me interesa la facilidad de trabajar con muestras
representativas de la información objeto , lo que
permitirá generar segmentos de datos que generan
información la cual puede concluir varios hipótesis .
PUNTO 2