Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Minería de Datos Fases de La Metodología Crisp-Dm
Minería de Datos Fases de La Metodología Crisp-Dm
Se centra en la comprensión de los objetivos del proyecto de datamining desde un punto de vista
de negocios. Esta fase es equivalente, por lo tanto, a una fase de análisis de requerimientos de un
proyecto de desarrollo de software, y es importante, puesto que el cliente puede no tener claro
qué es lo que quiere. Las tareas ha realizar en esta fase incluyen determinar los objetivos de
negocios, evaluar la situación del proyecto en términos de recursos, restricciones y suposiciones,
determinar objetivos de datamining que traduzcan a criterios técnicos los objetivos de negocios, y
finalmente producir el plan del proyecto.
En esta fase debe construirse una base de datos, la cual debe contener todas las características
consideradas candidatas para estimar el valor de una variable que se espera predecir. Esta fase
incluye la tarea de selección de los datos a los que se va a aplicar la técnica de modelamiento, la
tarea de limpieza de los mismos de manera de alcanzar el nivel de calidad requerido por las
técnicas de datamining que se seleccionen, la tarea de construir datos adicionales, la tarea de
integrar diferentes bases de datos, y la tarea de formatear los datos. La fase de preparación de los
datos debe entregar datos que estén en un formato adecuado para la técnica de modelamiento
que se empleará en la fase siguiente. Por ello, la fase de modelamiento puede requerir volver a la
fase de preparación de datos uno o más veces.
Fase de modelamiento:
1
“Plan para enfocar las campañas bancarias utilizando datamining” Mauricio de Luca
Esta es la fase medular del proyecto de datamining y consiste en descubrir una relación entre un
conjunto de variables y una variable que se espera predecir. Contempla la selección de una técnica
de modelamiento, entre las cuales pueden mencionarse las redes neuronales artificiales, o
modelos k-medias para agrupamiento, árboles de decisión, reglas de asociación, etc. Entre sus
tareas se encuentran la selección de la técnica de modelamiento, la generación del diseño de las
pruebas del modelo, la construcción del mismo, y finalmente, la evaluación técnica a la que debe
someterse el modelo a través de criterios estadísticos.
En esta fase deberá definirse una estrategia para implementar los resultados de la minería de
datos. Incluye las tareas de planificar el despliegue del modelo, de planificar el monitoreo y la
mantención de los modelos, de generar el reporte final del proyecto, y de revisar el proyecto en
relación a evaluar lo que ocurrió correctamente y lo que necesita ser mejorado.
Gabriel Cornejo