Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El módulo que acabas de revisar tuvo por objetivo comprender el flujo de trabajo necesario para
la implementación de un proyecto. Es de este modo que aprendimos que los proyectos de
análisis existen desde la década de los 90, donde ya se buscaba encontrar conocimiento a partir
de los datos (Knowledge Discovery in Databases). Este proceso de búsqueda de conocimiento
a partir de los datos fue normalizado en el tiempo, hasta estandarizarse en etapas concretas que
deben estar presente en todos los procesos de este tipo. El flujo de trabajo que plantea la
metodología Crisp-DM está compuesta por cinco etapas.
La primera etapa denominada comprensión del negocio, busca identificar, analizar y comprender
el problema de negocio, para así definir un problema de Data Science.
La etapa dos, señala que una vez que ya tienes identificado el problema de negocio, debemos
entender muy bien los datos con que vamos a resolver el problema, para lo cual es necesario
identificar las fuentes de información y hacer análisis de disponibilidad.
La tercera etapa consiste en capsular, almacenar y preparar los datos para poder hacer los
análisis. Los pasos para seguir son: Adquisición y registro, proceso de formateo y construcción
de variables, integración de datos, calidad del dato y limpieza, construcción de variables y el
análisis exploratorio de datos.