Está en la página 1de 5

MDEISW - Maestría en Dirección Estratégica en Ingeniería de

Software.

SOLUCIÓN DE
CASO PRÁCTICO
TI016 - Business Intelligence y Gestión Documental

“Metodología CRISP-DM”
Ing. Omar Orlando Orrala Palacios
25-5-2019
Solución de caso práctico MDEISW - TI016

Introducción

CRISP-DM inicia como un proyecto a mediados de 1997 con el auspicio de la Comisión Europea,
Uno de los patrocinadores más importantes es Daimler Chrysler, ahora parte de SPSS.

CRISP-DM, cuyas siglas en ingles son: Cross-Industry Standard Process for Data Mining, es un
método cuyo objetivo fue el de diseñar una metodología estándar para el modelamiento de
proyectos de minería de datos o Data Mining; completamente flexible e independiente del tipo de
industria, permite un proceso de desarrollo rápido, barato, administrable y confiable y sin límites
en el tamaño del proyecto.
Como metodología, incluye descripciones de las fases normales de un proyecto, las tareas
necesarias en cada fase y una explicación de las relaciones entre las tareas.
Como modelo de proceso, CRISP-DM ofrece un resumen del ciclo vital de minería de datos que
integran 6 fases:
1. Comprensión del negocio
2. Comprensión de los datos
3. Preparación de los datos
4. Modelado
5. Evaluación
6. Implementación

1. ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para


cumplir el primer paso de la metodología CRISP-DM?

El primer paso de CRISP-DM consistió en la comprensión del negocio, que desde una perspectiva
de investigación, consultado de José Supo, (2016), manifestó que esta fase, se basa en conocer la
línea de investigación del proyecto, el propósito u objetivo específico en estudio, siendo en
investigación científica los objetivos operativos.
En concordancia con Jackson, (2002), el primer paso consiste en el ENTENDIMIENTO DE
NEGOCIOS, que se enfocó en concebir los objetivos y requisitos del proyecto de una perspectiva
empresarial, para luego convertir este conocimiento en la definición del problema de minería de
datos, y en un plan preliminar diseñado para lograr los objetivos.
De manera global desde el punto de vista del negocio las acciones realizadas consistieron en:

• Determinar los objetivos del negocio.


• Valoración de la situación.
• Determinar los objetivos del DM.
• Realizar el plan del proyecto.

ING. OMAR ORLANDO ORRALA PALACIOS 1


Solución de caso práctico MDEISW - TI016

2. ¿Cuáles fueron las acciones realizadas por el equipo de trabajo para


comprender la naturaleza de los datos involucrados en el negocio?
Para Jackson, (2002), el segundo paso consistió en la COMPRENSIÓN DE DATOS. La fase de
comprensión de datos comenzó con la recopilación de datos inicial y continuó con actividades
para familiarizarse con los datos, identificar los problemas de calidad de los datos, descubrir
primero la información sobre los datos, y detectar subconjuntos interesantes para formar hipótesis
de información oculta, estas acciones concretamente fueron:

• Recolectar los datos iniciales


• Descripción de los datos
• Exploración de los datos
• Verificar la calidad de los datos

3. Explique el proceso utilizado para acometer la preparación de los


datos en la organización.
El proceso para PREPARACIÓN DE DATOS, consistió en actividades para construir el conjunto de
datos final, desde los datos preliminares sin procesar inicialmente. Las tareas de preparación de
datos se realizaron varias veces, y no necesariamente en un orden prescrito. Las tareas incluyeron
la selección de tablas, registros y atributos, así como la transformación y limpieza de datos para
herramientas de modelado. (Jackson, 2002).

Estas actividades consistieron en:

• Seleccionar los datos


• Limpiar los datos
• Estructurar los datos
• Integrar los datos
• Formatear los datos

4. Mencione qué etapa le sigue a la preparación de los datos y de qué


modo fue realizada por el equipo de trabajo.
Le sigue la etapa de MODELAMIENTO, donde se seleccionan y aplican diversas técnicas de
modelado, los parámetros se calibran para la obtención de valores óptimos. Existieron varias
técnicas, encontrando que algunas técnicas tienen requisitos específicos sobre la forma de los
datos, por lo que a menudo es necesario volver a la fase de preparación de datos. (Jackson, 2002).

Estas tareas para el equipo consistieron en:

• Seleccionar técnica de modelado


• Generar el plan de prueba
• Construir el modelo
• Evaluar el modelo

5. ¿Cuáles fueron los algoritmos utilizados?


En este punto de la minería de datos los algoritmos consistieron en un número de operaciones
cada una de las cuales estaba soportada por una variedad de técnicas matemáticas, como redes

ING. OMAR ORLANDO ORRALA PALACIOS 2


Solución de caso práctico MDEISW - TI016

neuronales, algoritmos de segmentación conceptual, análisis de asociaciones o sistemas de


inducción de reglas. Por ejemplo, en la construcción de modelos matemáticos fue posible aplicar
regresiones lineales. Un algoritmo muy útil desde el punto de vista informático fue la posibilidad
de aplicar árboles de decisiones, considerando que, para todos estos modelos predictivos, siempre
es necesario trabajar con datos limpios, cuyas entradas fueron depuradas en la etapa preparatoria
de datos. En el estudio al no tener un supuesto de linealidad se encontró que un árbol de regresión
lineal múltiple una versión no paramétrica resultó ser una alternativa para resolver los asuntos
estructurales. A manera de recomendación se determinó que para cumplir con el propósito de la
investigación o del punto de vista del negocio, siempre fue necesaria la revisión del modelo que
mas se adapte a los fines propuestos, encontrando persistentemente necesario afinar el modelo
hasta encontrar uno que tenga la mayor capacidad predictiva.

6. ¿De qué forma se logró garantizar la fase de evaluación en el


proyecto?

En esta fase, el modelo se presentó bastante depurado y con una buena calidad desde la
perspectiva del análisis de datos. Antes de seguir con el paso de divulgación del modelo fue
necesario evaluarlo nuevamente tomando en consideración los diferentes pasos que se ejecutaron
para la consecución del mismo. Con esto se aseguró que el modelo realmente cumplió en
satisfacer las necesidades y objetivos planteados por el negocio. Una forma de determinar esto
fue verificando si existía algún requerimiento importante del negocio que no había sido cubierto
completamente por el modelo. Luego de que fue validado el modelo se procedió con la toma de
la decisión del uso de los resultados obtenidos por el mismo. Aun así, siempre se podrá
perfeccionar el modelo.

Las acciones que se cumplieron fueron:

• Evaluar los resultados, es decir se evaluó la capacidad predictiva del modelo.


• Revisión del proceso, se intentó encontrar una mejor capacidad predictiva
• Determinar próximos pasos, se encontró necesario emprender acciones para afinar
detalles, que permitan conseguir el objetivo propuesto.

7. Explique brevemente la fase de implementación del proyecto.


La terminación de la creación de un modelo de minería de datos no constituyó el último esfuerzo
y peor aún la culminación del proyecto en sí. En esta fase fue necesario presentar el conocimiento
adquirido con el modelo a la organización de una forma entendible. Esto fue dado por la
implementación de reportes dinámicos que brindó la herramienta de BI, con los datos y resultados
obtenidos a partir del proceso de minería de datos. Esta fase de uso del modelo estuvo a cargo del
cliente y no del analista de los datos; para aquello el cliente conocía a cabalidad la forma en que
se debían utilizar los modelos creados.
Estas actividades fueron posibles gracias a la ejecución de las siguientes tareas:

• Plan de implementación.
• Plan de monitoreo y mantención.
• Informe final.
• Revisión del proyecto.

ING. OMAR ORLANDO ORRALA PALACIOS 3


Solución de caso práctico MDEISW - TI016

Conclusiones
La metodología CRISP-DM resulta ser concordante con el nivel investigativo, ya que sus seis
pasos pueden adaptarse a las líneas de investigación, y es compatible con el método científico:
✓ Dentro de las bases exploratoria, lo relacionamos con la comprensión del negocio.
✓ En lo descriptivo, relacional, lo relacionamos con la comprensión de los datos.
✓ En lo explicativo, realizamos la selección de variables, estamos anta la preparación de los
datos.
✓ En lo predictivo, se crea un modelo donde debemos encontrar la mayor capacidad de
predicción.
✓ En su aplicativo, evaluamos el modelo y su utilización, encontrando siempre posible el
mejoramiento de la capacidad predictiva del modelo con los tomadores de decisiones.

Bibliografía
Jackson, J. (2002). Data Mining; A Conceptual Overview. Communications of the Association
for Information Systems, 8, 267-296. https://doi.org/10.17705/1CAIS.00819
José Supo. (2016). Metodología CRISP-DM y la Investigación Científica - YouTube.
Recuperado de https://www.youtube.com/watch?v=7Op6EJVaZF4

ING. OMAR ORLANDO ORRALA PALACIOS 4

También podría gustarte