Está en la página 1de 8

Universidad Laica Eloy Alfaro de Manabí 

     Apellidos y nombres


 
Loor Mendoza kevin José 
  
Nivel
  
  Quinto Semestre 

Paralelo
  
“B” 

Materia
  
Minería de datos   

Tema 

Metodologías y Modelos de Proyectos de Minería de Datos


    
Docente 

ING. Fabricio Rivadeneira

Periodo lectivo 
2023(1) 

MANTA 2023

 
Contenido
1. Introducción.........................................................................................................................3
2. Selección de metodologías o modelos.................................................................................4
Figura 1. Fase (Romero, 2019)..................................................................................................4
figura 2. Actividades de las fases. Tomado de (Guzmán).........................................................5
Figura 3. Fases (Rodriguez Montequin)....................................................................................6
figura 4. Actividades tomado de (Guzmán)..............................................................................7
3. Establecer comparaciones (similitudes y diferencias)..........................................................7
4. Establecer ventajas y desventajas cada metodología...........................................................7
5. Referencias...........................................................................................................................8
6. Bibliografía...........................................................................................................................8
1. Introducción
La minería de datos es el arte de extraer información valiosa de grandes cantidades de
datos para obtener mejores decisiones.
La extracción de esta información útil es un proceso complejo, así que, se requiere de
metodologías estructuradas para la utilización ordenada de las herramientas y técnicas
disponibles.
Así que, en las últimas décadas del desarrollo tecnológico, se presenta estas
metodologías en la que se puede definir el Data Mining como: el conjunto de técnicas y
herramientas aplicadas al proceso no trivial de extraer y presentar conocimiento
implícito, previamente desconocido.
Sin embargo, la minería de datos también enfrenta desafíos importantes como: la
privacidad y seguridad de los datos, la calidad de los datos, la interpretación y
comunicación de los resultados obtenidos. Por lo cual, es importante contar con
profesionales capacitados y éticos que puedan abordar estos desafíos de manera efectiva
y responsable.
En este informe obtendremos metodologías utilizadas por los analistas de Data Mining:
CRISP-DM Y SEMMA.
2. Selección de metodologías o modelos.
CRISP-DM (Cross Industry Standard Process for Data Mining; Abierta 2000).
Es una Metodología de Minería de Datos para Desarrollo del proyecto analíticos, esta se
explica como un proceso jerárquico que son:
- Fase.
Análisis de los datos: obtención de los datos para familiarizarse con ellos.
Preparación de los datos: construir el conjunto de datos final donde se aplicará los
modelos.
Modelado: varias técnicas de modelado son seleccionados y aplicadas y sus parámetros
son calibrados en valores óptimos.
Evaluación: evaluar el rendimiento de este y la integridad de todos los pasos.
Desarrollo: obtención de conocimiento a partir de los datos.

Figura 1. Fase (Romero, 2019)


-Tareas generales.
-tareas específicas.
figura 2. Actividades de las fases. Tomado de (Guzmán)
-instancias de proceso.

SEMMA (Sample – Explore – Modify – Model – Assess; SAS, 2002).


Se emplea técnicas estadísticas de exploración y visualización, se seleccionan y
transforman variables, se modela con las variables para predecir los y se evalua la
exactitud del modelo.
Figura 3. Fases (Rodriguez Montequin)
Muestreo de los datos: contiene la información relevante que a la vez es rápido de
manipular, por razones de costos y rendimiento SAS aboga por una estrategia de
muestreo fiable, estadísticamente representativa de la fuente de los datos origen.
Exploración de datos: se utiliza técnicas visuales, estadísticas incluyendo análisis
factorial, análisis de correspondencia y la segmentación.
Modificación de datos: selección y transformación de las variables para dirigir el
proceso de modelado.
Modelado de datos: los algoritmos programados buscan automáticamente un
subconjunto de datos que predice con cierta confianza los resultados esperados.
Evaluación de datos: se observa la fiabilidad y se calcula la eficiencia de los modelos.
figura 4. Actividades tomado de (Guzmán)

3. Establecer comparaciones (similitudes y diferencias).


CRISP-DM SEMMA
Similitud se encuentran se encuentran
interrelacionadas entre sí, interrelacionadas entre sí,
convirtiendo el proceso de convirtiendo el proceso de
Data Mining en un proceso Data Mining en un proceso
iterativo e interactivo. iterativo e interactivo.

Diferencia Es una metodología abierta. Es una metodología cerrada.

mantiene una perspectiva se centra más en las


más amplia respecto a los características técnicas del
objetivos empresariales del desarrollo del proceso,
proyecto. mientras que la
metodología.

4. Establecer ventajas y desventajas cada metodología


Ventajas Desventajas
CRISP-DM Es la integración de la Tampoco se encuentran en
creación de un modelo con otras fases de la
el entendimiento del metodología actividades
negocio específicas del desarrollo
reduce la complejidad y software del producto,
contribuye a que el cliente como serían aspectos
tenga una mayor relacionados con la
comprensión y control de arquitectura de sistemas o
todo el proceso. la visualización e
interacción con el usuario.
Es muy útil de cara
a explicar la gestión del
proyecto al cliente
SEMMA Muestra comprensión

5. Referencias
6. Bibliografía
Guzmán, E. L. (s.f.). Módulo mineria de Datos. universidad nacional de colombia.
Obtenido de
https://disi.unal.edu.co/~eleonguz/cursos/md/presentaciones/Sesion5_Metodolog
ias.pdf
Rodriguez Montequin, M. T. (s.f.). METODOLOGÍAS PARA LA REALIZACIÓN DE
PROYECTOS. universidad oviedo. Obtenido de
https://www.aeipro.com/files/congresos/2003pamplona/ciip03_0257_0265.2134
.pdf#:~:text=Los%20proyectos%20de%20Data%20Mining%20tienen%20por
%20objetivo,y%20eficiente%20de%20las%20t%C3%A9cnicas%20y
%20herramientas%20disponibles.
Romero, J. (11 de junio de 2019). jorgeromero . Obtenido de jorgeromero:
https://jorgeromero.net/metodologias-de-mineria-de-datos/

También podría gustarte