Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Paralelo
“B”
Materia
Minería de datos
Tema
Periodo lectivo
2023(1)
MANTA 2023
Contenido
1. Introducción.........................................................................................................................3
2. Selección de metodologías o modelos.................................................................................4
Figura 1. Fase (Romero, 2019)..................................................................................................4
figura 2. Actividades de las fases. Tomado de (Guzmán).........................................................5
Figura 3. Fases (Rodriguez Montequin)....................................................................................6
figura 4. Actividades tomado de (Guzmán)..............................................................................7
3. Establecer comparaciones (similitudes y diferencias)..........................................................7
4. Establecer ventajas y desventajas cada metodología...........................................................7
5. Referencias...........................................................................................................................8
6. Bibliografía...........................................................................................................................8
1. Introducción
La minería de datos es el arte de extraer información valiosa de grandes cantidades de
datos para obtener mejores decisiones.
La extracción de esta información útil es un proceso complejo, así que, se requiere de
metodologías estructuradas para la utilización ordenada de las herramientas y técnicas
disponibles.
Así que, en las últimas décadas del desarrollo tecnológico, se presenta estas
metodologías en la que se puede definir el Data Mining como: el conjunto de técnicas y
herramientas aplicadas al proceso no trivial de extraer y presentar conocimiento
implícito, previamente desconocido.
Sin embargo, la minería de datos también enfrenta desafíos importantes como: la
privacidad y seguridad de los datos, la calidad de los datos, la interpretación y
comunicación de los resultados obtenidos. Por lo cual, es importante contar con
profesionales capacitados y éticos que puedan abordar estos desafíos de manera efectiva
y responsable.
En este informe obtendremos metodologías utilizadas por los analistas de Data Mining:
CRISP-DM Y SEMMA.
2. Selección de metodologías o modelos.
CRISP-DM (Cross Industry Standard Process for Data Mining; Abierta 2000).
Es una Metodología de Minería de Datos para Desarrollo del proyecto analíticos, esta se
explica como un proceso jerárquico que son:
- Fase.
Análisis de los datos: obtención de los datos para familiarizarse con ellos.
Preparación de los datos: construir el conjunto de datos final donde se aplicará los
modelos.
Modelado: varias técnicas de modelado son seleccionados y aplicadas y sus parámetros
son calibrados en valores óptimos.
Evaluación: evaluar el rendimiento de este y la integridad de todos los pasos.
Desarrollo: obtención de conocimiento a partir de los datos.
5. Referencias
6. Bibliografía
Guzmán, E. L. (s.f.). Módulo mineria de Datos. universidad nacional de colombia.
Obtenido de
https://disi.unal.edu.co/~eleonguz/cursos/md/presentaciones/Sesion5_Metodolog
ias.pdf
Rodriguez Montequin, M. T. (s.f.). METODOLOGÍAS PARA LA REALIZACIÓN DE
PROYECTOS. universidad oviedo. Obtenido de
https://www.aeipro.com/files/congresos/2003pamplona/ciip03_0257_0265.2134
.pdf#:~:text=Los%20proyectos%20de%20Data%20Mining%20tienen%20por
%20objetivo,y%20eficiente%20de%20las%20t%C3%A9cnicas%20y
%20herramientas%20disponibles.
Romero, J. (11 de junio de 2019). jorgeromero . Obtenido de jorgeromero:
https://jorgeromero.net/metodologias-de-mineria-de-datos/