Está en la página 1de 4

“POR SIEMPRE RESPONSABLE DE LO QUE SE HA CULTIVADO”

MATERIA:
FUNDAMENTOS DE LA CIENCIA DE DATOS

PROFESOR:
CARLOS GRANADOS MARTIN DEL CAMPO

ACTIVIDAD 9:
CUADRO COMPARATIVO

ALUMNA:
MARÍA GABRIELA DONES SÁNCHEZ

MATRICULA:
850183103

ZAPOPAN JAL. LUNES 08 DE AGOSTO DEL 2022


1. Con base en el material consultado, elabora un cuadro comparativo en el que identifiques cada una de las
metodologías, las diferencias y posibles usos.

KDD CRISP-DM SEMMA


Knowledge Discovery in Cross-Industry Standard Sample, Explore, Modify,
Databases Process for Data Mining Model and Access
Comprensión empresarial
Selección Comprensión de datos Muestra
Procesamiento Preparación de datos Esplorar
Transformación Modificar
Procesamiento de datos Modelado Modelo
Interpretación/Evaluación Evaluación Evaluar
Despliegue
SEMMA se aprovecha como un
conjunto de herramientas organizado
Se trata de un modelo estándar y funcional Si bien es cierto que el
Consiste en un proceso para analizar abierto del proceso que describe los proceso SEMMA es más ambiguo para
patrones que responden a tres enfoques comunes que utilizan los aquellos que no usan la herramienta,
factores: son importantes, útiles y expertos en minería de datos. Es el la mayoría lo considera como una
entendibles. modelo analítico más usado. metodología de minería de datos
funcional en lugar de una
herramienta Específica.

Muchas empresas aplican también el El modelo de CRISP-DM es flexible y se El método de minería de datos se
KDD en áreas como la detección de pueden personalizar fácilmente. Por puede utilizar para resolver una
fraudes, telecomunicaciones, ejemplo, si su organización intenta amplia gama de problemas
manufactura y más. Al igual que el detectar actividades de blanqueo de comerciales, incluida la identificación
data mining, existen herramientas dinero, es probable que necesite de fraudes, la retención y rotación de
digitales o programas que ayudan con realizar una criba de grandes clientes, el marketing de bases de
la organización de los datos. Pero el cantidades de datos sin un objetivo datos, la lealtad del cliente, la
KDD requiere de la intervención de la de modelado específico. En lugar de previsión de bancarrota, la
lógica y el análisis humano realizar el modelado, su trabajo se segmentación del mercado, así como
Indispensablemente para encontrar centrará en explorar y visualizar datos el análisis de riesgos, afinidad y
patrones en la información para descubrir patrones sospechosos cartera.
en datos financieros. CRISP-DM
permite crear un modelo de minería
de datos que se adapte a sus
necesidades concretas.
La finalidad del KDD es la
interpretación de patrones, modelos y
un profundo análisis de la información La diferencia clave es que cualquier SEMMA se centra en las tareas de
que una organización ha reunido para etapa del modelo puede tener modelado de proyectos de minería
así tomar mejores decisiones. Mientras retorno o iniciar una reversa al de datos, dejando fuera los aspectos
que la minería de datos de por sí no método. Si durante la etapa en comerciales a diferencia, por
necesita abundante investigación en particular el especialista encontró que ejemplo, de CRISP-DM y su fase de
el área en la que se gestiona sino solo los datos no son suficientes para comprensión empresarial.
conocimiento técnico, esta técnica resolver su objetivo, puede regresar a
requiere evaluar a detenimiento datos cualquiera de las otras etapas.
observables.

2. Con base en la información de los videos, menciona un ejemplo de la metodología de la ciencia de datos que usarías
para la creación de un modelo básico en una empresa de ecommerce (menciona la empresa, metodología y justifica
tu elección de metodología).

SEMMA (Sample, Explore, Modify, Model and Access)

En la actualidad la mayoría de las organizaciones tomaron el ecommerce como una nueva modalidad para desplazar
productos, en este caso sería una empresa que se dedica a la distribución de ropa, calzado y accesorios (Grupo Axo).
Las empresas utilizan los datos para lograr una ventaja competitiva, mejorar el rendimiento y ofrecer servicios más útiles
a los clientes. Los datos que se recopilan sobre nuestro entorno sirven como base para hipótesis y modelos del mundo en
el que vivimos. En última instancia, los datos se acumulan para ayudar a recopilar conocimiento. Eso significa que los
datos no valen mucho hasta que se estudian y analizan. Pero acumular grandes volúmenes de datos no es equivalente
a recopilar conocimientos valiosos. Es solo cuando los datos se ordenan y evalúan que aprendemos algo de ellos. Por las
características que tiene SEMMA, es la mitología que más se adapta a las necesidades de la empresa elegida, con la
base de datos que se maneja se puede realizar un modelo de negocios muy bien estructurado con la ayuda de su CRM
que maneja por excelencia.

Referencias.
• Credenciales Alternativas TEC (2019). Metodologías para la ciencia de datos [Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=5Ae1Riq_j4M&t=3s
• AddKw (14 mayo 2020). Metodología para proyectos de Data Science y Minería de Datos - CRISP-DM [Archivo de
video]. Recuperado de https://www.youtube.com/watch?v=E0XTArOciF0&t=241s
• Programación y más. (20 septiembre 2019). Introducción al Modelamiento de Datos [Archivo de video].
Recuperado de: https://www.youtube.com/watch?v=xK5LdoU8kAk
• Excel y Más. (15 octubre 2019). Creando un modelo de datos [Archivo de video]. Recuperado de:
https://www.youtube.com/watch?v=C0eb4_JGmFk
• Ecomaster. (11 mayo 2016). BIG DATA en Ecommerce. Modelos Predictivos de Consumo y Segmentación mediante
Técnicas Analíticas [Archivo de video]. Recuperado de: https://www.youtube.com/watch?v=F7WIqT7ZxO8
• Ecomaster (21 julio 2020). BIG DATA en Ecommerce [ejemplo de aplicación real Data Mining] Análisis de datos de
tiendas online [Archivo de video]. Recuperado de https://www.youtube.com/watch?v=3hLUD9V6-7s
• 4 Metodologías para proyectos de Data Science – INVESTIGACIÓN DATLAS – Blog Datlas (wordpress.com)

También podría gustarte