Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase Diplomado DS UC MetodologiÌ A DS 24 04 2023 V2
Clase Diplomado DS UC MetodologiÌ A DS 24 04 2023 V2
Fundamentos de la ciencia
de datos / Metodologías
para proyectos Data Science
f.berna@uc.cl
/franciabernasanchez
Objetivos clase 24-04-2023
datos.
• KDnuggets es una fuente común para el uso de la metodología de minería de datos. Cada
una de las encuestas en 2002, 2004, 2007 planteó la pregunta: "¿Qué metodología
principal está u9lizando para la minería de datos?", y la encuesta de 2014 amplió la
pregunta para incluir "...para análisis, minería de datos o proyectos de ciencia de datos".
150-200 encuestados respondieron a cada encuesta.
Regional distribution of
voters was
• US/Canada, 45.5%
• Europe, 28.5%
• Asia, 14%
• Latin America, 9.5%
• Other, 2.5%
INTRODUCCIÓN
*Proceso referencial
Proceso Proyecto DS (1/6)
Sistemas y aplicaciones
Búsquedas en Internet
Datos de organizaciones y
empresas
Proceso Proyecto DS (3/6)
Paso 3: Procesar los datos
• Esto incluye la transformación de los datos primarios en datos directamente u7lizables en los
modelos. Para conseguirlo, se detectarán y corregirán diferentes 7pos de errores en los datos
y se fusionarán o combinarán datos de diferentes fuentes, normalizando, agrupando etc.
• Si se ha completado este paso con éxito, se puede seguir avanzando hacia la visualización y
modelado de datos.
Proceso Proyecto DS (4/6)
Paso 4: Exploración de los datos
El cuarto paso es el de la exploración de datos. El obje7vo de este paso es obtener una
comprensión profunda de los datos. Hay que buscar patrones, correlaciones y desviaciones
basadas en técnicas visuales y descrip7vas. Los conocimientos adquiridos nos permiten
comenzar a modelar.
Proceso Proyecto DS (5/6)
Paso 5: Construcción del modelo o modelado de datos
http://datascience.uc.cl
f.berna@uc.cl
/franciabernasanchez