Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyecto de análisis de
datos
1. ¿Qué pasos debería tener un
proyecto de Análisis de Datos?
2. ¿Qué metodología se puede
seguir para dicho proyecto?
3. ¿Qué tipo de planificación
debe hacerse en este tipo de
proyectos?
4. Específicamente ¿Una
iniciativa de Data Science
debería de abordarse como
un proyecto o como una
iniciativa de investigación y
http://www.datascience-pm.com/managing- desarrollo (R&D)?
data-science-as-a-research-effort/
2
Facultad de Ingeniería
4
Facultad de Ingeniería
6
Facultad de Ingeniería
Descubrimiento
Data Analystics Lifecycle
Phase 1 Discovery
Descubrimiento
Data Analystics Lifecycle
Phase 1 Discovery
Descubrimiento
Data Analystics Lifecycle
Phase 1 Discovery
• También es
importante que
se defina la
problemática con
los interesados,
articular en
específico los
puntos críticos
del proyecto y los
objetivos que se
desean cumplir,
así como también
resultados
medibles para
cada uno de
estos.
9
Facultad de Ingeniería
Descubrimiento
• El rol, sobre todo para el Data Scientist, conlleva mucha interacción con el
cliente y sus expectativas, esto es crucial ya que entre más logre entender
los resultados que el negocio espera, sabrá si va o no por buen camino.
10
Facultad de Ingeniería
Descubrimiento
Data Analystics Lifecycle
Phase 1 Discovery Por último, dado
que se hace
mucha prueba y
error, es
importante
formular hipótesis
y preguntas que
se desean
responder, ya que
una vez se
obtengan
resultados se
puede comprobar
si la hipótesis era
válida o no.
12
Descubrimiento
Data Analystics Lifecycle
Phase 1 Discovery
Facultad de Ingeniería
Preparación de data
Data Analystics Lifecycle (Continued)
Phase 2: Preparation Esta es una de
las fases que
consume la
mayor cantidad
del tiempo (o la
que más
consume) dado
que aquí se debe
acomodar la
información para
su análisis y los
procesos,
herramientas y
recursos para
realizar el
procesamiento
de la
información.
13
Facultad de Ingeniería
Preparación de data
Data Analystics Lifecycle (Continued)
Phase 2: Preparation
• Esta parte es
sumamente
importante, ya
que si no se
cuenta con una
buena calidad de
la información, es
prácticamente
imposible
continuar con las
siguientes fases.
14
Facultad de Ingeniería
15
Facultad de Ingeniería
En esta parte
es importante
entender qué
modelos son
los que se
adaptan mejor
a la calidad de
la información.
16
Facultad de Ingeniería
17
Facultad de Ingeniería
18
Facultad de Ingeniería
19
Facultad de Ingeniería
20
Facultad de Ingeniería
20
Facultad de Ingeniería
21
Facultad de Ingeniería
22
Facultad de Ingeniería
Poner en marcha
Data Analystics Lifecycle
Phase 6: Operationalize
La última fase
consiste en poner
en marcha el
modelo,
empezando por
un piloto y luego
evaluar los
resultados que
este ha dado,
manteniendo un
monitoreo sobre
la exactitud del
mismo a lo largo
del tiempo.
23
Facultad de Ingeniería
Fase 2 ? ?
Fase 3 ? ?
Fase 4 ? ?
Fase 5 ? ?
Fase 6 ? ?
24
Facultad de Ingeniería
27
Facultad de Ingeniería