Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Diagnóstico inicial
Debemos conocer cómo puede beneficiarnos el Big Data y cuáles son los peligros y retos que pueden
presentarse.
es
d u.
.e
va
no
in
ro
Necesitamos una tecnología adecuada para el Big Data. Es imprescindible tener una infraestructura
Para nuestro proyecto debemos enfocarnos en algo que beneficie tanto a los clientes como a nuestra
pu
Debemos tener en cuenta los aspectos legales. En la recogida y tratamiento de datos personales
Muchos de los datos no son de buena calidad, ya que provienen de distintas fuentes. Los tipos de los
datos también son diferentes por lo que puede hacer la tarea aún más complicada. Para no tener
problemas y obtener los mejores resultados debemos preparar los datos con algoritmos basados en
el manejo de datos.
campus.euroinnova.edu.es
1 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
y procesamiento sistemático. Un buen diseño debe reconocer a los beneficiarios y actores claves.
Debemos especificar las estrategias posibles para afrontar un problema, justificarlas y definir los
es
d u.
.e
va
no
in
ro
eu
Como se ha indicado anteriormente el diseño debe incluir la propuesta del proyecto, la identificación
s.
Fundamentación o justificación
Marco institucional
Objetivos
Metas
campus.euroinnova.edu.es
2 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Beneficiarios
Productos
es
Humanos
u.
Físicos
Técnicos
d
.e
Financieros
Estructura financiera
Calendario financiero va
no
Cálculo de costos de ejecución y elaboración del presupuesto.
in
Factores externos condicionantes o pre-requisitos para el logro de los efectos e impacto del
eu
proyecto
s.
La fundamentación debe contener una descripción clara sobre la razón principal del proyecto,
pu
campus.euroinnova.edu.es
3 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
es
d u.
.e
va
El marco institucional se aplica al conjunto de políticas y leyes nacionales, estatales y locales que
Los métodos y técnicas a utilizar es un punto significativo ya que nos guiará sobre cómo vamos a
ro
realizar todo el proceso. Debe realizarse un estudio de las herramientas y procedimientos para ver
eu
cuáles son las más adecuadas para que se realice de la forma más sencilla y correcta.
s.
Es importante realizar una previsión adecuada de los recursos necesarios para nuestro proyecto
pu
para conseguir el mejor resultado con la mínima inversión posible. Se debe realizar un análisis de
Debemos recopilar información sobre el mayor número de persona que puedan orientarnos sobre el
ca
Hay que analizar las distintas actividades del proyecto, hacer un listado de los recursos que son
necesarios, marcar las características del recurso y establecer prioridades sobre que recursos que
son más importantes para nuestro proyecto y en caso de no lograr una financiación suficiente
campus.euroinnova.edu.es
4 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
es
d u.
.e
va
Todos los recursos que utilicemos deben presentarse en el análisis de costes para conseguir una
mobiliario, etc.
s.
publicaciones…
Metodológicos: son las técnicas que ayudan a organizar la empresa, por ejemplo técnicas de
m
Humanos: Se refiere a todas las personas contratadas para la realización del proyecto.
campus.euroinnova.edu.es
5 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
3. Proceso de implementación
Para la implementación del proyecto de Big Data podemos seguir las siguientes recomendaciones
es
d u.
.e
va
no
in
ro
En primer lugar se deben identificar las herramientas y datos que vamos a utilizar.En el diseño
hemos realizado un estudio de los datos y herramienta pero tenemos que recolectar información que
eu
eliminar datos duplicados, etiquetar y procesar nuevos tipos de metadatos. Debemos entender los
pu
Tener claro que se intenta lograr. Crear los requisitos de negocio de manera sencilla y clara es un
m
paso determinante. Sin objetivos claros es imposible planificar los tiempos y pasos específicos para
ca
finalizar el proyecto.
Contratar y localizar científicos de datos es importante para el éxito de cualquier proyecto de Big
Data, ya que estos expertos son capaces de concretar la capacidad para definir, razonar, tratar y
Debe entenderse la rápida adquisición y análisis de datos de Big Data y verificarse constantemente
campus.euroinnova.edu.es
6 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
A continuación se explica el proceso que siguen los datos hasta llegar a un resultado:
es
d u.
.e
va
no
Se extraen los datos de calidad, es decir, sin duplicados ni erróneos. Para ello se necesita un
software especializado ETL (Extract, Transform and Load – Extraer, Transformar y Cargar). La ETL
in
obtiene los datos de las diversas fuentes y sistemas, para a continuación hacer las trasformaciones
ro
pertinentes y finalmente guardar los datos en la base de datos o Data Warehouse. Un ejemplo de
eu
ETL es Pentaho Data Integration (Spoon) o Knime. A este tipo de proceso realizado por la ETL se le
denomina preprocesamiento. El preprocesamiento realiza una gran labor de limpieza de datos que
s.
los prepara para su análisis, de esta manera se obtendrá un mejor rendimiento y unos resultados
pu
más exactos.
m
Una vez obtenido los datos del preprocesado se procede al procesamiento y análisis de los datos.
ca
MapReduce es un modelo de programación de datos usado por Google en el cual en primer lugar se
divide los datos en varios bloques para posteriormente tratar estos bloques en paralelo.
para contar palabras. En primer lugar divide en bloques y proporciona a cada palabra el número. A
continuación ordena las palabras colocando las que se repiten cerca. Después cuenta las palabras
campus.euroinnova.edu.es
7 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
es
d u.
.e
va
no
MapReduce tiene limitaciones por lo que se han creado nuevas herramientas más potentes pero
in
Una vez procesados los datos necesarios y almacenados se estudia que técnica de análisis de datos
campus.euroinnova.edu.es
8 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Minería de Datos (Data Mining): Descubre comportamientos predictivos. Usa machine learning
y técnicas estadísticas.
Asociación: Encuentra relaciones entre distintas variables. Se intenta localizar una predicción
intención es hallar semejanzas entre estos grupos. Es una técnica adecuada para encontrar
relaciones entre resultados y hacer una evaluación preliminar de la estructura de los datos
es
analizados.
Análisis de texto (Text Analytics): Esta técnica permite obtener información de textos y así
u.
crear temas, asuntos o predecir palabras.
d
.e
Por último queda la visualización de los datos. Los gráficos son importantes para ver a primera
va
vista cuales son las conclusiones a las que se han llegado a partir del análisis realizado. Los
resultados obtenidos deben entregarse de manera clara para que sea fácil de entender.
no
in
ro
eu
s.
pu
m
ca
campus.euroinnova.edu.es
9 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
En muchas ocasiones las cosas no salen como originalmente se planearon. Para hacer frente a los
problemas que puedan surgir durante el proyecto la monitorización de proyectos proporciona apoyo
problemas y dificultades.
es
La monitorización de un proyecto hace que se consiga un gran rendimiento gracias a la repartición
u.
del trabajo según la especialidad de cada experto. Disminuye el tiempo y el exceso de presupuesto y
d
ayuda a documentar mejor el flujo de trabajo.
.e
va
no
in
ro
eu
s.
pu
m
ca
No importa el tipo de proyecto, la monitorización y control de proyectos es vital para lograr el éxito.
La organización de todas las actividades del proyecto, tales como el cumplimiento de los plazos
establecidos, los costos, la gestión del tiempo y aspectos del rendimiento, son fundamentales para
Podemos realizar un cronograma para planificar las actividades del proyecto en un determinado
tiempo y explorar ciertos riesgos que puedan surgir durante el transcurso del mismo.
Para ello debemos llevar un control del cronograma determinando su estado periódicamente,
campus.euroinnova.edu.es
10 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
intervenir sobre los factores que crean cambios, establecer que ha cambiado y gestionar los cambios
Para el cronograma se puede realizar un plan de gestión del cronograma, una línea base del
uso de informes de avance, mediciones del rendimiento, software de gestión de proyectos, análisis
es
En el plan de Gestión del proyecto debe incluirse la definición del proyecto, el cronograma y el
d u.
.e
va
no
in
ro
eu
s.
pu
La línea base del cronograma contiene el conjunto de tareas que forman el proyecto, su
m
En los informes de rendimiento es importante recoger las fechas que se han cumplido realmente y
cuáles no. Este informe permite ver los riesgos que se presentan y afecta al cronograma establecido.
En el análisis de variaciones se comparan las fechas estimadas con las fechas reales, obteniendo así
Debe documentarse todo el proceso de monitorización debidamente para llevar un buen control
sobre el proyecto. Es interesante incluir conclusiones que puedan ayudar a mejorar nuestros
campus.euroinnova.edu.es
11 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
próximos proyectos.
Se puede realizar una monitorización sobre el control de costos del proyecto e impedir así cambios
erróneos en el costo o en el uso de los recursos. También permite intervenir para mantener los
es
d u.
.e
va
no
in
ro
Para el control de costos puede realizarse una línea base del costo, los requerimientos de
eu
rendimiento del trabajo, peticiones de cambio aprobadas, un plan de gestión, un sistema de control
s.
de cambios del costo, observaciones de cálculo del rendimiento, proyecciones, estudios del
pu
variación.
ca
El sistema de control de costos contiene las operaciones por las que el costo inicial puede ser
variado. Contiene documentación sobre las tareas, el seguimiento y las aprobaciones necesarias
En las proyecciones se estima el presupuesto necesario para finalizar el proyecto, permitiendo llevar
Estimación para concluir el trabajo = Costo Real hasta la fecha actual + Costo Estimado necesario
para la finalización.
campus.euroinnova.edu.es
12 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
En el estudio del rendimiento del proyecto se comparan las tareas finalizadas con las que no y se
verifica el costo y el cronograma para determinar si el proyecto avanza según lo esperado. Esto
proporciona un pronóstico del rendimiento del proyecto y determina una estimación de finalización.
es
d u.
.e
va
no
in
Otra monitorización interesante para nuestro proyecto es el seguimiento y control de riesgos que
ro
permite identificar y analizar riesgos, hacer un seguimiento de los mismos y estudiar la ejecución de
Para ello se puede realizar un plan de gestión de riesgos con los tiempos y recursos para la gestión,
s.
información sobre el rendimiento de las tareas. Puedes reevaluar los riesgos para identificar nuevos
m
peligros y hacer auditorias de los riesgos, realizar mediciones de rendimiento técnico (comparación
de tareas realizadas con las que no) y reuniones de equipo para conocer del estado de la situación
ca
del proyecto.
campus.euroinnova.edu.es
13 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Debemos tener un jefe de proyecto para que planifique, ejecute y controle el proyecto. Es la
persona que se encarga de impulsar el avance del mismo mediante la toma de decisiones y según los
objetivos establecidos.
Debe ocuparse de dirigir y coordinar al equipo y los recursos empleados en el proyecto. Mantiene
las relaciones externas, adopta medidas correctoras, propone modificaciones y responde ante
es
clientes y superiores.
u.
Un buen jefe de proyecto de Big Data debe:
d
.e
Dominar la tecnología usada en el proyecto para que pueda comprender los puntos clave del
va
mismo, planificar recursos y generar ideas y soluciones.
Tener una gran aptitud gestora para que sea capaz de controlar y lograr todos los objetivos del
no
proyecto.
in
ro
eu
s.
pu
m
ca
Capacidad para relacionarse, ya que será el encargado del proyecto ante clientes, otras
direcciones,...
Para la ejecución de un proyecto se necesitan una serie de recursos. Los recursos requeridos para el
campus.euroinnova.edu.es
14 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Humanos: Para comenzar cualquier proyecto hay que disponer de personal apropiado y
Físicos: Los recursos físicos generalmente incluyen varios elementos como inmuebles,
Técnicos: Incluye las técnicas elegidas y las tecnologías que se van a utilizar. Cuando un
es
de las novedades no se realice en su totalidad.
u.
Financieros: Los recursos financieros se basan en el presupuesto requerido para la realización
d
del proyecto. Cualquier acción tiene un coste que es asumido por todas las partes implicadas
.e
en su puesta en marcha.
va
no
in
ro
eu
s.
pu
m
ca
campus.euroinnova.edu.es
15 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
6. Calendarización
es
d u.
.e
va
no
La calendarización es una actividad que reparte estimaciones de esfuerzo a través de la duración
planificada del proyecto. El proyecto debe dividirse en varias tareas y asignar un determinado
in
Es importante partir el proyecto en tareas y estimar el tiempo y los recursos necesarios para
eu
terminar cada tarea. Si se organizan las tareas concurrentemente se optimiza el esfuerzo de trabajo.
s.
Es conveniente minimizar las relaciones entre las distintas tareas para evitar retrasos y establecer
pu
Siempre es recomendable tener planes de contingencia para cualquier problema que se presente.
ca
Se puede hacer uso de los diagramas de Gantt que muestran a simple vista la programación de las
Se deben realizar reuniones frecuentes con el equipo que esté trabajando en el proyecto y exponer
los resultados, evaluaciones, complicaciones que se han presentado y comparar las fechas reales con
Los proyectos con una calendarización adecuada no necesitan un seguimiento del proceso del
proyecto que lo controle constantemente, lo que conlleva que no haya tantos inconvenientes en el
campus.euroinnova.edu.es
16 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
transcurso de éste.
es
u.
d
.e
va
no
in
ro
eu
s.
pu
m
ca
campus.euroinnova.edu.es
17 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
es
d u.
.e
va
no
El alcance de un proyecto trata de definir de forma clara el objetivo que se busca con el proyecto y
Medible: Debe definirse unas medidas cuantificables que permitan valorar el progreso y la
pu
Realizable: Tiene que existir una manera que posibilite el logro del proyecto.
ca
Realista: Tiene que ser posible su alcance con los recursos y plazos disponibles.
campus.euroinnova.edu.es
18 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
es
d u.
.e
va
Es importante definir bien el objetivo porque todas las actividades que lo componen van a estar
enfocadas a lograr ese objetivo, es decir, todo lo que requiramos para el proyecto va a depender de
no
este.
in
La valoración económica del proyecto tiene como objetivo examinar los distintos tipos de costes y
ro
conveniente para el tipo de beneficio que se desea conseguir y evaluar la rentabilidad económica de
eu
económica analiza tanto los costes monetarios como los beneficios (monetarios y de tipo social).
ca
Directos: Son los gastos de inversión en bienes inmuebles, personal, etc. Se vinculan con
etc.
Valorizados: Se relacionan con alguna actividad o servicio que se presta de manera solidaria. Si
campus.euroinnova.edu.es
19 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Oportunidad: Es el coste en el que se incide por seleccionar una alternativa y desechar otras.
es
d u.
.e
va
no
in
Marginal: Es un modo de análisis que se usa para considerar la oportunidad de gastar más para
ro
Y los beneficios:
s.
Percibidos por las personas: Se refiere a los beneficios no monetarios recibidos o definidos de
pu
Es importante definir la función social preguntándonos cómo o en qué mejoramos las condiciones de
vida de las personas a las que se dirige el proyecto. Se tiene que evaluar lo invertido (dinero,
campus.euroinnova.edu.es
20 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
es
d u.
.e
va
Deben establecerse los indicadores de evaluación, es decir, definir el periodo de realización
indicador.
eu
Se diferencias tres tipos de análisis económico según las particularidades de los beneficios:
s.
establecidos en otra clase de unidades. Permite escoger entre alternativas que podrían
ca
desempeñar los mismos objetivos con distintos costes. Se usa cuando los beneficios poseen un
verificables.
estimar la rentabilidad de la actividad según métodos objetivos. Los costes y los beneficios se
miden en dinero.
campus.euroinnova.edu.es
21 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
es
d u.
.e
va
A partir del análisis de Coste-Beneficio se obtiene el flujo de Caja con el que se puede conseguir el
actual del proyecto. Si el VAN es positivo debe aprobarse el proyecto, si es negativo rechazarlo y si
ro
es 0 es indiferente.
eu
La Tasa Interna de Retorno (TIR) es un método que calcula la rentabilidad promedio anual que
produce el capital que persiste invertido en él. Se define como la tasa que iguala a cero el VAN.
s.
Cuanto mayor sea la TIR más alta será la rentabilidad estimada del negocio, y cuanto menor sea la
pu
La relación beneficio/coste (B/C) compara los costes y los beneficios con el propósito de valorar su
ca
rentabilidad. Es el cociente entre el valor actual de los beneficios entre el valor actual de los costes y
la inversión inicial.
El período de recuperación del capital o la inversión (PR) es el tiempo en que la inversión inicial se
campus.euroinnova.edu.es
22 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
8. Ejercicios Prácticos
Ejercicio 1
Ejercicio 2
Haz un cronograma o diagrama de Gantt para el diseño del proyecto realizado en el ejercicio
es
anterior.
u.
Ejercicio 3
d
.e
Define el alcance del proyecto descrito en el ejercicio 2.
va
no
in
ro
eu
s.
pu
m
ca
campus.euroinnova.edu.es
23 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Recuerda
Para la implementación del proyecto deben identificarse las herramientas y datos que vamos
es
Proceso que siguen los datos para la obtención de un resultado de Big Data:
u.
Procesado: Uso de herramientas con algoritmos del tipo MapReduce u otros.
d
Análisis: Se escoge la herramienta idónea según el proyecto ( Data Mining, Clustering,…)
.e
Visualización de los resultados.
va
La monitorización de un proyecto hace que se consiga un gran rendimiento gracias a la
repartición del trabajo según la especialidad de cada experto. Disminuye el tiempo y el exceso
no
de presupuesto y ayuda a documentar mejor el flujo de trabajo.
in
Uso de cronogramas
ro
Control de costos
Debemos tener un jefe de proyecto para que planifique, ejecute y controle el proyecto.
s.
El alcance de un proyecto trata de definir de forma clara el objetivo que se busca con el
ca
La valoración económica del proyecto tiene como objetivo examinar los distintos tipos de
Un negocio será rentable si el VAN (valor actual neto) es mayor que cero, la TIR (Tasa Interna
de Retorno) es mayor que el coste de oportunidad del capital, la relación B/C (Beneficio/coste)
campus.euroinnova.edu.es
24 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Autoevaluación
Verdadero
es
Falso
d u.
.e
2. El diseño del proyecto…
va
No es el proceso de creación de la propuesta de trabajo de acuerdo a un modelo y
no
procesamiento sistemático.
in
procesamiento sistemático
eu
la procesamiento sistemático
pu
3. El marco institucional…
m
ca
campus.euroinnova.edu.es
25 / 26
[AFO007978] Curso Online en Big Data. Análisis de Datos Masivos
[MOD007799] Big Data. Análisis de Datos Masivos
[UDI041396] Fases de un Proyecto de Big Data
Verdadero.
Falso.
es
u.
5. El propósito de la monitorización…
d
.e
No es asegurar la culminación exitosa del proyecto
va
no
es asegurar la culminación exitosa del proyecto
in
campus.euroinnova.edu.es
26 / 26