Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asesor:
Marco Antonio, Bazalar Herrera
Lima - Perú
2017
2
………………………….
Presidente
Isabel Juana, Guadalupe Sifuentes
………………………….
Jurado 1
Samuel Alonso, Oporto Díaz
…………………………
Jurado 2
Percy, Diez Quiñones Panduro
…………………………………… ………………………………………
Graduando Asesor de Tesis
Katia Elizabeth, Garvich San Martín Marco Antonio, Bazalar Herrera
3
DECLARACIÓN DE AUTENTICIDAD
Yo, Katia Elizabeth Garvich San Martín, identificada con DNI N° 45508147 Bachiller del
Programa Académico de la Carrera de Ingeniería Informática y Sistemas de la Facultad
de Ingeniería de la Universidad San Ignacio de Loyola, presento mi tesis titulada:
Propuesta de análisis de datos no estructurados para generar decisiones oportunas en la
empresa GMD.
Declaro en honor a la verdad, que el trabajo de tesis es de mi autoría; que los datos, los
resultados y su análisis e interpretación, constituyen mi aporte. Todas las referencias han
sido debidamente consultadas y reconocidas en la investigación.
……………………………………………
Katia Elizabeth, Garvich San Martín
DNI N° 45508147
4
EPÍGRAFE
La información es la gasolina del sigo XXI
y el análisis de datos es el motor de
combustión.
ÍNDICE GENERAL
DEDICATORIA 10
AGRADECIMIENTOS 11
RESUMEN 12
ABSTRACT 13
INTRODUCCIÓN 14
IDENTIFICACIÓN DEL PROBLEMA 15
FORMULACIÓN DEL PROBLEMA 19
Problema General 19
Problemas específicos 19
MARCO REFERENCIAL 21
Antecedentes Internacionales 21
Antecedentes Nacionales 25
Estado del Arte 26
Marco Teórico 30
Big Data. 30
Características del Big Data. 30
Tipos de Datos. 34
Tipos de análisis 35
Estructura de la solución de Análisis de Datos No estructurados. 36
Cuando considerar una solución de Análisis de Datos No estructurados. 38
Beneficios de la solución de Análisis de Datos No estructurados. 39
Desafíos del Análisis de Datos No Estructurado. 41
OBJETIVOS 42
Objetivo general 42
Objetivos específicos 42
JUSTIFICACIÓN DE LA INVESTIGACIÓN 43
Justificación Teórica 43
Justificación Práctica 43
ALCANCE DEL PROYECTO 44
LIMITACIONES DEL PROYECTO 44
HIPOTESIS 45
MATRIZ DE CONSISTENCIA 46
MARCO METODOLÓGICO 48
Metodología y Enfoque 48
Paradigma 48
6
Método 49
VARIABLES 49
Variable Independiente 49
Variable Dependiente 49
POBLACIÓN Y MUESTRA 50
Población 50
Muestra 50
UNIDAD DE ANÁLISIS 50
INSTRUMENTOS Y TÉCNICAS 51
Instrumentos 51
Técnicas 54
PROCEDIMIENTOS Y MÉTODO DE ANÁLISIS 56
Procedimiento 56
Método de Análisis 56
PROPUESTA DE ANÁLISIS DE DATOS NO ESTRUCTURADOS 57
Metodología para el desarrollo de la Tesis 57
Situación actual de la organización 59
Capacidades técnicas y de negocio de GMD 59
Capacidades Técnicas. 60
Capacidades de Negocio. 61
Planeamiento del proyecto de Tesis 63
Plan de Gestión del Tiempo. 63
Plan de Gestión de riesgos. 64
Requerimientos del Proyecto 64
Requerimientos Funcionales. 65
Requerimientos No Funcionales. 66
Análisis de las Principales plataformas de Big Data 67
Presupuesto e Inversión 70
Diseño de la infraestructura 71
Plataforma de Análisis de grandes volúmenes de datos 74
Sistema Hadoop. 75
Stream computing. 75
Integración de información y Gobierno. 76
Aceleradores. 76
Interfaces de usuario. 76
Gestión de análisis y decisiones. 76
Herramientas para el análisis de grandes volúmenes de datos 77
7
InfoSphere BigInsights. 77
InfoSphere Streams. 88
InfoSphere Information Server. 92
IBM Cognos. 101
Propuesta de Análisis de Datos No Estructurados Completa 117
RESULTADOS 118
DISCUSIÓN 127
CONCLUSIONES 129
RECOMENDACIONES 131
REFERENCIAS 132
ANEXOS 134
Anexo 1: Formato de Encuesta 134
Anexo 2: Respuestas de la encuesta 137
Anexo 3: Validación de encuesta por Juicio de Expertos 144
Anexo 4: Presupuesto 146
Anexo 5: Cronograma 147
Anexo 6: Aprobación del Gerente Línea de GMD 148
Anexo 7: Uso de productos IBM Big Data sobre el Cloud de GMD 149
ÍNDICE DE TABLAS
ÍNDICE DE FIGURAS
DEDICATORIA
AGRADECIMIENTOS
RESUMEN
Hoy en día, las empresas depositan mucha confianza en la toma de decisiones que
realizan sobre sus negocios, basándose en la información que poseen sobre sus
operaciones internas y lo que ocurre en el mercado. Estas decisiones, que son tomadas
en un contexto de alta y creciente competencia, se toman cada vez más utilizando y
analizando la mayor cantidad de información que la empresa posea, dado que una
decisión errónea o tomada fuera tiempo (Es decir, cuando ya es demasiado tarde) puede
afectar significativamente a una organización.
ABSTRACT
Nowadays, companies place a lot of confidence in the decision making they make about
their businesses, based on the information they have about their internal operations and
what happens in the market. These decisions, which are taken in a context of high and
growing competition, are increasingly taken using and analyzing the largest amount of
information that the company possesses, given that a wrong decision or taken outside
time (That is, when it is too much late) can significantly affect an organization.
Decision making implies uncertainty and therefore risk. To minimize these risks it is
necessary to generate timely decisions based on an analysis of information that is efficient
and closer to the real time. Therefore, the information in a company must be clear,
precise, timely, complete, easily accessible and above all necessary and not superfluous.
For the present investigation, we will take as a case study the company GMD S.A.
(affiliated with Advent International), based on which the solution proposal for unstructured
data analysis will be elaborated, with the purpose that project managers can generate
timely and efficient decisions through real-time or near-real-time analysis of the
information corresponding to the projects.
14
INTRODUCCIÓN
En la actualidad, debido al gran avance que existe día a día en las tecnologías de
información, las organizaciones han tenido que enfrentarse a nuevos desafíos que les
permitan analizar, descubrir y entender, más allá de lo que sus herramientas tradicionales
reportan, sobre grandes y variados volúmenes de datos que se generan rápidamente;
asimismo, durante los últimos años el gran crecimiento de las aplicaciones disponibles en
internet ha sido parte importante de la generación de decisiones de negocio en las
empresas.
El presente trabajo de tesis tiene como objetivo proponer una solución de Análisis
de datos No estructurados con la finalidad de resolver la problemática sobre la
generación de decisiones oportunas en la implementación de proyectos de TI para la
empresa GMD. Durante el desarrollo de la investigación se expondrá el problema,
alcance, limitaciones, objetivos y metodología para obtener los resultados, conclusiones y
recomendaciones del estudio.
15
Para la presente tesis tomaremos como caso de estudio la empresa GMD S.A
(afiliada a Advent International), la cual se dedica al outsourcing de Procesos de Negocio
y Tecnologías de la Información (TI). El problema se centra en la falta de herramientas
para la extracción, procesamiento, análisis y visualización de grandes volúmenes de
datos no estructurados correspondientes a la fase de Implementación de los proyectos;
causando que dicha información no sea analizada y utilizada de la manera más rápida y
eficiente por los gerentes de proyectos, para generar decisiones oportunas. Es decir: “La
toma de decisiones, no está sustentada en un análisis de información que incluya datos
no estructurados, con la finalidad de minimizar los costos de los proyectos y generar
decisiones oportunas durante la implementación de los proyectos de GMD”. Como
consecuencia de este problema, se crean sobrecostos, pérdida de oportunidades de
negocio e insatisfacción en los clientes.
Problema General
Problemas específicos
Retraso en el análisis
de información
Causas
MARCO REFERENCIAL
Antecedentes Internacionales
realizaron dos casos de estudio, el primero sobre los participantes de un show de música
en el cual se analizaron los tweets recolectados del Twitter y el segundo sobre una
página de internet sobre retail en el cual el análisis de grandes volúmenes de datos no
estructurados requería un poder computacional. Como resultado de los casos de estudio,
el análisis de datos no estructurados actuó como medio para la creación de Valor pues
ofrecía ventajas significativas para el cliente. Asimismo, mejoró la eficiencia de las
transacciones que se realizaban entre la página web y sus clientes a través de la mejora
en la actividad de búsqueda. En conclusión, el análisis de datos no estructurados puede
crear valor en dos formas: Mediante la mejora en la eficiencia de las transacciones y
soportando la innovación al crear nuevos o mejores productos y servicios en una
organización.
Antecedentes Nacionales
En la universidad UPC (Perú), Mérida Fonseca y Ríos Alvarado (2014), realizaron una
investigación sobre una propuesta de plataforma de Big Data orientado al sector
turístico. El objetivo de esta investigación fue aprovechar el análisis de grandes
volúmenes de datos, en los procesos del sector turístico e identificar en tiempo real la
necesidad de los clientes. Para esta investigación se utilizó como metodología un
enfoque cualitativo para la descripción de los procesos. Asimismo, se consideraron, en el
análisis, las plataformas Oracle y Microsoft.
Como resultado, presentaron la propuesta de una plataforma de Big Data que ofrece
procesos para la extracción de data (estructurada y No estructurada), procedimientos
para el procesamiento de datos y procesos para la gestión de información. En
conclusión, los procesos internos del Sector turístico pueden ser aprovechados como
fuentes de información para permitir un análisis más profundo de las características de
los consumidores y clientes potenciales.
26
En la actualidad los datos se han vuelto el activo más valioso para las empresas, pues
cada vez más organizaciones se encuentran almacenando, procesando y extrayendo
valor de grandes volúmenes de datos de diferentes tipos y tamaños; es decir, las
empresas están buscando la forma de explotar todo el potencial de los datos para poder
mejorar la toma de decisiones y obtener mayores ventajas competitivas. Al respecto,
Gartner predijo que los datos empresariales crecerían un 800% desde el 2011 hasta el
2015, con 80% de los datos en formato no estructurado (por ejemplo, correos
electrónicos, documentos, vídeos, imágenes y contenido de medios de comunicación
social) y el 20% en formato estructurado (por ejemplo, transacciones de tarjetas de
crédito e información de contacto).
Componentes de la
Funcionalidad Descripción de la funcionalidad Producto IBM
plataforma
Marco Teórico
Big Data.
Existe mucha confusión sobre la definición de Big Data, al respecto podemos decir
que el término Big Data aplica a toda aquella información que no puede ser
procesada o analizada usando las herramientas o procesos tradicionales
(Zikopoulos, Eaton y Deroos, 2012). En consecuencia, las organizaciones de hoy
deben enfrentarse continuamente a los retos que implica el análisis de Big Data,
pues si bien tienen acceso a un gran volumen de información, no saben cómo
obtener valor de ella. Esto se debe a que la información se presenta en forma
cruda o en formatos semiestructurados o no estructurados; por lo tanto, como
resultado, no saben si vale la pena mantenerla.
La era del Big Data está en plena vigencia, debido a que el mundo está
cambiando; es decir, hoy en día somos capaces de percibir más cosas y en
consecuencia tendemos a tratar de almacenarla. Asimismo, mediante los avances
en comunicaciones, las personas y cosas se están volviendo cada vez más
interconectadas y no sólo por un tiempo sino casi todo el tiempo. Esta
interconectividad es la responsable de las altas tasas de crecimiento de datos.
Finalmente, debido a que los pequeños circuitos integrados son ahora tan baratos,
podemos agregar inteligencia a casi todo.
Según Mitchell, Locke y Wilson (2012), existen 3 características que definen el Big
Data y son llamadas el modelo de las 3V (Volumen, Velocidad y Variedad), juntas
estas características definen lo que es el Big Data, dado que han creado la
necesidad de nuevas y mejores capacidades para aumentar las cosas que
podemos hacer hoy, con la finalidad de proveer un mejor control y habilidad sobre
el conocimiento existente.
Volumen.
Se refiere al hecho de que Big Data implica analizar grandes cantidades de datos
que se generan cada segundo en el mundo digital y que son creados por la
interacción de personas, máquinas, redes, entre otros.
Por otro lado, mientras que la cantidad de data disponible para las
empresas va en aumento, el porcentaje de data que puede ser procesada,
comprendida y analizada disminuye, creando de este modo una zona ciega “The
blind zone”. Esta zona ciega es algo desconocido y puede significar un problema o
una oportunidad dependiendo del punto de vista. Finalmente, el tema sobre los
volúmenes de data está evolucionando de “Terabytes” hacia “Petabytes” e
inevitablemente seguirá hacia “Zettabytes” y toda esta información ya no podrá ser
almacenada ni procesada en los sistemas tradicionales pues no cuentan con las
capacidades necesarias (Zikopoulos, Eaton y Deroos, 2012).
Velocidad.
Se refiere a la velocidad con la cual la data es generada y actualizada. Asimismo,
en el mundo del Big Data la rapidez en el análisis de datos es uno de los factores
claves, debido a que tradicionalmente el análisis se realizaba sobre data histórica.
Big Data ha ampliado este concepto incluyendo el análisis en tiempo real.
Variedad.
Se refiere al hecho de que Big Data puede ser generada a través de diferentes
orígenes o fuentes y en varios formatos y estructuras. Con la explosión de
sensores, dispositivos inteligentes, redes sociales, entre otros; la data en las
empresas se ha vuelto más compleja, pues incluye no solo data relacional y
tradicional sino también data semi estructurada y no estructurada proveniente de
páginas web, registros web, búsquedas indexadas, fórums de las redes sociales,
e-mail, documentos, data de sensores de sistemas activos y pasivos, etc.
Por otro lado, la data estructurada o relacional representa sólo el 20% del
total de data generada y disponible siendo el 80% restante data semi estructurada
o no estructurada. Es en este punto donde las empresas han empezado a
entender el valor y la oportunidad del Big Data y para poder capitalizar esta
33
oportunidad, las empresas deben poder analizar todo tipo de datos, tanto
relacional como no relacional (Zikopoulos, Eaton y Deroos, 2012).
Tipos de Datos.
Data estructurada.
Se refiere a los tipos de datos que son usados por los sistemas de base de datos
tradicionales; es decir, donde los registros se distribuyen dentro de campos y filas
bien definidas, lo cual permite buscar, categorizar y ordenar fácilmente de acuerdo
a ciertos criterios. Por ejemplo, cuando ingresamos los datos de algún cliente o
empleado a través de formularios que piden datos como nombre, apellido,
dirección, etc.
Data no estructurada.
La data no estructurada es aquella que no tiene un formato predefinido y por tanto
no puede ser almacenada en una base de datos tradicional. Por ejemplo,
imágenes, videos, audios, textos, etc.
Data semiestructurada.
Es aquella que combina los dos tipos de datos descritos anteriormente. Los datos
semiestructurados no residen en bases de datos relacionales, pero presentan una
organización interna que facilita su tratamiento. Por ejemplo, documentos XML o
datos de ubicación anexados a las actualizaciones de las redes sociales.
35
Tipos de análisis
Análisis de datos.
Según Judd, McClelland y Ryan (2011), el análisis de datos es un proceso que
consiste en inspeccionar, limpiar y transformar datos con el objetivo de obtener
información útil que permita al gestor de proyecto realizar un análisis de dicha
información, a fin de obtener conclusiones que apoyen la toma de decisiones. Es
decir, el análisis de datos puede ser usado en diferentes industrias para permitir
que las compañías y las organizaciones tomen mejores decisiones empresariales.
Asimismo, también puede ser usado en las ciencias para verificar o reprobar
modelos o teorías existentes.
El análisis de datos se usa para describirlo todo. Por ejemplo, los bancos y
las compañías de tarjetas de crédito, analizan los retiros y los patrones de gasto
para prevenir el fraude o robo de identidad. Asimismo, las compañías de comercio
electrónico (Ecommerce) examinan el tráfico en el sitio web o los patrones de
navegación para determinar qué clientes son más o menos propensos a comprar
un cierto producto o servicio, basándose en compras previas o patrones de
visualización. Sin embargo, el análisis de datos moderno usa tableros de
información que se basan en flujos de datos en tiempo real. El llamado análisis en
tiempo real implica análisis e informes dinámicos basados en los datos
introducidos en un sistema un minuto antes del tiempo actual de uso. Para el caso
de la presente tesis, el análisis de datos en tiempo real es ejecutado de forma
automática mediante la herramienta de la plataforma Big Data Infosphere
Streams.
Análisis de información.
Según Izamorar (2018), el análisis de información es el proceso por el cual una
persona (en nuestro caso un gestor de proyecto), realiza el análisis de un conjunto
de datos procesados y organizados en reportes y/o dashboards, con el propósito
de reducir la incertidumbre e incrementar el conocimiento. Asimismo, el análisis de
Información favorece la resolución de problemas puesto que permite una
adecuada toma de decisiones.
36
Teniendo en cuenta que las empresas no tienen gran conocimiento acerca del
análisis de grandes volúmenes de datos no estructurados, lo primero que se
cuestionan es como puede estar conformada o estructurada la solución.
Los datos (ya sean flujos de datos, datos capturados o nueva data
generada durante el análisis) también pueden estar disponibles para las partes
internas o externas que deseen utilizarlo. Esto puede ser en forma libre o
mediante el pago de cuotas dependiendo de quién sea el propietario de los datos.
Los desarrolladores de aplicaciones, socios de negocios u otros sistemas que
consumen esta información, lo hacen a través de una “Interfaz de acceso a datos”,
la cual está representada en el lado derecho del diagrama.
38
Esta presentación puede ser textual (Listas o extractos) o gráfica (que van
desde simples tablas y diagramas hasta animaciones complejas). Asimismo, esta
visualización de datos debería darse en cualquier tipo de dispositivo, desde una
PC hasta un Smartphone.
Principio 3: Estas soluciones son ideales cuando toda o casi toda la data
necesita ser analizada versus una muestra de data o cuando una muestra de
datos no es tan efectiva como usar un amplio conjunto de datos desde el cual
realizar el análisis.
39
lenguaje natural, el cual puede resultar vital para minería de textos y análisis de
sentimientos.
Infraestructura inadecuada 8%
Altos costos 6%
Otros 4%
OBJETIVOS
Objetivo general
Objetivos específicos
JUSTIFICACIÓN DE LA INVESTIGACIÓN
Justificación Teórica
Big Data es el gran conjunto de datos estructurados y no estructurados que cada año
aumenta su tamaño y que puede originarse a través de diferentes fuentes como: redes
sociales, consultas en motores de búsqueda, correos, Información propia de las
empresas, entre otros. En la actualidad, las empresas acumulan cada vez más y más de
estos datos; sin embargo, no cuentan con las herramientas, experiencia y conocimientos
necesarios para aprovecharla y generar ganancias.
Lira Segura, J. en el diario Gestión (2014), indicó que las empresas cuentan con
grandes cantidades de datos; sin embargo, no saben qué hacer con ellos; por lo tanto, es
momento de que vean el análisis de datos no estructurados como una fuente de riqueza y
comiencen a obtener ganancias en lugar de verlo como una carga. Por otro lado, de
acuerdo con un estudio de Edgell Knowledge, sólo el 80% de los minoristas ha
escuchado sobre el término “Grandes volúmenes de datos no estructurados” y de ellos,
sólo el 47% entiende cómo aplicarlo a su negocio. Asimismo, según el IDC, el 90% de los
datos a nivel mundial han sido creados tan sólo en los últimos dos años, estimando que
el volumen de registros digitales crezca a 1.2 millones de zetabytes este año y 44 veces
más durante la siguiente década.
Justificación Práctica
GMD es una empresa dedicada a la provisión de soluciones de tecnología de la
información (servicios de outsourcing de TI) a empresas a nivel nacional de diferentes
sectores como comercio, banca y finanzas, gobierno, entre otros. La fase de
implementación de las soluciones de TI es la etapa más corta y critica del proyecto, pues
es la etapa donde se desarrolla el servicio de acuerdo con el alcance ofrecido y vendido
al cliente; por tanto, es indispensable poder contar con una solución de análisis de datos
que permita agilizar la toma de decisiones y reducir los costos de los proyectos. Para
lograr este objetivo, es necesario incluir la mayor cantidad de información disponible,
tanto estructurada (Aprox. 20% de la información total) como no estructurada (Aprox.
80% de la información total), con la finalidad de obtener el máximo provecho posible.
que puede crear ventajas competitivas, desatar nuevas innovaciones e impulsar mayores
ingresos. (IT Center, 2014, p.3).
HIPOTESIS
TABLA N° 5: Hipótesis
FUENTE: Elaboración propia
46
MATRIZ DE CONSISTENCIA
Específico ¿Cuál es el impacto que ocasiona la falta Determinar el impacto de implementar La propuesta de análisis de datos Indicadores: cuantitativo
de herramientas para el análisis y una propuesta de datos no no estructurados favorecerá la Tiempo en toma de
visualización de grandes volúmenes de estructurados, en la reducción del reducción del tiempo de análisis y decisiones.
datos no estructurados, en el tiempo de tiempo de análisis y visualización de visualización de información para Tiempo de análisis de
análisis de información para la generación datos para favorecer la generación de la generación de decisiones información.
de decisiones oportunas? decisiones oportunas. oportunas. Sobrecostos en los
proyectos.
47
MARCO METODOLÓGICO
Metodología y Enfoque
Hernández et al. Explican que “Este tipo de estudios tiene como finalidad conocer
la relación o grado de asociación que existe entre dos o más conceptos, categorías o
variables en una muestra o contexto en particular. En ocasiones sólo se analiza la
relación entre dos variables, pero con frecuencia se ubican en el estudio vínculos entre
tres, cuatro o más variables. Para evaluar el grado de asociación entre dos o más
variables, en los estudios correlacionales primero se mide cada una de éstas, y después
se cuantifican, analizan y establecen las vinculaciones.” (2014, p.93).
Paradigma
Método
VARIABLES
Variable Independiente
La variable independiente es la propuesta de análisis de data no estructurada, porque es
el fenómeno que afectará a otras variables y no depende de otra variable para subsistir.
Variable Dependiente
La variable dependiente es el impacto en la generación de decisiones oportunas, porque
sufrirá los cambios ocasionados por la manipulación de la variable independiente, la
variable dependiente se medirá de acuerdo con los siguientes indicadores:
POBLACIÓN Y MUESTRA
Población
La población objetivo está conformada por los jefes y gerentes de proyecto de la línea de
negocio ISO (International Standard Organization) de la empresa GMD. La empresa GMD
tiene actualmente 21 jefes de proyecto y 16 Gerentes de proyecto; es decir un total de 37
gestores de proyecto, quienes son responsables de la toma de decisiones.
Muestra
Hernández et al. Explican que “No siempre se tiene una muestra, pero en la
mayoría de las situaciones sí se realiza una. Sólo cuando queremos efectuar un censo
debemos incluir todos los casos (personas, animales, plantas, objetos) del universo o la
población. Por ejemplo, los estudios motivacionales en empresas suelen abarcar a todos
sus empleados para evitar que los excluidos piensen que su opinión no se toma en
cuenta. Las muestras se utilizan por economía de tiempo y recursos.” (2014, p.172).
UNIDAD DE ANÁLISIS
Para la presente tesis tendremos como unidad de análisis a los jefes y gerentes de
proyectos de la línea de negocio ISO; debido a que, son los responsables de la toma de
decisiones en los proyectos. Actualmente la toma de decisiones, no se encuentra
sustentada en un análisis de información que incluya datos no estructurados, debido a la
falta de herramientas para la extracción, procesamiento, análisis y visualización de éstos;
con la finalidad de minimizar los costos de los proyectos y generar decisiones oportunas.
INSTRUMENTOS Y TÉCNICAS
Instrumentos
DATOS INFORMATIVOS:
FECHA : ………/…… / 2017
PUESTO DE TRABAJO : Jefe de Proyecto ( ) Gerente de Proyecto ( )
_______________________________________________________________________
INDICACIONES:
Este instrumento me permitirá recoger información sobre la toma de decisiones de GMD,
con la finalidad de medir indicadores como: Tiempo de análisis de información, tiempo de
toma de decisiones y sobrecostos en los proyectos.
1 2 3 4 5
Uso de información
Problemas Generales
III. Considerando la siguiente escala, por favor indicar el tiempo real y que considerada
adecuado para las siguientes situaciones:
1 Menos de 20 min
2 Entre 20 a 60 min
3 Más de 1 hora
4 Más de 1 día
5 Semanas o meses
53
IV. ¿Cuánto considera que es el sobrecosto en los proyectos, causado por los retrasos en
la toma de decisiones?
1 Nada Importante
2 Poco Importante
3 Indiferente
4 Importante
5 Muy Importante
Técnicas
Procedimiento
https://docs.google.com/forms/d/e/1FAIpQLScXztTD0YVd0FL4JwqrEZq7puvjoHsRt0exhKSufaBdu5Rxbg/
viewform?usp=sf_link
Método de Análisis
Se llevará a cabo un análisis de datos mediante el software estadístico “SPSS versión
22”, con la finalidad de obtener la confiabilidad de los datos recolectados mediante el
instrumento (encuesta).
Justificación
Planeamiento
1
58
Diseño
El hecho que GMD haya crecido de manera desordenada, significa que no estaba
preparada para dicho crecimiento. Por lo tanto, la generación de información se ha vuelto
un tema bastante engorroso, pues se cuenta con tanta información, que ya no se sabe
qué hacer con ella. Asimismo, no existe un repositorio oficial dentro de GMD donde
almacenar toda esta información, quedando distribuida en diferentes repositorios
dependiendo del área que la genera. Esto causa que cuando se necesita determinada
información, no se sabe dónde está, no está completa o no se cuenta con los accesos
necesarios. Por lo tanto, se gasta tiempo y esfuerzo en la búsqueda o se realiza un
retrabajo para generarla nuevamente, impidiendo que se explote al máximo o se use de
manera eficiente.
Por otro lado, hay información proveniente de correos, audios, videos, entre otros,
que se pierde o no se almacena ni utiliza de la mejor manera.
Las necesidades de negocio de GMD están orientadas a generar decisiones que sean
oportunas, con la finalidad de reducir tiempo y costos durante la implementación de los
proyectos. En base a esto, se definirán las capacidades técnicas y de Negocio para el
desarrollo de la propuesta de análisis de datos no estructurados para la generación de
decisiones oportunas.
60
Capacidades Técnicas.
A nivel lógico: Está compuesta por máquinas virtuales, las cuales son
creadas usando tecnología VMWare.
Capacidades de Negocio.
Inversión.
GMD cuenta con más de 30 años en el mercado de Tecnologías de la información
y con aproximadamente 2,000 colaboradores. En el año 2015, GMD cerró su
facturación anual con un monto de US$ 83 millones de dólares, distribuidos entre
sus principales líneas de negocio (ISO, AO y BPO). Asimismo, ha realizado una
inversión de US$ 40 millones de dólares en nuevas tecnologías y servicios como
el Cloud Computing, Software Factory, la construcción de un nuevo Datacenter,
entre otros.
GMD tiene como meta propuesta para el año 2018, contar con presencia
regional en países como Chile y Colombia. Asimismo, se espera generar un
ingreso de US$ 260 millones de dólares. Por tanto, cuenta con la solvencia
necesaria para invertir en una solución de tecnología como la propuesta en la
presente tesis.
62
Alianzas estratégicas.
GMD tiene actualmente alianzas estratégicas con diferentes proveedores como
IBM (Partner a nivel de Hardware y Software), HP (Partner sólo a nivel de
Hardware), Oracle (Partner sólo a nivel de Software), entre otros, lo cual le
permite tener ventajas competitivas con respecto a sus competidores. Asimismo,
contar con descuentos y soporte para nuevos proyectos e inversiones en
soluciones de tecnología como la propuesta en la presente tesis.
Requerimientos Funcionales.
Nivel Exigible /
N° Requerimientos
Prioridad Deseable
La solución deberá permitir la búsqueda, captura y extracción de información de
1 fuentes como: documentos de lecciones aprendidas, oportunidades de mejora, 1 E
costos, quejas de los clientes y documentación propia de los proyectos.
La solución deberá permitir realizar y visualizar, de manera rápida, fácil y
2 amigable, el análisis de grandes volúmenes de datos para la generación de 1 E
decisiones oportunas por parte de los jefes y gerentes de proyecto.
La solución deberá presentarse en forma de Dashboards y reportes amigables,
3 1 E
que faciliten la generación de toma de decisiones.
Se espera que la solución propuesta permita realizar un análisis sobre los
siguientes puntos:
Identificar los errores más frecuentes en los proyectos.
4 Definir si un proyecto ha culminado con éxito, en base al análisis de 2 D
información realizada.
Validar si se están aplicando las lecciones aprendidas en los proyectos.
Identificar los tipos de quejas de clientes que existen y su frecuencia.
La solución deberá permitir realizar un análisis de grandes volúmenes de datos
5 1 E
en tiempo real o casi real.
Leyenda:
E = Exigible y D = Deseable
Requerimientos No Funcionales.
Nivel Exigible /
N° Requerimientos
Prioridad Deseable
Se deberán identificar las características a nivel de infraestructura que se
1 1 E
requieren para la solución.
Se deberán adquirir las licencias necesarias para el procesamiento y análisis de
2 1 E
grandes volúmenes de datos
Se deberá elegir una plataforma de Big Data a través de un análisis sobre los
3 1 E
principales proveedores.
La plataforma elegida deberá poder ser desplegada sobre la infraestructura
4 2 D
actual de GMD.
La solución deberá tener soporte del proveedor ante incidentes críticos en
5 2 D
modalidad 24 x 7 los 365 días del año.
6 La solución deberá permitir integrar y centralizar la información 1 E
Leyenda:
E = Exigible y D = Deseable
Según Jeff Kelly (2014), el mundo de las empresas proveedoras de Big Data se
divide en dos: Aquellas empresas creadas recientemente y que están trayendo
innovación al creciente mercado de Big Data (sus ingresos dependen 100% de Big Data)
y aquellas empresas proveedoras de base de datos y data Warehouse, ya establecidas,
que se están expandiendo al mundo del Big Data desde una posición bastante fuerte
gracias a su larga experiencia y renombre en el mercado (sus ingresos no dependen
100% de Big Data). A continuación, se muestra la lista de las 10 empresas de Big Data
más importantes:
% de Ingresos
Ingresos Total % de Ingresos por % de Ingresos por
Proveedor por Big Data
Big Data Ingresos Big Data (Hardware) Big Data (Software)
(Servicios)
IBM $1,368 $99,751 31% 27% 42%
HP $869 $114,100 42% 14% 44%
Dell $652 $54,550 85% 0% 15%
SAP $545 $22,900 0% 76% 24%
Teradata $518 $2,665 36% 30% 34%
Oracle $491 $37,552 28% 37% 36%
SAS
$480 $3,020 0% 68% 32%
Institute
Palantir $418 $418 0% 50% 50%
Accenture $415 $30,606 0% 0% 100%
PWC $312 $32,580 0% 0% 100%
Según Zhu, Gupta y Kumar (2014), La plataforma de análisis de Big Data de IBM
proporciona a las organizaciones un conjunto de soluciones, diseñado específicamente
para uso empresarial. Asimismo, proporciona la capacidad de empezar con una sola
funcionalidad y fácilmente añadir otras conforme se requiera, ya que la pre-integración de
sus componentes reduce el tiempo de implementación y el costo.
69
Entre las ventajas de utilizar la plataforma de Análisis de Big Data de IBM se tiene:
Las 5V’s.
Variedad: La plataforma soporta gran variedad de datos y permite a las empresas
gestionar estos datos en su formato original y transformarlos a otros formatos
deseados.
Análisis.
La plataforma permite analizar los datos en su formato nativo como texto, binario y
contenido multimedia.
Fácil de usar.
La plataforma incluye un conjunto de interfaces de usuario desarrollador (UI),
lenguajes comunes y consola de administración, que permiten una adopción más
rápida y reduce el tiempo de codificación y depuración.
La plataforma también ofrece interfaces de usuario final y capacidades de
visualización, como el análisis basado en web y herramientas para la visualización
de información, a través de interfaces familiares como las hojas de cálculo.
70
Integración.
La plataforma ofrece la posibilidad de integrar una amplia variedad de fuentes de
datos utilizando protocolos estándares, tales como Open Database Connectivity
(ODBC), Java Database Connectivity (JDBC), y Java Message Service (JMS).
Presupuesto e Inversión
Para el diseño de la solución propuesta se han definido las siguientes capacidades, las
cuales pueden ser ajustadas en el proceso. En base a este dimensionamiento tenemos
una inversión de $393,360.52 dólares.
Dado que GMD tiene como meta propuesta para el año 2018, contar con un
ingreso de US$ 260 millones de dólares, cuenta la solvencia necesaria para invertir en
una solución de tecnología como la propuesta en la presente tesis. Asimismo, el
71
costo/beneficio que se puede obtener de esta solución radica en una toma de decisiones
mucho más rápida (oportuna) que esté basada en un análisis de datos completo y no sólo
en el instinto, permitiendo hacer frente a las necesidades y requerimientos de sus clientes
y ganando oportunidades de negocio e inversión frente a la competencia.
Diseño de la infraestructura
Según Zhu, Gupta y Kumar (2014), el análisis de Big Data requiere gran cantidad de
almacenamiento (a nivel de bloque u objeto), procesamiento (a nivel de recursos) e
intercambio de datos (a nivel de red).
Asimismo, las plataformas tradicionales para el análisis de datos, no pueden escalar
fácilmente a bajo costo para satisfacer las demandas de Big Data. Por otro lado, la
mayoría de los datos no son estructurados y adecuados para las bases de datos
relacionales y almacenes de datos (Data Warehouse) tradicionales.
Sin embargo, los entornos Cloud Computing están construidos para responder a
cargas de trabajo de propósito general y usar grupos comunes de recursos (Resource
pooling), durante un largo periodo de tiempo, para proporcionar elasticidad a demanda;
mientras que las cargas de trabajo de Big Data utilizan gran cantidad de recursos en un
periodo de tiempo corto.
72
Por lo tanto, un ambiente de Cloud Computing para Big Data, requiere extrema
elasticidad para proveer cientos de máquinas virtuales (VMs) en horas o incluso minutos.
Asimismo, se requieren redes dedicadas y aisladas para asegurar que la replicación de
datos entre los nodos no afecte la ingestión de datos entrantes.
Según Zhu, Gupta y Kumar (2014), Para que el Cloud Computing y el Big Data
puedan trabajar juntos se deben asegurar los siguientes puntos a nivel de infraestructura
del Cloud Computing (IaaS):
CPU multicore
Sistema Hadoop.
Stream computing.
Está diseñado para analizar los datos en movimiento al tiempo que proporciona
una escalabilidad masiva y procesamiento de múltiples flujos de entrada
76
Aceleradores.
La plataforma Big Data de IBM proporciona una serie de aceleradores, como los
aceleradores Analíticos (para manejar los datos de texto, la minería de datos y los
datos acústicos).
Interfaces de usuario.
InfoSphere BigInsights.
Según Zikopoulos, Deroos y Parasuraman (2013), BigInsights está basado en
Apache Hadoop y cuenta con proyectos de código abierto como componente
principal.
Es tolerante a fallas.
Componentes Descripción
BigSheet.
Aunque el sistema Hadoop hace posible el análisis de grandes volúmenes de
datos, se necesita de un programador con una buena comprensión del paradigma
MapReduce para explorar los datos, algo que la empresa GMD no posee y que
claramente puede representar una barrera. Para resolver este problema,
81
Características de HBase:
Es horizontalmente escalable
Tiene soporte automático ante fallas
Provee lecturas y escrituras consistentes
Provee replicación de datos a través de los nodos del cluster
Se integra con Hadoop, tanto en el origen como en el destino.
Provee una API de Java amigable para clientes.
Alberga tablas muy grandes sobre los nodos del cluster Hadoop de
hardware básico.
HDFS HBase
Es un sistema de archivos distribuido Es una base de datos construida en la cima del HDFS.
adecuado para almacenar archivos de gran
tamaño.
No admite búsquedas rápidas de registros Ofrece búsquedas rápidas sobre tablas grandes.
individuales.
Proporciona alta latencia en el Proporciona baja latencia de acceso a las filas individuales
procesamiento por lotes; No posee ningún de miles de millones de registros (acceso aleatorio).
concepto de procesamiento por lotes.
Sólo proporciona acceso secuencial de los HBase utiliza internamente tablas hash y proporciona
datos. acceso aleatorio; asimismo, almacena los datos en
archivos HDFS indexados para búsquedas más rápidas.
Arquitectura de HBase.
En HBase, las tablas se dividen en regiones y son servidos por regiones de
servidores. Las regiones se dividen verticalmente por las familias de columnas en
"Stores" (Término usado para las regiones, para explicar la estructura de
almacenamiento). Los stores son almacenados como archivos en el HDFS.
InfoSphere Streams.
Dado que los jefes y gerentes de proyecto de GMD, ya no pueden esperar días,
semanas o meses para identificar nuevas oportunidades de negocio, conocer la
salud de la empresa e identificar quejas, molestias o preocupaciones de los
clientes, con respecto a los productos y servicios que ofrecen; IBM ha
desarrollado la tecnología InfoSphere Streams, la cual ofrece la posibilidad de
obtener valor de los datos al instante (en tiempo real), mediante el análisis de
datos en movimiento (data-in-motion).
Los operadores pueden tener cero o más entradas y cero o más salidas,
las salidas de un operador se conectan con las entradas de otro operador. Los
enlaces (flechas) que unen a los nodos, representan el flujo de datos en
91
Los elementos de datos dentro de un flujo son conocidos como tuplas, las
cuales representan paquetes de datos, formados por un conjunto de atributos para
un determinado objeto. Cada elemento en la tupla contiene el valor para ese
atributo y puede ser de tipo numérico, fecha, cadena o binario.
Componentes Descripción
Es una herramienta de integración de datos que permite a los usuarios mover y transformar
InfoSphere DataStage
datos entre los sistemas de destino operacionales, transaccionales, y analíticos.
InfoSphere Proporciona capacidades para crear y mantener una visión precisa de las entidades de datos
QualityStage como: clientes, ubicaciones, vendedores y productos a lo largo de la empresa.
Es una herramienta basada en web, utilizada para cargar datos entre las fuentes de datos
InfoSphere Data Click internas (on-premises) y externas (off-premises), incluyendo bases de datos y plataformas de
almacenamiento en el Cloud como Amazon S3.
Proporciona capacidades para automatizar el flujo de trabajo de la integración de datos. Los
usuarios pueden automatizar y monitorear múltiples tareas de integración de datos,
InfoSphere FastTrack
reduciendo el tiempo entre el desarrollo de los requerimientos de negocio y la implementación
de la solución.
InfoSphere Information Proporciona capacidades para perfilar y analizar datos, con la finalidad de ofrecer información
Analyzer fiable a la organización.
Es una herramienta basada en web que permite a los usuarios manejar un vocabulario
InfoSphere Information
empresarial. Asimismo, proporciona información sobre el flujo de datos de los activos que son
Governance Catalog
utilizados por los componentes de IBM InfoSphere Information Server.
InfoSphere Information Mide la efectividad del control de información, mediante la consulta y visualización de los
Governance Dashboard metadatos técnicos, operativos y de negocios.
InfoSphere Information Proporciona un entorno integrado que permite a los usuarios desplegar rápidamente la lógica
Services Director de InfoSphere Information Server como servicios.
97
InfoSphere Data
Permite diseñar y comprender los activos de los datos y sus relaciones.
Architect
Proporciona técnicas de exploración y análisis de datos para descubrir automáticamente las
InfoSphere Discovery
relaciones y correlaciones entre los datos estructurados de la empresa.
Conectividad común
InfoSphere Information Server se conecta a fuentes de informaciones,
estructuradas, no estructuradas, en el sistema principal o en las aplicaciones. La
conectividad controlada por metadatos se comparte entre los componentes de la
suite y los objetos de conexión pueden volver a utilizarse en las distintas
funciones.
Metadatos unificados.
InfoSphere Information Server está creado sobre una infraestructura de metadatos
unificados que permite el uso compartido de dominios empresariales y dominios
técnicos. Esta infraestructura reduce el tiempo de desarrollo y proporciona un
registro permanente que puede mejorar la confianza en la información. Todas las
funciones de InfoSphere Information Server comparten el mismo modelo, lo que
facilita la colaboración de distintos roles y funciones.
Servicios comunes.
InfoSphere Information Server está creado sobre la base de un conjunto de
servicios compartidos que centralizan las tareas principales de la plataforma.
Estas tareas incluyen la seguridad, la administración de usuarios, el registro
cronológico y la generación de informes. Los servicios compartidos permiten
gestionar y controlar estas tareas desde un único lugar, independientemente del
componente de la suite que se utilice.
100
IBM Cognos.
Explorar todo tipo de información, desde todos los ángulos, para evaluar la
situación actual del negocio.
102
IBM Cognos Business Insight, es una interfaz basada en web que permite
crear, editar o abrir dashboards sofisticados e interactivos para conocer y facilitar
la toma de decisiones. Los dashboards, son la manera más popular de presentar
información en base a las necesidades de negocio de los usuarios, asimismo, se
pueden crear diferentes tipos de reportes (gráficas, listas y tablas) para ser
usados dentro de los dashboards.
La interfaz de usuario del IBM Cognos Business Insight tiene los siguientes
componentes:
Quinto: Se debe tener en cuenta que puede haber reportes que muestren
la misma información y ocupen espacio en el Dashboard. En estos casos es
recomendable eliminar los reportes redundantes. Para esto seleccionar la opción
Eliminar Dashboard y luego confirmar la eliminación.
FIGURA N° 41: Interfaz Avanzada de usuario del IBM Cognos Business Insight
FUENTE: IBM Cognos Business Intelligence V10.1 Handbook.
109
El reporte Theme River (Río de temas), es útil para visualizar los datos no
estructurados y basados en texto. En el ejemplo de la figura 45, se muestran las
frases más populares relacionadas a los videojuegos sobre una línea de tiempo.
FIGURA N° 50: IBM Cognos Dynamic Query integrado con IBM Cognos BI
FUENTE: Big Data Analytics with IBM Cognos BI Dynamic Query.
117
RESULTADOS
1 6 16% 16%
2 13 35% 51%
3 11 30% 81%
4 6 16% 97%
5 1 3% 100%
Total 37 100% 100%
Análisis e interpretación:
Como se muestra en la tabla 19 y figura 52, el 81% de los encuestados afirman que la
información disponible actualmente para la toma de decisiones es poco o nada útil;
mientras que el 19% afirma que la información disponible es útil o muy útil.
119
50%
46%
45%
41%
40% 38%
35%
35% 32% 32% 32%
30%
27%
24% 24%
25%
22% 22%
20% 19% 19%
16% 16%
15% 14%
11%
10% 8% 8%
5% 5%
5% 3%
0% 0%
0%
Documentos sobre lecciones Costos de los proyectos. Quejas de los clientes (Correos, Documentación propia de los Audios y videos de comités
aprendidas documentos, entre otros). proyectos. ejecutivos y operativos.
Nunca Casi Nunca A Veces Casi Siempre Siempre
Análisis e interpretación:
Como se muestra en la tabla 20 y figura 53, la documentación de los proyectos y costos
tienen el mayor porcentaje de uso: mientras que los audios y videos de los comités y las
lecciones aprendidas, casi nunca o nunca son usados durante la toma de decisiones.
120
Análisis e interpretación:
Como se muestra en la tabla 21 y figura 54, los principales problemas están relacionados
a los sobrecostos en los proyectos, a la falta de un análisis de datos que incluya data no
estructurada como audios, videos, entre otros y a retrasos en el análisis de información,
causando retrasos en la toma de decisiones.
121
Análisis e interpretación:
Como se muestra en la tabla 22 y figura 55, los principales problemas están relacionados
a la falta de herramientas para la extracción y procesamiento de grandes volúmenes de
datos; así como a la falta de una interfaz amigable, causando retrasos en el proceso.
122
Análisis e interpretación:
Como se muestra en la tabla 23 y figura 56, los principales problemas están relacionados
a la falta de herramientas para el análisis de grandes volúmenes de datos; así como a la
falta de una interfaz amigable para el análisis y visualización de datos, por otro lado,
actualmente el análisis de datos se realiza de forma manual y sobre data histórica,
causando retrasos en el proceso.
123
60%
51%
50%
41% 41% 41%
40%
30% 24%
16% 16% 19% 19% 22%
20%
8%
10%
0% 3% 0% 0%
0%
Insatisfacción en los clientes. Hubo un incremento en los Se redujo la rentabilidad de la
costos. inversión.
Nunca Casi Nunca A Veces Casi Siempre Siempre
Análisis e interpretación:
Como se muestra en la tabla 24 y figura 57, los principales efectos negativos
relacionados a los retrasos en la toma de decisiones son el incremento en los costos y la
insatisfacción en los clientes, causando pérdidas monetarias a la empresa.
124
Menos de 20 Semanas o
Entre 20 a 60 min Más de 1 día Más de 1 hora
Opciones min meses
Recuento % Recuento % Recuento % Recuento % Recuento %
Extraer y
procesar 1 2.7% 17 45.9% 5 13.5% 1 2.7% 13 35.1%
datos
Analizar
0 0.0% 12 32.4% 12 32.4% 0 0.0% 13 35.1%
datos
Visualizar la
4 10.8% 18 48.6% 11 29.7% 0 0.0% 4 10.8%
información
Análisis e interpretación:
Como se muestra en la tabla 25 y figura 58, el 46% de los encuestados indica que la
extracción y procesamiento de datos toma más de un día; mientras que el 35% indica que
el proceso toma semanas o meses. El 35% de los encuestados indica que el proceso de
análisis de datos toma semanas o meses; mientras que el 32% indica que el proceso
toma más de un día. El 49% de los encuestados indica que el proceso de visualizar la
información toma más de un día; mientras que el 30% indica que el proceso toma más de
1 hora.
125
8. ¿Cuánto considera que es el sobrecosto en los proyectos, causado por los retrasos en
la toma de decisiones?
Porcentaje
Opciones Frecuencia Porcentaje
acumulado
Entre 0% a 15% adicional al costo del proyecto 13 35% 35%
Entre 15% a 25% adicional al costo del proyecto 12 32% 68%
Entre 25% a 50% adicional al costo del proyecto 9 24% 92%
Entre 50% a 75% adicional al costo del proyecto 3 8.% 100%
Total 37 100% 100%
Análisis e interpretación:
Como se muestra en la tabla 26 y figura 59, el 35% de los encuestados indica que el
sobrecosto en los proyectos, producto de los retrasos en la toma de decisiones, está
entre el cero y 15% adicional al costo del proyecto; mientras que el 33% indica que el
sobrecosto está entre el 15% y 25% adicional al costo del proyecto. Asimismo, el 24%
indica que el sobrecosto está entre el 25% y 50% y por último, el 8% indica que el
sobrecosto está entre el 50% y 75% adicional al costo del proyecto.
126
Análisis e interpretación:
Como se muestra en la tabla 27 y figura 60, más del 70% de los gestores de proyecto
consideran como importante o muy importante las siguientes características con las que
debe contar la plataforma de análisis de grandes volúmenes de datos en tiempo real para
la toma de decisiones: rápido procesamiento de grandes y variados volúmenes de datos
y el análisis en tiempo o casi real.
127
DISCUSIÓN
Por último, los resultados del presente estudio concuerdan con los resultados de
las investigaciones descritas en la sección de antecedentes, pues éstas tenían como
finalidad presentar propuestas de plataformas de Big Data para ofrecer procesos de
extracción de datos (estructurados y No estructurados), procedimientos para el
procesamiento de datos y herramientas para el análisis y visualización de información.
Asimismo, recomendaban aprovechar la mezcla de Big Data y Cloud Computing para
crear valor y alcanzar objetivos orientados a sus casos de estudio en sectores como el
turístico y retail.
129
CONCLUSIONES
De acuerdo con los resultados obtenidos, más del 50% de los gestores de
proyectos indican que actualmente los procesos de extracción, procesamiento, análisis y
visualización de datos toman aproximadamente 1 día, llegando incluso a tardar semanas
o meses dependiendo de la complejidad y/o volumen de los datos. Por lo tanto, la
propuesta de análisis de datos no estructurados, mediante las herramientas de la
plataforma Big Data de IBM, permitirán automatizar estos procesos causando una
reducción en los tiempos de respuesta a sólo segundos o minutos. En Conclusión, se
acepta la hipótesis general donde se determina que la propuesta de análisis de datos no
estructurados favorecerá la generación decisiones oportunas en la fase de
implementación de los proyectos de GMD, mediante el uso de las herramientas IBM
InfoSphere BigInsights, Streams, Information server y Cognos BI.
Tercera: De acuerdo con los resultados obtenidos, más del 50% de los gestores
de proyectos consideran que los principales problemas en los procesos de análisis y
visualización de datos están relacionados con la falta de herramientas e interfaz
amigable; asimismo, el análisis de datos se realiza de forma manual y sobre data
histórica, causando retrasos en estos procesos. Por lo tanto, la propuesta de análisis de
datos no estructurados, mediante el uso de la herramienta InfoSphere Streams, permitirá
la reducción en el tiempo de análisis de datos, al realizar el análisis en tiempo real o casi
real de datos como: la detección de errores en los proyectos, identificación de quejas y/o
preferencias de los clientes, correlación de eventos, entre otros.
Quinta: De acuerdo con los resultados obtenidos, más del 50% de los gestores de
proyectos consideran que los principales efectos negativos relacionados a los retrasos en
la toma de decisiones son el incremento en los costos y la insatisfacción en los clientes,
causando pérdidas monetarias a la empresa. Por lo tanto, la solución permitirá reducir el
tiempo en el análisis y visualización de la información, logrando también una reducción en
el tiempo de la toma decisiones, y por lo tanto una reducción en los sobrecostos de los
proyectos por decisiones tardías. En conclusión, se acepta la hipótesis específica 4
donde se determina que el desarrollo de la propuesta de análisis de datos no
estructurados impacta positivamente en la reducción de costos en los proyectos de TI de
GMD, mediante el análisis y visualización de información en tiempo real o casi real.
RECOMENDACIONES
Dentro de un proyecto tan ambicioso como lo fue éste, siempre se desea que exista una
mejora continua del mismo; por lo tanto, se recomienda realizar futuras investigaciones
que se centren en el proceso de implementación y desarrollo de la propuesta de análisis
de datos no estructurados para la generación de decisiones oportunas, corroborando los
resultados obtenidos en la presente tesis. Para esto es recomendable realizar la
adquisición de las herramientas de la plataforma Big Data de IBM.
REFERENCIAS
Alam, F. (2017). Data Migration: Relational Rdbms To Non-Relational Nosql (Tesis de maestría).
Blasiak, K. (2014). Big Data; A Management Revolution: The emerging role of big data in
businesses.
Browne et al. (2010). IBM Cognos Business Intelligence V10.1. International Business Machines
Corporation. Handbook.
http://www.redbooks.ibm.com/redbooks/pdfs/sg247912.pdf
Galimany Suriol, A. (2014). La creación de valor en las empresas a través del Big Data.
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la
investigación. Sexta Edición. Editorial Mc Graw Hill. México.
IBM Corporation. (2013). Big Data Analytics with IBM Cognos BI Dynamic Query.
http://www.redbooks.ibm.com/technotes/tips1057.pdf
IBM Corporation (2015). InfoSphere Information Server 11.5.0. IBM Knowledge Center.
Intel IT Center. (2014). Big Data in the Cloud: Converging Technologies. Intel Solution Brief, 3-11.
Judd, C. M., McClelland, G. H., & Ryan, C. S. (2011). Data analysis: A model comparison
approach. Routledge.
Kelly, J. (2014). Big Data Vendor Revenue and Market Forecast 2013-2017. Wikibon. Big Data
Vendor Revenue And Market Forecast 2012-2017.
Lira Segura, J.(2014). Big Data: La nueva moneda en el mundo de los negocios. Diario Gestión.
Recuperado de la Web del Diario Gestión.
http://gestion.pe/tecnologia/big-data-nueva-moneda-mundo-negocios-2110577
López García, D. (2013). Análisis de las posiblidades de uso de Big Data en las
organizaciones (Master's thesis).
Manso, F. (2017). Análisis de modelos de negocios basados en big data para operaciones
móviles.
Mérida, C. M. & Ríos, R. P. (2014). Propuesta de la plataforma de Big Data orientado al sector
turístico. Recuperada de Repositorio académico UPC de
http://repositorioacademico.upc.edu.pe/upc/handle/10757/346172
133
Mitchell, I., Locke, M. & Wilson, M. (2012). The white book of Big Data. United Kingdom: Fujitsu
Services Ltd.
Morales, G. D. F. (2010). Cloud computing for large scale data analysis. Technical report, IMT
Institute for Advanced Studies.
Mouthaan, N. (2012). Effects of Big Data Analytics on Organizations’ value creation (Tesis de
maestría). Recuperada de Digital Academic Repository de
http://dare.uva.nl/cgi/arno/show.cgi?fid=452536
Näsholm, P. (2012). Extracting Data from NoSQL Databases-A Step towards Interactive Visual
Analysis of NoSQL Data (Tesis de maestría).
Padberg, M. D. (2017). Big Data and Business Intelligence: a data-driven strategy for e-commerce
organizations in the hotel industry (Master's thesis, University of Twente).
Tutorials Point (2014). Apache HBase Hadoop Database. Tutorials Points Ltd.
http://www.tutorialspoint.com/hbase/hbase_tutorial.pdf
Ziff Davis B2B (2014). Visualization is Worth a Thousand Tables: How IBM Business Analytics Lets
Users See Big Data.
http://public.dhe.ibm.com/common/ssi/ecm/yt/en/ytl03299usen/YTL03299USEN.PDF
Zikopoulos, Deroos y Parasuraman (2013). Harness the power of Big Data. United States of
America: The McGraw-Hill Companies.
Zhu, W., Gupta, M. & Kumar, V. (2014). Building Big Data and Analytics Solutions in the Cloud.
IBM Corp.
134
ANEXOS
DATOS INFORMATIVOS:
FECHA : ………/…… / 2017
PUESTO DE TRABAJO : Jefe de Proyecto ( ) Gerente de Proyecto ( )
_______________________________________________________________________
INDICACIONES:
Este instrumento me permitirá recoger información sobre la toma de decisiones de GMD,
con la finalidad de medir indicadores como: Tiempo de análisis de información, tiempo de
toma de decisiones y sobrecostos en los proyectos.
VI. ¿Qué tan útil considera que es la información utilizada actualmente en la toma de
decisiones? Marcar del 1 al 5, teniendo en cuenta que 5 es Muy Útil y 1 Nada Útil
1 2 3 4 5
Uso de información
Problemas Generales
VIII. Considerando la siguiente escala, por favor indicar el tiempo real y que
considerada adecuado para las siguientes situaciones:
1 Menos de 20 min
2 Entre 20 a 60 min
3 Más de 1 hora
4 Más de 1 día
5 Semanas o meses
136
IX. ¿Cuánto considera que es el sobrecosto en los proyectos, causado por los retrasos en
la toma de decisiones?
1 Nada Importante
2 Poco Importante
3 Indiferente
4 Importante
5 Muy Importante
1 1 Casi Nunca Casi Siempre Casi Nunca Casi Siempre Casi Nunca Casi Siempre Siempre Casi Siempre Casi Siempre Casi Siempre
2 3 A Veces Casi Siempre A Veces Casi Siempre Nunca A Veces A Veces A Veces Casi Siempre Casi Nunca
3 2 Casi Siempre Siempre Siempre A Veces A Veces A Veces A Veces A Veces Casi Nunca Casi Siempre
4 2 Nunca Casi Nunca Casi Siempre Siempre Nunca Casi Nunca A Veces A Veces Siempre Casi Siempre
5 4 Casi Nunca Siempre Casi Siempre Siempre Nunca Casi Nunca Casi Siempre A Veces A Veces A Veces
6 2 Casi Siempre Siempre A Veces A Veces A Veces Casi Siempre Casi Siempre Casi Siempre Siempre Casi Siempre
7 2 Casi Siempre Siempre Casi Siempre Casi Siempre Casi Nunca Siempre Siempre Siempre Siempre A Veces
8 3 A Veces Casi Siempre Casi Siempre Siempre Casi Nunca A Veces Casi Nunca Casi Siempre Casi Nunca A Veces
9 4 Casi Siempre Casi Siempre Casi Siempre Siempre Casi Nunca A Veces A Veces A Veces Casi Nunca A Veces
10 2 A Veces Casi Siempre Siempre Siempre Casi Siempre Casi Siempre A Veces A Veces A Veces A Veces
11 2 Nunca Siempre Nunca Nunca Nunca Siempre Siempre Siempre Nunca A Veces
12 2 Casi Nunca Casi Siempre A Veces A Veces Nunca A Veces Casi Siempre A Veces Nunca Casi Nunca
13 3 Nunca Casi Siempre Casi Nunca Casi Siempre Casi Nunca A Veces A Veces A Veces Casi Siempre A Veces
14 3 Casi Siempre A Veces A Veces Siempre A Veces Casi Nunca Casi Nunca Casi Nunca Casi Nunca Casi Nunca
15 2 Siempre Siempre A Veces Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre
16 4 A Veces Casi Siempre A Veces Casi Siempre Nunca Casi Siempre Siempre A Veces Siempre Casi Siempre
17 3 Casi Nunca Casi Siempre A Veces Siempre Nunca A Veces Casi Siempre Casi Siempre Casi Nunca Casi Siempre
18 5 Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Nunca Casi Siempre Siempre Casi Siempre Casi Siempre A Veces
19 1 A Veces Casi Siempre Casi Siempre Casi Siempre A Veces A Veces A Veces A Veces A Veces A Veces
20 2 Casi Siempre Siempre Siempre Siempre Casi Siempre Casi Siempre Siempre Casi Siempre A Veces A Veces
21 4 A Veces A Veces A Veces Casi Siempre Casi Nunca A Veces A Veces A Veces A Veces Casi Siempre
22 2 A Veces Casi Nunca Casi Nunca A Veces Nunca Casi Nunca A Veces Casi Siempre Siempre Casi Siempre
23 4 Casi Nunca A Veces A Veces A Veces Nunca A Veces Casi Siempre Casi Siempre Siempre Casi Siempre
24 2 Casi Siempre A Veces Casi Siempre Casi Nunca Casi Nunca Casi Siempre A Veces A Veces A Veces Casi Siempre
138
PREGUNTAS
GESTORES
N° 1 N° 2 – a N° 2 - b N° 2 - c N° 2 – d N° 2 – e N° 3 – a N° 3 - b N° 3 - c N° 3 - d N° 3 - e
25 3 Casi Siempre Casi Nunca Casi Nunca Nunca Nunca Casi Siempre Casi Siempre A Veces A Veces Casi Siempre
26 3 Casi Nunca A Veces Nunca Casi Nunca Casi Nunca Siempre Casi Siempre Casi Siempre Casi Siempre Siempre
27 1 Casi Siempre Casi Nunca Casi Siempre Casi Nunca Casi Nunca A Veces Casi Siempre Casi Siempre Casi Siempre A Veces
28 4 Casi Nunca A Veces A Veces A Veces Nunca Casi Siempre A Veces A Veces Casi Nunca A Veces
29 1 Casi Siempre A Veces A Veces Casi Siempre A Veces A Veces A Veces Casi Siempre Casi Siempre Casi Siempre
30 3 Casi Nunca Casi Siempre A Veces A Veces Casi Nunca A Veces Casi Siempre Casi Siempre Casi Siempre Casi Siempre
31 1 Casi Nunca A Veces Casi Nunca Casi Nunca Nunca Casi Siempre A Veces Casi Siempre Casi Siempre Siempre
32 3 Casi Siempre Casi Siempre A Veces Casi Siempre Casi Siempre Siempre Siempre Casi Siempre Casi Siempre Siempre
33 3 Casi Nunca A Veces A Veces Casi Nunca Casi Nunca Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre
34 3 Casi Siempre Casi Nunca A Veces Casi Nunca Nunca Casi Siempre A Veces A Veces Casi Nunca Casi Siempre
35 1 Casi Nunca A Veces A Veces A Veces A Veces Siempre Siempre Siempre Siempre Siempre
36 2 Casi Nunca A Veces A Veces Casi Nunca Nunca Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre
37 2 Casi Siempre A Veces Casi Nunca Casi Nunca Nunca Casi Siempre Siempre Casi Siempre Casi Siempre Casi Siempre
PREGUNTAS
GESTORES
N° 4 - a N° 4 – b N° 4 - c N° 4 – d N° 5 - a N° 5 - b N° 5 – c N° 5 - d N° 5 - e N° 6 - a N° 6 - b N° 6 - c
1 Siempre Casi Siempre Siempre Siempre Siempre Siempre Siempre Casi Siempre Siempre Casi Siempre Siempre Casi Siempre
2 Casi Nunca Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre A Veces Casi Siempre Casi Siempre A Veces Casi Nunca
3 Casi Siempre Siempre Siempre Siempre Siempre Casi Siempre Casi Siempre Siempre Siempre A Veces Casi Siempre A Veces
4 Casi Siempre Casi Siempre Siempre Siempre Siempre Siempre Siempre Siempre Siempre Casi Siempre Casi Siempre Casi Siempre
5 Casi Siempre Casi Nunca Casi Siempre Siempre Casi Siempre Siempre Casi Siempre Casi Siempre Casi Siempre A Veces A Veces A Veces
6 A Veces A Veces Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre Siempre A Veces Casi Siempre A Veces Casi Siempre
7 Siempre Siempre Siempre Siempre Siempre Siempre Siempre Siempre Siempre Casi Siempre Casi Siempre Casi Siempre
8 Siempre Siempre Casi Siempre Siempre Casi Siempre Siempre Siempre Casi Siempre Casi Siempre A Veces Siempre Casi Siempre
9 A Veces A Veces Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre A Veces A Veces A Veces A Veces
139
PREGUNTAS
GESTORES
N° 4 - a N° 4 – b N° 4 - c N° 4 – d N° 5 - a N° 5 - b N° 5 – c N° 5 - d N° 5 - e N° 6 - a N° 6 - b N° 6 - c
10 Casi Siempre A Veces Casi Siempre Siempre Casi Siempre Siempre Siempre Siempre Casi Siempre A Veces A Veces A Veces
11 A Veces A Veces A Veces Casi Siempre Casi Siempre Casi Siempre Casi Siempre A Veces Casi Siempre Siempre Casi Siempre Casi Siempre
12 A Veces Casi Siempre Siempre Siempre A Veces A Veces Casi Siempre Casi Siempre A Veces A Veces Casi Siempre Casi Siempre
13 Casi Nunca A Veces Siempre Siempre Casi Siempre Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Siempre Siempre
14 Casi Nunca Casi Nunca Casi Siempre Casi Siempre Casi Nunca Casi Siempre Casi Siempre Siempre Casi Siempre A Veces A Veces A Veces
15 Casi Siempre Siempre A Veces A Veces Siempre Siempre Siempre Siempre Siempre Siempre Siempre A Veces
16 A Veces A Veces Siempre Siempre Siempre Siempre Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre Casi Siempre
17 A Veces Casi Siempre Siempre Siempre Casi Siempre Siempre Siempre Casi Siempre A Veces Casi Siempre Casi Siempre A Veces
18 Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre A Veces Casi Siempre Casi Siempre Casi Siempre Siempre Siempre Siempre
19 A Veces A Veces A Veces A Veces A Veces A Veces A Veces Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre
20 A Veces A Veces A Veces A Veces Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre
21 A Veces Casi Siempre Casi Siempre A Veces Casi Siempre A Veces A Veces A Veces A Veces Casi Siempre Casi Siempre Casi Siempre
22 Casi Siempre Siempre A Veces Casi Siempre Casi Siempre A Veces Casi Siempre A Veces A Veces A Veces Casi Siempre Casi Siempre
23 A Veces Casi Siempre Casi Nunca Casi Nunca A Veces Casi Siempre Casi Siempre Casi Siempre Siempre A Veces Casi Siempre Casi Nunca
24 Casi Siempre A Veces Casi Siempre Siempre Casi Siempre A Veces Casi Siempre Siempre Casi Siempre A Veces Casi Nunca Casi Nunca
25 Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre Siempre Siempre Casi Siempre A Veces A Veces Casi Nunca Casi Siempre
26 Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre Casi Siempre A Veces Casi Siempre A Veces Casi Siempre
27 A Veces Casi Siempre Siempre A Veces Casi Siempre Casi Siempre Siempre Siempre A Veces Casi Siempre Siempre Casi Siempre
28 A Veces Casi Siempre Casi Siempre A Veces Casi Siempre Casi Siempre Casi Siempre A Veces Casi Siempre Casi Siempre Casi Siempre Siempre
29 Casi Siempre A Veces Casi Siempre Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre A Veces Casi Siempre Casi Nunca Casi Nunca
30 Casi Siempre Casi Siempre Siempre A Veces Casi Siempre Casi Siempre Siempre Siempre A Veces A Veces Casi Nunca Casi Nunca
31 A Veces Siempre Siempre Siempre Siempre Casi Siempre Siempre Siempre Siempre A Veces Casi Siempre Casi Siempre
32 Siempre Siempre Casi Siempre A Veces Siempre Siempre Siempre Casi Siempre Siempre Casi Siempre Casi Nunca Casi Nunca
33 A Veces Casi Siempre Casi Siempre Casi Siempre A Veces Siempre Casi Siempre Casi Siempre A Veces A Veces Casi Nunca Casi Nunca
34 Casi Siempre A Veces A Veces Casi Nunca A Veces A Veces Casi Siempre Casi Siempre Casi Siempre A Veces A Veces Casi Siempre
35 Casi Siempre Siempre Siempre Siempre Siempre Casi Siempre Siempre Siempre Siempre Siempre Siempre Casi Siempre
140
PREGUNTAS
GESTORES
N° 4 - a N° 4 – b N° 4 - c N° 4 – d N° 5 - a N° 5 - b N° 5 – c N° 5 - d N° 5 - e N° 6 - a N° 6 - b N° 6 - c
36 Siempre Casi Siempre Casi Siempre Casi Siempre Siempre Siempre Siempre Casi Siempre Casi Siempre Siempre Casi Siempre Casi Siempre
37 Casi Siempre Siempre Siempre A Veces A Veces Casi Siempre A Veces Casi Nunca A Veces Casi Nunca A Veces A Veces
PREGUNTAS
GESTORES N° 7 - a N° 7 – b N° 7 - c N° 8 N° 9 - a N° 9 – b N° 9 - c N° 9 - d N° 9 - e
Entre 25% a 50%
adicional al costo del
1 Más de 1 día Más de 1 día Más de 1 hora proyecto Muy Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 0% a 15%
adicional al costo del
2 Más de 1 hora Más de 1 hora Más de 1 hora proyecto Muy Importante Importante Importante Importante Muy Importante
Entre 0% a 15%
adicional al costo del
3 Más de 1 día Más de 1 día Más de 1 día proyecto Muy Importante Importante Importante Muy Importante Importante
Entre 15% a 25%
adicional al costo del
4 Más de 1 día Más de 1 hora Más de 1 hora proyecto Muy Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 0% a 15%
adicional al costo del
5 Más de 1 día Más de 1 hora Entre 20 a 60 min proyecto Importante Muy Importante Importante Importante Indiferente
Entre 25% a 50%
adicional al costo del
6 Más de 1 día Más de 1 hora Entre 20 a 60 min proyecto Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 25% a 50%
adicional al costo del
7 Más de 1 día Más de 1 día Más de 1 día proyecto Importante Muy Importante Muy Importante Importante Importante
Entre 50% a 75%
Semanas o adicional al costo del
8 meses Semanas o meses Semanas o meses proyecto Importante Importante Importante Importante Importante
Entre 0% a 15%
Entre 20 a 60 adicional al costo del
9 min Más de 1 hora Entre 20 a 60 min proyecto Importante Muy Importante Importante Importante Importante
Entre 15% a 25%
10 Más de 1 día Más de 1 hora Más de 1 hora adicional al costo del Importante Muy Importante Muy Importante Importante Muy Importante
141
PREGUNTAS
GESTORES N° 7 - a N° 7 – b N° 7 - c N° 8 N° 9 - a N° 9 – b N° 9 - c N° 9 - d N° 9 - e
proyecto
Entre 50% a 75%
adicional al costo del
11 Más de 1 hora Más de 1 hora Entre 20 a 60 min proyecto Poco Importante Importante Muy Importante Muy Importante Importante
Entre 0% a 15%
adicional al costo del
12 Más de 1 hora Más de 1 hora Más de 1 hora proyecto Importante Importante Importante Muy Importante Importante
Entre 15% a 25%
adicional al costo del
13 Más de 1 día Más de 1 hora Más de 1 hora proyecto Muy Importante Importante Importante Muy Importante Muy Importante
Entre 0% a 15%
adicional al costo del
14 Más de 1 día Más de 1 día Más de 1 día proyecto Muy Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 25% a 50%
Semanas o adicional al costo del
15 meses Más de 1 día Más de 1 día proyecto Importante Indiferente Importante Muy Importante Muy Importante
Entre 25% a 50%
Menos de 20 adicional al costo del
16 min Más de 1 hora Más de 1 hora proyecto Muy Importante Importante Importante Muy Importante Muy Importante
Entre 15% a 25%
adicional al costo del
17 Más de 1 día Más de 1 hora Más de 1 hora proyecto Importante Muy Importante Muy Importante Indiferente Importante
Entre 50% a 75%
adicional al costo del
18 Más de 1 día Semanas o meses Más de 1 día proyecto Muy Importante Muy Importante Importante Importante Muy Importante
Entre 15% a 25%
adicional al costo del
19 Más de 1 hora Más de 1 día Más de 1 día proyecto Muy Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 0% a 15%
adicional al costo del
20 Más de 1 hora Más de 1 hora Más de 1 hora proyecto Muy Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 0% a 15%
adicional al costo del
21 Más de 1 día Más de 1 día Más de 1 día proyecto Importante Muy Importante Importante Importante Muy Importante
Entre 15% a 25%
Semanas o adicional al costo del
22 meses Más de 1 día Más de 1 día proyecto Importante Muy Importante Importante Importante Muy Importante
142
PREGUNTAS
GESTORES N° 7 - a N° 7 – b N° 7 - c N° 8 N° 9 - a N° 9 – b N° 9 - c N° 9 - d N° 9 - e
Entre 25% a 50%
adicional al costo del
23 Más de 1 día Semanas o meses Semanas o meses proyecto Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 0% a 15%
Semanas o adicional al costo del
24 meses Semanas o meses Más de 1 día proyecto Muy Importante Muy Importante Muy Importante Indiferente Importante
Entre 25% a 50%
Semanas o adicional al costo del
25 meses Semanas o meses Más de 1 día proyecto Muy Importante Muy Importante Muy Importante Importante Importante
Entre 0% a 15%
adicional al costo del
26 Más de 1 día Más de 1 día Más de 1 hora proyecto Importante Muy Importante Muy Importante Importante Muy Importante
Entre 25% a 50%
Semanas o adicional al costo del
27 meses Semanas o meses Más de 1 día proyecto Muy Importante Muy Importante Muy Importante Importante Muy Importante
Entre 15% a 25%
adicional al costo del
28 Más de 1 día Semanas o meses Más de 1 día proyecto Importante Importante Muy Importante Muy Importante Muy Importante
Entre 15% a 25%
Semanas o adicional al costo del
29 meses Más de 1 día Más de 1 día proyecto Importante Muy Importante Importante Muy Importante Muy Importante
Entre 0% a 15%
Semanas o adicional al costo del
30 meses Semanas o meses Semanas o meses proyecto Importante Importante Importante Muy Importante Muy Importante
Entre 15% a 25%
Semanas o adicional al costo del
31 meses Más de 1 día Más de 1 hora proyecto Importante Importante Muy Importante Muy Importante Muy Importante
Entre 15% a 25%
Semanas o adicional al costo del
32 meses Semanas o meses Más de 1 día proyecto Indiferente Muy Importante Muy Importante Importante Muy Importante
Entre 0% a 15%
adicional al costo del
33 Más de 1 día Semanas o meses Más de 1 día proyecto Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 0% a 15%
Semanas o adicional al costo del
34 meses Más de 1 día Más de 1 día proyecto Importante Muy Importante Muy Importante Muy Importante Muy Importante
Semanas o Entre 25% a 50%
35 meses Semanas o meses Más de 1 día adicional al costo del Indiferente Importante Importante Importante Importante
143
PREGUNTAS
GESTORES N° 7 - a N° 7 – b N° 7 - c N° 8 N° 9 - a N° 9 – b N° 9 - c N° 9 - d N° 9 - e
proyecto
Entre 15% a 25%
adicional al costo del
36 Más de 1 día Semanas o meses Semanas o meses proyecto Muy Importante Muy Importante Muy Importante Muy Importante Muy Importante
Entre 15% a 25%
Semanas o adicional al costo del
37 meses Semanas o meses Más de 1 día proyecto Indiferente Muy Importante Muy Importante Importante Muy Importante
144
Anexo 4: Presupuesto
147
Anexo 5: Cronograma
Año 2017
N° Actividad
Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre
1 Planificación de la investigación
2 Aprobación del plan de tesis
3 Planteamiento del problema