Está en la página 1de 15

PASO 6 - AVANCE DE LA PROPUESTA

Por:
JUAN DAVID PÉREZ REYES
DIANA CAROLINA RUIZ
JUAN MIGUEL MEJIA
MARCEL GIOVANNY HERRERA
GUSTAVO ADOLFO OSORIO

Presentado a:
Diana M Cardona Román
PROYECTO DE GRADO (ING. DE SISTEMAS) - (201014A_614)
GRUPO 201014_60

Universidad Nacional Abierta y a Distancia UNAD


Noviembre 2019
EL PLANTEAMIENTO DEL PROBLEMA

Hoy en día las compañías colombianas desean ocupar un lugar importante


en el mercado nacional el cual está en constante cambio. Por esa razón las
compañías requieren generar nuevas estrategias para mejorar sus productos y
servicios para la satisfacción total de cliente, para esto se deben apoyar en el uso
de la información y datos de toda la compañía para analizar sus fortalezas,
debilidades, oportunidades y amenazas para así tener nuevas oportunidades de
mejora.

Cuando hablamos de información se refiere a grandes volúmenes de datos


almacenados y no digitalizados lo cual suele ser un problema complejo por la cual
toda compañía frecuenta, debido a que es muy difícil la administración y la
mantenibilidad de los mismos, ya que cada día se almacena grandes cantidades
de información haciéndose dispendioso el buen uso.

Por lo general esto suele suceder por no tener sistemas integrales, bases
de datos centralizadas o no contar con las herramientas adecuadas para el
almacenamiento, análisis y gestión de datos.

Dificultando los procesos debido a que se requiere más tiempo, personas y


recursos para el procesamiento y análisis de la información los cuales son vitales
para los procesos internos y externos de la compañía como Mapei.
JUSTIFICACION

Una de las tecnologías que se ha convertido en condición de uso, son los


gestores de bases de datos (SGBD) orientados a los macrodatos, también
llamados como datos masivos o BIG DATA los cuales están orientados al análisis
no convencional en busca de una nueva analítica para inteligencia de negocio
tomado de las distintas fuentes de datos.

La implementación de estas tecnologías es complejo debido su alto impacto


en los procesos de las compañía, pero después de una buena adaptación la
percepción al usuario final será eficiente en cuestión de tiempo y desempeño.

Por eso se requiere diseñar un plan de implementación contemplando todas


necesidades reales del sistema, tanto los recursos a nivel tecnológico, el tiempo
de implementación y capacitación del personal.
OBJETIVO GENERAL

Diseñar o implementar un software de BIG DATA para el manejo de información


de la compañía Mapei.

OBJETIVO ESPECIFICOS

• Identificar las necesidades que tiene la compañía Mapei


• Recolectar, clasificar e interpretar los datos necesarios para determinar los
requerimientos de información.
• Conocer mediante la implementación de un cuestionario, entrevista y
observación los requerimientos.
• Concluir mediante una exposición los resultados obtenidos mediante todo el
proceso de análisis del sistema.
• Identificar la solución a implementar en la empresa Mapei a raíz del análisis
de los síntomas y los efectos de la problemática.

TÍTULO PARA LA INVESTIGACIÓN

Diseño e implementación de un BIG DATA en la empresa Mapei

PREGUNTAS DE INVESTIGACIÓN.
¿Será capaz un sistema de BIG DATA proporcionar control en los datos de forma
rápida y eficaz?

¿Se hacen nulas las pérdidas de información u omisión de los datos, ejerciendo
un control sobre estas?

¿Aumentan las oportunidades de mejora de negocio al tener un control sobre los


datos de la empresa?

¿Se estará cumpliendo con las expectativas del usuario final?


¿Qué tantas fallas podría presentar el sistema de control y gestión de datos?

¿La herramienta cuenta con un protocolo de seguridad viable?

GLOSARIO

Analítica Empresarial (Business Analytics): Análisis de la información que


ayude a la toma decisiones de negocios y para automatizar y optimizar procesos
de negocios

Datos: Es una representación simbólica de un atributo o variable cuantitativa o


cualitativa.

Información: Conjunto organizado de datos procesados.

Base de datos: Conjunto de datos pertenecientes a un mismo contexto y


almacenados sistemáticamente para su posterior uso.

Big Data: En español (grandes datos o grandes volúmenes de datos)

Software: Conjunto de programas y rutinas que permiten a la computadora


realizar determinadas tareas.

Codificar: Diseño y estructuración en lenguaje de programación.

Compilar: Traducir un código de programación a código ejecutable por la


máquina.

SGBD: Sistema gestor de base de datos

Algoritmo: se define como las instrucciones o reglas ordenadas que sirven para
expresar aquello que se busca. En el Big Data, para ser más precisos, ayuda en la
búsqueda de patrones y relaciones entre variables entre tanta cantidad de datos.
Los algoritmos son pilares básicos y necesarios de las actividades digitales y
tecnológicas de hoy en día. En los negocios es un elemento que ayuda a
comprender el comportamiento de los clientes.

Analítica de negocio: es la forma en la que un negocio utiliza sus técnicas para


obtener información a través de sus datos. Se suele hacer mediante análisis
estadísticos.

Analítica predictiva La analítica predictiva es lo que hace el perfil anterior (analista


de datos) con los datos históricos de la empresa. Como bien indica su nombre, es
una ciencia que se utiliza para predecir lo que puede pasar en el negocio en base
a esos datos históricos que utiliza técnicas como la del modelado predictivo
basadas en algoritmos estadísticos y de aprendizaje automático. Esto ayuda a
mejorar la planificación y los resultados.

Analytics: es la forma de capturar, procesar y analizar información para que se


conviertan en insights.

Blaze: este término es importante en programación. Blaze es una interfaz para


consultar datos en diferentes sistemas de almacenamiento. Se le conoce también
como una librería de Python (lenguaje de programación) que ayuda a almacenar,
describir, consultar y procesar datos. Se puede usar para acceder a datos de un
gran número de fuentes como Bcolz, MongoDB, SQLAlchemy, Apache Spark,
PyTables, etc.

Bokeh: Es una librería de Python que se usa para aplicaciones de rendimiento


con datos en streaming y con la que se pueden crear gráficos interactivos en 3D y
aplicaciones webb

Bosque aleatorio: es un método de ensamblado que utiliza varios algoritmos de


aprendizaje. Tal y como define Adobe, este método se utiliza para “obtener un
rendimiento más predictivo que el que podría obtenerse de cualquier algoritmo de
aprendizaje constituyente”. Este algoritmo de “Personalización automatizada es un
método de clasificación o regresión que funciona creando una multitud de árboles
de decisión durante el aprendizaje”.
Ciencia de datos: son métodos científicos en los que se utilizan algoritmos,
estadísticas, procesos, sistemas, ingeniería software para obtener conocimiento,
resolver problemas analíticos y tener un mejor entendimiento de la información.

Clase binaria: es una habilidad matemática que permite que los modelos de
programación no lineal (el proceso para resolver sistemas de igualdades y
desigualdades sujetas a varias restricciones) se resuelvan.

C++: es un lenguaje de programación que se diseñó a finales de los años 70 con


el objetivo de extender al lenguaje de progrmación C mecanismos para la
manipulación de objetos. En Machine learning tiene librerías útiles como LibSVM,
Shark o MLPack.

Data Lake: es el lago de datos en el que el profesional de la ciencia de datos se


baña para conseguir todas las respuestas a las preguntas que ofrece el Big Data.
Es el almacenamiento de toda la información en bruto recogida y que trabaja con
una arquitectura plana.

Data mining: la minería de datos. Este concepto se utiliza para nombrar las
técnicas utilizadas para explorar las bases de datos.

Indicador lift: según define la unidad de datos de telefónica “Luca”, en la minería


de datos y el aprendizaje automático este indicador de confianza “compara la
frecuencia de un patrón observado con la frecuencia en que podríamos ver ese
mismo patrón por casualidad”. “Si el valor de «Lift» es próximo a 1, es muy posible
que el patrón que hemos observado sea mera casualidad. Cuanto mayor sea este
valor, más posibilidades hay de que el patrón sea real”

Lingüística computacional: en las ciencias de la computación, la lingüística


computacional estudia el idioma hablado para convertirlo en datos estructurados
mediante herramientas computacionales.
NoSQL: son sitemas de gestión de bases de datos y estructuras que permiten
almacenar información cuando las bases de datos relacionales dan problemas.

Perl: es un lenguaje de scripting que se diseñó a finales de los años 80. Toma
características del lenguaje C y de otros lenguajes de programación. “Perl se ha
usado mucho para tareas de procesamiento de texto y de limpieza y depuración
de datos”, informa Luca.

Python: es un lenguaje de programación multiparadigma que se utiliza en la


ciencia de datos. Python se utiliza para denominar a las librerías especializadas en
automatic learning y generación de gráficos.

Sentiment Analytics: el análisis de sentimientos o minería de opinión es el proceso


automatizado de comprender una opinión sobre un tema dado del lenguaje escrito
o hablado.

Small data: son los análisis de datos que se realizan sobre cantidades menores a
las consideradas como Big Data.

SQL (Structured Query Language): el lenguaje de consulta estructurada es un


lenguaje específico del dominio que, según informa Luca, “se basa en el uso del
álgebra y cálculos relacionales para realizar consultas a las bases de datos de
manera sencilla. Las consultas se realizan mediante un lenguaje de comandos
que permite seleccionar, insertar, actualizar, averiguar la ubicación de los datos, y
más”.

UIMA (Arquitectura de Gestión de Información Desestructurada): son los sistemas


de software que se utilizan para entender la información no estructurada.

Weka: es una colección de algoritmos de aprendizaje automático para tareas de


minería de datos. Contiene herramientas para la preparación de datos,
clasificación, regresión, agrupación, extracción de reglas de asociación y
visualización.
TECNOLOGÍA MODERNA O DE ALTO IMPACTO DESCRIBIR (BIG DATA)

¿Qué es?

El término BIG DATA que hace referencia a una gran cantidad de datos o
grandes volúmenes de datos que no puede ser utilizado o administrados por el
software convencional donde puede brindar información importante para la
inteligencia de negocio.

¿Para qué sirve?

Big Data brinda información que no está contemplada en el software convencional


lo cual hace posible dar uso a esa información para todo tipo de procesos, generar
indicadores que puedan ser útiles para tomar decisiones, informes de tendencias
del mercado o control de los datos con el fin de diseñar nuevos productos y
servicios.

¿Cuáles son las características principales?

VOLUMEN: administra grandes cantidad de datos que pueden ser obtenidos


desde diferentes fuentes.

VARIEDAD: se puede obtener a través de múltiples canales y fuentes, tipos de


datos en distintos formatos, estructurados y no estructurados.

VELOCIDAD: Rapidez y capacidad de generación de datos a través de redes


sociales y canales digitales, así como también a la capacidad de obtenerlos para
procesarlos y convertirlos en información útil.

VERACIDAD: Una vez obtenidos los datos es posible conocer cuáles de éstos son
válidos y útiles para la organización.

En resumen, podemos decir que, Big Data es pasar de una gran cantidad de
datos no estructurados a estructurados dándoles valor para la inteligencia del
negocio.
¿Cuáles son las ventajas y desventajas?
VENTAJAS

- Implementación de BIG DATA que posibilitan la adquisición de datos y


permiten descubrir las necesidades y puntos de mejora en la compañía.
- El análisis de los datos puede mejorar sustancialmente la toma de
decisiones reduciendo al mínimo los riegos.
- Permite la Segmentación de los clientes

DESVENTAJAS
- El exceso de datos se almacenan y analizan indiscriminadamente solo se
convierten en ruido que ralentizará y obstaculizará las tareas.
- Existen reacciones desfavorables por parte de los usuarios, que consideran
que vulnera su privacidad.

¿Cuáles son las aplicaciones o usos?


- La exploración de grandes datos
Permite darle valor a los datos para tomar mejores decisiones, mejorar las
operaciones y reducir los riesgos.
- Extensión de la seguridad/inteligencia
Mecanismos para localizar anomalías y prevenir ataques.
- Análisis de Operaciones
Permite obtener visibilidad en tiempo real de las operaciones, la experiencia
del cliente, transacciones y comportamiento

¿Por qué se puede aplicar en determinado problema o en ciertos sistemas?


Porque BIG DATA está diseñando para adaptarse a todo tipo de sistemas
sin discriminación donde cuyo fin es trabajar con grandes volúmenes de
datos en gestión y análisis.
¿Por qué se considera una tecnología de punta o moderna?
Porque la tecnología del BIG DATA está en constante evolución y todo
apunta a que jugará un papel todavía más importante en la toma de
decisiones futuras.

MAPA CONCEPTUAL
DECÁLOGO DE BERNAL

CONCEPTO DESCRIPCION

Cronología (¿Cuándo?) En la empresa Mapei Colombia se evidencia una


necesidad de la implementación de un sistema de
análisis de datos Big Data. En los últimos años se han
desperdiciado datos importantes que pueden dar
directrices acerca de las decisiones empresariales y de
mercadeo de la empresa. Se propone la
implementación del sistema para conseguir la
fidelización de clientes y propender por una empresa
más rentable y más moderna en los próximos años.

Axiomas (¿Quién?) La junta directiva, los socios, el gerente, el


departamento de mercadeo son conscientes de la
necesidad de la empresa de aprovechar el gran
volumen de datos que posee y entienden que el
correcto análisis y diferenciación de los mismos puede
generarles ventajas competitivas hacia el futuro.

Método (¿Cómo?) Se ha realizado un diagnóstico inicial de la situación el


cual permite identificar puntos iniciales y
oportunidades para trabajar en la definición del
sistema que permita conseguir el objetivo principal de
desarrollo de la herramienta de manejo Big Data con la
cual se puedan conocer las preferencias, costumbres,
intenciones de compra y finalmente la fidelización de
sus clientes para garantizar la demanda del negocio
durante los próximos años.

Ontología (¿Qué?) Se pretende definir qué tipo de intervención se


requiere y si se puede dar formato a un programa de
análisis ya establecido y si se debe realizar un diseño
a medida de las necesidades y objetivos de la
empresa.

Tecnología (¿Con que?) Realizando una implementación de un sistema de


manejo de datos Big Data, que se alimente de la
misma información que los clientes proveen en cada
una de las visitas e interacciones que realizan con la
empresa.

Teleología (¿Para qué?) El estudio de la implementación del sistema permitirá


conocer la viabilidad del sistema en sí, que logrará
evidenciar rasgos antes no observados de los clientes
y que pueden resultar fundamentales para las
decisiones estratégicas de la empresa en cuanto a
mercadeo y campañas de fidelización de los clientes.

Topografía (¿Dónde?) Se pretende realizar el estudio de diseño e


implementación de manera que al tener una visión
clara del qué hacer se pueda llevar a cabo en cada
una de las sedes donde la empresa Mapei Colombia
tenga servicio a sus clientes.

Ecología (¿Contra qué?) Cuando la empresa logre tener un sistema de análisis


de datos establecido, tendrá acceso modelos de datos
que permitan conocer mejor a sus clientes, de esta
manera se asegura dejar atrás las ventas informales
de las cuales no podía sacar ninguna información útil o
datos aprovechable que redunde en una mejor modelo
de negocio y por ende, mejor rentabilidad para su junta
directiva

Etiología (¿Por qué?) Se hace necesario establecer sistemas de análisis de


datos para competir en un mercado ya algo saturado
con multiplicidad de ofertas, se requiere la
especialización y fidelización de los clientes para tener
éxito organizacional y empresarial.

Experiencia (¿Cuánto?) Este proyecto está basado en investigación aplicada,


ya que se pretende tener un grupo interdisciplinario
que oriente y diseñe la selección e implementación del
sistema de análisis de datos que redunde en la
consecución de los objetivos planteados por la
empresa.
REFERENCIAS
#ADNCLOUD. (2019). ¿Qué es Big Data y para qué sirve?. [online]
Available at: https://blog.mdcloud.es/que-es-big-data-y-para-que-sirve/ [Accessed
1 Nov. 2019].

Máster en Business Intelligence y Data Science. (2019). Ventajas y


desventajas del uso del Big Data - Máster en Business Intelligence y Data
Science. [online] Available at: https://www.master-bigdata.com/ventajas-y-
desventajas-big-data/ [Accessed 1 Nov. 2019].

Morán, A. and Morán, A. (2019). El uso del Big Data en la ciencia. [online]
Dciencia. Available at: https://www.dciencia.es/el-uso-del-big-data-en-la-ciencia/
[Accessed 2 Nov. 2019].

También podría gustarte