Está en la página 1de 16

Hoja de respuestas

Módulo: Impacto y valor del Big Data


Nombre y apellidos: Dennis Patricio Carrillo Coello
Fecha de entrega:
Caso 1. Diseño de arquitectura para visión cliente 360 º

Enunciado

Diseñar la arquitectura funcional de una plataforma big data que proporcione


una visión 360 º de los clientes. En ella, deberían reflejarse:

● Las fuentes de datos que se van a procesar como entrada. Explicar cuáles de
estas fuentes son estructuradas, semiestructuradas y no estructuradas.
● Diferenciar todas las capas de almacenamiento que tendrá la solución.
Explicar y justificar el porqué de cada una de ellas.

IMF Business School


Big Data se refiere a datos masivos que al ser relacionados entre si, dan información
relevante del comportamiento de datos mas complejos

Con LoT o internet de las cosas, es posible interactuar con todos los datos desde
cualquier lugar y en cualquier maquina

Para diseñar una arquitectura eficiente de Big Data nos hemos enfocado en las siguientes
funciones:

• Procesamiento de datos en tiempo real


• Eficiencia de Procesos
• Almacenamiento de datos van siendo generado y procesados
• Análisis de incidencias a partir de datos generados por dispositivos IoT.
• Optimización de procesos

IMF Business School


IMF Business School
Bases de datos corporativas y Archivo de datos externos: Aquí puede ir catalogado datos
estructurados y semiestructurados ya que se almacenara todos los datos que las empresas
tienen registrados y los datos externos que tienen importancia en los datos finales como
coste de proveedores, datos del sector, etc.
Datos no estructurados: Datos de redes sociales que son difíciles de separar, al igual que
datos del internet de las cosas y datos de dispositivos, como patrones en el chat o datos de
navegación.

Para llegar a esa arquitectura es necesario evaluar cuales y cuantos dispositivos pueden
ofrecer estos datos o pueden convertirse en inteligentes a través de sensores capaces de
recopilar los datos el análisis requerido.

Almacenes de datos especializados, Hadoop, diseñado para aportar necesidades de análisis


específicas para un único departamentode la empresa, por ejemplo Marketing,
Gerenciamiento, Acontecimientos y sucesos, etc…

IMF Business School


Apache Sqoop es la librería que hemos elegido ya nos permite importar datos desde un
almacenamiento de datos estructurado, a Hadoop. Igualmente una vez que hayamos procesado los
datos con Hadoop podemos exportar el resultado a un base de datos relacional.
Sqoop nos permite importar datos a otras bases de datos como Hive, además que suministra una
herramienta desde línea de comando a través de la cual se puede realizar todo el proceso de
importación y exportación de datos desde una base de datos relacional a un sistema de ficheros
distribuidos y viceversa.

Posteriormente usamos Apache Spark, por su velocidad al procesar datos a gran escala, asi como
también posee Api fáciles de usar para procesamiento de datos a gran escala.
Tiene gran apertura con lenguajes como Java, R, Phyton y esto facilita la manipulación de datos
estructurados y semiestructurados.

Finalmente tenemos a MongoDB que lo hemos elegido por su bajo costo, su veracidad al tener una
base de datos muy amplia.
Cualquier ordenador o servidor es ideal para MongoDB y tener un buen servidor para los proyectos

IMF Business School


Para el canal de distribución de datos hemos elegido apache Apache Kafka por su baja latencia, alta
escalabilidad y tolerancia a fallos ; tiene algunos beneficios como:

- Permite a aplicaciones distribuidas publicar datos en tiempo real a los canales Kafka.
- Permite a los sistemas consumir datos en tiempo real.
- Ofrece un catálogo de conectores, que están englobados en Kafka Connect, que te permite de
manera muy cómoda ingestar datos a tópicos de Kafka o enviar datos desde tópicos de Kafka a otros
sistemas.

Incluye un componente para procesado de datos en tiempo real llamado Spark Streams, que no hemos
utilizado en la implementación que estamos mostrando, que ofrece muy baja latencia y permite aplicar
transformación de datos.

IMF Business School


Trabajamos con tecnologías punteras de procesamiento de datos tales como Kafka y Spark de la suite
Apache Hadoop, así como tecnologías de visualización en cuadros de mando como Qlik Sense, Power BI .
Estas tecnologías permiten realizar sistemas de procesamiento de datos capaces de ofrecer a clientes
información relevante sobre sus procesos productivos que les han permitido analizar y optimizar el
funcionamiento de su negocio.

Las ventajas de por ejemplo Power BI y Qlink como visualización es que:


• Unifica los procesos analíticos: gestiona de manera simultánea los datos e información procedentes
de diversas plataformas.
• Es una herramienta visual: La interfaz de Power BI y Qlink nos permite interpretar los datos
visualizadas con mucha facilidad y de manera ágil.
• Seguridad y privacidad: se garantiza la seguridad de los datos, ofreciendo rigurosos controles de
accesibilidad
• Control y rentabilida: pueden tener el control de todo lo que sucede en la compañía, analizar su
rendimiento, optimizar su productividad e impulsar su rentabilidad.

IMF Business School


Caso 2. Analizar el índice de madurez del modelo de negocio de big data en el
caso de John Deere.

Enunciado

Al final del ejercicio, se proporciona la traducción al español del siguiente artículo:

Ferguson, S. “John deere bets the farm on AI, IoT”; 2018. [En línea]

En el texto, se habla del proceso de transformación abordado por el fabricante de


equipamiento agrícola John Deere. Leer el artículo y, utilizando el índice de madurez del
modelo de negocio de big data de la figura, hacer un análisis explicando y justificando en
qué etapa estaría John Deere en el momento que se describe en el artículo y qué etapas
crees que ha seguido la empresa hasta llegar ahí o, en su caso, qué etapas seguirá
posteriormente para completar las etapas descritas en el modelo.

IMF Business School


IMF Business School
ORGANIZACION

IMF Business School


INFRAESTRUCTURA

IMF Business School


ADMINISTRACION DE DATOS

IMF Business School


ANALITICA

IMF Business School


GOBIERNO

IMF Business School


BIBLIOGRAFIA

- John Deere: facturación neta mundial 2001-2020, https://es.statista.com/estadisticas/600694/ventas-netas-e-


ingresos-de-john-deere-a-nivel-mundial/
- “¿Qué Es Power Bi?: Ventajas y Tipos De Licencias - EVOTIC: Transformación Digital Inteligente.” EVOTIC, 17 Sept.
2021, https://evotic.es/business-intelligence-bi/que-es-power-bi-ventajas-y-tipos-de-licencias/.
- Admin. “Business Intelligence Archivos - Página 2 De 2 - EVOTIC: Transformación Digital Inteligente.” EVOTIC,
https://evotic.es/category/business-intelligence-bi/page/2/.
- Ilabaca, Sebastian. “¿Qué Es Apache Spark?” Analytics10, 6 Feb. 2019, https://www.analytics10.com/que-es-
apache-spark/.
- Ventajas y desventajas de MongoDB, https://openwebinars.net/blog/ventajas-y-desventajas-de-mongodb/

IMF Business School

También podría gustarte