Está en la página 1de 20

BIG DATA

BASE DE DATOS

2023
Departamento De Ciencias Exactas, Físicas Y Naturales

Ingeniería en sistemas de información y Licenciatura en sistemas


de información

Monografía

Asignatura: Base de Datos

Equipo de Cátedra: Prof. Tit. Ing. Emilio Rearte (ISI y LSI - La Rioja).

Prof. Adj. Lic. Diego Candelero (LSI - Chamical).

Prof. Ay. 1ra. Ing. José L. Andrada (ISI y LSI - La Rioja).

Prof. Adsc. María Laura Zapata (ISI - La Rioja).

Alumnos:

Cobresi Manresa, Juan Martin EISI961


Índice

Introducción .......................................................................................................... 4

Definición.............................................................................................................. 5

¿Por qué el Big Data es tan importante? .............................................................. 6

Características ..................................................................................................... 8

Ventajas Big Data ................................................................................................. 9

Desventajas de Big Data .................................................................................... 10

Tecnología y Métodos en el procesamiento del Big Data .................................. 12


Herramientas ................................................................................................................ 13

Aplicaciones de Big Data.................................................................................... 14

Desafíos de la calidad de datos en Big Data ...................................................... 15

Big data con un crecimiento exponencial ........................................................... 18

Conclusión.......................................................................................................... 20
Introducción

El término “Big Data” se refiere al volumen masivo de datos estructurados y no


estructurados que se generan constantemente en la sociedad actual. La dificultad
surge debido a factores como el volumen, la velocidad, la variedad y la complejidad
de los datos. A medida que aumenta la diversidad de fuentes de información y la
cantidad de datos crece exponencialmente, se ha vuelto necesario desarrollar
tecnologías especializadas para manejarlos. La creciente importancia de Big Data
radica en cómo se procesan, analizan y utilizan estos datos para tomar decisiones
informadas y mejorar el funcionamiento de los negocios, las instituciones y la vida
cotidiana. En esta monografía, discutiremos los conceptos asociados con Big Data,
sus aplicaciones, principales tecnologías y métodos empleados en su procesamiento,
desafíos y tendencias futuras.

BIG DATA 4
Definición

Denominamos Big Data a la gestión y análisis de enormes volúmenes de datos


que no pueden ser tratados de manera convencional, ya que superan los límites
y capacidades de las herramientas de software habitualmente utilizadas para la
captura, gestión y procesamiento de datos.

Dicho concepto engloba infraestructuras, tecnologías y servicios que han sido


creados para dar solución al procesamiento de enormes conjuntosde datos
estructurados, no estructurados o semi-estructurados (mensajes en redes
sociales, señales de móvil, archivos de audio, sensores, imágenes digitales,
datos de formularios, emails, datos de encuestas, etc.).

El objetivo de Big Data, al igual que los sistemas analíticos convencionales, es


convertir el Dato en información que facilita la toma de decisiones, incluso en
tiempo real. Sin embargo, más que una cuestión detamaño es una oportunidad
de negocio. Las empresas ya están utilizando Big Data para entender el perfil,
las necesidades y el sentir de sus clientes respecto a los productos y/o servicios
vendidos. Esto adquiere especial relevancia ya que permite adecuar la forma en
la que interactúa la empresa con sus clientes y en cómo les prestan servicio.

BIG DATA 5
¿Por qué el Big Data es tan importante?

Lo que hace que Big Data sea tan útil para muchas empresas es el hecho
de que proporciona respuestas a muchas preguntas que las empresas ni
siquiera sabían que tenían. En otras palabras, proporciona un punto de
referencia. Con una cantidad tan grande de información, los datos pueden
ser moldeados o probados de cualquier manera que la empresa considere
adecuada. Al hacerlo, las organizaciones son capaces de identificar los
problemas de una forma más comprensible.

La recopilación de grandes cantidades de datos y la búsqueda de tendencias


dentro de los datos permiten que las empresas se muevan mucho más
rápidamente, sin problemas y de manera eficiente. También les permite
eliminar las áreas problemáticas antes de que los problemas acaben con sus
beneficios o su reputación.

El análisis de Big Data ayuda a las organizaciones a aprovechar sus datos y


utilizarlos para identificar nuevas oportunidades. Eso, a su vez, conduce a
movimientos de negocios más inteligentes, operaciones más eficientes,
mayores ganancias y clientes más felices. Las empresas con más éxito con
Big Data consiguen valor de las siguientes formas:

▪ Reducción de coste: Las grandes tecnologías de datos, como Hadoop


y el análisis basado en la nube, aportan importantes ventajas en
términos de costes cuando se trata de almacenargrandes cantidades
de datos, además de identificar maneras más eficientes de hacer
negocios.

BIG DATA 6
▪ Más rápido, mejor toma de decisiones: Con la velocidadde
Hadoop y la analítica en memoria, combinada con la capacidad de
analizar nuevas fuentes de datos, las empresas pueden analizar la
información inmediatamente y tomar decisiones basadas en lo que han
aprendido.

▪ Nuevos productos y servicios: Con la capacidad de medir las


necesidades de los clientes y la satisfacción a través de análisis viene
el poder de dar a los clientes lo que quieren. Con la analítica de Big
Data, más empresas están creando nuevos productos para satisfacer
las necesidades de los clientes.

BIG DATA 7
Características

Los macrodatos se pueden describir por las siguientes características:

 Volumen: Es el gran volumen de datos que se generan o recolectan.


Estos volúmenes masivos provienen de diversas fuentes, como redes
sociales, sensores IoT, registros empresariales y transacciones
comerciales.

 Variedad: Diversidad en los tipos de datos generados, incluidos datos


estructurados (bases de datos), semiestructurados (XML, JSON) y no
estructurados (imágenes, videos, audio).

 Velocidad: Se refiere a la rapidez con la que los datos son generados,


transmitidos y procesados. El Big Data se genera frecuentemente en
tiempo real, lo que hace necesario que los sistemas puedan procesarlo
rápidamente para obtener información o tomar decisiones pertinentes.

 Veracidad: La calidad y exactitud de los datos recopilados.

 Valor: Es el obtenido a través del análisis y utilización efectiva de Big


Data. Se centra en las ventajas que supone para la empresa u
organización disponer de esta recopilación de datos para tomar sus
decisiones estratégicas.

BIG DATA 8
Trabajar con Big Data tiene que servir para aportar valor a la sociedad, las
empresas, los gobiernos, en definitiva, a las personas; todo el proceso tiene
que ayudar a impulsar el desarrollo, la innovación y la competitividad, pero
también mejorar la calidad de vida de las personas.

Ventajas Big Data

• Mejora en la toma de decisiones


Disponer de un gran volumen de datos estructurados que se puedan
interpretar ayuda a las organizaciones a poder tomar una decisión.

• Feedback a tiempo real

Incluso en los momentos en los que es necesario tomar una decisión


inmediata, el Big Data es un arma muy poderosa puesto que permite
recibir y procesar los datos a tiempo real y contar con la información
necesaria rápidamente. El Big Data es por encima de todo una
tecnología ágil y veloz que permite por ejemplo obtener información a
tiempo real del lanzamiento de un producto o el resultado de una
estrategia.

• Conocimiento del mercado

BIG DATA 9
El conocimiento del mercado en el que se opera puede ayudar no solo a
la toma de decisiones, sino también a la localización de posibles
oportunidades mediante el tratamiento de estos datosestructurados y
comparables. También puede ayudar a predecir posibles escenarios e
incluso a conocer mejor a los consumidores, mediante un análisis
segmentado.

• Tecnología del presente y del futuro

La tecnología del Big Data está en constante evolución y todo apunta a


que jugará un papel todavía más importante en la toma de decisiones
futuras. Por ello, cada vez son más las organizaciones que afrontan el
reto de la transformación digital por lo que los profesionales de Business
Intelligence se convirtieron en uno de los perfiles más demandados. Una
nueva profesión para la que ya existen formaciones como el MBA del
Instituto Europeo de Posgrado, con especialidad en Business
Intelligence y Big Data.

Desventajas de Big Data

• Ataques informáticos

Dado el valor de esta información, las empresas que cuentan con un


sistema de Big Data disponen igualmente de la tecnología más puntera
en seguridad puesto que el hackeo de estos datos puede suponer una

BIG DATA 10
importante crisis para sucorporación. Esto significa que mucha de esa
información se puede llegar a ver alterada y violada. Estas empresas
si se pierde o se altera la información se pierde un activo importante
para la empresa.

• Perdida de privacidad

Debido que constantemente toda nuestra generación de datos ésta


siendo estudiada por las empresas esto hace que se puede llegar a
perder privacidad. No obstante hasta ahora esos datos solamente les
pertenecen a las empresas.

• Mucha volatilidad

Los datos cambian rápidamente y eso hace que tengan una validez muy
corta. Para solucionarlo necesitamos un poder de procesamiento muy
alto.

Si no lo hacemos bien, el procesamiento y análisis basado en estos datos


puede producir conclusiones erróneas, que pueden llevar a cometer
errores en la toma de decisiones.

No existen estándares de calidad de datos unificados.

BIG DATA 11
Tecnología y Métodos en el procesamiento del Big Data

Existen muchísimas herramientas para tratar con big data. Algunos


ejemplos incluyen Hadoop, NoSQL, Cassandra, inteligencia empresarial,
aprendizaje automático y MapReduce. Estas herramientas tratan con
algunos de los 3 tipos de big data:

➢ Datos estructurados: Son datos que tienen bien definidos su longitud


y su formato, como las fechas, los números o las cadenas de
caracteres. Se almacenan en tablas. Un ejemplo son las bases de
datos relacionales y los almacenes de datos.

➢ Datos no estructurados: Son datos que carecen de un formato


determinado. No se pueden almacenar dentro de una tabla ya que no se
puede desgranar su información a tipos básicos de datos. Algunos
ejemplos son los PDF, documentos multimedia, correos electrónicos o
documentos de texto.

➢ Datos semiestructurados: Son datos que no pertenecen a bases de


datos relacionales, ya que no se limitan a campos determinados, pero
que contiene marcadores para separar los diferentes elementos. Es una
información poco regular como para ser gestionada de una forma
estándar. Estos datos poseen sus propios metadatos semiestructurados
que describen los objetos y las relaciones entre ellos, y pueden acabar
siendo aceptados por convención. Como ejemplos tenemos los archivos
tipo hojas de cálculo, HTML, XML, JSON, o los datos almacenados en
bases de datos NoSQL.

BIG DATA 12
Herramientas

 Hadoop: Es un framework de código abierto que permite el


procesamiento distribuido de grandes conjuntos de datos a través de
múltiples servidores. Se compone de dos componentes principales: el
sistema de archivos distribuidos Hadoop (HDFS) y el modelo de
programación MapReduce.

 NoSQL: Es una categoría de bases de datos diseñadas para gestionar


datos no estructurados, especialmente cuando hay necesidad de escalar
horizontalmente y proporcionar alta disponibilidad. Algunas de las bases
de datos NoSQL populares incluyen MongoDB, Couchbase y Cassandra.

 Machine Learning y Analytics: El Big Data se utiliza con frecuencia en


conjunto con técnicas de machine learning y análisis avanzado, lo que
permite a las organizaciones extraer insights valiosos e identificar
patrones ocultos en los datos.

 Sistemas de análisis: Apache Hive, Elasticsearch

 Visualización de datos: Tableau, QlikView

BIG DATA 13
Aplicaciones de Big Data

 Negocios: marketing, ventas, logística, servicios al cliente.

 Salud: diagnóstico temprano de enfermedades, investigación genómica


y optimización del tratamiento médico.

 Gobierno: monitoreo de la seguridad pública, prevención del fraude,


planificación urbana y política pública.

BIG DATA 14
 Finanzas: detección de fraude bancario, administración de riesgos y
toma de decisiones de inversión.

 Medios sociales: análisis de sentimientos, medición del compromiso y


recomendaciones personalizadas.

Desafíos de la calidad de datos en Big Data

Las especiales características del Big Data hacen que su calidad de datos
se enfrente a múltiples desafíos. Se trata de las conocidas como 5 Vs:
Volumen, Velocidad, Variedad, Veracidad y Valor, que definen la
problemática del Big Data.

BIG DATA 15
Estas 5 características del big data provocan que las empresas tengan
problemas para extraer datos reales y de alta calidad, de conjuntos de datos
tan masivos, cambiantes y complicados.

Algunos desafíos a los que se enfrenta la calidad de datos de Big Data


son:

1) Muchas fuentes y tipos de datos

Con tantas fuentes, tipos de datos y estructuras complejas, la dificultadde


integración de datos aumenta.

Las fuentes de datos de big data son muy amplias:

• Datos de internet y móviles.

• Datos de Internet de las Cosas.

• Datos sectoriales recopilados por empresas especializadas.

• Datos experimentales.

Y los tipos de datos también lo son:

1) Tipos de datos no estructurados: documentos, vídeos, audios, etc.

2) Tipos de datos semi-estructurados: software, hojas de cálculo,


informes.

3) Tipos de datos estructucrurados: bases de datos.

BIG DATA 16
Solo el 20% de información es estructurada y eso puede provocar muchos
errores si no acometemos un proyecto de calidad de datos.

2) Tremendo volumen de datos

Como ya hemos visto, el volumen de datos es enorme, y eso complica la


ejecución de un proceso de calidad de datos dentro de un tiempo razonable.

Es difícil recolectar, limpiar, integrar y obtener datos de alta calidad de forma


rápida. Se necesita mucho tiempo para transformar los tipos no estructurados
en tipos estructurados y procesar esos datos.

3) Mucha volatilidad

Los datos cambian rápidamente y eso hace que tengan una validez muy corta.
Para solucionarlo necesitamos un poder de procesamiento muy alto.

Si no lo hacemos bien, el procesamiento y análisis basado en estos datos puede


producir conclusiones erróneas, que pueden llevar a cometer errores en la toma
de decisiones.

BIG DATA 17
Big data con un crecimiento exponencial

Tengamos en cuenta que actualmente el ritmo de crecimiento de los datos


es exponencial, de esta manera, es lógico pensar en nuevas herramientas
que nos ayuden en el tratamiento de estos silos de información, que pueden
provenir de múltiples y diferentes canales, como:

❖ Histórico de datos, datos acumulados durante años, que pueden arrojar


estadísticas y tendencias muy representativas

❖ Redes sociales, muy útiles si podemos filtrar y analizar el feedback de


nuestros clientes y proveedores.

❖ ClickStream, conocer la navegación y el uso que hacen nuestros


clientes de nuestro sitio web.

❖ Sensores, pueden llegar a generar auténticas montañas de datos para


evaluar.

❖ Dispositivos móviles, la incorporación de los mismos a las estructuras


empresariales siguiendo BYOD (Bring Your Own Device).

❖ Internet, es una poderosa herramienta si somo capaces de organizar la


información que necesitamos.

BIG DATA 18
Al plantearnos la necesidad de llevar a cabo una implantación de big data,
debemos tener en cuenta que por un lado dispondremos de una solución para
nuestros datos estructurados (RDBMS convencional) y no estructurados o
semi (Hadoop) y que necesitaremos dar respuesta al análisis de datos, para
ello el ecosistema Big data dispone de múltiples soluciones, algunas de bajo
nivel y otras que nos abstraen de esa complejidad, pero que necesitaremos
responder.

BIG DATA 19
Conclusión

El Big Data ha transformado la forma en que se recolecta, almacena, procesa e


interpreta información a gran escala. La adopción de herramientas y tecnologías
adecuadas permite a las empresas e instituciones aprovechar el potencial de los
datos para mejorar sus operaciones, tomar decisiones informadas, proporcionar
mejores servicios a sus clientes y aumentar su rentabilidad. Sin embargo, también
es necesario abordar los desafíos éticos y legales que la revolución del Big Data
plantea en relación con el respeto a la privacidad, la protección de los datos
personales, la transparencia de los algoritmos y la responsabilidad de sus
resultados. El Big Data ofrece grandes oportunidades, pero también implica
grandes responsabilidades para quienes lo utilizan y lo regulan.

BIG DATA 20

También podría gustarte