Está en la página 1de 19

UNIVERSIDAD AUTONOMA DE SATO DOMINGO

Facultad de Ciencias
Escuela de Informática

Tema de Investigación:

El Big Data

Sustentantes:
IBM
“Desarrollando un camino hacia el futuro”

Larisa de Jesús FD2388


María Beriguete 100528804

Computación Esencial - INF 2060 – 32


Santiago Guillermo Ventura

Santo Domingo. R.D


215/5/2020

2
Contenido

INTRODUCCIÓN 2
I. OBJETIVO GENERAL...............................................................................................................3
III. DESARROLLO........................................................................................................................4
Para qué sirven el Big Data.....................................................................................................5
Tipos de datos según su estructura Además de por su procedencia, es importante
saber que se pueden clasificar los datos según su tipo de estructura en 3 clases:...............5
¿De dónde vienen los datos?..................................................................................................5
Las "tres V" de Big Data............................................................................................................6
El ciclo de gestión de información en 4 fases.................................................................10
¿Cómo funciona Big Data?.....................................................................................................11
1. Integrar...............................................................................................................................11
2. Gestionar.............................................................................................................................12
3. Analizar................................................................................................................................12
Casos de uso de Big Data.......................................................................................................12
Desafíos de la calidad de datos en Big Data....................................................................13
1. Muchas fuentes y tipos de datos:............................................................................14
2. Tremendo volumen de datos.....................................................................................14
3. Mucha volatilidad..........................................................................................................15
4. No existen estándares de calidad de datos unificados....................................15

2
INTRODUCCIÓN

Los datos se han convertido en uno de los mayores activos de muchas empresas. En
plena era de la información, las grandes multinacionales de Internet consiguen
ingresos millonarios a través de las bases de datos de sus usuarios y su análisis. Es
también conocida la definición de Big Data como las tres V, que representan el gran
Volumen de datos que debe ser capaz de tratar, la Velocidad con la que puede
procesar esos datos, y la Variedad de formas que pueden tomar los mismos. En
ocasiones se hace énfasis en el objetivo del Big Data añadiendo una cuarta V, la del
Valor que se obtiene por la información extraída de los datos, aunque esta no se
verá en el detalle de nuestra investigación.

Sin embargo, la simple acumulación de información y datos no es suficiente.


Conocer, clasificar, filtrar y utilizar la información mediante un análisis exhaustivo de
esos datos se hace imprescindible para que los datos se conviertan en verdaderos
activos y generadores de negocio de la empresa. Los clientes están demandando
una transformación digital en todos los sectores sin distinción y las empresas se
han percatado de los beneficios que repercute en su cuenta de resultados gracias
a la optimización de los procesos internos y una óptima toma de decisiones.

En la actualidad son muchos los ejemplos que podemos encontrar en el mundo


sobre los beneficios de la analítica de datos. La analítica de datos también es posible
en muchos casos gracias a las soluciones que las propias empresas crean para
gestionarla.

Finalmente, implica la creación de ventajas competitivas sostenibles, mediante la


explotación por una parte de las reservas de conocimiento provenientes del análisis
detallado de las nuevas fuentes de información, y por otra parte, del desarrollo de
capacidades predictivas provenientes de dicho análisis.

2
I. OBJETIVO GENERAL

Estudiar y comprender la Big Data en sentido general, para que sirve, su estructura,
como funciona entre otros detalles imprescindibles para tener un conocimiento claro
y completo sobre la Big Data.

Objetivo Especifico
 Analizar la estructura de la Big Data
 Conocer las ventajas y desventajas de la misma
 Comprender como funciona la Big Data
 Analizar y conocer el papel que juega el ser humano en el desarrollo de la big
data
En sentido general, tener conocimiento sobre el tema y como en sentido general
podemos aprovechar del mismo en estos tiempos de grandes cambios donde nos
movemos de lo offline a lo online.

II. METODOLOGÍA

El desarrollo de esta investigación se realizó siguiendo dos estrategias. Como


primera estrategia, se hizo una investigación documental por medio de la
herramienta bibliográfica EBESCO, la plataforma de servicios bibliográficos que
brinda la universidad. La segunda estrategia comprende el análisis de algunos
trabajos particulares referentes al soporte y estructura conceptual de la temática
abordada.

2
III. DESARROLLO

El Big Data
Big Data es un término que describe el
gran volumen de datos – estructurados y
no estructurados – que inundan una
empresa todos los días. Pero no es la
cantidad de datos lo importante. Lo que
importa es lo que las organizaciones
hacen con los datos. El Big Data puede
ser analizado para obtener insights que
conlleven a mejores decisiones y
acciones de negocios estratégicas.
El Big Data es el análisis masivo de
datos. Una cuantía de datos, tan
sumamente grande, que las aplicaciones de software de procesamiento de datos que
tradicionalmente se venían usando no son capaces de capturar, tratar y poner en
valor en un tiempo razonable.
Igualmente, el mismo término se refiere a las nuevas tecnologías que hacen posible
el almacenamiento y procesamiento, además de al uso que se hace de la
información obtenida a través de dichas tecnologías.

Para qué sirven el Big Data


Big Data es la posibilidad de explotar comercialmente una gran cantidad de datos
para crear nuevos servicios comerciales. En el mundo se acumulan cada vez más
datos en formato digital pero el problema es que estos datos son en general poco
estructurados y en cantidades ingentes. Son por lo tanto difíciles de explotar por
métodos convencionales. El Big Data consiste en extraer la inteligencia necesaria y
darles valor.

Tipos de datos según su estructura


Además de por su procedencia, es importante saber que se pueden clasificar los
datos según su tipo de estructura en 3 clases:

2
¿De dónde vienen los datos?

Producidos por personas. Mandar un email, escribir un comentario en Facebook,


contestar a una encuesta telefónica, meter información en una hoja de cálculo,
responder a un WhatsApp, coger los datos de contacto de un cliente, hacer clic en
un enlace de Internet… Infinidad de acciones que realizamos en el día a día suponen
una fuente de datos inmensa.
Entre máquinas. Sí, entre máquinas también se comparten datos directamente, en
lo que se conoce igualmente como M2M, que viene del inglés «machine to
machine». Así, los termómetros, parquímetros y sistemas de riego automático de las
ciudades, los GPS de vehículos y teléfonos móviles, las máquinas expendedoras de
bebidas y alimentos en un hospital, o los contadores de electricidad de las viviendas,
por poner unos pocos ejemplos, se comunican a través de dispositivos con otros
aparatos, a los que transmiten los datos que van recogiendo.

Biométricas. Los datos que tienen como origen artefactos como sensores de
huellas dactilares, escáneres de retina, lectores de ADN, sensores de reconocimiento
facial o reconocimiento de voz. Su uso es muy extendido en materia de seguridad en

2
todas sus variantes (privada,
corporativa, militar, policíaca, de
servicios de inteligencia, etcétera).

Marketing web. Nuestros


movimientos en la Red están sujetos a
todo tipo de mediciones que tienen
como objeto estudios de marketing y
análisis de comportamiento.
Transacciones de datos. El traspaso de dinero de una cuenta bancaria a otra, la
reserva de un billete de avión o añadir un artículo a un carrito de compra virtual de
un portal de comercio electrónico, serían algunos ejemplos.

Las "tres V" de Big Data


Volumen La cantidad de datos importa. Con big data, tendrá que procesar
grandes volúmenes de datos no estructurados de baja densidad. Puede
tratarse de datos de valor desconocido, como feeds de datos de
Twitter, flujos de clics de una página web o aplicación para móviles, o
equipo con sensores. Para algunas organizaciones, esto puede suponer
decenas de terabytes de datos. Para otras, incluso cientos de
petabytes.
Velocida La velocidad es el ritmo al que se reciben los datos y (posiblemente) al
d que se aplica alguna acción. La mayor velocidad de los datos
normalmente se transmite directamente a la memoria, en vez de
escribirse en un disco. Algunos productos inteligentes habilitados para
Internet funcionan en tiempo real o prácticamente en tiempo real y
requieren una evaluación y actuación en tiempo real.
Variedad La variedad hace referencia a los diversos tipos de datos disponibles.
Los tipos de datos convencionales eran estructurados y podían
organizarse claramente en una base de datos relacional. Con el auge
del big data, los datos se presentan en nuevos tipos de datos no
estructurados. Los tipos de datos no estructurados y
semiestructurados, como el texto, audio o vídeo, requieren un
preprocesamiento adicional para poder obtener significado y habilitar
los metadatos.

¿Por qué es importante el Big Data?

2
La importancia del Big Data no gira en torno a cuántos datos tiene usted, sino qué
hace con ellos. Puede tomar datos de cualquier fuente y analizarlos para hallar
respuestas que hagan posibles.

1. Reducciones de costos,
2. Reducciones de tiempo,
3. Desarrollo de nuevos productos y soluciones optimizadas,
4. Toma de decisiones inteligente.

Cuando se combina el Big Data con analítica poderosa, se pueden realizar tareas
relacionadas con negocios, tales como:

 Determinar las causas de origen de fallos, problemas y defectos casi en


tiempo real.
 Generar cupones en el punto de venta basados en los hábitos de compra del
cliente.
 Recalcular portafolios de riesgo completos en minutos.
 Detectar conducta fraudulenta antes de que afecte a su organización.

2
Ventajas
Según la capacidad de obtención y análisis
que se tenga del Big Data, la empresa
obtendrá grandes ventajas con relación a
una empresa que no use el análisis de
grandes conjuntos de datos para su
beneficio.

1. Mejor toma de decisiones


Al disponer de un gran tamaño de
información, esta se tomaría como referencia. Con un correcto análisis, ayudará a
tomar más rápidamente y con seguridad las decisiones más acertadas.

2. Conocer los intereses del público


Al recoger mucha información de las búsquedas o interacciones de personas en la
red, tu empresa puede hacerse una buena idea de lo que tu audiencia busca. Esto le
permitirá adaptar su oferta y negocio a los intereses de los clientes y los nuevos
tiempos.

3. Feedback al instante
Aunque la cantidad de datos que se puede llegar a recoger es enorme, es posible
analizarlos al instante para obtener la opinión del cliente acerca de un producto,
pudiendo influir de manera positiva en la mejora del mismo.

Empresas de todo el mundo usan el Big Data para siempre estar al día, adaptando
sus negocios al público en general. Así pueden ofrecer servicios y productos acorde
a las necesidades actuales y los nuevos tiempos.

Desventajas
El Big Data tiene muchas ventajas. No obstante, cuando esta información no es
tratada y analizada por expertos o profesionales en esta materia, puede traer
consigo algunos inconvenientes como:

1. El alto volumen de datos puede ralentizar el análisis


Aunque su gran tamaño sirve para tener una apreciación más real acerca de
algo, también es un gran inconveniente. Ello puede ralentizar el análisis de la
información. Aunque los profesionales en la materia conocen como
seleccionar y omitir grandes patrones de datos.

2
2. Seguridad virtual
En los últimos años los ciberataques han centrado su atención en el Big Data,
debido a la vulnerabilidad de los datos. Esto hace necesario el uso de
herramientas y normas para un trabajo tanto eficaz como responsable del Big
Data.

3. La tecnofobia
Algunas personas consideran que el uso de Big Data es una violación a su
privacidad, ya que utiliza sus interacciones en la red para generar datos,
aunque estos terminen resultando en un producto en su beneficio.

Componentes del Big Data


 Fuentes: las más habituales son los registros históricos de la compañía, los
almacenes de datos, los dispositivos inteligentes, los sistemas de gestión de
datos, Internet y el Internet de las Cosas. Para poder determinarlas es
necesaria la puesta en común de los conocimientos técnicos, por parte de los
desarrolladores, y la perspectiva del negocio, por parte de los analistas.
 Capa de almacenamiento: su función es la de recoger y transformar los
datos sin perder de vista la normativa legal. Además, tiene que dar acceso a
los datos independientemente de su formato, volumen, frecuencia u origen.
 Capa de análisis: se encarga de leer los datos almacenados. Mediante la
utilización de los modelos, los algoritmos y las herramientas adecuadas,
proporciona visibilidad sobre los datos para que puedan ser consultados en la
capa de consumo.
 Capa de consumo: son muchos los proyectos y usuarios que se benefician
del conocimiento extraído en todo este proceso. La forma de consumir los
datos dependerá del destinatario, pero será habitual verlos en forma de
reporting o visualización en tiempo real.

2
El ciclo de gestión de información en 4 fases

Conoces ya de dónde vienen los datos, los tipos de ellos que existen y sus
características principales. Lo siguiente es cómo gestionarlos:

¿Cómo funciona Big Data?


El big data le aporta nuevas perspectivas que abren paso a nuevas oportunidades y
modelos de negocio. Iniciarse en ello requiere de tres acciones clave:

2
1. Integrar
El big data concentra datos de numerosas fuentes y aplicaciones distintas. Los
mecanismos de integración de datos convencionales, tales como ETL (extract,
transform, load [extraer, transformar, cargar]), generalmente no están a la altura de
dicha tarea. Analizar conjuntos de big data de uno o más terabytes, o incluso
petabytes, de tamaño requiere de nuevas estrategias y tecnologías.
Durante la integración, es necesario incorporar los datos, procesarlos y asegurarse
de que estén formateados y disponibles de tal forma que los analistas empresariales
puedan empezar a utilizarlos.
2. Gestionar
El big data requiere almacenamiento. Su solución de almacenamiento puede residir
en la nube, on premises o en ambos. Puede almacenar sus datos de cualquier forma
que desee e incorporar los requisitos de procesamiento de su preferencia y los
motores de procesamiento necesarios a dichos conjuntos de datos on-demand.
Muchas personas eligen su solución de almacenamiento en función de dónde residan
sus datos en cada momento. La nube está aumentando progresivamente su
popularidad porque es compatible con sus requisitos tecnológicos actuales y porque
le permite incorporar recursos a medida que los necesita.
3. Analizar
La inversión en big data se rentabiliza en cuanto se analizan y utilizan los datos.
Adquiera una nueva claridad con un análisis visual de sus diversos conjuntos de
datos. Continúe explorando los datos para realizar nuevos descubrimientos.
Comparta sus hallazgos con otras personas. Construya modelos de datos con
aprendizaje automático e inteligencia artificial. Ponga sus datos a trabajar.

Casos de uso de Big Data

Desarrollo de Empresas como Netflix y Procter & Gamble usan big data para prever

2
productos la demanda de los clientes. Construyen modelos predictivos para
nuevos productos y servicios clasificando atributos clave de productos
anteriores y actuales, y modelando la relación entre dichos atributos y
el éxito comercial de las ofertas. Además, P&G utiliza los datos y la
analítica de grupos de interés, redes sociales, mercados de prueba y
avances de salida en tiendas para planificar, producir y lanzar nuevos
productos.
Mantenimient Los factores capaces de predecir fallos mecánicos pueden estar
o predictivo profundamente ocultos entre datos estructurados (año del equipo,
marca o modelo de una máquina) o entre datos no estructurados que
cubren millones de entradas de registros, datos de sensores, mensajes
de error y temperaturas de motor. Al analizar estos indicadores de
problemas potenciales antes de que estos se produzcan, las
organizaciones pueden implantar el mantenimiento de una forma más
rentable y optimizar el tiempo de servicio de componentes y equipos.
Experiencia La carrera para clientes está en marcha. Disponer de una vista clara
del cliente de la experiencia del cliente es más posible que nunca. El big data le
permite recopilar datos de redes sociales, visitas a páginas web,
registros de llamadas y otras fuentes para mejorar la experiencia de
interacción, así como maximizar el valor ofrecido. Empiece a formular
ofertas personalizadas, reducir las tasas de abandono de los clientes y
gestionar las incidencias de manera proactiva.
Fraude y En lo que a seguridad se refiere, no se enfrenta a simples piratas
conformidad informáticos deshonestos, sino a equipos completos de expertos. Los
contextos de seguridad y requisitos de conformidad están en constante
evolución. El big data le ayuda a identificar patrones en los datos que
pueden ser indicativos de fraude, al tiempo que concentra grandes
volúmenes de información para agilizar la generación de informes
normativos.
Machine El machine learning o aprendizaje automático es un tema candente en
Learning la actualidad. Los datos, concretamente big data, es uno de los
motivos de que así sea. Ahora, en lugar de programarse, las máquinas
pueden aprender. Esto es posible gracias a la disponibilidad de big
data para crear modelos de machine learning.
Eficiencia Puede que la eficiencia operativa no sea el aspecto más destacado en
operativa los titulares, pero es el área en que big data tiene un mayor impacto.
El big data le permite analizar y evaluar la producción, la opinión de los
clientes, las devoluciones y otros factores para reducir las situaciones
de falta de stock y anticipar la demanda futura. El big data también
puede utilizarse para mejorar la toma de decisiones en función de la
demanda de mercado en cada momento.
Impulse la El big data puede ayudarle a innovar mediante el estudio de las
innovación interdependencias entre seres humanos, instituciones, entidades y
procesos, y, posteriormente, mediante la determinación de nuevas
formas de usar dicha información. Utilice las perspectivas que le
ofrecen los datos para mejorar sus decisiones financieras y
consideraciones de planificación. Estudie las tendencias y lo que
desean los clientes para ofrecer nuevos productos y servicios. Implante
políticas de precios dinámicas. Las posibilidades son infinitas.

2
Desafíos de la calidad de datos en Big Data
Hasta la llegada del Big Data, mediante ETL podíamos cargar la información
estructurada que teníamos almacenada en nuestro sistema ERP y CRM, por ejemplo.
Pero ahora, podemos cargar información adicional que ya no se encuentra dentro de
los dominios de la empresa: comentarios o likes en redes sociales, resultados de
campañas de marketing, datos estadísticos de terceros, etc. Todos estos datos nos
ofrecen información que nos ayuda a saber si nuestros productos o servicios están
funcionando bien o por el contrario están teniendo problemas.
Algunos desafíos a los que se enfrenta la calidad de datos de Big Data son:
1. Muchas fuentes y tipos de datos:
Con tantas fuentes, tipos de datos y estructuras complejas, la dificultad de
integración de datos aumenta.
Las fuentes de datos de Big Data son muy amplias:
o Datos de internet y móviles.
o Datos de Internet de las Cosas.
o Datos sectoriales recopilados por empresas especializadas.
o Datos experimentales.

Y los tipos de datos también lo son:


a. Tipos de datos no estructurados: documentos, vídeos, audios, etc.
b. Tipos de datos semi-estructurados: software, hojas de cálculo,
informes.
c. Tipos de datos estructurados
Solo el 20% de información es estructurada y eso puede provocar muchos errores si
no acometemos un proyecto de calidad de datos.

2
2. Tremendo volumen de datos
Como ya hemos visto, el volumen de datos es enorme, y eso complica la ejecución
de un proceso de calidad de datos dentro de un tiempo razonable.
Es difícil recolectar, limpiar, integrar y obtener datos de alta calidad de forma rápida.
Se necesita mucho tiempo para transformar los tipos no estructurados en tipos
estructurados y procesar esos datos.

3. Mucha volatilidad
Los datos cambian rápidamente y eso hace que tengan una validez muy corta. Para
solucionarlo necesitamos un poder de procesamiento muy alto.
Si no lo hacemos bien, el procesamiento y análisis basado en estos datos puede
producir conclusiones erróneas, que pueden llevar a cometer errores en la toma de
decisiones.
4. No existen estándares de calidad de datos unificados
En 1987 la Organización Internacional de Normalización (ISO) publicó las normas
ISO 9000 para garantizar la calidad de productos y servicios. Sin embargo, el estudio
de los estándares de calidad de los datos no comenzó hasta los años noventa, y no
fue hasta 2011 cuando ISO publicó las normas de calidad de datos ISO 8000.
Estas normas necesitan madurar y perfeccionarse. Además, la investigación sobre la
calidad de datos de big data ha comenzado hace poco y no hay apenas resultados.
La calidad de datos de big
data es clave, no solo para
poder obtener ventajas
competitivas sino también
impedir que incurramos en
graves errores estratégicos
y operacionales
basándonos en datos
erróneos con
consecuencias que pueden
llegar a ser muy graves.

2
El lado humano de la analítica de Big Data
En última instancia, el valor y la eficacia de los grandes datos depende de los
operadores humanos encargados de comprender los datos y formular las consultas
adecuadas para dirigir proyectos de big data. Algunas grandes herramientas de
datos se encuentran con nichos especializados y permiten a los usuarios menos
técnicos hacer varias predicciones a partir de datos de negocios cotidianos. Sin
embargo, otras herramientas están apareciendo, como los dispositivos Hadoop, para
ayudar a las empresas a implementar una infraestructura de computación adecuada
para abordar grandes proyectos de datos, minimizando la necesidad de hardware y
conocimientos de software de computación distribuida.
Pero estas herramientas sólo abordan casos de uso limitados. Muchas otras grandes
tareas de datos, como la determinación de la efectividad de un nuevo fármaco,
pueden requerir una gran experiencia científica y computacional del personal
analítico. Actualmente hay una escasez de científicos de datos y otros analistas que
tengan experiencia trabajando con grandes datos en un entorno de código abierto
distribuido.

2
IV. CONCLUSIÓN
Este trabajo es de gran importancia para nosotras ya que nos ayudó a afianzar
nuestros conocimientos con respecto al tema de la Big Data, la importancia del
mismo para así comprender mejor como el mismo ha llegado a tener gran
importancia e influencia en el mundo entero. Así como también pudimos analizar
cómo influye de manera positiva, analizamos las dimensiones significativas en el
tratamiento de datos, como son la variedad, velocidad y veracidad. La Big Data no
busca sustituir a los sistemas tradicionales, sino construir una nueva tendencia
donde se construyan arquitecturas de sistemas que permitan manejar todas las
peticiones. Uno de los análisis más importantes es el que podemos hacer partiendo
de los diferentes usos que se le da a la big data y como estos han venido creciendo
de forma exponencial en el tiempo.

2
V. RECOMENDACIONES
 Agregar una materia que trate sobre este tema en el plan de estudios de la
carrera de informática, ya sea de manera obligatoria, o como optativa un
poco más avanzada.
 Que los estudiantes reciban capacitación en esta área no solo del como
capación curricular, sino también como capacitación extracurricular, con
cursos especializados y diplomados.
 Que incorporen a la universidad un sistema de Big Data o de Análisis de Big
Data que le permita a la institución a través de los recursos que posee y
aprovechando la cantidad de personas que cohabitan en ella explotar al
máximo toda la información o toda la data en ella generada.

2
VI. Bibliografía
 https://www.masterbigdataucm.com/que-es-big-data/
 https://es.calameo.com/books/0052816652a87a00de5f7
 https://www.sciencedirect.com/science/article/pii/S071686401930001X
 https://www.powerdata.es/big-data
 https://www.sas.com/es_mx/insights/big-data/what-is-big-data.html
 https://www.oracle.com/es/big-data/what-is-big-data.html

También podría gustarte