Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Ciencias
Escuela de Informática
Tema de Investigación:
El Big Data
Sustentantes:
IBM
“Desarrollando un camino hacia el futuro”
2
Contenido
INTRODUCCIÓN 2
I. OBJETIVO GENERAL...............................................................................................................3
III. DESARROLLO........................................................................................................................4
Para qué sirven el Big Data.....................................................................................................5
Tipos de datos según su estructura Además de por su procedencia, es importante
saber que se pueden clasificar los datos según su tipo de estructura en 3 clases:...............5
¿De dónde vienen los datos?..................................................................................................5
Las "tres V" de Big Data............................................................................................................6
El ciclo de gestión de información en 4 fases.................................................................10
¿Cómo funciona Big Data?.....................................................................................................11
1. Integrar...............................................................................................................................11
2. Gestionar.............................................................................................................................12
3. Analizar................................................................................................................................12
Casos de uso de Big Data.......................................................................................................12
Desafíos de la calidad de datos en Big Data....................................................................13
1. Muchas fuentes y tipos de datos:............................................................................14
2. Tremendo volumen de datos.....................................................................................14
3. Mucha volatilidad..........................................................................................................15
4. No existen estándares de calidad de datos unificados....................................15
2
INTRODUCCIÓN
Los datos se han convertido en uno de los mayores activos de muchas empresas. En
plena era de la información, las grandes multinacionales de Internet consiguen
ingresos millonarios a través de las bases de datos de sus usuarios y su análisis. Es
también conocida la definición de Big Data como las tres V, que representan el gran
Volumen de datos que debe ser capaz de tratar, la Velocidad con la que puede
procesar esos datos, y la Variedad de formas que pueden tomar los mismos. En
ocasiones se hace énfasis en el objetivo del Big Data añadiendo una cuarta V, la del
Valor que se obtiene por la información extraída de los datos, aunque esta no se
verá en el detalle de nuestra investigación.
2
I. OBJETIVO GENERAL
Estudiar y comprender la Big Data en sentido general, para que sirve, su estructura,
como funciona entre otros detalles imprescindibles para tener un conocimiento claro
y completo sobre la Big Data.
Objetivo Especifico
Analizar la estructura de la Big Data
Conocer las ventajas y desventajas de la misma
Comprender como funciona la Big Data
Analizar y conocer el papel que juega el ser humano en el desarrollo de la big
data
En sentido general, tener conocimiento sobre el tema y como en sentido general
podemos aprovechar del mismo en estos tiempos de grandes cambios donde nos
movemos de lo offline a lo online.
II. METODOLOGÍA
2
III. DESARROLLO
El Big Data
Big Data es un término que describe el
gran volumen de datos – estructurados y
no estructurados – que inundan una
empresa todos los días. Pero no es la
cantidad de datos lo importante. Lo que
importa es lo que las organizaciones
hacen con los datos. El Big Data puede
ser analizado para obtener insights que
conlleven a mejores decisiones y
acciones de negocios estratégicas.
El Big Data es el análisis masivo de
datos. Una cuantía de datos, tan
sumamente grande, que las aplicaciones de software de procesamiento de datos que
tradicionalmente se venían usando no son capaces de capturar, tratar y poner en
valor en un tiempo razonable.
Igualmente, el mismo término se refiere a las nuevas tecnologías que hacen posible
el almacenamiento y procesamiento, además de al uso que se hace de la
información obtenida a través de dichas tecnologías.
2
¿De dónde vienen los datos?
Biométricas. Los datos que tienen como origen artefactos como sensores de
huellas dactilares, escáneres de retina, lectores de ADN, sensores de reconocimiento
facial o reconocimiento de voz. Su uso es muy extendido en materia de seguridad en
2
todas sus variantes (privada,
corporativa, militar, policíaca, de
servicios de inteligencia, etcétera).
2
La importancia del Big Data no gira en torno a cuántos datos tiene usted, sino qué
hace con ellos. Puede tomar datos de cualquier fuente y analizarlos para hallar
respuestas que hagan posibles.
1. Reducciones de costos,
2. Reducciones de tiempo,
3. Desarrollo de nuevos productos y soluciones optimizadas,
4. Toma de decisiones inteligente.
Cuando se combina el Big Data con analítica poderosa, se pueden realizar tareas
relacionadas con negocios, tales como:
2
Ventajas
Según la capacidad de obtención y análisis
que se tenga del Big Data, la empresa
obtendrá grandes ventajas con relación a
una empresa que no use el análisis de
grandes conjuntos de datos para su
beneficio.
3. Feedback al instante
Aunque la cantidad de datos que se puede llegar a recoger es enorme, es posible
analizarlos al instante para obtener la opinión del cliente acerca de un producto,
pudiendo influir de manera positiva en la mejora del mismo.
Empresas de todo el mundo usan el Big Data para siempre estar al día, adaptando
sus negocios al público en general. Así pueden ofrecer servicios y productos acorde
a las necesidades actuales y los nuevos tiempos.
Desventajas
El Big Data tiene muchas ventajas. No obstante, cuando esta información no es
tratada y analizada por expertos o profesionales en esta materia, puede traer
consigo algunos inconvenientes como:
2
2. Seguridad virtual
En los últimos años los ciberataques han centrado su atención en el Big Data,
debido a la vulnerabilidad de los datos. Esto hace necesario el uso de
herramientas y normas para un trabajo tanto eficaz como responsable del Big
Data.
3. La tecnofobia
Algunas personas consideran que el uso de Big Data es una violación a su
privacidad, ya que utiliza sus interacciones en la red para generar datos,
aunque estos terminen resultando en un producto en su beneficio.
2
El ciclo de gestión de información en 4 fases
Conoces ya de dónde vienen los datos, los tipos de ellos que existen y sus
características principales. Lo siguiente es cómo gestionarlos:
2
1. Integrar
El big data concentra datos de numerosas fuentes y aplicaciones distintas. Los
mecanismos de integración de datos convencionales, tales como ETL (extract,
transform, load [extraer, transformar, cargar]), generalmente no están a la altura de
dicha tarea. Analizar conjuntos de big data de uno o más terabytes, o incluso
petabytes, de tamaño requiere de nuevas estrategias y tecnologías.
Durante la integración, es necesario incorporar los datos, procesarlos y asegurarse
de que estén formateados y disponibles de tal forma que los analistas empresariales
puedan empezar a utilizarlos.
2. Gestionar
El big data requiere almacenamiento. Su solución de almacenamiento puede residir
en la nube, on premises o en ambos. Puede almacenar sus datos de cualquier forma
que desee e incorporar los requisitos de procesamiento de su preferencia y los
motores de procesamiento necesarios a dichos conjuntos de datos on-demand.
Muchas personas eligen su solución de almacenamiento en función de dónde residan
sus datos en cada momento. La nube está aumentando progresivamente su
popularidad porque es compatible con sus requisitos tecnológicos actuales y porque
le permite incorporar recursos a medida que los necesita.
3. Analizar
La inversión en big data se rentabiliza en cuanto se analizan y utilizan los datos.
Adquiera una nueva claridad con un análisis visual de sus diversos conjuntos de
datos. Continúe explorando los datos para realizar nuevos descubrimientos.
Comparta sus hallazgos con otras personas. Construya modelos de datos con
aprendizaje automático e inteligencia artificial. Ponga sus datos a trabajar.
Desarrollo de Empresas como Netflix y Procter & Gamble usan big data para prever
2
productos la demanda de los clientes. Construyen modelos predictivos para
nuevos productos y servicios clasificando atributos clave de productos
anteriores y actuales, y modelando la relación entre dichos atributos y
el éxito comercial de las ofertas. Además, P&G utiliza los datos y la
analítica de grupos de interés, redes sociales, mercados de prueba y
avances de salida en tiendas para planificar, producir y lanzar nuevos
productos.
Mantenimient Los factores capaces de predecir fallos mecánicos pueden estar
o predictivo profundamente ocultos entre datos estructurados (año del equipo,
marca o modelo de una máquina) o entre datos no estructurados que
cubren millones de entradas de registros, datos de sensores, mensajes
de error y temperaturas de motor. Al analizar estos indicadores de
problemas potenciales antes de que estos se produzcan, las
organizaciones pueden implantar el mantenimiento de una forma más
rentable y optimizar el tiempo de servicio de componentes y equipos.
Experiencia La carrera para clientes está en marcha. Disponer de una vista clara
del cliente de la experiencia del cliente es más posible que nunca. El big data le
permite recopilar datos de redes sociales, visitas a páginas web,
registros de llamadas y otras fuentes para mejorar la experiencia de
interacción, así como maximizar el valor ofrecido. Empiece a formular
ofertas personalizadas, reducir las tasas de abandono de los clientes y
gestionar las incidencias de manera proactiva.
Fraude y En lo que a seguridad se refiere, no se enfrenta a simples piratas
conformidad informáticos deshonestos, sino a equipos completos de expertos. Los
contextos de seguridad y requisitos de conformidad están en constante
evolución. El big data le ayuda a identificar patrones en los datos que
pueden ser indicativos de fraude, al tiempo que concentra grandes
volúmenes de información para agilizar la generación de informes
normativos.
Machine El machine learning o aprendizaje automático es un tema candente en
Learning la actualidad. Los datos, concretamente big data, es uno de los
motivos de que así sea. Ahora, en lugar de programarse, las máquinas
pueden aprender. Esto es posible gracias a la disponibilidad de big
data para crear modelos de machine learning.
Eficiencia Puede que la eficiencia operativa no sea el aspecto más destacado en
operativa los titulares, pero es el área en que big data tiene un mayor impacto.
El big data le permite analizar y evaluar la producción, la opinión de los
clientes, las devoluciones y otros factores para reducir las situaciones
de falta de stock y anticipar la demanda futura. El big data también
puede utilizarse para mejorar la toma de decisiones en función de la
demanda de mercado en cada momento.
Impulse la El big data puede ayudarle a innovar mediante el estudio de las
innovación interdependencias entre seres humanos, instituciones, entidades y
procesos, y, posteriormente, mediante la determinación de nuevas
formas de usar dicha información. Utilice las perspectivas que le
ofrecen los datos para mejorar sus decisiones financieras y
consideraciones de planificación. Estudie las tendencias y lo que
desean los clientes para ofrecer nuevos productos y servicios. Implante
políticas de precios dinámicas. Las posibilidades son infinitas.
2
Desafíos de la calidad de datos en Big Data
Hasta la llegada del Big Data, mediante ETL podíamos cargar la información
estructurada que teníamos almacenada en nuestro sistema ERP y CRM, por ejemplo.
Pero ahora, podemos cargar información adicional que ya no se encuentra dentro de
los dominios de la empresa: comentarios o likes en redes sociales, resultados de
campañas de marketing, datos estadísticos de terceros, etc. Todos estos datos nos
ofrecen información que nos ayuda a saber si nuestros productos o servicios están
funcionando bien o por el contrario están teniendo problemas.
Algunos desafíos a los que se enfrenta la calidad de datos de Big Data son:
1. Muchas fuentes y tipos de datos:
Con tantas fuentes, tipos de datos y estructuras complejas, la dificultad de
integración de datos aumenta.
Las fuentes de datos de Big Data son muy amplias:
o Datos de internet y móviles.
o Datos de Internet de las Cosas.
o Datos sectoriales recopilados por empresas especializadas.
o Datos experimentales.
2
2. Tremendo volumen de datos
Como ya hemos visto, el volumen de datos es enorme, y eso complica la ejecución
de un proceso de calidad de datos dentro de un tiempo razonable.
Es difícil recolectar, limpiar, integrar y obtener datos de alta calidad de forma rápida.
Se necesita mucho tiempo para transformar los tipos no estructurados en tipos
estructurados y procesar esos datos.
3. Mucha volatilidad
Los datos cambian rápidamente y eso hace que tengan una validez muy corta. Para
solucionarlo necesitamos un poder de procesamiento muy alto.
Si no lo hacemos bien, el procesamiento y análisis basado en estos datos puede
producir conclusiones erróneas, que pueden llevar a cometer errores en la toma de
decisiones.
4. No existen estándares de calidad de datos unificados
En 1987 la Organización Internacional de Normalización (ISO) publicó las normas
ISO 9000 para garantizar la calidad de productos y servicios. Sin embargo, el estudio
de los estándares de calidad de los datos no comenzó hasta los años noventa, y no
fue hasta 2011 cuando ISO publicó las normas de calidad de datos ISO 8000.
Estas normas necesitan madurar y perfeccionarse. Además, la investigación sobre la
calidad de datos de big data ha comenzado hace poco y no hay apenas resultados.
La calidad de datos de big
data es clave, no solo para
poder obtener ventajas
competitivas sino también
impedir que incurramos en
graves errores estratégicos
y operacionales
basándonos en datos
erróneos con
consecuencias que pueden
llegar a ser muy graves.
2
El lado humano de la analítica de Big Data
En última instancia, el valor y la eficacia de los grandes datos depende de los
operadores humanos encargados de comprender los datos y formular las consultas
adecuadas para dirigir proyectos de big data. Algunas grandes herramientas de
datos se encuentran con nichos especializados y permiten a los usuarios menos
técnicos hacer varias predicciones a partir de datos de negocios cotidianos. Sin
embargo, otras herramientas están apareciendo, como los dispositivos Hadoop, para
ayudar a las empresas a implementar una infraestructura de computación adecuada
para abordar grandes proyectos de datos, minimizando la necesidad de hardware y
conocimientos de software de computación distribuida.
Pero estas herramientas sólo abordan casos de uso limitados. Muchas otras grandes
tareas de datos, como la determinación de la efectividad de un nuevo fármaco,
pueden requerir una gran experiencia científica y computacional del personal
analítico. Actualmente hay una escasez de científicos de datos y otros analistas que
tengan experiencia trabajando con grandes datos en un entorno de código abierto
distribuido.
2
IV. CONCLUSIÓN
Este trabajo es de gran importancia para nosotras ya que nos ayudó a afianzar
nuestros conocimientos con respecto al tema de la Big Data, la importancia del
mismo para así comprender mejor como el mismo ha llegado a tener gran
importancia e influencia en el mundo entero. Así como también pudimos analizar
cómo influye de manera positiva, analizamos las dimensiones significativas en el
tratamiento de datos, como son la variedad, velocidad y veracidad. La Big Data no
busca sustituir a los sistemas tradicionales, sino construir una nueva tendencia
donde se construyan arquitecturas de sistemas que permitan manejar todas las
peticiones. Uno de los análisis más importantes es el que podemos hacer partiendo
de los diferentes usos que se le da a la big data y como estos han venido creciendo
de forma exponencial en el tiempo.
2
V. RECOMENDACIONES
Agregar una materia que trate sobre este tema en el plan de estudios de la
carrera de informática, ya sea de manera obligatoria, o como optativa un
poco más avanzada.
Que los estudiantes reciban capacitación en esta área no solo del como
capación curricular, sino también como capacitación extracurricular, con
cursos especializados y diplomados.
Que incorporen a la universidad un sistema de Big Data o de Análisis de Big
Data que le permita a la institución a través de los recursos que posee y
aprovechando la cantidad de personas que cohabitan en ella explotar al
máximo toda la información o toda la data en ella generada.
2
VI. Bibliografía
https://www.masterbigdataucm.com/que-es-big-data/
https://es.calameo.com/books/0052816652a87a00de5f7
https://www.sciencedirect.com/science/article/pii/S071686401930001X
https://www.powerdata.es/big-data
https://www.sas.com/es_mx/insights/big-data/what-is-big-data.html
https://www.oracle.com/es/big-data/what-is-big-data.html