Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EL BIG DATA
Presentado por:
Profesor:
Clara Inés Peña de Carrillo, PhD
TABLA DE CONTENIDO
Resumen.................................................................................................................................... 4
1. Introducción ....................................................................................................................... 5
5. Beneficios ........................................................................................................................ 11
6. Aplicaciones .................................................................................................................... 11
9. Conclusión ....................................................................................................................... 15
Referencias.............................................................................................................................. 16
3
TABLA DE ILUSTRACIONES
Resumen
datos, es una disciplina digital que ha permitido explotar el potencial que se encuentra en los
El objetivo de este trabajo es presentar una visión general de sus elementos más básicos
posterior análisis. En definitiva, el Big Data se presenta como una herramienta digital muy
oportuna para este siglo en el que la información crece exponencialmente y es el eje para que
1. Introducción
El Big Data se refiere a una nueva forma de generar, obtener, almacenar, procesar y analizar
gran volumen de información que llega a gran velocidad de manera variada. (Jiménez,M 2014).
Se caracteriza por 4 v’s las cuales son Volumen, velocidad, variedad y veracidad.
Da la posibilidad de trabajar desde datos sin estructura como los comentarios en las redes
sociales hasta bases de datos más estructuradas. Todo esto a un costo bajo en relación a sus
beneficios lo que le permite el acceso a este tipo de tecnologías de manera más fácil a las
organizaciones y hace mucho más eficiente sus operaciones y toma de decisiones. Asimismo se
representar un reto para el Big Data el lograr depurar dicha información y quedarse con la
información real, esto también requiere más profesionales que desarrollen y se especialicen en
esta tecnología. Este documento se basa en los trabajos y artículos de Benitez Sanchez, J. M.
Maté Jiménez, C. (2014). Y finalmente el de Sevillano, P.(s.f). Resulta un tema muy interesante
características, en la sección 4 se presentan las técnicas del Big Data, en la sección 5 se muestran
sus beneficios y en la sección 6 sus aplicaciones. En la sección 7 los retos actuales, en la sección
8 se adjunta un mapa conceptual que resume todo lo anterior y finalmente en la sección 9 las
exorbitantes, sin embargo Big Data no solo se dirige a gran tamaño, sino que abarca tanto
2017).
Su surgimiento radica en que debido a la gran cantidad y complejidad de datos que se generan
servicio necesario. Y estos datos vienen de todas partes: sensores, posts o comentarios en redes
Oxford acerca del Big data. De acuerdo a esta institución son datos de tamaño muy grande,
Gardner lo define como activos de información que se caracterizan por su volumen elevado,
velocidad elevada y alta variedad, por lo cual demandan soluciones innovadoras y eficientes de
(Jiménez,M 2014).
Como se menciona anteriormente los datos del Big Data provienen de diversas fuentes, de
-Grafos de datos
-Datos transaccionales
-Datos web
-Datos científicos
Sin embargo de manera general según Maté Jiménez (2014) los datos que se tratan en Big Data
se agrupan en:
Se pueden encontrar cuatro fases o elementos donde se agrupan o clasifican las diferentes
una cantidad inmensa de datos que se almacena según su naturaleza, y puede ser
estructurada o puede corresponder a datos sin ninguna estructura, pero con características
de gran valor.
propuestas de nuevas estrategias que afronten os tipos de datos que no se pueden gestionar
con un sistema de gestión de bases de datos relacionales. Para esto surgen tecnologías de
Análisis:
Atiende a la necesidad de extraer eficazmente información valiosa desde los datos masivos
para generar valor en las organizaciones y facilitar la toma de decisiones, para hacerlo aún más
llamado Hadoop, se trata de una plataforma de software para el cálculo distribuido, fiable y
escalable. A su vez permite escribir con facilidad y ejecutar aplicaciones que procesan inmensas
cantidades de datos.(Maté Jiménez, 2014). De Hadoop, se derivan tres softwares más cada uno
con una función. MapReduce (motor de cálculo offline) , HDFS (sistema de ficheros distribuidos
Figura 1. Hadoop
9
Velocidad: las soluciones Big Data deben procesar datos que llegan constantemente a gran
formatos, esto para que se pueda determinar si una aplicación puede ser considerada Big Data
Veracidad: al provenir de tantas fuentes y de manera tan veloz los datos son desorganizados.
Por lo tanto debe existir una capacidad de limpieza que permita la veracidad que minimice lo
Sin embargo, con el paso del tiempo se le han atribuido algunas v’s adicionales como:
Confianza en los datos: Quienes toman decisiones en las organizaciones deben confiar en los
datos para dejarse guiar por ellos. La confianza en los datos les da valor y además logran inspirar
uso.
necesidad de conocer información útil a partir de los bases de datos crecimiento de los datos
disponibles, se aplica para dar soluciones empresariales y comerciales, ya que con este medio se
Es una técnica que se aplica en la ingeniería computacional, que parte de una concepción
problemas matemáticos intangibles que no han podido tener solución desde otros enfoques
Es un método usado para relacionar las variables en grandes bases de datos. Lo que hace es
identificar reglas midiendo de relación de intereses, un buen ejemplo de esto es en las redes
sociales revisar las personas que pueden estar interesadas en seguir a otras dependiendo de sus
tiene como objetivo extraer información, a partir de un cúmulo de datos, que brinde la posibilidad
5. Beneficios
De acuerdo a (Hernández-Leal et al., 2017) los principales beneficios del Big Data son:
-Reducción del coste de capital: Hay una reducción del coste de hardware, software y otros
costes de infraestructuras.
-Eficiencia de las operaciones: hay una reducción de los costes operacionales, debido a que
-Mejora de los procesos de negocio: uno de sus beneficios es que aumenta los ingresos
6. Aplicaciones
Tener acceso a los datos, abre una gran ventana de posibilidades para usarlos a favor de las
empresas, de los individuos, de la sociedad en general, etc. El Big Data tiene diversas
zonas vulnerables, etc. Por ejemplo, google puede predecir la propagación de la gripe utilizando
empresas, utilizan los datos de las búsquedas comunes de los que serían clientes potenciales para
así de acuerdo a su comportamiento sugerir que adquiera algún producto o servicio, una
personas tienen a su disposición información de todas las partes del mundo en gran cantidad, etc.
Tecnología cross-sectorial: En la banca y seguros es muy útil para detectar los clientes de
Si bien el Big Data ha facilitado traído muchos beneficios para los individuos y
organizaciones, al ser una tendencia de tan alto crecimiento sus retos son mayores cada día.
-Carencia de capital humano: cada día se requieren más profesionales calificados para el uso
de Big Data.
tecnológicas.
través de la red surgen cada día de manera exponencial y requieren un manejo especial y así
8. Mapa Conceptual
9. Conclusión
El Big Data sin lugar a dudas seguirá impulsándose con el paso del tiempo ya que es una
herramienta que le da valor a las organizaciones y a sus procesos sin incurrir en grandes costos.
Tiene gran impacto en la sociedad y las empresas. A los ciudadanos y consumidores les permite
acceder a servicios digitales de mucho más valor e interactuar de manera digital con las
empresas. Es un tema bastante amplio sin embargo estas bases hacen surgir un interés por el
tema. Asimismo es importante conocer este tipo de herramientas que son de utilidad en el campo
Referencias
Hernández-Leal, E. J., Duque-Méndez, & Moreno-Cadavid, J. (2017). Big Data: una exploración
https://doi.org/10.22430/22565337.685
Maté Jiménez, C. (2014). Big data. Un nuevo paradigma de análisis de datos. Anales de