Está en la página 1de 16

1

EL BIG DATA

Presentado por:

Camila Andrea Reyes Uribe

Profesor:
Clara Inés Peña de Carrillo, PhD

UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA


FACULTAD DE CIENCIAS ECONÓMICAS, ADMINISTRATIVAS Y CONTABLES
CURSO: EDUCACIÓN DIGITAL EN LA SOCIEDAD DEL CONOCIMIENTO
Bucaramanga
2020
2

TABLA DE CONTENIDO

Resumen.................................................................................................................................... 4

1. Introducción ....................................................................................................................... 5

2. ¿Qué es el Big Data?.......................................................................................................... 6

2.1 Soluciones informáticas para el tratamiento de Big Data .................................................. 8

3. Características del Big Data............................................................................................... 9

4. Técnicas del Big Data ...................................................................................................... 10

4.1 Minería de datos (DM) ............................................................................................. 10

4.2 Machine Learning..................................................................................................... 10

4.3 Algoritmos Genéticos (GA) ..................................................................................... 10

4.4 Aprendizaje de reglas de asociación (Association rule learning)............................ 10

4.5 Reconocimiento de patrones .................................................................................... 11

5. Beneficios ........................................................................................................................ 11

6. Aplicaciones .................................................................................................................... 11

7. Retos del Big Data ........................................................................................................... 12

8. Mapa Conceptual ............................................................................................................. 12

9. Conclusión ....................................................................................................................... 15

Referencias.............................................................................................................................. 16
3

TABLA DE ILUSTRACIONES

Figura 1. Hadoop ...................................................................................................................... 8

Figura 2. El Big Data ............................................................................................................. 14


4

Resumen

El Big Data es un concepto que ha tomado relevancia en el área tecnológica debido al

crecimiento exponencial de los datos disponibles. Se refiere al análisis de grandes volúmenes de

datos, es una disciplina digital que ha permitido explotar el potencial que se encuentra en los

datos para la toma de decisiones en beneficio de las organizaciones, individuos y sociedad en

general por lo cual tiene gran impacto.

El objetivo de este trabajo es presentar una visión general de sus elementos más básicos

como su definición, funcionamiento, características, beneficios, técnicas y aplicaciones. Esto

mediante la búsqueda de referencias bibliográficas enfocada a artículos de tipo académico y su

posterior análisis. En definitiva, el Big Data se presenta como una herramienta digital muy

oportuna para este siglo en el que la información crece exponencialmente y es el eje para que

muchas compañías se actualicen y se mantengan a flote.

Palabras clave: Datos, tecnología, Big Data.


5

1. Introducción

El Big Data se refiere a una nueva forma de generar, obtener, almacenar, procesar y analizar

información. Esta disciplina surge como respuesta a la rápida evolución en la creación de

información y de datos proveniente de diferentes fuentes. Gardner lo define como activos de

gran volumen de información que llega a gran velocidad de manera variada. (Jiménez,M 2014).

Se caracteriza por 4 v’s las cuales son Volumen, velocidad, variedad y veracidad.

Da la posibilidad de trabajar desde datos sin estructura como los comentarios en las redes

sociales hasta bases de datos más estructuradas. Todo esto a un costo bajo en relación a sus

beneficios lo que le permite el acceso a este tipo de tecnologías de manera más fácil a las

organizaciones y hace mucho más eficiente sus operaciones y toma de decisiones. Asimismo se

suele trabajar desde softwares especializados como lo es Hadoop.

Y aunque la creciente disponibilidad de información representa una ventaja, también puede

representar un reto para el Big Data el lograr depurar dicha información y quedarse con la

información real, esto también requiere más profesionales que desarrollen y se especialicen en

esta tecnología. Este documento se basa en los trabajos y artículos de Benitez Sanchez, J. M.

(2003). Hernández Leal, E. J, Duque-Méndez, & Moreno-Cadavid, J. (2017). Así como el de

Maté Jiménez, C. (2014). Y finalmente el de Sevillano, P.(s.f). Resulta un tema muy interesante

ya que combina informática y negocios.

El documento cuenta con la siguiente estructura: En la sección 1 la presente introducción, en

la sección dos se introduce al concepto de Big Data, en la sección 3 se muestran sus

características, en la sección 4 se presentan las técnicas del Big Data, en la sección 5 se muestran

sus beneficios y en la sección 6 sus aplicaciones. En la sección 7 los retos actuales, en la sección

8 se adjunta un mapa conceptual que resume todo lo anterior y finalmente en la sección 9 las

conclusiones sobre esta temática.


6

2. ¿Qué es el Big Data?

El término Big Data se asocia principalmente al procesamiento de cantidades de datos

exorbitantes, sin embargo Big Data no solo se dirige a gran tamaño, sino que abarca tanto

volumen como variedad de datos y velocidad de acceso y procesamiento. (Hernández-Leal et al.,

2017).

Su surgimiento radica en que debido a la gran cantidad y complejidad de datos que se generan

cada día, los sistemas de gestión y de procesado de datos tradicionales no proporcionan el

servicio necesario. Y estos datos vienen de todas partes: sensores, posts o comentarios en redes

sociales o blogs, transacciones comerciales, señal GPS, etc. (Sevillano, s.f.).

Por su parte (Jiménez,M 2014) presenta el termino proporcionado por el diccionario de

Oxford acerca del Big data. De acuerdo a esta institución son datos de tamaño muy grande,

típicamente hasta el extremo de que su gestión presenta retos logísticos significativos.

Gardner lo define como activos de información que se caracterizan por su volumen elevado,

velocidad elevada y alta variedad, por lo cual demandan soluciones innovadoras y eficientes de

procesado para la mejora del conocimiento y la toma de decisiones en las organizaciones.

(Jiménez,M 2014).

Como se menciona anteriormente los datos del Big Data provienen de diversas fuentes, de

manera específica se identifican 5.

-Grafos de datos

-Datos transaccionales

-Datos web

-Datos científicos

-Aplicaciones que cuentan con datos masivos.


7

Sin embargo de manera general según Maté Jiménez (2014) los datos que se tratan en Big Data

se agrupan en:

a) Datos estructurados: los tradicionalmente conocidos como tablas y bases de datos.

b) Datos semiestructurados: lenguaje XML

c) Datos no estructurados: datos web, emails, mensajes, multimedia

2. El funcionamiento del Big Data

Se pueden encontrar cuatro fases o elementos donde se agrupan o clasifican las diferentes

tecnologías de soporte de su funcionamiento. (Hernández-Leal et al., 2017)

 Generación: es un proceso de diversas actividades de la sociedad, en las que se genera

una cantidad inmensa de datos que se almacena según su naturaleza, y puede ser

estructurada o puede corresponder a datos sin ninguna estructura, pero con características

de gran valor.

Adquisición: esta fase contempla la recolección de los datos generados diariamente, la

trasmisión y pre-procesamiento de estos. Esta fase es muy importante ya que en la

recolección se encuentran conjuntos de datos redundantes o datos inútiles, de manera que

si no se tratan pueden incrementar el espacio de almacenamiento innecesariamente y

afectar los resultados de una fase de análisis.

Almacenamiento: El Big Data ha generado la necesidad de plantear estudios y

propuestas de nuevas estrategias que afronten os tipos de datos que no se pueden gestionar

con un sistema de gestión de bases de datos relacionales. Para esto surgen tecnologías de

almacenamiento de datos masivos como almacenamiento con conexión directa y el

almacenamiento en red, también diferentes motores NoSQL.


8

Análisis:

Atiende a la necesidad de extraer eficazmente información valiosa desde los datos masivos

para generar valor en las organizaciones y facilitar la toma de decisiones, para hacerlo aún más

eficaz se requiere de tecnologías que faciliten incluso el análisis en tiempo real.

2.1 Soluciones informáticas para el tratamiento de Big Data

El tratamiento de dichos volúmenes de datos se realiza, principalmente mediante un software

llamado Hadoop, se trata de una plataforma de software para el cálculo distribuido, fiable y

escalable. A su vez permite escribir con facilidad y ejecutar aplicaciones que procesan inmensas

cantidades de datos.(Maté Jiménez, 2014). De Hadoop, se derivan tres softwares más cada uno

con una función. MapReduce (motor de cálculo offline) , HDFS (sistema de ficheros distribuidos

de Hadoop), Hbase (acceso de datos online).

A continuación en la figura 1, se muestra el icono de Hadoop.

Figura 1. Hadoop
9

3. Características del Big Data

El Big data se caracteriza principalmente con 4v’s

 Volumen: En Big Data se gestionan y procesan cantidades grandes de datos.

 Velocidad: las soluciones Big Data deben procesar datos que llegan constantemente a gran

velocidad. Hay gran velocidad en la llegada, procesamiento, análisis y entrega.

 Variedad: En Big Data es fundamental que exista combinación de fuentes de datos y

formatos, esto para que se pueda determinar si una aplicación puede ser considerada Big Data

 Veracidad: al provenir de tantas fuentes y de manera tan veloz los datos son desorganizados.

Por lo tanto debe existir una capacidad de limpieza que permita la veracidad que minimice lo

incierto o impreciso de los datos y así tomar decisiones de manera sensata.

Sin embargo, con el paso del tiempo se le han atribuido algunas v’s adicionales como:

Confianza en los datos: Quienes toman decisiones en las organizaciones deben confiar en los

datos para dejarse guiar por ellos. La confianza en los datos les da valor y además logran inspirar

confianza a los usuarios.

Valor: El valor consiste en el coste económico de la tecnología y el valor que se obtiene de su

uso.

Volatilidad: muy relacionado con la velocidad.

Variabilidad: Muy relacionado con la variedad.


10

4. Técnicas del Big Data

4.1 Minería de datos (DM)

Es un paso en el proceso de descubrimiento de descubrimiento de conocimiento. Se define

como el proceso de extracción de conocimiento a partir de cúmulos de datos. Y surge de la

necesidad de conocer información útil a partir de los bases de datos crecimiento de los datos

disponibles, se aplica para dar soluciones empresariales y comerciales, ya que con este medio se

descubre información relevante. (Hernández-Leal et al., 2017)

4.2 Machine Learning

Comprende el descubrimiento de modelos, patrones y regularidades en los datos. Y tiene dos

enfoques: el simbólico que trabaja el aprendizaje inductivo de descripciones simbólicas y el

estadístico que se centra en los métodos de reconocimiento de patrones o en la estadística.

(Hernández-Leal et al., 2017)

4.3 Algoritmos Genéticos (GA)

Es una técnica que se aplica en la ingeniería computacional, que parte de una concepción

diferente como la de biológica de la genética. Su enfoque busca dar solución a diversos

problemas matemáticos intangibles que no han podido tener solución desde otros enfoques

matemáticos tradicionales. (Hernández-Leal et al., 2017)

4.4 Aprendizaje de reglas de asociación (Association rule learning)

Es un método usado para relacionar las variables en grandes bases de datos. Lo que hace es

identificar reglas midiendo de relación de intereses, un buen ejemplo de esto es en las redes

sociales revisar las personas que pueden estar interesadas en seguir a otras dependiendo de sus

amistades o seguidores. (Hernández-Leal et al., 2017)


11

4.5 Reconocimiento de patrones

Es una técnica que aplicada especialmente en procesos de ingeniería y computación que

tiene como objetivo extraer información, a partir de un cúmulo de datos, que brinde la posibilidad

de establecer propiedades o relaciones entre estos datos.(Hernández-Leal et al., 2017)

5. Beneficios

De acuerdo a (Hernández-Leal et al., 2017) los principales beneficios del Big Data son:

-Reducción del coste de capital: Hay una reducción del coste de hardware, software y otros

costes de infraestructuras.

-Eficiencia de las operaciones: hay una reducción de los costes operacionales, debido a que

mejoran los métodos de integración, gestión, análisis y entrega de datos

-Mejora de los procesos de negocio: uno de sus beneficios es que aumenta los ingresos

debido, incluye mejoras en el diseño y la prestación de servicios, etc.

-Proporciona conocimiento desde todas las perspectivas y horizontes temporales

Se puede acceder a todo tipo de información.

-Prevención y predicción del fraude o del riesgo.

6. Aplicaciones

Tener acceso a los datos, abre una gran ventana de posibilidades para usarlos a favor de las

empresas, de los individuos, de la sociedad en general, etc. El Big Data tiene diversas

aplicaciones. (Benitez Sanchez, 2003).Las más comunes son:

Predicción de fenómenos: Predicción de fenómenos naturales, crímenes, identificación de

zonas vulnerables, etc. Por ejemplo, google puede predecir la propagación de la gripe utilizando

los términos de búsquedas más comunes.


12

Sistemas de recomendación: se usa principalmente en el comercio electrónico. Muchas

empresas, utilizan los datos de las búsquedas comunes de los que serían clientes potenciales para

así de acuerdo a su comportamiento sugerir que adquiera algún producto o servicio, una

compañía reconocida por utilizar dichas estrategias es Amazon.

Repositorios de información: permite el acceso al conocimiento de forma muy amplia, las

personas tienen a su disposición información de todas las partes del mundo en gran cantidad, etc.

Entre 2003 y 2008

Tecnología cross-sectorial: En la banca y seguros es muy útil para detectar los clientes de

valor, identificar la propensión a la compra, detectar y evitar el fraude.

7. Retos del Big Data

Si bien el Big Data ha facilitado traído muchos beneficios para los individuos y

organizaciones, al ser una tendencia de tan alto crecimiento sus retos son mayores cada día.

Algunos de estos son:

-Carencia de capital humano: cada día se requieren más profesionales calificados para el uso

de Big Data.

-La dificultad en el diseño de sistemas de análisis, se requieren de nuevas arquitecturas

tecnológicas.

-Extraer el valor significativo de los datos, principalmente porque la información creada a

través de la red surgen cada día de manera exponencial y requieren un manejo especial y así

obtener su valor significativo.

8. Mapa Conceptual

A continuación en la figura 2 se presenta de manera mapa conceptual la estructura general

del Big data expresada anteriormente.


13
14

Figura 2. El Big Data


15

9. Conclusión

El Big Data sin lugar a dudas seguirá impulsándose con el paso del tiempo ya que es una

herramienta que le da valor a las organizaciones y a sus procesos sin incurrir en grandes costos.

Tiene gran impacto en la sociedad y las empresas. A los ciudadanos y consumidores les permite

acceder a servicios digitales de mucho más valor e interactuar de manera digital con las

empresas. Es un tema bastante amplio sin embargo estas bases hacen surgir un interés por el

tema. Asimismo es importante conocer este tipo de herramientas que son de utilidad en el campo

de la economía y los negocios.


16

Referencias

Benitez Sanchez, J. M. (2003). tecnología y aplicaciones Big Data : Algoritmos , Contenido.

Tecologias Recientes, 13, 57.

Hernández-Leal, E. J., Duque-Méndez, & Moreno-Cadavid, J. (2017). Big Data: una exploración

de investigaciones, tecnologías y casos de aplicación. TecnoLógicas, 20(39), 15–38.

https://doi.org/10.22430/22565337.685

Maté Jiménez, C. (2014). Big data. Un nuevo paradigma de análisis de datos. Anales de

Mecánica y Electricidad, 10–16. https://www.iit.comillas.edu/docs/IIT-14-153A.pdf

Sevillano, P. (s.f.). Big Data. 16. https://doi.org/10.1002/jemt.1060150207

Hugo Reyes, 2017. Hadoophttps://commons.wikimedia.org/wiki/File:Elephant_hadoop.svg

También podría gustarte