Está en la página 1de 7

Big Data:

Termino poco conocido, pero se oirá mucho en los próximos años.

Alguna vez te has preguntado porque Amazon te recomienda crema anti arrugas si
apenas tienes 30 años?

Ciencia del computo que se encarga de la captación, ordenamiento, almacenamiento y


análisis de grandes volúmenes de información de distintas fuentes, con la finalidad de
obtener insigths que permitan entender mejor a un consumidor, patrón de consumo, un
comportamiento, siempre buscando un insigths que permita ofrecer un mejor servicio.

Cuando tienes tanta información disponible, eres capaz de identificar patrones que antes
eran imposibles de ver, y esta información vale muchísimo dinero, la importancia del
negocio del Big data en el mercado mundial es tan grande que cuatro de las cinco marcas
más valiosas del mundo (Apple, Google, Microsoft, Facebook, Coca-Cola) son
proveedoras de datos.

Veamos la big data como una ensalada de información hecha de muchos ingredientes,
ingredientes como, por ejemplo: el like que le diste a tu amigo gordo que bajó de peso
gracias a un entrenador de Instagram, o tu post de Facebook que habla de la cacería ilegal
de ardilla marina, tu retweet de animal político que está muy interesante pero muy
larguísimo que ni si quiera leíste y lo sabes, todos libros de historia y búsquedas en
Google.

Este boom de datos masivos, existe gracias al almacenamiento digital, con la llegada de
la era digital no lo cambió la manera en la que almacenamos información, sino el tipo de
información que generamos, piénsenlo bien. Por ejemplo, el Vaticano podría pagar por
saber cuantas personas han googleado ¿Existe Dios?, Ósea Google sabe que eres ateo.

Herramientas en la nube:

Uno de los objetivos del uso de las tecnologías Big Data es el de transformar los datos en
conocimiento útil para la empresa, y para ello se necesitan herramientas Big Data que nos
ayuden a analizar, procesar y almacenar todos los datos recogidos. Un gran número de
entre las mejores herramientas usadas en Big Data son open Source, lo que da fe del
éxito de este modelo de desarrollo, además de las alternativas de pago.
1. Hadoop:
No se puede hablar de Big Data sin hablar de la veterana Apache Hadoop. Esta
herramienta se considera el framework estándar para almacenamiento de
grandes volúmenes de datos; se usa también para analizar y procesar, y es
utilizado por empresas como Facebook y Yahoo!.
La biblioteca Hadoop utiliza modelos de programación simples para el
almacenamiento y procesamiento distribuido de grandes conjuntos de datos en
clusters, dando redundancia para no perder nada y, al mismo tiempo,
aprovechando muchos procesos a la vez.

2. MongoDB:
Dentro de las bases de datos NoSQL, probablemente una de las mas famosas
sea MongoDB. Con un concepto muy diferente al de las bases de datos
relacionales alternativa para almacenar los datos de nuestras aplicaciones.
MongoDB es una base de datos orientada a documentos (guarda los datos en
documentos, no registros). Estos documentos son almacenados en BSON, que
es una representación binaria de JSON.

3. Elasticsearch:
Elasticsearch es una potente herramienta para la búsqueda entre grandes
cantidades de datos, especialmente cuando los datos son de tipo complejo.
Nos permite indexar y analizar en tiempo real un gran volumen de datos y
hacer consultas sobre ellos. Un ejemplo de uso son consultas de texto
completo; al estar los datos indexados, los resultados se obtienen de forma
muy rápida.

4. Apache Spark:
Apache Spark es un motor de procesamiento de datos de código abierto
realmente rápido.
Creado por Matei Zaharia, se considera el primer software open Source que
hace la programación distribuida (muy en esencia, consiste en distribuir el
trabajo entre un grupo de ordenadores, “cluster”, que trabajan como uno)
realmente accesible a los científicos de datos.
5. Apache Storm:
Apache Storm es un sistema de computación distribuida en tiempo real
orientado a procesar flujos constantes de datos, por ejemplo, datos de sensores
que se emiten con una alta frecuencia o datos que provengan de las redes
sociales, donde a veces es importante saber qué se está compartiendo en este
momento.

Tipos de big Data

1. Web y Redes Sociales


Incluye contenido web e información que es obtenida de las redes sociales
como Facebook, Twitter, LinkedIn, etc.
2. Datos de grandes transacciones (Big Transaction Data)
Incluye registros de facturación, en telecomunicaciones registros detallados de
las llamadas (CDR), etc. Estos datos transaccionales están disponibles en
formato tanto semi estructurados como no estructurados.
3. Machine-to-Machine(M2M)
Se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M
utiliza dispositivos como sensores o medidores que capturan algún evento en
particular, los cuales se transmiten a través de redes alámbricas, inalámbricas
o hibridas a otras aplicaciones que traducen estos eventos en información
significativa, seguridad e inteligencia. Los datos biométricos han sido
información importante para las agencias de investigación.
4. Biométricas
Información biométrica en la que se incluye huellas digitales, escaneo de la
retina, reconocimiento facial, genética, etc. En el área de seguridad e
inteligencia, los datos biométricos han sido información importante para las
agencias de investigación.
5. Generados por los seres humanos (Human Generated)
Las personas generamos diversas cantidades de datos como la información que
guarda un call center al establecer una llamada telefónica, notas de voz,
correos electrónicos, documentos electrónicos, estudios médicos, etc.
Que otros tipos de existen BD

Además, según su estructura, puede clasificarse en tres tipos:

1. Datos estructurados
Datos cuya longitud y formato están bien definidos y están almacenados en
tablas. Pueden se ordenados y procesados fácilmente por cualquier
herramienta de gestión de datos. Son datos estructurados las fechas, las hojas
de datos o las bases de datos.
2. Datos semiestructurados
Información ni regular y, por tanto, no se puede gestionar de una forma
estándar. Estos datos poseen sus propios metadatos semiestructurados que
describen los objetos y las relaciones entre ellos, y pueden acabar siendo
aceptados por convención. HTML, JSON o XML son ejemplos de datos
semiestructurados.
3. Datos no estructurados
Datos binarios que no tienen estructura interna identificable. Es un
conglomerado masivo y desorganizado de datos que no tienen valor hasta que
se organizan, identificándolos y almacenándolos. Algunos ejemplos de datos
no estructurados son imágenes, videos, audios, PDFs, RRS o .txt.

Que otras tecnologías han aparecido

Big Data se expande cada vez más a diversos tipos de clientes y empresas, pero ¿qué
tecnologías tienen más demanda y prometen el mayor potencial de crecimiento?

Presentamos las 10 tecnologías que cumplen con las expectativas del cliente:

1. Análisis predictivo: Soluciones de software y/o hardware que permiten a las


empresas descubrir, evaluar, optimizar e implementar modelos predictivos
mediante el análisis de grandes fuentes de datos para mejorar el rendimiento
comercial o mitigar el riesgo.
2. Base de datos NoSQL: bases de datos de valores clave, documentos y
gráficos.
3. Búsqueda y descubrimiento de conocimiento: herramientas y tecnologías
para admitir la extracción de información de autoservicio y nuevas
perspectivas de grandes repositorios de datos estructurados y no estructurados
que se residen en múltiples fuentes, como sistemas de archivos, base de datos,
flujos, API y otras plataformas y aplicaciones.
4. Análisis de flujo: software que puede filtrar, agregar, enriquecer y analizar un
alto rendimiento de datos múltiples fuentes de datos en vivo y en cualquier
formato.
5. Fabrica de datos en memoria: proporciona acceso de baja latencia y
procesamiento de grandes cantidades de datos mediante la distribución de
datos a través de la memoria de acceso aleatorio dinámico (DRAM), Flash o
SSD de un sistema informático distribuido.
6. Almacenes de archivos distribuidos: una red informática donde los datos se
almacenan en mas de un nodo, a menudo de forma replicada, para redundancia
y rendimiento.
7. Virtualización de datos: una tecnología que ofrece la información de varias
fuentes de datos, incluidas fuentes de Big Data como Hadoop y tiendas de
datos distribuidos en tiempo real y casi en tiempo real.
8. Integración de datos: herramientas para la orquestación de datos en
soluciones como Amazon Elastic MapReduce (EMR), Apache Hive, Apache
Pig, Apache Spark, MapReduce, Couchbase, Hadoop y MongoDB.
9. Preparación de datos: software que alivia la carga de aprovisionar, dar
forma, limpiar y compartir conjuntos de datos diversos y desordenados para
acelerar la utilidad de los datos para el análisis.
10. Calidad de los datos: productos que realizan limpieza y enriquecimiento de
datos en grandes operaciones paralelas en almacenes de datos distribuidos y
bases de datos,

Casos de Éxito

El Big Data está de moda ¿Por qué? Por que su aplicación está revolucionando la manera
en que las empresas entienden y se relacionan con los consumidores. Su uso está
generando un gran impacto, Sobre todo en Marketing.

Estas son algunas ventajas de las muchas que tienen el Big Data aplicado en Marketing.

 Obtener datos de los clientes, como sexo, edad, ubicación, gustos…


 Planificar y ejecutar acciones de marketing personalizadas, lanzando un mensaje
específico para cada segmento.
 Mejorar la comunicación con el cliente y reforzar la relación con él.
 Tomar decisiones en tiempo real y más acertadas.
 Incrementar la fidelización de los clientes y el número de conversiones.

Casos de éxito:

1. Netflix:

Netflix es la plataforma mas grande en el mundo de series y películas online. La


compañía supo detectar el gran poder del Big Data para conocer los gustos de sus
usuarios y su éxito se debe, entre otros factores, a las recomendaciones que hace
a sus consumidores en base a los patrones de consumo de contenido.

2. Starbucks:
La conocida marca de cafés prima por la originalidad del espacio y de las bebidas que
ofrece. También a nivel informático la empresa gusta de innovar y primar por la
diferencia. Utiliza soluciones de Big Dara desde hace bastante tiempo, para
mantenerse siempre al frente de su competencia. A través del Big Data, la empresa
logra generar análisis demográficos que sirven como planes de mercado y aperturas
de nuevas tiendas. Sus sistemas inteligentes recogen información de las personas que
circulen en una zona determinada, el tráfico de vehículos que existe y las
disponibilidades de transporte público. Con base en el análisis de estas informaciones,
es posible definir si abrir una cafetería en una determinada zona era una buena
inversión o no. El Big Data permite además que la marca conozca muy bien a sus
clientes y de esta forma consigue generar cupones de descuento y promociones
personalizadas.

3. Real Betis (Equipo de la liga española):


Dio a conocer que la utilización de Analytics fue clave para contratar al Argentino
Giovani Lo Celso ante la salida de Fabian al Napoli italiano, el club recurrió al Big Data
para analizar jugadores que tuvieran condiciones similares a él y ocupar su vacante
con alguien casi idéntico a su rendimiento.
Se estudiaron los datos de cinco ligas europeas. Cientos de futbolistas fueron
valorados en el proceso. Fue Giovani Lo Celso, quien resultó con estadísticas
favorables y con una aproximación de 86% al perfil de Fabian. Real Betis no dudó en
ficharlo.
4. Cambridge Analytics:
CA es una empresa con sede en Londres fundada en 2013 por Alexander Nix. Se dedica
al uso de datos para “cambiar el comportamiento de audiencias” y sus análisis y
estudios son vendidos a empresas y también a políticos. Han trabajado en mas de cien
campañas políticas en el mundo.
En 2013, Aleksandr Kogan desarrolló un test de personalidad en formato de una
aplicación de Facebook. Aproximadamente 265 mil usuarios completaron el test, el
cual pedía información personal y acceso a la red de amigos, “estados” y “me gusta”
en la red social. Toda esta valiosa información fue vendida a la información de Nix. A
partir de esta base de datos se obtuvieron los perfiles de alrededor de 50 millones de
usuarios, los cuales fueron manipulados en favor de la campaña de Donal Trump
mediante la creación de publicidad seccionada según cada perfil creando noticias
falsas (fake news).

Bibliografía:

Big Data:
https://www.youtube.com/watch?v=FD55bekgARM&t=1s
https://www.youtube.com/watch?v=PfM6xXkB78M

Tecnologías de Big Data:


https://www.executrain.com.mx/blog/big-data/item/conoce-las-10-tecnologias-de-
big-data-del-momento
http://www.iic.uam.es/innovacion/herramientas-big-data-para-empresa/
https://www.vexsoluciones.com/tecnologias/tipos-de-datos-en-big-data/

Tipos de Big Data:


https://bbvaopen4u.com/es/actualidad/reconocer-los-diferentes-tipos-de-datos-
indispensable-en-la-era-del-big-data

Casos de Éxito Con en uso de Big Data:


https://www.mailify.com/es/blog/autores-invitados/5-casos-de-exito-en-big-data-
marketing/
https://www.celag.org/cambridge-analytica-el-big-data-y-su-influencia-en-las-
elecciones/

También podría gustarte