Está en la página 1de 8

BIG DATA

¿QUÉ ES?

El Big Data es el análisis masivo de datos. Una cuantía de datos, tan


sumamente grande, que las aplicaciones de software de procesamiento de
datos que tradicionalmente se venían usando no son capaces de capturar,
tratar y poner en valor en un tiempo razonable.
Igualmente, el mismo término se refiere a las nuevas tecnologías que hacen
posible el almacenamiento y procesamiento, además de al uso que se hace de
la información obtenida a través de dichas tecnologías.

CARACTERÍSTICAS

▪ VOLUMEN: La gran cantidad de datos que se generan y que se


guardan.
▪ VARIEDAD: Las diferentes formas en que los datos pueden ser
usados.
▪ VISIBILIDAD: Describe la naturaleza y el tipo de los datos, para
ayudar a los profesionales a analizarlos y utilizarlos de forma
eficiente. Los datos convencionales eran estructurados y podían
organizarse en una base de datos simple. Con el auge del Big
Data, los datos se presentan en nuevos tipos de datos, en este
caso no estructurados, por lo que existe una mayor dificultad para
llegar a ser procesados.
▪ VELOCIDAD: Se trata del ritmo al que se reciben los datos y
(posiblemente) al que se aplica alguna acción.
▪ VERACIDAD: Los resultados de los análisis se pueden ver
afectados por la calidad de los datos capturados.
▪ VALOR: La información generada debe ser útil.

TIPOS

A la hora de clasificar los “grandes datos” podemos hacerlo según dos criterios:
procedencia y estructura.
Así, según su procedencia, los datos pueden llegar desde distintas fuentes,
entre otras:

▪ WEB Y REDES SOCIALES: información disponible en Internet


como contenido Web, generada por los usuarios en su actividad en
las redes sociales o información de búsquedas en buscadores.
▪ MACHINE-TO-MACHINE (M2M): datos generados a partir de la
comunicación entre sensores inteligentes integrados en objetos de
uso cotidiano.
▪ TRANSACCIONES: incluye registros de facturación, llamadas o
transacciones entre cuentas.
▪ BIOMÉTRICOS: datos generados por tecnología de identificación
de personas mediante reconocimiento facial, de huellas dactilares o
mediante información genética.
▪ GENERADOS POR PERSONAS: a través de correos electrónicos,
servicios de mensajería o grabaciones de llamadas.
▪ GENERADOS POR ORGANIZACIONES TANTO PÚBLICAS
COMO PRIVADAS: datos relacionados con el medioambiente,
estadísticas gubernamentales sobre población y economía,
historiales clínicos electrónicos, etc.

Por otro lado, según su estructura, los datos pueden ser:

▪ ESTRUCTURADOS: datos que tienen definidos su formato,


tamaño y longitud, como las base de datos relacionales o Data
Warehouse.
▪ SEMIESTRUCTURADOS: datos almacenados según una cierta
estructura flexible y con metadatos definidos, como XML y HTML,
JSON, y las hojas de cálculo (CSV, Excel).
▪ NO ESTRUCTURADOS: datos sin formato específico, como
ficheros de texto (Word, PDF, correos electrónicos) o contenido
multimedia (audio, vídeo, o imágenes).

BENEFICIOS

▪ Es un conjunto de tecnologías muy ágiles y flexibles.

▪ Es escalable por lo que, si tienes más datos, puedes poner más


máquinas e incluir nuevas analíticas y más información. Así, la
infraestructura puede crecer al mismo tiempo que tu empresa o
proyecto.

▪ La mayoría de aplicaciones pertenecen a la comunidad Open


Source, software de código abierto o que forma parte del dominio
público. Con esto, además del ahorro económico evidente que
nuevamente entra en escena, también tenemos a nuestra
disposición una gran comunidad de desarrolladores que trabajan
diariamente en mejorar sistemas y procesos de estos recursos,
como la comunidad Open Source de Apache, donde también
resuelven dudas que surgen a diversos usuarios en todo el mundo.
▪ Es rápido y económico respecto a la infraestructura de
almacenamiento. Por ejemplo, a través de servicios de
computación en la nube, puedes pagar únicamente por lo que
consumes.

▪ A través del Big Data y habiendo seguido correctamente el ciclo de


gestión de información que culmina con la puesta en valor de los
datos, habrás conseguido un objetivo previamente marcado. Este
puede ser ganar más dinero o ahorrarlo a través de mejoras de
costes, adquisición de nuevos clientes o retención de los actuales,
avanzar en una investigación científica, obtener una ventaja
competitiva respecto a nuestros competidores anticipándonos a lo
que deparará el mercado a través de análisis predictivos, optimizar
nuestros procesos de producción…

¿PARA QUÉ SIRVE?

Veamos algunos ejemplos reales de su uso:

▪ MARKETING: segmentación de clientes. Muchas empresas usan datos


masivos para adaptar sus productos y servicios a las necesidades de
sus clientes, optimizar operaciones e infraestructuras, y encontrar
nuevos campos de negocio.
▪ DEPORTES: optimización del rendimiento. Dispositivos como los smart
watches registran automáticamente datos como el consumo de calorías
o los niveles de acondicionamiento físico.
▪ SALUD PÚBLICA: codificación de material genético. Por ejemplo,
existen plataformas de análisis del Big Data que se dedican a
descodificar cadenas de ADN para comprender mejor las enfermedades
y encontrar nuevos tratamientos.
▪ NUEVAS TECNOLOGÍAS: desarrollo de dispositivos autónomos. El
análisis de datos masivos puede contribuir a mejorar máquinas y
dispositivos, y hacerlos más autónomos. Un ejemplo son los coches
inteligentes.
▪ SEGURIDAD: detección y prevención de crímenes. Los cuerpos de
seguridad usan el Big Data para localizar a criminales o prevenir
actividades delictivas como los ataques cibernéticos.
CASOS PRÁCTICOS DE APLICACIÓN

▪ AMAZON: La compañía de referencia a nivel mundial, en lo que a


comercio electrónico se refiere, basa buena parte de su éxito en
conocer de antemano lo que necesitan sus clientes. Así, es muy
probable que si entras en la página de esta empresa, te sugiera
artículos que van a ser de gran interés para ti. ¿Cómo? A través de la
inteligencia de datos analizan muchos factores de carácter individual del
usuario como sus hábitos de compra o intereses y otros más generales
como tendencias del momento o pautas de conducta de otros usuarios
que adquirieron productos similares. Juntan todo en la coctelera del Big
Data y ofrecen una serie de productos sugeridos o relacionados con
compras que el cliente ya ha hecho o se ha planteado hacer.

▪ NETFLIX: Uno de los grandes factores del éxito de la popular empresa


estadounidense Netflix, es su magistral uso de los macrodatos para
crear nuevos contenidos para sus usuarios, cuyos hábitos de consumo
y preferencias son observados al detalle para descubrir qué es lo que
van a querer ver a continuación en base a patrones predictivos. Así
crearon, por ejemplo, la serie House of Cards: observaron que a
muchos de sus usuarios les gustaban contenidos que incluyeran poder,
política, drama y sensualidad entre sus características principales. Y
también que les gustaba como actor Kevin Spacey. Así, dieron con la
fórmula y mezclaron en la trama todos estos ingredientes poniendo a
protagonizar a Spacey la misma. Igual proceso para Stranger Things y
otros grandes éxitos de audiencia.

▪ T-MOBILE: Esta empresa de telecomunicaciones alemana es un


ejemplo de uso de los datos masivos como mejor arma de retención de
clientes. Analizando a fondo las conversaciones, reclamaciones y
descontentos que sus clientes dejaban en redes sociales, crearon
soluciones específicas para cada uno de ellos y consiguieron reducir la
fuga de clientes a otras empresas en un 50%, con lo que el retorno de
la inversión realizada en Big Data fue compensado con creces.

▪ NIKE: Los dispositivos electrónicos de su línea NikePlus (relojes


inteligentes, pulsómetros, dispositivos con sensores que conectan sus
zapatillas con un teléfono…) recogen cantidades masivas de
información de millones de usuarios. Información que sirve a la
empresa de ropa deportiva estadounidense para buscar la fidelización
de los usuarios a través de retos y objetivos que apelan a la capacidad
de superación de estos, creando un vínculo con la marca más allá de la
simple venta de material deportivo.
▪ SPOTIFY: Bajar hasta los datos individualizados más llamativos para
lanzar con ellos una campaña global masiva. Eso hizo en Reino Unido
la compañía sueca Spotify, que ofrece reproducción de música vía
streaming. Su plan consistió en buscar la complicidad del gran público.
Y lo consiguieron mostrando curiosidades o rarezas del comportamiento
de algunos de sus usuarios que habían detectado a través de los
macrodatos. Así, en grandes carteles publicitarios, colocaron anuncios
como estos:

«Querida persona que reprodujo “Sorry” 42 veces en el Día de San


Valentín, ¿qué hiciste?»

«Queridas 3.749 personas que reprodujeron “It’s the end of the world as
we know it” el día del Brexit, estamos con vosotros»

«Querida persona en el Theater District que escuchó la banda sonora


de Hamilton 5.376 veces este año, ¿puedes conseguirnos tickets?

DATA MINING
¿QUÉ ES?

La minería de datos es el conjunto de técnicas de procesamiento y análisis de


grandes volúmenes de datos de manera automática o semiautomática con el
fin de encontrar patrones que ayuden a comprender mejor el comportamiento
de una base de datos en determinadas circunstancias.
Las técnicas de Data Mining nos ayudan a transformar datos en información
relevante. Para conseguirlo, se aplican técnicas de estadística, computación e
Inteligencia Artificial, por lo que, para su puesta en marcha, es necesario contar
con un profesional especializado en este campo.

FASES

▪ SELECCIÓN DE OBJETIVOS: Como en todo proceso, el primer punto


es el establecimiento de los objetivos a conseguir con la aplicación de
las técnicas de Data Mining. En este punto, la empresa deberá decidir
con el apoyo del experto en Data Mining qué tipo de información es
relevante en su caso. En base a estos objetivos, se establecerá el
modelo para el análisis de los datos, por lo que deben ser claros.
▪ SELECCIÓN DE LAS BASES DE DATOS Y PREPROCESAMIENTO:
El segundo paso es establecer la o las bases de datos que servirán de
materia prima para la extracción de información. Se realiza un análisis
general previo para detectar diagramas de dispersión (que muestran la
correlación entre datos), histogramas y anomalías para corregirlas y
normalizar todas las entradas. Estos datos pueden ser propios o
comprados, pero deben tener siempre coherencia con los objetivos
marcados. De otro modo, sería, literalmente, como pedirle peras al
olmo: no puedes esperar extraer datos de comportamiento económico,
por ejemplo, en una base que no contenga datos relacionados con este
campo.

▪ DETERMINACIÓN DEL MODELO: Una vez se tienen todos los datos


organizados y se conocen los objetivos, el experto en Data Mining
creará un modelo predictivo de análisis y segmentación acorde.

▪ EXTRACCIÓN DE INFORMACIÓN: Tras aplicar el modelo, se extrae


los patrones de comportamiento observado, las relaciones establecidas
entre los datos y las conclusiones a las que llevan estas.

▪ ANÁLISIS DE RESULTADOS: Antes de poder dar estas conclusiones


como válidas para extrapolarse y/o aplicarse, se debe comprobar que
los resultados son lógicos y sus márgenes de error son admisibles. En
caso contrario, deberá hacerse una revisión del proceso para localizar
el origen del fallo y empezar nuevamente todo el proceso o reiniciarlo
desde un punto según sea el caso.

BENEFICIOS

▪ Permite descubrir información que no esperábamos obtener. Esto se


debe a su funcionamiento con algoritmos, ya que permite hacer muchas
combinaciones distintas.

▪ Es capaz de analizar bases de datos con una enorme cantidad de


datos.

▪ Los resultados son muy fáciles de interpretar y no es necesario tener


conocimientos en ingeniería informática.

▪ Permite encontrar, atraer y retener clientes.

▪ La empresa puede mejorar la atención al cliente a partir de la


información obtenida.
▪ Da a las empresas la posibilidad de ofrecer a los clientes los productos
o servicios que necesitan.

▪ Antes de usar los modelos, estos son comprobados mediante


estadísticas para verificar que las predicciones obtenidas son válidas.

▪ Ahorra costes a la empresa y abre nuevas oportunidades de negocio.

Sin embargo, también puede aparecer algún inconveniente a la hora de utilizar


técnicas de Data Mining, por ejemplo, dependiendo del tipo de datos que se quieran
recopilar, nos puede llevar mucho trabajo, o a veces la inversión inicial para obtener
las tecnologías necesarias para la recopilación de datos puede tener un coste elevado.

¿PARA QUÉ SIRVE?

La minería de datos puede utilizarse en diferentes aspectos, pero cuando se


habla de marketing de atracción o el desarrollo de un negocio digital, las funciones
más destacables de esta práctica son las siguientes.

▪ ANÁLISIS DEL CICLO DE COMPRA: Tiene la finalidad de entender cuáles


son los comportamientos de los clientes durante ciertas temporadas, cuáles
son los productos que más compran y otras tendencias.

▪ ESTUDIO DE LA COMPETENCIA: Igualmente, se puede establecer un


análisis del ciclo de navegación de los clientes para entender por qué no
completaron una compra, pero sí compraron a la competencia.

▪ CONTRATACIÓN DE PERSONAL: Permite investigar a fondo los mejores


candidatos para contratar, de forma que el nuevo personal cumpla con las
expectativas y objetivos de la empresa.

▪ MARKETING: Las empresas pueden determinar nuevas tendencias en ventas,


marketing de contenidos, comunicación y más.

CASOS PRÁCTICOS DE APLICACIÓN

▪ OBAMA Y LA CAMPAÑA POR LA PRESIDENCIA: El éxito de la


campaña de Obama cuando se presentó a la presidencia de los
Estados Unidos tuvo base en el análisis de datos masivos sobre la
población y la competencia. Su campaña de marketing al completo tuvo
como referencia este estudio para así llegar al público más afín a través
de los canales correctos e incluso con la persona correcta. Cada paso
de la campaña estaba dado en firme gracias a la aplicación de Data
Mining.
▪ AMAZON Y EL SERVICIO DE ATENCIÓN AL CLIENTE: Más que
hablar de las campañas de remarketing y email marketing de Amazon
que, por supuesto tiene detrás este tipo de estrategias, quiero
centrarme en la utilización de esta información para la atención al
cliente. Amazon es una de las empresas que más destaca por su buena
gestión en este aspecto y la clave de su éxito está en la Minería de
Datos. Gracias a su conocimiento y seguimiento del comportamiento de
usuarios Amazon se adelanta a las posibles crisis asegurándose la
fidelidad de los clientes. El cruce de datos de cada departamento sobre
un mismo usuario hace posible que los trabajadores de la compañía
puedan conocer el historial de comportamiento de un usuario y
solucionar de manera ágil cualquier incidencia.

▪ STARBUCKS Y LA ELECCIÓN DE LOCALIZACIONES: ¿Alguna vez te


has preguntado porque hay dos Starbucks cerca? La respuesta es
sencilla: porque pueden. La cadena utiliza Data Mining para determinar
la localización más óptima para la apertura de sus locales basada en
los datos demográficos y de tráfico entre otros.

También podría gustarte