Está en la página 1de 11

© Editorial UOC

Capítulo I. Entendiendo el big data

Capítulo I
Entendiendo el big data

1. La utilidad es la clave

Los avances tecnológicos sucedidos en los primeros años


del siglo XXI han dado paso a un importante cambio en el
paradigma de la comunicación, permitiendo intercambiar
y sustituir todos aquellos agentes que tradicionalmente ini-
ciaban el proceso comunicativo. Así, hoy en día, emisor y
receptor desarrollan habilidades y manejan herramientas
que les permiten intercambiar sus roles. Internet fue, en su
momento, el gran democratizador que ofrecía información a
todas las personas y, a su vez, todo el mundo podía compartir
información.
Que las personas vieran la utilidad de las redes sociales
digitales fue sin duda otro hito importante en la hoja de ruta
de la participación social y, poco a poco, la industria de los
medios, entendida como tradicional emisor, quiso participar
de dicha utilidad. Hoy en día, como usuarios de las nuevas
tecnologías, presenciamos cómo el tsunami digital arrasa con
hábitos y costumbres, además de proponer nuevas profesio-
nes, términos o maneras de comunicarnos que hace tan solo
unos años no hubiéramos imaginado. La hoja de ruta de las
nuevas tendencias viene marcada por empresas disruptivas
que apuestan por tecnologías ya presentes como la singulari-
dad tecnológica, la realidad aumentada, el cloud computing o el
uso de wearables, entre otros.

17
© Editorial UOC Big data

La industria de la comunicación, concretamente la rela-


cionada con medios audiovisuales más tradicionales como
el cine, la televisión o la radio, ha encontrado en el uso de
internet la posibilidad de transformar su modelo de negocio,
cambiando, por lo tanto, la manera en la que acerca sus pro-
ductos a la audiencia. Esto ha supuesto un cambio en la men-
talidad de todos los agentes que forman parte de la cadena
de valor. Viendo estos elementos con cierta perspectiva, nos
encontramos en primer lugar con los creadores de contenido,
quienes han visto cómo sus historias podrían ser contadas
en diferentes plataformas, enriqueciéndose y retroalimentán-
dose. Hablamos, por ejemplo, del transmedia. En segundo
lugar, los productores y distribuidores de contenidos también
se sitúan en un momento álgido debido, principalmente, a
la cantidad de datos que han ido atesorando desde los últi-
mos años, información relativa al consumo pero, también,
al consumidor. En esta línea, resalta también la importancia
de los destinatarios o los ya mencionados consumidores de
dichos productos audiovisuales, quienes son más conscientes
que nunca del poder del consumo on demand, algo que les
permite decidir cuándo, dónde y qué ver. A esta modalidad
de demanda se suma la ya realidad cotidiana del uso de redes
sociales a través de las que comunicar, emitir juicios críticos
y, básicamente, hacer valer su opinión sobre los productos
consumidos. Todas estas acciones en la era de las TIC deri-
van en la generación de datos. Esto es una información muy
variada, son registros procedentes de las audiencias, de los
consumos y de los usuarios que demandan sus contenidos a
través de formularios en aplicaciones o en webs de canales
de televisión o simples puntuaciones y recomendaciones de
los espectadores. Asumir que esa información es valiosa,

18
© Editorial UOC Capítulo I. Entendiendo el big data

ordenarla y extraer de ella decisiones de negocio para futuras


acciones ofrece una ventaja y un valor indudable para todos.
Esto es la gestión masiva de datos, también denominada big
data, palanca de cambio de nuevas acciones y decisiones. Pero,
como repetiremos a lo largo de estas páginas, los datos en sí
mismos carecen de valor, la importancia radica en el uso que
se haga de ellos.

2. Gestión de datos masivos en la empresa

La revolución industrial que ha supuesto la aparición de


TIC disruptivas ha marcado claramente el paso del período
en el que usábamos la tecnología como proceso mecánico
a entenderlas como un elemento productivo, con su consi-
guiente impacto tanto a nivel industrial como a nivel indivi-
dual del usuario en un marco amplísimo de posibilidades. El
big data como tendencia surge, pues, cuando la industria se da
cuenta de que no puede almacenar ni manejar la información
de manera convencional; es por lo tanto un paso lógico en
el proceso del uso de las TIC. Comprender las posibilidades
del big data en cada industria supone entender las dinámicas
internas, así como las fuentes de datos generables de las que
podemos disponer y la interacción que podemos realizar en
ellas. Pero también es importante entender que todo forma
parte de un proceso de negocio, que el uso masivo de los
datos ofrece nuevas posibilidades de orientar los negocios.
Volvemos a insistir: es fundamental entender que los datos en
sí mismos carecen de valor, dado que es precisamente lo que
se haga con ellos lo que les va a dar importancia.

19
© Editorial UOC Big data

Si hacemos una foto de aquellas industrias que estable-


cen en su modelo de negocio una relación con la gestión
masiva de datos, quizás el sector aeronáutico sea uno de los
que mayor ventaja tiene, seguido de la banca, los seguros, el
sector médico o el agrícola. Por citar algunos ejemplos, el
sector de la medicina encuentra la utilidad del big data en el
cruce de datos anónimos con el propósito de obtener con-
clusiones más precisas y rápidas sobre hallazgos científicos.
Un buen exponente es Research Kit, la plataforma de datos
abiertos de Apple. Por otro lado, en cuestiones agrícolas, la
startup española Cubenube dispone de gestión cloud de datos
agrícolas con idea de minimizar riesgos en las plantaciones.
En el caso de la industria del turismo, los destinos turísticos
reciben un implacable impulso para convertirse en smart cit-
ies, respaldo tanto de la iniciativa privada con clusters como
SmartCitiesLab, formado por Telefónica, Intel, Admira o
Ficosa, o también desde la esfera pública a través de Segittur,
que lidera el proyecto Destinos Turísticos Inteligentes desde
el Ministerio de Industria, Energía y Turismo. En España, son
los grandes grupos empresariales los que están promoviendo
iniciativas innovadoras a partir del uso del big data con idea
de tener un rol importante en la transformación tecnológica.
En esta línea, el BBVA promueve acciones cloud computing y
big data a través de la consultora Beeva y la gestión del talento
digital a través del Centro de Innovación. O también desde
Bbva Data & Analytics y el análisis de datos. Otro ejemplo es
el grupo Telefónica y su espacio de Innovación o incluso de
aceleradora de proyectos empresariales digitales, Wayra. En
general, podemos deducir la apuesta clara por negocios que
relacionen el big data con industrias tanto tradicionales como
emergentes.

20
© Editorial UOC Capítulo I. Entendiendo el big data

Para todas estas industrias y empresas, la integración


del big data en sus estrategias y procesos está entendida
siempre como mejora desde un punto de vista estratégico.
Centrándonos en el caso del sector audiovisual, y desde una
perspectiva internacional, la empresa de software Netflix se
presenta como uno de los más rentables casos de uso del
big data y business intelligence. Con una envidiable política de
transparencia, ofrece a través de su Netflix Tech Blog1 toda
la información posible sobre su funcionamiento interno.
Netflix es un canal de video on demand (VOD). Ellos se definen
a sí mismos como una aplicación que ofrece sus servicios a
través de una conexión a internet; esto permite una serie de
acciones bidireccionales entre el canal y el espectador. Para
ello, es importante tener categorizada o etiquetada la infor-
mación. Así, desde 2007, la empresa ha contratado personal
(los denominados taggers) destinado a visualizar determinados
títulos con idea de identificarlos con etiquetas (tags) y proce-
der posteriormente a su indexación.
Con idea de entender el proceso de adjudicación de eti-
quetas, es interesante comprender que el valor de la gestión
masiva de datos radica, en primer lugar, en poder encontrar
la información que buscamos en un entramado de redes cam-
biante y volátil; esto es, internet. Las características de la web,
tal y como la conocemos hoy, hicieron necesaria la aparición
de un sistema organizativo que permitiera la catalogación y

1  Se recomienda la lectura del blog de Netflix relativo a su división técnica en


techblog.netflix.com donde, en función de los conocimientos más o menos téc-
nicos del usuario, podemos obtener información interna del funcionamiento de
la plataforma con respecto a temas como algoritmos, analítica, data visualización,
data pipeline, arquitectura cloud, etc.

21
© Editorial UOC Big data

búsqueda de información,2 esto es, motores de búsqueda que


habitualmente usan los usuarios; quizás sea Google el más
conocido y usado, junto con otros desaparecidos o en uso
como Yahoo!, Altavista o Lycos. Mención especial merece
la WorldWideWeb, la red de redes, el primer buscador que
centraba su acción en un motor de búsqueda capturando
URL.3 En 2005, el etiquetado de los contenidos realizado por
usuarios se gestó en la red social del.icio.us, respaldada por
Yahoo! y, actualmente, este etiquetado es la base de las redes
sociales con idea de proceder posteriormente a la búsqueda e
identificación de datos.
En el caso del buscador más empleado por los usuarios,
Google, el motor de búsqueda de datos no se centra en el
tagging,4 sino que prioriza webs en función de su popularidad.
Para ello, patentó el denominado page rank, un algoritmo vivo
que evoluciona, se retroalimenta y se actualiza continuamen-
te. Su base de trabajo establece el criterio de «popularidad»
en función del número de webs que enlazan al site, además de
otros valores como la calidad de las webs de referencia.5 En
este sentido, el resultado es un baremo de 0 a 10 que hace que
las páginas web con un page rank más alto aparezcan primera-
mente en una búsqueda aleatoria.
A partir de aquí, dado que las búsquedas en internet
no son privadas, es posible para las empresas intervinien-

2 Orense Fuentes, M. (2010). SEO. Cómo triunfar en buscadores (págs. 23-24).


Madrid: ESIC Editorial.
3  Unique resource location.
4  Término referido a la acción de usar etiquetas.
5 Orense Fuentes, M. (2010). SEO. Cómo triunfar en buscadores. Madrid: ESIC
Editorial.

22
© Editorial UOC Capítulo I. Entendiendo el big data

tes saber qué tipo de búsquedas se realizan. Más aún, en


el caso de identificar los perfiles de usuarios que realizan
búsquedas, es posible no solo conocer los gustos de manera
personalizada sino intuir posibles nuevas búsquedas a rea-
lizar por dicho usuario. Llevado a términos de negocio, los
motores de recomendación en función de métricas, algo-
ritmos y predicciones hacen el resto. El objetivo es ofrecer
una herramienta de hiperpersonalización. Pongamos, por
ejemplo, el sector audiovisual, donde las empresas capaces
de gestionar datos y acciones de usuarios a través de las TIC
son propensas a ofrecer contenidos audiovisuales hiper-
personalizados e hipersegmentados a través de un canal
de televisión, aplicación o dispositivo. Para ello se recaban
datos básicos a través de la monitorización en tiempo real
del consumo audiovisual. Esto es, qué producto se está
visionando y las acciones que se realizan sobre él, ya sea play
(visionado), pausa, repetición, avance o parada. Además,
pueden obtenerse más datos referentes a la geolocalización,
las valoraciones que se hacen, opiniones, etc. Esto es infor-
mación masiva por cada usuario (big data); la gestión de la
misma para detectar la información útil para la empresa y
las decisiones estratégicas que se tomen para cumplir los
objetivos empresariales, por ejemplo en el caso de Netflix,
serán lo que la convierta en una empresa con un negocio
que entiende las posibilidades de las TIC. De tal forma que
este negocio no ofrece al usuario todo lo que busca o quiere,
más bien ofrece al usuario todo aquello en lo que está inte-
resado, dado que eso dicen los datos.

23
© Editorial UOC Big data

2.1. El ecosistema en línea

En el tiempo que leemos esta página se enviarán 277.000


tuits, se subirán a YouTube setenta y dos horas de vídeo y se
harán cuatro millones de búsquedas en internet. Pero no es
solo una cuestión de cantidad, sino también de incremento
veloz. Una comparativa para tener más perspectiva nos cuen-
ta que en 2013, en un minuto, se enviaron 11,8 millones de
comentarios a través de WhatsApp, y en 2015 suman ya 44,4
millones. También, en ese mismo minuto, se ha pasado de
publicar 817 post a 1.212 solo dos años después.6 La UIT indi-
ca que el grado de penetración de internet se ha multiplicado
por siete desde el año 2000. Y actualmente 3.200 millones de
personas acceden a internet. En general, la aparición de nue-
vos dispositivos y aplicaciones, la oferta de tarifas de datos
más competitivas en gigas y precio, sumado a un rol activo
y social por parte del usuario de las nuevas tecnologías, todo
ello, ha propiciado un ecosistema proclive al intercambio de
información. De hecho, el 83 % de los usuarios de teléfonos
smartphones usa a diario redes sociales desde el móvil y nueve
de cada diez internautas habituales disponen de una cuenta
activa en las redes sociales más demandadas.7 Ante este pano-
rama, es entendible que en el uso diario de internet se generen

6 Domo (2015). «What happens on the internet in one minute» [en línea].
<http://www.likeablesocialmedia.org/what-happens-on-the-internet-in-one-minu-
te-infographic/>Allen, Robert (2016). «What happens online in 60 seconds?» [en
línea]. [Fecha de consulta: 10 de marzo de 2016]. <http://www.smartinsights.com/
internet-marketing-statistics/happens-online-60-seconds/>
7  The Cocktail-ARENA (2015). «Observatorio de redes, VII oleada» [en línea]. [Fecha
de consulta: 10 de marzo de 2016]. <http://www.slideshare.net/TCAnalysis/observa-
torio-redes-sociales-56195394?ref=http://tcanalysis.com/blog/archive/2015/12/>

24
© Editorial UOC Capítulo I. Entendiendo el big data

grandes volúmenes de datos y metadatos. Podemos concretar,


por tanto, que el big data es el término empleado para refe-
rirse a toda aquella cantidad ingente de datos que, debido a
sus características, no pueden ser siempre procesados por los
sistemas informáticos actuales. Como veremos más adelante,
puede ser una cuestión de volumen, lo que hará que se necesi-
te trabajar con grandes almacenes de datos físicos (data centers)
o en la nube. Pero también podemos valorar características
como la escala temporal o velocidad, lo que va a permitir
establecer predicciones. En este sentido, muchos algoritmos
no están preparados para adaptarse a cambios tan rápidos.
Estos datos masivos pueden ser informaciones volcadas
en la red de internet o almacenadas de manera privada en las
empresas. Sea como sea, tradicionalmente estos datos esta-
ban disponibles de manera offline, sin conectividad entre ellos.
Hablamos aquí de documentos Word, tablas Excel, reclama-
ciones, encuestas telefónicas o documentos de subscripción,
entre otras muchas modalidades de ofrecimiento de datos.
Cada uno de estos son documentos que toda empresa realiza
con idea de generar o transcribir la información que produce
su empresa. Los documentos Word pueden ser guiones cine-
matográficos o las hojas Excel listados de una base de datos
de series televisivas con diferentes campos, en columnas, con
datos relativos a fechas, nacionalidad, género o minutos de
duración. Es decir, un sinfín de datos organizados de maneras
diferentes según cada empresa.
Pero, además, cada persona, como usuario de internet,
también genera datos, consciente o inconscientemente. Así,
en la actualidad, prácticamente cualquier uso que hagamos
de una herramienta digital conlleva el acto de lanzar datos
al escenario de internet. Por ello, cada vez que comparti-

25
© Editorial UOC Big data

mos información estamos generando datos y/u opiniones.


Pongamos como ejemplo un acto tan rutinario como enviar
un correo electrónico, publicar una actualización en una red
social, clicar un «me gusta» en una foto, publicar la puntua-
ción obtenida en un videojuego o aceptar la política de cookies
de las páginas web. El hecho de compartir o interactuar con
toda esta información supone que se están generando datos
y más datos al universo de internet pero, además, estamos
vinculando, en la mayoría de los casos, dicha información con
un perfil de usuario. Esto es así porque, para casi cualquier
acción en la web, debemos previamente identificarnos y esta
es una información que se adjunta a los datos que vamos a
compartir. Si pensamos en los teléfonos móviles, desde hace
unos años han sido reemplazados por smartphones, lo que
nos permite interactuar con aplicaciones, descargas, internet,
pero, para todo ello, es necesario previamente identificarnos
con un usuario, una imagen, un nombre, incluso una cuenta
bancaria. Desde ese momento estamos generando una acti-
vidad comercial por la que se entiende que, al no pagar por
unos datos que el usuario ha ofrecido, el producto resulta ser
el mismo usuario. En general, podríamos decir que actual-
mente los usuarios se han acostumbrado a consumir servicios
de manera gratuita. A cambio, podemos entonces hablar de
miles y millones de usuarios sin limitación geográfica que
diariamente ofrecen sus hábitos de consumo y perfiles per-
sonales de manera gratuita al universo de internet. A partir
de aquí, es lógico pensar que las empresas puedan recrear
sus modelos de negocio al saber exactamente qué piensa
su cliente de sus productos o qué apreciación se tiene de su
marca. Más aún, dependiendo del grado de penetración de
la tecnología, se puede afinar con gran exactitud cuáles son

26
© Editorial UOC Capítulo I. Entendiendo el big data

los hábitos de consumo de sus clientes, así como elaborar


una radiografía de los mismos a cualquier hora del día; esto
es la denominada categorización de perfiles, tremendamente
útil para elaborar acciones comerciales como el marketing
inbound. Visto con perspectiva y utilidad publicitaria, el big data
ofrecería un índice de impacto altísimo, casi sin margen de
error, dado que los productos ofrecidos podrían estar hechos
a medida. Bajo este abanico de posibilidades, es viable esta-
blecer patrones de consumo y predicciones que, en el ámbito
del negocio, busquen un fin concreto: tener contento al usua-
rio, ofreciendo, cada vez más, productos a medida.

2.2. Principales características del big data

Si analizamos toda la información que las empresas pue-


den obtener dentro del abanico llamado big data, encontramos
que se dan una serie de características comunes. Estas son las
denominadas volumen, variedad, veracidad y velocidad.
Son las principales características que definen el big data y es
así para cualquier industria o sector con el que lo estemos
relacionando. El volumen hace referencia a la gran cantidad
de datos disponibles o accesibles. Hay que tener en cuenta
que muchos de esos datos no serán útiles porque no tendrán
calidad o porque no forman parte de nuestra estrategia; con
todo, el volumen de información es enorme, continuo y
creciente. En esta línea, las diversas fuentes de información
de donde poder obtener datos dan paso a la siguiente carac-
terística, la variedad. Podemos obtener datos estructurados y
organizados o datos desestructurados, datos provenientes de
imágenes, texto, música, cifras, tablas de Excel, transacciones,

27

También podría gustarte