Está en la página 1de 4

uno | 11 de octubre 2017

Pat Gelsinger Christian Gardiner


Boletín trimestral #3 Los datos son la nueva ciencia. Los datos son el activo estratégico
SO WHAT? El Big Data son las respuestas de las compañías por excelencia.
editado por de la Riva group

TODO LO QUE DEBES SABER SOBRE

BIG DATA
big data: la capacidad de producir correlaciones como resultado de almacenar grandes cantidades de datos de
diversos tipos y orígenes, que se producen a gran velocidad y que requieren de un tratamiento en tiempo real.

partamos de la pregunta
Generamos más datos que nunca,
tendencia que muestra un creci- formas de proceso de
más básica: ¿qué es un dato?
la palabra viene del latín
datum, que significa «lo que
miento exponencial. Nuestra capa-
cidad para procesar tantos datos
datos en big data
se da», y se refiere a una inaugura en sí una nueva etapa en la
correlación: los datos masivos causalidad: en el tiempo
representación simbólica de revolución digital. que se leen de diversas fuentes y del big data, la relación
un atributo o variable cuali- se combinan de forma casi instan- causal de los datos ya no
tativa o cuantitativa. es una «Big Data son recursos de tánea no miden subjetividades, es un factor relevante,
fracción de información que gran volumen, alta veloci- sino que producen tendencias y porque se considera que
se puede analizar, combinar, dad y variedad que exigen análisis sobre datos que quizá, entre muchos valores ni
almacenar o transmitir. po- formas rentables e innova- en términos causales, no habrían siquiera existe o no es im-
dría decirse que un dato es, doras de procesamiento sido tomados en cuenta. portante.
a la información, lo que una que permitan una mejor
molécula a la materia.
comprensión, toma de de-
cisiones y automatización
«Big Data trata de entender de procesos.» MINERÍA DE HERRAMIENTAS MÁS
IMPORTANTES DE LA
las relaciones que te unen Gartner it Glossary DATOS MINERÍA DE DATOS:
a las personas que te inte-
resan y el conocimiento del El intercambio de datos a través de La minería de datos o datamining B inteligencia artificial
potencial de esa relación» internet permite analizar la correla- es una herramienta que permite
C estadística
Joe Rospars. ción de datos en un número prác- identificar patrones en todos los
ticamente infinito de dimensiones, datos para ponerlos a disposición D sistemas de bases de datos
por lo que encuentra correlaciones del análisis y, finalmente, ayudar en
datos en el mundo digital: que de otra manera serían inimagi- la toma de decisiones.
B documentos nables para el ser humano. La corre- Lo que hace particulares a los UTILIDAD DE LA
lación se produce en un cruce de procesos de minería es que se pro- MINERÍA DE DATOS
C fotografías
datos que brinda información sobre ducen mediante algoritmos que se
D social media algo. insertan en estas grandes bases de
E fechas datos, que buscan tendencias, ano- funciona para predecir,
«Debemos dejar de hablar malías, desviaciones o situaciones al utilizar la información
F localizaciones geográficas para pronosticar valores
G transacciones de causalidades y pensar interesantes pero desconocidas, y
futuros.
en correlaciones.» otros eventos importantes.
H búsquedas Victor Mayer y Kennet
I visitas a sitios web Cukier
funciona para describir, al
big data: puede obtener presentar patrones descrip-
almacenamiento de datos información de datos tivos de la información para
estructurados, no que puedan ser interpreta-
formas tradicionales: formas digitales: estructurados y dos por seres humanos.
pinturas smartphones semiestructurados
códices computadoras
gráficas memorias de a partir de datos estructu-
almacenamiento minería de datos: se rados, presenta resultados
mapas masivo enfoca en el análisis de que son argumentados y
fotografías nube datos convencionales, en discutidos después de arro-
videos los que la información jar información en la que
está estructurada de no se propusieron hipótesis
grabaciones de audio forma homogénea previas.
delarivagroup.com dos | 11 de octubre 2017

Geoffrey Moore Michael Nielsen

Sin análisis de Big Data, las Con la infraestructura apropiada, los datos Boletín trimestral #3
empresas están ciegas y sordas. pueden transformarse en conocimiento, a SO WHAT?
menudo de forma sorprendente. editado por de la Riva group

Es importante señalar que para llevar


a cabo estos procesos es indispen- HISTORIA DEL BIG 1970: Edgar F. Codd, crea
sable la actividad de los individuos DATA la base de datos relacional. 1980: Aparición de Internet
que intervienen en la extracción de
información.
PRINCIPALES PROCESOS 1920: Nikola Tesla predice 1963: Primera base de da- 1990: nasa, Minería de
DE LA MINERÍA DE DATOS el mundo inalámbrico. tos en ee.uu. datos.
B filtrado de datos
C selección de variables 1944: Universidad de Har-
D extracción de conocimiento 1928: Fritz Pfleumer pre- vard, primera computado- 2005: Consolidación de la
senta la banda magnética. ra, Mark I web 2.0
E interpretación y evaluación
La minería de datos utiliza, de forma
automatizada, diferentes algoritmos
que son clasificados como técnicas. 2006: Hadoop
Una de las más reconocidas es la de

Fuente: Barcelona Supercomputing Center


10  30
redes neuronales. geopbyte Más allá del
sistema decimal
características de las redes 2025 NUBE O CLOUD
neuronales: El concepto de nube o Cloud,
b consisten en unidades hace referencia a un paradigma de

10  27
de procesamiento que brontobyte Este será almacenamiento que no tiene una
intercambian datos. nuestro universo digital del
mañana identidad física para los usuarios;
c se utilizan para reconocer es una infraestructura distribuida
patrones, por ejemplo, en 2020 en internet. Estas plataformas
imágenes, manuscritos y permiten la distribución de datos
10 24
yottabyte Este es nuestro
secuencias de tiempo. universo digital actual y recursos de información en el
d tienen la capacidad de momento en que se requiera y de
aprender y mejorar su manera redundante, lo que hace
funcionamiento. 2015 que su disponibilidad sea segura
zettabyte 1.3 zb de tráfico en y confiable.
A partir del aprendizaje en instan-
cias repetitivas, se construyen y re-
10 21 la red en 2016
VENTAJAS DE LA NUBE:
fuerzan los conectores que fijan la B la información está siem-
información que va quedando en la exabyte 1eb es creado en pre disponible.
red neuronal como referente. 10 18 internet por día = 250 millones 2010 C los dispositivos ya no se
de dvds de información saturan de información.
ALGORITMOS
Un algoritmo, en su definición más bá- 10 15 petabyte El cern genera 1pb CARACTERÍSTICAS DE LA
sica, consiste en una serie de pasos por segundo NUBE:
para realizar una tarea. En las ciencias B on-demand self service:
10 12 terabyte Facebook consume
de la computación, son secuencias de 500tb de datos al día el consumidor accede y
operaciones que permiten solucionar utiliza los servicios según
un problema. Los algoritmos son autó- 10 9 gigabyte sus necesidades.
nomos y no dependen de lenguajes de 10 
8
megabyte C broad network access:
programación, por lo que deben dise- servicios disponibles en
ñarse para ser leídos fácilmente. una red privada, comparti-
da o pública.
CARACTERÍSTICAS DE LOS ALGORITMOS D resource pooling: re-
cursos del hardware
como la capacidad de
finitud (finiteness): un te antes de que comience básicas para que en princi- procesamiento, asignación
algoritmo debe terminar el algoritmo. estas entra- pio puedan ser realizadas de memoria o almacena-
siempre después de un nú- das se toman de conjuntos exactamente y en un tiem- miento.
mero finito de pasos. de objetos especificados. po finito por un hombre
usando papel y lápiz. E rapid elasticity: des-
definición (definiteness): salida (output): cantida- pliegue y planificación de
cada paso de un algorit- des que tienen una rela- Hoy en día gran parte de nues- recursos.
mo debe ser definido con ción específica con las tras actividades están relacio-
Fuente: Donald Knuth

precisión; las acciones a entradas. F measured service: con-


nadas con algoritmos: la cá- trol y elaboración de
realizar son rigurosas y efectividad (effective- mara que se ajusta a nuestra
sin ambigüedades. informes de uso del ser-
ness): las operaciones a sonrisa, el teclado que predice vicio para controlarlo y
entrada (input): cantida- realizar en el algoritmo nuestra escritura, son sólo al- optimizarlo.
des que se dan inicialmen- deben ser suficientemente gunos ejemplos.
11 de octubre 2017 | tres delarivagroup.com

Peter Norvig Chris Anderson


Boletín trimestral #3 No tenemos mejores algoritmos. No hay razón para aferrarse a los viejos
SO WHAT? Sólo tenemos más datos. caminos. Es tiempo de preguntarnos: ¿qué
editado por de la Riva group puede aprender la ciencia de Google?

PLATAFORMAS QUE USAN INTELIGENCIA ARTIFICIAL


LA NUBE: El término inteligencia artificial se re-
objetivos de
la inteligencia
origen
de datos
-amazon
-google drive
fiere a sistemas creados por los seres
humanos con la intención de consti- artificial:
tuir agentes racionales autónomos web
-dropbox mediante procesos computacionales. diseñar programas machine to machine
-spotify La ia vinculada al Big Data se tra- comparativos de (m2m)
ta de programas computacionales eficiencia con los
-netflix construidos para realizar operaciones seres humanos, con la biometrics
definidas en un proceso en el que el finalidad de producir social media
«Los datos son el petróleo sistema pueda generar un proceso de
mayor conocimiento.
transacciones
del siglo xxi.» aprendizaje tal cual lo hace la mente maximizar resultados
Cesar Alierta y rendimiento de las human generated
humana, a partir de la experiencia.
acciones.

tipos de inteligencia artificial Como podemos ver, los datos tie-


nen una complejidad que corres- «Las aplicaciones Big Data
Machine learning. Máquinas Deep learning. Emulación
ponde a su origen, a las formas de más impactantes serán por
capaces de autoprogramarse cada vez más cercana a
almacenamiento y, además, a cómo
pero en donde los humanos la percepción humana. sí mismas una industria que
toman las primeras decisiones. Aprendizaje no supervisado. se procesan por aplicaciones de Big
Data. Por eso, a través de las 3 v que
aprovechará los datos que la
Aprendizaje supervisado.
lo componen podemos decir que el propia empresa consume y
Big Data se define como: la capaci- genera en el viaje de hacer
La analítica de datos (en inglés,
analytics) ha sido considerada como
3 v de big data dad de producir correlaciones como negocios. No existe una fór-
(douglas laney) resultado de almacenar grandes can- mula única para extraer valor
una propuesta tradicional frente al tidades de datos de diversos tipos de los datos, depende de su
mundo del Big Data. Regularmente,
al tratarse del análisis de datos para
volumen y orígenes, que se producen a gran aplicación.»
datos masivos, cantidades
velocidad y que requieren de un tra- David Gorbet
tomar decisiones, se confunde o no tamiento en tiempo real.
se identifica su especificidad frente al monumentales.
Big Data. Pero la analítica puede ser los datos se almacenan
comprendida como el paso anterior en una batería llamada principales herramientas de
en esta revolución de los datos masi-
vos; lo más relevante es que se basa
clúster. administración de datos:
en las deducciones que se pueden velocidad -nosql (arquitectura tipo base de datos)
hacer a través de los resultados ob- -Hadoop (ecosistema de software que puede coordinar bases
rapidez en el procesamien-
tenidos de datos en bruto. to y selección de datos. de datos nosql)
tipos de analítica identifica los procesos
de mayor volatilidad para Análisis Recomendaciones Rápidas
descriptiva: ¿qué hay? producir una respuesta
predictivo lecturas/
predictiva: ¿qué va a ocu- oportuna e inmediata.
escrituras
rrir?
prescriptiva: ¿qué hacer?
variedad
diversidad de tipos y for- En tiempo
mas de datos que es posi- Interactivo
BIG DATA ANALITYCS
ble procesar. hadoop real
Big Data Analytics se refiere al proce- datos clasificados en es-
samiento y análisis de los datos ma- tructurados (tablas), no
sivos que se producen a escalas que estructurados (la mayo- Detección
Transacciones de fraude
no es posible procesar por los medios ría, cadenas de seguimien-
convencionales de la informática. El to) o semiestructurados
de usuarios
objetivo del análisis se centra en que (lenguajes webs).
la información obtenida debe servir Datos de
para algo, por lo que se espera que en Batch nosql
sensores
este procesamiento de datos se llegue «Si combinamos inteligencia
a nuevas formas de actuación de em- artificial, con los mejores
presas u organizaciones. algoritmos, con Big Data,
obtenemos el poder analíti- Perfiles Potencia de Procesamiento
«Big Data consiste en encon- co y productivo más grande de usuarios cómputo masivo large-scale
trar correlaciones, mientras (Google, Amazon, Face-
que el Small Data se preocu- book) que es el que está
pa por las causas, las razones cambiando el mundo drásti- Se trata de marcos de reconocimiento que se diferencian de los sistemas
detrás de las cosas.» camente.» de gestión de bases de datos relacionales, porque permiten analizar datos de
Martin Lindstrom Gustavo Ross diferentes tipos en grandes volúmenes por ser más flexibles y funcionar en
estructuras que no son fijas.
delarivagroup.com 11 de octubre 2017 | cuatro

Hannah Jones Carly Fiorina


El análisis de datos para la La meta es convertir los Boletín trimestral #3
sostenibilidad puede ayudar a liderar datos en información, y la SO WHAT?
los modelos de negocio. información en insights. editado por de la Riva group

big data y política predicciones sobre el

Bernard Marr
«Tras nuestra última investi- El uso del Big Data en política ha
BENEFICIOS futuro del big data:
gación hemos descubierto sido polémico. Esta tendencia ha
que las empresas utilizan Big permitido tener un mayor acer- DEL BIG DATA 1. Los volúmenes de datos seguirán cre-
ciendo.
Data para obtener resultados camiento al votante; además, los
centrados en el cliente, apro- partidos políticos aprenden a co- oportuno 2. Las formas de analizar los datos me-
vechar los datos internos y nocerse mejor. La lectura de da- e inmediato jorarán.
crear un mejor ecosistema de tos masivos se realiza, sobre todo, 3. Aparecerán más herramientas para el
información.» durante las campañas electorales, análisis (sin el analista).
porque se pueden identificar los accesible
ibm Institute for Business Value 4. La analítica prescriptiva se incorporará
perfiles de votantes para definir a
/ Escuela de Negocios Saïd en quiénes dirigirse y así capitalizar al software de análisis empresarial.
la Universidad de Oxford recursos en tiempo real. Es una es-
holístico 5. Además, la información en tiempo
trategia similar a como las empre- real sobre transmisión de datos será la
sas lanzan campañas publicitarias y pertinente característica distintiva de los ganadores
Según los especialistas Viktor posicionan sus productos. de datos en el futuro.
Mayer y Kenneth Cukier auto- seguro 6. El aprendizaje automático será una
res del libro seminal Big data. programas big data usados tendencia estratégica.
La revolución de los datos masi- en política:
7. Los grandes datos representarán enor-
vos, hay tres tipos de empresas 2008, barack obama, progra- preciso mes desafíos para los encargados de in-
que pueden identificarse en el ma narwhal terpretarlos.
mundo de los datos masivos: 2016, donald trump, cambrid- utilizable 8. Más compañías nombrarán un jefe de
B Las que tienen datos pero no ge analytica
datos.
tienen capacidades para ex-
traer el valor o construir ideas big data y gobierno ¿Qué es lo que nos depara el
9. «Los agentes autónomos y las cosas»
sobre ellos. El Big Data también ha empezado a seguirá siendo tendencia.
tener usos en las políticas públicas, futuro?
C Las que tienen las capacida- 10. Los científicos incluirán arquitectos
más allá de las coyunturas electo- La mayoría de los usuarios piensa y expertos en gestión de datos. Pero la
des, como las consultoras, que rales. La posibilidad de almacena- que Big Data revolucionará el
tienen el conocimiento para sa- gran crisis del talento puede disminuir a
miento, procesamiento y análisis de mundo de la misma forma que lo medida que las empresas emplean nue-
car conclusiones de los datos, datos masivos ha permitido un dise- hizo internet. Tendrá un mayor
pero que no los poseen. vas tácticas.
ño, ejecución y evaluación más co- impacto en:
rrectos de los proyectos. Así como 11. El modelo de negocio de datos como
D Las que tienen mentalidad Big
se hace en el ámbito empresarial, servicio está en el horizonte.
Data, como Google o Amazon,
en las que los datos y su aná- los gobiernos empiezan a usar da- 63% 12. Los mercados de algoritmos también
lisis son cruciales, ya que no tos acerca de las personas. surgirán.
sólo tienen los datos o saben El Big Data es una tendencia con- 13. La tecnología cognitiva será la nueva
analizarlos para tener éxito, sino la relación con los clientes moda.
solidada y, a la vez, en permanente
que tienen personal capaz de evolución. Se ha caracterizado por
desarrollar ideas sobre formas 14. Todas las empresas son negocios de
desarrollarse a la par de la inteli- 56% datos ahora.
de explorar los datos. gencia artificial y por conectarse
directamente con los avances en 15. Las empresas que utilicen datos verán
operaciones de cambio
Mientras más info tengo más inteligencia de negocios y con la $430 mil millones en beneficios de pro-
quiero a mis clientes analítica. Responder qué para con- ductividad en 2020.
solidar un cómo y proponer un 58% 16. «Datos rápidos» y «datos procesables»
Una de las cuestiones que ha reve- para qué, es hoy una opción posi- reemplazarán datos grandes, según algu-
lado el uso de Big Data es que las ble gracias al manejo y gestión de nos expertos.
compañías se están enfocando en co- datos masivos. desarrollo de productos
nocer mejor a sus usuarios o clientes.
El engagement que una marca tenga
dependerá de la cantidad de infor- Amazon, algoritmo filtrado Google, su algoritmo busca cal-
mación que obtenga de sus posibles colaborativo ítem por ítem cular la importancia de cada si-
clientes. para analizar grandes volú- tio web a partir de los vínculos
menes de datos. (links) que cada sitio recibe.

«El internet de las cosas, CASOS EXITOSOS DE BIG DATA


en términos muy simples,
se puede definir como la Airbnb, su algoritmo pone pre-
Uber, su gran base de datos @delarivagroup
capacidad de los objetos cios de renta a través de una
permite que el algoritmo tar-
de comunicarse entre ellos, de 15 segundos en localizar
cantidad de información sobre De la Riva
mediante una señal de inter- el automóvil más cercano al
lugares similares a los que ofre-
De la Riva Group
net.» cen los arrendadores, y hace
usuario.
Luis Arvizu sugerencias dinámicas.