Está en la página 1de 13

LAS10

TENDENCIAS PRINCIPALES DE
big data
PARA 2017
Las 10tendencias principales de
big data para2017
El 2016 fue un ao de gran trascendencia para los big data. Una
mayor cantidad de organizaciones comenz a almacenar y procesar
datos de todo tipo de formatos y tamaos, adems de extraer valor
de ellos. En 2017, continuar el crecimiento de los sistemas que
admiten grandes volmenes de datos, tanto estructurados como no
estructurados. Elmercado exigir plataformas que faciliten a los
responsables de los datos las tareas de administracin y seguridad
En Tableau, cada ao analizamos de los big data. Adems, estas plataformas debern permitir a
loms destacado del sector. losusuarios finales poder analizar dichos datos. Estos sistemas
madurarn para funcionar correctamente en el marco
Este debate ofrece como delossistemas y estndares empresariales de TI.
resultado una lista con las
tendencias principales de los
big data para el ao siguiente.
Acontinuacin, presentamos
nuestras predicciones para
elao 2017.
Los big data se vuelven rpidos y simples: las opciones
se expanden para inyectar rapidez a Hadoop
1 Es posible implementar el aprendizaje automtico y realizar anlisis de opiniones con Hadoop,
perola primera pregunta que la gente suele formular es la siguiente: cul es la velocidad del SQL
interactivo? Al fin y al cabo, SQL es el medio utilizado por los usuarios corporativos que desean
acceder a datos de Hadoop para generar dashboards de KPI ms rpidos e iterativos, adems de
realizar anlisis exploratorios.

Esta necesidad de velocidad potenci la adopcin de bases de datos ms rpidas, como Exasol y
MemSQL, tiendas basadas en Hadoop, como Kudu, y tecnologas que permiten realizar consultas
ms giles. Con el uso de motores SQL en Hadoop (Apache Impala, Hive LLAP, Presto, Phoenix
yDrill) y tecnologas OLAP en Hadoop (ATScale, Jethro Data y Kyvos Insight), estos aceleradores
de consultas estn desdibujando an ms las lneas divisorias entre almacenes de datos
tradicionales y el mundo de los big data.

MS INFORMACIN: Informe comparativo de ATScale sobre BI en Hadoop, 4T 2016 (en ingls)


Los big data ya no solo se hospedan
en Hadoop: las herramientas
diseadas especficamente para
2 Hadoop se vuelven obsoletas
En aos anteriores, con la ola de los big data, vimos surgir varias
tecnologas para satisfacer las necesidades de anlisis en Hadoop.
Sin embargo, las empresas con entornos complejos y heterogneos
ya no desean adoptar un punto de acceso a BI aislado, para una sola
fuente de datos (Hadoop). Las respuestas a sus preguntas estn en
el interior de un conjunto de fuentes, desde sistemas de registros y
almacenes de datos en la nube, hasta datos estructurados y no
estructurados incluidos en fuentes de Hadoop u otros tipos.
(Casualmente, incluso las bases de datos relacionales se estn
adaptando para los big data. Por ejemplo, SQL Server 2016
recientemente incorpor compatibilidad con JSON).

En 2017, los clientes exigirn anlisis de todo tipo de datos. Las


plataformas compatibles con distintos tipos de datos y fuentes
prosperarn, mientras que las diseadas para ser utilizadas solo
con Hadoop y que no sirvan para otros casos se quedarn en el
camino. El retiro de Platfora es un indicio precursor de esta
tendencia.

MS INFORMACIN: Un sentido poco comn: el almacn de big data (en ingls)


Las organizaciones aprovechan los
mares de datos desde un comienzo
3 para obtener el mximo rendimiento
Un mar de datos es como un embalse artificial. En primer lugar, se
construye una pared contenedora (se genera un clster). Luego, se
llena de agua (datos). Una vez confeccionado el mar, se comienza a
utilizar el agua (los datos) con diversos propsitos, como generar
electricidad, producir agua potable o proporcionar actividades de
recreo (anlisis predictivos, aprendizaje automtico, seguridad
ciberntica, etc.).

Hasta ahora, incorporar agua al mar era un fin en s mismo. En 2017,


eso cambiar, ya que la justificacin de negocio para utilizar
Hadoop se volver ms estricta. Para obtener respuestas con
mayor rapidez, las organizaciones exigirn un uso iterativo y gil del
mar. Realizarn un anlisis detenido de los resultados de negocios
antes de invertir en personal, datos e infraestructura. A su vez, esto
promover una asociacin ms estrecha entre la empresa y TI.
Lasplataformas de autoservicio tendrn un mayor reconocimiento.
Sern consideradas como las herramientas que permiten
aprovechar los recursos de los big data.

MS INFORMACIN: Maximizar el valor con un mar de datos (en ingls)


La arquitectura evoluciona hacia un marco en
4 elquela talla nica deja de ser el estndar
Hadoop ya no solo es una plataforma de procesamiento por lotes para casos de uso cientficos.
Seha convertido en un motor multipropsito para realizar anlisis ad hoc. Incluso se est utilizando
para generar informes operativos sobre volmenes de trabajo diarios (de lo que se encargaban
tradicionalmente los almacenes de datos).

En 2017, las organizaciones reaccionarn a estas necesidades hbridas buscando diseos de


arquitectura informtica para casos de uso especficos. Antes de comprometerse con una
estrategia de datos, investigarn un gran nmero de factores, entre los que se incluyen roles de
usuarios, preguntas, volmenes, frecuencia de acceso, velocidad de datos y nivel de agregacin.
Estas arquitecturas modernas se adaptarn a las necesidades. Combinarn las mejores
herramientas de preparacin de datos de autoservicio con Hadoop Core y plataformas de anlisis
de usuario final. De esta forma, podrn reconfigurarse segn evolucionen las necesidades. En ltima
instancia, la flexibilidad de estas arquitecturas ser el factor decisivo entre las opciones
tecnolgicas.

MS INFORMACIN: El marco de trabajo con datos activos/semiactivos/inactivos y cmo se aplica a la estrategia de


Hadoop (en ingls)
Ni volumen ni velocidad: la variedad
ser lo que impulse las inversiones
5 en big data
Gartner define los big data con las tres uves: grandes volmenes,
alta velocidad y gran variedad de activos de informacin. A medida
que estos tres componentes crecen, la variedad se convierte en el
factor ms decisivo a la hora de evaluar una inversin en big data.
Esto se puede ver en los resultados de una encuesta reciente
realizada por New Vantage Partners. Esta tendencia continuar en
aumento a medida que las empresas quieran integrar ms fuentes
y centrarse en la larga cola de los big data. JSON sin esquemas,
tipos anidados de otras bases de datos (relacionales y NoSQL),
datos estructurados (Avro, Parquet, XML)... Los formatos de datos
se multiplican, por lo que los conectores son cada vez ms
fundamentales. En 2017, se evaluarn las plataformas de anlisis en
funcin de su capacidad para proporcionar conectividad directa a
esta diversidad de fuentes y en tiempo real.

MS INFORMACIN: No es el volumen, sino la variedad lo que impulsa las


iniciativas de big data (en ingls)
Spark y el aprendizaje automtico
6 dinamizan el mundo de los big data
Apache Spark, un antiguo componente del ecosistema de Hadoop,
se est convirtiendo en la plataforma de big data preferida entre las
empresas. En una encuesta realizada a arquitectos de datos,
administradores de TI y analistas de BI, casi el 70% de ellos prioriz
Spark sobre el tradicional MapReduce. Este ltimo realiza procesos
por lote y no se presta a aplicaciones interactivas ni a
procesamiento secuencial en tiempo real.

Estas grandes capacidades de cmputo en big data pusieron en


primer plano a las plataformas que ofrecen aprendizaje automtico
con clculo exhaustivo, inteligencia artificial y algoritmos grficos.
En particular, el aprendizaje automtico de Microsoft Azure se ha
destacado, gracias a su facilidad de uso, adaptada para
principiantes, y la integracin simplificada con plataformas
existentes de Microsoft. Poner el aprendizaje automtico a
disposicin de las masas conducir a la creacin de ms modelos y
aplicaciones que generen petabytes de datos. A medida que las
mquinas aprendan y los sistemas se vuelvan ms inteligentes,
toda la atencin se centrar en los proveedores de software de
autoservicio. Existir curiosidad por ver cmo facilitan el acceso de
los datos al usuario final.

MS INFORMACIN: Por qu usar Spark para el aprendizaje automtico (en ingls)


La confluencia entre IoT, la nube y los big data crea
7 nuevas oportunidades para el anlisis de autoservicio
Parece que en 2017 cualquier objeto cotidiano estar dotado de algn tipo de sensor que enviar
informacin. La IoT (Internet de las cosas) est generando volmenes masivos de datos
estructurados y no estructurados. Adems, una parte cada vez mayor de estos datos se est
implementando en servicios en la nube. En su mayora, estos datos son heterogneos y estn
hospedados en diferentes sistemas, tanto relacionales como de otros tipos, que abarcan desde
clsteres de Hadoop hasta bases de datos NoSQL. Mientras que las innovaciones en los servicios
de almacenamiento y administracin aceleraron el proceso de captura, el acceso a los datos y su
comprensin todava suponen un importante desafo final. Como resultado, se observa un aumento
en la demanda de herramientas analticas que combinen una amplia variedad de fuentes de datos
hospedados en la nube y que se conecten con ellas sin problemas. Dichas herramientas permiten
que los negocios exploren y visualicen cualquier tipo de datos, sin importar dnde estn
almacenados. Esto los ayuda a descubrir las oportunidades ocultas en su inversin de IoT.

MS INFORMACIN: Cmo resolver el problema del ltimo eslabn de la Internet de las cosas (Tableau)
La preparacin de datos de autoservicio
se vuelve una tendencia dominante a
medida que los usuarios finales
8 comienzan a dar forma a los big data
Hacer que los datos de Hadoop sean accesibles para los usuarios
corporativos es uno de los desafos ms grandes de la actualidad.
Elsurgimiento de plataformas de anlisis de autoservicio ha allanado
este camino. Sin embargo, los usuarios corporativos desean reducir
an ms los tiempos y la complejidad de preparar datos para el
anlisis. Y esto se vuelve particularmente importante a la hora de
procesar tipos y formatos diversos de datos.

La agilidad de las herramientas de preparacin de datos de


autoservicio no solo permite preparar datos de Hadoop directamente
en la fuente, sino que tambin los ponen a disposicin en forma de
instantneas. As se permite una exploracin ms rpida y sencilla.
Enrelacin con esto, hemos sido testigos de numerosas innovaciones
producidas por empresas dedicadas a la preparacin de big data para
el usuario final, como Alteryx, Trifacta y Paxata. Estas herramientas les
estn abriendo el paso tanto a quienes adoptaron Hadoop desde un
primer momento como a los recin llegados. Por ello, se continuarn
afianzando en el 2017.

MS INFORMACIN: Por qu la preparacin de autoservicio es una aplicacin genial


para los big data (en ingls)
Los big data crecen: Hadoop se
incorpora a los estndares
9 empresariales
Una tendencia en aumento es la transformacin de Hadoop en
unaparte fundamental del entorno de TI empresarial. Y, en 2017,
veremos un crecimiento de la inversin en los componentes de
seguridad y administracin que rodean a los sistemas
empresariales. Apache Sentry proporciona un sistema para
aplicaruna autorizacin detallada y basada en roles sobre los
datosy los metadatos almacenados en un clster de Hadoop.
Apache Atlas, creado como parte de la iniciativa de administracin
de datos, permite que las organizaciones apliquen una clasificacin
homognea en todo su entorno de datos. Apache Ranger
proporciona una herramienta de administracin de seguridad
centralizada para Hadoop.

Estos son los tipos de funcionalidades que los clientes corporativos


esperan de sus plataformas de sistemas de administracin de
bases de datos relacionales (RDBMS). Actualmente, estn a la
vanguardia de las tecnologas emergentes de big data y contribuyen
a simplificar la adopcin empresarial.

MS INFORMACIN: Las etapas de maduracin de Hadoop: a dnde se dirige?


(eningls)
El incremento de los catlogos de metadatos
contribuye al descubrimiento de big data valiosos
10 para el anlisis
Durante mucho tiempo, las empresas desechaban datos, porque no los podan procesar en su totalidad.
Con Hadoop, pueden procesar grandes cantidades de datos. Sin embargo, estos no suelen estar
organizados de manera sencilla.

Mediante las herramientas de autoservicio, los catlogos de metadatos pueden ayudar a los usuarios a
descubrir y comprender datos relevantes y dignos de anlisis. Esta necesidad de los clientes gener una
oportunidad que fue aprovechada por Alation y Waterline. Ambas organizaciones utilizan el aprendizaje
automtico para automatizar el trabajo de encontrar datos en Hadoop.
Catalogan archivos con etiquetas, encuentran relaciones entre activos de datos e incluso proporcionan
sugerencias de consultas a travs de interfaces de usuario que permiten realizar bsquedas. Esto ayuda
tanto a los consumidores como a los administradores de datos en la reduccin del tiempo necesario
para encontrar datos, hacer consultas precisas y obtener resultados fiables. En 2017, se observar un
mayor conocimiento y una mayor demanda del descubrimiento de autoservicio. Este crecer como una
extensin natural del anlisis de autoservicio.

MS INFORMACIN: Catlogos de datos como requisito estratgico para mares de datos (en ingls)
Acerca de Tableau
Integrar la visualizacin de datos en sus programas y procesos de comercio minorista es ms fcil de
lo que imagina.

Tableau Software ayuda a las personas a ver y comprender los datos, independientemente de su
volumen o el nmero de sistemas en los que se almacenen. Conctese rpidamente a dashboards de
datos, combnelos, visualcelos y comprtalos. Sin problemas, desde su PC o iPad. Cree y publique
dashboards con actualizaciones de datos automticas y comprtalos con colegas, socios o clientes,
sin necesidad de tener conocimientos de programacin. Inicie una prueba gratuita hoy mismo.

TABLEAU.COM/TRIAL

También podría gustarte