Está en la página 1de 7

Documento tcnico

El ABC de Big Data: Analytics, Bandwidth and Content


Richard Treadway e Ingo Fuchs, NetApp, Noviembre de 2011 | WP-7147

RESUMEN EJECUTIVO
Las empresas entran en una nueva era en la que la cantidad de datos procesados y almacenados superan las actuales arquitecturas del sector del almacenamiento. NetApp proporciona soluciones dirigidas a la escala de grandes volmenes de datos mediante el llamado ABC de Big Data, Analytics, Bandwidth and Content (anlisis, ancho de banda y contenido), que permite a los clientes obtener informacin sobre conjuntos de datos masivos, mover datos rpidamente y almacenar contenido importante durante largos periodos de tiempo sin aumentar la complejidad operativa.

NDICE 1 2 3 4 5 6 UNA NUEVA ERA A GRAN ESCALA ............................................................................................... 3 FUENTES DE GRAN ESCALA .......................................................................................................... 3 CARENCIAS DE LOS MTODOS ACTUALES ................................................................................ 4 LMITES DE LAS INFRAESTRUCTURA........................................................................................... 4 EL ABC DE LOS DATOS A ESCALA ............................................................................................... 5 RESUMEN .......................................................................................................................................... 7

LISTA DE FIGURAS Figura 1) Dnde falla su infraestructura? ................................................................................................. 5 Figura 2) El ABC de Big Data de NetApp: Analytics, Bandwidth and Content (anlisis, ancho de banda y contenido) ................................................................................................................................................... 6

UNA NUEVA ERA A GRAN ESCALA

En la dcada de 1990, los equipos de tecnologa se centraban en obtener un rendimiento ptimo de las aplicaciones infraestructuras clave de sus empresas. Estos sistemas de registro en silo normalmente hacan un buen trabajo a la hora de mantener un registro de la informacin importante pero eran caros y no ofrecan una visin lo suficientemente detallada de los datos para que pudiera suponer una ventaja empresarial. En la primera dcada del ao 2000, el centro de inters de la tecnologa cambi hacia la eficiencia y hacia cmo conseguir ms con menos. Tecnologas como la virtualizacin, el uso compartido y la consolidacin de la infraestructura existente de la empresa se convirtieron en los impulsores clave de la tecnologa. Ahora estamos entrando en la era de la gran escala, donde la cantidad de datos procesados y almacenados por las empresas supera las construcciones arquitectnicas del sector del almacenamiento actual. Como resultado, los equipos de tecnologa intentan convertir los sistemas de registro existentes, creados en las dcadas de los 90 y 2000, en sistemas de adquisicin, que pueden proporcionar la informacin necesaria a las personas adecuadas de forma eficiente, y en tiempo real, para ayudarles a realizar anlisis ms sofisticados y a tomar mejores decisiones empresariales. Evolucin de sistemas de registro a sistemas de adquisicin Los datos por s solos no tienen valor. El valor deriva del uso de los mismos para impulsar los resultados del negocio, ofrecer servicios a los clientes y aumentar los ingresos. El reto para el almacenamiento escalable consiste en hacer posibles estos resultados empresariales a partir de conjuntos de datos de dimensiones considerables.

FUENTES A GRAN ESCALA

Este aumento masivo se produce por diversos motivos. Debido a la presin de los costes, muchas empresas estn consolidando sus centros de datos ya que no pueden permitirse que cada unidad empresarial tenga su propia infraestructura tecnolgica distribuida por todo el mundo. El paso a cloud computing tambin contribuye a este aumento, lo cual aade a la demanda cientos de miles de usuarios en menos sistemas centralizados. Otra fuente del aumento de escala es el crecimiento masivo de datos generados por equipos y usuarios. Las tecnologas digitales se estn pasando a medios ms densos, las fotografas han pasado a ser digitales, los vdeos utilizan la resolucin ms alta y el anlisis avanzado requiere ms almacenamiento. Adems, los datos generados por el equipo a partir de redes sensores, seguimiento del comportamiento de compra y otras fuentes, contribuyen a crear conjuntos de datos de mayor tamao que deben comprenderse y comercializarse. En resumen, la cantidad de datos est aumentando y los objetos de datos en s mismos estn aumentando de tamao. Todo esto crea una cantidad enorme de presin sobre las infraestructuras existentes, especialmente en la plataforma de almacenamiento. A esto es a lo que se refiere NetApp cuando habla del reto de Big Data.

De dnde surge Big Data? Aunque los datos de origen humano, como las fotos de Facebook o los tweets, reciben gran parte de la atencin en los medios, el mayor crecimiento de datos procede de conjuntos generados por mquinas, como el seguimiento del comportamiento de los clientes y los anlisis de mercados financieros.

CARENCIAS DE LOS MTODOS ACTUALES

Las empresas actuales encuentran difcil gestionar el crecimiento exponencial de los grandes volmenes de datos. Los mtodos tradicionales no pueden escalarse al nivel necesario para poder albergar todos los datos, analizarlos a la velocidad a la que llegan y almacenar los conjuntos de datos relevantes de forma eficiente durante periodos de tiempo prolongados. El sector como conjunto ha empezado a encontrarle el truco a la gestin de una infraestructura cada vez ms compleja en el mundo virtual, pero tratar la infraestructura en un mundo escalable supone retos muy serios. El tiempo hasta llegar a la informacin es crtico para las empresas que obtienen el mximo valor de sus datos. Se necesitan semanas o meses para hacer un anlisis, lo que supone demasiado tiempo para detectar una tendencia que puede afectar al negocio en un instante. El cumplimiento de normativas tambin es un reto importante para muchas empresas. Las organizaciones reguladas pueden tener que mantener sus datos durante periodos muy largos de tiempo o para siempre. Y se les pide que encuentren datos rpidamente cuando sean necesarios para informes o durante auditoras del sector. En resumen, el reto de Big Data es el de obtener una ventaja sobre la competencia: cmo obtener el mximo valor para la empresa de su inmenso universo digital de informacin.

LMITES DE LAS INFRAESTRUCTURA

Los grandes volmenes de datos superan las infraestructuras de almacenamiento actuales en tres grandes reas, como se muestra en la figura 1. Complejidad. Los datos ya no son solo texto y nmeros, incluyen eventos en tiempo real y de infraestructura compartida. La informacin ahora est relacionada, es de alta fidelidad y se compone de mltiples tipos de datos. Aplicar los algoritmos normales para la bsqueda, almacenamiento y categorizacin cada vez resulta ms complejo e ineficiente. Velocidad. A qu velocidad entran los datos? El vdeo de alta definicin, la retransmisin multimedia a travs de dispositivos reproductores de Internet y el vdeo a cmara lenta para seguimiento, todos ellos tienen tasas de consumo muy elevadas. Los negocios tienen que seguir el ritmo de los flujos de datos para que la informacin sea til. Tambin tienen que seguir el ritmo de las tasas de incorporacin de datos para proporcionar resultados empresariales ms rpidos, o en el caso militar, para salvar vidas. Volumen. Todos los datos recopilados deben almacenarse en una ubicacin que sea segura y siempre est disponible. Con volmenes de datos tan altos, los equipos tcnicos tienen que decidir qu significa demasiados datos, por ejemplo, es posible que tengan que desechar todos los datos cada semana y empezar de nuevo la semana siguiente. Pero en muchos casos, esto no es una opcin, de modo que los datos deben almacenarse por ms tiempo, sin aumentar la complejidad operativa. Esto puede provocar que la infraestructura falle rpidamente en esta rea.

Figura 1) Dnde falla su infraestructura?

EL ABC DE LOS DATOS A ESCALA

NetApp ha dividido los conjuntos de soluciones para la gestin de datos a escala en tres reas principales llamadas el ABC de Big Data: Analytics, Bandwidth and Content (anlisis, ancho de banda y contenido. Como se muestra en la figura 2, cada rea cuenta con sus retos especficos y sus requisitos de infraestructura nicos. Anlisis. Esta rea de la solucin se centra en proporcionar un anlisis eficiente para conjuntos de datos extremadamente grandes. El anlisis se centra en la obtencin de informacin interna, el aprovechamiento del universo digital y la conversin de los datos en informacin de alta calidad para proporcionar informacin en ms profundidad sobre el negocio y permitir una mejor toma de decisiones. Ancho de banda. Esta rea de la solucin se centra en obtener un mejor rendimiento para unas cargas de trabajo muy rpidas. Las aplicaciones de gran ancho de banda incluyen: la capacidad de realizar anlisis complejos a velocidades extremadamente altas; la retransmisin de vdeo de alto rendimiento para seguimiento y planificacin de la misin; y la edicin y reproduccin de vdeo en medios y entretenimiento. Contenido. Esta rea de la solucin se centra en la necesidad de proporcionar un almacenamiento de datos escalable, seguro e ilimitado. Las soluciones de contenido deben permitir el almacenamiento de cantidades de datos virtualmente ilimitadas de forma que las empresas puedan almacenar tantos datos como deseen y encontrarlos cuando los necesiten, sin perderlos.

Figura 2) El ABC de Big Data de NetApp: Analytics, Bandwidth and Content (anlisis, ancho de banda y contenido)

RESUMEN

La nueva era de la escala sobrepasa las arquitecturas de almacenamiento existentes. Las empresas necesitan plantearse las siguientes preguntas: se pueden aprovechar mejor nuestros datos? Qu informacin interna puede ayudar realmente a nuestro negocio? Cmo podemos utilizar los datos para obtener una ventaja competitiva? Qu pasara si pudiramos vincular las tendencias de patrones de compra a la ubicacin fsica de las personas en un momento concreto para proporcionarles una mejor experiencia? Qu pasara si pudiramos detectar cundo va a suceder un fraude? Podemos identificar los puntos conflictivos de probabilidad de fallo antes de que sucedan? La lista de preguntas es ilimitada. Pero la respuesta siempre es la misma. NetApp ofrece las soluciones de almacenamiento que permiten a las empresas aprovechar los grandes volmenes de datos y transformarlos en un mayor valor de negocio. El universo de los datos puede ser una mina de oro de informacin. NetApp ayuda a las empresas a encontrar el valor de estos datos y convertirlo en una ventaja empresarial real.

La innovacin de Big Data se basa en NetApp Las ofertas de Big Data de NetApp ofrecen una base para estimular la innovacin, tomar mejores decisiones e impulsar resultados satisfactorios a la misma velocidad que los negocios actuales.

NetApp no realiza declaracin ni garanta alguna con respecto a la exactitud, fiabilidad o aptitud de cualquier informacin o recomendacin dispuesta en esta publicacin, o con relacin a los resultados que puedan obtenerse mediante el uso de la informacin o el cumplimiento de las recomendaciones dispuestas en el presente. La informacin contenida en este documento se distribuye TAL CUAL, y el uso de la misma o la implantacin de cualquier recomendacin o tcnica incluida en el presente sern responsabilidad del cliente y dependern de su capacidad para evaluarlas e integrarlas en su entorno operativo. Este documento y la informacin contenida en el mismo solo se pueden utilizar en relacin con los productos de NetApp descritos en este documento.
2012 NetApp, Inc. Todos los derechos reservados. Queda prohibida la reproduccin de cualquier parte de este documento sin la previa autorizacin por escrito de NetApp, Inc. Las especificaciones estn sujetas a modificaciones sin previo aviso. NetApp, el logotipo de NetApp y Go further, faster son marcas o marcas registradas de NetApp, Inc. en Estados Unidos y/o en otros pases. El resto de marcas o productos son marcas o marcas registradas de sus respectivos propietarios y debern ser tratadas como tal. WP-7147-1111-esES

www.netapp.com/es

También podría gustarte