Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mohd Et All - Big Data Visualization - Tools and Challenges (1) .En - Es
Mohd Et All - Big Data Visualization - Tools and Challenges (1) .En - Es
com
YO.INTRODUCCIÓN
En los últimos años, Big Data se ha convertido en un tema de interés
para todas las industrias, incluidas las académicas, las empresas de TI y los
gobiernos [1]. La tasa de crecimiento de los datos ha aumentado
exponencialmente en pocos años debido a varios factores como el Internet
de las cosas (IoT), los sensores en nuestro entorno y la digitalización de Fig. 1. Beneficios de la visualización de big data
todos los registros fuera de línea, como nuestro historial médico, etc. Big
Data ha demostrado su importancia para este mundo. en tan poco tiempo
que hoy en día casi todas las empresas de TI y no TI almacenan todos los Big Data se caracteriza por 5V, es decir, gran volumen, alta velocidad, alta
datos que producen. variedad, baja veracidad y alto valor. El desafío real no es solo procesar
esta gran cantidad de datos, sino también procesar datos con una gran
diversidad. La alta diversidad e incertidumbre en los datos reduce el
Hoy en día, las empresas luchan por almacenar la gran cantidad de
tiempo de respuesta de la aplicación, ya que tiene que lidiar no solo con
datos, mientras que analizarlos, interpretarlos y presentarlos de manera
datos estructurados tradicionales sino también con datos
significativa es una idea para más adelante [2]. El principal desafío de Big
semiestructurados y no estructurados [1].
Data radica en capturar, almacenar, analizar, compartir, buscar y visualizar
datos. Uno de los aspectos principales del análisis de Big Data es que
II.RETOS
podemos encontrar patrones interesantes en un gran conjunto de datos,
Las herramientas de visualización tradicionales han llegado a sus
pero en realidad el resultado del análisis suele ser números sin procesar y,
límites cuando se encuentran con conjuntos de datos muy grandes y
según esos números, es muy difícil interpretar algo. Pero si esos números
estos datos evolucionan continuamente. Aunque hay algunas
se representan visualmente, se vuelve mucho más fácil para nuestro
extensiones de los enfoques de visualización tradicionales, se quedan
cerebro encontrar patrones significativos y tomar decisiones en
atrás por millas. La herramienta de visualización debería poder
consecuencia. La Fig. 1 muestra los beneficios de la visualización de Big
proporcionarnos una visualización interactiva con la menor latencia
data [3].
posible. Para reducir la latencia, podemos hacer lo siguiente: [5]
La visualización de datos ciertamente no es algo nuevo; Ha existido durante • Usar los datos precalculados
siglos. La visualización de datos es una forma fácil y rápida de transmitir • Paralelizar el procesamiento y la representación de datos
mensajes y representar cosas complejas [4]. Los humanos estamos adaptados • Usar un middleware predictivo
para encontrar patrones en todo lo que vemos. Dado que los datos se acumulan La herramienta de visualización de Big Data debe ser capaz de manejar
a un ritmo tan masivo, las formas tradicionales de presentar los datos están datos semiestructurados y no estructurados porque los big data suelen
obsoletas [1]. En comparación con los datos tradicionales, tener este tipo de formato. Se da cuenta de que para hacer frente
terceroHERRAMIENTAS DE VISUALIZACIÓN
La tarea de la visualización de big data es reconocer patrones y
correlaciones interesantes. Necesitamos elegir cuidadosamente las Han surgido varias herramientas para ayudarnos a salir de los problemas
dimensiones de los datos que se visualizarán, si reducimos las dimensiones señalados anteriormente. La característica más importante que debe tener
para que nuestra visualización sea baja, entonces podemos terminar una visualización es que debe ser interactiva, lo que significa que el usuario
perdiendo patrones interesantes, pero si usamos todas las dimensiones, debe poder interactuar con la visualización. La visualización debe mostrar
podemos terminar teniendo una visualización demasiado densa para ser útil información relevante cuando se pasa el cursor sobre ella, el panel de
para el usuario. usuarios Por ejemplo: “Dadas las pantallas convencionales acercamiento y alejamiento debe estar allí, la visualización debe adaptarse en
(1,3 millones de píxeles), la visualización de cada punto de datos puede dar tiempo de ejecución si seleccionamos un subconjunto o un superconjunto de
lugar a un exceso de trazado, superposición y puede abrumar las datos. Revisamos algunas de las herramientas de visualización más
capacidades perceptivas y cognitivas del usuario [7]”. populares.
A. Herramientas
Debido al gran volumen y la gran magnitud de big data, se vuelve
difícil de visualizar. La mayoría de las herramientas de visualización 1) Cuadro:Tableau es una herramienta de visualización de datos
actuales tienen bajo rendimiento en escalabilidad, funcionalidad y interactiva que se centra en Business Intelligence. Tableau ofrece una
tiempo de respuesta [8]. Se han propuesto métodos que no solo amplia gama de opciones de visualización. Proporciona la opción de
visualizan datos sino que procesan al mismo tiempo. Estos métodos crear una visualización personalizada. Es rápido y flexible. Admite
utilizan Hadoop y la solución de almacenamiento y el lenguaje de principalmente todos los formatos de datos y la conexión a varios
programación R [9] como entorno de compilación en el modelo [10]. La servidores, desde Amazon Aurora hasta Cloudera Hadoop y Salesforce.
figura 2 muestra el contorno de dicho modelo. La interfaz de usuario es intuitiva, hay una amplia variedad de gráficos
disponibles. Para cálculos y estadísticas simples, no se requieren
habilidades de codificación, pero para análisis pesados, podemos
ejecutar modelos en R y luego importar los resultados a Tableau. Esto
requiere bastante habilidad de programación basada en la tarea que
debemos realizar.
5) Excel 2016:
• Tipo de cliente: ¿Cuáles son los diferentes tipos de clientes disponibles para la 2) Empaquetado de círculos: es lo mismo que en el diagrama de árbol, pero en lugar de
herramienta, es decir, escritorio, en línea o aplicación móvil? rectángulos, usamos círculos. Esto no es tan eficiente en cuanto al espacio como la
• MOOCS: si hay tutoriales disponibles en línea para aprender la visualización de mapas de árbol.
embalaje
servicios en la nube. Para eso, necesitamos tener una cuenta de trabajo
rayos de sol Y norte Y
para iniciar sesión, la cuenta pública no funcionará aquí.
• El tamaño del libro de trabajo está limitado solo a 250 MB. Paralelo Y Y Y
coordinar
• Es lento en comparación con Tableau.
Gráfico de flujo Y norte Y
3) trama:
Circular Y Y norte
• Los usuarios profesionales tienen funciones limitadas, como el tamaño de carga de los red
diagrama
archivos, solo hasta 500 KB.
BI de energía norte Y Y Y Y Y Y Y