Está en la página 1de 17

10/1/2022

Diplomado en Big Data & Data Analytics

Visualización y recuperación de los


datos

robertsoruco@Gmail.com

Visualización

La mente Humana y visualización

1
10/1/2022

Suben o bajan?

2
10/1/2022

Información en imágenes

Visualización

• "Visualización es aquella tecnología plural (esto


es, disciplina) que consiste en transformar datos
en información semántica —o en crear las
herramientas para que cualquier persona
complete por sí sola dicho proceso— por medio
de una sintaxis de fronteras imprecisas y en
constante evolución basada en la conjunción de
signos de naturaleza icónica (figurativos) con
otros de naturaleza arbitraria y abstracta (no
figurativos: textos, estadísticas, etc.)".
• Alberto Cairo en El Arte Funcional

infografía o visualización de datos?

• Para algunos, la infografía consiste en


presentar información por medio de
gráficos estadísticos, mapas y
esquemas, en tanto que la visualización
se basa en la creación de herramientas
visuales (estáticas e interactivas)
creadas para que los usuarios exploren
y analicen determinado conjunto de
datos.
• los límites son definidos por las
palabras presentación y exploración.

3
10/1/2022

Ejemplo de Infografía

Visualización

¿Por qué es importante la visualización de


datos?
• Debido a la forma en que el cerebro humano procesa la
información, utilizar gráficos para visualizar grandes cantidades de
datos complejos es más fácil que examinar las hojas de cálculo o los
informes
• Identificar las áreas que necesitan atención o mejora.
• Aclarar qué factores influyen en el comportamiento del
cliente.
• Ayuda a entender qué productos colocar en dónde.
• Predecir volúmenes de ventas.

4
10/1/2022

Expresión de los Datos

• Estos productos
tecnográficos se
mueven, los movemos,
nos hablan o si les
proporcionamos datos
de entrada generan
nuevas actividades o
presentaciones,
figurativas o no.

Entrega Información a través de la


visualización

Magic Quadrant For Analytics And Business


Intelligence Platforms

5
10/1/2022

Información a través de recursos visuales

Ejemplo en la historia
• "Carta figurativa de las sucesivas pérdidas de hombres de la armada francesa en la campaña de Rusia
de Napoleón en 1812" de Charles Minard (1869)

Metodología

Investigación y análisis
Obtención Objetivos
Indicadores
Formateo y Limpieza
Procesamiento
Esbozar
Prototipar
Finalizar

6
10/1/2022

Fase 1: La Estrategia / Inv. y análisis


• La
estrategia
hace
referencia
a todo
aquello
que nos
conduce
a definir
los
objetivos
de la
visualizaci
ón de
datos.

Fase 1: La Estrategia / objetivos

Fase 1: La Estrategia / Indicadores

A menudo, las visualizaciones de datos no


alcanzan los objetivos planteados porque
tratan unos datos que no son relevantes o que
no captan todos los ángulos del problema.

Se puede definir tres tipos de indicadores:

• Volumen
• Calidad
• Contexto

7
10/1/2022

Fase 2 / Obtención
• El primer paso para poder trabajar una visualización será obtener los
datos necesarios, definidos durante el proceso de estrategia;… buscarlos
y extraerlos de bases de datos, o implementar sistemas que los generen

Fase 2 / Formateo y Limpieza


• Debe validarse el contenido, asegurarse de que no contienen errores y
que el formato es adecuado y consistente para su consumo. A menudo
contienen errores o valores poco coherentes que conviene revisar.
Fase 2 / Procesamiento
• El procesamiento de los datos es, por si mismo, una disciplina propia. En
función del volumen y de lo que se quiera analizar, se podrán ejecutar
algoritmos muy complejos que podrán dar mucho más valor a los datos.

Fase 3 / Esbozar
• Esta fase consiste en elaborar borradores con el objetivo de
descubrir maneras de representar los datos de acuerdo con
la estrategia definida. También es habitual referirse con el
término inglés sketching.
• En particular, la fase de esbozo es muy útil para definir el
aspecto de la visualización de datos, que debe ser
coherente con los objetivos definidos en la estrategia.

Fase 3 / Prototipar
• En esta fase se utilizan los datos reales para ver si los
esbozos siguen siendo válidos. A veces, algunas
visualizaciones escogidas no son las adecuadas. En este
caso, conviene volver a trabajar con papel y bolígrafo para
obtener nuevas ideas. Es decir, durante el prototipaje, se
alterna el uso de papel y bolígrafo con el uso de
herramientas digitales de prototipaje para trabajar con
datos reales.

8
10/1/2022

Fase 3 / Finalizar

• En esta fase se transforma el


prototipo en el producto
final. Es el momento de
tratar aspectos como:
– La redacción de textos
finales
– La adaptación a la guía de
estilo requerida (colores,
tipografías, espacios,
logotipos, etc.)
– La elaboración de
mecanismos de ayuda

Tipos de gráficos y diagramas para la


visualización de datos

Diagrama de Arco
• En los diagramas de Arco los nodos se colocan a lo largo de una
sola línea y los arcos se utilizan para mostrar las conexiones entre
ellos.
• El espesor de cada línea de arco puede representar la frecuencia
entre la fuente y el nodo de destino. Los diagramas de arco puede
ser útiles en la búsqueda de concurrencias dentro de los datos.

9
10/1/2022

Gráfico de área
• Los gráficos de área son similares a los gráficos de línea, pero con
el área debajo de la línea relleno con un determinado color o
textura.
• Al igual que los gráficos de líneas, los gráficos de área se utilizan
para mostrar el desarrollo de valores cuantitativos durante un
intervalo de tiempo. Se utiliza normalmente para mostrar
tendencias en lugar de transmitir valores específicos.

Gráfico de barras
• El gráfico de barras es también conocido como gráfico de columnas.
• El gráfico de barras clásico utiliza barras horizontales o verticales para
mostrar comparaciones numéricas que de diferentes categorías. Uno
de los ejes de la gráfica muestra las categorías específicas que se
comparan y el otro eje representa una escala de valores.
• Los gráficos de barras se distinguen de los histogramas en que no
muestran desarrollos continuos a lo largo de un intervalo.

Nube de ideas o mapas mentales


• Una lluvia de ideas provenientes de un origen o “nube”,
también conocido como mapa mental, es un diagrama usado
para mapear ideas asociadas, palabras, imágenes y
conceptos.

10
10/1/2022

Gráfico de burbujas
• Un gráfico de burbujas es un gráfico de múltiples variables que supone un cruce
entre un diagrama de dispersión y un gráfico de área proporcional.
• Los gráficos de burbujas se utilizan normalmente para comparar y mostrar las
relaciones entre los círculos categorizados, por el uso de posicionamiento y
proporciones. El panorama general de las cartas de la burbuja se puede utilizar
para analizar patrones y correlaciones.
• Los tamaños de los círculos deben construirse con su base fuera el área del
círculo, no en el origen de su radio o diámetro. El tamaño de los círculos puede
cambiar de manera exponencial, pero esto dará lugar a malas interpretaciones
por el sistema visual humano.

Mapa de burbujas
• Con este mapa de datos, los círculos se visualizan en una región geográfica
designada con el área del círculo que es proporcional a su valor en el conjunto de
datos.
• Los mapas de burbujas son ideales para la comparación de proporciones asociadas a
regiones geográficas sin los problemas causados por el tamaño del área regional,
como pueden darse en los mapas coropléticos. Sin embargo, el mayor defecto de los
mapas de la burbuja es que si estas son demasiado grandes se pueden superponer
unas y otras, incluso entre diferentes regiones del mapa.

Calendario

• A lo largo de la historia, se han desarrollado diferentes sistemas de calendario


como una herramienta de organización para ayudarnos a planificar el futuro. Los
calendarios también se utilizan como una herramienta visual para mostrar
períodos de tiempo y para visualizar la organización de eventos. Los períodos de
tiempo, a menudo se muestran y se dividen en unidades tales como días,
semanas, meses y años. Una fecha es la designación de un solo día, específico
dentro de un sistema de este tipo.

11
10/1/2022

Gráfico de velas
• El gráfico de velas también se conoce como gráfico de velas japonesas.
• Este tipo de gráfico se utiliza como una herramienta de negociación para visualizar y
analizar los movimientos de precios en el tiempo para valores, derivados, divisas,
acciones, bonos, materias primas, etc… los símbolos utilizados en los gráficos de velas
se asemejan a los diagramas de caja, pero funcionan de manera diferente y por lo
tanto, no deben ser confundidos.
• El rectángulo principal en el símbolo se conoce como el cuerpo real, que se utiliza para
mostrar la gama entre el precio de apertura y cierre de ese período de tiempo.
Mientras que las líneas que se extienden desde la parte inferior y la parte superior del
cuerpo real con conocidas como sombras superior e inferior o mechas. Cada sombra
representa el precio más bajo o más alto negociado durante el período de tiempo
representado. Cuando el mercado es al alza (el precio de cierre es mayor de lo que se
abrió) el cuerpo es de color normalmente blanco o verde. Pero cuando el mercado es a
la baja (el precio de cierre es menor de lo que se abrió), entonces el cuerpo es por lo
general de color negro o rojo.
• Los gráficos de velas son excelentes para detectar y predecir las tendencias del
mercado con el tiempo y son útiles para interpretar el sentimiento del día a día del
mercado, a través de los colores y formas de cada símbolo candelero.

Gráfico de velas

Mapa coroplético
• Los mapas coropléticos, también llamados mapas coropletos o mapas de coropletas
muestran zonas geográficas o regiones divididas en colores, con sombras o dibujos en
relación con una variable de datos. Esto proporciona una manera de visualizar los
valores de un área geográfica, que puede mostrar variación o patrones en la ubicación
o extensión que se muestra.
• La variable de datos utiliza la progresión de color para representarse a sí misma en
cada región del mapa. Típicamente, esto puede ser una mezcla o transición de un
color a otro, una progresión de matices de más transparente a opaco, de claro a
oscuro o todo un espectro de color.

12
10/1/2022

Gráficos de densidad

• También conocidos como gráficos de densidad de Kernel o gráficos de densidad de


seguimiento.
• Un diagrama de densidad visualiza la distribución de datos a través de un período de
intervalo o de tiempo continuo. Esta tabla es una variación de un histograma que utiliza
un núcleo suavizado para trazar los valores, lo que permite distribuciones curvas y
homogéneas al suavizar el ruido. Los picos se muestran en una pantalla de ayuda
gráfica de densidad donde los valores se concentran en el intervalo.

Gráfico de anillos
• Un gráfico de anillos es esencialmente un gráfico de sectores con un área del centro
cortada.
• Sin embargo los gráficos de anillos tienen una ligera ventaja sobre los gráficos de
sectores, que a veces son criticados por centrarse en los tamaños relativos de las
piezas entre sí y a la carta en su conjunto, sin dar ninguna indicación de los cambios en
comparación con otros gráficos circulares.
• Un gráfico de anillos aborda parcialmente este problema de énfasis, para que el
espectador se centre más en los cambios de los valores globales, prestando atención a
la lectura de la longitud de los arcos, en lugar de comparar las proporciones entre las
rebanadas.

Mapa de puntos

• También conocido como mapa de distribución de puntos o mapa


de densidad de puntos.
• Los mapas de puntos son una forma de detectar patrones
espaciales o la distribución de datos a través de una región
geográfica, mediante la colocación de puntos de igual tamaño.

13
10/1/2022

Gráfico de matriz de puntos


• Una serie de unidades de puntos de colores se utilizan para representar
diferentes categorías y agruparlas en una matriz. Sirven para dar una visión
general de la distribución y proporciones de cada categoría en un conjunto de
datos, y también para comparar la distribución y proporción a través de otros
conjuntos de datos, con el fin de descubrir patrones.
• Cuando una sola variable o categoría está presente y los puntos son de un
solo color, un gráfico de matriz de puntos funciona de la misma manera que
un gráfico de áreas proporcionales.

Mapa de calor con matriz

• Los mapas de calor sirven para visualizar datos a través de las variaciones de
color. Cuando se aplica a un formato tabular, los mapas de calor son útiles
para el interrogatorio de datos multivariados, a través de la colocación de las
variables en las filas y columnas y la coloración de las células dentro de la
tabla. Los mapas de calor son buenos para mostrar la diferencia a través de
múltiples variables, revelando cualquier patrón, que pone en evidencia si las
variables son similares entre sí, y para detectar si existe cualquier correlación
entre ellas

Gráfico de Marimekko

• También conocido como parcela de mosaico.


• Los gráficos de marimekko se utilizan para visualizar los datos categóricos sobre un par de
variables. Funcionan como una especie de gráfico de barras apiladas sobre el 100% de los
valores, donde todas las barras son de igual longitud a través de un eje de valores y escalado,
dividiéndose en segmentos. Sólo en una tabla de Marimekko, ambos ejes son una variable con
una escala, que determinan la anchura y la altura de cada segmento. Esto hace que sea posible
la detección de las relaciones entre las categorías y sus subcategorías a través de las dos
variables.

14
10/1/2022

Rosa de Nightingale

• También conocido como diagrama de área polar.


• Esta gráfica se hizo famosa por la estadística médica, gracias a Florence
Nightingale, para comunicar las muertes prevenibles de los soldados durante
la guerra de Crimea.
• Gráficas de rosa de nightingale se dibujan en un sistema de coordenadas
polares. Cada categoría o intervalo en los datos se dividen en segmentos
iguales en un gráfico radial, y estos se extienden desde el centro en
proporción al valor que representan dependiendo de un eje polar. Así que
cada anillo del centro de la cuadrícula polar puede ser utilizado como una
escala para representar el tamaño de segmento y un valor más alto. Por lo
tanto, es importante tener en cuenta el área en lugar del radio de un segmento
para representar su valor.
• El mayor defecto del gráfico de Nightingale es que a los segmentos externos
se les da más importancia debido a su tamaño de área mayor. Esto
representa un aumento desproporcionado en su valor.

Rosa de Nightingale

Gráficos de sectores circulares

• Ampliamente utilizado en las presentaciones y oficinas, los gráficos circulares


o de tarta ayudan a mostrar las proporciones y porcentajes entre las
categorías al dividir un círculo en segmentos proporcionales. Cada longitud de
arco representa una proporción de cada categoría, mientras que el círculo
completo representa la suma total de todos los datos, igual a 100%.

15
10/1/2022

Pirámide de población

• También conocida como pirámide de edades y sexo.


• Una pirámide de población es un estilo de gráfico de espalda con espalda, o par de
histogramas (para cada sexo) que muestra la distribución de la población en todos los
grupos de edad y en ambos sexos. El eje X se utiliza para trazar los números de
población y el eje Y muestra los grupos de edad.
• Las pirámides de población son ideales para detectar cambios o diferencias en los
patrones de población. Se pueden utilizar múltiples pirámides de población para
comparar los patrones a través de las naciones o grupos de población seleccionados.

Gráfico radial
• También es conocido como gráfico de la araña, gráfico polar, o parcela de estrellas.
• Los gráficos radiales son una manera de comparar múltiples variables cuantitativas. Esto los
hace útiles para ver qué variables tienen valores similares o si hay valores extremos entre
cada variable. Los gráficos radiales son útiles también para ver de qué variables están
resultando altas o bajas dentro de un conjunto de datos, lo que es ideal para la visualización
del rendimiento.
• Cada variable se proporciona un eje que se inicia desde el centro. Todos los ejes están
dispuestos radialmente, con distancias iguales entre sí, mientras se mantiene la misma escala
entre todos los ejes. Las líneas de la cuadrícula que se conectan de eje a eje, y se utilizan
como una guía. Cada valor de la variable se representa a lo largo de su eje individual y todas
las variables son un conjunto de datos que conectados entre sí forman un polígono.

Gráfico de dispersión

• También conocido como gráfico de puntos, parcela XY o diagrama de


dispersión.
• Los diagramas de dispersión utilizan una colección de puntos colocados
mediante coordenadas cartesianas para mostrar los valores de dos variables.
Al mostrar una variable en cada eje, se puede detectar si existe una relación o
correlación entre las dos variables.

16
10/1/2022

Gráfico de barras apiladas

• A diferencia de un gráfico de barras múltiples este muestra sus barras


de lado a lado, en el segmento de las barras apiladas se muestran
múltiples conjuntos de datos uno a continuación del otro. Se utilizan
para mostrar cómo una categoría más grande se divide en categorías
menores y cuál es la relación que cada parte tiene en la cantidad total.

https://datavizcatalogue.com/ES/buscar/patrones.html

Práctica nro.1: Presentar información a través de


la visualización.
• Imagine que tiene que presentar información sobre ciertos temas a cierto público
y su objetivo es lograr que éste público se conecte con Ud. A través de la
información visual que va ha presentarles.
• Para esto debe presentar imágenes o fotografías que llamen la atención y
despierten sentimientos de contrariedad, heroismo y éxito de los siguientes
temas:
• Covid 19
• Diego A. Maradona
• Comida sana
• Video juegos
• Logro de metas o proyectos de una empresa.
• (*) Organizados en grupos tomar tres temas y presentarlo en un powerpoint

17

También podría gustarte