Está en la página 1de 15

VISUALIZACIÓN DE DATOS

Edu Abelleira
28-01-21
Learning Path
Índice
1. Parte teórica….………..……………………………….………………………….……………3
1.1. ¿Qué es?…..……………………………..………..……….…………………..…….3
1.2. Estadística descriptiva……………………….…………….…………..……….……5
1.2.1.Univariante……………………………………………………………………5
1.2.2. Bivariante y multivariado………………….………………………………..6
1.3.Características de un gráfico eficaz.……………………..…………..…………….7
1.4.Tipos de gráficos………………..……………….……………………………………8
2. Parte/Aplicación práctica…………………………….…………………………………….….10
3. Conclusión…………………………….……………………………..….……..……………….14
4. Bibliografia/Webgrafia……………………………….…………………………………..…….15
1. Parte teórica
1.1. ¿Qué es?
La visualización de datos es una representación gráfica de la información y los datos.
Mediante el uso de elementos visuales, como gráficos o mapas, nos ofrece de una
manera accesible detectar y comprender las tendencias, los valores atípicos y incluso que
patrones hay en los datos. En el sentido más academicísta, esta representación puede
considerarse como un mapeo entre los datos originales (numéros) y elementos gráficos
(barras, sectores, líneas o puntos en un gráfico). Así pues, un gráfico de barras es un
mapeo de la longitud de una barra en relación una variable determinada.
Por un lado, la visualización de datos tiene sus bases en el campo de la estadística y, por
lo tanto, generalmente se considera una rama de la estadística descriptiva que más
adelante desarrollare con más detención. Por otro lado, debido a que se requieren tanto
habilidades de diseño como habilidades estadísticas y de computación para visualizar de
manera efectiva, actualmente, muchos autores consideran que forma parte tanto de la
rama del arte como de la rama de la ciencia. Casi todas las visualizaciones de datos se
crean para consumo humano, hay estudios que demuestran que las personas utilizan en
promedio un 19% menos de recursos cognitivos y son un 4,5% más capaces de recordar
detalles al comparar la visualización de datos con el texto. Esta técnica se usa ya que las
persona podemos ver y identificar fácilmente las diferencias en la longitud, la forma, la
orientación, las distancias y el color (tono) de las barras, sectores, líneas, etc, sin un
esfuerzo de procesamiento significativo; lo que se conoce como “atributos de pre-
atención”.
Dado que, como ya he dicho, los humanos pueden procesar más fácilmente las
diferencias en la longitud de la barra o línea que en el área de la superficie, es más
efectivo usar un gráfico de barras para mostrar la comparación (usa la longitud de las
barras) en lugar de gráficos circulares (usa el área de la superficie para mostrar la
comparación). Casi todas las visualizaciones de datos se crean para consumo humano. El
conocimiento de la percepción y la cognición humanas es necesario al diseñar
visualizaciones intuitivas. La cognición humana se refiere a procesos en los seres
humanos como la percepción, la atención, el aprendizaje, la memoria, el pensamiento, la
formación de conceptos, la lectura y la resolución de problemas. El procesamiento visual
humano es eficiente para detectar cambios y hacer comparaciones entre cantidades,
tamaños, formas y variaciones de luminosidad y colores. Cuando los datos simbólicos
(cognición humana) se asignan a las propiedades visuales, los humanos pueden
examinar grandes cantidades de datos de manera eficiente. Aproximadamente 2/3 de las
neuronas del cerebro pueden participar en el procesamiento visual. Una buena
visualización proporciona un enfoque diferente para mostrar posibles conexiones,
relaciones, etc, que no son tan obvias con los datos cuantitativos no plasmados. La
visualización puede convertirse en una gran herramienta para sacar diferentes
conclusiones.
1.2. Estadística descriptiva
La estadística descriptiva nos da resúmenes sencillos sobre nuestra muestra y sobre las
observaciones o conclusiones que hemos sacado. Como ya he dicho anteriormente, estos
resúmenes pueden ser cuantitativos o visuales, es decir, gráficos fáciles de entender. Este
tipo de estadística, se distingue de la estadística inferencial o estadística inductiva que lo
que hace es que a través de una muestra predice lo que va a pasar con el resto de la
población. Este cambio entre las dos, significa que la estadística descriptiva, a diferencia
de la estadística inferencial, no se desarrolla sobre la base de la teoría de
la probabilidad y con esto podemos decir que son estadísticas más objetivas y
concretas. Lo más común cuando un análisis de datos extrae sus principales conclusiones
utilizando estadísticas inferenciales, es que también se presentan estadísticas
descriptivas para así poder tener una base de datos cierta, coherente y objetiva.
Como ya vimos en las Tech Skills, las medidas que se utilizan para describir un conjunto
de datos son medidas de tendencia central o centralización (media, mediana y moda) y
las medidas de variabilidad o dispersión (desviación, varianza, correlación, máximos y
mínimos). En el mundo empresarial, las estadísticas descriptivas nos dan un resumen útil
de muchos tipos de datos como por ejemplo, retornos, rentabilidades, inversiones, etc.

1.2.1. Univariante

Este tipo de gráficos son aquellos en los que solo tenemos una variable para analizar pero
dónde podemos extraer la media, la mediana, la moda, el rango, los cuartiles, etc. Con
este tipo de gráficos hay que ir muy con cuidado ya que no son muy comunes y a menudo
nos proporcionan resultados engañosos y esto nos lleva a desarrollar un gráfico bivariante
que nos va a dar mucha más claridad. El tipo de gráficos más usados en este caso es el
diagrama de sectores (quesos) ya que nos da una imagen rápida de una variante o tema
determinado.
1.2.2. Bivariante y multivariado

Como bien indica el nombre, en este caso es cuándo ponemos en interacción dos
variables (bivariado). Por otro lado está el análisi multivariado que es cuando juntamos
más de dos variables (ya requiere de procesadores informáticos, mentes muy claras o
una relación directamente proporcional muy fuerte). La gran diferencia entre el análisis
univariante y bivariante es que el análisis bivariante no solo es un análisis simple, sino
que también nos da la relación entre dos variables diferentes (por ejemplo: horas/
resultado). Con este tipo de análisis, entra en juego otro concepto, la pendiente, que nos
va a dar un número que nos indicará cual ha sido la progresión, que relación hay entre las
variables y nos ayudará a intuir cual puede ser la proyección a pesar de que en nuestro
caso (Company) al ser personas es difícil predecir cual va a ser la proyección ya que
puede no seguir una línea (línea de regresión= mx+n dónde x es la pendiente). Dicho
esto, aquí encontramos otro dos conceptos distintos:

- La pendiente no estandarizada: esta nos indica el cambio de unidad en la variable


(x) para un cambio de una unidad en la variable (y), algo que se conoce como
variables inversamente proporcionales o poco bivariantes. (productividad)

- La pendiente estandarizada: nos van a dar cambios en ambas variables cuando


modifiquemos uno de los valores (ya sea x o y). Lo que se conoce como variables
directamente proporcionales. (acción/resultados).
Aquí también tenemos que vigilar bastante ya que los datos muy desglosados y muy
acotados a menudo se acaban transformando casí en logaritmos. El uso de logaritmos
hace que los gráficos sean más simétricos y acaban tomando más una distribución
normal, lo que los hace más fáciles de interpretar de forma intuitiva. (pura teoría que no
me voy a alargar ya que se me escapa). Creo que no hace falta decir que este análisis, es
el mas utilizado en nuestro día a día y que las personas tendemos a relacionar dos
conceptos/variables con la intención de sacar un resultado, es algo intuitivo se podría
decir.
1.3. Características de un gráfico eficaz
Como ya comentaba al principio, actualmente la visualización de datos tiene una parte de
arte y otra parte de ciencia o estadística. Es por eso que toda analítica, debe ir respaldad
por un buen diseño y una buena presentación del gráfico, unos mismos elementos
gráficos pueden llegar de una manera más o menos efectiva. Por ejemplo, los gráficos de
puntos y los gráficos de barras superan a los gráficos circulares.

"La excelencia en los gráficos estadísticos consiste en ideas complejas comunicadas con
claridad, precisión y eficiencia”.

Es por estas razones que según Edward Tufte, todas las presentaciones gráficas deben:

• Mostrar los datos con claridad y etiquetas.


• Llevar al espectador o quién le presentemos a pensar en los valores que se
muestran más que en la metodología, el diseño gráfico, la tecnología de producción
gráfica o cualquier otra cosa. (Parece contraproducente con lo que he comentado
al principio del apartado pero las personas inconscientemente ya nos fijamos en el
diseño y la presentación, que eso pase a un segundo plano y tomemos consciencia
de los valores y resultados mostrados).
• Evitar distorsionar lo que los datos nos dicen o nos transmiten.
• Presentar muchos números en un espacio pequeño.
• Llegar a hacer que grandes conjuntos de datos sean coherentes entre sí.
• Animar al ojo a comparar diferentes datos.
• Revelar los datos en varios niveles de detalle, desde una descripción amplia hasta
la base que lo compone.
• Tienen un propósito/objetivo razonablemente claro: descripción, exploración,
tabulación o decoración
• Estar muy integrado con las descripciones estadísticas y verbales de un conjunto
de datos.
La finalidad de los gráficos, está en transmitir un mensaje, sacar unas conclusiones y
llegar a la acción con ello pero el no aplicar estos principios puede llevarnos a gráficos
engañosos, que distorsionen el mensaje o apoyen una conclusión errónea.
1.4. Tipos de gráficos
Para poder llegar a transmitir bien el mensaje y llegar a las conclusiones deseadas, hay
que tener claros también la tipología de gráficos que existen y cuando podemos usar uno
o otro. Encontramos 8 grandes tipologías aunque también voy a nombrar algunos de los
muchos otros que existen:
- Series de tiempo (univariable): se tiene en cuenta una sola variable durante un
período de tiempo. Se puede utilizar un gráfico de líneas para demostrar la tendencia. (ej:
tiempo que tarda un coche en realizar cada vuelta a un circuito).
- Clasificación: los valores a analizar se clasifican en orden ascendente o descendente,
como una clasificación. Se puede utilizar un gráfico de barras para mostrar la
comparación entre los participantes.
- Sectores: los valores se miden como una proporción del total (es decir, un porcentaje
de 100%). Un gráfico circular o un gráfico de barras pueden mostrar la comparación de
razones, como la participación de mercado representada por los competidores en un
mercado.
- Desviación: los valores se comparan con una referencia previamente puesta, como
una comparación de los gastos reales con los presupuestados para varios
departamentos de la Company durante un período de tiempo determinado. Un gráfico
de barras puede mostrar una comparación de la cantidad real con la de referencia.
- Distribución de frecuencia: muestra el número de repeticiones de una variable
particular para un intervalo dado, como por ejemplo las edades de las personas.
Un histograma, un tipo del gráfico de barras, se puede utilizar para este análisis.
- Correlación: Comparación entre valores representados por dos variables (X, Y) para
determinar si tienden a ser directamente proporcionales o al contrario lo son
inversamente. Por ejemplo, hacer una gráfica del desempleo (X) y la inflación (Y) para
una muestra de x meses. Normalmente se utiliza un diagrama de dispersión para este
mensaje.
- Comparación nominal: comparación de valores categóricos sin ningún orden en
particular, como el volumen de horas por persona. Se puede utilizar un gráfico de
barras para esta comparación.
- Geográfica o geoespacial : comparación de una variable en un mapa o espacio
delimitado, se podría calcular el número de personas en los distintos pisos de un
edificio por ejemplo. Un cartograma es un gráfico típico utilizado.
Otros menos usados y a la vez más complejos de realizar son:
- Diagrama de caja y bigotes
- Gráfico de nube y burbuja
- Gráfico de bala
- Mapa de calor
- Matriz
- Red
- Gráfico de área polar
- Gráfico de árbol radial
- Escala de tiempo
- Diagrama de árbol
- Nube de palabras
2. Parte/Aplicación práctica
Una vez explicada la teoría y detectando que dentro de la Company no terminábamos de
hacer un buen análisis del chronos y dónde se estaban dedicando las horas y con que
reconversión a nivel de resultados (funnel), junto con Anna hemos realizado uno nuevo y
este es el resultado gráficamente:

En este primer gráfico, podemos ver el total de horas de cada miembro de la Company y a
la vez también se puede ver de forma general donde han estado dedicadas estas horas.
En este gráfico, podemos ver dos cosas. Por un lado vemos cuantas horas de TS/FS ha
hecho cada miembro, la cual cosa nos va a facilitar el trabajo a la hora de saber si alguien
ha faltado en alguna de ellas durante la semana y por otro lado, podemos analizar que
hace cada miembro durante las TS/FS, si solo hace acto de presencia o aporta
conocimiento, dinámicas, diálogos, etc…
En estos últimos gráficos podemos ver todo lo que tiene que ver con la parte individual,
tanto LP’s, BP’s y OBV’s. Esto, nos va a dar un total de horas dedicadas a cada campo.
En cuanto a LP’s y BP’s, también nos va a decir de que tipología es el LP o el BP
basándonos con los 12 procesos que componen el Rocket Model. Por lo que hace OBV’s,
sabremos ver el total de OBV’s de cada una de las 4 tipologías y dónde se han hecho
estas OBV’s (proyecto) para ver y saber donde se encuentra el proyecto en todo momento
en cuanto al exterior y fases del Design Thinking.
Ya en estos últimos gráficos, encontramos los proyectos. Esta pestaña nos da mucha
información valiosa. Primero de todo vemos quién se encuentra en cada proyecto y en
cuantos proyectos por persona estamos. Nos da también una imagen de los proyectos
activos dentro de la Company y ya por último, nos hace un funnel acotado de dónde se
han dedicado las horas que se han invertido en el proyecto, bien sea con reuniones,
obv’s, asesorias, gestión con clientes, etc.
3. Conclusiones
Una vez terminado este Learning Path, voy a sacar unas conclusiones. A nivel del la
Company creo que ahora tenemos un muy buen chronos que nos va a permitir poder
analizar más individual y colectivamente donde estamos en todo momento. Es una
herramienta que la vamos a utilizar cada lunes en la FS para tener una fotografia de como
empezamos la semana en TINN y ser conscientes de nuestros indicadores.También nos
va a mostrar nuestra productividad ya que va relacionado con los resultados, ya sean
numero de LP’s, número de OBV’s, número de BP, etc. Ahora el siguiente paso es poder
relacionar toda esta información con nuestra facturación/beneficio y así, terminar de darle
un sentido completo. A nivel individual, me ha costado bastante sacar tanto el Learning
Path como el excel pero al final creo que tenemos un muy buen resultado y que ahora ya
solo falta que se llene y ¡empiece el análisis!
4. Webgrafia/bibliografia
- https://www.tableau.com/es-es/learn/articles/data-visualization

- https://en.wikipedia.org/wiki/Descriptive_statistics#Bivariate_and_multivariate_analysis

- https://www.grapheverywhere.com/las-20-herramientas-de-visualizacion-de-datos-
big-data-del-momento/

- https://datos.gob.es/sites/default/files/doc/file/informe_herramientas_visualizacion.pdf

- https://infogram.com/es/pagina/visualizacion-datos

- http://www5.uva.es/estadmed/datos/univariante/univar.htm

- https://www.vernier.com/product/graphical-analysis-4/

- https://docs.google.com/spreadsheets/d/
1a7XXdqi2LCQJKyuBTnGDFHAKW6iDKpUJaLp5jdLfB4I/edit#gid=1200861646 (excel)

También podría gustarte