Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 Trabajar Con Los Datos A Visualizar
3 Trabajar Con Los Datos A Visualizar
Los conjuntos de datos son cada vez más grandes y complejos. La visualización de
datos ayuda a los científicos de datos a comprender qué técnicas utilizar para descubrir
ideas o patrones ocultos y les ayuda a entender los resultados de la aplicación de estas
técnicas guiando así el proceso de análisis para la obtención de los resultados
deseados. Necesitamos explorar, que es la forma de profundizar en ellos para poder
encontrar patrones y valores atípicos, solo así veremos lo que esconden los
datos. Analiza visualmente tus datos desde diferentes perspectivas, intenta descubrir
algunos patrones en tus datos.
Cuando se trata de explorar tus datos no hay razón para dudar. Aunque en un inicio no
sepas qué significan los patrones, al menos ya sabes que existen. Puedes empezar a
relacionar la subida de unos índices con la bajada de otros, o las subidas y las bajadas
con días específicos de la semana.
Al explorar los datos, podrás distinguir, además, los datos que son incorrectos o los que
directamente están ausentes. Es un buen ejercicio que explores tus datos utilizando
varios tipos diferentes para que descubras de ellos lo que cada tipo de gráfico te puede
llegar a revelar. Este es sin duda un gran experimento para ejecutar, te puedes apoyar
en tablas dinámicas de Excel, por ejemplo; toma tus datos, intercambia filas y
columnas, filtra, ordena por campos diferentes y en diferentes direcciones, sigue
explorando hasta que los datos hablen por sí mismos.
Por otra parte, no te quedes atascado en un análisis de datos que no cuenta nada. No
manipules los datos para demostrar una teoría. Asegúrate de entender
completamente la pregunta que estás tratando de responder. Infórmate, pregunta todo
lo que haga falta y deja que las respuestas salgan en el análisis y si no salen, igual
habrá que reformular.
Analizar datos lleva tiempo y esfuerzo; cuanto más profundices y te ensucies con los
datos más limpios estarán tus informes, gráficos, imágenes o historias.
Verás que en unos pocos pasos tu conjunto de datos estará suficientemente limpio y
los más simplificado para ser visualizado en los informes.
Elegir el gráfico correcto es muy importante, pero está lejos de ser tu última decisión al
visualizar los datos. Hay sutilezas y matices que deben considerarse más allá del tipo de
gráfico que utilizas como puede ser la decisión de acumular o no los datos en un
gráfico.
Los gráficos de doble eje con escalas muy dispares no siempre dan buen resultado, por
lo que podemos considerar mostrar dos gráficos o crear una proporción en los datos
dividiendo unos entre otros.
Cuando hablamos de acomodados, se plantea además la necesidad de elegir entre
gráficos de barras apiladas y barras apiladas proporcionales. Con las barras
apiladas, nos surge el reto de calcular el tamaño de cada sección que se verá claro solo
en la categoría pegada al eje. Con las barras cien por ciento apiladas es más fácil de
comparar las proporciones, ya que el tamaño de todas las columnas es comparable
entre sí.
Es posible utilizar, además, gráficos tipo cascada en los que se muestre el aumento o
disminución del dato en cada momento. Estos gráficos suelen acompañarse de
colores con formato condicional que ilustran rápidamente la evolución del indicador
concreto que se muestra.
Como hemos visto, existen suficientes opciones gráficas que ofrecen la posibilidad de
representar valores sin acumular o acumulados.
La visualización de datos es un enfoque importante del mundo Big Data ya que permite
obtener una visión completa y descubrir el valor de los datos. va a depender de las
respuestas que necesitemos dar a los requisitos de negocio que se planteen para el
informe que estamos elaborando. que se planteen para el informe que estamos
elaborando.
Los conjuntos de datos de hoy son más grandes, se generan y cambian con más
rapidez, y son más diversos que los conjuntos de datos del pasado. Las tecnologías Big
Data nos permiten manejar el volumen, la velocidad y la variedad que conllevan estos
conjuntos de datos modernos.
Resultaría difícil que no contáramos con datos de tipo fecha o fecha/hora. Estos tipos
de datos nos garantizan el análisis en el tiempo, y dan un enorme juego a los informes
que vamos a crear con ellos. Esto se debe a que, por lo general, existe mucho interés en
analizar las distribuciones, relaciones, correlaciones y comparativas en el tiempo.
Si se trata de procesos con inicio y fin o fechas que se comparan dinámicamente con la
fecha actual, podríamos encontrar datos de tipo duración que se componen por una
estructura de días, horas, minutos y segundos. Este formato se puede convertir, según
sea la necesidad, en años, meses y semanas.
Conocer con certeza la magnitud de los valores que estamos manejando en el proceso
de creación del informe es de gran importancia. Podríamos trabajar con otros tipos de
datos como pueden ser, booleanos,
los tan conocidos como verdadero o falso, tan útiles para conseguir definir estados.
Hay otra clasificación relativa a los datos que tienen que ver más con el contenido que
con el formato en sí.
Existen datos cuantitativos que pueden ser medidos. Datos discretos que se basan en
recuentos y dejan ver un solo punto cada vez o datos continuos que nos permiten ver
los puntos y las conexiones entre ellos. Existen, además, datos categóricos que son los
que se pueden agrupar. Estos datos se pueden categorizar de dos formas: Ordinal y
nominal. Ordinal significa categorizar de forma ordenada, pequeño, mediano y
grande, primero, segundo y tercero. Es un dato que técnicamente se puede
clasificar. Nominal, simplemente, significa nombre. El nombre lo es todo al utilizar
categorías como rojo, verde, azul, coches, camiones o barcos.
Es muy importante poder distinguir lo que se conoce como datos de cola larga. Es el
caso de cuando existe gran cantidad de valores muy grandes o muy pequeños, en los
extremos de la muestra que contribuyen a expandir todo el conjunto de datos; afectan
la escala y la forma en la que decidamos representarlos.