Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CIENCIA DE DATOS
SEMANA 7
CONDICIONES FAVORABLES PARA LA CLASE
Práctca la puntualidad
Respeta el turno de
partcipación
PRESENTACIÓN DE LA CLASE
Presentación del Módulo
Unidad de Competencia
Contenidos Semana 7
Herramientas de visualización
Power BI
Tableau
Qlik
Google Charts
Retroalimentación
Evaluación
MOMENTO PARA RECORDAR
Bienvenidos a la última semana del módulo Fundamentos de la Ciencia de Datos.
Realizada la captura de datos, su depuración y elegido el modelo de base de datos que se utilizará
para trabajar con ellos, dentro de un proyecto de ciencia de datos, corresponde ahora la etapa de
implementación.
Las consideraciones y aprehensiones de las etapas anteriores, permitirán que ésta sea exitosa y que
el análisis que se realice, tenga resultados relevantes que permitan a la organización tomar
decisiones óptimas.
Junto con la implementación, será necesario visualizar los resultados, que es la manera mas fácil de
ver comportamientos, tendencias y otras características importantes producto del estudio. Para ello
se verán distintas herramientas de visualización, cada una con sus características propias que las
hacen parte importante de la última etapa de un proyecto de ciencia de datos.
MOMENTO PARA CONOCER
1.- Implementación de un modelo de datos
Entendiendo que todo el proceso previo de captura consideró la depuración y preparación de datos,
es importante tener en cuenta que dicho proceso fue realizado con la intención de encontrar el
mejor modelo para los datos que se disponen y los objetivos que se persiguen. Dicho
procedimiento se realizó utilizando diferentes técnicas estadísticas, pero siempre con el objetivo de
contar con datos útiles que permitieran que el modelo elegido, cumpliera con los objetivos de la
organización.
Pruebas:
El cambio o migración a la nueva estructura puede provocar conflictos o problemas producto de
este traspaso. Es importante corregir estos errores con el fin de que todos los datos cumplan con
las orientaciones o especificaciones de la nueva base de datos.
1.1.- Objetivos
A partir de las consideraciones anteriores, se puede resumir el objetivo de la implementación en
dos aspectos:
Optimización de consultas:
Se debe tener en cuenta las técnicas que se emplean para proteger la base de datos de los
accesos no autorizados y los mecanismos para asignar y revocar privilegios a los diferentes
usuarios. De estas y otras acciones se encarga el componente de seguridad. En la actualidad
dado que una gran cantidad de ordenadores y otros tipos de dispositivos están interconectados,
es necesario restringir el acceso a las bases y sistema evitando así, posibles alteraciones o
pérdida de información.
Una forma de controlar el acceso, es gestionar clave de seguridad, esto, considerando que la
información que maneja cada organización es su activo y muy sensible.
2.- Visualización y herramientas de visualización. (Dashborad)
2.1.- Visualización
La visualización de datos es la representación gráfica de información y datos. Al utilizar
elementos visuales como cuadros, gráficos y mapas, las herramientas de visualización de datos
proporcionan una manera accesible de ver y comprender tendencias, valores atípicos y patrones
en los datos.
Habitualmente se tiende a creer que la visualización de datos solo se hace al final de un proceso
de ciencia de datos debido a que es en esta etapa donde se verán los resultados producto del
estudio; sin embargo, esto no es correcto. Debemos recordar que en la etapa de captura ya se
hicieron visualizaciones previas con la intención de poder apreciar el comportamiento de los
datos.
2.2.- Técnicas de visualización
Valores discretos: Son aquellos valores que representan números enteros, es decir, no existen
valores intermedios entre uno y otro. Ejemplo: número de hijos, número de casas, número de
habitantes, etc.
Valores continuos: Son aquellos que representan valores decimales o intervalos. Ejemplo:
estatura en metros.
Visualizaciones multidimensionales:
Este tipo de visualización permite mostrar gráficamente la interacción entre dos o más variables
o características. Si consideramos que las bases de datos están organizadas en tablas, se puede
decir que se están visualizando dos o más columnas a la vez permitiendo la comparación
inmediata entre ellas.
Como todo proceso, la visualización tiene también un protocolo o pasos a seguir. Estos son:
Elegir técnica de visualización:
Es necesario determinar qué tipo de visualización es más adecuada a partir de los objetivos
propuestos en el proyecto. Por ejemplo, si se quiere visualizar las tendencias de las ventas
durante un lapso de tiempo, lo ideal es que la técnica sea el uso de un gráfico de líneas. Si se
quiere ver el consumo respecto a un periodo particular, quizás sea preferible el uso de
correlación.
Analizar visualización:
Cuando se construye una visualización sobre un grupo de datos, es posible que queden al
descubierto diversos patrones que a primera vista no eran perceptibles. Un gráfico puede
mostrar una alta correlación entre dos columnas de la base de datos, en circunstancias de que
dichas columnas no habían sido analizadas antes en conjunto. Estos hallazgos permiten
responder las preguntas de negocios, corregir las hipótesis erróneas y volver a plantearlas para
una nueva iteración en el proyecto. Ejemplo: en base a los descubrimientos, es posible generar
planes de acción para la organización tales como: reordenar la distribución de los productos en
una tienda, dejar de fabricar ciertos productos, añadir otros servicios.
Presentar visualización y resultados:
Es importante conocer a los usuarios a los que se les va a mostrar la visualización (y sus
resultados), ya que, dependiendo del conocimiento que ellos tengan sobre analítica, es el nivel
de tecnicismo que la presentación puede admitir. En este sentido, las visualizaciones que para
un científico de datos son simples de comprender, pueden no serlo para quién toma las
decisiones en la organización. Es por esto, que no todas las visualizaciones pueden ser
expuestas debido a su complejidad y exigencia técnica. Ejemplo: un árbol de decisión, el cual
puede tener múltiples caminos y condiciones para determinar sus niveles, sin embargo, al
momento de mostrar los resultados, es conveniente resaltar solo aquellos que tienen mayor
incidencia en el negocio.
A continuación, se presentan algunos tipos de gráficas utilizados en visualización:
2.5.- Herramientas de visualización
Tableau es una plataforma de análisis integral eficaz, segura y flexible para nuestros datos. Fue
diseñado para el individuo, pero se adapta a toda la empresa. Es la única plataforma de
inteligencia de negocios que transforma datos para motivar acciones a partir de la información.
Tableau ofrece varios productos enfocados en la analítica. Posee módulos para la preparación de
los datos (Tableau Prep), visualización y creación de tableros de control (Tableau Desktop) y
soluciones para el trabajo colaborativo a través de la web (Tableau Server y Tableau Online). Su
funcionalidad principal y, en la que resulta más competitivo, es la visualización interactiva de los
datos.
Tableau Desktop es el producto principal de Tableau. Posee una interfaz gráfica orientada al
análisis y exploración de los datos, permitiendo arrastrar y soltar columnas, aplicar filtros y, en
general, entregarle la libertad al usuario para que este responda sus preguntas de negocios
interactivamente. La figura muestra una captura de pantalla de Tableau Desktop.
Tableau Prep es un módulo de Tableau que facilita el trabajo con diversas fuentes de
información, como bases de datos relacionales, plataformas de contabilidad y finanzas, Hadoop
y otros sistemas de Big Data, etc. Sus funciones principales son seleccionar, limpiar, preparar y
transformar los datos. Posee una interfaz gráfica para diagramar las operaciones que se realizan
con la información, además de que permite consultar, en todo momento, el estado de una fuente
de datos (analizar algunas filas, modificar un dato directamente, etc.)
2.5.3.- Qlik
Qlik es la plataforma que permite extraer el valor oculto detrás de los datos que se generan en
la empresa. Dentro de sus áreas de utilidad están finanzas, recursos humanos, marketing o
ventas, y cualquier otra en donde se generan datos, permitiendo su uso sin importar su origen
o ubicación.
Qlik entre permite democratizar los datos, es decir, recopilar, procesar y extraer el valor de los
datos de una compañía para que estos datos sean accesibles por todo el personal de una
empresa.
Una de las cualidades de Qlik es que logra tomarse de la inteligencia artificial para lograr una
mejor oferta al trabajar con inteligencia aumentada. Esto lo consigue a través de la indexación
asociativa que generan automáticamente conocimientos sobre los datos para que puedan ser
explorados por los usuarios, lo que también recibe el nombre de alfabetización de los datos.
Dicho en otras palabras, Qlik ayuda a leer y entender mejor los datos.
Dentro de los productos que ofrece, está Qlik Sense, el cual es un prestigioso software de
inteligencia empresarial que ayuda a las empresas globales a actuar más rápido, trabajar de
manera más inteligente y ofrecer a todos analíticas modernas. Combina, carga, visualiza y
explora datos con facilidad independientemente de su tamaño. Crea y comparte paneles de
control potentes e interactivos en un entorno manejable. Ofrece un rendimiento y escalabilidad
inigualables en SaaS empresarial, en la nube de elección del cliente o como implementación
local. Acelera el camino hacia el valor comercial con una completa plataforma de BI.
Observación: