Está en la página 1de 21

ANÁLISIS DE DATOS

EMPLEANDO ESTADÍSTICA
DESCRIPTIVA
Módulo 4
Power BI: Visualización
ÍNDICE
1| Presentación del módulo

2| Logro básico del módulo

3| Objetivos específicos

4| Competencias relacionadas con el módulo

5| Núcleos Temáticos

6| ¿Qué vas a encontrar en el módulo?

7| Tips para obtener mejores resultados

8| ¡Es momento de aprender!

9| Referencias
Análisis de datos empleando estadística descriptiva 3

1 Presentación del módulo


Power BI se ha convertido en los últimos años en la herramienta de visualización
de datos más popular. Su precio asequible, con su versión gratuita de escritorio
Power BI Desktop, su conexión con diferentes tipos de fuentes, el uso intuitivo
de sus herramientas, la interrelación de los distintos cuadros de mando y la
facilidad de compartir la información generada la convierten en la aplicación
preferida para generar la visualización. En esta segunda parte del curso, vamos
a aprender a obtener las principales medidas estadísticas a través de esta
herramienta y también la mejor forma de visualizarlas.

2 Logro básico del módulo


• Obtener las principales medidas estadísticas y conocer la forma de
visualizarlas.

3 Objetivos específicos
Este material de aprendizaje busca:
1. Comprender el lenguaje DAX.
2. Crear diferentes medidas estadísticas.
3. Generación de informes o Dash Board.
4. Manipular diferentes objetos gráficos.
5. Realizar consultas en lenguaje natural.

4 Competencias relacionadas con el módulo


El participante al finalizar el estudio del curso:
• Comprende el lenguaje DAX que emplea Power BI.
• Diseña informes o Dash Board.
• Emplea diferentes instrumentos gráficos.
Análisis de datos empleando estadística descriptiva 4

5 Núcleos Temáticos

6 ¿Qué vas a encontrar en el módulo?


Un curso diseñado para 10 horas de autoaprendizaje: destinado a la lectura y
análisis de contenidos, participación a través de herramientas didácticas propias
de los entornos virtuales.
En cada unidad, encontrarás dispositivos pedagógicos para apoyo metodológico,
donde se dispondrá una guía de actividades semanal que orienta el proceso y
ruta que debe realizar el estudiante en pro de su proceso de aprendizaje. En
dicho texto, se incluyen las competencias de cada unidad. En la semana de cada
unidad, se encuentra la cartilla (documento que el autor elaboró especialmente
para el módulo) y lecturas complementarias si el tema lo requiere. Después de
las lecturas están los contenidos multimediales, los cuales pueden ser:
Análisis de datos empleando estadística descriptiva 5

• Objetos Virtuales: recursos digitales utilizados con un propósito educativo;


permite interacción y selección de la ruta de aprendizaje, que en está
ocasión será un caso teórico práctico interactivo referente al SENA.
• Video cápsulas: videos cortos que presentan el desarrollo de un proceso,
un ejemplo, un procedimiento, un ejercicio, un contenido. Tienen como
propósito complementar, repasar, indicar procesos y procedimientos
requeridos para un acto específico del aprendizaje.
• Material complementario: son materiales complementarios que se incluyen
en las diferentes semanas para reforzar los aprendizajes (audios o podcast,
juegos o enlaces web, lecturas, entre otros).
• Videos de Apoyo: son videos de valor ubicados en la Web con el fin de
generar reflexión y asimilación de conocimiento.
• Foro: se realizará de forma asincrónica, aquí el estudiante tendrá la
posibilidad de preguntar y despejar inquietudes.
La evaluación del módulo se llevará a cabo a través de un quiz individual, según
los parámetros de la universidad; velando por la formación y la evaluación
integral de los estudiantes.

7 Tips para obtener mejores resultados


1. Lee con mucha atención este material y navégalo en su totalidad.
2. Para facilitar la comprensión de los contenidos, puedes hacer uso de
estrategias como: tomar apuntes, revisar los temas las veces que lo
requieras, realizar diagramas, tablas o mapas conceptuales o utiliza cualquier
otra técnica de estudio que te permita alcanzar tus logros.
3. Maneja adecuadamente tu tiempo, recuerda que tienes tres semanas para
consumir todo el contenido del módulo.
4. Busca un lugar cómodo y tranquilo, sin ruido ni distractores que puedan
afectar tu concentración y disponte a recibir este conocimiento con la mejor
actitud.
Análisis de datos empleando estadística descriptiva 6

8 ¡Es momento de aprender!

Unidad 1. Generalidades
En el módulo anterior, vimos la importación de los datos y algunas herramientas
para su transformación en Power BI. En esta segunda parte, vamos a aprender
el lenguaje DAX que es el empleado por este aplicativo para la generación
de medidas. Además, vamos a ver las principales herramientas básicas de
visualización que ayudan a representar de una mejor manera los cálculos
generados. Al igual que en el módulo anterior vamos a utilizar el archivo de Excel
PuntajesPowerBI.xlsx para realizar los ejemplos que desarrollaremos.

Unidad 2. Lenguaje DAX y Creación de Medidas


El lenguaje DAX es la sintaxis que utiliza Power BI para la introducción de
funciones, fórmulas y análisis de datos con el fin de generar una expresión y
obtener un valor determinado. Esta sintaxis fue la que nos permitió realizar
todas las tareas del módulo anterior solo que permaneció oculta. Además, su
estructura es muy similar a la que se utiliza en las hojas de Excel.

2.1. Estructura del Lenguaje DAX


La sintaxis básica del lenguaje DAX está compuesta por las siguientes partes:
Análisis de datos empleando estadística descriptiva 7

Que representa el nombre con el que


será asignado el nuevo objeto en
Power BI.

El signo igual determina el nuevo


valor que va a tener el nuevo objeto
creado.
Análisis de datos empleando estadística descriptiva 8

El lenguaje DAX tiene incorporadas


diversas funciones como lo son SUM
que suma los elementos del objeto al
que se le está calculando o COUNT
que cuenta el número de elementos
que contiene. A lo largo del curso
emplearemos algunas de ellas y en
el material de apoyo se presentarán
otras.

Representa los objetos ya creados


que serán utilizados para crear el
objeto nuevo.

2.2. Principales Medidas


Si queremos calcular una nueva medida, en la vista principal del informe, en el
menú Modelado, seleccionamos Nueva medida como se muestra en la figura
2a. Al hacerlo se despliega una barra muy similar a la que aparece en Excel en
donde se formulan las medidas, figura 2b. Aunque no es necesario, lo ideal sería
crearlas dentro de la tabla de la cual se va extraer la información, por tanto,
antes de crearla se aconseja seleccionar dicha tabla en la parte derecha de
Power BI como se muestra en la figura 2c.
Análisis de datos empleando estadística descriptiva 9

Figura 2
Formulación de medidas

A continuación, vamos a ver algunas de las medidas que pueden definirse:


• count: esta medida permite contar el número de registros que existen en
la columna de una tabla. Por ejemplo, si queremos contar el número de
colegios podríamos escribir en la línea de fórmulas:

Num_Colegios = count(Puntajes[COD_INSTITUCIÓN])

como se muestra en la figura 3a. Como teníamos seleccionada la columna


puntajes, esta medida aparece creada dentro de las columnas de la tabla
Puntajes como se muestra en la figura 3b,
Figura 3
Creación de medida count
Análisis de datos empleando estadística descriptiva 10

Observemos que para determinar el objeto al que se le aplica la función se


debió seleccionar la tabla, en este caso Puntajes, a la que pertenece la columna
a la que le vamos a calcular la función y la columna se escribe entre paréntesis
cuadrados. Más adelante veremos cómo son utilizadas estas medidas.
• distinctcount: cuenta el número de valores distintos. Por ejemplo, en
nuestro caso, podríamos contar el número de departamentos utilizando el
siguiente comando:
Num_Departamentos = count(‘Información Institución’[COD_
DEPARTAMENTO])
que sin utilizar ningún filtro previo nos daría 32, que sería la cantidad de
departamentos que tiene Colombia. De nuevo, esta medida podría crearse, en
un caso ideal, en la tabla Información Institución.
• average: devuelve el valor promedio de una columna. Por ejemplo, para
calcular el puntaje promedio de la prueba de matemáticas podríamos
escribir:
Promedio_Mat = AVERAGE(Puntajes[PROMMATEMATICA])
• median: devuelve la mediana de una columna. Por ejemplo, para la calcular
la mediana de la prueba de Lectura Crítica escribiríamos:
Mediana = median(Puntajes[PROMLECTURACRITICA])
Análisis de datos empleando estadística descriptiva 11

2.3. Operadores Lógicos¹


En DAX, podemos utilizar los operadores lógicos para calcular medidas. Los
símbolos que corresponden a cada uno de ellos son:

2.4. Funciones de Filtro


En DAX, las funciones de filtro permiten calcular medidas cuando se cumplen
algunas condiciones en los datos. Dentro de estas, la más usada es calculate.
• calculate: evalúa la función que se desee bajo un filtro o filtros
determinados, cada filtro se separa por una coma. Por ejemplo, podríamos
desear calcular la cantidad de colegios de calendario A y que tuvieron un
desempeño Medio o Alto en matemáticas. Para esto podríamos utilizar la
función calculate que tiene dos filtros: uno para el desempeño y otro para
calendario.
Ba_Me_Mat_A =
CALCULATE(
count(Puntajes[COD_INSTITUCIÓN]),
if(Puntajes[Desempeño Matemáticas]=”Medio” ||
Puntajes[Desempeño Matemáticas]=”Alto”,
TRUE , FALSE ),

¹https://docs.microsoft.com/es-es/dax/
Análisis de datos empleando estadística descriptiva 12

‘Información Institución’[COD_CALENDARIO]=1
Expliquemos un poco cómo fue construida esta fórmula:
Me_Al_Mat_A: es el valor calculado, en este caso sería la cantidad de colegios de
calendario A con desempeño en matemáticas Medio y Alto.
Medida: count(Puntajes[COD_INSTITUCIÓN]): es la medida que se desea
calcular, la cantidad de colegios.
Primer filtro: if(Puntajes[Desempeño Matemáticas]=”Medio” ||
Puntajes[Desempeño Matemáticas]=”Alto”,TRUE,FALSE). Este representa la
primera condición relacionada con el desempeño. Observemos que se forma con
el condicional if que va será verdadero si el desempeño en matemáticas es Alto
o Medio. Recuerde que el operador lógico O se representa por ||.
Segundo filtro: ‘Información Institución’[COD_CALENDARIO]=1. Este se refiere
a los colegios de calendario A que fueron identificados en la tabla calendario con
el valor de 1.

Unidad 3. Generación de Informes y Entorno de Trabajo

Ya con los datos preparados y la


creación de algunas medidas vamos
a generar un Informe o Dash Board
con ellos. Estos informes facilitan la
visualización y además permiten la
interacción de todas las gráficas, en
las siguientes secciones veremos las
más importantes:

3.1. Filtros
Los filtros son elementos que permiten
seleccionar características específicas
de una variable. Por ejemplo, vamos
a crear uno que nos permita elegir un
determinado departamento siguiendo
estos pasos:
Análisis de datos empleando estadística descriptiva 13

• Damos clic en el ícono que se muestra en la figura 4a.


• Al dar clic aparece en el ambiente de trabajo una especie de tabla como la
que se muestra en la Figura 4.b.
• Luego vamos a la parte derecha, en la sección de campos y tomamos la
columna Departamento de la tabla Departamentos y la arrastramos al
campo donde dice valores en la sección de visualización como se muestra
en la Figura 4c.
• Observemos que en el objeto gráfico que había aparecido anteriormente se
encuentran los nombres de los Departamentos (figura 4d).
• Si damos clic en la parte superior derecha del filtro creado, aparece la
opción de presentar la información como lista o como un menú desplegable
(figura 4e).
• Ahora, podemos cambiar el formato dando clic en el ícono de brocha que
aparece en la sección de visualizaciones (figura 4f).
Figura 4
Creación de filtros
Análisis de datos empleando estadística descriptiva 14

Lo anterior podemos hacerlo para las columnas de calendario, naturaleza y


jornada.

3.2. Tablas
Además de los filtros, podemos crear algunas tablas que nos brinden
información detallada de lo que sucede en cada colegio. A continuación, vamos
a crear una tabla con los puntajes de cada colegio en cada una de las pruebas,
para conseguirlo vamos a hacer lo siguiente:
• Seleccionamos el ícono tabla en la sección de visualización tal como se
muestra en la figura 5a.
• En el entorno de trabajo, aparece un gráfico en forma de tabla figura 5b.
• Luego, vamos a la sección Campos y de la tabla Información
Instituciones arrastramos la columna NOMBREINSTITUCIÓN
al campo valores de Visualización. Esto mismo hacemos con las
columnas PROMLECTURACRITICA, PROMMATEMATICAS,
PROMSOCIALESYCIUDADANAS, PROMCIENCIASNATURALES Y
PROMINGLÉS de la tabla Puntajes. Tal como se muestra en la figura 5c.
Figura 5
Creación de tablas
Análisis de datos empleando estadística descriptiva 15

• Después, al tener cada variable en el campo valores podemos determinar


qué medida estadística queremos mostrar de dicha variable, por ejemplo,
podríamos visualizar: un promedio, una suma, el mínimo, entre otros.
Para ello, hacemos clic sobre la esquina derecha de cada columna y ahí se
despliegan dichas opciones. Dado que cada colegio solo aparece una vez,
como medida podríamos seleccionar el valor máximo que toma cada colegio,
ya que con cualquiera obtendríamos el mismo valor (figura 5d).
• Al igual que en el caso anterior, podemos dar formato a la tabla para
mejorar su presentación. figura 5e. Si se quieren cambiar los nombres de las
columnas, se hace doble clic sobre el nombre de la columna en valores.

3.3. Diagramas de Barras o Tortas


Los gráficos más usados son los diagramas de barras o las tortas. En esta
sección, vamos a explicar cómo graficar el primer tipo de gráfico, ya que el
segundo se realiza de forma similar. Por ejemplo, representemos la cantidad de
colegios por naturaleza Oficial y No oficial que presentaron la prueba en cada
departamento.
• Seleccionamos el ícono mostrado en la figura 6a.
• En el entorno de trabajo, aparece la gráfica de la figura 6b.
Figura 6
Creación diagrama de barras
Análisis de datos empleando estadística descriptiva 16

• En los campos que aparecen en visualizaciones, ponemos en:


• Eje: la columna Departamentos de la tabla Departamentos.
• Valores: la columna COD_INSTITUCIÓN por defecto aparece recuento,
es decir, el total de colegios que es la medida que no interesa, pero
podría seleccionarse cualquier otra.
• Leyenda: la columna NATURALEZA de la tabla Naturaleza.
• Como se observa en la figura 6c.
• Finalmente, damos formato en la brocha de visualizaciones como se ha
hecho anteriormente, figura 6d.
• De manera similar se realiza el gráfico de torta de la figura 6e.

3.4. Tarjetas
Las tarjetas son objetos gráficos que presentan información puntual, por
ejemplo, la cantidad de colegios, el promedio obtenido en una prueba, entre
otras. Estas son utilizadas más que todo para mostrar medidas específicas como
las que hemos creado anteriormente. Expondremos la creación de una tarjeta
que determine el número de colegios.
• Seleccionamos el ícono tarjeta de la figura 7a.
• Aparece una gráfica como la de Figura 7b.
• Luego en Campo podemos colocar la medida Num_Colegios de la tabla
Puntajes que habíamos creado anteriormente (figura 7c).
• Finalmente, damos formato como hemos hecho con los anteriores objetos
obteniendo la tarjeta de la Figura 7.e.
Análisis de datos empleando estadística descriptiva 17

Figura 7
Creación de tarjeta

Al combinar todos los anteriores elementos podemos obtener un tablero como


el de la figura 8.
Figura 8
Tablero Final Power BI
Análisis de datos empleando estadística descriptiva 18

Unidad 4. Consultas y Visualización


El tablero anterior permite conocer información a nivel de Departamento,
Naturaleza, Calendario y Jornada, veamos algunos ejemplos:

4.1. Manipulación de Filtros


Para ejemplificar cómo podríamos utilizar los filtros, en Departamentos
seleccionemos Bogotá y en Jornada Mañana y observemos cómo toda la
información que existe en el tablero se transforma, mostrando los resultados
únicamente para los colegios de la jornada Mañana de la ciudad de Bogotá.
figura 9.
En la figura 9, vemos que la cantidad de colegios que presentaron la prueba de
jornada diurna fueron 341, y de estos 260 eran de naturaleza No Oficial y el
resto, 60, de naturaleza Oficial. Además, la nota promedio en Matemáticas fue
de 51.78, que al compararla con la nacional fue mayor.
Figura 9
Información de los colegios de la jornada mañana de Bogotá
Análisis de datos empleando estadística descriptiva 19

4.2. Consultas en Lenguaje Natural


Power BI tiene una característica adicional que permite realizar preguntas en
lenguaje natural haciendo clic en el ícono que se señala en la figura 10a. Al
hacerlo, se crea un campo como el que se muestra en la figura 10b. en el que
puede realizarse una pregunta utilizando un lenguaje cotidiano, por ejemplo,
es posible que al querer preguntar ¿cuál es el puntaje promedio en lectura
crítica? Power BI empieza a buscar aproximaciones a la respuesta como las que
aparecen en la figura 10c.
Figura 10
Ejemplo consultas lenguaje natural

*Nota: las figuras relacionadas en la cartilla fueron creadas por el autor a


partir de Power BI.
Análisis de datos empleando estadística descriptiva 20

¡Importante!

Recuerda que tendrás un encuentro sincrónico, el cual será programado


por la Universidad del Rosario, para ello serás notificado previamente.
Por último, no olvides que para terminar este módulo debes resolver el
quiz.

9 Referencias
• Aprende Excel https://www.youtube.com/watch?v=zRarRrT8dIY. 12 de
octubre de 2020
• Descarga de aplicaciones de Power BI: https://powerbi.microsoft.com/es-es/
downloads/. 12 de octubre de 2020
• ICFES. ww.icfes.gov.co
• Planilheiros https://www.youtube.com/watch?v=RfH9Z1v3euE. 12 de
octubre de 2020
• Referencia de expresiones de análisis de datos (DAX). https://docs.microsoft.
com/es-es/dax/. 12 de octubre de 2020
• Tipos de visualización en Power BI. https://docs.microsoft.com/es-es/
power-bi/visuals/power-bi-visualization-types-for-reports-and-q-and-a. 12
de octubre de 2020
• Pythagoras Data Science https://www.youtube.com/watch?v=DWnPP_
FjQCw&t=520s. 12 de octubre de 2020
Análisis de datos empleando estadística descriptiva 21

También podría gustarte