Está en la página 1de 37

Power BI: Herramientas

básicas para el análisis de


datos
Módulo II
Módulo 2: Utilizar las herramientas de Power BI para la transformación de
datos.

1. Uso de Power Query para la transformación de datos:


a) Integración de Datos
● Unir 2 o más consultas:

Existen dos formas para unir dos o más tablas en Power BI, y al decir unir, se refiere a juntar
dos tablas para tener una sola tabla después de este proceso:

Combinar Consultas
Merge Queries

Anexar Consultas
Append Queries

● Combinar Consultas – Merge Queries

Combinar consultas con Power Query, se utiliza cuando la información de la segunda tabla es
adicional o complementa las filas de la primera tabla.

Para esto debe existir un Id o identificador de fila que permita hacer match en ambas tablas,
y entonces al momento de unirlas queda una fila más larga, se está combinando la fila.

*** Tips= M de Merge lo puedes asociar a Mezclar filas.

TELEDUC 2
Caso práctico:
Tomaremos 3 tablas de la Base de datos Neptuno llevadas a archivos independientes de
Excel. Los archivos están en una carpeta llamada: “Archivos para combinar”.

Estos archivos se llaman: Productos, Pedidos y Detalle de Pedidos.

Detalle de Pedidos se conectará con Productos a través del Id de Producto (para obtener la
información como Nombre producto, Proveedor, Categoría…) y con Pedidos a través de un Id.
de Pedido (para obtener información del Pedido como: Nombre Cliente, Empleado, Forma
Envío…)

Detalle de Pedidos:

Pedidos:

Productos:

TELEDUC 3
Las tablas deben estar relacionadas para poder combinarlas adecuadamente:

Un producto de la tabla Productos puede estar una o muchas veces en la tabla Detalle de
pedidos (relación uno a muchos). Por otra parte, un Pedido de la tabla Pedidos puede tener
uno o muchos productos en la tabla Detalle de pedidos (relación uno a muchos).

Para combinar las consultas debe:

✔ Seleccionar desde la izquierda la Tabla Detalle Pedidos


✔ En el editor Power Query seleccionar Inicio – Combinar – Combinar consultas para crear
una nueva.

TELEDUC 4
✔ En el cuadro Combinar, en el que se visualizará arriba la tabla Detalle de Pedidos.
Entonces, abajo seleccionaremos la tabla con la cual haremos la combinación, que en este
caso será Productos.
✔ Y luego seleccionaremos el campo que las relaciona que, en este caso, en ambas tablas
tienen el mismo nombre: Id. de producto

Obs: Si en las dos tablas no existe un campo en común, será imposible hacer la
combinación de consultas. Recuerde que lo mismo ocurriría en Excel si utilizáramos la
función Buscar V y no tuviéramos un campo en común para relacionar las tablas.

Power Query alerta con un mensaje de coincidencia de datos, es decir verifica que todos
los datos del campo Id. de producto de la tabla Detalle de Productos se encuentren dentro
del campo Id. de producto de la tabla Productos. No puede haber inconsistencia de los
datos.

TELEDUC 5
✔ Al dar Aceptar, en el editor de consultas se ha creado una nueva consulta llamada
Combinar 1 y se ha agregado al final una columna nueva con el nombre de la tabla con la
que hicimos la combinación: Productos, que posee unas flechas de expansión.

✔ Al hacer clic en cualquiera de las celdas de la columna Productos, aparecerán abajo los
datos del producto asociado a ese pedido sacado de la tabla Productos, según el Id. de
Producto.

Solo queda expandir la columna Productos, para agregar los campos en la consulta Detalle de
pedidos.

Se deben activar los campos de Productos que se requiere que aparezcan en Detalle de
pedidos. En este caso, activaremos Nombre de producto, Proveedor y Categoría.

TELEDUC 6
El campo Id. de producto, no es necesario, porque ya existe en la consulta Detalle de pedidos.
Luego desactivamos “Usar el nombre de columna original como prefijo” y Aceptar.

Aparecerán 3 columnas con los nuevos datos y cambiamos nombre a la consulta por
“Consulta Combinada”.

✔ Para traer a esta Consulta Combinada los datos de la tabla Pedidos, sin salir del editor
Power Query, ahora combinaremos esta nueva consulta con los campos de la Tabla
Pedidos.

TELEDUC 7
✔ Ir a Inicio – botón Combinar – opción Combinar Consultas – Combinar consultas.

✔ En este caso, no crearemos una consulta nueva, sino que


haremos la combinación en la misma “Consulta Combinada”.

✔ Se mostrará el cuadro Combinar, donde aparecerá arriba la


“Consulta Combinada” y abajo, elegiremos la tabla Pedidos y
seleccionaremos el título Id. de pedido, como clave de
combinación en ambas tablas.
✔ En esta consulta resultante no puede haber un Id. de pedido que no exista primero en la
tabla Pedidos, lo que asegura la consistencia de los datos.

TELEDUC 8
✔ Al Aceptar, estaremos nuevamente en el editor, donde habrá que expandir la doble flecha
de la columna nueva que tendrá el nombre de la tabla con la cual hicimos la combinación:
Pedidos.

✔ En este caso, activaremos los campos: Cliente, Empleado, Fecha pedido y País de
destinatario.
✔ Al Aceptar aparecerán los campos nuevos:

✔ Finalmente, Cerrar y aplicar.

TELEDUC 9
Aparecerá la “Consulta Combinada” en Power BI Desktop con todos los campos anexados.

En Power BI Desktop las consultas que contienen las tablas originales se pueden ocultar con
clic derecho del mouse, dejando activa solamente la consulta llamada Consulta Combinada.
En la Vista Tabla, las consultas ocultas se muestran atenuadas.

Obs:
✔ Cada vez que los archivos de origen cambien, los datos se deberán Actualizar. Clic
derecho sobre el nombre de la consulta (Consulta Combinada) y Actualizar. De esta
forma, los datos se cargarán de nuevo.
✔ Aunque se agregaron 3 columnas de la consulta Productos y 4 columnas de la consulta
Pedidos, no significa que se relacionaron siete campos. Éste es sólo el resultado, ya que
la relación la hizo solo con dos campos: Id. de producto de la consulta Productos y Id. de
pedido de la consulta Pedidos.
✔ Los campos en común que se relacionan deben estar en el mismo formato, es decir, en
este caso Id. de productos y Id. de pedido deben ser números enteros.

Anexar Consultas – Append Queries

Anexar consultas con Power Query, se utiliza cuando la información de la segunda tabla tiene
las mismas columnas que la primera tabla, y contiene filas adicionales que no tiene la primera.

Por medio del nombre de las columnas se unen las dos tablas una debajo de la otra.

*** Tips= A de Anexar lo puedes asociar a Agregar filas abajo.

TELEDUC 10
Anexar varias hojas similares de un mismo libro Excel y unirlas en una sola Tabla

El editor de Power Query permite unir en una sola tabla un libro de Excel con varias hojas que
contienen información similar y con la misma estructura.

Por ejemplo, si necesitamos unir los Clientes de una empresa, que están separados por Áreas
en distintas hojas de un mismo archivo (3 hojas), es posible utilizar el editor Power Query.

Nuestro archivo de ejemplo se llama “Clientes con hojas similares a unir” y el primer paso a
seguir será Conectarse a un Libro de Excel.

1. Estando en Power BI Desktop, desde la pestaña Inicio, grupo Datos, botón Obtener Datos,
seleccionar Excel o ir directamente al botón Excel.

2. Buscar el libro y abrirlo. En el ejemplo, el archivo se llama “Clientes con hojas similares a
unir”.

3. En la ventana Navegador, seleccionar la hoja o las hojas de cálculo que se quieren


importar desde el panel de la izquierda.

En el ejemplo, son 3 hojas llamadas: Área 1, Área 2 y Área 3.

4. Seleccionar Transformar datos

TELEDUC 11
Obs: Revisar que cada una de las hojas importadas, tenga los encabezados, de lo
contrario, activar el botón “Usar la primera fila como encabezado”.

5. Estando en el editor Power Query, seleccionar la primera Hoja de la unión (en este caso
Área 1).

6. Desde la pestaña Inicio – botón Combinar – opción Anexar consultas.

TELEDUC 12
✔ Anexar consultas: las tablas se anexarán a continuación de la tabla seleccionada.

✔ Anexar consultas para crear una nueva: creará una nueva tabla con todas las tablas
anexadas, sin anexarla a la primera.

7. Aparecerá una ventana en la que podrá determinar si va a unir “Dos tablas” o “Tres o más
tablas”. En este caso, son 3 tablas.

✔ Seleccionar las tablas de a una o marcarlas con la tecla Control presionada (sin incluir
Área 1, porque ya está considerada).

Finalmente, Agregar y Aceptar

TELEDUC 13
8. Al Aceptar, la consulta en principio se llamará Anexar 1, que contendrá las tres tablas
anexadas. El nombre se puede cambiar en el panel de la derecha directamente
(Configuración de la consulta). En este caso, la llamaremos Tabla anexada.

9. Si fuera necesario, se debe asignar el tipo de dato adecuado a cada columna, si es que el
editor Power Query no lo aplicó correctamente.

10. Finalmente, Cerrar y aplicar.

En el panel Campos se mostrarán las 3 tablas originales, más la Tabla anexada creada.

TELEDUC 14
2. Reordenación avanzada de datos con Power Query

a) Transponer Tablas

Si bien, es posible transponer datos en Excel, la ventaja de realizarlo con Power Query de
Power BI Desktop, es que la consulta quedará guardada, para poder actualizarla cada vez que
se modifique y cargue el archivo.

Transponer un archivo consiste en mover los campos que están en columnas a filas y
viceversa.

En el siguiente ejemplo, tomaremos un libro de Excel de Proveedores, donde los títulos de las
columnas o campos se encuentran en la columna izquierda, lo que es poco común, ya que
deberían estar en la primera fila.

Podemos ver que la información se visualiza en forma horizontal, no vertical que es lo más
común.

Este archivo posee 11 campos (Id. De proveedor, Nombre de Compañía, Nombre del contacto,
etcétera) y 29 proveedores (hacia la derecha).

Para transponer este libro, lo abriremos desde Power BI Desktop y luego haremos la
transformación con el editor de Power Query.

El archivo de ejemplo se llama: Proveedores para transponer

1. Desde la pestaña Inicio – Grupo Datos – Excel.

2. Abrir el archivo llamado “Proveedores para transponer”.

3. Seleccionar la única hoja que tiene y hacer clic en Transformar datos.

TELEDUC 15
Power Query no reconocerá los encabezados de columnas (Column1, Column2…etcétera).

4. Para transponer los datos, solo bastará con ir a la pestaña Transformar – Transponer.

Power Query no reconocerá los títulos como encabezados de


columnas, como se aprecia en la siguiente imagen.

Y se agregará a los pasos aplicados en la Configuración de la


consulta el ítem.

TELEDUC 16
5. Para que los datos de la primera fila pasen a ser los títulos de cada columna, se debe
Transformar – Usar la primera fila como encabezado.

b) Anulación de Dinamización de columnas (Unpivot)

Cuando creamos una base de datos, se debe tener muy claro que la información se debe
guardar en formato tabular.

Por ejemplo, si queremos guardar las Ventas por Empleado, Sexo, Categoría y País, la base de
datos debería tener solo 6 columnas:

Id.Empleado - Empleado - Sexo - Categoría - País - Ventas.

Los usuarios deben tener claro que la información debe ser almacenada
para ser procesada, no para ser presentada. Y muchas veces, optan por la segunda opción y
en vez de tener 6 columnas, tienen N columnas, información que es difícil de manipular.

En el siguiente ejemplo (Ventas-Pivot), los datos se visualizan de una forma fácil de entender,
sin embargo, la información está almacenada de forma incorrecta, porque es difícil de
manipular.

A esto se le llama tabla pivoteada (pivot), es decir, es una tabla con la típica estructura de
tabla dinámica, con datos en fila, columna y valor.

TELEDUC 17
Esta tabla posee 9 empleados en fila y 21 países en columnas, calculando las ventas por ítem.

Lo ideal sería que esta misma información no estuviera en una tabla pivoteada, donde los
campos de países no deberían estar en diversas columnas, sino en forma de base de datos
(hacia abajo).

Para llevar esta tabla pivoteada a una base de datos tabulada con solo 6 columnas, se debería
repetir el empleado tantas veces como países hay, o sea, 21 veces hacia abajo por cada
Empleado.

La estructura de base de datos tabular debería estar como en el ejemplo siguiente.

TELEDUC 18
Cuando los datos están en formato tabular, la creación de una tabla dinámica es mucho más
simple y además, con esta estructura, se podrá relacionar con otras tablas fácilmente.

Para comprobarlo, abrimos el archivo Ventas-2 (que está en formato tabular) y crearemos en
Excel la Tabla dinámica siguiente:

✔ Nos paramos dentro de la tabla.


✔ Vamos a la pestaña Insertar – Tabla dinámica – Aceptar.
✔ Llevamos el campo Id.Empleado, Empleado y sexo a Filas, el campo País a Columnas
y Ventas a Valores. Con solo 4 movimientos, tenemos los datos listos para análisis,
gráficos y presentación.
✔ Damos Diseño Tabular
✔ No mostramos los Subtotales
✔ Damos formato con separador de miles a los valores

Conclusión: es mucho más fácil trabajar con datos no pivotados, en formato tabular, ya que
la información queda más fácil de manipular y, además se podrá relacionar esta tabla con
otras tablas sin problemas.

El editor de Power Query permitirá transformar tablas pivoteadas (de distintos orígenes) a
formato tabular (no pivoteados).

Para ello, abriremos en Power BI Desktop el archivo Ventas_Pivot (que tiene columnas
pivoteadas) y entraremos al editor de Power Query con Transformar datos, con el fin de anular
las columnas pivoteadas.

TELEDUC 19
✔ Estando en Power BI, desde la pestaña Inicio, desde la sección Datos, seleccionar el
botón Excel.
✔ Seleccionar el nombre del archivo (Ventas_Pivot)
✔ Activar Hoja1
✔ Seleccionar Transformar Datos, para entrar al editor Power Query

En Power Query, aparecerá lo siguiente:

Pasos a seguir:

✔ En este caso, Power Query asignó los títulos de la primera fila como Encabezados
de columna automáticamente.
✔ En caso, que no lo hiciera, habría que activar el botón “Usar la primera fila como
encabezado”.
✔ Eliminar la columna Total general (última columna), con el botón derecho sobre la
columna – Quitar (o seleccionar columna y tecla Supr).
✔ En la columna Id.Empleado, desactivar el “Total general” a través del filtro.

TELEDUC 20
✔ A continuación, para anular las columnas pivoteadas hay dos opciones:

● Anular dinamización de columnas: se deben seleccionar previamente las


columnas pivoteadas a anular. En este caso, serían las columnas de los
países desde Alemania hasta Venezuela.

● Anulación de dinamización de otras columnas: se debe seleccionar


previamente la columna que no está pivoteada. En este caso, las columnas
Id.Empleado, Empleado, Sexo y Categoría.

Si optamos por la segunda opción, porque sale más rápido, habría que seleccionar las
columnas Id.Empleado, Empleado, Sexo y Categoría (que no están pivoteadas) y las
alternativas son:

✔ Ir a la pestaña Transformar – Anular dinamización de columnas - Anulación de


dinamización de otras columnas

TELEDUC 21
✔ La segunda alternativa es dar clic con el botón derecho del mouse sobre las
columnas seleccionadas y elegir la opción: Anulación de dinamización de otras
columnas

Y el resultado será:

✔ Cambiaremos el nombre de la columna Atributo por País y el Valor por Ventas.


✔ Para que las Ventas tengan separador de miles optaremos, por el Tipo Número
Decimal fijo.

✔ Pestaña Inicio - Cerrar y aplicar.

En la vista Tabla de Power BI, se verá:

TELEDUC 22
<

c) Agrupar datos - Group By

Esta herramienta permite agrupar filas de acuerdo a un ítem y obtener totales por este grupo,
por ejemplo: sumar, promediar, contar, etcétera.

d) Agrupar por una o más columnas

Partiremos con una agrupación básica, que incluirá una sola columna y un solo cálculo. En
este caso, sumaremos los Cargos $ por Empleado.

Una vez abierto el archivo Pedidos desde Power BI Desktop, activar Hoja1 y luego Transformar
datos, para entrar al editor Power Query.

En el editor, seleccionaremos desde la pestaña Transformar, la opción Agrupar por

Aparecerá el siguiente cuadro de diálogo, donde deberemos indicar: la columna por la cual
quiere agrupar y el cálculo a aplicar a un ítem determinado.

TELEDUC 23
En el ejemplo, generaremos un informe Sumando los Valores por Empleado.

Al Aceptar, el resultado será:

TELEDUC 24
A continuación, haremos una agrupación Avanzada, para lo cual hay que activar Uso
Avanzado. Esta opción permitirá agrupar por más de un ítem. En cuanto a las funciones, será
posible hacer más de un cálculo.

Para el ejercicio, calcularemos por Empleado, la Suma, Promedio, Máximo, Mínimo y Recuento
de filas de los Empleados en base al Valor.

Y el resultado será:

3. Mantener los datos actualizados en Power BI Desktop

TELEDUC 25
Es fundamental actualizar los datos frecuentemente para entregar resultados precisos.

Cada vez que actualiza los datos, Power BI debe consultar las fuentes de datos subyacentes,
posiblemente cargar los datos de origen en un conjunto de datos y luego actualizar cualquier
visualización en sus informes o paneles que dependan del conjunto de datos actualizado.

Obs: Las diferentes formas de actualización dependen de los modos de almacenamiento y


tipos de conjuntos de datos que admite Power BI (Modo de Importación, Modo Direct Query,
Modo Live Connect). Este Manual se basa principalmente en el “Modo Importación”.

a) Actualizar en Modo Importación

Power BI importa la información de las fuentes de datos originales al conjunto de datos. El


informe de Power BI y las consultas del panel enviadas al conjunto de datos devuelve
resultados de las tablas y columnas importadas. Puede considerar dicho conjunto de datos
como una copia en un punto en el tiempo. Debido a que Power BI copia los datos, debe
actualizar el conjunto de datos para recuperar los cambios de las fuentes de datos
subyacentes.

Solo los conjuntos de datos del modo Importar requieren una actualización de los datos de
origen, debido a que este tipo de conjunto de datos importa datos de sus fuentes de datos, y
los datos importados pueden actualizarse de manera regular o ad-hoc.

Una vez conectados a una o más fuentes externas, los datos importados se deben mantener
actualizados de acuerdo a los datos más recientes del libro o carpeta.

Las alternativas son:

1. Estando en ambiente de Power BI Desktop, ir a la pestaña Inicio - Actualizar.

2. Con el botón derecho del mouse sobre el nombre de la tabla o consulta creada en la
sección Campos (panel de la sección derecha) y seleccionar Actualizar datos.

TELEDUC 26
3. Si se está dentro del editor de Power Query, seleccionar Actualizar vista previa –
Actualizar todo (para actualizar todas las consultas).

b) Posible problema al actualizar los datos.

Cuando se ha perdido el enlace con el origen, ya sea porque el archivo de origen a procesar se
ha borrado o porque ha cambiado de nombre o de carpeta y se Actualizan los datos, aparecerá
un mensaje de error y no se podrá Actualizar.

Si se actualiza en ambiente Power BI Desktop el mensaje será:

TELEDUC 27
Si se actualiza en ambiente del editor de Power Query el mensaje será:

Solución:

Estando el editor de Power Query, dar clic en el botón Configuración de Origen de Datos o
Editar configuración, para revisar y corregir los datos de conexión.

Se abrirá la siguiente ventana, donde se deberá Cambiar Origen.

TELEDUC 28
Posteriormente, debe volver a actualizar.

4. Columnas Condicionales

Power Query permite crear columnas nuevas de acuerdo con una o más condiciones.

a) Crear una columna condicional.


✔ Ir a la pestaña Agregar Columna – Columna condicional.

✔ Llenar las opciones de acuerdo con la necesidad y Aceptar.

Ejemplo 1:

Crear una columna condicional de acuerdo a la categoría del Trabajador, que puede ser A, B
o E. La columna se llamará Tipo Trabajador.

✔ Si la Categoría es A, indicar Supervisor


✔ Si la Categoría es B, indicar Obrero
✔ Si la Categoría es E, indicar Ejecutivo

TELEDUC 29
Ejemplo 2:

En el siguiente ejemplo calcularemos el Anticipo, dependiendo de la Categoría:

✓ Si Categoría es A calcular el 20% del Sueldo


✓ Si Categoría es B, calcular el 30% del Sueldo
✓ Sino 0

TELEDUC 30
El asistente no acepta poner 20%, por lo que deberá ser reemplazado por 0.2 o por 20/100.

Cuando se realiza un cálculo debes ingresar el valor con el signo = para evitar que el programa
crea que es “texto” el elemento de salida a calcular.

TELEDUC 31
Además, hay que recordar que los decimales, en este ambiente, se escriben con punto.

TELEDUC 32
5. Columnas Personalizadas

Las columnas personalizadas permiten crear fórmulas a través de funciones y en el caso de


la función Si (IF) permite aplicar cálculos.

a) Crear una columna personalizada


● Ir a la pestaña Agregar Columna – Columna personalizada.

● Escribiremos un código en lenguaje M, para la función If (Si), Else (Sino) y Aceptar.

Ejemplo 1:

Crear una Columna personalizada llamada Ayuda por Hijo

Si el Sueldo es menor a 1000000 (1 millón), le corresponderá Nro Hijos por 50000 (50 mil),
Sino 0.

El resultado será:

Obs: los números se escriben sin punto


separador de miles. Y si hubiera decimales, se
usa el punto.

TELEDUC 33
Ejemplo 2: Crearemos una Columna personalizada llamada Bono Producción.

✔ Si la Gerencia es Gcia Minas, el Bono será Sueldo * 30%.

✔ Si la Gerencia es Gcia Fundición, el Bono será Sueldo * 25%.

✔ Si la Gerencia es Gcia Plantas el Bono será Sueldo * 20%.

✔ Si la Gerencia es Gcia Servicios el Bono será Sueldo * 10%.

✔ De lo contrario será 0.

Para este ejemplo, tenemos Si anidados (If), es decir, varias funciones Si.

El resultado será:

TELEDUC 34
b) Crear un Parámetro y aplicarlo a un cálculo con Columna Personalizada

Los parámetros se crean para guardar valores que pueden ser usados en distintas consultas
o tablas y que son de fácil actualización.

Crearemos el parámetro dólar y luego lo ocuparemos para calcular el Monto Pedido, que se
encuentra en pesos a dólares.

c) Crear Parámetros:
✔ Ir a Inicio – Administrar parámetros – Parámetro Nuevo.

✓ En este caso, crearemos el parámetro llamado Dólar y le asignaremos el valor de 724,5.

✔ El parámetro se mostrará en el panel de la izquierda, donde están las consultas.

TELEDUC 35
✔ Desde ahí se podrá modificar al seleccionarlo. También se puede modificar su valor
con Inicio – Administrar parámetros – Editar parámetros.

d) Utilizar el Parámetro en un cálculo:


✔ Crearemos una columna personalizada con el valor del Sueldo en dólares.
✔ Para esto, ir a la pestaña Agregar Columna – Columna personalizada.

TELEDUC 36
✔ Con el botón derecho del mouse o Inicio – Tipo de dato, lo dejaremos como Decimal fijo
(quedará con dos decimales y con separador de miles).

TELEDUC 37

También podría gustarte