Está en la página 1de 18

Curso: Power BI Fundamentals

Sesión 3: Transformaciones de datos avanzadas.


Caso VanArsdel

VanArsdel es una empresa que fabrica y vende artículos deportivos. La compañía tiene oficinas
en los Estados Unidos (EE. UU.) y en varios otros países. Sus ventas comprenden las ventas en
los Estados Unidos y ventas internacionales; y estas provienen de sus productos
manufacturados, así como de los productos de otros fabricantes.

La oficina de VanArsdel en Estados Unidos almacena los datos de ventas en una base de datos
Access [además tiene un respaldo de estas en archivos de texto], mientras que las
transacciones de ventas de VanArsdel International están disponibles como archivos separados
por comas (CSV). Estos archivos CSV tienen la misma estructura de columnas que la tabla de
ventas para EE. UU, la cual proviene de la Base de datos SQL (Access) [o de los archivos de
texto].

Se desea realizar un análisis de los datos de ventas mundiales de VanArsdel entre los años
2000 y 2015, por lo que debe incorporar todos estos datos a Power BI Desktop antes de
poder realizar cualquier análisis. Finalmente, también se desea comparar las ventas de
VanArsdel por país con la población de dicho país; para ello debe importar estos datos desde
un informe Excel a Power BI.

Importación y Transformación de Datos


Inicialmente se importará la información de las ventas que se encuentra en la Base de Datos
Access. En el caso que no pueda leer la información desde el archivo Access instalar los
parches necesarios correspondientes accediendo a la siguiente ruta:

https://www.microsoft.com/en-
us/download/details.aspx?id=13255&wt.mc_id=DXLEX_edx_DAT207x

Adicionalmente si sigue teniendo problemas con la lectura de la Base de Datos Access puede
acceder a los archivos de texto de respaldo.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 1
www.indataperu.org
Curso: Power BI Fundamentals

1- Descargue todos los archivos indicados por el docente del curso.

2- Desde la pestaña inicio, haga clic en Origen de Datos y luego en la opción de Base
de Datos de Access. Después, seleccione el archivo descargado que lleva como
nombre “PowerBI”. Entonces elija los Datasets “bi_date”, “bi_geo”,
“bi_manufacturer”, “bi_product” y “bi_salesFact”. Finalmente, haga clic en
Editar (Transformar datos).

En este momento se abrirá la ventana de Editor Power Query en donde se realizarán todas
las transformaciones necesarias previas a la explotación de información.

3- Ahora cambiará el tipo de dato de la columna “Date” del Dataset “bi_salesFact”,


que actualmente se encuentra como texto, a un tipo de dato Fecha (puede ver que al

lado de la columna “Date” se encuentra el icono , lo cual indica que los valores de
esta columna tienen un tipo de dato texto). Para ello primero seleccione el Dataset

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 2
www.indataperu.org
Curso: Power BI Fundamentals

“bi_salesFact”, luego seleccione la columna “Date”, después desde la pestaña

Transformar elija Tipo de datos > Fecha (Ahora deberá visualizar el ícono al
lado de la columna “Date”, lo cual indica que los valores de la columna tienen el tipo
de dato fecha). Otra forma de cambiar el tipo de dato es seleccionando la columna
“Date” y eligiendo la opción Cambiar tipo > Fecha.

4- Filtrar fechas: filtre todas las filas cuya fecha sea mayor al 31/12/1999. Para esto

despliegue los filtros para la columna “Date” haciendo clic en , seleccione la


opción Filtro de fecha > Posterior a.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 3
www.indataperu.org
Curso: Power BI Fundamentals

5- Le aparecerá una nueva ventana donde deberá ingresar la fecha 31/12/1999 y hacer
clic en Aceptar.

6- Realice los pasos 3,4 y 5 para la columna “Date” del Dataset “bi_date”.

7- Seleccione el Dataset “bi_salesFact” y cambie el tipo de dato de la columna


“Revenue” a tipo de dato Número decimal fijo ($).

8- Renombre todos los Dataset de acuerdo a lo siguiente:


- El Dataset “bi_date” por “Date”.
- El Dataset “bi_geo” por “Locations”.
- El Dataset “bi_manufacturers” por “Manufacturers”.
- El Dataset “bi_product” por “Products”.
- El Dataset “bi_salesFact” por “Sales”.

9- Seleccione la pestaña Inicio y haga clic en la opción Cerrar y Aplicar para regresar
al Power BI Desktop.

10- Explore todas las tablas importadas desde el Power BI Desktop.

En la siguiente imagen podrá visualizar que los valores la columna “Product” están formados
por la concatenación de la columna “Manufacturer” y el código de producto. Por lo tanto, se
desea tener una columna con este Código del producto.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 4
www.indataperu.org
Curso: Power BI Fundamentals

11- Seleccione la vista de Datos y haga clic en Editar consultas. Esta acción abrirá
nuevamente la ventana de Editor de Power Query.

12- Ubicarse en el Dataset “Products” y cree una copia de la columna “Product”, esto
creará una nueva columna de nombre “Product-Copy” la cual se ubicará en el
extremo derecho del conjunto de datos. Para ello haga clic derecho sobre la columna
“Product” y luego hacer clic en Duplicar columna.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 5
www.indataperu.org
Curso: Power BI Fundamentals

13- Seleccione la columna “Product-Copy”, desde la pestaña Transformar elija la


opción Dividir columna (Split Columns) y seleccione Por delimitador.
Seleccione el delimitador de Espacio y elija la opción Delimitador situado más a
la izquierda. Finalmente hacer clic en Aceptar.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 6
www.indataperu.org
Curso: Power BI Fundamentals

Esto dividirá la columna seleccionada en dos nuevas columnas: (1) “Product-Copia.1”; y


(2) “Product-Copia.2”, tal y como se muestra en la siguiente imagen.

14- Remueva la columna redundante “Product-Copy.1” cuyos valores son similares a los
valores de la columna “Manufacturer”. Para esto ubíquese sobre la columna
“Product-Copy.1”, haga clic derecho y seleccione “Quitar”.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 7
www.indataperu.org
Curso: Power BI Fundamentals

15- Cambie la denominación de la columna “Product-Copia.2” por “Product Code”


haciendo doble clic sobre la columna y escribiendo el nuevo nombre.

Hasta este momento se ha trabajado con la información de ventas de los Estados Unidos
ubicada en la base de datos Access [o en los archivos de texto de respaldo]. Ahora se
procederá con la importación de la información de las ventas internacionales que se encuentra
en la carpeta de nombre “International”.

16- Desde la pestaña Inicio, seleccione Nuevo origen, luego elija la opción “Más...” y
haga clic en Carpeta (Folder). Finalmente seleccione Conectar.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 8
www.indataperu.org
Curso: Power BI Fundamentals

17- Haga clic en Examinar, luego diríjase a la ruta donde se encuentra la carpeta
“International” y seleccione Aceptar. Finalmente hacer clic en “Transformar
datos”.

En este momento se agregará el Dataset de nombre “International” el cual contendrá


información de los archivos que se están leyendo desde dicha carpeta.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 9
www.indataperu.org
Curso: Power BI Fundamentals

18- Seleccione la primera columna denominada “Content” y haga clic en la opción


Quitar otras columnas.

19- Seleccione el ícono Combinar Archivo para poder visualizar la información que
se encuentra en estas celdas. Esto abrirá una ventana de diálogo donde puede
configurar cada uno de los archivos que está leyendo desde la carpeta
“International”. Power BI por defecto realiza la configuración de los archivos que se
están leyendo, usted deberá verificar esto. Finalmente haga clic en Aceptar.

Recordemos que leer archivos que tienen una configuración regional distinta a la peruana
obliga a que modifique las opciones de la herramienta Power BI con la misma configuración
regional del archivo. Esto se hace con la finalidad de poder tratar los campos de fecha de
manera correcta, ya que estos fueron creados con una configuración horaria distinta. Por
ejemplo, si un archivo Excel tiene configurado una localidad de Estados Unidos, deberá de
cambiar la configuración regional de Power BI Desktop con esta localidad para poder leer los
campos de fecha sin ningún problema.

Para cambiar la configuración regional de Power BI debe hacer lo siguiente:

20- Desde Power BI Desktop, seleccionar la pestaña Archivo > Opciones y


configuración > Opciones. Ir a la sección Archivo actual y modifique la
Configuración regional para la importación seleccionando Inglés (Estados
Unidos). Esto permitirá leer las fechas correctamente en archivos que tienen una
configuración regional de Estados Unidos tal y como se muestra en la siguiente imagen:

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 10
www.indataperu.org
Curso: Power BI Fundamentals

21- Ubicarse en el Dataset “International” y cambie el tipo de dato de texto del campo
“Date” por el tipo de dato Fecha haciendo clic derecho sobre la columna y
seleccionando Cambiar tipo > Fecha. En caso le aparezca una ventana de diálogo de
confirmación, hacer clic en la opción Sustituir actual.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 11
www.indataperu.org
Curso: Power BI Fundamentals

22- Luego de ello filtre las fechas que sean mayores al 31/12/1999 (Puede retornar a los
pasos 4 y 5 para ver como filtrar los valores de fechas).

23- Cambie la denominación del Dataset “International” por “International Sales”.


Para ello debe de asegurarse que el Dataset “International” se encuentre
seleccionado, luego ir al panel de Configuración de la consulta y en la sección
Propiedades coloque el nuevo nombre del Dataset.

Hasta este momento se tiene la información de las ventas en 2 Datasets distintos: (1) “Sales”,
y (2) “International Sales”. Sin embargo, para efectos del análisis se requiere que toda la
información de ventas se encuentre en un único Dataset, por que debe realizar una unión de
información entre ambos.

24- Seleccione el Dataset “Sales”, desde la pestaña Inicio elegir la opción Combinar >
Anexar Consultas (Append Queries)

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 12
www.indataperu.org
Curso: Power BI Fundamentals

25- Seleccione el Dataset a anexar, en este caso “Internacional Sales” y luego haga clic
en Aceptar.

Puede observar que se ha agregado una columna extra denominada Country que tiene
valores nulos para las ventas en los Estados Unidos.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 13
www.indataperu.org
Curso: Power BI Fundamentals

26- Para poder dar solución a la presencia de estos valores nulos, se realizará una
transformación adicional para poder reemplazar estos valores nulos con el valor
“USA”, para ello puede aplicar cualquiera de los siguientes dos pasos:

a. Desde la pestaña Agregar columna seleccione la opción Columna


condicional para agregar una nueva columna. Aparecerá una nueva ventana
de diálogo en donde deberá colocar el nuevo nombre de columna “Country
Name”. Luego deberá configurar esta nueva columna, tomando como base la
columna “Country”, con la siguiente condición:

Si la columna “Country” es igual a null entonces el valor de la nueva columna


[“Country Name”] será “USA”, caso contrario la nueva columna tendrá el valor
actual de la columna “Country”.

b. Desde la pestaña Agregar columna, seleccione la opción Columna


personalizada (Custom Column). Aparecerá una ventana en donde
deberá ingresar el nombre de la nueva columna “Country Name” y escribir
el siguiente código de programación:

if [Country]= null then "USA" else [Country]

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 14
www.indataperu.org
Curso: Power BI Fundamentals

27- Eliminar la columna “Country” del conjunto de datos haciendo clic derecho y
seleccionando la opción Quitar

Se desea también cruzar la información de ventas de VanArsdel con la población por año de
cada país donde la empresa opera. Esta información de población se encuentra en un
documento Excel no estructurado. Es decir, los datos que se encuentran en este Excel no
se encuentran en filas y columnas como en los ejemplos vistos hasta este momento, por lo que
vamos a realizar una serie de pasos para poder obtenerla.

28- Desde la pestaña Inicio, seleccionar Nuevo origen > Excel y seleccionar el Excel
Country Population by Year.

29- Renombrar el Dataset como “Country Population”.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 15
www.indataperu.org
Curso: Power BI Fundamentals

30- Eliminar las primeras 3 filas. Desde la pestaña Inicio seleccionar Quitar Filas >
Quitar Filas Superiores e ingresar el valor de 3.

31- Seleccionar la opción Usar la primera fila como encabezado para colocar los
valores de la primera fila como los nombres de las columnas.

32- Seleccionar todas las columnas correspondientes a los años desde el 1999 hasta 2014.

33- Desde la pestaña Transformar, seleccione la opción Anular dinamización de

columnas (Unpivot Columns) .

34- Cambiar los nombres de columnas a “Year” y “Population”, según como


corresponda. Además, también ambas columnas deben de tener el tipo de dato
Numero entero.

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 16
www.indataperu.org
Curso: Power BI Fundamentals

35- Filtre los valores de la columna Year de tal forma que solo tenga información de las
poblaciones de países desde el año 2000 en adelante; es decir debe de quitar aquellas
filas que correspondan al año 1999. Para esto haga clic en el ícono de filtro ubicado
al lado del nombre de la columna Year y quite la selección
correspondiente al año 1999.

36- Ahora que ya ha realizado todas las transformaciones ir a la pestaña Inicio y


seleccione la opción Cerrar y Aplicar.

1
1

Esto cargará todas las transformaciones realizadas en el Editor de Power Query al Power BI
Desktop, por lo que en teoría estaría listo para empezar hacer algunas visualizaciones

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 17
www.indataperu.org
Curso: Power BI Fundamentals

37- Una vez que la información en el Power BI Desktop haya sido cargada, guarde su
trabajo con el nombre “Caso VanArsdel” haciendo clic derecho en Archivo >
Guardar como. Deberá tener una pantalla similar a la siguiente:

Docente: Ing. Rolando Moreno. MBA. SMC.


info@indatperu.org - 952437731 18
www.indataperu.org

También podría gustarte