Está en la página 1de 33

Power BI

Juan Carlos Fernández


jfernandez@pucp.edu.pe
INFOPUC

Sesión 2:
Extracción y Transformación
de la Información
Objetivos de la sesión

1. Comprender el funcionamiento del


módulo de Power Query.
2. Obtener datos de diferentes fuentes:
bases de datos, Excel y archivos de texto.
3. Revisar el proceso de limpieza
(transformación) de los datos.

INFOPUC
Estructura de la sesión

1. Revisar las funcionalidades del editor de


consulta (Power Query).
2. Elaborar la conexión a fuentes de archivos
de texto y Excel.
3. Elaborar la conexión a base de datos SQL
Server.
4. Realizar la limpieza de los datos cargados.
INFOPUC
Beneficios de Usar Power BI
• Soporta más datos que Excel, con archivos más pequeños utilizando
Vertipaq (tecnología de Microsoft que comprime los datos para
colocarlos en memoria).

• Es increíblemente rápido (In Memory BI x Velocity).

• Permite utilizar múltiples tablas y visualizaciones.

• Alta eficiencia a través de opciones avanzadas.

• Tiene una versión gratuita.


INFOPUC
Diferencias de Excel y Power BI

INFOPUC
Diferencias de Excel y Power BI

INFOPUC
Extracción y Transformación de Datos

• Se realiza mediante el editor de consultas (Power Query).

• El editor de consultas permite conectarse y obtener datos de una


variedad de fuentes de manera gráfica e intuitiva.

• Permite la limpieza de datos (y la carga de los datos para que se puedan


relacionar (modelar).

• No es el objetivo de esta herramienta analizar los datos, solo


prepararlos para su posterior análisis.
INFOPUC
Editor de Consultas (Power Query)

INFOPUC
Editor de Consultas (Power Query)

• Buscar y conectar datos en una gran variedad de fuentes de origen.

• Combinar fuentes de origen de datos para que coincidan con los


requisitos de análisis de datos.

• Preparar los datos para analizarlos y modelarlos.

• Realizar procesos de limpieza de datos.

• Crear vistas personalizadas de datos.


INFOPUC
Editor de Consultas (Power Query)

• Tiene un módulo importante de historial de pasos:

✓ Almacena la secuencia de cada paso aplicado a la consulta.

✓ Permite deshacer pasos.

✓ Permite insertar pasos.

INFOPUC
Obtener Datos de Excel

INFOPUC
Obtener Datos de Excel

INFOPUC
Obtener Datos de Texto o CSV

INFOPUC
Obtener Datos de Texto o CSV

INFOPUC
Obtener Datos de Base de Datos

INFOPUC
Obtener Datos de Base de Datos

1. Modo Import:
• Las tablas y columnas seleccionadas se importan a Power BI
• La actualización de datos implica una nueva importación

2. Modo DirectQuery:
• No se importan datos a Power BI
• En cada interacción con un informe se conecta a la base de datos
• Siempre se visualizan datos actuales
INFOPUC
Obtener Datos de la Web

INFOPUC
Obtener Archivos de una Carpeta

• Permite hacer carga


masiva de archivos
• Consideraciones:
✓ Cantidad de
columnas iguales
✓ Formatos
diversos (xls, csv,
txt)
✓ Deben incluirse
en una carpeta
INFOPUC
Obtener Datos de Otras Fuentes

INFOPUC
Dividir Columna

INFOPUC
Formato de Textos

INFOPUC
Extraer Datos

INFOPUC
Ordenar Datos

INFOPUC
Definir Formatos

• Son importantes para las operaciones de tal forma que se tenga el


resultado esperado:

✓ Para cálculos se debe tener números sin espacios ni caracteres.

✓ Para escalas de tiempo se debe tener fechas:


forma de fecha (dd/mm/aaaa)

✓ Para concatenaciones debe tener caracteres.

INFOPUC
Definir Formatos

INFOPUC
Anexar Datos

• Permite unir dos o más tablas.

• No es necesario tener campo en común.

• El sistema añade a la tabla o conjunto final los campos de todas las


tablas seleccionadas.

• Es similar a una operación UNION realizada en una base de datos SQL.

INFOPUC
Anexar Datos

INFOPUC
Columna Condicional

• Permite agregar una columna nueva con un nuevo valor, en base a una
condición de valor de una tabla o consulta existente.

• Se puede aplicar para agrupar valores según otro valor para obtener un
resumen de datos.

• Se utiliza la sentencia (SI ENTONCES... DE LO CONTRARIO...).

INFOPUC
Columna Condicional

INFOPUC
Aplicar los Cambios

INFOPUC
¿Qué aprendimos
hoy?
➔ Identificamos las diferentes
fuentes externas de datos que se
pueden utilizar.
➔ Revisamos las opciones de la
transformación de datos dentro
del módulo de Power Query.

También podría gustarte