Está en la página 1de 27

Power BI

Obtener y
Transformar los Datos
Por: Carlos Piscoya Tenorio
[MINSA]
Agenda de Hoy
• Motivación
• Introducción • Transformar los datos
• Obtener los datos • El Query Editor
• Orígenes o fuentes de datos • Interfaz y menús Query Editor
• Caso Práctico 01 : • Algunas transformaciones
Casos Positivo Covid 19 • Caso Práctico 02:
Campeonatos Copa Mundial de Fútbol [FIFA]
Motivación
¿Cuántos datos se generan?
Introducción
• En realidad el volumen de datos que pueden llegar a manejar las
organizaciones es cada día más ingente y para sacar beneficio a ese caudal
de información, que ayuda a tomar las mejores decisiones o conocer más al
cliente, lo primero que conviene comprender es cuáles son las categorías de
datos a los que se
enfrenta y las fuentes
de origen de los
mismos, lo que le
ayudará a dirigirse a lo
que verdaderamente
necesita.

• Con Power BI Desktop puede


conectarse fácilmente con el
mundo de los datos en
continua
expansión.

Obtener los datos


• Es la función con la que empezamos cada
proyecto debido a que con ella integramos
los datos que serán necesarios en nuestro
reporte. Esta función no sólo se utiliza al
inicio de cada proyecto, sino cada vez que
sea requerido integrar más fuentes de datos
• Una vez obtenidos los datos (conectados)
en
Power BI, todas las fuentes o rutas a éstos
quedarán almacenadas en el reporte, lo cual
permitirá a Power BI actualizar los nuevos
registros para ser visualizados en el reporte
cuando sea requerido
Origen o fuente de datos
• Una fuente de datos es cualquier ruta o destino que cuente con
registros provenientes de documentos o archivos digitales del
tipo Excel, PDF, Sitios web, bases de datos/Servidores, servicios
en línea, etc
Orígenes de
datos de
archivos
• Libro de Excel
• Texto o CSV
• XML
• JSON
• Carpeta
• PDF
• Parquet
• Carpeta de SharePoint
Orígenes de
datos de base
de datos
Access • Base de datos
• Base de datos SQL • Base de datos SQL Oracle
Server Server Analysis • Base de datos IBM
• Base de datos Services Db2
• Base de datos • Servidor de • Dremio Cloud
Informix de IBM mensajería de SAP (Beta)
(beta) Business
• Exasol
Warehouse
• IBM Netezza • Indexima
• Amazon Redshift •
• Base de datos • InterSystems IRIS
MySQL Impala
(Beta)
• Base de datos • Google BigQuery
• Jethro (beta)
PostgreSQL • Vertica
• Kyligence
• Base de datos • Snowflake
Sybase • Linkar PICK Style /
• Essbase MultiValue
• Base de datos Databases
Teradata • Actian (beta)
• Amazon Athena • (Beta) • MariaDB
• Base de datos SAP
HANA Conector de BI • MarkLogic

• Servidor de • Data Virtuality LDW • • TIBCO(R) Data


aplicaciones de Virtualization
Denodo
SAP Business • Cubos de AtScale
Warehouse • Dremio Software

Orígenes de
datos de Power
Platform
• Conjuntos de datos de
Power BI
• Flujos de datos de Power BI
• Common Data
Service (heredado)
• Dataverse
• Flujos de datos
Orígenes de
datos de Azure
Analytics SQL • • Azure
• Azure SQL Base de datos Database for
Database de Azure PostgreSQL
• Azure Analysis • Azure Blob
Synapse Services
Storage Lake trabajo de
• Azure Table Storage Azure
Storage Gen1 Synapse
• Azure Analytics
• Azure Cosmos
DB HDInsight (beta)
(HDFS) • Azure Time
• Azure Data
• Azure Series
Explorer
HDInsight Insights
(Kusto)
Spark (Beta)
• Azure Data
Lake • HDInsight • Azure Cost
Storage Interactive Management •
Gen2 Query Azure
• Área de Databricks
• Azure Data

Orígenes de
Online Services Dynamics NAV (solo Boards)

• Dynamics 365 Business • Objetos de Salesforce •


Central
• Lista de SharePoint Online • Informes de Salesforce •
• Dynamics 365 Business
Microsoft Exchange Online • Google Analytics
Central (local)
Dynamics 365 (en línea) • • Adobe Analytics
• Azure DevOps (solo
Dynamics 365 (Dataverse) • Boards) • appFigures (Beta)
• Azure DevOps Server • Data.World - Obtener un
conjunto de datos (Beta)
• Asana (beta) • Intune Data Warehouse
• GitHub (Beta) (Beta)
• Assemble Views
• LinkedIn Sales Navigator • Projectplace para Power BI
(Beta) • Automation Anywhere
• Marketo (Beta) • Product Insights (Beta) •
• Automy Data Analytics
• Mixpanel (Beta) (Beta) Quick Base

• Planview Enterprise One - • Dynamics 365 Customer • SoftOne BI (beta)


PRM (Beta) Insights (Beta)
• Spigit (Beta)
• QuickBooks Online (Beta) • • Origen de datos de Emigo
• TeamDesk (Beta)
Smartsheet • Entersoft Business Suite
(Beta) • Webtrends Analytics
• SparkPost (Beta) • eWay-CRM (Beta)

• SweetIQ (Beta) • FactSet Analytics • Witivio (Beta)

• Planview Enterprise One - • Palantir Foundry • Workplace Analytics (Beta) •


CTM (Beta) Creador de Zoho (Beta)
• API inteligente PPM de
• Twilio (Beta) hexágono
• Digital Construction Works
• Zendesk (Beta) • Industrial App Store Insights

Otros orígenes
de datos (beta)
• Hive LLAP
• Web • Solver
• Script de R
• Lista de SharePoint • • Script de Python • Bloomberg Data and
Analytics
Fuente de OData
• ODBC • Cherwell (Beta)
• Active Directory • OLE DB • Cognite Data Fusion •
• Microsoft Exchange • Acterys: Planeamiento y Delta Sharing
• Archivo Hadoop automatización de
(HDFS) modelos (beta) • EQuIS (beta)

• Anaplan Connector v1.0 • FHIR


• Spark
Insights (Beta)
• Google Sheets (beta) • • BQE Core
Information Grid (Beta) • • Siteimprove
• MicroStrategy for
Jamf Pro (Beta) • SumTotal Power BI
• SurveyMonkey (Beta)
• Starburst Enterprise
• Kognitwin
• Microsoft Teams
• MicroStrategy for • Amazon OpenSearch
Personal Analytics
Power BI Service (Beta)
(beta)
• Paxata • Proyecto OpenSearch
• Tenforce (Smart)List •
(beta)
• QubolePresto (Beta) • Usercube (beta) • Vena
• Consulta en blanco
Roamler (Beta) • Vessel Insight
• SIS-CC SDMX (Beta) • Zucchetti HR Infinity
(Beta)
• Shortcuts Business

Caso Práctico 01
• Casos positivos por COVID-19 - [Ministerio de Salud - MINSA]
https://www.datosabiertos.gob.pe/dataset/casos-positivos-por-covid-19-
ministerio-de-salud-minsa
Obtener Datos | Orígenes
Obtener Datos | Vista Previa
Obtener Datos | Query Editor
Transformar los datos
• En ocasiones nuestras fuentes contarán con más elementos que no son
parte de la tabla de datos que deseamos importar, o bien inconsistencias
en los datos que requieren de modificación, y para corregir temas de este
tipo será necesario “Transformar los datos”.
• Debido a que Power BI está conectado a fuentes de datos, al estar
alimentando estas fuentes con nuevos registros, Power BI puede
actualizarse y mostrar estos datos posteriormente en el reporte.
• Nota: El cambiar la estructura de las fuentes de datos puede afectar en el
proceso de obtención. Así mismo, cambiar el nombre de archivo o de
carpeta o cualquier factor que afecta la ruta.
• Tip: Organizar una estructura efectiva: Asignar nombres consistentes y
que no vayan a ser cambiados con el paso del tiempo, tanto en las tablas,
así como nombres de archivos o carpetas, modelo de base de datos, etc.
La intención es prevenir problemas futuros por cambios de este tipo.
Query Editor
• Es una herramienta ETL de usuario final. Es decir, pensada para
poder ser usada solo con formación ofimática aunque requiere
amplia base técnica para explotar todo su potencial.
• Implementa un entorno gráfico de desarrollo del componente ETL
donde las operaciones representadas en los menús se traducen
en pasos de importación de datos o de transformación realizados
sobre los datos, que se agrupan en consultas o tablas. Es
mayormente utilizando para
corrección y limpieza de datos,
no para realizar cálculos/
operaciones.
• Para abrir el Query Editor, clic
en
Transformar Datos desde pestaña
Inicio. Un nuevo apartado aparecerá
en otra ventana de Power BI.
Interfaz del Query Editor 1. En la cinta aparecen muchos botones
activos que permiten
interactuar con los datos de
la consulta.

2. En el panel izquierdo se
muestran las consultas y
están disponibles para su
selección, visualización y
conformación.

3. En el panel central se
muestran los datos de la
consulta seleccionada,
disponibles para darles
forma.

4. Aparece el panel
Configuración de la consulta,
con una lista de las
propiedades de la consulta y
los pasos aplicados.

Descripción de los Menús


• Las operaciones de importación y transformación de datos se
estructuran en los menús Inicio, Transformar y Agregar
columna.
• El menú Inicio contiene las operaciones de importación de
datos, definición y gestión de consultas, y operaciones de
transformación de uso frecuente. Algunas de las operaciones
de transformación de este menú también están incluidas en los
otros
Descripción de los Menús
• El menú Transformar incluye operaciones de transformación
sobre tablas y sobre los distintos tipos de columnas de las
tablas.

• Por último, el menú Agregar columna agrupa las opciones para


añadir columnas de distintos tipos.
Algunas transformaciones mínimo
Tipos de Datos
•Permite especificar el tipo de Cambiar Nombre
dato manejado en una •Permite cambiar el nombre del
Usar primera fila columna. encabezado de una columna
como encabezado
•Permite transformar los datos Anexar Consultas
contenidos en la primera fila de •Permite añadir nuevos datos
la tabla en nombres de las sobre una estructura en común
columnas o viceversa. de tabla
Agrupar por Remplazar Valores
•Permite hacer agrupaciones de •Permite cambiar los datos de
datos, en base a niveles de las celdas por otros valores.
Reducir Filas columnas, utilizando funciones Administrar Columnas
•Permite conservar o quitar filas de resumen como : Conteo,
suma, promedio, máximo y •Permite elegir o quitar
de nuestros datos
columnas de nuestros datos
•Establecer un orden ascendente un criterio de búsqueda.
o descendente a partir de una Agregar Columnas
columna. •Permite agregar columnas
Filtrar nuevas a partir de las columnas
•Reducir los datos por medio de existentes.
Ordenar

Caso Práctico 02
• Caso Campeonatos Copa Mundial de Fútbol.-
[Wikipedia]
https://es.wikipedia.org/wiki/Copa_Mundial_de_F%C3%BAtb

ol

Transformar Datos | Básico


Transformar Datos | Avanzado
Practicar más.
https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv

https://www.sqlshack.com/getting-started-with-query-editor-in-power-bi-desktop/
¿Algun
a
duda?

También podría gustarte