Documentos de Académico
Documentos de Profesional
Documentos de Cultura
By Microsoft
By Oracle
Azure
MODULO 02:
PREPARACIÓN DE DATOS
Módulo 02: Preparación de Datos
1. Introducción a Tidy Data.
2. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, web).
3. Limpiar, transformar y cargar datos.
4. Identificar anomalías.
5. Evaluar la calidad, profile, distribución de columnas.
6. Resolver inconsistencias, null values.
7. Combinar consultas: Merge, append.
8. Resolve data import errors.
9. Parámetros y funciones en Power Query.
M02-01. Introducción a Tidy Data.
¿Qué es Tidy Data?
Estructuras de datos que facilitan el análisis.
Transformar Datos
Consiste en transformar set de datos desordenados
o desorganizados en set de datos ordenados y disponibles para
análisis estadístico.
+51922936632
M02-01. Introducción a Tidy Data.
Cualquier set de datos (entidad /tabla) debe contener 3
elementos: 3 reglas para ordenar datos
1. Variables (Columnas / Atributos): Miden determinados atributos 1. Cada variable forma 1 columna
(altura, peso, frecuencia, 2. Cada observación forma 1 línea
duración, fecha, etc) 3. Cada conjunto de observaciones
2. Observaciones (Registros): Colección de todas las medidas de las forma una tabla
variables referidas
a una única entidad
3. Valores: Intersección de variables y observaciones
Apellido Paterno Apellido Materno Nombres Profesión Area donde Labora Cargo Actual Variables
Ing. Control de
Chamorro Acero Salvatory Edward Ingeniero Civil Oficina técnica
Proyectos
VASQUEZ Honorio Carlos Stiven Ingeniero de Minas Proyectos Jefe de operaciones
+51922936632
M02-01. Introducción a Tidy Data.
Ejercicio: Aplicar Tidy Data al siguiente ejemplo: 3 reglas para ordenar datos
• ¿El set de datos esta ordenado? No, tiene que 1. Cada variable forma 1 columna
2. Cada observación forma 1 línea
cumplir las 3 reglas. 3. Cada conjunto de observaciones
• ¿Cuáles son las variables? WBS, Fecha y forma una tabla
Monto: ver solución de la siguiente página.
+51922936632
M02-01. Introducción a Tidy Data.
Solución:
WBS Fecha Monto
- Las columnas desde la columna de Jun-22 a Set-
WBS1 Jun-22 $ 3,655
22 pertenece a 1 sola variable;por lo tanto, se
debe transformar a una sola columna llamada WBS1 Jul-22 $ 2,016
“Fecha”. WBS1 Ago-22 $ 2,359
- Indicar que las fechas corresponden para los WBS1 Set-22 $ 3,977
valores WBS1 y WBS2.
WBS2 Jun-22 $ 3,914
- Posteriormente copiar las columnas de monto
para cada valor de WBS y Fecha. WBS2 Jul-22 $ 3,184
WBS2 Ago-22 $ 2,732
WBS2 Set-22 $ 2,941
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Excel: Excel es una fuente de datos que contiene formato de archivos tipo plano
Þ Un archivo plano es aquel que solo tiene una tabla de datos y en el que cada fila de datos
está en la misma estructura. El archivo no contiene jerarquías.
Þ El archivo Excel puede estar de manera local (su computadora), onedrive (Microsoft),
sharepoint (Microsoft).
Þ El archivo Excel (Google Sheets) puede estar en Google drive.
https://learn.microsoft.com/es-es/training/modules/get-data/2-data-files
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar a un archivo Excel alojado en su computadora
https://learn.microsoft.com/es-es/training/modules/get-data/2-data-files
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar a un archivo Excel alojado en su computadora
https://learn.microsoft.com/es-es/training/modules/get-data/2-data-files
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Importante: Tener una
Conectar a un archivo Excel: Alojado en OneDrive/SharePoint cuenta de Office
Empresarial .
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Importante: Tener una
Conectar a un archivo Excel: Alojado en OneDrive/SharePoint cuenta de Office
Empresarial .
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Importante: Tener una
Conectar a un archivo Excel: Alojado en OneDrive/SharePoint cuenta de Office
Empresarial .
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar a un archivo Excel: Google drive
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Importante: El conector a
Conectar a un archivo Excel: Google drive
usar es del tipo Web.
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar a un archivo Excel: Google drive
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar Microsoft Form a Power BI
Los formularios deben ser creados desde un sitio de SharePoint (SP); si los
formularios fueron creados directamente desde Microsoft Form deberían de ser
asignados a un sitio de SP.
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar Microsoft Form a Power BI
Cuando se contesta al formulario se generará un archivo Excel con un icono de una nube (este indica que esta sincronizado).
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web). Importante: Office Desktop
tiene que tener la misma
Conectar Microsoft Form a Power BI
sesión de la web.
Cuando se contesta al formulario se generará un archivo Excel con un icono de una nube (este indica que esta sincronizado).
Dar clic al icono de Excel => Edición => Abrir en la aplicación de escritorio.
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar Microsoft Form a Power BI
En el aplicativo de escritorio ir a información y copiar ruta de acceso, aparecerá un dirección como:
https://herluc.sharepoint.com/sites/ModeladodeDatos/Documentos%20compartidos/EjemploForm.xlsx ?web=1
Copiar solo la parte resaltada e ir a Power BI y seleccionar un conector de tipo Web.
Importante:
El paso de copiar ruta de
acceso desde Excel de
escritorio (sincronizado)
sirve para todo archivo
alojado en la nube
(OneDrive, SharePoint).
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar Power BI con el gestor de base de datos de Primavera P6 (ODBC: Open Database Connectivity
Para este tipo de conexión se necesita instalar sqliteodbc; los pasos se detallan en “Manual Instalación de Primavera P6 y Software ODBC”
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar Páginas Web
Para el ejemplo se tomara la pagina:
https://www.google.com/finance/quote/USD-PEN?sa=X&ved=2ahUKEwjXgfX2voL9AhVHLrkGHTHeBRkQmY0JegQIBxAd
+51922936632
M02-02. Obtener datos de diferentes fuentes (Excel, SharePoint, Google
drive, Formularios, Primavera P6, páginas web).
Conectar Páginas Web
Copiar la dirección en tipo de conector Web; luego aparecerá la siguiente ventana para realizar la transformación en Power Query.
+51922936632
M02-03. Limpiar, transformar y cargar datos.
+51922936632
M02-04. Identificar Anomalías (Desde enero-2020)
Power BI detecta puntos anómalos o diferentes con respecto a otros puntos de datos.
Þ Este tipo de análisis se realiza con un grafico de líneas.
Þ El eje “X” debe ser de tipo continuo (1) y el eje de “fecha” debe ser de tipo date (2); (3) detectar anomalías.
+51922936632
M02-04. Identificar Anomalías (Desde enero-2020)
Al hacer clic en una anomalía nos aparecerá la siguiente ventana:
+51922936632
M02-05. Evaluar la calidad, profile, distribución de columnas.
Ingresar a Power Query y habilitar estas 3 opciones.
+51922936632
M02-06. Resolver inconsistencias, null values.
En la data de ingreso ventas observar que en la columna fecha se esta ingresando la fecha y el signo “+”.
Al momento de ingresar a Power Query y cargar datos aparecerá un error porque el tipo de columna es fecha.
+51922936632
M02-06. Resolver inconsistencias, null values.
En la data de ingreso ventas observar que en la columna fecha se esta ingresando la fecha y el signo “+”.
Al momento de ingresar a Power Query y cargar datos aparecerá un error porque el tipo de columna es fecha.
Hacer la limpieza (reemplazar errores por null) y luego quitar el paso de quitar errores.
+51922936632
M02-07. Combinar consultas: Merge, append.
Combinar Consultas: Sirve para unir/fusionar 2 tablas para obtener los
atributos donde:
-Tabla 01: Es la data que contiene un atributo de búsqueda.
- Tabla 02: Es la tabla donde se realizará la búsqueda, tiene que contener
valores únicos.
Anexar Consultas: Sirve para combinar archivos; los datos resultantes son la
suma de los registros de las tablas.
https://learn.microsoft.com/es-es/power-bi/connect-data/desktop-shape-and-combine-data
+51922936632
M02-08. Resolve data import errors.
Cambio de Origen:
Este error ocurre cuando Power BI no encuentra la fuente de datos
+51922936632
M02-08. Resolve data import errors.
Cambio de Origen:
Ingresar a “Data source setting” y direccionar a la ruta donde se encuentre su fuente de datos.
+51922936632
M02-08. Parámetros y funciones en Power Query.
Los parámetros se pueden usar en cualquier paso de consulta. Además de funcionar como filtro de datos, se pueden usar
parámetros para especificar elementos como una ruta de acceso de archivo o un nombre de servidor. Los parámetros no solicitan
la entrada. En su lugar, puede cambiar rápidamente su valor con Power Query.
+51922936632
+51922936632