Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 3 - Funtes de Datos
Clase 3 - Funtes de Datos
3.
Power BI
Power BI
Power Pivot y Power View y Preview de junto con
Power Query Power Maps Power Bi Azure (para
para Excel para Excel cloud para aplicaciones
Office 365 propias)
Lanzamiento
La versión gratuita de PBI permite: de Power BI
Desktop
- 1 GB/usuario
- Crear reportes y paneles
- Usar PBI Desktop
- Importar datos sin límites de fuentes
- Consultas en lenguaje natural
- Ver informes en el móvil
- Publicar en la web
Arquitectura del servicio de Power BI
Data Analytics con Power BI
Posibilidades de uso de las herramientas de BI de Microsoft
Power BI • Es gratuito.
(https://powerbi.microsoft.com/en-us/desktop/)
Desktop
Esto es lo que usaremos a lo largo del curso
Trivia Time!
Power BI Desktop (PBID): Iniciando por primera vez
1 Menú principal
2 Menú contextual (cinta de opciones)
3 Selector de vistas
4 Vista principal
5 Elementos de visualización
6 Filtros de visualización
7 Campos de tablas
8 Selector de páginas
PBID: Configuración inicial
1) Ajustar la configuración regional (fecha y separadores)
PBID: Configuración Inicial (2)
2. Habilitar las nuevas opciones que se vayan agregando en modo preview
Reinicio Requerido!
PBI Desktop: configuración inicial (3)
3. Mantener actualizado el software. Todos los meses sale una nueva versión y al abrir PBI nos ofrece
actualizar (opción configurable)
Práctica
Introducción a Power BI
Query Editor
Importación de un archivo Local
Vista de Datos y Vista de Relaciones
Unidad 3
Vista de Relaciones: Muestra el modelo de datos (notar que PBID lo supuso de forma automática)
Relaciones entre
tablas
ANALYTICS
EXTRACCION
Extracción de Datos
Alimentando la inteligencia de la organización
+
Fuentes de Datos ETL Extracción + Transformación (1)
Comprenden los orígenes y repositorios de la Las fuentes de datos deben ser accedidas, cargadas al área
información en bruto. Requiere un dominio técnico de staging para luego atravesar los procesos primarios de
sobre formatos, procesos y sistemas. ajustes de datos (limpieza, corrección, formateo)
Extracción de Datos
No tan rápido…
Fuentes
NO Tradicionales Web Software Web Scraping
Cualquier innovación
ó mejora en términos de
diversidad o calidad en la
oferta de datos disponible Social Data Servicios en la Nube
multiplicará las posibilidades
de la gestión orientada a datos
Extracción
Evaluando las fuentes de datos +
Data Profiling es el
proceso de evaluar
Legibilidad Consistencia
la “calidad” de una Los datos deben describir información La información derivada de los datos debería
fuente de datos de manera completa y decodificable ser coincidente con otras fuentes avaladas
según una serie de
dimensiones:
Integridad Exactitud
Todos los atributos relevantes de la Los datos deben garantizar un nivel
información deberían estar en los datos aceptable de precisión
Presentación Accesibilidad
Los datos deben poder ser identificados La fuente de datos debería poder ser
y accedidos de manera apropiada accedida siempre que se lo requiera
Confiabilidad Actualización
El origen de la fuente debería ser La fuente debe garantizar su actualización
conocido y avalado cuando este sea necesario
Extracción
Procesos de extracción +
La Zona de Staging es el ámbito físico donde la
información es copiada y duplicada desde las
fuentes de origen para su posterior tratamiento.
OLTP Recursos en Red Bases de Datos Servicios en la Nube Las tradicionales como los Sistemas OLTP o los
Recursos en Red suelen ser tratados mediante copias
de los registros fuentes a través de procesos de
tareas programadas (procesos Batch).
20% 80%
Tabla de Tabla de
Tabla de
Cobros Clientes
Ventas (Desde
(desde Google (CSV Local)
Excel local)
Sheets)
Tabla de
Ubicaciones
(Desde
Códigos de
OneDrive) Tabla de
Países
(Wikipedia) Segmentos
(Desde PDF)
Importar datos desde varios orígenes
Usaremos Unidad 4 -> a
Seleccionar “Tabla
Tabla de Ventas (Excel local) Ventas”
Formatear
Pegar link de
Tabla de Cobros Google Drive y Formatear
(Desde Google Sheets) marcar “Hoja 1”
Importar = traer una copia de los datos a PBID. Se debe refrescar cada vez. Límite en 1GB de datos
DirectQuery = conectarse directamente a la fuente. Los datos no se importan ni se copian. Siempre se usan los
datos actuales y permite visualizaciones a mayores volúmenes de información que sería imposible importar
cada vez
Limitaciones:
• Todas las tablas vienen de la misma base de datos
• Algunas funciones no están disponibles
• Queries complejos pueden fallar
• Más datos: http://tiny.cc/EANTDA-DirectQuery
• Fuentes soportadas: http://tiny.cc/EANTDA-DQFuentes
Bonus Track
Cómo compartir un archivo en OneDrive Personal
1. Subir el archivo o bien copiarlo a la 3. Establecer opciones de Edición y luego
carpeta local OneDrive Aceptar
2. Click con botón derecho sobre el
archivo
Bonus Track:
Cómo compartir un archivo en OneDrive Personal
4. Click con botón derecho sobre el 6. Copiar el código del iframe y
archivo y elegir Insertar pegarlo en un bloc de notas
5. Click en
Generar
Bonus Track:
Cómo compartir un archivo en OneDrive Personal
7. Construir el siguiente link genérico con los parámetros que dice el código del iframe, como se muestra abajo
8. Ese es el link que armamos es el que deberemos usar cuando nos conectemos a OneDrive desde PowerBI