Procesos ETL y Tipos de Datos en BI

Este documento describe los conceptos clave del proceso ETL, incluyendo la extracción, transformación y carga de datos de diferentes fuentes. Explica los tipos de datos estructurados, semiestructurados y no estructurados, así como las etapas y objetivos del proceso ETL.

Cargado por

Fabio Pinto

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

51 vistas18 páginas

Procesos ETL y Tipos de Datos en BI

Cargado por

Fabio Pinto

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

UNIDAD 2:

PROCESOS
ETL
Variedad: una del características
de
los datos en BI
¿Variedad?
● De organización de datos
● De tipos y formatos de
datos
● Tipos de fuentes de datos
Tipos de datos

● Datos estructurados
Los datos estructurados tienen perfectamente definido la
longitud, el formato y el tamaño de sus datos.

Se almacenan en formato tabla, hojas de cálculo o en bases

de datos relacionales.
Tipos de datos

● Datos semiestructurados
Los datos semiestructurados no presenta una estructura
perfectamente definida una organización definida en sus
metadatos como por ejemplo los formatos HTML, XML o
JSON.
Tipos de datos

● Datos no estructurados
Los datos no estructurados se caracterizan por no tener un
formato específico.

Se almacenan en múltiples formatos como documentos PDF

o Word, correos electrónicos, ficheros multimedia de
imagen, audio o video…
Proceso ETL
El proceso de ETL es una tecnología que tiene la función de
integrar datos, para ofrecer una visión mejorada de los
mismos. ETL corresponde a las siglas en inglés:
• Extract: Extracción.
• Transform: Transformación.
• Load: Carga.

ETL es el proceso donde se ponen a disposición los datos

extraídos de múltiples fuentes, se limpian y/o transforman
en datos útiles, los cuales se cargan en diferentes
plataformas.
¿Para qué se utiliza un proceso ETL?
En prácticamente cualquier operación empresarial los datos desempeñan el
papel más importante, pero para que tengan su valor, deben prepararse
para su uso, y es donde se necesitan los procesos ETL. Algunos ejemplos
de aplicación de ETL:

● Migración de datos de una aplicación a otra.

● Replicación de datos para copias de seguridad o análisis de
redundancia.
● Procesos operativos.
● Construcción de almacenes de datos.
Extracción
Los datos en bruto deben extraerse de una variedad de
fuentes, por ejemplo:
● Bases de datos existentes.
● Registros de actividades.
● Rendimiento y anomalías de aplicaciones.
● Incidencias de seguridad.
● Actividades transaccionales.

Además, estos datos pueden estar en diversos ficheros con

formatos variados (pdf, word, csv, json, xml, jpg, etc.). Algunos de
ellos pueden tener formatos de datos antiguos y costosos de
tratar.
Fuentes de datos
● Archivos: en disco o
SFTP
● API (OData)
● Base de datos
Transformación
● Es donde se produce la operación más crítica. El resultado
más destacado de la transformación pasa por aplicar las
normas necesarias del negocio a los datos para cumplir con
los requisitos de notificación. La transformación modifica los
datos en bruto para que presenten los formatos de
notificación correctos. Si los datos no se limpian, podríamos
obtener resultados completamente erróneos.
Estos son algunos de los estándares que
garantizan la calidad de datos y su
accesibilidad durante esta fase:

● Verificación: ejecutar comprobaciones automatizadas

● Normalización: definir qué datos para cotejar información similar, como tiempos de
entrarán en juego, cómo se formatearán transacción o registros de acceso. Las tareas de
y almacenarán, y otras consideraciones verificación permiten seguir limpiando los datos no
básicas que definirán las etapas utilizables y pueden alertar sobre anomalías en sus
sucesivas. sistemas, aplicaciones o datos.

● Clasificación: maximizar la eficiencia de los almacenes de

● Eliminación de duplicados: notificar los datos agrupando y clasificando elementos como los
duplicados a los administradores de datos en bruto, audios, archivos multimedia y otros
datos; excluyendo y/o eliminando los objetos en categorías. Las normas de transformación
datos redundantes. determinarán cómo se clasifica cada dato y a dónde se
trasladará.

Las demás tareas: las define el científico de datos y las

configura para que se ejecuten automáticamente.
Carga
La última fase de un proceso de ETL típico es la carga de esos datos extraídos y
transformados a su nuevo destino. Existen dos vías habituales de cargar los datos a un
almacén de datos: la carga completa y la carga incremental.
● Históricamente estos procesos se han realizado codificando manualmente en lenguajes
tipo Cobol, RPG, SQL, SAS, etc., actualmente se estima que todavía el 40% del trabajo
sobre procesos ETL (nueva creación, mantenimiento) se realiza con herramientas de este
tipo.

● Si bien, las herramientas ETL clásicas tienen sus limitaciones, ya que no mapean todo tipo de
sistemas fuente o destino y no dan soporte a todo tipo de transformaciones. Estas limitaciones se
han ido mitigando en las últimas versiones de estas herramientas, sobre todo en lo relativo a
mapeo de fuentes origen y destino. Herramientas tales como Informática Power Center, SAS Data
Integration, Capa de integración Oracle B.I, SSIS sobre Microsoft SQL Server, Pentaho Kettle,
Business Objetcs Data Integrator, etc.
Preguntas

● Es un protocolo que sirve para la ● El origen del concepto de Odata parte

transferencia de archivos propio de la web de esta fuente de datos muy presente
en la web
a) API
a) SFTP
b) SMTP
b) Correo
c) SFTP
c) CSV
d) Drive
d) API
Preguntas

● Es un protocolo que sirve para la ● El origen del concepto de Odata parte

transferencia de archivos propio de la web de esta fuente de datos muy presente
en la web
a) API
a) SFTP
b) SMTP
b) Correo
c) SFTP
c) CSV
d) Drive
d) API
PREGUNTAS y RESPUESTAS
FIN DEL
BLOQUE

También podría gustarte

Tema 2 Conceptos de Etl
Aún no hay calificaciones
Tema 2 Conceptos de Etl
89 páginas
Procesos ETL: Extracción, Transformación y Carga
Aún no hay calificaciones
Procesos ETL: Extracción, Transformación y Carga
7 páginas
Definición y Proceso de ETL
Aún no hay calificaciones
Definición y Proceso de ETL
8 páginas
Herramientas ETL en Gestión de Datos
100% (1)
Herramientas ETL en Gestión de Datos
13 páginas
Técnicas de ETL en Inteligencia de Negocios
Aún no hay calificaciones
Técnicas de ETL en Inteligencia de Negocios
6 páginas
Procesos ETL: Extracción y Carga de Datos
100% (1)
Procesos ETL: Extracción y Carga de Datos
12 páginas
Proceso ETL: Guía Completa y Herramientas
0% (1)
Proceso ETL: Guía Completa y Herramientas
4 páginas
ETL Extracción Transformación y Carga de Datos
Aún no hay calificaciones
ETL Extracción Transformación y Carga de Datos
6 páginas
Herramientas ETL: Guía y Ejemplos
Aún no hay calificaciones
Herramientas ETL: Guía y Ejemplos
15 páginas
Limpieza de Datos en el Proceso ETL
Aún no hay calificaciones
Limpieza de Datos en el Proceso ETL
23 páginas
Proceso ETL
Aún no hay calificaciones
Proceso ETL
7 páginas
Herramientas y Procesos de ETL
Aún no hay calificaciones
Herramientas y Procesos de ETL
6 páginas
Proceso ETL: Extracción, Transformación y Carga
Aún no hay calificaciones
Proceso ETL: Extracción, Transformación y Carga
25 páginas
Proceso ETL en Inteligencia de Negocios
Aún no hay calificaciones
Proceso ETL en Inteligencia de Negocios
10 páginas
Integracíon de Datos ETL
Aún no hay calificaciones
Integracíon de Datos ETL
8 páginas
Creación de Soluciones BI y ETL
Aún no hay calificaciones
Creación de Soluciones BI y ETL
62 páginas
Herramientas ETL
Aún no hay calificaciones
Herramientas ETL
4 páginas
Procesos ETL y Data Warehousing en BI
Aún no hay calificaciones
Procesos ETL y Data Warehousing en BI
11 páginas
Carga y Mantenimiento Del Almacén de Datos
Aún no hay calificaciones
Carga y Mantenimiento Del Almacén de Datos
34 páginas
Introducción a Procesos ETL y SSIS
Aún no hay calificaciones
Introducción a Procesos ETL y SSIS
10 páginas
Técnicas ETL y ELT: Ventajas y Desventajas
Aún no hay calificaciones
Técnicas ETL y ELT: Ventajas y Desventajas
10 páginas
Etl. M1 PDF
Aún no hay calificaciones
Etl. M1 PDF
32 páginas
Presentación - ETL Y ELT
Aún no hay calificaciones
Presentación - ETL Y ELT
28 páginas
ETL Actividad de Investigacion
Aún no hay calificaciones
ETL Actividad de Investigacion
13 páginas
Procesos ETL: Extracción, Transformación y Carga
Aún no hay calificaciones
Procesos ETL: Extracción, Transformación y Carga
7 páginas
Guía ETL para DBAs y Desarrolladores
100% (1)
Guía ETL para DBAs y Desarrolladores
6 páginas
Tarea 4 IA Uapa
Aún no hay calificaciones
Tarea 4 IA Uapa
8 páginas
Proceso ETL en Inteligencia de Negocios
Aún no hay calificaciones
Proceso ETL en Inteligencia de Negocios
22 páginas
Procesos ETL en Business Intelligence
Aún no hay calificaciones
Procesos ETL en Business Intelligence
26 páginas
Proceso ETL en Inteligencia de Negocios
Aún no hay calificaciones
Proceso ETL en Inteligencia de Negocios
10 páginas
Guía Completa de Herramientas ETL
Aún no hay calificaciones
Guía Completa de Herramientas ETL
12 páginas
Etapa Contextualizacioón ETL 236N-4B
Aún no hay calificaciones
Etapa Contextualizacioón ETL 236N-4B
5 páginas
Procesos ETL
100% (1)
Procesos ETL
21 páginas
El Proceso de Etl (Extract, Transform and Load)
Aún no hay calificaciones
El Proceso de Etl (Extract, Transform and Load)
91 páginas
Herramientas y Proceso ETL en BI
Aún no hay calificaciones
Herramientas y Proceso ETL en BI
16 páginas
Introducción al Proceso ETL en Datos
Aún no hay calificaciones
Introducción al Proceso ETL en Datos
10 páginas
Arquitectura de Soluciones BI
Aún no hay calificaciones
Arquitectura de Soluciones BI
21 páginas
Guía Completa sobre ETL: Proceso y Herramientas
Aún no hay calificaciones
Guía Completa sobre ETL: Proceso y Herramientas
1 página
Tipos y Conjuntos de Datos en Minería de Datos
Aún no hay calificaciones
Tipos y Conjuntos de Datos en Minería de Datos
6 páginas
Proceso de ETL
Aún no hay calificaciones
Proceso de ETL
2 páginas
SEM6-ETL - Mapeo de Datos - OLTP
Aún no hay calificaciones
SEM6-ETL - Mapeo de Datos - OLTP
22 páginas
Proceso ETL
Aún no hay calificaciones
Proceso ETL
8 páginas
Guía de Integración de Datos
Aún no hay calificaciones
Guía de Integración de Datos
5 páginas
Med - Etl - Ebook
Aún no hay calificaciones
Med - Etl - Ebook
22 páginas
El Proceso ETL en El Análisis de Datos
Aún no hay calificaciones
El Proceso ETL en El Análisis de Datos
4 páginas
Almacén de Datos y ETL en Educación
Aún no hay calificaciones
Almacén de Datos y ETL en Educación
13 páginas
Proceso ETL: Extracción, Transformación y Carga
Aún no hay calificaciones
Proceso ETL: Extracción, Transformación y Carga
30 páginas
Informe Etl
100% (1)
Informe Etl
20 páginas
Proceso ETL: Extracción y Transformación
Aún no hay calificaciones
Proceso ETL: Extracción y Transformación
38 páginas
EBOOK Procesos ETL
Aún no hay calificaciones
EBOOK Procesos ETL
22 páginas
Herramientas ETL para Inteligencia de Negocios
Aún no hay calificaciones
Herramientas ETL para Inteligencia de Negocios
12 páginas
ETL y Data Warehousing
Aún no hay calificaciones
ETL y Data Warehousing
17 páginas
Herramientas Etl
Aún no hay calificaciones
Herramientas Etl
7 páginas
Técnicas ETL en la Gestión de Datos Empresariales
Aún no hay calificaciones
Técnicas ETL en la Gestión de Datos Empresariales
4 páginas
Procesos ETL: Guía Completa
Aún no hay calificaciones
Procesos ETL: Guía Completa
5 páginas
Guía Completa de Procesos ETL
Aún no hay calificaciones
Guía Completa de Procesos ETL
5 páginas
Identificación de Procesos Organizacionales. GA1-220501092-AA1-EV02
89% (27)
Identificación de Procesos Organizacionales. GA1-220501092-AA1-EV02
6 páginas
Algoritmo para El Cálculo de Áreas y Volúmenes GA2-240201528-AA4-EV01.ENVIAR
90% (52)
Algoritmo para El Cálculo de Áreas y Volúmenes GA2-240201528-AA4-EV01.ENVIAR
9 páginas
Bitácora de Procesos en Competencia GA3-220201501-AA4
83% (12)
Bitácora de Procesos en Competencia GA3-220201501-AA4
19 páginas
Plan de Mejora de Productos y Procesos de Tic 220501046-AA4-EV01
70% (10)
Plan de Mejora de Productos y Procesos de Tic 220501046-AA4-EV01
9 páginas
Evidencia GA2-240201528-AA2-EV01 Informe Del Planteamiento de Ecuación
91% (11)
Evidencia GA2-240201528-AA2-EV01 Informe Del Planteamiento de Ecuación
6 páginas
Solucionario-3
80% (25)
Solucionario-3
301 páginas
Taller. Utilización de Las Herramientas de Ofimática. Realizar Un Taller Práctico Con Las Herramientas Ofimáticas. GA1-220501046-AA2-EV01
77% (13)
Taller. Utilización de Las Herramientas de Ofimática. Realizar Un Taller Práctico Con Las Herramientas Ofimáticas. GA1-220501046-AA2-EV01
4 páginas
Manual en Español de Power BI
92% (12)
Manual en Español de Power BI
1317 páginas
Diagrama de Sistemas de La Relación Del Individuo Con El Entorno
85% (20)
Diagrama de Sistemas de La Relación Del Individuo Con El Entorno
3 páginas
GA3-220501093-AA2-EV01 - Fundamentos de Programación Estructurada y Estructuras Cíclicas
100% (12)
GA3-220501093-AA2-EV01 - Fundamentos de Programación Estructurada y Estructuras Cíclicas
7 páginas
Algoritmo para El Cálculo de Áreas y Volúmenes GA2-240201528-AA4-EV01. El Que Ya Habia Enviar Que Ya Estaba Calificado
93% (14)
Algoritmo para El Cálculo de Áreas y Volúmenes GA2-240201528-AA4-EV01. El Que Ya Habia Enviar Que Ya Estaba Calificado
12 páginas
GA3-2202015 01-AA3-EV01. Informe de Laboratorio
93% (15)
GA3-2202015 01-AA3-EV01. Informe de Laboratorio
13 páginas
GA1-220501046-AA1-EV01 Mapa Conceptual Sobre Los Tipos de Software y Servicios de Internet
100% (24)
GA1-220501046-AA1-EV01 Mapa Conceptual Sobre Los Tipos de Software y Servicios de Internet
1 página
Aprende A Hablar Con IA Ingeniería de Prompts Comparte y Disfruta
100% (10)
Aprende A Hablar Con IA Ingeniería de Prompts Comparte y Disfruta
22 páginas
Cuaderno Ejercicios Practicas Excel Avanzado
81% (21)
Cuaderno Ejercicios Practicas Excel Avanzado
100 páginas
Taller - Utilización de Las Herramientas de Ofimática. GA1-220501046-AA2-EV01.
86% (7)
Taller - Utilización de Las Herramientas de Ofimática. GA1-220501046-AA2-EV01.
6 páginas
Mapa Conceptual Sobre Software y Servicios de Internet. GA2-220501046-AA1-EV01
97% (31)
Mapa Conceptual Sobre Software y Servicios de Internet. GA2-220501046-AA1-EV01
1 página
Cuaderno de Notas de Python
100% (8)
Cuaderno de Notas de Python
238 páginas
Evidencia Taller. AA4-EV02
100% (10)
Evidencia Taller. AA4-EV02
15 páginas
Cuestionario Ga3 240202501 Aa1 Ev01
67% (3)
Cuestionario Ga3 240202501 Aa1 Ev01
9 páginas
PRE SABER Integridad, Transparencia y Lucha Contra La Corrupción
88% (57)
PRE SABER Integridad, Transparencia y Lucha Contra La Corrupción
2 páginas
Video Presentación Del Caso GA2-240201528-AA3-EV01
100% (4)
Video Presentación Del Caso GA2-240201528-AA3-EV01
11 páginas
Planteamiento de Ecuación. GA2-240201528-AA2-EV01.
91% (22)
Planteamiento de Ecuación. GA2-240201528-AA2-EV01.
8 páginas
Programacion en Python
100% (21)
Programacion en Python
261 páginas
Evidencia 11. GA1-220501046-AA3-EV01 Informe Mejora de Productos y Procesos Con La Incorporación de TIC
100% (10)
Evidencia 11. GA1-220501046-AA3-EV01 Informe Mejora de Productos y Procesos Con La Incorporación de TIC
5 páginas
Evidencia Ga1 220501046 Aa2 Ev01 Taller Utilizacion de Las Herramientas de Ofimatica
100% (7)
Evidencia Ga1 220501046 Aa2 Ev01 Taller Utilizacion de Las Herramientas de Ofimatica
7 páginas
Claves de Office 2021
53% (15)
Claves de Office 2021
4 páginas
GA2-220501094-AA4-EV01 Taller de Especificación Del Modelo Conceptual y Estructurar
80% (10)
GA2-220501094-AA4-EV01 Taller de Especificación Del Modelo Conceptual y Estructurar
8 páginas
Algoritmos en Python: Guía Práctica
100% (31)
Algoritmos en Python: Guía Práctica
257 páginas
Cuadro Sinóptico: Alternativas Productivas SENA
91% (11)
Cuadro Sinóptico: Alternativas Productivas SENA
1 página
Curso de Realidad Aumentada 8vo Semestre
Aún no hay calificaciones
Curso de Realidad Aumentada 8vo Semestre
12 páginas
Base de Datos para PQR en IPS
Aún no hay calificaciones
Base de Datos para PQR en IPS
1 página
Patrones de Navegación en Diseño UI
Aún no hay calificaciones
Patrones de Navegación en Diseño UI
62 páginas
Visibilidad de Deportes Alternativos en Valledupar
Aún no hay calificaciones
Visibilidad de Deportes Alternativos en Valledupar
11 páginas
Desigualdad y Discriminación LGBTI en Valledupar
Aún no hay calificaciones
Desigualdad y Discriminación LGBTI en Valledupar
8 páginas
Decálogo para Reformar la Salud en Colombia
Aún no hay calificaciones
Decálogo para Reformar la Salud en Colombia
3 páginas
Sentencias DDL - DML
Aún no hay calificaciones
Sentencias DDL - DML
14 páginas
Guía Completa de GeoServer 2.10.0
Aún no hay calificaciones
Guía Completa de GeoServer 2.10.0
101 páginas
Tarea 2 - Base de Datos y Tablas Dinámicas
50% (2)
Tarea 2 - Base de Datos y Tablas Dinámicas
30 páginas
Tutorial MySQL para Ingenieros de Sistemas
Aún no hay calificaciones
Tutorial MySQL para Ingenieros de Sistemas
201 páginas
Procedimientos Almacenados en SQL para SGBD
Aún no hay calificaciones
Procedimientos Almacenados en SQL para SGBD
8 páginas
Sistema de Normalización de Bases de Datos
Aún no hay calificaciones
Sistema de Normalización de Bases de Datos
106 páginas
Estructura y Manejo de Listas en Java
Aún no hay calificaciones
Estructura y Manejo de Listas en Java
121 páginas
Fundamentos de Bases de Datos Silberschatz Korth Sudarshan
Aún no hay calificaciones
Fundamentos de Bases de Datos Silberschatz Korth Sudarshan
403 páginas
Guía de ADO.NET para Acceso a Datos
Aún no hay calificaciones
Guía de ADO.NET para Acceso a Datos
19 páginas
Base de Datos en Red
Aún no hay calificaciones
Base de Datos en Red
20 páginas
Modelado Dimensional para Analítica
Aún no hay calificaciones
Modelado Dimensional para Analítica
22 páginas
Comparativa: ROLAP, MOLAP y HOLAP
33% (3)
Comparativa: ROLAP, MOLAP y HOLAP
12 páginas
Diferencia Entre MySQL y SQL Server PDF
Aún no hay calificaciones
Diferencia Entre MySQL y SQL Server PDF
5 páginas
Introducción al Álgebra Relacional
Aún no hay calificaciones
Introducción al Álgebra Relacional
24 páginas
Proyecto de Base de Datos ITLA
Aún no hay calificaciones
Proyecto de Base de Datos ITLA
5 páginas
Algoritmos Semana 05 Colas
Aún no hay calificaciones
Algoritmos Semana 05 Colas
27 páginas
Historia de Base de Datos
0% (1)
Historia de Base de Datos
9 páginas
Guía de Instalación HP Service Manager 9.30
Aún no hay calificaciones
Guía de Instalación HP Service Manager 9.30
57 páginas
Interfaz de Gestión de Afiliados JAC
Aún no hay calificaciones
Interfaz de Gestión de Afiliados JAC
4 páginas
Simulacro de Examen de Bases de Datos
Aún no hay calificaciones
Simulacro de Examen de Bases de Datos
3 páginas
Creación de Base de Datos Aerolínea
Aún no hay calificaciones
Creación de Base de Datos Aerolínea
6 páginas
Implementación de Colas en Java
Aún no hay calificaciones
Implementación de Colas en Java
3 páginas
Conceptos Clave de Transacciones SQL
Aún no hay calificaciones
Conceptos Clave de Transacciones SQL
2 páginas
Puntos Extra 5 Autocalificable
Aún no hay calificaciones
Puntos Extra 5 Autocalificable
6 páginas
Gestión de Usuarios y Grupos - Teoría
Aún no hay calificaciones
Gestión de Usuarios y Grupos - Teoría
11 páginas
Inteligencia de Negocios en Compras y Almacén
Aún no hay calificaciones
Inteligencia de Negocios en Compras y Almacén
131 páginas
Introducción a Bases de Datos
Aún no hay calificaciones
Introducción a Bases de Datos
6 páginas
Transformación de Datos en Excel con Power Query
Aún no hay calificaciones
Transformación de Datos en Excel con Power Query
34 páginas
Normalización de Bases de Datos: Guía Completa
Aún no hay calificaciones
Normalización de Bases de Datos: Guía Completa
9 páginas
Bases de Datos para Decisiones
Aún no hay calificaciones
Bases de Datos para Decisiones
25 páginas