Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Karen Andrea Herrera Betancur
Juan Pablo Mejía Pérez
Mateo González Bayer
Pruebas de software
Profesor: Andrés Alberto Restrepo Herrón
Ingeniería de Software
Tecnológico de Antioquia
Medellín
2021
Introducción
Uno de los valores más importantes en una organización es la información por lo tanto
actualmente se generan muchos más datos que hace unos seis años atrás. Estamos
constantemente consultando nuestras redes sociales y usando nuestro teléfono móvil,
ordenador o Tablet. Es por esta cantidad de datos que hay que tratar en la actualidad que
es tan importante el Proceso de ETL: éste se encarga de extraer, transformar y cargar los
datos, además de gestionar y asegurarse de su integración y coherencia. Todo ello nos
permite extraer unos datos de un entorno y cargarlos en el entorno destino, después de
haberlos analizado.
Data warehouse
Un Data Warehouse es según (Orfila X, s.f) “una base de datos que se caracteriza por integrar y
depurar información de una o más fuentes distintas, para luego procesarla. De esta manera, es
posible analizar dicha información desde diferentes puntos de vista y a gran velocidad. El data
warehouse es una de las partes más importantes de la inteligencia empresarial en el entorno actual
en el que operan las empresas ya que esta ayuda a mejorar la toma de decisiones y el rendimiento
de la empresa”
Las características:
Orientados por temas: Los datos se organizan por temas, con el fin de facilitar su acceso
Variante en el tiempo: Los cambios producidos en los datos a lo largo del tiempo
quedan registrados para que los informes que se puedan generar reflejen esas variaciones.
Integrado: Los datos se organizan por temas para facilitar su acceso y entendimiento por
Metadatos: El data warehouse cuenta con metadatos, es decir, datos sobre datos. Los
El ETL es un elemento dentro de un data warehouse que según (cita) “es el proceso responsable
warehouse.”
Extracción de datos: Esta fase consiste en la obtención de datos de las fuentes de origen.
Los datos pueden tener diferentes orígenes, ya sean Bases de Datos Relacionales, Bases
sistema de destino.
Nivel intermedio: contiene el motor de análisis que se utiliza para acceder a los datos.
Nivel superior: es el cliente front-end que presenta los resultados de los análisis mediante
¿Cuándo se utiliza?
Los data warehouse son una herramienta muy recomendable cuando se quiere garantizar que
información de una empresa. Dada la arquitectura a tres niveles empleada en estas soluciones, los
usuarios finales de los DWH pueden hacer consultas sobre sus almacenes de datos sin tocar o
Hay nueve tipos de pruebas ETL y se clasifican en cuatro categorías generales: pruebas de
sistemas nuevos, pruebas de migración, pruebas de cambios y pruebas de informes. Sin embargo,
Validación de producción: Este tipo de prueba ETL valida los datos en los sistemas de
producción y los compara con los datos de origen para encontrar cualquier lógica
dentro de los plazos previstos y que la respuesta individual del servidor de prueba sea
datos se transforman con precisión de acuerdo con las reglas comerciales esperadas.
predeterminado.
La ejecución de esta prueba garantiza que todos los datos necesarios se carguen desde el sistema
de origen al destino. Requiere comparar los valores de datos entre el sistema de origen y de
destino, y validar la información que se transfiere. Además, verifica los límites de cada campo
para el tipo de datos o las limitaciones de la columna de la base de datos para asegurarse de que
Como su nombre lo indica, esta prueba verifica la precisión de los datos transformados y
cargados. Comparación de valor También es un paso esencial en este proceso que compara los
Validación de datos
También conocido como la prueba de origen a destino, asegura que los datos se transformen
Desempeño
Pruebas de extremo a extremo que verifican que todas las etapas del proceso ETL se realizan
dentro del marco de tiempo requerido dado el volumen y la complejidad de los datos. El objetivo
principal de ejecutar esta prueba es averiguar si el sistema ETL puede manejar la carga esperada.
Regresión ETL
Las pruebas de regresión se realizan para verificar la funcionalidad del flujo ETL para una
ETL incremental
Las pruebas de metadatos aseguran que la integridad de los datos hasta metadatos Se conserva el
nivel. El proceso implica validar la estructura de la tabla de origen y destino con respecto a los
requisitos de mapeo.
Aquí hay una lista de las tareas comunes involucradas en las pruebas ETL:
Existen distintos tipos de pruebas que pueden aplicarse a la data warehouse y bases de
aunque este tipo de test ha de llevarse a cabo durante la etapa de desarrollo, nunca
después. Los elementos más críticos y que deben someterse a este tipo de prueba son, al
Pruebas del sistema de integración: depende del éxito obtenido en las pruebas unitarias
y debe lograr dos metas principales:
b. Asegurar que no surgen problemas durante la ejecución del trabajo: con este objetivo, una
procesados.
datos es un paso gigante hacia adelante, que sirve para confirmar que el sistema actúa del modo
esperado una vez que las partes constituyentes de la solución se ponen juntas.
Pruebas de validación de datos: mediante este proceso se someten a test los datos
son válidos (a menos que, por supuesto, el informe original sea defectuoso). Esta prueba
ha de ser llevada a cabo por un representante del negocio, ya que este perfil es quien
mejor conoce los datos y puede validarlos con mayores garantías de éxito.
se proporcionan al usuario final cumplen con sus expectativas y que lo mismo sucede con
la solución en condiciones de trabajo reales. Para ello, en el testing hay que considerar
de regresión.