Está en la página 1de 97

Inteligencia de Negocios

DISEÑO DE UN DATAWAREHOUSE

PROF. LEANDRO FONDEUR


UNIVERSIDAD APEC
Qué veremos?
 Arquitectura de un DataWarehouse
 Plan de Implementación
 Modelo Dimensional
 Esquemas de Modelado Dimensional
 Estrategias de Generación del DataWarehouse
 Desnormalización del DataWarehouse
Arquitectura de un Data Warehouse
• Establece el marco de trabajo, estándares y procedimientos para
el DW a un nivel empresarial

• Los objetivos de las actividades de la arquitectura son simples,


integrar al DW las necesidades de información empresarial
Resultados de la Arquitectura
Los principales resultados del desarrollo de la arquitectura DW
incluyen:

 El modelo de datos fuente


 El modelo de datos conceptual DW
 Arquitectura tecnológica DW
 Estándares y procedimientos DW
 El plan de implementación incremental para el DW
Arquitectura DW - Modelos de datos
• Proveen una estructura para identificar, nombrar, describir y
asociar los componentes de una base de datos

• Se necesitan modelos de datos tanto para los datos fuente


como para los datos seleccionados que van a incorporarse en
el DW
Arquitectura DW - Estándares
• Son una parte importante de la arquitectura del DW

• Sin estándares, no son posibles las oportunidades para


reusar y hay riesgos de que partes del desarrollo no
obtengan los beneficios de la integración
Arquitectura DW –
Plan de implementación

• Es la parte de la arquitectura de DW que identifica los


incrementos del DW y describe la secuencia de desarrollo de
estos incrementos
Metodología de Ralph Kimball
• Serie de pasos para crear un Data Warehouse

• Se basa en lo que Kimball denomina Ciclo de Vida Dimensional


del Negocio

• Propone un enfoque de menor a mayor en la construcción del DW

• La metodología incluye la planificación, análisis de


requerimientos y diseño
Modelo Dimensional
• Técnica para modelar bases de datos simples y entendibles
al usuario final

• La idea fundamental es que el usuario visualice fácilmente la


relación que existe entre los distintos componentes del
modelo
Modelo Dimensional (Cont.)
1. Proceso de Negocio
 Define el proceso de negocio que se estará analizando
Ejemplo: Gastos realizados por cada mercado para cada ítem a
nivel mensual. Productos vendidos por cada mercado según el
precio en cada mes

2. Granularidad
 Nivel de detalle que se tomará para analizar la información
 Depende de los requerimientos del negocio y de los datos con
los que se cuentan
Ejemplo: Producto x mercado x tiempo
Modelo Dimensional (Cont.)
3. Dimensiones
 Son las perspectivas de análisis de las variables, son catálogos de
información necesarios para la presentación de los datos a los
usuarios
Ejemplo: tiempo, mercado, producto, cliente

4. Métricas
 En este paso se tienen que identificar las medidas que surgen en el
proceso de negocio
 Viene siendo qué es lo que se va a analizar
 Se colocan en una tabla llamada tabla de hechos
Ejemplo: Ventas totales, Cantidad vendida
Con estos pasos del Ciclo de Vida Dimensional
del Negocio se tiene casi listo el DW, el
siguiente paso es construir las dimensiones y
la tabla de hechos ya especificadas
anteriormente, y por último hacer la limpieza
de la información - ETL.
Elementos de una tabla de dimensiones
• Clave subrogada
 Es la clave principal de la tabla de dimensiones
 Nos permite identificar de forma única cada fila, suele ser un
entero auto incremental
 Es totalmente transparente al usuario de negocio, no la usará en
ningún momento, ni tan siquiera tendrá conocimiento de su
existencia
• Clave de negocio
 Es la clave con la que trabaja habitualmente el usuario, pero no
puede ser la clave principal porque se pueden producir
duplicidades
Elementos de una tabla de dimensiones
(Cont.)
• Atributos de la dimensión
 Serán cada una de las características que necesitemos almacenar
 Lo habitual es que haya varias decenas de ellos, incluso que en
algunos casos superen el centenar

• Fecha de Inicio y Fecha de Fin


 Servirán para conocer el periodo de vigencia de cada una de las
versiones de los atributos
Elementos de una tabla de dimensiones
(Cont.)

Tabla Dimensión Producto


Tablas de Hechos (Fact Tables)
Son tablas que representan un proceso de negocio, por ejemplo,
las ventas, las compras, los pagos, los apuntes contables, los clics
sobre nuestro sitio web, etc.
Están formadas por los siguientes elementos:
◦ Clave principal: Identifica de forma única cada fila. Al igual que en los
sistemas transaccionales toda tabla debe tener una clave principal, en
una tabla de hechos puede tenerla o no, y esto tiene sus pros y sus
contras, pero ambas posturas son defendibles

◦ Claves externas (Foreign Keys): Apuntan hacia las claves principales


(claves subrogadas) de cada una de las dimensiones que tienen
relación con dicha tabla de hechos
Tablas de Hechos (Cont.)
Medidas (Measures): Representan columnas que contienen datos
cuantificables, numéricos, que se pueden agregar. Por ejemplo,
cantidad, importe, precio, margen, número de operaciones, etc.

Metadatos y linaje: Nos permite obtener información adicional


sobre la fila, como por ejemplo, qué día se incorporó al Data
Warehouse, de qué origen proviene (si tenemos varias fuentes),
etc. No es necesario para el usuario de negocio, pero es
interesante analizar en cada tabla de hechos qué nos aporta y si
merece la pena introducir algunas columnas de este tipo
Elementos de una tabla de hechos
(Cont.)

Tabla de Hechos de Ventas


SCD (Slowly Changing Dimensions)
• SCD tipo 1, sobre escritura: la nueva información sobrescribe a la
antigua, no se guardan históricos y sólo se tiene la versión actual.
Dicha sobre escritura se produce cuando se detecta algún error en los
valores para corregirlo y mejorar la calidad del dato

• SCD tipo 2, historial de cambios: refleja toda la información histórica.


Por cada cambio que se produzca, se crea una nueva fila en la tabla de
dimensiones con la fecha de inicio y una nueva clave subrogada, y se
marca la fecha de fin de la versión anterior. Cada hecho que entra,
debe comprobar a qué versión de la fila en la tabla de dimensiones se
debe asociar en función de la fecha en la que se produzca
Esquemas de Modelado Dimensional

Esquema en estrella (Star Schema)


◦ Hay una única tabla central, la tabla de
hechos, que contiene todas las
medidas y una tabla adicional por
cada una de las perspectivas desde las
que queremos analizar dicha
información, es decir por cada una de
las dimensiones
Esquemas de Modelado Dimensional
(Cont.)
Esquema en copo de nieve (snowflake
schema)
◦ Algunas de las dimensiones no están
relacionadas directamente con la tabla
de hechos, sino que se relacionan con
ella a través de otras dimensiones
◦ En este caso también tenemos una tabla
de hechos, situada en el centro, que
contiene todas las medidas y una o
varias tablas adicionales, con un mayor
nivel de normalización
Bus Dimensional
Esquema, habitualmente en forma de tabla, que representa los
diversos DataMarts y las diferentes dimensiones definidas en
nuestra organización
Estrategias de Generación del Data
Warehouse

Estrategia Estrategia
Bottom- Top-
up down
Estrategia Bottom-up
• Construcción de un Data Warehouse desde la información
contenida en los sistemas transaccionales

• Genera todas las estructuras dimensionales desde las fuentes


de datos de los sistemas OLTP
Estrategia Bottom-up (Cont.)
Ventajas:

 Se asegura la existencia de toda la información de los


sistemas OLTP, que requiera el Data Warehouse

 Posibilita la generación de mecanismos de carga


automatizados que simplifiquen las operaciones de
mantenimiento y administración de la información
Estrategia Bottom-up (Cont.)
Desventajas:
 Generación de estructuras dimensionales innecesarias para la
correcta toma de decisiones, se desperdician recursos valiosos y
alargan los tiempos de implementación

 Para una correcta toma de decisiones, no solo se requiere la


información presente en los sistemas transaccionales, también es
necesaria información externa a la empresa, información que
queda fuera del modelo al ser utilizado este enfoque
Estrategia Top-down
• Establece como paso inicial la definición de todos los
requerimientos de información para los ejecutivos de la
organización

• Se identifican las fuentes de información que serán utilizadas


para satisfacer los requerimiento definidos, dichas fuentes
pueden ser sistemas transaccionales, información no
automatizada y fuentes externas a la organización
Estrategia Top-down (Cont.)
Ventajas:
 El Data Warehouse resultante está realmente enfocado a las
necesidades de los clientes y que apoya de forma más eficiente
la toma de decisiones

Desventajas:
 Aumenta la complejidad en la obtención de información
necesaria para la carga de datos, especialmente cuando las
fuentes no se encuentran automatizadas o están fuera de la
organización
Desnormalización del DW
• El desafío de integrar datos de sistemas operacionales a
través de las aplicaciones y los límites del sistema es una
necesidad primordial

• En muchos casos, el cometido es solamente poblar el Data


Warehouse
Desnormalización del DW (Cont.)
• Sólo después de que esté en uso, muchos de los casos de
inconsistencia , duplicación y desnormalización de datos
salen a la superficie

• Además de la revisión de los datos de arriba a abajo, es


necesaria una investigación de abajo hacia arriba de los
datos reales que están en el Data Warehouse para asegurar
su operación exitosa
Desnormalización del DW (Cont.)
• La falta de estándares de datos
 Esto resulta en formatos múltiples de datos dentro de distintas
bases, haciendo cualquier intento de consolidación imposible

• Los datos ocultos


 Esto a menudo ocurre cuando la información no solicitada es
entrada en campos de texto independiente
 Por la rigidez de la mayoría de los metadatos, la información
"adicional" crítica es a menudo dejada de lado y necesita ser
descubierta antes de ser manipulada
Desnormalización del DW (Cont.)
• La miopía de datos
 A menudo, los números de cuenta múltiples bloquean
una vista consolidada

 Esto puede ser el caso cuando un grupo familiar tiene


a varios miembros, cada uno con su propio número de
cuenta, o cuando una casa matriz tiene sucursales
múltiples

 Tales casos requieren capacidades investigativas


fuertes para localizar y reorganizar la información
relacionada
Desnormalización del DW (Cont.)
• La pesadilla de las anomalías
 Considere las numerosas opciones disponibles para
los empleados que cargan datos para ingresar un
nombre de compañía, dirección, número de
teléfono dentro de un campo de datos
 Súmese al número de abreviaciones convencionales
un número igual o mayor de abreviaciones
convenientes
 Multiplique estos por el número de campos, el
número de empleados que ingresan datos, y el
número de entradas reales, y usted comienza a
entender la pesadilla de igualar y consolidar
información compleja
Desnormalización del DW (Cont.)
• Las sorpresas de datos
 Esto ocurre cuando los valores de datos se
desvían de los metadatos y de las reglas del
negocio
 Por ejemplo, los nombres comerciales a
menudo quedan mezclados con nombres
personales; y la información de relaciones como
"dba" o "c/o" se puede encontrar en una gran
variedad de campos
 Pero simplemente porque los datos no están
donde deberían, no quiere decir que son datos
que usted puede ignorar
Inteligencia de Negocios

IMPLEMENTACIÓN DE UN DATAWAREHOUSE

PROF. LEANDRO FONDEUR


UNIVERSIDAD APEC
Qué veremos?
 Granularidad
 Agregación
 ETL
 Staging Area
Granularidad
 Es importante a la hora de diseñar una tabla de hechos, tener
en cuenta el nivel de granularidad que va a tener, es decir, el
nivel de detalle más atómico que vamos a encontrar de los
datos
 No es lo mismo tener una fila por cada venta, que una fila
donde se indiquen las ventas del día para cada artículo y tienda
 A mayor granularidad, mayor será el número de filas de nuestra
tabla de hechos, y dado que el espacio en disco y rendimiento
no se ven notablemente afectados en los sistemas actuales,
debemos llegar siempre al máximo nivel de granularidad que
resulte útil a los usuarios
Agregación
 Proceso por el cual se resumen los datos a partir de las filas
de detalle de máxima granularidad

 Hoy en día disponemos de sistemas OLAP que se encargan


de agregar dichos datos y ofrecerlos al usuario con una gran
rapidez y eficacia
Extract-Transform-Load (ETL)
Proceso que Sirve
permite a las principalmente
organizaciones para mantener
extraer, una consistencia
transformar y en los datos y
cargar los datos eliminar o
a otra fuente de corregir los que
información estén erróneos
ETL (Extract, Transform and Load)
 Procesos que leen los datos de las
diferentes fuentes, los transforman y
adaptan al modelo que hayamos
definido, los depuran y limpian, y los
introducen en la base de datos destino

 Se deben reconciliar todos los datos de


las diferentes fuentes, realizar los
cálculos necesarios, mejorar la calidad
de los datos, adaptarlos al nuevo
modelo físico y almacenarlos en él
ETL - Extracción de los datos
• Actualización completa
 Borrar los datos y volver a cargarlos
• Actualización incremental
 Borrado sólo parte de los datos, por ejemplo desde una fecha, y carga de
los nuevos datos
 Comparar los datos de origen y de destino, actualizando sólo los cambios
 Uso de triggers u otras técnicas de replicación
 Captura de datos mediante una aplicación diseñada específicamente para
ello
 Existencia de columnas timestamp que permitan seleccionar las filas
modificadas desde la última extracción y aplicar dichos cambios en destino
ETL - Transformación de los datos
• Asegurar que los datos sean válidos, de su integridad y de su
utilidad, lo que suele incluir realizar cálculos y generar
nuevos valores
• Los datos deben ser depurados para eliminar inconsistencias,
discrepancias y duplicidades
• Estas transformaciones suelen conllevar cambios con
respecto a la estructura de origen para adaptarla al destino,
cambios en el contenido de los valores de origen y creación
de nuevos valores en las filas de destino
ETL - Carga en el Data Warehouse
• Proceso de incorporar los datos al Data Warehouse y/o a los
diferentes DataMarts, y a los cubos OLAP

• Todo ello según la presentación, formatos definidos y


periodicidad de actualización propuesta
Área de staging
 Es un área temporal que se encuentra en el flujo de datos entre
las fuentes y el Data Mart o Data Warehouse con el fin de:
 Facilitar la extracción de datos
 Realizar tareas de limpieza (data cleansing)
 Mejorar la calidad de los datos
 Ser utilizada como caché de los datos operacionales o acceder a
un nivel de detalle de los datos y de los cambios no almacenados
en el DataMart o Data Warehouse
Recomendaciones para la carga de un
área de staging
• Mínimo impacto sobre el origen
◦ Para conseguir una máxima escalabilidad y para afectar lo mínimo
posible al rendimiento de los servidores transaccionales que van a ser
nuestros orígenes de datos, debemos consumir de ellos los mínimos
recursos posibles, y centrar el consumo de dichos recursos en el
servidor que se encarga de realizar los procesos ETL
• Trazabilidad del dato
◦ Es muy importante saber dónde, cuándo y quién ha realizado cada
cambio.
◦ Realizar los procesos de extracción y de obtención de diferencias
entre el origen y el destino
◦ Ir almacenando todos los cambios que nos encontremos para poder
seguir la pista de cualquier dato y de los cambios que ha sufrido
Recomendaciones para la carga de un
área de staging (Cont.)
• Generación de tablas Delta
◦ Que tenga registradas las operaciones de inserción, actualización y borrado
que se han ido produciendo en el origen, y aplicar esos cambios en el destino
◦ Este proceso es más eficiente y consume menos recursos en origen y destino,
que hacer una lectura de dicho origen, compararlo con el destino, y obtener
de ahí las diferencias para seguidamente aplicarlas al destino
• Limpieza de datos
◦ Es importante llevar a cabo una serie de tareas de limpieza de datos y
detección de incoherencias
◦ Podemos hacer ciertas correcciones sobre datos que tenemos la certeza de
que no son correctos, o simplemente no entrarlos al destino y dejarlos en
algún lugar para que alguien los revise
Carga de una tabla en el área de Staging
cuyo origen es una base de datos relacional

Carga de una tabla en el área de Staging. Control Flow


Tratamiento de filas nuevas y modificadas – Data Flow
Tratamiento de filas eliminadas – Data Flow
Inteligencia de Negocios
ARQUITECTURA Y HERRAMIENTAS DE BI

PROF. LEANDRO FONDEUR


UNIVERSIDAD APEC
Qué vimos?
Granularidad
Agregación
Proceso ETL
Área Staging
Qué veremos?
Arquitectura BI
Metadata
Jerarquía
Herramientas OLAP
Concepto FASMI
Búsquedas en el cubo OLAP
Arquitectura de BI
Metadata
• Nos explicita todos los atributos de las tablas, de los sistemas de
donde provienen, así como la definición de cada uno de los atributos
de las mismas
• Puede incorporar también si los campos son recalculados o
transformados y el detalle de las transformaciones que se han
llevado a cabo
• Gestión del Metadata: Proveer un repositorio donde definir,
documentar y gestionar la información del proceso ETL y su
ejecución. El Metadata debería ser accesible también desde otras
aplicaciones
Metadata (Cont.)
• Es el repositorio central de información de la información
• Nos da el significado de cada uno de los componentes y sus
atributos que residen en el Data Warehouse (o Data Mart)
• La información que contiene el Metadata es útil para los
departamentos de tecnología y los propios usuarios
• Puede incluir definiciones de negocio, descripciones detalladas de
los tipos de datos, formatos y otras características
Metadata (Cont.)
• El personal de los departamentos de Tecnología necesita saber los
orígenes de la información: bases de datos de las que obtenemos
los datos, qué transformaciones realizamos, criterios de filtros de
información, nombre de las columnas y de las tablas, plazos de
carga, utilización, etc.

• Los usuarios necesitan saber las entidades y sus atributos, cómo


han sido calculados, quiénes son los responsables de los datos, los
informes disponibles, los flujos de distribución de la información,
etc.
Metadata (Cont.)
• La construcción del Metadata supone que se defina el significado de
cada una de las tablas y cada uno de los atributos que se cargan en el
Data Warehouse.
• Este es un punto complejo de todo proyecto, ya que obliga a que se
definan los conceptos de negocio y se homogeneicen entre los
distintos departamentos, filiales, etc.
• Obliga a que todos los componentes de la organización hablen
utilizando la misma terminología y con el mismo significado
Jerarquías
• La existencia de las jerarquías en las
dimensiones nos permite pasar del
máximo detalle a la agregación en
los distintos niveles
• Nos permite agregar o desagregar la
información
• Nos permiten hacer agrupaciones
• Cambiar el orden de las distintas
dimensiones en función de las
necesidades de consulta
Herramientas OLAP
• Los usuarios necesitan analizar información a distintos niveles
de agregación y sobre múltiples dimensiones
• Los usuarios pueden hacer este análisis al máximo nivel de
agregación o al máximo nivel de detalle
• A estos tipos de análisis les llamamos multidimensionales,
porque nos facilitan el análisis de un hecho desde distintas
perspectivas o dimensiones
• La visualización de la información es independiente respecto
de cómo se haya almacenado
Concepto FASMI que los productos OLAP
deben cumplir
FAST (Rápido): Debe ser rápido, necesitamos lanzar consultas y ver
los resultados inmediatamente
ANALYSIS (Análisis): Debe soportar la lógica de negocio y análisis
estadísticos que sean necesarios para los usuarios
SHARED (Compartido): Debe apoyar el intercambio y la
accesibilidad. Debe mantener la integridad de la información al
proporcionar confidencialidad (seguridad) y administrar el acceso
concurrente
MULTIDIMENSIONAL (Multidimensional): Tiene que proveer una
visión conceptual de la información a través de distintas dimensiones
INFORMATION (Información): Debe poder manejar toda la
información relevante y la información derivada
La representación gráfica del OLAP son
los cubos

Los contenidos de OLAP permite


cada uno de los que
cubos individuales cada uno de los
recogen lo que cubos
llamamos individuales
“hechos” pueda contener
más de un
hecho
Búsqueda: Slice and Dice

Slice: Selecciona una


dimensión en particular
de un cubo dado y
proporciona un nuevo
sub-cubo
Búsqueda: Slice and Dice (Cont.)

Dice: Selecciona dos o


más dimensiones de un
cubo dado y proporciona
un nuevo sub-cubo
Búsqueda: Pivot

Pivot: Rota el cubo,


proporcionando una vista
alternativa de los datos
Búsqueda: Roll-up and Drill-down
Búsqueda: Roll-up and Drill-down (Cont.)
Roll-up: Ver el máximo nivel de agregación (en inglés “roll-up”) en
atributos de una dimensión sobre los que se ha definido una jerarquía

Drill-down: Bajamos a más detalle (en inglés “drill-down”) en


atributos de una dimensión sobre los que se ha definido una
jerarquía
Búsqueda: Roll-up and Drill-down (Cont.)
Inteligencia de Negocios
ARQUITECTURA Y HERRAMIENTAS DE BI

PROF. LEANDRO FONDEUR


UNIVERSIDAD APEC
Qué veremos?
 Herramientas OLAP
 Herramientas de BI
Herramientas OLAP
ROLAP: Relational OLAP
 Acceden directamente a la base de datos relacional (RDBMS)
 Accede habitualmente sobre un modelo “estrella”
 No tiene limitaciones en cuanto al tamaño
 Es más lento que el MOLAP
 Algunos productos comerciales permiten cargar cubos virtuales
para acelerar los tiempos de acceso
Herramientas OLAP (Cont.)
MOLAP: Multidimensional OLAP
 Accede directamente sobre una base de datos multidimensional
(MDDB)
 Ventaja: Es muy rápida en los tiempos de respuesta
 Desventaja: Si queremos cambiar las dimensiones, debemos cargar
de nuevo el cubo
Herramientas OLAP (Cont.)
HOLAP: Hybrid OLAP
 Accede a los datos de alto nivel en una base de datos multidimensional
 Accede a los datos atómicos directamente sobre la base de datos
relacional
 En esencia utiliza las ventajas del ROLAP y del MOLAP
Formas de acceso de las herramientas
OLAP
• Cliente/Servidor: lo que significa tener las instalaciones locales en
los ordenadores de los usuarios
• Acceso web: cliente, cliente ligero, o sólo con el navegador. En
este tipo de acceso el navegador comunica con un servidor web,
el cual habla con la aplicación del servidor, que es la que conecta
con el Data Warehouse
• Virtual o Desktop OLAP (DOLAP): En este caso creamos un cubo
con las dimensiones que le interesan al usuario. La ventaja es que
el usuario sólo recibe los hechos y las dimensiones en los que está
interesado y los analiza en forma local
Herramientas de BI
Generadores de informes:
 Utilizadas por desarrolladores profesionales para crear
informes estándar para grupos, departamentos o la
organización

Herramientas de usuario final de consultas e informes:


 Empleadas por usuarios finales para crear informes para ellos
mismos o para otros; no requieren programación
Herramientas de BI (Cont.)
Herramientas OLAP:
 Permiten a los usuarios finales tratar la información de forma
multidimensional para explorarla desde distintas perspectivas y
periodos de tiempo
Herramientas de BI (Cont.)
Herramientas de Dashboard y Scorecard:
 Permiten a los usuarios finales ver información crítica para el
rendimiento con un simple vistazo utilizando íconos gráficos y ver más
detalle para analizar información

 Documento en el que se reflejan las principales métricas de una


empresa, con ellos se puede hacer un seguimiento a los factores que
contribuyen a su funcionamiento y su éxito. Estos ayudan a diagnosticar
si se están haciendo bien o no las cosas
Herramientas de BI (Cont.)
Herramientas de planificación, modelización y
consolidación:
 Permite a los analistas y a los usuarios finales crear planes de
negocio y simulaciones con la información de BI
 Pueden ser para elaborar la planificación, los presupuestos,
las previsiones
 Estas herramientas proveen a los dashboards y los scorecards
con los objetivos y los umbrales de las métricas
Herramientas de BI (Cont.)
Herramientas datamining:
◦ Permiten a estadísticos o analistas de negocio crear modelos
estadísticos de las actividades de los negocios
◦ Datamining es el proceso para descubrir e interpretar patrones
desconocidos en la información mediante los cuales resolver
problemas de negocio
◦ Los usos más habituales del datamining son: segmentación, venta
cruzada, hábito de consumo, clasificación, previsiones,
optimizaciones, etc.
Herramientas de BI (Cont.)
Herramientas de Geo-
referencia:
◦ Estas herramientas añaden una
capa de visualización sobre la
que representan los valores
que obtenemos de las
herramientas de BI
◦ La información es representada
sobre un área geográfica
Productos de BI
26/11/2020 Examen Primer Parcial: Revisión del intento

Comenzado en Tuesday, 6 de October de 2020, 20:10


Estado Terminados
Finalizado en Tuesday, 6 de October de 2020, 20:25
Tiempo 15 mins 6 segundos
empleado
Calificación 20.00 de un total de 20.00 (100%)

Pregunta 1 Característica de un Data Warehouse donde la información, una vez introducida, debe ser de sólo lectura, nunca se
Correcta modifica ni se elimina, y ha de ser permanente y mantenerse para futuras consultas.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Contienen metadatos.

b. Integrado.

c. No volátil. 

Su respuesta es correcta.

La respuesta correcta es: No volátil.

Pregunta 2 Buscar independencia entre los conocimientos técnicos de los usuarios es una característica de la Inteligencia de Negocio.
Correcta Indique cuál es dicha característica.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Apoyo en la toma de decisiones.

b. Accesibilidad a la información.

c. Orientación a los usuarios finales. 

Su respuesta es correcta.

La respuesta correcta es: Orientación a los usuarios finales.

Pregunta 3 Buscar la manera en que los usuarios tengan acceso a herramientas de análisis es una característica de la Inteligencia de
Correcta Negocio. Indique cuál es dicha característica.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Apoyo en la toma de decisiones. 

b. Orientación a los usuarios finales.

c. Accesibilidad a la información.

Su respuesta es correcta.

La respuesta correcta es: Apoyo en la toma de decisiones.

https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 1/6
26/11/2020 Examen Primer Parcial: Revisión del intento

Pregunta 4 Garantizar el acceso de los usuarios a los datos de manera independiente es una característica de la Inteligencia de
Correcta Negocio. Indique cuál es dicha característica.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Orientación a los usuarios finales.

b. Apoyo en la toma de decisiones.

c. Accesibilidad a la información. 

Su respuesta es correcta.

La respuesta correcta es: Accesibilidad a la información.

Pregunta 5 Característica de los datos de un Data Warehouse donde todos los datos relativos a un mismo elemento de la vida real
Correcta quedan unidos entre sí.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Orientado a temas. 

b. Histórico.

c. Integrado.

Su respuesta es correcta.

La respuesta correcta es: Orientado a temas.

Pregunta 6 Están diseñados para gestionar un gran número de peticiones concurrentes sobre sus bases de datos, y que los usuarios
Correcta puedan insertar, modificar, borrar y consultar dichos datos. 
Puntúa 1.00
sobre 1.00 Seleccione una:
a. OLAP.

b. ODS.

c. OLTP. 

Su respuesta es correcta.

La respuesta correcta es: OLTP.

Pregunta 7 Habitualmente utilizan sistemas de bases de datos relacionales para gestionar los datos, y suelen estar altamente
Correcta normalizados.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. ODS.

b. OLAP.

c. OLTP. 

Su respuesta es correcta.

La respuesta correcta es: OLTP.

https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 2/6
26/11/2020 Examen Primer Parcial: Revisión del intento

Pregunta 8 Característica de los datos de un Data Warehouse donde la información se estructura en diversos niveles de detalle para
Correcta adecuarse a las necesidades de consulta de los usuarios.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Integrado. 

b. Histórico.

c. Orientado a temas.

Su respuesta es correcta.

La respuesta correcta es: Integrado.

Pregunta 9 En la arquitectura de una aplicación de Data Mart corresponde a las consultas, procesos y funciones de formateo.
Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Capa lógica analítica. 

b. Capa de datos.

c. Capa de presentación.

Su respuesta es correcta.

La respuesta correcta es: Capa lógica analítica.

Pregunta 10 Especializada en el almacenamiento de los datos de un área de negocio específica.


Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Data Warehouse.

b. Data Mart. 

c. Inteligencia de Negocios.

d. Data Mining.

Su respuesta es correcta.

La respuesta correcta es: Data Mart.

Pregunta 11 Es un vector multidimensional, de N dimensiones, la información se almacena en cada una de estas dimensiones, de
Correcta forma ordenada y jerarquizada, lo que permite realizar un rápido análisis de su contenido.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. OLAP.

b. Cubo OLAP. 

c. Métricas.

d. Dimensión.

Su respuesta es correcta.

La respuesta correcta es: Cubo OLAP.

https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 3/6
26/11/2020 Examen Primer Parcial: Revisión del intento

Pregunta 12 Involucrar a los usuarios finales durante la etapa de definición es un criterio de la determinación de los requerimientos de
Correcta la información.
Puntúa 1.00
sobre 1.00 Elija una;
Verdadero 

Falso

La respuesta apropiada es 'Verdadero

Pregunta 13 Es un criterio tecnológico que indica que todos los factores que puedan provocar un aumento en la carga de proceso del
Correcta sistema deben ser considerados a la hora de determinar la plataforma tecnológica adecuada.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Gestión.

b. Escalabilidad. 

c. Rendimiento.

Su respuesta es correcta.
La respuesta correcta es: Escalabilidad.

Pregunta 14 Vistas de varios Data Marts físicos o el Data Warehouse corporativo ajustado para satisfacer los requerimientos de grupos
Correcta específicos de usuarios.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Vistas Materializadas.

b. Data Marts virtuales. 

c. Data Mining.

Su respuesta es correcta.

La respuesta correcta es: Data Marts virtuales.

Pregunta 15 Base de datos corporativa en la que se integra información depurada de las diversas fuentes que hay en la organización.
Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Data Mining.

b. Inteligencia de Negocios.

c. Data Warehouse. 

d. Data Mart.

Su respuesta es correcta.

La respuesta correcta es: Data Warehouse.

https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 4/6
26/11/2020 Examen Primer Parcial: Revisión del intento

Pregunta 16 Característica de los datos de un Data Warehouse donde los datos deben quedar reflejados de forma que al ser
Correcta consultados reflejen estos cambios y no se altere la realidad que había en el momento en que se almacenaron.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Orientado a temas.

b. Histórico. 

c. Integrado.

Su respuesta es correcta.

La respuesta correcta es: Histórico.

Pregunta 17 Diferentes hechos con valores concretos que solicita el usuario.


Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Dimensiones.

b. Medidas. 

c. Cubo OLAP.

Su respuesta es correcta.

La respuesta correcta es: Medidas.

Pregunta 18 Es un criterio tecnológico en el cual debemos preguntarnos con qué frecuencia se efectuarán las cargas y
Correcta transformaciones sobre los datos?
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Gestión. 

b. Rendimiento.

c. Escalabilidad.

Su respuesta es correcta.

La respuesta correcta es: Gestión.

Pregunta 19 Diferentes perspectivas desde las que queremos analizar la información.


Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Dimensiones. 

b. Medidas.

c. Cubo OLAP.

Su respuesta es correcta.

La respuesta correcta es: Dimensiones.

https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 5/6
26/11/2020 Examen Primer Parcial: Revisión del intento

Pregunta 20 Cuál no es un beneficio que aporta la Inteligencia de Negocios.


Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Aumento en tiempos para las distintas actividades del negocio. 

b. Mejora nuestra posición competitiva.

c. Reducción de costos.

Su respuesta es correcta.

La respuesta correcta es: Aumento en tiempos para las distintas actividades del negocio.

https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 6/6
Comenzado en Tuesday, 3 de November de 2020, 20:08
Estado Terminados
Finalizado en Tuesday, 3 de November de 2020, 20:23
Tiempo 15 mins
empleado
Calificación 19.00 de un total de 20.00 (95%)

Pregunta 1 Es una operación de Minería de Datos, la cual consiste en detectar cuáles registros poseen características discordantes o
Correcta diferentes a las que poseen generalmente un registro de su naturaleza.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Detección de desviaciones. 

b. Segmentación de una Base de Datos.

c. Análisis de Asociaciones.

Su respuesta es correcta.

La respuesta correcta es: Detección de desviaciones.

Pregunta 2 Como parte de los pasos del proceso de la Minería de Datos, al momento de seleccionar los datos, estas variables pueden
Correcta realizar los cálculos que necesito para poder llegar a las conclusiones necesarias.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Variables independientes. 

b. Variables dependientes.

c. Variables objetivos.

Su respuesta es correcta.

La respuesta correcta es: Variables independientes.

Pregunta 3 Apareamiento. Ordene las seis fases del modelo CRSIP-DM.


Correcta

Puntúa 1.00 Comprensión del negocio. 1 


sobre 1.00
Modelado. 4 

Comprensión de lo datos. 2 

Evaluación. 5 

Implantación. 6 

Preparación de los datos. 3 

Su respuesta es correcta.

La respuesta correcta es: Comprensión del negocio. → 1, Modelado. → 4, Comprensión de lo datos. → 2, Evaluación. → 5,
Implantación. → 6, Preparación de los datos. → 3
Pregunta 4 Es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o
Correcta semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento
Puntúa 1.00 de los datos en un determinado contexto.
sobre 1.00

Seleccione una:
a. Data Wharehouse.

b. Minería de Datos. 

c. Inteligencia de Negocios.

d. Datamarts.

Su respuesta es correcta.

La respuesta correcta es: Minería de Datos.

Pregunta 5 En este tipo de almacenamiento OLAP se mantienen volúmenes de información más grandes en la base de datos
Correcta relacional y las agregaciones en bases de datos multidimensionales separada.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. MOLAP.

b. HOLAP. 

c. ROLAP.

d. DOLAP.

Su respuesta es correcta.

La respuesta correcta es: HOLAP.

Pregunta 6 Estos métodos se caracterizan por tener sus fundamentos en el procesamiento simplificado de la información por parte
Correcta del cerebro; estos a través de una arquitectura de nodos y conexiones permiten que los datos se propaguen entre una
Puntúa 1.00 capa de nodos de entrada hacia una capa de salida.
sobre 1.00

Seleccione una:
a. Métodos Simbólicos.

b. Predicción de valores.

c. Métodos Neuronales. 

Su respuesta es correcta.

La respuesta correcta es: Métodos Neuronales.

Pregunta 7 Es un conjunto de elementos de procesamiento de la información altamente interconectados, capaces de aprender con la
Correcta información que se les alimenta.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Clasificación neuronal.

b. Arboles de decisión.

c. Redes neuronales. 

Su respuesta es correcta.

La respuesta correcta es: Redes neuronales.


Pregunta 8 Es un tipo de consulta donde las consultas son recurrentes y aleatorias, y se le da respuesta a una necesidad concreta de
Correcta información.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Consultas Ad-Hoc. 

b. Consultas Empaquetadas.

c. Consultas Distribuidas.

Su respuesta es correcta.

La respuesta correcta es: Consultas Ad-Hoc.

Pregunta 9 Es conocido como el modelo estándar de la industria. Se trata de un modelo de proceso de minería de datos que
Correcta describe los enfoques comunes que utilizan los expertos en minería de datos.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. 5 A's.

b. SEMMA.

c. CRISP-DM. 

Su respuesta es correcta.

La respuesta correcta es: CRISP-DM.

Pregunta 10 En este tipo de almacenamiento OLAP se realiza un resumen de la información, se hacen cálculos por adelantado y se
Correcta usan técnicas de compresión.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. ROLAP.

b. DOLAP.

c. HOLAP.

d. MOLAP. 

Su respuesta es correcta.

La respuesta correcta es: MOLAP.

Pregunta 11 Desarrolla, interpreta y evalúa el modelo de minería de datos a la luz de los objetivos de negocio y criterios de éxito del
Correcta negocio.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. El ingeniero de minería de datos. 

b. El analista de minería de datos.

c. El cliente de minería de datos.

d. El líder del proyecto.

e. El analista de TI.

Su respuesta es correcta.

La respuesta correcta es: El ingeniero de minería de datos.


Pregunta 12 Reconoce patrones que describen el grupo al que pertenece un artículo. Basada en redes neuronales de propagación
Correcta hacia atrás.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Arboles de decisión.

b. Clasificación neuronal. 

c. Redes neuronales.

Su respuesta es correcta.

La respuesta correcta es: Clasificación neuronal.

Pregunta 13 Se emplean para dividir una BD en subconjuntos, donde los miembros de cada uno de ellos comparten características
Correcta similares.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Segmentación. 

b. Patrones secuenciales.

c. Descubrimiento de asociaciones.

Su respuesta es correcta.

La respuesta correcta es: Segmentación.

Pregunta 14 Es una operación de Minería de Datos, la cual consiste en utilizar los datos que la empresa posee como histórico con el
Correcta fin de analizarlos para generar de manera automática un modelo que permita augurar el comportamiento futuro.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Modelos de predicción y clasificación. 

b. Análisis de Asociaciones.

c. Sumarización de Datos.

Su respuesta es correcta.

La respuesta correcta es: Modelos de predicción y clasificación.

Pregunta 15 Es una operación de Minería de Datos, la cual consiste en agrupar datos que tienen alguna asociación. Esta nos permite
Correcta tener una visión general de nuestra estructura de datos.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Análisis de Asociaciones.

b. Sumarización de Datos. 

c. Modelos de predicción y clasificación.

Su respuesta es correcta.

La respuesta correcta es: Sumarización de Datos.


Pregunta 16 Es una operación en cubos OLAP mediane el cual se selecciona el más bajo nivel de detalle. Son usados en un contexto
Correcta de dimensiones jerárquicas.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Pivoting.

b. Dice.

c. Slice.

d. Roll-Up.

e. Drill-Down. 

Su respuesta es correcta.

La respuesta correcta es: Drill-Down.

Pregunta 17 Ayudan en la toma de decisiones, desde un punto de vista probabilístico con el fin de tomar la opción más conveniente.
Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Redes neuronales.

b. Arboles de decisión. 

c. Clasificación neuronal.

Su respuesta es correcta.

La respuesta correcta es: Arboles de decisión.

Pregunta 18 No es una Herramienta de Consulta e Informes.


Incorrecta

Puntúa 0.00 Seleccione una:


sobre 1.00
a. Dashboards.

b. Evaluación centralizada.

c. Data Mining.

d. EIS. 

Su respuesta es incorrecta.

La respuesta correcta es: Evaluación centralizada.

Pregunta 19 Es una operación en cubos OLAP mediane el cual se rota la orientación de la data para fines de generación de reportes.
Correcta

Puntúa 1.00 Seleccione una:


sobre 1.00
a. Pivoting. 

b. Drill-Down.

c. Slice.

d. Roll-Up.

e. Dice.

Su respuesta es correcta.

La respuesta correcta es: Pivoting.


Pregunta 20 Es una lista de pasos secuenciales desarrollados por SAS Institute, uno de los mayores productores de software de
Correcta estadísticas e inteligencia de negocios. Orienta la implementación de aplicaciones de minería de datos.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. CRISP-DM.

b. 5 A's.

c. SEMMA. 

Su respuesta es correcta.

La respuesta correcta es: SEMMA.

También podría gustarte