Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DISEÑO DE UN DATAWAREHOUSE
2. Granularidad
Nivel de detalle que se tomará para analizar la información
Depende de los requerimientos del negocio y de los datos con
los que se cuentan
Ejemplo: Producto x mercado x tiempo
Modelo Dimensional (Cont.)
3. Dimensiones
Son las perspectivas de análisis de las variables, son catálogos de
información necesarios para la presentación de los datos a los
usuarios
Ejemplo: tiempo, mercado, producto, cliente
4. Métricas
En este paso se tienen que identificar las medidas que surgen en el
proceso de negocio
Viene siendo qué es lo que se va a analizar
Se colocan en una tabla llamada tabla de hechos
Ejemplo: Ventas totales, Cantidad vendida
Con estos pasos del Ciclo de Vida Dimensional
del Negocio se tiene casi listo el DW, el
siguiente paso es construir las dimensiones y
la tabla de hechos ya especificadas
anteriormente, y por último hacer la limpieza
de la información - ETL.
Elementos de una tabla de dimensiones
• Clave subrogada
Es la clave principal de la tabla de dimensiones
Nos permite identificar de forma única cada fila, suele ser un
entero auto incremental
Es totalmente transparente al usuario de negocio, no la usará en
ningún momento, ni tan siquiera tendrá conocimiento de su
existencia
• Clave de negocio
Es la clave con la que trabaja habitualmente el usuario, pero no
puede ser la clave principal porque se pueden producir
duplicidades
Elementos de una tabla de dimensiones
(Cont.)
• Atributos de la dimensión
Serán cada una de las características que necesitemos almacenar
Lo habitual es que haya varias decenas de ellos, incluso que en
algunos casos superen el centenar
Estrategia Estrategia
Bottom- Top-
up down
Estrategia Bottom-up
• Construcción de un Data Warehouse desde la información
contenida en los sistemas transaccionales
Desventajas:
Aumenta la complejidad en la obtención de información
necesaria para la carga de datos, especialmente cuando las
fuentes no se encuentran automatizadas o están fuera de la
organización
Desnormalización del DW
• El desafío de integrar datos de sistemas operacionales a
través de las aplicaciones y los límites del sistema es una
necesidad primordial
IMPLEMENTACIÓN DE UN DATAWAREHOUSE
Pregunta 1 Característica de un Data Warehouse donde la información, una vez introducida, debe ser de sólo lectura, nunca se
Correcta modifica ni se elimina, y ha de ser permanente y mantenerse para futuras consultas.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Contienen metadatos.
b. Integrado.
c. No volátil.
Su respuesta es correcta.
Pregunta 2 Buscar independencia entre los conocimientos técnicos de los usuarios es una característica de la Inteligencia de Negocio.
Correcta Indique cuál es dicha característica.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Apoyo en la toma de decisiones.
b. Accesibilidad a la información.
Su respuesta es correcta.
Pregunta 3 Buscar la manera en que los usuarios tengan acceso a herramientas de análisis es una característica de la Inteligencia de
Correcta Negocio. Indique cuál es dicha característica.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Apoyo en la toma de decisiones.
c. Accesibilidad a la información.
Su respuesta es correcta.
https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 1/6
26/11/2020 Examen Primer Parcial: Revisión del intento
Pregunta 4 Garantizar el acceso de los usuarios a los datos de manera independiente es una característica de la Inteligencia de
Correcta Negocio. Indique cuál es dicha característica.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Orientación a los usuarios finales.
c. Accesibilidad a la información.
Su respuesta es correcta.
Pregunta 5 Característica de los datos de un Data Warehouse donde todos los datos relativos a un mismo elemento de la vida real
Correcta quedan unidos entre sí.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Orientado a temas.
b. Histórico.
c. Integrado.
Su respuesta es correcta.
Pregunta 6 Están diseñados para gestionar un gran número de peticiones concurrentes sobre sus bases de datos, y que los usuarios
Correcta puedan insertar, modificar, borrar y consultar dichos datos.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. OLAP.
b. ODS.
c. OLTP.
Su respuesta es correcta.
Pregunta 7 Habitualmente utilizan sistemas de bases de datos relacionales para gestionar los datos, y suelen estar altamente
Correcta normalizados.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. ODS.
b. OLAP.
c. OLTP.
Su respuesta es correcta.
https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 2/6
26/11/2020 Examen Primer Parcial: Revisión del intento
Pregunta 8 Característica de los datos de un Data Warehouse donde la información se estructura en diversos niveles de detalle para
Correcta adecuarse a las necesidades de consulta de los usuarios.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Integrado.
b. Histórico.
c. Orientado a temas.
Su respuesta es correcta.
Pregunta 9 En la arquitectura de una aplicación de Data Mart corresponde a las consultas, procesos y funciones de formateo.
Correcta
b. Capa de datos.
c. Capa de presentación.
Su respuesta es correcta.
b. Data Mart.
c. Inteligencia de Negocios.
d. Data Mining.
Su respuesta es correcta.
Pregunta 11 Es un vector multidimensional, de N dimensiones, la información se almacena en cada una de estas dimensiones, de
Correcta forma ordenada y jerarquizada, lo que permite realizar un rápido análisis de su contenido.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. OLAP.
b. Cubo OLAP.
c. Métricas.
d. Dimensión.
Su respuesta es correcta.
https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 3/6
26/11/2020 Examen Primer Parcial: Revisión del intento
Pregunta 12 Involucrar a los usuarios finales durante la etapa de definición es un criterio de la determinación de los requerimientos de
Correcta la información.
Puntúa 1.00
sobre 1.00 Elija una;
Verdadero
Falso
Pregunta 13 Es un criterio tecnológico que indica que todos los factores que puedan provocar un aumento en la carga de proceso del
Correcta sistema deben ser considerados a la hora de determinar la plataforma tecnológica adecuada.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Gestión.
b. Escalabilidad.
c. Rendimiento.
Su respuesta es correcta.
La respuesta correcta es: Escalabilidad.
Pregunta 14 Vistas de varios Data Marts físicos o el Data Warehouse corporativo ajustado para satisfacer los requerimientos de grupos
Correcta específicos de usuarios.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Vistas Materializadas.
c. Data Mining.
Su respuesta es correcta.
Pregunta 15 Base de datos corporativa en la que se integra información depurada de las diversas fuentes que hay en la organización.
Correcta
b. Inteligencia de Negocios.
c. Data Warehouse.
d. Data Mart.
Su respuesta es correcta.
https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 4/6
26/11/2020 Examen Primer Parcial: Revisión del intento
Pregunta 16 Característica de los datos de un Data Warehouse donde los datos deben quedar reflejados de forma que al ser
Correcta consultados reflejen estos cambios y no se altere la realidad que había en el momento en que se almacenaron.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Orientado a temas.
b. Histórico.
c. Integrado.
Su respuesta es correcta.
b. Medidas.
c. Cubo OLAP.
Su respuesta es correcta.
Pregunta 18 Es un criterio tecnológico en el cual debemos preguntarnos con qué frecuencia se efectuarán las cargas y
Correcta transformaciones sobre los datos?
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Gestión.
b. Rendimiento.
c. Escalabilidad.
Su respuesta es correcta.
b. Medidas.
c. Cubo OLAP.
Su respuesta es correcta.
https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 5/6
26/11/2020 Examen Primer Parcial: Revisión del intento
c. Reducción de costos.
Su respuesta es correcta.
La respuesta correcta es: Aumento en tiempos para las distintas actividades del negocio.
https://eva.unapec.edu.do/moodle/mod/quiz/review.php?attempt=490552&cmid=389374 6/6
Comenzado en Tuesday, 3 de November de 2020, 20:08
Estado Terminados
Finalizado en Tuesday, 3 de November de 2020, 20:23
Tiempo 15 mins
empleado
Calificación 19.00 de un total de 20.00 (95%)
Pregunta 1 Es una operación de Minería de Datos, la cual consiste en detectar cuáles registros poseen características discordantes o
Correcta diferentes a las que poseen generalmente un registro de su naturaleza.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Detección de desviaciones.
c. Análisis de Asociaciones.
Su respuesta es correcta.
Pregunta 2 Como parte de los pasos del proceso de la Minería de Datos, al momento de seleccionar los datos, estas variables pueden
Correcta realizar los cálculos que necesito para poder llegar a las conclusiones necesarias.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Variables independientes.
b. Variables dependientes.
c. Variables objetivos.
Su respuesta es correcta.
Comprensión de lo datos. 2
Evaluación. 5
Implantación. 6
Su respuesta es correcta.
La respuesta correcta es: Comprensión del negocio. → 1, Modelado. → 4, Comprensión de lo datos. → 2, Evaluación. → 5,
Implantación. → 6, Preparación de los datos. → 3
Pregunta 4 Es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o
Correcta semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento
Puntúa 1.00 de los datos en un determinado contexto.
sobre 1.00
Seleccione una:
a. Data Wharehouse.
b. Minería de Datos.
c. Inteligencia de Negocios.
d. Datamarts.
Su respuesta es correcta.
Pregunta 5 En este tipo de almacenamiento OLAP se mantienen volúmenes de información más grandes en la base de datos
Correcta relacional y las agregaciones en bases de datos multidimensionales separada.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. MOLAP.
b. HOLAP.
c. ROLAP.
d. DOLAP.
Su respuesta es correcta.
Pregunta 6 Estos métodos se caracterizan por tener sus fundamentos en el procesamiento simplificado de la información por parte
Correcta del cerebro; estos a través de una arquitectura de nodos y conexiones permiten que los datos se propaguen entre una
Puntúa 1.00 capa de nodos de entrada hacia una capa de salida.
sobre 1.00
Seleccione una:
a. Métodos Simbólicos.
b. Predicción de valores.
c. Métodos Neuronales.
Su respuesta es correcta.
Pregunta 7 Es un conjunto de elementos de procesamiento de la información altamente interconectados, capaces de aprender con la
Correcta información que se les alimenta.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Clasificación neuronal.
b. Arboles de decisión.
c. Redes neuronales.
Su respuesta es correcta.
b. Consultas Empaquetadas.
c. Consultas Distribuidas.
Su respuesta es correcta.
Pregunta 9 Es conocido como el modelo estándar de la industria. Se trata de un modelo de proceso de minería de datos que
Correcta describe los enfoques comunes que utilizan los expertos en minería de datos.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. 5 A's.
b. SEMMA.
c. CRISP-DM.
Su respuesta es correcta.
Pregunta 10 En este tipo de almacenamiento OLAP se realiza un resumen de la información, se hacen cálculos por adelantado y se
Correcta usan técnicas de compresión.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. ROLAP.
b. DOLAP.
c. HOLAP.
d. MOLAP.
Su respuesta es correcta.
Pregunta 11 Desarrolla, interpreta y evalúa el modelo de minería de datos a la luz de los objetivos de negocio y criterios de éxito del
Correcta negocio.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. El ingeniero de minería de datos.
e. El analista de TI.
Su respuesta es correcta.
b. Clasificación neuronal.
c. Redes neuronales.
Su respuesta es correcta.
Pregunta 13 Se emplean para dividir una BD en subconjuntos, donde los miembros de cada uno de ellos comparten características
Correcta similares.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Segmentación.
b. Patrones secuenciales.
c. Descubrimiento de asociaciones.
Su respuesta es correcta.
Pregunta 14 Es una operación de Minería de Datos, la cual consiste en utilizar los datos que la empresa posee como histórico con el
Correcta fin de analizarlos para generar de manera automática un modelo que permita augurar el comportamiento futuro.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Modelos de predicción y clasificación.
b. Análisis de Asociaciones.
c. Sumarización de Datos.
Su respuesta es correcta.
Pregunta 15 Es una operación de Minería de Datos, la cual consiste en agrupar datos que tienen alguna asociación. Esta nos permite
Correcta tener una visión general de nuestra estructura de datos.
Puntúa 1.00
sobre 1.00 Seleccione una:
a. Análisis de Asociaciones.
b. Sumarización de Datos.
Su respuesta es correcta.
b. Dice.
c. Slice.
d. Roll-Up.
e. Drill-Down.
Su respuesta es correcta.
Pregunta 17 Ayudan en la toma de decisiones, desde un punto de vista probabilístico con el fin de tomar la opción más conveniente.
Correcta
b. Arboles de decisión.
c. Clasificación neuronal.
Su respuesta es correcta.
b. Evaluación centralizada.
c. Data Mining.
d. EIS.
Su respuesta es incorrecta.
Pregunta 19 Es una operación en cubos OLAP mediane el cual se rota la orientación de la data para fines de generación de reportes.
Correcta
b. Drill-Down.
c. Slice.
d. Roll-Up.
e. Dice.
Su respuesta es correcta.
b. 5 A's.
c. SEMMA.
Su respuesta es correcta.