Está en la página 1de 2

CORPORACIÓN UNIVERSITARIA MINUTO DE DIOS

BASES DE DATOS MASIVAS


II PARCIAL - ISUM

NOMBRE: Andres Felipe Aya Roa ID: 665693 FECHA:


29/10/2020 NOTA:

1. COMPONENTE TEORICO (5.0)

Responda cada una de las siguientes preguntas con una respuesta sólida y argumentada:

a) ¿Qué es Data Warehouse?

Es un almacén usado generalmente por empresas y organizaciones en el cual se


guarda una gran cantidad de datos e información, donde se almacén todo tipo de
información de estas mismas; de bases de datos externas, la función de esta es el
almacenamiento para después la recopilación y manipulación que se le pueden
ejercer a esos ciertos datos.

b) Mencione los elementos clave de un Data Warehouse.

La información registrada en la data no puede ser modificada, solo se le pueden


realizar acciones como de lectura o consulta.

Todos estos tipos de datos almacenados corresponden a cierto periodo de tiempo.

No solo por periodo de tiempo, sino también por temática se encuentran por
decirlo así filtrada la información, separada es un mejor termino para describir
como se encuentra la información y los datos.

c) ¿Cuál es el proceso de diseño de un DataWarehouse?

d) ¿A que hacen referencia las tablas Dimensión y la tabla de hecho?.

Estas dos tablas hacen referencia a un modelo llamado dimensional el cual tiene
como función facilitar la compresión de la base de datos, de acá nacen las tablas
dimensión y de hecho.

Tabla de hechos
Esta es la tabla central del modelo dimensional y esta tabla posee campos claves
del modelado, y tiene como función evitar la redundancia de atributos;
normalmente son los valores cuantitativos.
CORPORACIÓN UNIVERSITARIA MINUTO DE DIOS
BASES DE DATOS MASIVAS
II PARCIAL - ISUM
Tabla de dimensiones
Estas son las tablas simples, sin ningún tipo de parametrización en su creación, se
relación con la tabla de hechos a través de un valor clave, en esta tabla sus
atributos ofrecen información relaciona junto a la table hechos y no posee un
limite de este tipo de tablas.

e) ¿Qué es el Data Mining?


f) ¿Qué es KDD?.

Es un proceso secuencial el cual se encarga de encontrar conocimiento en un


conjunto de datos en bruto o mejor dicho encontrar patrones validos y novedosos
todo esto para una buena toma de decisiones en el área enfocada.

g) ¿Cuáles son los pasos en la secuencia del algoritmo KDD?


h) ¿Qué es el clustering?.

Este es un método del data mining ya explicado el cual se encarga de la agrupación


de datos, los agrupo dependiendo la similitud entre ellos; su función principal
consiste en la identificación de grupos o los mismos clústeres los cuales depende
de la similitud tanto alta como intermedia y todo esto se representa atreves de un
dendograma el cual expresa las relaciones de similitud.

i) ¿Para que se utiliza la clustering?


j) Describa las técnicas de clustering observadas en clase.
Una de las técnicas que hemos visto en clase es del clustering jerárquico el cual es
representado atraves de un dendograma o árbol, los cuales muestran las
similitudes entre los distintos elementos, el cual esta técnica tiene dos tipos; el
Aglomerativo y el de división.

Nota1: Toda respuesta será analizada, si alguna respuesta corresponde a


información copiada de internet, se invalidara dicha respuesta.
Nota2: Recuerde subir el parcial al aula virtual.

Éxitos.

También podría gustarte