Está en la página 1de 3

TALLER ETL

Valentina Solano Gutierrez

1. Cuadro comparativo entre k-means y árbol de decisiones.

K-MEANS ARBOL DE DECISIONES

Proceso que intenta descubrir patrones en una de las herramientas más útiles y utilizadas
grandes volúmenes de conjuntos de datos. para la toma de decisiones adecuadas teniendo
varias alternativas posibles de acción.
Asigna cada punto al conjunto más próximo y es una buena ayuda para elegir entre varios
recalcula los centroides, repitiendo este cursos de acción.
proceso hasta que no se producen cambios en
las asignaciones.
Utiliza los métodos de la inteligencia proviene de la forma que adopta el modelo,
artificial, aprendizaje automático, estadística semejante a un árbol. Esta formado por
y sistemas de bases de datos. múltiples nodos cuadrados, que representan los
puntos de decisión, y de los cuales surgen
ramas que representan las distintas
alternativas.
Consiste en extraer información de un Es una forma gráfica y analítica de representar
conjunto de datos y transformarla en una todos los sucesos posibles a partir de una
estructura comprensible para su uso posterior decisión asumida
Busca patrones en los datos sin tener una Ayuda a tomar la decisión más acertada, desde
predicción específica como objetivo (no hay el punto de vista probabilístico, ante todas las
variable dependiente). posibles soluciones.

Es un método utilizado en minería de datos. Permite visualizar todas las posibles soluciones
a un problema
es buena idea usar el menor número atributos Provee de un esquema para cuantificar el costo
posible debido a los que se conoce como la del resultado y su probabilidad de uso.
maldición de la dimensionalidad. En esencia se
refiere a que a medida que el número de
dimensiones (atributos) aumenta, la distancia
discrimina cada vez menos.
2) Describa y explique con sus palabras porque cree que es importante la
utilización de los algoritmos en proceso ETL.

RTA:// Los algoritmos en ETL juegan un papel importante en la integración de


datos inteligentes porque ayudan a las decisiones de inteligencia empresarial
posteriores. También es responsable de limpiar los datos durante el proceso de
extracción que carga los datos en el almacén de datos.

En cualquier operación comercial, los datos juegan un papel importante. Para


ser valiosos, deben transferirse y estar listos para usarse, lo que requiere un
proceso ETL

3) Defina que es una bodega de datos 

RTA:// Es un conjunto de datos integrados u orientados por temas, que cambia


con el tiempo y no es temporal, apoyan el proceso de toma de decisiones del
departamento administrativo y están diseñados para manejar grandes
cantidades de datos de diversa índole de diversas fuentes u otras fuentes.
Estos datos cubren un largo período de tiempo, lo que significa que los datos
de origen tienen diferentes escenarios. El enfoque de esta información radica
en su análisis para apoyar la toma de decisiones informada y oportuna.
Analizar, seleccionar y transferir datos seleccionados de la fuente.
4)

También podría gustarte