Está en la página 1de 42

Tarea Extraclase de

Bases de Datos 2

Integrantes:
Jesús Enrique Fernández Prieto
Richar Omar Albolay Cadalso
Edvalere Fernando Pedro Tuneca
Grupo: 1402
Sumario
1. Almacenes de Datos
• ¿Qué es un Almacén de Datos?
• ¿Qué elementos componen un DataWareHouse?
• ¿Qué papel juega el almacén de datos en los sistemas de inteligencia
empresarial?
• ¿Qué es un modelo multiimensional?
• ¿Cuál es la diferencia entre el modelo multiimensional y el modelo
relacional?
• ¿Cómo se diseña un modelo de datos multiimensional para resolver
los requisitos de información en
una empresa?
• ¿En qué consiste la técnica de Extracción – Transformación – Carga?
2. Visualización de Datos
¿Qué es la visualización de datos?
• ¿Cómo contribuye la visualización de datos a la toma de decisiones?
• ¿Cuáles son las técnicas de visualización más utiizadas?
• ¿Cómo se pueden vincular las técnicas de visualización a diferentes tios de
datos?
3. Bases de Datos NoSQL
• ¿Qué es una Base de Datos NoSQL?
• Mencione al menos 3 ejemplos de Bases de Datos NoSQL.
• Mencione 3 ejemplos de aplicaciones que usen Bases de Datos NoSQL.
• Enuncie las principales característias de MongoDB.
Almacenes de Datos
Un almacén de datos es una colección de datos
orientada a temas, integrada, no volátil y de tiempo
variante, que brinda soporte a la toma de decisiones.
Elementos que componen una
DataWareHouse
Hecho:
Evento específico que constituye la unidad
fundamental de análisis de datos, para la toma de
decisiones.
Ejemplos: ventas, exportaciones, inversiones
Dimensiones:

Es una entidad de negocios respecto de la cual se deben


calcular las métricas.
Ejemplos: clientes, productos, tiempo. El hecho “Ventas”,
por sí solo, carece de sentido.
Una dimensión puede tener múltiples niveles de agrupación.
Por ejemplo, la dimensión “Ubigeo” puede disgregarse en:
países, departamentos, provincia, distrito.
Medidas:

Valores cuantitativos que almacenan las métricas del


negocio. Están representados por columnas numéricas
en la tabla de hechos.
Papel que juega el almacén de datos en los
sistemas de inteligencia empresarial
Son una caja automatizada que recolecta datos, los organiza
y los procesa para entregarlos de forma organizada.
Analiza los resultados para que cualquier usuario pueda
actuar ante cualquier situación.
Permite realizar análisis sobre el desempeño de la empresa.
Son fundamentales en cuanto a la competitividad de la
industria actual.
Ofrecen mejora continua y crecimiento sostenible.
Propiciar un crecimiento operacional y económico.
Modelo multidimensional
Son sistemas de gestión de bases de datos capaces
de procesar la información a gran velocidad, vienen
marcadas por la forma en la que guardan y procesan la
información ya que al igual que las bases de datos
relacionales, almacenan la información en tablas. Sin
embargo, la diferencia radica en la estructura que
forman estas tablas, ya que en las bases
multidimensionales los datos se ven como cubos de
información.
Diferencia entre el modelo
multidimensional y el modelo
relacional
Una base de datos multidimensional (MDB) es un tipo de
base de datos optimizada para aplicaciones de almacén de
datos y procesamiento analítico en línea (OLAP).
Estas suelen crearse a partir de bases de datos relacionales
existentes.
Mientras que a una base de datos relacional se suele
acceder mediante una consulta en Lenguaje de Consulta
Estructurado (SQL).
Las BD multidimensionales tienen un rendimiento muy
superior al de las bases de datos relacionales.
Diseño de un modelo de datos
multiimensional para resolver los requisitos de
información en un empresas
Técnica de Extracción –
Transformación – Carga
• Canaliza los datos que se usan para recopilar datos de
varios orígenes.
• Transforma los datos según las reglas del negocio y los
carga en un almacén de datos de destino.
• El trabajo de transformación en ETL tiene lugar en un
motor especializado y, a menudo, implica el uso de
tablas de almacenamiento provisional para conservar
los datos temporalmente a medida que estos se
transforman y, finalmente, se cargan en su destino.
• La transformación de datos que tiene lugar a menudo
conlleva varias operaciones como filtrado, ordenación,
agregación, combinación de datos, limpieza de datos,
desduplicación y validación de datos.
• Frecuentemente, las tres fases del proceso ETL se
ejecutan en paralelo para ahorrar tiempo.
Visualización de datos
• La visualización de datos es la representación gráfica
de información y datos. Al utilizar elementos visuales
como cuadros, gráficos y mapas, las herramientas de
visualización de datos proporcionan una manera
accesible de ver y comprender tendencias, valores
atípicos y patrones en los datos.
Contribuciones de la visualización de
datos a la toma de decisiones
 Permite prestarles más atención a los
detalles.
 Provoca una respuesta emocional.
 Se comparte con más facilidad.
 Permite comparaciones sencillas.
 Permite predicciones rápidas.
 Ayuda en la toma de decisiones.
Grupos generales de visualización de datos:

 Temporal: se refiere al tiempo y la investigación


de cambios durante un período específico.
 Jerárquico: representa una relación entre
diferentes puntos de datos.
 De red: se trata de relaciones que se indican
mediante líneas que conectan puntos.
 Geoespacial: describe áreas geográficas e
intenta transmitir una sensación de espacio.
Ejemplos más específicos de métodos para visualizar datos:

 Gráfico de área  Área polar


 Gráfico de barras  Árbol radial
 Nube de burbujas  Diagrama de dispersión (2D
 Gráfico de bala o 3D)
 Cartograma  Gráfico de flujo
 Vista circular  Tablas de texto
 Mapa de distribución de  Escala de tiempo
puntos  Diagrama de árbol
 Gráfico de Gantt  Gráfico circular apilado
 Mapa de calor  Nube de palabras
 Histograma
 Matriz
 Red
Principales tipos de visualización de datos:
Cambios en un determinado período
 Representa cómo cambió un número, en un contexto dado,
en períodos definidos.
 Los gráficos de líneas son el ejemplo más común.
 También se pueden representar como barras e incluso en
forma de árbol.
 Puedes comparar el esfuerzo de diferentes departamentos o
el desempeño de la empresa a comparación de sus
competidores.
Principales tipos de visualización de datos:
Comparación de categorías
Se colocan diferentes fuentes una al lado de la otra para
comprender las relaciones entre ellas.
Es otro tipo común y simple de visualización de datos.
Principales tipos de visualización de datos:
Clasificación (Ranking)
Aquí la posición importa mucho.
Implica comparar tres o más números dentro de un
período fijo.
Podrás entender cómo se relacionan todos estos aspectos
y cuáles tuvieron más éxito.
Los gráficos organizados en barras o columnas son el
camino a seguir.
Principales tipos de visualización de datos:
De una parte, al todo
Podemos comprender fácilmente el peso de diferentes
elementos dentro de una empresa.
Los gráficos pizza son usadas en esta categoría.
Esa es la mejor manera de analizar el presupuesto.
También es un método muy efectivo para encuestas de
edad y otros aspectos.
Principales tipos de visualización de datos:
Correlación
Tiene en cuenta los cambios a lo largo del tiempo.
Muestra cómo dos o más indicadores evolucionan juntos.
Les permite a las personas comprender si uno influye en el
otro y cómo lo hace.
El gráfico de dispersión es sin duda el más utilizado para este
propósito.
Principales tipos de visualización de datos:
Distribución
Tratan más de incidencia y volumen que de rendimiento
directo.
Muestran la frecuencia con la que se produce un conjunto
de valores en un período. Es un poco como parte del todo,
pero se usa principalmente para estadísticas.
Por lo general, verás este tipo de datos mostrados como un
histograma o un gráfico de densidad.
Principales tipos de visualización de datos:
Flujo
Los diagramas de flujo se refieren más al movimiento que al
volumen.
Muestran la evolución de un indicador y también cómo esta
evolución se conecta con otros puntos y períodos.
Los gráficos de redes y acordes también funcionan muy
bien. La clave para este tipo de visualización de datos es la
conexión.
Base de Datos NoSQ
• Las bases de datos NoSQL son sistemas de
almacenamiento de información que no cumplen con
el esquema entidad-relación, es decir que no imponen
una estructura de datos en forma de tablas y
relaciones entre ellas, por lo tanto, estos sistemas son
más flexibles, puesto que suelen permitir almacenar
información en otros formatos
Ejemplos de Bases de datos NoSQL
• Cassanda

• CouchDB

• HBase Apache
Aplicaciones que usan Bases de Datos
NoSQL
• Google

• Adobe

• Twitter
Principales características de MongoDB
• Potente sintaxis de consultas
• Indexación
• Soporte para SQL
• Transacciones
• Base de datos distribuida con gran escalabilidad
vertical y horizontal
• Permite ejecutar consultas pasando directamente
código JavaScript
Respuesta al Ejercicio No1
Diseño del Almacen.

• Hecho: Alquiler
• Medidas: cant_copias, ingresos, prom_copias
• Dimensiones: audiovisuales, municipios, cliente, tiempo
Aplicación de una técnica de
Visualización
Representación de dimensión como documento
de MongoDB
Dimensión audiovisual
Consultas para la búsqueda de información en el
documento representado

db.dim_audiovisuales.find({precio : {$gt : 50}}, {categoría: Serie })

db.dim_audiovisuales.find({precio : {$gt : 25}}, {categoría: Filme })


Bibliografía
htts://eva.uci.cu/mod/folder/view.php?id=17133

htts://eva.uci.cu/mod/folder/view.php?id=16024

htts://eva.uci.cu/mod/resource/view.php?id=17000

htts://eva.uci.cu/mod/resource/view.php?id=17035

htts://www.youtube.com/watch?v=dbFWoLLVChM

También podría gustarte