Está en la página 1de 13

UNIVERSIDAD MARIANO GÁLVEZ

FACULTAD DE INGENIERÍA EN SISTEMAS DE INFORMACIÓN

Definición de temas

CURSO BASE DE DATOS 2

Docente
Dra. Alma Lucrecia Olivet López

9959-18-7960 Sebastian André Moreira Berges

Guatemala 25 de MAYO 2021


Docente
Dra. Alma Lucrecia Olivet López
1 SISTEMAS DISTRIBUIDOS DE BASE DE DATOS

1.1 Definiciones

1.1.1 Almacenamiento distribuido de datos


Es una colección de datos que pertenecen lógicamente a un sólo sistema, pero se encuentra
físicamente esparcido en varios "sitios" de la red. Un sistema de base de datos distribuidos se compone
de un conjunto de sitios, conectados entre sí mediante algún tipo de red de comunicaciones, en el
cual:

1.1.2 Transacciones distribuidas


Son transacciones realizadas dentro de una base de datos distribuida. Una base de datos distribuida
consiste en varias bases de datos situadas en diferentes espacios físicos o lógicos, conectadas entre si
por un sistema de comunicaciones.

1.1.2.1 Control de transacciones en la base de dato distribuida

1.1.3 Ventajas
- Permiten trabajar a cada nodo de la red con autonomía local
- Aumentan la disponibilidad, confiabilidad y eficiencia en el acceso a la información
- Se pueden expandir de forma indefinida en función de las necesidades de la empresa u
organización.
- Permiten la escalabilidad sin necesidad de grandes inversiones
- Los recursos se comparten entre nodos, de manera que se puede acceder a toda la información
desde cualquier sitio.

1.1.4 Desventajas
- Resulta más difícil establecer mecanismos para controlar el acceso a los datos y garantizar la
seguridad
- Los errores en la red pueden tener graves consecuencias para la privacidad de la información
- Es un sistema más complejo de implementar
- Conseguir una transparencia óptima puede suponer un importante gasto de tiempo y dinero
- Falta de experiencia y ausencia de estándares en el desarrollo e implementación de estas bases
de datos.

1.2 Diseño de sistemas distribuidos

El diseño de sistemas distribuidos se refiere a como estarán estructurados los sistemas distribuidos en
cualquier base de datos.
1.3 La distribución de los datos

La distribución de la información en estas bases de datos se realiza por medio de transacciones


distribuidas

1.3.1 Centralizada
En este caso la base de datos se encuentra centralizada en un lugar concreto físico y lógico, mientras
que el resto de clientes están distribuidos. Se basa en el clásico modelo servidor/cliente.

1.3.2 Distribuida
En este caso la información está repartida por los diferentes nodos de la base de datos. Solo existe una
copia de cada nodo, pero la información se encuentra dividida en fragmentos disjuntos, cada uno
alojado en un sitio o nodo de la base. Al no necesitar realizar copias exactas de toda la información, los
costos de almacenamiento son menores. A cambio, se obtiene menor disponibilidad y fiabilidad de los
datos

1.3.3 Replicación
El esquema de base de datos distribuida replicada se basa en que cada nodo debe tener una réplica
completa de la base de datos. Se trata de un método que supone altos costes para el mantenimiento de
la información, ya que cada cambio en una copia debe ser realizada también en todas las demás.

1.4 Esquema distribuido

1.5 Componentes de un sistema gestor distribuido

- Procesador de datos locales: Se encarga de la gestión local de datos de forma muy semejante a
como lo hace un SGBD.
- Directorio global: Es análogo al DD del BD centralizadas. Registra donde y como se guardan los
datos.
- Procesador de aplicaciones distribuidas: Se encarga de gestionar las funciones distribuidas.
- Software de comunicaciones: Provee al procesador de aplicaciones distribuidas de los servicios
de comunicaciones necesarios para realizar su tarea.

1.6 Los pasos a seguir para diseñar una base de datos distribuida

El proceso de diseño consta de los siguientes pasos:

 Determinar el propósito de la base de datos

Esto le ayudará a prepararse para los pasos restantes.

 Buscar y organizar la información necesaria


Recopile todos los tipos de información que podría querer registrar en la base de datos, como los
nombres de producto y los números de pedido.

 Dividir la información en tablas

Divida los elementos de información en entidades principales o temas, como Productos o Clientes.
Después, cada tema se convierte en una tabla.

 Convertir los elementos de información en columnas

Decida qué información quiere almacenar en cada tabla. Cada elemento se convierte en un campo y se
muestra como una columna en la tabla. Por ejemplo, una tabla de empleados podría incluir campos
como Apellidos y Fecha de contratación.

 Especificar las claves principales

Elija la clave principal de cada tabla. La clave principal es una columna que se usa para identificar cada
fila. Un ejemplo podría ser Id. de producto o Id. de pedido.

 Establecer las relaciones de tablas

Busque en cada tabla y decida cómo se relacionan los datos en una tabla con los datos de otras tablas.
Agregue campos a las tablas o cree tablas para aclarar las relaciones, según sea necesario.

 Perfeccionar el diseño

Analice el diseño en busca de errores. Cree las tablas y agregue unos cuantos registros de datos de
ejemplo. Compruebe si puede obtener los resultados que quiere de las tablas. Haga algunos ajustes en
el diseño, si es necesario.

 Aplicar las reglas de normalización

Aplique las reglas de normalización de datos para ver si las tablas están estructuradas correctamente.
Haga algunos ajustes en las tablas, si es necesario.
1.7 Esquema de y distribución de datos

1.8 Tipos de fragmentación

Una herramienta de análisis que dibuja pares relacionados de variables para presentar un patrón
de relación o de correlación. Cada conjunto de datos representa un factor diferente que puede ser
cuantificado. Un conjunto de datos es dibujado en un eje horizontal (eje x) y el otro conjunto de
datos se dibuja en el eje vertical (eje y). El resultado es un número de puntos que pueden ser
analizados para determinar si existe una relación significativa (también conocida como
“correlación”) entre los dos conjuntos de datos.
2 ANÁLISIS MULTIDIMENSIONAL Y DATAWAREHOUSE
El Análisis Multidimensional (OLAP) representa una forma intuitiva y lógica de analizar la información
empresarial. Los datos se organizan en dimensiones, es decir, variables que permiten la medición
jerarquizada y que forman el cubo multidimensional.

La información histórica que el Data Warehouse contiene permite analizar tendencias y efectuar
predicciones con la ayuda de herramientas de inteligencia empresarial. El Data Warehouse asegura que
toda la organización utilice los mismos datos y éstos se transformen en valiosa información con la que
adoptar decisiones.

2.1 Bases de datos OLAP, ROLAP y MOLAP

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es


una solución utilizada en el campo de la llamada Inteligencia de negocios (o Business Intelligence) cuyo
objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras de datos
diversas, normalmente multidimensionales (o Cubos OLAP), que contienen datos resumidos de
grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas,
marketing, informes de dirección, minería de datos y áreas similares.

ROLAP significa Procesamiento Analítico OnLine Relacional, es decir, se trata de sistemas y


herramientas OLAP (Procesamiento Analítico OnLine) construidos sobre una base de datos relacional. Es
una alternativa a la tecnología MOLAP (Multidimensional OLAP) que se construye sobre bases de datos
multidimensionales. Ambos tipos de herramientas, tanto ROLAP como MOLAP, están diseñadas para
realizar análisis de datos a través del uso de modelos de datos multidimensionales, aunque en el caso
de ROLAP estos modelos no se implementan sobre un sistema multidimensional, sino sobre un sistema
relacional clásico
2.2 El esquema estrella y el esquema snowfake

En las bases de datos usadas para data warehousing, un esquema en estrella es un modelo de
datos que tiene una tabla de hechos (o tabla fact) que contiene los datos para el análisis, rodeada
de las tablas de dimensiones. Este aspecto, de tabla de hechos (o central) más grande rodeada de
radios o tablas más pequeñas es lo que asemeja a una estrella, dándole nombre a este tipo de
construcciones.

En las bases de datos utilizadas en (data warehousing), un esquema en copo de nieve es una
estructura algo más compleja que el esquema en estrella. Se da cuando alguna de las dimensiones
se implementa con más de una tabla de datos.

2.3 Jerarquías y resúmenes

Una base de datos jerárquica es un tipo de sistema de gestión de bases de datos que, como su
nombre indica, almacena la información en una estructura jerárquica que enlaza los registros en
forma de estructura de árbol (similar a un árbol visto al revés), en donde un nodo padre de
información puede tener varios nodos hijo, y así sucesivamente.

2.4 Datawarehouse y Datamart

2.4.1 Definición de Datawarehouse


Un data warehouse es un repositorio unificado para todos los datos que recogen los diversos
sistemas de una empresa. El repositorio puede ser físico o lógico y hace hincapié en la captura de
datos de diversas fuentes sobre todo para fines analíticos y de acceso.

Normalmente, un data warehouse se aloja en un servidor corporativo o cada vez más, en la nube.
Los datos de diferentes aplicaciones de procesamiento de transacciones Online (OLTP) y otras
fuentes se extraen selectivamente para su uso por aplicaciones analíticas y de consultas por
usuarios

2.4.2 Definición de Datamart


Un data mart es una versión específica de almacén de datos (data warehouse) centrados en un tema o
un área de negocio dentro de una organización.

2.5 Inteligencia del negocio (Bussiness Inteligence)

Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento,
de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.

2.6 Data mining

El Data Mining es un conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos,
de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos que
expliquen el comportamiento de estos datos.

2.7 Data Science

Data Science es un campo interdisciplinario que utiliza conceptos de estadística, matemática y


programación, en conjunto con herramientas tecnológicas, para extraer información de los
datos para tomar mejores decisiones.

2.8 Data Analisis

El análisis de datos es un proceso que consiste en inspeccionar, limpiar y transformar datos con el
objetivo de resaltar información útil, para sugerir conclusiones y apoyo en la toma de decisiones. El
análisis de datos tiene múltiples facetas y enfoques, que abarca diversas técnicas en una variedad de
nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales. Los datos se
coleccionan y analizan para indagar en cuestiones, probar conjeturas o refutar teorías.
3 BASES DE DATOS ORIENTADAS A OBJETOS

3.1 Basada en Objetos, orientado a objetos y objetos relacionales

En una base de datos orientada a objetos, la información se representa mediante objetos como los
presentes en la programación orientada a objetos. Cuando se integra las características de una base de
datos con las de un lenguaje de programación orientado a objetos, el resultado es un sistema gestor de
base de datos orientada a objetos (ODBMS, Object Database Management System). Un ODBMS hace
que los objetos de la base de datos aparezcan como objetos de un lenguaje de programación en uno o
más lenguajes de programación a los que dé soporte. Un ODBMS extiende los lenguajes con
datos persistentes de forma transparente, control de concurrencia, recuperación de datos, consultas
asociativas y otras capacidades

3.2 Estructura de Objetos y jerarquías

El paradigma orientado a objetos se basa en el encapsulamiento de datos y del código relacionado con
cada objeto en una sola unidad. Conceptualmente, todas las interacciones entre cada objeto y el resto
del sistema se realizan mediante mensajes. Por lo tanto, la interfaz entre cada objeto y el resto del
sistema se define mediante un conjunto de mensajes permitidos.

En general, cada objeto esta asociado con:

• Un conjunto de variables que contiene los datos del objeto; las variables corresponden con los
atributos del modelo E-R.

• Un conjunto de mensajes a los que responde; cada mensaje puede o no tener parámetros o tener
uno o varios.

• Un conjunto de métodos, cada uno de los cuales es el código que implementa un mensaje; el
método devuelve un valor como respuesta al mensaje

3.3 SQL de objetos y SQL ANSI 2003

Microsoft SQL Server incluye objetos y contadores que el Monitor de sistema puede utilizar para
supervisar la actividad de los equipos en los que se ejecute una instancia de SQL Server. Un objeto es
cualquier recurso de SQL Server , como un bloqueo de SQL Server o un proceso de Windows. Cada
objeto contiene uno o más contadores que determinan diversos aspectos de los objetos que se van a
supervisar. Por ejemplo, el objeto Bloqueos de SQL Server contiene los contadores Número de
interbloqueos/seg. y Tiempos de espera de bloqueos/seg.

3.4 Referencia objetos y llaves primarias

Para hacer referencia a objetos en otras bases de datos en el sistema IBM Netezza, debe utilizar la
denominación de tres niveles en el formato
nombre_base_datos.nombre_esquema.nombre_objeto.

nombre_base_datos
El nombre de la base de datos donde se define el objeto.

nombre_esquema

El esquema de la base de datos donde se define el objeto. En releases


de Netezza anteriores, Netezza daba soporte a un esquema por base de datos, que coincidía con el
nombre del propietario de base de datos. Empezando en el release 7.0.3, el sistema da soporte a
un esquema de forma predeterminada, pero se puede configurar para dar soporte a varios
esquemas de una base de datos. Para obtener más información, consulte Soporte de esquema.

nombre_objeto

El nombre de la tabla, vista, sinónimo u otro objeto.

3.5 Campos Múltiples y Arrays

En BigQuery, un array es una lista ordenada que consta de cero o más valores del mismo tipo de datos.
Puedes construir arreglos de tipos de datos simples, como INT64 y tipos de datos complejos, como
STRUCT. La excepción actual a esto es el tipo de datos ARRAY: no se admiten arreglos de arreglos. Los
arrays pueden incluir valores NULL.

Con BigQuery, puedes construir literales de array, compilar arrays a partir de subconsultas mediante la
función ARRAY y agregar los valores a un array con la función ARRAY_AGG.

3.6 Tablas anidadas y jerarquías

El modelo de base de datos objeto-relacional integra los conceptos de la tradicional base de datos
relacional y los conceptos de paradigma de objetos que se utiliza en la programación orientada a
objetos (POO).

El objetivo de este concepto es poder aplicar la tecnología madura de bases de datos relacionales
sobre la organización de los datos complejos es decir datos de texto e imagen, mapas, datos en el
rango de audio etc. Las bases de datos Objeto-relacional son compatibles con estos objetos de
datos y las operaciones de mayor complejidad.

En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre los datos
como parte de la definición de la base de datos. Una operación (llamada función) se especifica en
dos partes. La interfaz (o signatura) de una operación incluye el nombre de la operación y los tipos
de datos de sus argumentos (o parámetros). La implementación (o método) de la operación se
especifica separadamente y puede modificarse sin afectar la interfaz. Los programas de aplicación
de los usuarios pueden operar sobre los datos invocando a dichas operaciones a través de sus
nombres y argumentos, sea cual sea la forma en la que se han implementado. Esto podría
denominarse independencia entre programas y operaciones.
4 BIBLIOGRAFIA
https://ayudaleyprotecciondatos.es/bases-de-datos/distribuida/

https://www.cs.upc.edu/~gomariz/index_archivos/IntroduccionSD-EnricMartinez.pdf

https://medium.com/@edusalguero/sistemas-distribuidos-caracterizacion-modelado-comunicacion-
tiempo-2c1f85f4e67a

https://openwebinars.net/blog/que-es-un-sistema-distribuido/

https://es.wikipedia.org/wiki/ROLAP

https://es.wikipedia.org/wiki/Esquema_en_estrella

https://es.wikipedia.org/wiki/Esquema_en_copo_de_nieve

https://es.wikipedia.org/wiki/Base_de_datos_jerárquica

https://www.powerdata.es/data-
warehouse#:~:text=Inmon%2C%20el%20cual%20es%20conocido,proceso%20de%20toma%20de%20dec
isiones.

https://es.wikipedia.org/wiki/Data_mart#:~:text=Un%20data%20mart%20es%20una,negocio%20dentro
%20de%20una%20organización.

https://www.sinnexus.com/business_intelligence/

https://www.iebschool.com/blog/data-mining-mineria-datos-big-
data/#:~:text=El%20Data%20Mining%20es%20un,el%20comportamiento%20de%20estos%20datos.

https://www.galileo.edu/trends-innovation/que-es-data-science/

https://es.wikipedia.org/wiki/Análisis_de_datos

https://es.wikipedia.org/wiki/Base_de_datos_orientada_a_objetos

https://modelosbd2012t1.wordpress.com/2012/01/27/bases-de-datos-orientados-a-
objetos/#:~:text=Estructura%20de%20una%20BD%20OO,sistema%20se%20realizan%20mediante%20m
ensajes.

https://www.ibm.com/docs/es/psfa/7.1.0?topic=databases-reference-database-objects

https://cloud.google.com/bigquery/docs/reference/standard-sql/arrays?hl=es-419#finding_lengths

https://sites.google.com/a/espe.edu.ec/bases-de-datos-ii/introduccion/bdd-objeto-relacional

También podría gustarte