Está en la página 1de 16

UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO

ESCUELA PROFESIONAL DE ING. INFORMÁTICA Y DE SISTEMAS

ASIGNATURA:
FUNDAMENTOS Y DISEÑO DE BASES DE DATOS

EVOLUCIÓN DE LAS BASES DE DATOS

APELLIDOS Y NOMBRES: Espinoza Champi Israel Enrique

1. LINEA DE EVOLUCION: RENDIMIENTO

1. B.D. PARALELAS
De forma general el concepto de paralelismo en las bases de datos lo podríamos
definir como la partición de la base de datos (normalmente a nivel de relaciones)
para poder procesar de forma paralela en distintos discos y con distintos
procesadores una sola operación sobre la base de datos.

El paralelismo se usa para mejorar la velocidad en la ejecución de consultas.


Además el paralelismo se usa para proporcionar dimensionabilidad ya que la
creciente carga de trabajo se trata sin incrementar el tiempo de respuesta pero
incrementando el grado de paralelismo.

El objetivo del paralelismo en los sistemas de bases de datos suele ser asegurar
que la ejecución del sistema continuará realizándose a una velocidad aceptable,
incluso en el caso de que aumente el tamaño de la base de datos o el número
de transacciones (ampliabilidad).

Modelos de arquitectura:

• Memoria compartida: Todos los procesadores comparten una


memoria común.
• Disco compartido: Todos los procesadores comparten un disco
común.
• Sin compartimiento: Los procesadores no comparten ni memoria ni
disco.
• Jerárquico: Es un híbrido de las anteriores.

Referencias: https://modelosbd2012t1.wordpress.com/2012/03/24/base-de-
datos-paralelas/
https://ingenierosinformatica9.wordpress.com/2011/06/13/base-de-datos-
paralelas/

2. B.D. EN TIEMPO REAL


La base de datos en tiempo real en verdad es simplemente un objeto JSON de
gran magnitud que puedes administrar en tiempo real. Esto significa que solo es
un árbol de valores.

Esto permite modelar datos de manera simple y flexible. La base de datos no


tiene esquema. Esto significa que no debes adoptar una estructura fija desde el
comienzo. Sin embargo, si te preocupa la validación de datos, la base de datos
en tiempo real incorpora un lenguaje de reglas impuestas por servidor que te
permite validar la estructura de datos de cada acción de escritura en la base de
datos.

Propiedades:
• Atomicidad: Una transacción se ejecuta por completo o no se ejecuta.
Confirma todas sus operaciones satisfactoriamente (commit) o deshace
sus operaciones si no pudo completarse (rollback).
• Consistencia: Una transacción que altera datos garantiza que la BD pasa
de un estado consistente a otro, cumpliendo las reglas de integridad.
• Aislamiento: Las actualizaciones parciales de los datos no son visibles
por otras transacciones hasta que la transacción se confirme.
• Durabilidad: Una vez que una transacción se ha confirmado el resultado
debe persistir en la BD aunque se produzcan fallas posteriores.

Referencias:
https://developers-latam.googleblog.com/2017/05/conoces-la-base-de-datos-
en-tiempo-real.html
https://www.researchgate.net/publication/260592743_Transitando_Hacia_las_B
ases_de_Datos_de_Tiempo_Real

3. B.D. EN MEMORIA PRINCIPAL


Un sistema de bases de datos en memoria principal (BD-MP) se define como un
sistema en el cual la copia principal de los datos se encuentra en la memoria
principal, con lo cual todo el procesamiento de consultas y transacciones, y la
administración del almacenamiento de datos, se hacen sin necesidad de usar el
disco, salvo por el hecho de registrar en éste los registros de bitácora asociados
con las operaciones de modificación de datos, dada la persistencia que presenta.

El diseño del sistema administrador de una base de datos en memoria principal


(SABD-MP) contempla varias diferencias con respecto a una base de datos
tradicional, basada en el disco. En el caso particular del procesamiento de
consultas, el modelo de costos a usar debe considerar aspectos relacionados
con parámetros propios de la forma de ejecutarlo y con la estructura de la
memoria principal del computador. Surge, en lugar de una recuperación desde
el disco, una que contempla el rescate de datos desde la memoria principal hacia
los cachés, operación que se debe tomar en cuenta desde el diseño mismo de
las estructuras de almacenamiento e indexación que se vayan a usar, pues de
lo contrario el resultado puede ser perjudicial para el sistema.

Durante la ejecución práctica de las bases de datos in-memory se producen


procesos recurrentes e idénticos. Las bases de datos en memoria realizan los
siguientes pasos para realizar una copia de seguridad de los datos:

1. Inicio de la base de datos: cuando se inicia la base de datos, el sistema


carga todos los datos del disco duro a la memoria RAM. Esto significa que
no es necesario cargar ningún dato mientras la base de datos está en
ejecución.

2. Cotejo de los datos modificados: si los datos cambian, la base de datos


los ajusta a intervalos regulares.

3. Copias de seguridad del registro de transacciones: los cambios


actuales se registran en los registros de transacciones. Si se produce un
error, la base de datos se puede restaurar al momento anterior de que se
hubiera producido el error. Este proceso se denomina "rollforward".
4. Tratamiento de los datos: los datos se procesan según el principio AKID
(atomicidad, consistencia, aislamiento y durabilidad) al igual que con las
bases de datos tradicionales. Este principio describe las propiedades que
han de tener los procesos en los sistemas de gestión de bases de datos.

5. Replicación de la base de datos: el proceso copia continuamente los


datos a un ordenador o servidor para realizar copias de seguridad.

Referencias:
http://sedici.unlp.edu.ar/bitstream/handle/10915/22995/Documento_completo.p
df?sequence=1&isAllowed=y#:~:text=Un%20sistema%20de%20bases%20de,n
ecesidad%20de%20usar%20el%20disco%2C
https://www.ionos.es/digitalguide/hosting/cuestiones-tecnicas/base-de-datos-
en-memoria/
2. LÍNEA DE EVOLUCIÓN: DISTRIBUCIÓN

1. B.D. DISTRIBUIDAS

Una base de datos distribuida es una colección de múltiples bases de datos


interconectadas, que se extienden físicamente a través de varias ubicaciones
que se comunican a través de una red informática.

Características:
• Se usa para crear, recuperar, actualizar y eliminar bases de datos
distribuidas.
• Sincroniza la base de datos periódicamente y proporciona mecanismos
de acceso en virtud de los cuales la distribución se vuelve transparente
para los usuarios.
• Asegura que los datos modificados en cualquier sitio se actualicen
universalmente.
• Se utiliza en áreas de aplicación donde numerosos usuarios procesan y
acceden grandes volúmenes de datos simultáneamente.
• Está diseñado para plataformas de bases de datos heterogéneas.
• Mantiene la confidencialidad y la integridad de los datos de las bases de
datos.
A continuación veamos las ventajas de una base de datos distribuida sobre una
base de datos centralizada.
• Desarrollo modular. Si el sistema necesita ser ampliado con nuevas
localizaciones o nuevas unidades, en sistemas de base de datos
centralizados, esta acción requiere sustanciales esfuerzos adicionales,
así como la interrupción del servicio. Sin embargo, en las bases de datos
distribuidas, el trabajo simplemente requiere agregar nuevos ordenadores
y datos en los nuevos sitios y finalmente conectarlos al sistema distribuido,
sin que exista ninguna interrupción de funciones.
• Mejor tiempo de respuesta. Si los datos están distribuidos de una
manera eficiente, las peticiones de los usuarios van a poder ser
satisfechas directamente desde los datos locales, por lo que se
proporciona una respuesta más rápida. Por otro lado, en sistemas
centralizados, todas las solicitudes tienen que pasar a través del
ordenador central, lo cual incrementa el tiempo de respuesta.
• Más fiable. En caso de fallo en la base de datos, el todo el sistema de
base de datos centralizada se detiene. Sin embargo, en sistemas
distribuidos, cuando un componente falla, el funcionamiento del sistema
continua, aunque pueda tener una reducción de rendimiento. Por lo tanto,
una base de datos distribuida es más fiable.
• Menor coste de comunicación. En sistemas de bases de datos
distribuidas, si el dato se localiza allí dónde es más usado, el coste de
comunicación para manipulación de datos puede ser minimizado. Esto no
es factible en sistemas centralizados.
Referencias:
https://www.tecnologias-informacion.com/distribuidas.html
https://www.informaticaparatunegocio.com/blog/una-base-datos-distribuida-puede-
interesante/

2. B.D. FEDERADAS

Un sistema de bases de datos federadas es una colección de sistemas de bases


de datos cooperativos y autónomos. En un sistema federado los usuarios tienen
acceso a los datos, de los distintos sistemas, a través de una interfaz común sin
embargo, no existe un esquema global que describa a todos los datos de las
distintas bases de datos, en su lugar hay varios esquemas unificados, cada uno
describiendo porciones de bases de datos y archivos para el uso de cierta clase
de usuarios.

Las bases de datos federadas son vistas unificadas de bases de datos


independientes aparentan ser una sola base de datos, pero son una colección
de sistemas de bases de datos independientes, cooperativos, heterogéneos, que
son autónomos y que permiten compartir todos o algunos de sus datos. Una BDF
aparenta ser una BD normal y corriente, pero no tiene existencia física, es una
vista lógica.
Dependiendo del enfoque, un sistema federado debe cumplir con ciertas
características, por ejemplo, en se presentan las siguientes:
• Distribución: Los datos pueden estar ubicados entre múltiples bases de
datos.
• Heterogeneidad: Se debe permitir diferencias en el hardware, software y
en los sistemas de comunicación.
• Heterogeneidad de semántica: Ocurre cuando hay discrepancias
acerca del significado, interpretación o pretensión de utilización de los
mismos datos o datos relacionados.
• Autonomía: Se define como la capacidad de manejar su propio sistema
de base de datos, es decir, que tengan control separado e independiente.
Referencias:
https://modelosbd2012t1.wordpress.com/2012/03/15/bases-de-datos-
federadas/
http://eolo.cps.unizar.es/Docencia/MasterUPV/Articulos/Sistemas%20de%20Ba
ses%20de%20Datos%20Federadas.pdf

3. B.D. MÓVILES

Es una Base de datos donde los usuarios pueden acceder a la información lejos
de donde se encuentra almacenada la base de datos, se hace utilizando una
conexión inalámbrica

Sistemas de Base de datos móviles:

Es la habilidad de recuperar la información de los sistemas de computación y/o


repositorios de información sobre dispositivos móviles en cualquier momento en
cualquier lugar. Además de introducir o actualizar información en los sistemas
principales de forma remota desde el dispositivo móvil. Esto da toda la libertad
al usuario de manipular toda la información desde lejos.

Es un sistema distribuido que soporta conectividad móvil, posee todas las


capacidades de un sistema de base de datos y permiten a las unidades móviles,
una completa movilidad espacial por medio de la tecnología inalámbrica
Estructura y Características

Todas las bases de datos móviles tienen una arquitectura similar, donde
debemos distinguir una serie de elementos principales característicos de este
tipo de sistemas:

• Servidor de base de datos corporativo y SMBD que gestiona y almacena


los datos corporativos y proporciona aplicaciones corporativas. Se
correspondería con el SMBD y el servidor que se utiliza en la
organización.
• Base de datos remota y SMBD que gestiona y almacena los datos
móviles. Son las bases de datos que deben estar implementadas en los
dispositivos móviles.
• Plataforma de base de datos móvil, que puede ser un ordenador portátil,
PDA u otro dispositivo de acceso a Internet, es decir, los dispositivos
móviles en cuestión.
• Enlaces de comunicación bidireccionales entre el SMBD corporativo y el
SMBD móvil. Que pueden ser redes inalámbricas de distinta naturaleza,
comunicaciones vía satélite, etc.

Dentro de los servicios, que ofrecen los Sistemas Manejadores de Base de Datos
móviles, destacan los siguientes:
• Comunicación con el servidor centralizado de base de datos mediante
técnicas de comunicación inalámbrica.
• Replicación de datos en el servidor centralizado de base de datos y en el
dispositivo móvil.
• Sincronización de datos entre el servidor centralizado de base de datos y
el dispositivo móvil.
• Gestión de datos en el dispositivo móvil.
• Análisis de los datos almacenados en el dispositivo móvil.
Referencias:
https://vdocuments.mx/2-arquitectura-de-base-de-datos-moviles.html
https://modelosbd2012t1.wordpress.com/2012/03/15/base-de-datos-moviles-3/

4. MULTIBASES DE DATOS

Un sistema multibase de datos (SMulBD) soporta operaciones en múltiples


sistemas de base de datos componentes (SBDC). Cada SBDC es manejado por
un sistema manejador de base de datos (SMBD). Un SBDC en un SMulBD puede
ser centralizado o distribuido y puede residir en la misma computadora o en
múltiples computadoras conectadas por un subsistema de comunicación. Un
SMulBD es llamado homogéneo si todos los SMBD componentes son iguales; si
son diferentes entonces es llamado un SMulBD heterogéneo.
Autonomía de las bases de datos:
1. Diseño: modelo, lenguaje, implementación.
2. Comunicación: como, cuando se responde a otros sistemas.
3. Ejecución: Criterio a seguir en la toma de decisiones.
4. Asociación: decisión de que datos se comparten y a quien.

Propiedades:
• Este tipo de manejadores, tiene un manejo transparente para los
usuarios.
• Se aprecia como una sola base de datos. A esto se le conoce como
ínter operar y existen tres formas: Distribuidas, federadas o multibase.
• El sistema está conformado por un conjunto de bases de datos
heterogéneas. Esto significa que pueden o no tener diferentes
sistemas operativos, diferente equipo de cómputo(hardware),
diferentes manejadores de bases de datos, diferente modelo de
datos(J, red, Relacional, orientada a objetos), diferente estructura de
datos.
• Las bases de datos que participan en la BDF mantienen su
autonomía. Esto quiere decir que cada elemento de la federación
decide con quién, qué y cómo compartir sus datos, además de que
cada una cuenta con su respectivo diseño de acuerdo con las
necesidades del usuario.
• El MBDF(Manejador de Bases de Datos Federadas) recibe una
consulta sencilla y este a su vez la descompone en varias consultas
parciales.
• El MBDF deberá tener un optimizador de recursos para aprovechar
correctamente todos los componentes.
• Pueden ser físicamente distribuidas en diferentes lugares e incluso en
lugares muy lejanos.
Referencias:
https://karenkurapikadb.wordpress.com/2016/12/04/unidad-3sistemas-de-
multibase-de-datos/
https://tecsierra.wordpress.com/unidad-3-sistemas-de-multibase-de-datos/

3. LÍNEA DE EVOLUCIÓN: INTELIGENCIA

1. B.D. ACTIVAS

Un sistema de bases de datos activas es un sistema de gestión de bases de


datos (SGBD) que contiene un subsistema que permite la definición y la gestión
de reglas de producción(reglas activas). Las reglas siguen el modelo evento–
condición–acción (modelo ECA): cada regla reacciona ante un determinado
evento, evalúa una condición y, si esta es cierta, ejecuta una acción. La ejecución
de las reglas tiene lugar bajo el control de un subsistema autónomo, denominado
motor de reglas, que se encarga de detectar los eventos que van sucediendo y
de planificar las reglas para que se ejecuten. En el modelo ECA una regla tiene
tres componentes:
• El evento (o eventos) que dispara la regla. Estos eventos pueden ser
operaciones de consulta o actualización que se aplican explícitamente
sobre la base de datos. También pueden ser eventos temporales (por
ejemplo, que sea una determinada hora del día) u otro tipo de eventos
externos (definidos por el usuario).
• La condición que determina si la acción de la regla se debe ejecutar. Una
vez ocurre el evento disparador, se puede evaluar una condición (es
opcional). Si no se especifica condición, la acción se ejecutará cuando
suceda el evento. Si se especifica condición, la acción se ejecutará sólo
si la condición se evalúa a verdadero.
• La acción a realizar puede ser una transacción sobre la base de datos o
un programa externo que se ejecutará automáticamente.
Propiedades de las reglas activas
No es difícil diseñar reglas activas de modo individual, una vez se han
identificado claramente el evento, la condición y la acción. Sin embargo, entender
el comportamiento colectivo de las reglas activas es más complejo ya que su
interacción suele ser sutil. Por este motivo, el problema principal en el diseño de
las bases de datos activas está en entender el comportamiento de conjuntos
complejos de reglas. Las propiedades principales de estas reglas son
terminación, confluencia e idéntico comportamiento observable.
• Un conjunto de reglas garantiza la terminación cuando, para cada
transacción que puede activar la ejecución de reglas, esta ejecución
produce un estado final en un número finito de pasos.
• Un conjunto de reglas garantiza la confluencia cuando, para cada
transacción que puede activar la ejecución de reglas, la ejecución termina
produciendo un estado final único que no depende del orden de ejecución
de las reglas.
• Un conjunto de reglas garantiza un comportamiento observable idéntico
cuando, para cada transacción que puede activar la ejecución de reglas,
esta ejecución es confluyente y todas las acciones visibles llevadas a cabo
por la regla son idénticas y producidas en el mismo orden.

Referencias:
https://equipo2bdatos.wordpress.com/
https://www.ecured.cu/Bases_de_datos_activas

2. B.D. DEDUCTIVAS

Una base de datos deductiva consiste en un sistema de almacenamiento que, a


través de ciertas reglas definidas, es capaz de utilizar la información contenida
en la base de datos para deducir información adicional.
Este tipo de bases de datos se fundamenta en materias como la lógica
matemática y el cálculo relacional, por ello también se las suele denominar como
bases de datos lógicas. Su objetivo es definir nuevas relaciones para el
procesamiento de consultas a través de la información presente en la propia
base de datos.
Las principales características de las bases de datos deductivas son las
siguientes:

• Utilizan el lenguaje DataLog, un lenguaje declarativo.


• Permiten hacer consultas a través de reglas lógicas, deduciendo nueva
información por medio de los datos presentes en la database.
• Son capaces de soportar conjuntos y objetos de gran complejidad.
• Al contrario que en otras bases de datos, no existen relaciones entre
entidades, sino predicados. También se basan en hechos en lugar de
tulpas.
• Pueden establecer negaciones por estratos.

En cualquier caso, la característica fundamental de esta base de datos es que


ha de ser modelada a través de reglas lógicas, las cuales le permiten deducir
información a partir de los datos ya almacenados.

Una Base de Datos Deductiva utiliza dos tipos de especificaciones: hechos y


reglas. Los hechos se especifican de manera similar a como se especifican las
relaciones, excepto que no es necesario incluir los nombres de los
atributos. Recordemos que una tupla en una relación describe algún hecho del
mundo real cuyo significado queda determinado en parte por los nombres de los
atributos. En una Base de Datos Deductiva, el significado del valor del atributo
en una tupla queda determinado exclusivamente por su posición dentro de la
tupla.

Referencias:
http://basededatosdeductivas.blogspot.com/p/que-es-una-base-de-datos-
deductiva.html
https://ayudaleyprotecciondatos.es/bases-de-
datos/deductivas/#:~:text=Las%20principales%20caracter%C3%ADsticas%20de%20la
s,datos%20presentes%20en%20la%20database.

3. B.D. ORIENTADAS A OBJETOS

Una base de datos orientada a objetos es aquella que implementa dentro de


un sistema de información la representación de datos en forma de objetos. Esto
mediante la aplicación de programación orientada de objetos. Estas bases de
datos se diferencias de las bases de datos relacionales clásicas, debido a que
no responden a un sistema de tablas para registrar su información.
Estas bases de datos mezclan las potencialidades de una base de datos de
programación orientada a objetos con diferentes lenguajes de programación.
Estas se coordinan muy bien con Delphi, Phyton, Ruby, JavaScript, Java, Visual
BASIC, NET, C++, entre otros.
La mayoría de las bases de objetos ofrecen lenguajes de consultas para
encontrar los objetos que pertenecen a la base.

Ventajas e inconvenientes del modelo de base de datos orientada a objetos


El modelo de base de datos con el que decidamos trabajar dependerá mucho
del uso que queramos darle. Las bases de datos de objetos son especialmente
adecuadas si ya estamos trabajando con lenguajes de programación
orientados a objetos, como Java, porque los objetos del código fuente se
pueden integrar fácilmente en la base de datos. Si recurrimos a una base de
datos relacional, lo que suele ser lo más frecuente, nos costará incorporar
objetos complejos a la estructura tabular.
Uno de los inconvenientes de este modelo es que su uso está poco extendido.
Aunque se conoce desde la década de 1980, hasta ahora solo se han
desarrollado unos pocos SGBD para bases de datos orientadas a objetos. La
comunidad que se dedica a mejorar este modelo también es relativamente
pequeña. Por ello, la mayoría de los desarrolladores prefieren utilizar bases de
datos relacionales, que están generalizadas, bien documentadas y mucho más
desarrolladas.
Lo que supone una ventaja en ciertas situaciones puede convertirse en un
inconveniente en otras: la complejidad de los objetos garantiza que hasta las
consultas y anotaciones más complejas puedan llevarse a cabo mucho más
rápido que en los modelos relacionales. Sin embargo, si los procesos son
sencillos en comparación, no se puede prescindir de la estructura compleja, lo
que puede conllevar problemas de ralentización.
Referencias:
https://www.ionos.es/digitalguide/hosting/cuestiones-tecnicas/base-de-datos-orientada-
a-objetos/
https://www.grapheverywhere.com/bases-de-datos-orientadas-objetos/

4. B.D. TEMPORALES
Las bases de datos temporales son aquellas que administran los datos
considerando la variación del tiempo en los mismos, partiendo del hecho de que
el tiempo es una variable importante en la información, y que convencionalmente
las bases de datos representan el estado de la información en un solo instante
de tiempo, existen sectores dentro de los que se incluyen las finanzas, la
medicina y el entorno gubernamental, que necesitan representar su información
en un tiempo pasado; razón por la cual, durante los últimos veinte años se han
presentado modelos de bases de datos temporales, con el fin de representar la
evolución histórica de los datos.

Para el modelamiento de las BDT se puede hacer una extensión del modelo
relacional, adicionando atributos temporales a cada relación. Así mismo, para lo
que refiere a la consulta de los datos existen lenguajes especializados para estas
bases de datos, como lo son TQUEL y SQL3.

Especificando más profundamente, los aspectos temporales normalmente


incluyen tiempo de validez y tiempo de transacción. La combinación de estos dos
atributos forman un dato bitemporal.
• Tiempo de validez indica el período en el cual un hecho es verdad en
el mundo real.
• Tiempo de transacción indica el período en el cual un hecho está
guardado en la base de datos.
• El Dato Bitemporal es la combinación del tiempo de validez y el
tiempo transaccional.

Referencias:
https://dialnet.unirioja.es/descarga/articulo/6007715.pdf
https://es.slideshare.net/elaragon/bases-de-datos-temporales

5. B.D. DIFUSAS

Las Bases de datos relacionales difusas intentan aplicar una forma más humana
de pensar en la programación de computadoras usando lógica difusa. Por tanto
diremos que es una metodología que proporciona una manera simple y elegante
de obtener una conclusión a partir de información de entrada vaga, ambigua,
imprecisa, con ruido o incompleta. En general la lógica difusa imita como una
persona toma decisiones basada en información con las características
mencionadas. Una de las ventajas de la lógica difusa es la posibilidad de
implementar sistemas basados en ella tanto en hardware como en software o en
combinación de ambos.

Esta lógica es una lógica multivaluada y sus características principales,


presentadas por Zadeh en la referencia antes mencionada son:
• En la lógica difusa, el razonamiento exacto es considerado como un caso
particular del razonamiento aproximado.
• Cualquier sistema lógico puede ser trasladado a términos de lógica difusa.
• En lógica difusa, el conocimiento es interpretado como un conjunto de
restricciones exigibles, es decir, difusas, sobre un conjunto de variables.
• La inferencia es considerada como un proceso de propagación de dichas
restricciones. En lógica difusa, todo problema es un problema de grados.

Las bases de datos difusas nacen de unir la teoría de bases de datos,


principalmente del modelo relacional con la teoría de conjuntos difusos, para
permitir, básicamente dos objetivos:
• El almacenamiento de información difusa (además de información no
difusa).
• El tratamiento y consulta de esta información de forma difusa o exible.

Las bases de datos tradicionales son muy limitadas: No permiten ni almacenar


ni tratar con datos imprecisos. Sin embargo, las personas manejamos datos
imprecisos muy a menudo y muy eficientemente.

Referencias:
http://repositori.uji.es/xmlui/bitstream/handle/10234/149667/TFG_2014_Sanchis
MinguezD.pdf?sequence=1&isAllowed=y
http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S1405-
77432010000300005

6. ALMACENES DE DATOS

Un almacén de datos es una amplia recopilación de datos comerciales que sirven


para ayudar a una organización a tomar decisiones.. El concepto de almacén de
datos existe desde la década de los ochenta, cuando se desarrolló para ayudar
en la transmisión de datos de operaciones meramente de alimentación a
sustentar sistemas de soporte a las decisiones que permiten entrever business
intelligence. La gran cantidad de datos que encontramos en los almacenes de
datos procede de distintos lugares, como aplicaciones internas de marketing,
ventas o finanzas; aplicaciones de cara al cliente o sistemas de socios externos,
por dar tan solo unos ejemplos.
Desde el punto de vista técnico, un almacén de datos extrae datos
periódicamente de dichas aplicaciones y sistemas, luego los datos pasan por
procesos formateo e importación para efectuar coincidencias en el mismo
almacén. El almacén de datos guarda estos datos tratados para que, a la hora
de tomar decisiones, se puedan consultar. La frecuencia a la que se extraen o
cómo se formatean, por ejemplo, variará en función de las necesidades de la
empresa.
Los almacenes de datos ofrecen el beneficio global y único de permitir a las
organizaciones analizar grandes cantidades de datos variantes y extraer un valor
significativo de ellos, así como mantener un registro histórico.
Cuatro características únicas (descritas por el informático William Inmon, a quien
se considera el padre del almacén de datos) permiten que los almacenes de
datos brindan este beneficio global. Según esta definición, los almacenes de
datos son

• Orientados a temas. Pueden analizar datos sobre un tema en


particular o un área funcional (como ventas).
• Integrados. Los almacenes de datos crean consistencia entre los
diferentes tipos de datos de fuentes diferentes.
• No volátiles. Una vez que los datos están en un almacén de datos, son
estables y no cambian.
• Variantes en el tiempo. El análisis del almacén de datos analiza los
cambios a lo largo del tiempo.

Un almacén de datos bien diseñado realizará consultas muy rápidamente,


ofrecerá un alto rendimiento de datos y proporcionará suficiente flexibilidad para
que los usuarios finales puedan “analizar minuciosamente” o reducir el volumen
de datos para un examen más detallado para satisfacer distintas demandas—ya
sea en un nivel alto o en un nivel muy fino y detallado. El almacén de datos sirve
como base funcional para entornos de BI de middleware que proporcionan
informes, paneles y otras interfaces a los usuarios finales.
Referencias:
https://www.ecured.cu/Almac%C3%A9n_de_Datos
https://www.oracle.com/ar/database/what-is-a-data-warehouse/
https://www.talend.com/es/resources/what-is-data-warehouse/

También podría gustarte