Está en la página 1de 39

SISTEMAS INFORMATICOS DE GESTION PBLICA

Gestores de Bases de Datos SGBD

Ing. Luis Avila Agreda

Sistemas Gestores de Bases de Datos


Una base de datos o banco de datos (BD) es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemticamente para su posterior uso. Una biblioteca puede considerarse una base de datos compuesta por documentos y textos impresos en papel e indexados para su consulta. Actualmente, la mayora de las bases de datos estn en formato digital (electrnico). Existen programas denominados sistemas gestores de bases de datos, abreviado SGBD, que permiten almacenar y posteriormente acceder a los datos de forma rpida y estructurada. Las propiedades de estos SGBD, as como su utilizacin y administracin, se estudian dentro del mbito de la informtica. Las aplicaciones ms usuales son para la gestin de empresas e instituciones pblicas. Tambin son ampliamente utilizadas en entornos cientficos con el objeto de almacenar la informacin experimental. Las bases de datos pueden contener muchos tipos de datos. La Informacin personal (data) se encuentra protegida por las leyes de varios pases.

Sistemas Gestores de Bases de Datos

Sistemas Gestores de Bases de Datos

Sistemas Gestores de Bases de Datos

Tipos de base de datos


Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto que se est manejando, la utilidad de las mismas o las necesidades que satisfagan. Segn la variabilidad de los datos almacenados: Bases de datos estticas Son bases de datos de slo lectura, utilizadas primordialmente para almacenar datos histricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a travs del tiempo, realizar proyecciones, tomar decisiones y realizar anlisis de datos para inteligencia empresarial.

Bases de datos dinmicas stas son bases de datos donde la informacin almacenada se modifica con el tiempo, permitiendo operaciones como actualizacin, borrado y adicin de datos, adems de las operaciones fundamentales de consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema de informacin de un supermercado, una farmacia, un videoclub o una empresa.

Tipos de base de datos


Bases de datos bibliogrficas Slo contienen una referencia de la fuente primaria, que permite localizarla. Un registro tpico de una base de datos bibliogrfica contiene informacin sobre el autor, fecha de publicacin, editorial, ttulo, edicin, de una determinada publicacin, etc. Puede contener un resumen o extracto de la publicacin original, pero nunca el texto completo. Como su nombre lo indica, el contenido son cifras o nmeros. Por ejemplo, una coleccin de resultados de anlisis de laboratorio, entre otras.

Tipos de base de datos

Tipos de base de datos


Bases de datos de texto completo Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las ediciones de una coleccin de revistas cientficas. Directorios Un ejemplo son las guas telefnicas en formato electrnico.

Modelos de bases de datos


Clasificacin de acuerdo a su modelo de administracin de datos. Un modelo de datos es bsicamente una "descripcin" de algo conocido como contenedor de datos, as como de los mtodos para almacenar y recuperar informacin de esos contenedores. Los modelos de datos son abstracciones que permiten la implementacin de un sistema eficiente de base de datos. Modelos bases de datos: Bases de datos jerrquicas Los datos se organizan en una forma similar a un rbol (visto al revs), en donde un nodo padre de informacin puede tener varios hijos. El nodo que no tiene padres es llamado raz, y a los nodos que no tienen hijos se los conoce como hojas. (relacin uno a muchos) Son tiles en aplicaciones que manejan un gran volumen de informacin y datos muy compartidos permitiendo crear estructuras estables y de gran rendimiento. Una de las principales limitaciones de este modelo es su incapacidad de representar eficientemente la redundancia de datos.

Modelos de bases de datos


Limitaciones de las Base de Datos Jerrquicas Al borrar un nodo padre, desaparecen tambin sus nodos subordinados. Slo podr aadirse un nodo hijo, si existe el nodo padre. La rigidez de su estructura: slo un padre por hijo y ausencia de relaciones entre los nodos hijos. Por Ejemplo: Un Sistema de Reservaciones de una Lnea Area

Modelos de bases de datos


Base de datos de red Su diferencia del jerrquico es la modificacin del concepto de nodo: se permite que un mismo nodo tenga varios padres (relacin muchos a muchos).

Esta mejora ofrece una solucin eficiente al problema de redundancia de datos.


La dificultad que significa administrar la informacin en una base de datos de red ha significado que sea un modelo utilizado en su mayora por programadores ms que por usuarios finales.

Modelos de bases de datos


Base de datos de red Por ejemplo: Los vendedores destacados para distribuir determinados productos en algunas ciudades pueden ilustrar este modelo. Cada Producto puede ser distribuido por ms de un Vendedor, as mismo cada Vendedor puede encargarse de diferentes Ciudades

Bases de datos transaccionales


Son bases de datos cuyo nico fin es el envo y recepcin de datos a grandes velocidades. Son muy poco comunes y estn dirigidas por lo general al entorno de anlisis de calidad, datos de produccin e industrial. Su fin nico es recolectar y recuperar los datos a la mayor velocidad posible, por lo tanto la redundancia y duplicacin de informacin no es un problema como con las dems bases de datos.

Para poderlas aprovechar al mximo permiten algn tipo de conectividad a bases de datos relacionales.
Un ejemplo: el traspaso de una cantidad de dinero entre cuentas bancarias. Se realiza mediante dos operaciones distintas, 1) se decrementa el saldo de la cuenta origen y 2) se incrementa el saldo de la cuenta destino. Para garantizar la atomicidad del sistema: que no desaparezca dinero, las dos operaciones deben ser atmicas, es decir, el sistema debe garantizar que, bajo cualquier circunstancia, el resultado final es que, o bien se han realizado las dos operaciones, o bien no se ha realizado ninguna.

Bases de datos relacionales

Bases de datos relacionales


ste es el modelo utilizado en la actualidad para modelar problemas reales y administrar datos dinmicamente. Sus fundamentos son de 1970 por Edgar Frank Codd, de los laboratorios IBM en San Jos (California) Su idea fundamental es el uso de "relaciones, que se pueden considerar en forma lgica como conjuntos de datos llamados "tuplas". Esto es pensando en cada relacin como si fuese una tabla que est compuesta por registros (las filas de una tabla), que representaran las tuplas, y campos (las columnas de una tabla).

Bases de datos relacionales


Por ejemplo: En un pequeo negocio, se puede contar con una Tabla de Clientes y Tabla de Pedidos Las rdenes que pertenecen a un determinado cliente son identificadas colocando el campo de identificacin del cliente en la orden (campo clave de la tabla de clientes), lo cual permite enlazar las dos tablas.

Bases de datos relacionales


En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia. Esto tiene la ventaja de que es ms fcil de entender y de utilizar para un usuario espordico de la base de datos. La informacin puede ser recuperada mediante "consultas" o almacenada, lo cual ofrece una amplia flexibilidad para administrar la informacin. El lenguaje ms habitual para construir las consultas a bases de datos relacionales es SQL, (Structured Query Language ) Lenguaje Estructurado de Consultas, un estndar implementado en TODOS los motores o sistemas de gestin de bases de datos relacionales. Durante su diseo, una base de datos relacional pasa por un proceso de normalizacin. Durante los aos 80 la aparicin de dBASE muy usado en los lenguajes de programacin y sistemas de administracin de datos. dBase no utilizaba SQL como lenguaje base para su gestin. Tablas DBF.

OpenOffice.org Base es un sistema de gestin de bases de datos de software libre.

Bases de datos multidimensionales


Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creacin de Cubos OLAP. Bsicamente no se diferencian demasiado de las bases de datos relacionales (una tabla en una base de datos relacional podra serlo tambin en una base de datos multidimensional) La diferencia est ms bien a nivel conceptual; en las bases de datos multidimensionales los campos o atributos de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla, o bien representan mtricas que se desean estudiar.

Bases de datos orientadas a objetos


El Anlisis Orientado a Objetos (O.O.) no es un enfoque que modela la realidad. En lugar de esto, modela la forma en que las personas comprenden la realidad. Un Objeto es una representacin detallada, concreta y particular de un algo. Tal representacin determina su Identidad, su Estado y su Comportamiento particular en un momento dado. Identidad: Le permite a un Objeto ser distinguido de entre otros y esto se da gracias al nombre que cada Objeto posee.

Estado: El estado de un Objeto es el conjunto de valores concretos que lo caracterizan en un momento dado, como: peso, color, precio, etc.
Comportamiento: Define un conjunto de funciones que el objeto es capaz de llevar a cabo. Tales funciones pueden estar relacionadas entre s, modificar el estado del objeto o invocar funcionalidades de otros objetos, entre muchas otras cosas ms. Una Clase se define como la generalizacin de un objeto en particular. Es decir, una Clase representa a una familia de Objetos concretos. De lo anterior, podemos decir que una instancia de una clase es siempre un objeto en particular.

Bases de datos orientadas a objetos


Este modelo, bastante reciente, y propio de los modelos informticos orientados a objetos, trata de almacenar en la base de datos los objetos completos (estado y comportamiento). Una base de datos orientada a objetos es una base de datos que incorpora todos los conceptos importantes del paradigma de objetos: Encapsulacin - Propiedad que permite ocultar la informacin al resto de los objetos, impidiendo as accesos incorrectos o conflictos.

Herencia - Propiedad a travs de la cual los objetos heredan comportamiento dentro de una jerarqua de clases.
Polimorfismo - Propiedad de una operacin mediante la cual puede ser aplicada a distintos tipos de objetos.

Bases de datos orientadas a objetos


Modelo de Bases de Datos Orientada a Objetos

Bases de datos documentales


Permiten la indexacin a texto completo, y en lneas generales realizar bsquedas ms potentes. Tesaurus es un sistema de ndices optimizado para este tipo de bases de datos.

Bases de datos deductivas


Es un sistema de base de datos pero con la diferencia de que permite hacer deducciones a travs de inferencias. Se basa principalmente en reglas y hechos que son almacenados en la base de datos. Las bases de datos deductivas son tambin llamadas bases de datos lgicas, a raz de que se basa en lgica matemtica. Este tipo de base de datos surge debido a las limitaciones de la Base de Datos Relacional de responder a consultas recursivas y de deducir relaciones indirectas de los datos almacenados en la base de datos.

Gestin de bases de datos distribuida (SGBD)


La base de datos y el software SGBD pueden estar distribuidos en mltiples sitios conectados por una red. Hay de dos tipos: 1. Distribuidos homogneos: utilizan el mismo SGBD en mltiples sitios.

2. Distribuidos heterogneos: Da lugar a los SGBD federados o sistemas multibase de datos en los que los SGBD participantes tienen cierto grado de autonoma local y tienen acceso a varias bases de datos autnomas preexistentes almacenados en los SGBD, muchos de estos emplean una arquitectura cliente-servidor. Estas surgen debido a la existencia fsica de organismos descentralizados.
Esto les da la capacidad de unir las bases de datos de cada localidad y acceder as a distintas universidades, sucursales de tiendas, etctera.

Gestin de bases de datos distribuida (SGBD)


La base de datos y el software SGBD pueden estar distribuidos en mltiples sitios conectados por una red. Hay de dos tipos: 1. Distribuidos homogneos: utilizan el mismo SGBD en mltiples sitios.

2. Distribuidos heterogneos: Da lugar a los SGBD federados o sistemas multibase de datos en los que los SGBD participantes tienen cierto grado de autonoma local y tienen acceso a varias bases de datos autnomas preexistentes almacenados en los SGBD, muchos de estos emplean una arquitectura cliente-servidor. Estas surgen debido a la existencia fsica de organismos descentralizados.
Esto les da la capacidad de unir las bases de datos de cada localidad y acceder as a distintas universidades, sucursales de tiendas, etctera.

Arquitectura cliente-servidor
La arquitectura cliente-servidor es un modelo de aplicacin distribuida en el que las tareas se reparten entre los proveedores de recursos o servicios, llamados servidores, y los demandantes, llamados clientes. Un cliente realiza peticiones a otro programa: el servidor le da respuesta. Esta idea se aplica en un sistema operativo multiusuario distribuido a travs de una red de computadoras. En esta arquitectura la capacidad de proceso est repartida entre los clientes y los servidores. Tiene ventajas de tipo organizativo debidas a la centralizacin de la gestin de la informacin y la separacin de responsabilidades, lo que facilita y clarifica el diseo del sistema. Los tipos especficos de servidores incluyen los servidores web, los servidores de archivo, los servidores del correo, etc.

Arquitectura cliente-servidor

Arquitectura cliente-servidor
En los sistemas multicapa el servidor se descompone en diferentes programas que pueden ser ejecutados por diferentes computadoras aumentando as el grado de distribucin del sistema. La arquitectura cliente-servidor sustituye a la arquitectura monoltica en la que no hay distribucin, tanto a nivel fsico como a nivel lgico. En la red de comunicaciones cliente-servidor : todos los clientes estn conectados a un servidor, se centralizan los diversos recursos y aplicaciones con que se cuenta los pone a disposicin de los clientes cada vez que estos son solicitados. Esto significa que todas las gestiones que se realizan se concentran en el servidor, de manera que en l se disponen: los requerimientos provenientes de los clientes que tienen prioridad, los archivos que son de uso pblico y los que son de uso restringido, los archivos que son de slo lectura y los que pueden ser modificados, etc. Este tipo de red puede utilizarse conjuntamente en caso de que se este utilizando en una red mixta.

Arquitectura cliente-servidor
Ventajas Centralizacin del control: los accesos, recursos y la integridad de los datos son controlados por el servidor de forma que un programa cliente defectuoso o no autorizado no pueda daar el sistema. Esta centralizacin tambin facilita la tarea de poner al da datos u otros recursos (mejor que en las redes P2P). Escalabilidad: se puede aumentar la capacidad de clientes y servidores por separado. Cualquier elemento puede ser aumentado (o mejorado) en cualquier momento, o se pueden aadir nuevos nodos a la red (clientes y/o servidores). Fcil mantenimiento: al estar distribuidas las funciones y responsabilidades entre varios ordenadores independientes, es posible reemplazar, reparar, actualizar, o incluso trasladar un servidor, mientras que sus clientes no se vern afectados por ese cambio (o se afectarn mnimamente). Esta independencia de los cambios tambin se conoce como encapsulacin. Existen tecnologas, suficientemente desarrolladas, diseadas para el paradigma de C/S que aseguran la seguridad en las transacciones, la amigabilidad de la interfaz, y la facilidad de empleo.

Arquitectura cliente-servidor
Desventajas La congestin del trfico ha sido siempre un problema en el paradigma de C/S. Cuando una gran cantidad de clientes envan peticiones simultaneas al mismo servidor, puede ser que cause muchos problemas para ste (a mayor nmero de clientes, ms problemas para el servidor). Cuando un servidor est cado, las peticiones de los clientes no pueden ser satisfechas.

El software y el hardware de un servidor son generalmente muy determinantes. Un hardware regular de un ordenador personal puede no poder servir a cierta cantidad de clientes. Normalmente se necesita software y hardware especfico, sobre todo en el lado del servidor, para satisfacer el trabajo. Esto aumentar el costo.
El cliente no dispone de los recursos que puedan existir en el servidor. Por ejemplo, si la aplicacin es una Web, no podemos escribir en el disco duro del cliente o imprimir directamente sobre las impresoras sin sacar antes la ventana previa de impresin de los navegadores.

Arquitectura cliente-servidor
Ejemplos La mayora de los servicios de Internet son tipo de cliente-servidor. La accin de visitar un sitio web requiere una arquitectura cliente-servidor, ya que el servidor web sirve las pginas web al navegador (al cliente). Al visitar un sitio web , la computadora y el navegador web del usuario seran considerados un cliente; y las computadoras, las bases de datos, y los usos que componen el sitio web seran considerados el servidor. Cuando el navegador web del usuario solicita un servicio, el servidor del sitio web recopila toda la informacin a mostrar en la base de datos, la articula en una pgina web, y la enva de nuevo al navegador web del cliente. Otro ejemplo: el funcionamiento de un juego online. Si existen dos servidores de juego, cuando un usuario lo descarga y lo instala en su computadora pasa a ser un cliente. Si tres personas juegan en un solo computador existiran dos servidores, un cliente y tres usuarios. Si cada usuario instala el juego en su propio ordenador existiran dos servidores, tres clientes y tres usuarios.

Los Datos y el Origen de la Informacin

Los Datos y el Origen de la Informacin


El dato es un hecho que describe un suceso o una entidades. La importancia de los datos est en su capacidad de asociarse dentro de un contexto para convertirse en informacin. Por s mismo los datos no tienen capacidad de comunicar un significado y por lo tanto no pueden afectar el comportamiento.

En cambio la informacin reduce nuestra incertidumbre (sobre algn aspecto de la realidad) y, por tanto, nos permite tomar mejores decisiones.
Los datos necesitan alojarse en un lugar fsico (memoria) para su posterior procesamiento o ejecucin. Hasta el momento se ha supuesto que los datos no son tan voluminosos y por lo tanto caben en memoria. Sin embargo, existen problemas en donde el volumen de datos es tan grande que es imposible mantenerlos en memoria. Entonces, los datos se almacenan en un conjunto de archivos, los que forman una base de datos.

Los Datos y el Origen de la Informacin


Da a da se multiplica la cantidad de datos almacenados, sin embargo, contrariamente a lo que pudiera esperar, esta explosin de datos no supone un aumento de nuestro conocimiento, puesto que resulta imposible procesarlos con los mtodos clsicos. Es as que hoy las organizaciones tienen gran cantidad de datos almacenados y organizados, pero a los cuales no los pueden analizar eficientemente en su totalidad. Con algunas sentencias de SQL se puede realizar un primer anlisis, pero la mayora de las veces, se requiere la utilizacin de tcnicas ms avanzadas. El descubrimiento de conocimiento en bases de datos apunta a procesar automticamente grandes cantidades de datos para encontrar conocimiento til en ellos

Descubrimiento de Conocimiento en Bases de Datos (KDD)


El KDD ( Knowledge Discovery from Databases) es el proceso de identificar patrones vlidos, novedosos, potencialmente tiles y en ltima instancia, comprensibles a partir de los datos.
El objetivo fundamental del KDD es encontrar conocimiento til, vlido, relevante y nuevo sobre una determinada actividad mediante algoritmos, dadas las crecientes rdenes de magnitud en los datos. Hay un profundo inters por presentar los resultados de manera visual, de interpretacin muy clara. El resultado de la exploracin deber ser interesante y su calidad no debe ser afectada por ruido en los datos.

Estructuracin de los Datos


Para poder analizar los datos con fiabilidad es necesario que exista una cierta estructuracin y coherencia entre los mismos.
La informacin que se quiere investigar sobre un cierto dominio de la organizacin se encuentra en bases de datos y otras fuentes muy diversas, internas o externas. Se necesita conjugar los distintos archivos y bases de datos de manera que se pueda utilizarlos para extraer conclusiones. Solucionar inconvenientes de heterogeneidad de las fuentes. Se deben estandarizar (Uniformizar) los datos: Diferentes tipos de datos representando el mismo concepto (ejemplo: la representacin de fecha, donde al ao se lo puede guardar con dos o cuatro dgitos). Diferentes claves para representar el mismo elemento (ejemplo: un mismo cliente puede ser representado por un cdigo de cliente o por un NIF). Diferentes niveles de precisin al representar un dato (ejemplo: los nmeros reales no siempre se almacenan de la misma forma, cantidades absolutas, relativas)

Estructuracin de los Datos


La estructuracin de los datos no es sencilla y esto se agrava cuando los diferentes archivos se encuentran en sistemas informticos y soportes diferentes.
La calidad de los resultados est directamente relacionada con la correcta comprensin y posterior estructuracin de los datos almacenados. Lo razonable sera recoger los datos (informacin histrica) en un sistema separado y especfico. As nace el Data-Warehousing: Almacenes o Bodegas de Datos, con la necesidad de unificar los distintos archivos y bases de datos para poder comprenderlos. Se necesita de tecnologas que sirvan de gua para comprender el contenido de las Bases de Datos.

Estructuracin de los Datos


Data-Warehouse: Almacenes o Bodegas de Datos, donde se unifican los distintos archivos y bases de datos.

También podría gustarte