Está en la página 1de 8

Lnea de tiempo

Evolucin de los Sistemas de Gestores de Bases de Datos


I.

LOS AOS SESENTA Y SETENTA: SISTEMAS CENTRALIZADOS

Los SGBD de los aos sesenta y setenta (IMS de


IBM, IDS de Bull, DMS de Univac, etc.) eran
sistemas
totalmente
centralizados,
como
corresponde a los sistemas operativos de aquellos
aos, y al hardware para el que estaban hechos:
un gran ordenador para toda la empresa y una red
de terminales sin inteligencia ni memoria.
Los primeros SGBD en los aos sesenta todava
no se les denominaba as estaban orientados a
facilitar la utilizacin de grandes conjuntos de
datos en los que las interrelaciones eran
complejas. El arquetipo de aplicacin era el Bill of materials o Parts explosion, tpica en las
industrias del automvil, en la construccin de naves espaciales y en campos similares.
Estos sistemas trabajaban exclusivamente por lotes (batch). Al aparecer los terminales de
teclado, conectados al ordenador central mediante una lnea telefnica, los SGBD estaban
ntimamente ligados al software de comunicaciones y de gestin de transacciones. Aunque
para escribir los programas de aplicacin se utilizaban lenguajes de alto nivel como Cobol o
PL/I.
La programacin era muy compleja. Puesto que los programas estaban relacionados con el
nivel fsico, se deban modificar continuamente cuando se hacan cambios en el diseo y la
organizacin de la BD. La preocupacin bsica era maximizar el rendimiento: el tiempo de
respuesta y las transacciones por segundo.
Segn las computadoras fueron ganando velocidad y capacidad, aparecieron sistemas de
bases de datos de propsito general. Apareci el inters en obtener un estndar y Charles
Bachman autor de uno de los primeros productos, el
Integrated Data Store (IDS) fund el Database Task
Group dentro de CODASYL, el grupo responsable de la
creacin y estandarizacin de COBOL. En 1971 publicaron
su estndar, que pas a ser conocido como la
aproximacin CODASYL, y en breve aparecieron
algunos productos basados en esta lnea.
La estrategia de CODASYL estaba basada en la navegacin manual por un conjunto de
datos enlazados en red. Cuando se arrancaba la base de datos, el programa devolva un
enlace al primer registro de la base de datos, el cual a su vez contena punteros a otros

datos. Para encontrar un registro concreto el programador deba ir siguiendo punteros hasta
llegar al registro buscado.
Para responder a preguntas simples como buscar todas las personas en Japn el programa
deba recorrer todos los datos para escoger los registros correctos. No existan los conceptos
buscar ni encontrar, algo que sera inaceptable hoy en da, pero que en los tiempos en
que los datos se guardaban en cintas no era viable llevarlos a la prctica.
Se encontraron soluciones a muchos de esos
problemas. El fabricante Prime cre un SGBD
ajustado a CODASYL basado en rboles binarios
que atajaba la navegacin de registro en registro
proveyendo caminos alternativos de acceso.
Tambin aportaba un lenguaje de interrogacin muy
claro. De hecho no hay razn para no poder aplicar
los conceptos de normalizacin a bases de datos
CODASYL, pero en ltimo trmino CODASYL
resultaba muy complejo y requera de mucho
esfuerzo y prctica para producir una aplicacin til.
IBM tambin tena su SGBD propio en 1968, conocido como IMS. Se trataba de un
software desarrollado para el programa Apolo sobre System/360. IMS tena conceptos
similares a CODASYL, pero usaba una jerarqua estricta de ordenacin de los datos, frente
a la estructura en red de CODASYL. Ambos conceptos fueron englobados posteriormente
en el concepto de bases de datos de navegacin debido al modo de acceso a los datos, de
hecho Bachman recibi al premio Turing en 1973 por su ponencia "El programador como
navegador".

Los aos setenta


Edgar Codd trabajaba en IBM, en una de esas oficinas
perifricas que estaba dedicada principalmente al
desarrollo de discos duros. Estaba descontento con el
modelo de navegacin CODASYL, principalmente con
la falta de operacin de bsqueda. En 1970 escribi
algunos artculos en los que perfilaba una nueva
aproximacin que culmin en el documento "A
Relational Model of Data for Large Shared Data
Banks".
En este artculo descubri un nuevo sistema para
almacenar y trabajar con grandes bases de datos. En
vez de almacenar registros de tipo arbitrario en una
lista encadenada como en CODASYL, la idea de Codd

era usar una "tabla" de registros de tamao fijo. En este modelo relacional los registros
relacionados se enlazan con una "clave".
Un uso comn de las bases de datos puede mantener una agenda de usuarios, su nombre,
informacin de acceso, direccin y telfono. En el modelo relacional, una parte de la
informacin se usa como clave, identificando de manera biunvoca un registro concreto.
Cuando se recopila informacin acerca de un usuario, se acceder a la informacin de las
tablas optativas buscando mediante esa clave. Por ejemplo si el nombre de usuario es nico,
la direccin y nmero de telfono de ese usuario ser guardada con el nombre de usuario
como clave. La recopilacin de esta informacin en un solo registro es algo para lo que los
lenguajes tradicionales no estn pensados.
As como el enfoque de navegacin requiere programas que realicen bucles para recolectar
registros, el enfoque relacional tambin los requerir. La solucin de Codd para los
necesarios bucles se basa en un lenguaje orientado a conjuntos, una sugerencia que ms
tarde cristalizara en el ubicuo SQL. Plante el uso de una rama del lgebra llamada clculo
de tuplas, y demostr que con ella se podran realizar todas las operaciones tpicas sobre
una base de datos, adems de extraer conjuntos de datos de una forma sencilla.
El artculo de Codd cay en manos de dos personas en Berkeley, Eugene Wong y Michael
Stonebraker. Ellos comenzaron un proyecto llamado INGRES con fondos asignados a un
proyecto de base de datos geogrfica programada por los estudiantes. Comenzando en
1973, INGRES produjo sus primeras versiones de prueba que estuvieron listas para uso
general en 1979. INGRES era muy similar a System R de IBM en varios aspectos,
incluyendo un lenguaje para acceso a los datos, conocido como QUEL. Con el paso del
tiempo, INGRES adopt el estndar SQL.
IBM comenz a trabajar a principios de 1970 en un prototipo lejanamente basado en los
conceptos de Codd llamndolo System R. La primera versin estuvo lista en 1974 o 1975, y
comenz as el trabajo en sistemas multitabla, en
los que los datos podan disgregarse de modo
que toda la informacin de un registro (alguna
de la cual es opcional) no tiene que estar
almacenada en un nico trozo grande. Las
versiones multiusuario siguientes fueron
probadas por los usuarios en 1978 y 1979,
tiempo por el que un lenguaje SQL haba sido
estandarizado. Las ideas de Codd se revelaron
como operativas y superiores a las de
CODASYL, lanzando a IBM al desarrollo de
una verdadera versin de produccin de System
R, conocido como SQL/DS, y posteriormente como Database 2 (DB2).

II.

LOS AOS OCHENTA

Los ordenadores minis, en primer lugar, y despus los ordenadores micros, extendieron la
informtica a prcticamente todas las empresas e instituciones. Esto exiga que el desarrollo
de aplicaciones fuese ms sencillo. Los SGBD de los aos setenta eran demasiado
complejos e inflexibles, y slo los poda utilizar un personal muy cualificado.
Durante la dcada de 1980 el auge de la programacin orientada a objetos influy en el
modo de manejar la informacin de las bases de datos. Programadores y diseadores
comenzaron a tratar los datos en las bases de datos como objetos. Esto quiere decir que si
los datos de una persona estn en la base de datos, los atributos de la persona como
direccin, telfono y edad se consideran que pertenecen a la persona, no son datos extraos.
Esto permite establecer relaciones entre objetos y atributos, ms que entre campos
individuales.
Otro gran foco de atencin durante la dcada fue el incremento de velocidad y fiabilidad en
el acceso. En 1989, dos profesores de la Universidad de Wisconsin publicaron un artculo
en una conferencia ACM en el que exponan sus mtodos para mejorar las prestaciones de
las bases de datos. La idea consista en replicar la informacin importante y ms
solicitada en una base de datos temporal de pequeo tamao con enlaces a la base de
datos principal. Esto implicaba que se poda buscar mucho ms rpido en la base de datos
pequea que en la grande. Su mejora de prestaciones llev a la introduccin de la
indizacin, incorporado en la totalidad de los SGBD.

En la dcada de los ochenta aparece Oracle Database


que es considerado como uno de los sistemas de
bases de datos ms completos, destacando: soporte de
transacciones, estabilidad, escalabilidad, y soporte
multiplataforma. Oracle Database es un sistema de
gestin de base de datos de tipo objeto-relacional (ORDBMS, por el acrnimo en ingls de
Object-Relational Data Base Management System), desarrollado por Oracle Corporation.

En la actualidad, Oracle (Nasdaq: ORCL) todava encabeza la lista. La tecnologa Oracle se


encuentra prcticamente en todas las industrias
alrededor del mundo y en las oficinas de 98 de
las 100 empresas Fortune 100. Oracle es la
primera compaa de software que desarrolla e
implementa software para empresas cien por
ciento activado por Internet a travs de toda su
lnea de productos: base de datos, aplicaciones
comerciales y herramientas de desarrollo de
aplicaciones y soporte de decisiones. Oracle es
el proveedor mundial lder de software para
administracin de informacin, y la segunda empresa de software.

III.

DECADA DE LOS NOVENTA


Al acabar la dcada de los ochenta,
los SGBD relacionales ya se
utilizaban prcticamente en todas las
empresas. A pesar de todo, hasta la
mitad de los noventa, cuando se ha
necesitado un rendimiento elevado se
han seguido utilizando los SGBD
prerrelacionales.

A finales de los ochenta y principios de los noventa, las empresas se han encontrado con el
hecho de que sus departamentos han ido comprando ordenadores departamentales y
personales, y han ido haciendo aplicaciones con BD. El resultado ha sido que en el seno de
la empresa hay numerosas BD y varios SGBD de diferentes tipos o proveedores. Este
fenmeno de multiplicacin de las BD y de los SGBD se ha visto incrementado por la
fiebre de las fusiones de empresas.
La necesidad de tener una visin global de la empresa y de interrelacionar diferentes
aplicaciones que utilizan BD diferentes, junto con la facilidad que dan las redes para la
intercomunicacin entre ordenadores, ha conducido a los SGBD actuales, que permiten que
un programa pueda trabajar con diferentes BD como si se tratase de una sola. Es lo que se
conoce como base de datos distribuida.
Esta distribucin ideal se consigue cuando las diferentes BD son soportadas por una misma
marca de SGBD, es decir, cuando hay homogeneidad. Sin embargo, esto no es tan sencillo
si los SGBD son heterogneos. En la actualidad, gracias principalmente a la estandarizacin
del lenguaje SQL.
Adems de esta distribucin impuesta, al querer tratar de forma integrada distintas BD
preexistentes, tambin se puede hacer una distribucin deseada, diseando una BD

distribuida fsicamente, y con ciertas partes replicadas en diferentes sistemas. Las razones
bsicas por las que interesa esta distribucin son las siguientes:
1) Disponibilidad. La disponibilidad de un sistema con una BD distribuida puede ser ms
alta, porque si queda fuera de servicio uno de los sistemas, los dems seguirn funcionando.
Si los datos residentes en el sistema no disponible estn replicados en otro sistema,
continuarn estando disponibles. En caso contrario, slo estarn disponibles los datos de los
dems sistemas.
2) Coste. Una BD distribuida puede reducir el coste. En el caso de un sistema centralizado,
todos los equipos usuarios, que pueden estar distribuidos por distintas y lejanas reas
geogrficas, estn conectados al sistema central por medio de lneas de comunicacin. El
coste total de las comunicaciones se puede reducir haciendo que un usuario tenga ms cerca
los datos que utiliza con mayor frecuencia; por ejemplo, en un ordenador de su propia
oficina o, incluso, en su ordenador personal.
Tambin es muy importante resaltar que en la dcada de 1990 la investigacin en bases de
datos gir en torno a las bases de datos orientadas a objetos.
Las cuales han tenido bastante xito a la hora de gestionar
datos complejos en los campos donde las bases de datos
relacionales no han podido desarrollarse de forma eficiente.
As se desarrollaron herramientas como Excel y Access del
paquete de Microsoft Office que marcan el inicio de las bases
de datos orientadas a objetos. As se cre la tercera generacin
de sistemas gestores de bases de datos.

Fue tambin en esta poca cuando se empez a modificar la primera publicacin hecha por
ANSI del lenguaje SQL y se empez a agregar nuevas expresiones regulares, consultas
recursivas, triggers y algunas caractersticas orientadas a objetos, que posteriormente en el
siglo XXI volver a sufrir modificaciones introduciendo caractersticas de XML, cambios
en sus funciones, estandarizacin del objeto sequence y de las columnas autonumricas. Y
adems, se crear la posibilidad de que SQL se pueda utilizar conjuntamente con XML, y
se definir las maneras de cmo importar y guardar datos XML en una base de datos SQL.
Dando asi, la posibilidad de proporcionar facilidades que permiten a las aplicaciones
integrar el uso de XQuery (lenguaje de consulta XML) para acceso concurrente a datos
ordinarios SQL y documentos XML. Y posteriormente, se dar la posibilidad de usar la
clausula order by. Aunque el boom de la dcada de los noventa ser es el nacimiento del
World Wide Web a finales de la dcada, ya que a travs de este se facilitar la consulta a
bases de datos.

IV.

TENDENCIAS ACTUALES

Los tipos de datos que se pueden definir en los


SGBD relacionales de los aos ochenta y
noventa son muy limitados. La incorporacin de
tecnologas multimedia imagen y sonido en
los SI hace necesario que los SGBD relacionales
acepten atributos de estos tipos.
Sin embargo, algunas aplicaciones no tienen
suficiente con la incorporacin de tipos
especializados en multimedia. Necesitan tipos
complejos que el desarrollador pueda definir a
medida de la aplicacin. En definitiva, se necesitan tipos abstractos de datos: TAD. Los
SGBD ms recientes ya incorporaban esta posibilidad, y abren un amplio mercado de TAD
predefinidos o libreras de clases.
Esto nos lleva a la orientacin a objetos (OO). El xito de la OO al final de los aos
ochenta, en el desarrollo de software bsico, en las aplicaciones de ingeniera industrial y
en la construccin de interfaces grficas con los usuarios, ha hecho que durante la dcada
de los noventa se extendiese en prcticamente todos los campos de la informtica.
En los SI se inicia tambin la adopcin, tmida de momento, de la OO. La utilizacin de
lenguajes como C++ o Java requiere que los SGBD relacionales se adapten a ellos con
interfaces adecuadas. La rpida adopcin de la web a los SI hace que los SGBD incorporen
recursos para ser servidores de pginas web, como por ejemplo la inclusin de SQL en
guiones HTML, SQL incorporado en Java, etc. Notad que en el mundo de la web son
habituales los datos multimedia y la OO.
Durante estos ltimos aos se ha empezado a extender un tipo de aplicacin de las BD
denominado Data Warehouse, o almacn de datos, que tambin produce algunos cambios
en los SGBD relacionales del mercado. A lo largo
de los aos que han trabajado con BD de distintas
aplicaciones, las empresas han ido acumulando
gran cantidad de datos de todo tipo. Si estos datos
se analizan convenientemente pueden dar
informacin valiosa*. Por lo tanto, se trata de
mantener una gran BD con informacin
proveniente de toda clase de aplicaciones de la
empresa (e, incluso, de fuera). Los datos de este
gran almacn, el Data Warehouse, se obtienen por una replicacin ms o menos elaborada
de las que hay en las BD que se utilizan en el trabajo cotidiano de la empresa. Estos
almacenes de datos se utilizan exclusivamente para hacer consultas, de forma especial para
que lleven a cabo estudios* los analistas financieros, los analistas de mercado, etc.
Actualmente, los SGBD se adaptan a este tipo de aplicacin, incorporando, por ejemplo,
herramientas como las siguientes:

a) La creacin y el mantenimiento de rplicas, con una cierta elaboracin de los datos.


b) La consolidacin de datos de orgenes diferentes.
c) La creacin de estructuras fsicas que soporten eficientemente el anlisis
multidimensional.

En la actualidad, las tres grandes


compaas que dominan el
mercado de las bases de datos son
IBM, Microsoft y Oracle. Por su
parte, en el campo de internet, la
compaa que genera gran cantidad
de informacin es Google. Aunque
existe una gran variedad de
software que permiten crear y
manejar bases de datos con gran
facilidad, como por ejemplo LINQ, que es un proyecto de Microsoft que agrega consultas
nativas semejantes a las de SQL a los lenguajes de la plataforma .NET. El objetivo de este
proyecto es permitir que todo el cdigo hecho en Visual Studio sean tambin orientados a
objetos; ya que antes de LINQ la manipulacin de datos externos tena un concepto ms
estructurado que orientado a objetos; y es por eso que trata de facilitar y estandarizar el
acceso a dichos objetos.

Cabe destacar que Visual Studio


es un entorno de desarrollo
integrado
para
sistemas
operativos Windows que soporta
varios
lenguajes
de
programacin tales como Visual
C++, Visual#, Visual J#,
ASP.NET y Visual Basic.NET,
aunque se estn desarrollando las extensiones necesarias para otros, cuyo objetivo es
permitir crear aplicaciones, sitios y aplicaciones web, as como servicios web a cualquier
entorno que soporte la plataforma .Net, creando as aplicaciones que intercomuniquen entre
estaciones de trabajo, pginas web y dispositivos mviles.