Está en la página 1de 9

Bases de datos espaciales y multimedia

Debido a que las dos cuestiones abordadas en esta seccin son muy amplias, podemos ofrecer tan solo una breve introduccin a estos campos. La Seccin 23.3.1 introduce las bases de datos espaciales, y la Seccin 23.3.2 examina brevemente las bases de datos multimedia.

23.3.1. Introduccin a los conceptos de bases de datos espaciales


Las bases de datos espaciales proporcionan conceptos para bases de datos que siguen la pista de los objetos en un espacio multidimensional. Por ejemplo, las bases de datos cartogrficas que almacenan mapas incluyen descripciones espaciales bidimensionales de sus objetos, desde pases y estados a ros, ciudades, carreteras, mares, etc. Estas bases de datos se emplean en muchas aplicaciones, como por ejemplo, en la gestin medioambiental, de emergencias y de combates. Otras bases de datos, como las meteorolgicas para la informacin del tiempo atmosfrico, son tridimensionales, puesto que las temperaturas y otras informaciones meteorolgicas estn relacionadas con puntos espaciales tridimensionales. En general, una base de datos espacial almacena objetos que tienen caractersticas espaciales que las describen. Las relaciones espaciales entre los objetos son importantes, y se necesitan frecuentemente cuando se consulta la base de datos. Aunque una base de datos espacial puede generalmente referirse a un espacio n-dimensional para cualquier n, limitaremos nuestro estudio a dos dimensiones a modo de ilustracin. Las principales extensiones que se necesitan para las bases de datos espaciales son modelos que pueden interpretar caractersticas espaciales. Adems, se necesitan con frecuencia estructuras especiales de indexacin y almacenamiento para mejorar el rendimiento. Examinemos en primer lugar algunas de las extensiones del modelo para bases de datos espaciales bidimensionales. Las extensiones bsicas que se necesitan son las de incluir conceptos geomtricos bidimensionales, como por ejemplo, puntos, lneas y segmentos de lnea, crculos, polgonos y arcos, con el fin de especificar las caractersticas espaciales de objetos. Adems, se necesitan operaciones espaciales para operar con las caractersticas espaciales de los objetos (por ejemplo, para calcular la distancia entre dos objetos) as como condiciones booleanas espaciales (por ejemplo, verificar si dos objetos se solapan espacialmente). Para ilustrar esto, consideremos una base de datos que se emplea para aplicaciones de gestin de emergencias. Se necesitara una descripcin de las posiciones espaciales de muchos tipos de objetos. Algunos de estos objetos tienen generalmente caractersticas espacales como calles y carreteras, surtidores de agua (para control de incendios), comisaras, parque de bomberos, y hospitales. Otros objetos tienen caractersticas espaciales dinmicas que cambian con el tiempo, como vehculos de polica, ambulancias o coches de bomberos. Las siguientes categoras muestran los tres tipos caractersticos de consultas espaciales: Consulta de rango: encuentra los objetos de un tipo concreto que estn dentro de una rea espacial determinada o de una distancia concreta a partir de una localizado n determinada. (Por ejemplo, encuentra todos los hospitales dentro del rea urbana de Dallas, o encuentra todas las ambulancias en un radio de cinco millas del lugar de un accidente.) Consulta de vecindad ms cercana', encuentra un objeto de un tipo concreto que est ms cercano a una localizacin dada. (Por ejemplo, encuentra el coche de polica que se halla ms cerca de un lugar concreto.) Reuniones o superposiciones espaciales', generalmente, rene los objetos de dos tipos basados en una condicin espacial determinada, como la interseccin o coincidencia de objetos espacialmente o que se encuentren a una determinada distancia entre s. (Por ejemplo, encuentra todas las ciudades que dan a una carretera principal o encuentra todas las casas que estn a menos de dos millas de un lago.) Para dar respuesta a stas y a otros tipos de consultas espaciales de manera eficiente, se necesitan tcnicas especiales para la indexacin espacial. Una de las tcnicas ms conocidas es el empleo de rboles R y sus variantes. Los rboles R agrupan, en los mismos nodos hoja de un ndice estructurado en rbol, los objetos que se hallan en proximidad fsica espacial cercana. Dado que un

nodo hoja puede sealar slo a un nmero determinado de objetos, se necesitan algoritmos para dividir el espacio en subespacios rectangulares que incluyan los objetos. Los criterios tpicos para dividir el espacio incluyen la minimizacin de reas rectangulares, puesto que esto dara lugar a una reduccin ms rpida del espacio de bsqueda. Los problemas como tener objetos que se solapan en reas espaciales se manejan de diferentes formas por las muchas variantes de los rboles R. Los nodos internos de los rboles R estn asociados con rectngulos cuya rea cubre todos los rectngulos en su subrbol. Por lo tanto, los rboles R pueden dar respuesta fcilmente a consultas como, por ejemplo, encontrar todos los objetos en un rea determinada limitando la bsqueda de rbol a aquellos subrboles cuyos rectngulos se cruzan con el rea determinada por la consulta. Otras estructuras de almacenamiento espacial incluyen rboles cuadraticos y sus variantes. Generalmente, los rboles cuadraticos dividen cada espacio o subespacio en reas del mismo tamao, y continan con las subdivisiones de cada subespacio para identificar las posiciones de varios objetos. Recientemente, se han propuesto estructuras de acceso espacial ms novedosas, y esta rea sigue siendo una rea de investigacin activa.

23.3.2.

Introduccin a los conceptos de bases de datos multimedia

Las bases de datos multimedia proporcionan caractersticas que permiten a los usuarios almacenar y consultar diferentes tipos de informacin multimedia, que incluye imgenes (como fotografas o dibujos), vdeo clips (como pelculas, noticiarios o vdeos domsticos), audio clips (como canciones, mensajes telefnicos o discursos),, y documentos (como libros o artculos). Los principales tipos de consultas de bases de datos que se necesitan incluyen la localizacin de fuentes multimedia que contengan determinados objetos de inters. Por ejemplo, se puede querer localizar todos los vdeo clips en una base de datos de vdeos que contengan una persona determinada, por ejemplo Bill Clinton. Tambin se puede querer obtener vdeo clips que estn basados en determinadas actividades como vdeo clips en los que se marque un gol en un partido de ftbol por un jugador o equipo determinado. Los tipos de consultas anteriores se conocen con el nombre de recuperacin basada en contenido, porque se est recuperando la fuente multimedia basndose en determinados objetos o actividades que contiene. Por consiguiente, una base de datos multimedia debe emplear algn modelo para organizar e indexar las fuentes multimedia basndose en su contenido. La identificacin del contenido de las fuentes multimedia resulta una tarea ardua y que lleva mucho tiempo. Existen dos mtodos principales. El primero se basa en el anlisis automtico de las fuentes multimedia para identificar ciertas caractersticas matemticas en sus contenidos. Este mtodo usa tcnicas diferentes dependiendo del tipo de fuente multimedia (imagen, texto, vdeo o audio). El segundo mtodo se basa en la identificacin manual de los objetos y actividades de inters de cada fuente multimedia y en emplear esta informacin para indexar las fuentes. Este mtodo puede aplicarse a todas las diferentes fuentes multimedia, pero requiere una fase de procesamiento manual previo en la que una persona tiene que examinar cada fuente multimedia para identificar y catalogar los objetos y actividades que contiene a fin de que puedan emplearse para indexar estas fuentes. En lo que queda de esta seccin, intentaremos abordar brevemente algunas de las caractersticas de cada tipo de fuente multimedia, imgenes, vdeo, audio y texto, en este orden. Una imagen se suele almacenar sin procesar como un conjunto de valores pixel o celdas, o de forma comprimida para ahorrar espacio. El descriptor de configuracin de imagen describe la forma geomtrica de la imagen sin procesar, que suele ser la de un rectngulo de celdas de una determinada anchura y altura. Por lo tanto, cada imagen puede representarse mediante una red de m por n celdas. Cada celda contiene el valor de un pixel que describe el contenido de la celda. En las imgenes en blanco y negro, los pixels pueden ser un bit. En la escala gris o imgenes en color, un pixel son mltiples bits. Debido a que las imgenes pueden necesitar grandes cantidades de espacio, stas se almacenan frecuentemente de forma comprimida. Los estndares de compresin, como el

estndar GIF, emplean diversas transformaciones matemticas para reducir el nmero de celdas almacenadas pero an mantienen las caractersticas de la imagen principal. Las transformadas matemticas que se pueden utilizar son la Transformada de Fourier Discreta (TFD), la Transformada de coseno discreta (TCD) y las transformaciones de onda pequea. Para identificar objetos de inters en una imagen, sta se suele dividir en segmentos homogneos empleando un predicado de homogeneidad. Por ejemplo, en una imagen en color, las celdas que estn adyancentes entre s y cuyos valores pixel estn cercanos se agrupan en un segmento. El predicado de homogeneidad define las condiciones para el modo de agrupar estas celdas automticamente. Por lo tanto, la segmentacin y la compresin pueden identificar las principales caractersticas de una imagen. Una consulta tpica de una base de datos de imgenes sera la de encontrar las imgenes en la base de datos que sean similares a una imagen determinada. La imagen determinada podra ser un segmento aislado que contenga, por ejemplo, un patrn de inters, y la consulta es la de localizar otras imgenes que contengan el mismo patrn. Existen dos tcnicas principales para este tipo de bsqueda. El primer mtodo emplea una funcin de distancia para comparar la imagen dada con las imgenes almacenadas y sus segmentos. Si el valor de distancia devuelto es pequeo, la probabilidad de que haya una coincidencia es alta. Se pueden crear ndices para que agrupen las imgenes almacenadas que se encuentran cercanas en la distancia mtrica para limitar el espacio de bsqueda. El segundo mtodo, denominado el mtodo de transformacin, mide la similitud de imagen mediante un pequeo nmero de transformaciones que pueden transformar las celdas de una imagen para coincidir con la otra imagen. Las transformaciones incluyen rotaciones, traslaciones y cambios de escala. Aunque el ltimo mtodo es ms general, tambin es una tarea ms ardua y que lleva tiempo. Una fuente de vdeo se representa normalmente como una secuencia de fotogramas en la que cada fotograma es una imagen. Sin embargo, ms que identificar los objetos y actividades en cada fotograma individual, el vdeo se divide en segmentos de vdeo, donde cada segmento est integrado por una secuencia de fotogramas contiguos que incluye los mismos objetos o actividades. Cada segmento se identifica por sus fotogramas iniciales y finales. Los objetos y actividades identificados en cada segmento de vdeo pueden emplearse para indexar los segmentos. Se ha propuesto una tcnica de indexacin denominada rboles de segmentos de cuadros para la indexacin de vdeo. El ndice incluye tanto objetos, como personas, casas o coches, como actividades, como puede ser una persona pronunciando un discurso o dos personas hablando, Una fuente de texto/documento es bsicamente el texto completo de un determinado artculo, libro o revista. Estas fuentes se caracterizan por estar indexadas mediante la identificacin de las palabras clave que aparecen en el texto y sus frecuencias relativas. Sin embargo, las palabras de relleno se eliminan de ese proceso. Debido a que podra haber demasiadas palabras clave a la hora de intentar indexar una coleccin de documentos, se han desarrollado tcnicas para reducir el nmero de palabras clave a aquellas que sean ms relevantes para la coleccin. Una tcnica llamada descomposiciones de valor singular (DVS), basada en transformaciones de matrices, puede emplearse para este fin. Una tcnica de indexacin denominada rboles de vectores telescpicos, o rboles VT, puede utilizarse para agrupar documentos similares. Las fuentes audio incluyen mensajes grabados almacenados, como discursos, presentaciones de clase, o incluso la grabacin de vigilancia de los mensajes o conversaciones telefnicas por aplicacin de la ley. En este caso, se pueden emplear transformaciones discretas para identificar las principales caractersticas de la voz de una persona determinada a fin de contar con una indexacin y recuperacin basada en la similitud. Los rasgos caractersticos de audio incluyen el volumen, la intensidad, el tono y la claridad.

SISTEMAS DE INFORMACION GEOGRAFICA Los sistemas de informacin geogrfica (GIS)6 se emplean para recoger, modelar, almacenar y analizar informacin que describe las propiedades fsicas del mundo geogrfico. En lneas generales, el mbito de los GIS abarca dos tipos de datos: (1) datos espaciales, procedentes de mapas, imgenes digitales, fronteras administrativas y polticas, carreteras, redes de transporte; datos fsicos tales como ros, caractersticas del suelo, regiones climticas, elevaciones del terreno, y (2) datos no espaciales como cmputos del censo, datos econmicos e informacin sobre ventas o marketing. Los GIS constituyen un dominio de rpido desarrollo que ofrecen mtodos sumamente innovadores para hacer frente a algunas demandas tcnicas que constituyen un reto.

27.4.1. Las aplicaciones GIS


Es posible dividir los GIS en tres categoras: (1) aplicaciones cartogrficas, (2) aplicaciones para el modelado digital de terrenos, y (3) aplicaciones de objetos geogrficos. La Figura 27.5 resume estas categoras. En las aplicaciones cartogrficas y de modelado de terrenos, se capturan variedad de atributos espaciales, por ejemplo, las caractersticas del suelo, densidad de cultivos y calidad del aire. En las aplicaciones de objetos geogrficos, se identifican los objetos de inters de un dominio fsico, por ejemplo, centrales elctricas, distritos electorales, parcelas de terreno, reas de distribucin de productos y edificios o lugares emblemticos de una ciudad. Estos objetos estn relacionados con datos de aplicaciones pertinentes, que pueden ser, para este ejemplo concreto, el consumo elctrico, las pautas de voto, los volmenes de venta de propiedades, el volumen de venta de productos y la densidad del trfico. Las dos primeras categoras de aplicaciones GIS requieren una representacin basada en campos, mientras que la tercera categora precisa de una basada en objetos. Las aplicaciones de tipo cartogrfico conllevan unas funciones especiales que pueden incluir la superposicin de varias capas de mapas para combinar datos de atributos que permitirn, por ejemplo, la medicin de distancias en un espacio tridimensional y la reclasificacin de datos en el mapa. El modelado digital de terrenos requiere una representacin digital de partes de la superficie terrestre utilizando elevaciones del terreno en puntos de muestreo que se interconectan para dar lugar a un modelo de superficie como, por ejemplo, una red tridimensional (lneas conectadas en 3D) que muestre la superficie del terreno. Esto precisa de unas funciones de interpolacin entre los puntos observados as como unas funciones de visualizacin. En las aplicaciones geogrficas basadas en objetos, se necesitan funciones espaciales adicionales para manejar los datos referentes a carreteras, conductos fsicos, cables de comunicacin, cables de alta tensin, etc. Por ejemplo, para una regin dada, se pueden emplear mapas comparables para contrastarlos en diferentes puntos del tiempo y mostrar los cambios producidos en determinados datos como son la ubicacin de carreteras, cables, edificios y ros.

27.4.2.

Requisitos de los GIS para la gestin de datos

Los requisitos funcionales de las aplicaciones GIS descritas anteriormente se traducen en los siguientes requisitos para las bases de datos. Modelado y representacin de datos. En lneas generales, los datos GIS pueden representarse en dos formatos: (1) vector y (2) matriz de puntos (rster). Los datos del vector representan objetos geomtricos como son puntos, lneas y polgonos. De este modo, un lago puede representarse como un polgono, un ro como una serie de segmentos de lnea. Los datos de la matriz de pontos se caracterizan por una serie de puntos, en la que cada punto representa el valor de un atributo pora una localizacin del mundo real. De manera informal, las imgenes de las matrices de puntos son series n-dimensionales en las que cada entrada constituye una unidad de la imagen y representa un atributo. Las unidades bidimensionales se denominan pixels, mientras que las unidades tridimensionales reciben el nombre de voxels. Los datos de elevacin tridimensional se almacenan en un formato de modelo de elevacin digital (DEM)7 basado en matrices de puntos. Otro formato de matriz de puntos denominado red irregular triangular (TIN)8 es un mtodo topolgico basado en vectores que modela las superficies conectando puntos de muestra a modo de vrtices de tringulos y tiene una densidad de puntos que puede variar con la aspereza del terreno. Las cuadrculas rectangulares (o matrices de elevacin) son estructuras de series bidimensionales. En el modelado digital del terreno (DTM),9 tambin puede emplearse el modelo sustituyendo la elevacin por algn atributo de inters como puede ser la densidad de poblacin o la temperatura ambiental. Los datos GIS incluyen a menudo una estructura temporal adems de la estructura espacial. Por ejemplo, la densidad del trfico puede medirse cada 60 segundos en un conjunto de puntos. Anlisis de datos. Los datos GIS experimentan diversos tipos de anlisis. Por ejemplo, en aplicaciones como los estudios de la erosin del suelo, estudios sobre el impacto medioambiental, o en simulaciones de afluencia hidrolgica, los datos DTM pueden experimentar varios tipos de anlisis geomorfomtricos, mediciones como son los valores de laderas, gradiente (la tasa de cambio en altitud), aspecto (la direccin magntica del gradiente), convexidad del perfil (la tasa de de cambio en el gradiente), convexidad de plano (la convexidad de contornos y otros parmetros). Cuando se emplean los datos GIS para aplicaciones de soporte a la toma de decisiones, estos pueden sufrir

operaciones de agregacin y expansin mediante el almacenamiento de datos, como ya vimos en la Seccin 26.1.5. Adems, se realizan operaciones geomtricas (para calcular distancias, reas y volmenes), operaciones topolgicas (para calcular superposiciones, intersecciones, caminos ms cortos), v operaciones temporales (para calcular consultas internas o basadas en eventos). El anlisis conlleva una serie de operaciones temporales y espaciales que ya tratamos en las Secciones 23.2 y 23.3. Integracin de datos. Los GIS deben integrar datos tanto de vectores como de matrices de puntos procedentes de diversas fuentes. Algunas veces se infieren los bordes y regiones de una imagen de matriz de puntos para formar un modelo de vector, o a la inversa, se emplean imgenes de matriz de puntos como fotografas areas para actualizar modelos de vectores. Se emplean diversos sistemas coordinados como el Universal Transverse Mercator (UTM), sistemas de latitud/longitud y sistemas catastrales locales para identificar localizaciones. Los datos procedentes de diferentes sistemas coordinados requieren unas transformaciones adecuadas. Muchas herramientas para el trazado de mapas basadas en la Web (por ejemplo, http://maps.yahoo.com) hacen uso de las principales fuentes pblicas de datos geogrficos, entre los que se incluyen los ficheros TIGER de los que se ocupa el Ministerio de Comercio de los EE.UU., para el trazado de mapas de carreteras. Con frecuencia, hay mapas de gran precisin y pocos atributos que tienen que unirse con mapas de poca precisin y que contienen numerosos atributos. Esto se realiza mediante un proceso denominado rubber banding donde, el usuario define un conjunto de puntos de control en ambos mapas y se realiza la transformacin del mapa de menor precisin para alinear los puntos de control. Una cuestin de integracin fundamental es la de crear y mantener la informacin de atributos (como son la calidad del aire o la densidad del trfico) que con el tiempo pueden relacionarse e integrarse con la informacin geogrfica correspondiente a medida que ambos evolucionan. Captura de datos. El primer paso a la hora de crear una base de datos espacial para el modelado cartogrfico es el de obtener informacin geogrfica bidimensional o tridimensional en forma digital, un proceso que a veces se ve dificultado por las caractersticas del mapa original tales como la resolucin, el tipo de proyeccin, las escalas de los mapas, la autorizacin cartogrfica, la diversidad de tcnicas de medicin as como las diferencias del sistema de coordenadas. Asimismo, tambin pueden obtenerse datos espaciales procedentes de sensores remotos en satlites como Landsat, NORA, y Advanced Very High Resolution Radiometer (AVHRR: Radimetro de Resolucin Muy Alta Avanzado) as como SPOT HRV (High Resolution Visible Range Instrument o Instrumento de Campo Visible de Alta Resolucin), que est libre de sesgo interpretativo y es muy preciso. En lo que se refiere al modelado digital del terreno, los mtodos de captacin de datos varan desde los manuales hasta los plenamente automatizados. Los estudios del terreno suelen ser el mtodo tradicional y el ms preciso, pero llevan mucho tiempo. Otras tcnicas incluyen el muestreo fotogramtrico y la digitalizacin de documentos cartogrficos.

27.4.3. Operaciones especficas de datos GIS


Las aplicaciones GIS se llevan a cabo mediante el empleo de los siguientes operadores especiales: Interpolacin: este proceso obtiene datos de elevacin para puntos en los que no se han obtenido muestras. Incluye el clculo para un solo punto, el clculo de una cuadrcula rectangular o de un contorno, etc. La mayora de los mtodos de interpolacin se basan en la triangulacin que emplea el mtodo TIN para interpolar elevaciones dentro del tringulo tomando como base las de sus vrtices. Interpretacin: el modelado digital del terreno conlleva la interpretacin de operaciones sobre datos del terreno como son la definicin, el allanado, la reduccin de detalles y su mejora. Las operaciones adicionales implican el arreglo o cierre de los bordes de los tringulos (en los datos TIN), y la fusin, lo que supone la combinacin de modelos que se superponen y la resolucin de conflictos entre los datos de los atributos. Las conversiones entre los modelos de cuadrculas, los modelos de contornos y los datos TIN son aspectos integrantes de la interpretacin del terreno. Anlisis de proximidad: varias clases de anlisis de proximidad incluyen el clculo de zonas de inters en torno a objetos, como son el establecimiento de un bfer en torno a un vehculo en una

autopista. Los algoritmos de camino ms corto mediante el empleo de informacin en 2D o 3D constituyen un tipo importante de anlisis de proximidad. Procesamiento de imgenes en una matriz de puntos: este proceso puede dividirse en dos categoras (1) el lgebra de mapas, que se emplea para integrar caractersticas geogrficas en diferentes capas de mapas para dar lugar a nuevos mapas algebraicamente; y (2) el anlisis digital de imgenes, que se encarga del anlisis de una imagen digital para caractersticas como son la deteccin de bordes y la deteccin de objetos. La deteccin de carreteras en una imagen de una ciudad obtenida por satlite es un ejemplo de esta ltima. Anlisis de redes: las redes aparecen en los GIS en numerosos contextos que deben analizarse y que pueden estar sujetos a segmentaciones, superposiciones, etc. La superposicin de redes hace referencia a un tipo de unin espacial en la que una red dada, por ejemplo una red de autopistas, se combina con una base de datos concreta (por ejemplo, localizaciones de accidentes) para dar lugar, en este caso, a un perfil de carreteras con una alta siniestralidad. Otra funcionalidad de las bases de datos. bien sujeta a otras consideraciones. La funcionalidad de una base de datos GIS est tam Extensibilidad: es preciso que los GIS sean extensibles para dar cabida a una serie de aplicaciones en constante evolucin y a los tipos de datos correspondientes. Si se emplea un SGBD estndar, ste debe permitir un conjunto bsico de tipos de datos con recursos para definir nuevos tipos y mtodos para dichos tipos. Control de calidad de los datos: como en muchas otras aplicaciones, la calidad de los datos originales es de primordial importancia a la hora de proporcionar unos resultados precisos a las consultas. Este problema resulta especialmente significativo en el contexto de los GIS debido a la variedad de datos, fuentes y tcnicas de medicin empleadas y a la absoluta precisin que esperan los usuarios de las aplicaciones. Visualizacin: una funcin crucial de los GIS est relacionada con la visualizacin (la exposicin grfica de la informacin del terreno y la representacin correspondiente de los atributos de la aplicacin). Las principales tcnicas de visualizacin incluyen (1) el contorneado mediante el empleo de isolneas, unidades espaciales de lneas o arcos de valores de atributos iguales; (2) sombreado de montaas, un mtodo de iluminacin empleado para la representacin cualitativa de relieves empleando intensidades distintas de luz para las facetas individuales del modelo de terreno; y (3) visualizaciones de perspectivas, imgenes tridimensionales de las facetas del modelo de terreno mediante la utilizacin de mtodos de proyeccin de perspectivas de los grficos creados por ordenador. Estas tcnicas aplican datos cartogrficos y otros objetos tridimensionales a los datos del terreno proporcionando versiones animadas de las escenas como ocurre en las simulaciones de vuelo y en pelculas de dibujos animados. Este tipo de requisitos muestran claramente que los SGBDR (SGBD relacinales) o SGBDO (SGBD de objetos) no satisfacen las necesidades concretas de los GIS. Por lo tanto, es preciso disear sistemas que sirvan de soporte para las representaciones en forma de vector y de matriz de puntos y para la funcionalidad espacial as como las caractersticas necesarias del SGBD. En la subseccin siguiente, se examina brevemente un conocido GIS denominado ARC-INFO, que no es un SGBD pero que integra la funcionalidad de un SGBDR en la parte INFO del sistema. Es probable que en el futuro se diseen ms sistemas que operen con bases de datos relacinales u orientadas a objetos y que contengan algo de informacin espacial y la mayor parte de informacin no espacial.

27.4.4.

Ejemplo de un GIS: ARC-IIMFO

ARC/INFO, un conocido GIS lanzado en 1981 por el Environmental System Research Institute (ESRI), emplea el modelo de nodo de arco para almacenar datos espaciales. Una disposicin geogrfica, denominada cobertura en ARC/INFO, consta de tres componentes bsicos: (1) nodos (puntos), (2) arcos (similares a lneas), y (3) polgonos. El arco es el ms importante de los tres y almacena gran cantidad de informacin topolgica. Un arco consta de una nodo inicial y un nodo

final (y, por lo tanto, tiene tambin direccin). Adems, los polgonos a la derecha e izquierda del arco tambin se almacenan junto con cada arco. Dado que no existe restriccin en lo que a la forma del arco se refiere, los puntos de la forma que no contienen informacin topolgica tambin se almacenan junto con cada arco. De este modo, la base de datos gestionada por el SGBDR INFO est formada necesariamente por tres tablas: (1) tabla de atributos de nodos (NAT),10 (2) tabla de atributos de arcos (AAT),11 y (3) tabla de atributos de polgonos (PAT).12 La informacin adicional puede almacenarse en tablas distintas y combinarse con cualquiera de estas tres tablas. La NAT contiene un identificador (ID) interno para el nodo, un ID especificado por el usuario, las coordenadas del nodo, y cualquier otra informacin relacionada con dicho nodo (por ejemplo, los nombres de las carreteras con interseccin en ese nodo). La AAT contiene un ID interno para el arco, un ID especificado por el usuario, el ID interno de los nodos inicial y final, el ID interno de los polgonos a la derecha e izquierda, una serie de coordenadas de los puntos de la forma (si los hay), la longitud del arco, y cualquier otro dato relacionado con el arco (por ejemplo, el nombre de la carretera que representa el arco). La PAT est formada por un ID interno para el polgono, un ID especificado por el usuario, el rea del polgono, el permetro del polgono, y cualquier otro dato relacionado (por ejemplo, el nombre del municipio que representa el polgono). Las consultas espaciales habituales estn relacionadas con la adyacencia, la contencin y la conectividad. El modelo de nodo de arco contiene suficiente informacin como para satisfacer los tres tipos de consultas, pero el SGBDR no resulta adecuado para este tipo de consultas. Un simple ejemplo pondr de relieve el nmero de veces que debe consultarse una base de datos relacional para obtener informacin sobre adyacencia. Supongamos que intentamos determinar si dos polgonos, A y B, son adyacentes entre s. Tendramos que examinar toda la AAT de manera exhaustiva para establecer si hay un borde que tiene a A en un lado y a B en el otro. La bsqueda no puede limitarse a los bordes de cada polgono puesto que no almacenamos explcitamente todos los arcos que constituyen un polgono en la PAT. El almacenaje de todos los arcos en la PAT resultara redundante dado que toda la informacin ya est contenida en la AAT. ESRI ha creado Arc/Storm (Are Store Manager), el cual permite que numerosos usuarios empleen el mismo GIS, maneja bases de datos distribuidas, y se integra con otros SGBDR comerciales como ORACLE, INFORMIX y SYBASE. Aunque ofrece muchas ventajas funcionales y de rendimiento respecto a ARC/INFO, es esencialmente un SGBDR incorporado a un GIS. 27.4,5. Problemas y cuestiones futuras en los GIS Los GIS constituyen un rea de aplicacin de bases de datos en expansin, que refleja una explosin en el nmero de usuarios finales que emplean mapas digitalizados. datos sobre terrenos, imgenes espaciales, datos meteorolgicos, as como datos de soporte de informacin del trfico. Como consecuencia de ello, ha surgido una serie de problemas cada vez mayor que afectan a las aplicaciones GIS y que han de resolverse: Nuevas arquitecturas', las aplicaciones GIS precisarn una nueva arquitectura cliente-servi-dor que se beneficiar de los avances ya existentes de la tecnologa de los SGBDR y SGBDO. Una solucin posible es la de separar los datos espaciales de los no espaciales para que estos ltimos puedan ser totalmente controlados por un SGBD. Un proceso de este tipo requiere un modelado y una integracin adecuadas, a medida que evolucionan ambos tipos de datos. Los distribuidores comerciales consideran que resulta ms viable contar con un nmero reducido de bases de datos independientes que se enven entre s las actualizaciones de modo automtico. Para ello, se necesitarn unas herramientas adecuadas para la transferencia de datos, la gestin de cambios y la gestin del flujo de trabajo. Versionado y mtodo del ciclo de vida del objeto: debido a que las caractersticas geogrficas estn en constante evolucin, los GIS deben mantener unos minuciosos datos cartogrficos y de terreno, un problema de gestin que podra reducirse mediante una actualizacin incre-mental combinada con unos esquemas de autorizacin de actualizaciones para diferentes niveles de usuarios. Con el mtodo del ciclo de vida del objeto, que abarca las actividades de creacin, destruccin y modificacin de objetos as como la promocin de versiones en objetos permanentes, se puede predefinir un conjunto completo de mtodos para controlar estas actividades para los objetos GIS. Estndares de datos: debido a la diversidad de los esquemas y modelos de representacin, la formalizacin de los estndares de transferencia de datos resulta crucial para el xito de los GIS. La

organizacin para la estandarizacin internacional (ISO TC211) y la organizacin de estndares europeos (CEN TC278) se encuentran en el proceso de debate de cuestiones relevantes, entre ellas la conversin de datos entre vector y matriz de puntos para un rpido rendimiento de las consultas. Aplicaciones equiparables y estructuras de datos: si observamos de nuevo la Figura 27.5, veremos que una clasificacin de las aplicaciones GIS se basa en la naturaleza y organizacin de los datos. En el futuro, los sistemas que comprendan un amplio abanico de funciones (desde anlisis de mercados y servicios pblicos hasta navegacin de vehculos) precisarn de datos en tomo a fronteras as como de funcionalidad. Por otra parte, las aplicaciones en ciencia medioambiental, hidrologa y agricultura requerirn datos ms orientados al rea y al modelo de terreno. No resulta evidente que un nico GIS de mbito general pueda servir de soporte a toda esta funcionalidad. Las necesidades especializadas de los GIS harn necesario que deban mejorarse los SGBD de uso general con tipos de datos y funcionalidad adicionales antes de que puedan servir de soporte a aplicaciones GIS completamente desarrolladas. Ausencia de semntica en las estructuras de datos: esto resulta especialmente patente en los mapas. La informacin relativa a cruces en autopistas y carreteras puede resultar difcil de precisar tomando como base los datos almacenados. Las vas de sentido nico tambin son difciles de representar en los GIS actuales. Los sistemas de transporte CAD han incorporado este tipo de semntica en los GIS.

27.4.6.

Bibliografa seleccionada para los GIS

Hay una serie de libros en torno a los GIS. Adam y Gangopadhyay (1997) y Laurini y Thompson (1992) analizan los problemas de la gestin de las bases de datos GIS y la gestin de la informacin. Kemp (1993) da una visin general de las cuestiones y fuentes de datos de los GIS. Maguire et al. (1991) tienen un conjunto de artculos sobre los GIS. Sarasua y O'Neill (1999) se centran en los GIS para los sistemas de transporte. El Ministerio de Comercio de los EE.UU. (1993) est a cargo de los ficheros TIGER sobre datos viarios. El sitio Web de Laser-Scan (http://www.lsl.co.uk/papers) constituye una buena fuente de informacin. El Environmental System Research Institute (ESRI, Instituto de Investigacin de Sistemas Medioambientales) cuenta con una biblioteca excelente de publicaciones en torno a los GIS para todos los niveles en la direccin http://www.esri.com. La terminologa GIS se define en la siguiente direccin: http://www.esri.com/library/glossary/glossary.html.