Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Frassia
1. Presentación.............................................................................................................................. 2
2. INTRODUCCION A LOS CONCEPTOS PRINCIPALES .......................................................... 3
3. CASO ........................................................................................................................................ 4
4. CONOCIMIENTOS.................................................................................................................... 6
4.1. LA INFORMACIÓN COMO RECURSO ............................................................................. 6
4. 2 LAS BASES DE DATOS EN EL GIS.................................................................................. 8
4.3 EL MODELO RELACIONAL ................................................................................................ 9
4. 3.1. UN POCO DE HISTORIA ........................................................................................... 9
4.3.2. TÉRMINOS TÉCNICOS ................................................................................................ 11
4.3.3. Postulados ................................................................................................................. 13
4.3.4. Relaciones entre tablas.............................................................................................. 16
4.3.5. Tipo de relaciones...................................................................................................... 17
4.3.6. Integridad relacional................................................................................................... 20
4.3.7. Vistas y Tablas........................................................................................................... 21
4.3.8. SQL - STRUCTURED QUERY LANGUAGE ............................................................. 21
5. MODELO EAR (ENTIDAD-ATRIBUTO-RELACIÓN) .......................................................... 23
1ER PASO: Se deben identificar las entidades..................................................................... 24
2DO PASO: Se debe identificar las relaciones entre tablas especificando tipo de relación . 24
3ER PASO: Se debe identificar los atributos de las entidades ............................................. 25
4TO PASO: Se deben derivar nuevas tablas ........................................................................ 26
6. VENTAJAS Y DESVENTAJAS DEL MODELO ................................................................... 30
6.1 Ventajas ......................................................................................................................... 30
6.2 Desventajas ................................................................................................................... 30
Nota final.................................................................................................................................. 31
EVALUACIÓN ............................................................................................................................. 32
GLOSARIO.................................................................................................................................. 33
1
La información no espacial Arq. M. Frassia
1. Presentación
Hasta el momento, Usted ya dispone de conocimientos básicos para comprender qué el GIS,
la naturaleza de la información geográfica, los modelos raster y vectorial para la
representación de la información y qué software resultan convenientes, entre otros temas.
Probablemente disponga también de información temática. Por lo tanto, el problema en esta
clase es tratar de comprender cuál es el modelo que posibilita la unión de esta información
con el elemento espacial.
• Debe saber que para gestionar la información temática, los GIS tienen un modelo de
bases de datos propio y además, soporta la importación de otros modelos
comerciales como Microsoft Accesss, dBASE, Oracle, etc.
• Esta aptitud es la que posibilita que los usuarios utilicen las capacidades inherentes de las
bases de datos externas, que en general son más potentes y versátiles.
2
La información no espacial Arq. M. Frassia
• Una base de datos esta formada por diferentes tablas que guardan información sobre
elementos semejantes (por ejemplo una tabla guarda la información sobre las parcelas y
otra sobre los edificios).
• Un identificador, también llamado
etiqueta, reconoce cada objeto: una
ciudad de otra, un río de otro, etc.
• Los identificadores deben ser únicos e
inequívocos ya que proveen el
mecanismo por el cual las tablas se unen
entre sí.
• Las etiquetas pueden ser un nombre, Ej.
"Córdoba", una descripción, "Casa de
Gobierno " o un número distintivo, Ej. "el
número del documento de identidad".
3
La información no espacial Arq. M. Frassia
3. CASO
En esta oportunidad, vamos a comenzar con el comentario del biólogo español Ángel Manuel
Felicísimo Pérez que relata las exigencias del Municipio para acceder a un puesto de trabajo
en el equipo de Sistemas de Información Geográfica municipal.
PRÓLOGO:
Aparece una plaza de funcionario para el Ayuntamiento.
NUDO:
Me acerco al citado Ayuntamiento y examino las bases de la convocatoria. Os voy a ahorrar
detalles y me limitaré a una breve síntesis (el cabreo me impidió tomar notas detalladas):
Titulación exigida: diplomado en informática
Fase de concurso de méritos: entre otros detalles no se considera siquiera la experiencia de
trabajo en SIG y sí puntúa, sin embargo, el haber trabajado como técnico en informática.
(Nota: los datos y títulos anteriores están citados de memoria por lo que pueden no ser
exactos aunque sí garantizo que no violan la esencia del asunto.)
DESENLACE:
Un técnico en SIG debe ser informático (grado medio). En conclusión, abstenerse geógrafos
y, por supuesto, biólogos, geólogos, topógrafos y demás gente espuria (que no se me juzgue
mal, yo soy biólogo).
Un técnico en SIG debe saber con exquisito detalle todos las intimidades del bus IEEE, de
gestión de redes, intranets, MSAccess (!) ...
También debe saber algo de SIG ya que los últimos 5 o 6 temas hacen referencia a ellos con
un enfoque muy general (cuando no francamente erróneo desde en punto de vista
conceptual).
Da igual que hayas trabajado en SIG durante 10 años ya que este aspecto no se considera de
interés en la fase de concurso.
En fin, saludos
Ángel Manuel Felicísimo Pérez
¿Y usted se preguntará porque comenzamos con este ejemplo?
Pues queda claro en el mensaje, que un técnico en GIS no puede dejar se saber sobre bases
de datos relacionales. Por lo cual le presentamos a continuación algunos conceptos que lo
ayudarán a comprender cómo funciona una base de datos y cuál es su importancia para el
GIS.
Pero antes de comenzar le planteamos el siguiente problema que deberá resolver una vez
finalizada la clase 8. Le proponemos que imprima esta problema y que vaya pensando en el a
medida que avanza la clase.
4
La información no espacial Arq. M. Frassia
Un municipio requiere una base de datos para administrar sus registros catastrales. El
relevamiento preliminar reveló que se necesitará guardar información acerca de manzanas
(identificador, superficie, barrio al cual pertenecen), lotes (identificador, dirección, superficie,
frente), unidades funcionales (identificador, superficie, propietarios, valuación fiscal) y
propietarios (nombre y apellido y teléfonos, dirección de facturación). Por razones de
comodidad, en una tabla aparte se desea tener la información acerca de las unidades
funcionales, como una descripción de la misma y un plano escaneado).
Las “reglas de la organización” indican que:
• En una manzana hay varios lotes.
• En cada lote hay varias unidades funcionales.
• Una unidad funcional puede tener varios propietarios.
• Un mismo propietario puede tener varias unidades funcionales.
• Un mismo propietario puede tener varios teléfonos.
• Por supuesto el municipio quiere pasar de sus archivos papel a archivos digitales y
quiere que esta información se refleje en un GIS.
5
La información no espacial Arq. M. Frassia
4. CONOCIMIENTOS
• Hay claras diferencias entre datos e información aunque generalmente se los confunde.
Para tratar de entender la diferencia utilizaremos un ejemplo:
De este ejemplo podemos inferir que la información es cualitativamente más que los datos
y esto es necesariamente así porque la información debe servirle al usuario para tomar
decisiones. Debe tener utilidad para él, condición que no siempre se cumple con los datos. La
información, por lo tanto, es siempre contextuada y refiere a un proceso analítico sobre el dato.
6
La información no espacial Arq. M. Frassia
Al contar con Datos confiables y consistentes podemos generar Información que nos permita
tomar las decisiones más convenientes. A partir de la información podemos generar
Conocimiento (que no es más que Información + Valor), hasta llegar al tope de la pirámide de
valor, la Sabiduría, estatus en el cual contamos con la información valiosa en el momento,
lugar y tiempo adecuados para la generación de ventajas competitivas.
Tener “agrupada como un todo” esta información trae muchos beneficios, como reducir la
redundancia y la inconsistencia de los datos guardados.
7
La información no espacial Arq. M. Frassia
El GIS tiene la capacidad de tomar datos y procesarlos, para entregar información útil. Por
ese motivo que los GIS despiertan gran entusiasmo: tienen la habilidad de agregar valor a los
datos existentes.
El GIS se caracteriza por que utiliza bases de datos asociadas. Cada objeto gráfico
representado tiene atributos asociados. Volviendo al ejemplo de la Escuela 23 podemos
presuponer que sin duda la base de datos incluye información como el nombre, la dirección,
cantidad de alumnos, cantidad de cargos, teléfonos, tipo, etc.
Probablemente usted ya disponga de información de este tipo en tablas, por lo cual el problema
se remite a tratar de comprender cual es el modelo que posibilita la unión de esta información
con el elemento espacial.
• Para gestionar la información temática, los GIS tiene un modelo de bases de datos propio
y soporta la importación de otros modelos comerciales como Microsoft Accesss,
dBASE, Oracle, etc. Esta aptitud es la que posibilita que los usuarios utilicen las
capacidades inherentes de las bases de datos externas, que en general son más
potentes y versátiles.
• Las tablas se conectan a través de un campo común que ambos archivos poseen:
específicamente el identificador que posibilita la unión entre los elementos espaciales y
las tablas externas que habitualmente tienen las organizaciones. En nuestro ejemplo el
identificador Escuela 23 debería posibilitar la unión del elemento gráfico con las bases
provistas por el Ministerio de Educación.
• Pero antes de relacionar tablas es importante comprender las posibles relaciones que
entablan entre ellas, ya que los fabricantes de software presuponen que cuando se opera
un GIS se conoce el modelo relacional.
8
La información no espacial Arq. M. Frassia
En los años 60, cuando comenzaron los primeros desarrollos con computadoras, la atención
estaba centrada en la resolución de problemas particulares: si era necesario procesar
información se programaba especialmente una aplicación particular que solucionaba el
problema requerido. El ejemplo típico es la liquidación de sueldos de los empleados: una tarea
manual muy repetitiva que se automatiza para bajar el costo del procesamiento.
Este modelo fue adecuado mientras las aplicaciones permanecieron independientes. Los
problemas comenzaron cuando se hizo necesario compartir información y los formatos
entre aplicaciones no eran compatibles. Por ejemplo, “Compras” tenía los artículos comprados,
“Almacén” los que estaban en stock y “Ventas” los artículos vendidos; pero por más que los
tres refirieran a los mismos datos (los artículos que la empresa comercializaba), no podían
compartir esa información porque la aplicación que cada sector usaba, guardaba la información
en un formato distinto.
Podrá imaginarse el sin número de problemas que esto acarreaba. En principio, las
organizaciones se veían obligadas a mantener varias copias de la misma información en los
diferentes formatos que requerían las aplicaciones existentes. Esto inevitablemente creaba
redundancia de información (imaginen en una municipalidad la cantidad de veces que era
necesario guardar nombre y dirección de los contribuyentes), que a su vez traía aparejado la
inconsistencia de la información, ya que múltiples copias conllevan inevitablemente a errores
y a un altísimo costo de mantenimiento (¡sí un contribuyente cambiaba de domicilio había que
cambiar el dato en tantos archivos como aplicaciones hubiera!).
9
La información no espacial Arq. M. Frassia
10
La información no espacial Arq. M. Frassia
Es importante que preste especial atención a esta sección ya que introduce los términos
técnicos a los cuales haremos referencia en la próxima clase.
• Datos: Los datos son hechos o cosas del mundo lo suficientemente importante como para
ser registrados. Son recopilados como hechos o evidencias. Adquieren significado a partir
de su procesamiento para convertirse en información. Al hablar de datos, hacemos
referencia a un concepto amplio que puede incluir texto, imágenes, sonido, reglas de
decisión, etc.
• Información: Es el resultado del análisis de los datos. Por ejemplo, un satélite colecciona
datos (valores numéricos) que una vez volcados en un mapa, son interpretados por una
persona que identifica los diferentes usos del suelo en determinada región.
• Inconsistencia de datos: utilizaremos un ejemplo. Digamos que empleamos un archivo
para almacenar la información de clientes. Supongamos que tenemos varios programas
que utilizan esa información y que en un momento dado se pueden tener registros
duplicados con atributos diferentes. Por ejemplo, una persona cambia de dirección y al no
tener una estructura bien definida, no alteramos el registro, sino que lo agregamos una
segunda vez con la nueva dirección. De esta manera, tendremos a la misma persona con
dos datos diferentes y sin posibilidad de saber cual es la correcta.
• Base de datos: Una base de datos es un conjunto de información relacionada con un
asunto o con una finalidad.
Se compone de entidades (cosas u objetos del mundo real distinguibles de todos los
demás objetos) que poseen atributos (propiedades o características de las que se quiere
llevar registro).
Las entidades pueden ser cosas concretas, como una persona o un libro, o abstractas,
como un préstamo o una venta.
11
La información no espacial Arq. M. Frassia
Para comprender su utilidad analicemos este caso: tenemos un registro de personas donde
almacenamos datos como: nombre, puesto, salario base, dirección, teléfono, fecha de
nacimiento, gustos musicales, aficiones, nombre, fecha de nacimiento y ocupación del
conjugue, nombres y fechas de nacimiento de sus hijos, nombres de sus mascotas, autos
que posee (con todas las características), etc.
Frecuentemente sólo utilizaremos nombre, puesto y salario base para generar una nómina,
esto implica que en cada vez que recuperamos información visualizamos datos que no
necesitamos, con la de que tenemos que traer registros inmensos para utilizar sólo cuatro
campos. El problema no es el almacenaje en disco, sino el tiempo desperdiciado en
recuperar registros de tal magnitud. Para solucionar esta dificultad se construye una
consulta que sólo muestra los datos necesarios.
Otro ejemplo: en muchos casos nos interesa que ciertas gentes tengan acceso sólo a parte
de la información. Es de mal gusto que todos los empleados sepan cuál es el salario del
director.
• SQL (Structured Query Language): el más conocido de los llamados “lenguajes de
consulta” que posibilitan la manipulación de la información. Entre sus ventajas
encontramos que es completo, simple, en seudo ingles, y está sostenido por una sólida
base matemática.
• identificadores: volviendo al ejemplo anterior del registro de personas donde coexisten
datos que usamos frecuentemente, con otros que se usan esporádicamente, un diseño un
poco más inteligente tendría dos tablas, una con los datos más frecuentemente
empleados de cada persona y la otra con el resto de la información que se emplea quizá
sólo para fines estadísticos o para enviar tarjetas de felicitación. Por supuesto, ambas
tablas estarían relacionadas mediante un identificador que sea inequívoco.
Se llama identificador a todo atributo o grupo de atributos cuyo valor identifica la entidad
bajo análisis. Si nos encontramos con una entidad que no tiene un atributo que lo
identifique inequívocamente, podemos “inventar” un atributo que sirva como identificador.
Si la entidad es Si la entidad es
“Personas”, su “Aulas”, se crea el
DNI suele atributo Código de
usarse como Aula.
identificador
• Usuarios de una base de datos: una base de datos típica conlleva la existencia de tres
tipos de usuario con relación a su diseño, desarrollo y uso:
El administrador de bases de datos, que diseña y mantiene la Base.
El desarrollador de aplicaciones que implementa las transacciones e interfaces.
Los usuarios finales que consultan y editan los datos de la Base mediante un lenguaje de
consulta de alto nivel.
12
La información no espacial Arq. M. Frassia
4.3.3. Postulados
• Una base de datos relacional siempre está compuesta de tablas que se conectan
(relacionan) entre sí para compartir información.
13
La información no espacial Arq. M. Frassia
Tomemos el ejemplo de una escuela, donde se llena una ficha para cada alumno,
especificando los datos personales del mismo. Esto se guarda en la tabla “Alumnos”, que
tendrá tantos registros (filas) como estudiantes distintos tenga el establecimiento educativo.
Cada registro se compondrá de un cierto número de campos (columnas), como ser Nº de
Documento del alumno, Nombre, Apellido, Edad, Dirección, Teléfono.
TABLA ALUMNOS
Nº de Nombre Apellido Edad Dirección Teléfono
Documento
10.552.356 Juana Martínez 8 Av. Cabildo 2424 4321-1234
22.658.569 Adrián González 5 Chorroarín 125 4444-1111
32.568.857 Héctor Gómez 6 Padilla 627 9999-2222
• Así como cuando organizamos una biblioteca se crea un índice que permite hacer una
referencia a un libro fichado, en las bases de datos es necesario la creación de un campo
denominado identificador que permita localizar la unidad de análisis.
En este caso Nº de Documento de Alumno es el atributo identificador que permite
reconocer al escolar en forma inequívoca.
• En ningún momento dos filas de la misma tabla pueden tener el mismo valor de
identificador.
• Los identificadores pueden estar formados por una sola columna. Pero a veces no
alcanza con un solo o atributo para identificar un elemento de una base de datos: en esos
casos se utiliza un conjunto de atributos. Tomemos el ejemplo el identificador de una tabla
“Venta”. Normalmente una venta se identifica mediante el número de factura que se emitió,
pero si la empresa tiene distintos talonarios de facturas (Responsable Inscripto – A – o
Consumidor Final – B –), deben usarse conjuntamente los atributos Tipo de Factura +
Número de factura ya que el número sólo no alcanza para identificar una venta.
14
La información no espacial Arq. M. Frassia
• Este modelo introduce el concepto de valor nulo, para hacer alusión a valores que no son
todavía conocidos. Por ejemplo, en la tabla alumnos, la columna estatura puede estar
vacía para determinado registro, no indicando esto que no tenga altura sino que no se
conoce la misma. En este ejemplo se ve claramente la diferencia entre “cero” y “nulo”.
¿Por qué es el concepto de valor nulo tan
importante? Porque los registros con valor
nulo se excluyen de las estadísticas.
15
La información no espacial Arq. M. Frassia
Si ahora agregáramos en la tabla “Alumnos” al maestro a cargo del grado, con sus datos
personales, surgiría una enorme cantidad de problemas. Además de tener que ingresar todos
los datos del maestro por cada alumno (redundancia), si algún educador cambia de teléfono
deberíamos actualizar la información en muchos registros, tantos como alumnos tenga el
grado, lo que se presta a generar inconsistencias (que en un registro figure el teléfono viejo y
en otro el nuevo). También se agrandaría el tamaño de la base, lo que haría más costoso el
medio de almacenamiento (discos rígidos) y más largas las búsquedas (porque tiene que pasar
por más registros).
Para relacionar esta tabla con la base alumnos, en la tabla alumnos creamos un campo
donde se ubica el identificador del maestro que nos remite a los datos personales del mismo.
16
La información no espacial Arq. M. Frassia
Resumiendo, en general en una base de datos hay más de una tabla, que generalmente están
relacionadas entre ellas. Las tablas se conectan a través de un campo común que ambas
poseen: específicamente el identificador de una tabla puede ser el atributo de otra con la
finalidad de proveer un vínculo entre ambas.
DEFINICIÓN
Identificador primario (o clave primaria):
El campo que identifica inequívocamente a
una entidad.
Son varios los tipos de relaciones que pueden entablar entre dos tablas:
TIPOS DE RELACIONES
17
La información no espacial Arq. M. Frassia
Uno a uno:
18
La información no espacial Arq. M. Frassia
Uno a Muchos:
Muchos a Muchos:
19
La información no espacial Arq. M. Frassia
Ahora que ya conocemos el funcionamiento de las claves primarias y las claves ajenas
estamos en posición de estudiar las reglas de integridad. Con este nombre se designa
aquellas reglas que han de ser aplicadas a una base de datos para asegurar que los datos
introducidos sean consistentes con la realidad que se pretenden modelar. Existen dos
reglas generales que aporta el modelo relacional. Estas dos reglas son muy simples:
Además, muchos RDBMSs añaden un buen número de características que ayudan a mantener
más fácilmente la integridad de los datos. Mediante estos mecanismos es posible añadir reglas
específicas para cada base de datos; éstas son las denominadas restricciones de integridad
definidas por el usuario. Por ejemplo, podríamos determinar que un profesor no pueda ser
menor de x años o que un curso sólo pueda pertenecer a los niveles 1, 2 ó 3. El resultado sería
que al intentar introducir un valor fuera de este rango, el DBMS rechazaría la información
introducida mostrando un mensaje de error.
20
La naturaleza de la información no espacial Arq. M. Frassia
Con este objetivo, las tablas pueden ser de dos tipos: tablas y vistas.
• Las tablas son reales en el sentido que contienen información y una estructura física
determinada.
• Las vistas son tablas virtuales, siendo una combinación de filas y columnas de una o
más tablas. El objetivo de las mismas es presentarse a un particular usuario en la forma
que es útil para su propósito. Una vista puede ocultar los datos que el usuario no necesita o
no debe ver.
Supongamos que en un banco, hay una Base de Datos con las siguientes tablas:
Un empleado a nivel gerencial necesita saber los nombres de todos los clientes que tiene cada
sucursal que tiene préstamos otorgados. Sin embargo, el empleado no está autorizado a ver la
información concerniente a los préstamos concretos que pueda tener cada cliente (monto,
cuotas, etc). Por lo tanto, se le debe negar el acceso a la información de la tabla Préstamo.
Pero se puede crear una Vista que cuando sea llamada, muestre solamente los campos
Nombre y Apellido (de Cliente) y Nº de Sucursal (de Sucursales).
21
La naturaleza de la información no espacial Arq. M. Frassia
La historia de SQL (que se pronuncia deletreando en inglés las letras que lo componen, es
decir "ese-cu-ele" y no "siquel" como se oye a menudo) empieza en 1974 con la definición, por
parte de Donald Chamberlin y de otras personas que trabajaban en los laboratorios de
investigación de IBM, de un lenguaje para la especificación de las características de las bases
de datos que adoptaban el modelo relacional.
El prototipo (System R), basado en este lenguaje, se adoptó y utilizó internamente en IBM y lo
adoptaron algunos de sus clientes elegidos. Gracias al éxito de este sistema, que no estaba
todavía comercializado, también otras compañías empezaron a desarrollar sus productos
relacionales basados en SQL. A partir de 1981, IBM comenzó a entregar sus productos
relacionales y en 1983 empezó a vender DB2.
En el curso de los años ochenta, numerosas compañías (por ejemplo Oracle y Sybase, sólo
por citar algunos) comercializaron productos basados en SQL, que se convierte en el
estándar industrial de hecho por lo que respecta a las bases de datos relacionales.
En 1986, el ANSI adoptó SQL (sustancialmente adoptó el dialecto SQL de IBM) como
estándar para los lenguajes relacionales y en 1987 se transformó en estándar ISO. Esta
versión del estándar va con el nombre de SQL/86. En los años siguientes, éste ha sufrido
diversas revisiones que han conducido primero a la versión SQL/89 y posteriormente, a la
actual SQL/92.
El hecho de tener un estándar definido por un lenguaje para bases de datos relacionales abre
potencialmente el camino a la intercomunicabilidad entre todos los productos que se
basan en él.
Desde el punto de vista práctico, por desgracia las cosas fueron de otro modo. Efectivamente,
en general cada productor adopta e implementa en la propia base de datos sólo el
corazón del lenguaje SQL.
Actualmente, está en marcha un proceso de revisión del lenguaje por parte de los comités
ANSI e ISO, que debería terminar en la definición de lo que en este momento se conoce como
SQL3. Las características principales de esta nueva encarnación de SQL deberían ser su
transformación en un lenguaje stand-alone (mientras ahora se usa como lenguaje
hospedado en otros lenguajes) y la introducción de nuevos tipos de datos más complejos
que permitan, por ejemplo, el tratamiento de datos multimediales.
22
La naturaleza de la información no espacial Arq. M. Frassia
Este modelo fue creado en 1976 por Peter Chen del “Massachusetts Institute of Tecnology” y
es ampliamente usado como un medio de modelado de bases de datos.
Se supone que mediante estos simples componentes se puede modelar cualquier "sección de
realidad".
El modelo EAR aporta una herramienta de modelado para representar las entidades,
propiedades y relaciones: los diagramas Entidad/Relación.
23
La naturaleza de la información no espacial Arq. M. Frassia
Incluye varios pasos, los cuales ejemplificaremos con un modelo de datos simplificado para la
Prefectura Naval:
Las entidades son objetos o cosas que pueden identificarse y tener una existencia
independiente y sobre que la organización necesita información.
Una relación es una asociación entre dos objetos. Las relaciones son representadas por un
rombo entre los rectángulos (a veces se coloca el nombre de la relación dentro del rombo).
• Uno-a-uno
• Uno-a-muchos
• Muchos-a-muchos
24
La naturaleza de la información no espacial Arq. M. Frassia
Afortunadamente, las reglas para transformar las relaciones del diagrama en relaciones del
modelo relacional son bastante directas.
Uno a uno:
• Si la relación es Uno-a-Uno es aceptable unir estas entidades en una sola tabla,
considerando al Capitán como un atributo de la tabla Barco.
• Alternativamente, puede ser más conveniente guardar las dos entidades separadas
en dos tablas, usando el identificador común para cruzar información entre tablas. En
este ejemplo ambas tablas podrían estar unidas por el identificador “Barco” (en la tabla
Barco será clave primaria y en la tabla capitán clave secundaria).
Uno a Muchos:
• Si la relación es Uno-a-Muchos se resuelve agregando la llave primaria de la tabla de
uno (Barco) a la tabla de muchos (Tripulante), que automáticamente se convierte en
llave secundaria.
• En este ejemplo la llave o identificador principal de la tabla Barco pasa a ser un atributo
de la tabla Tripulante.
Muchos a Muchos:
• Las relaciones muchos a muchos no son aceptadas por el sistema.
• Por ejemplo, varios barcos pueden patrullar una región y cada región puede estar
patrullada por varios barcos (el barco Libertad patrulla la Region 1 y 2, mientras que el
barco Argentina patrulla solo la 3, y el barco Santa Ana patrulla la 2 y la 3)
• En este caso se debe pasar al 4TO PASO: se deben derivar nuevas tablas
En este paso se asignan atributos a las entidades. Son en general adjetivos, características de
las entidades que queremos registrar. En el diagrama se muestran como elipses atadas a los
rectángulos por líneas.
25
La naturaleza de la información no espacial Arq. M. Frassia
El sentido común nos dice que los atributos elegidos dependerán del uso que se deba dar a la
base de datos. De una misma persona puede interesarnos grupo y factor sanguíneo si estamos
diseñando el modelo de datos de un Hospital, o la carrera y promedio de notas si el diseño es
para una Universidad.
26
La naturaleza de la información no espacial Arq. M. Frassia
Muchos a Muchos:
• Si la relación es Muchos-a-Muchos, el modelo propone la descomposición de esta
relación en dos relaciones Uno-a-Muchos usando las llaves primarias de las tablas como
atributo en la tabla de conexión (o “asociativa”) creada.
• En este ejemplo se crea una tabla de conexión con una llave primaria compuesta por
las dos llaves primarias de las respectivas tablas, la de la Región y la de Barco.
• La combinación de ambas llaves constituye la llave principal de la tabla de conexión, que
llamaremos Patrulla.
• Esta tabla de conexión intermedia posibilita convertir una relación Muchos a Muchos
en relaciones Uno a muchos y Muchos a Uno
27
La naturaleza de la información no espacial Arq. M. Frassia
28
La naturaleza de la información no espacial Arq. M. Frassia
SOLUCIÓN DEFINITIVA
Así queda el diagrama EAR una vez resuelto el ejercicio
• Este modelo especifica la existencia de cuatro entidades, BARCO, CAPITÁN,
TRIPULACIÓN y REGIÓN, que se corresponden con otras tantas relaciones.
• Un BARCO tiene muchos TRIPULANTES (Uno a Muchos) pero solo 1 CAPITÁN (Uno a
Uno).
• Como REGIÓN y BARCO mantenían relación Muchos a Muchos se descompuso esta
relación en dos relaciones Uno-a-Muchos usando las llaves primarias de las tablas como
atributo en la tabla de conexión (o “asociativa”) creada. El resultado fue la tabla
PATRULLA
• Para cada una de las entidades existe un campo que las identifica únicamente y al cual se
denomina clave primaria de cada una de las tablas.
• Las entidades tienen otras propiedades que las describen y que se corresponden con los
distintos campos de la tabla.
29
La naturaleza de la información no espacial Arq. M. Frassia
6.1 Ventajas
• Posibilitan múltiples vistas de una misma base según los requerimientos de información
del sistema (¿Recuerda el modelo bancario?).
• Posibilitan bases de datos distribuidas, como bases divididas en partes que residen en
lugares geográficamente distantes, pero que están fuertemente vinculadas funcionando
como una base de datos (sino, no sería una bases de datos sino muchas separadas).
• Mantienen la integridad y calidad del sistema ya que los datos están separados de
las aplicaciones (toda lectura o escritura de información debe pasar por el DBMS).
6.2 Desventajas
• No soportan las relaciones complejas que existen en el mundo real. Por ejemplo,
objetos conformados de otros objetos (ejemplo: objeto propiedad compuesto de objetos
edificio, terreno y cerca).
• No tienen conocimiento semántico, es decir, no entienden qué significan los datos que
guardan. Por ejemplo, las bases de datos con información hidrológica no “saben” que el
agua fluye en declive. El conocimiento semántico es tan básico que debe ser compensado
por los programadores, creando aplicaciones a medida del usuario que hagan amigable al
sistema.
• Los tipos de datos son limitados (numéricos, alfanuméricos, etc.) y no reconoce tipos de
datos más complejos. Para dar ejemplos triviales, sería bueno que fueran capaces de
reconocer un dato de tipo Votante que seleccionara de una base de personas a los
30
La naturaleza de la información no espacial Arq. M. Frassia
individuos mayores de 18 años de edad, o un tipo de datos Día que sólo aceptara valores
de texto cuyos valores varíen entre domingo y lunes.
• Tienen dificultades con el tiempo considerado como una sucesión natural. Una
secuencia de hechos donde los eventos pasan antes o después de otros son muy difíciles
de modelar en una base de datos relacional.
Nota final
Es importante recalcar que mientras los modelos relacionales soportan relaciones uno a uno,
uno a muchos y muchos a uno, los GIS como Arcview 3.X sólo permiten relaciones uno a uno,
siendo está una de sus grandes debilidades. Imaginen la dificultad que significa para un
catastro no poder consultar las partidas de las múltiples unidades funcionales de un lote
Este problema esta resuelto en los GIS de última Generación, como el ArcView 8.1 que
reconoce relaciones 1 a 1 y las llama “Joints” y relaciones 1 a muchos a las cuales llama
“Relates”.
31
La naturaleza de la información no espacial Arq. M. Frassia
EVALUACIÓN
Actividad
A partir del problema planteado en el apartado 3 cree un diagrama Entidad-Atributo-Relación:
Si tiene alguna duda acerca de las ‘reglas de la organización’ que no haya sido aclarada, haga
una suposición y explicítela por escrito. Envíe este diagrama al tutor.
Si todavía está con ánimo, vuelva a su propio caso, tal como lo ha ido pensando a lo largo de
todas las clases. Elabore un diagrama para el mismo.
Una vez que haya concluido guarde la actividad en el mismo documento que uso para la
evacuación de la clase 1 y remita este documento al tutor para su corrección al finalizar el
curso.
Solicite la siguiente clase
32
La naturaleza de la información no espacial Arq. M. Frassia
GLOSARIO
Base de datos: Una base de datos es un conjunto de información relacionada con un asunto o
con una finalidad.
Datos: Los datos son hechos o cosas del mundo lo suficientemente importante como para ser
registrados. Son recopilados como hechos o evidencias. Adquieren significado a partir de su
procesamiento para convertirse en información. Al hablar de datos, hacemos referencia a un
concepto amplio que puede incluir texto, imágenes, sonido, reglas de decisión, etc.
Identificador: Se llama identificador a todo atributo o grupo de atributos cuyo valor identifica
la entidad bajo análisis. Posibilita la unión entre los elementos espaciales y las tablas externas
que habitualmente tienen las organizaciones.
Identificador primario El campo que identifica inequívocamente a una entidad.
Identificador secundario El campo de una tabla que está vinculado con el identificador
primario de otra tabla, creando así una relación
Query o consulta: es una declaración o grupo de declaraciones en idioma formal que permite
comunicarse con el DBMS para recuperar la información almacenada.
SQL (Structured Query Language): el más conocido de los llamados “lenguajes de consulta”
que posibilitan la manipulación de la información
Valor nulo: Es la ausencia de un valor. Si una columna particular de una fila es nula, quiere
decir que no se conocen los valores para esta información. Nulo no es lo mismo que cero. Este
concepto es importante en el momento de realizar estadísticas ya que los valores nulos no son
computados.
33