Está en la página 1de 38

Mdulo 1:

Cartografa, SIG y Tecnologas Asociadas

Captulo 2:
Fundamentos de Bases de Datos

Diplomado en SIG DIPLO-GIS 2005


Lima, Septiembre 2005
Temario

Aspectos generales
Estructura de una base de datos
Tablas y sus elementos
Bases de datos relacionados (RDB)
De la realidad a la base de datos

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 2


Aspectos generales de datos

Exigencias generales: datos tiles deberan ser:


Relevantes (con respecto al problema o tema de
estudio)
Completos (para ver todo el contexto)
Exactos (como requerido por el estudio)
Actuales (dependiendo del objetivo del estudio)
Econmicos (levantamiento y actualizacin)
Interpretables e inequvocos (para contribuir a
conclusiones correctas)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 3


Estructura de una base de datos

Una base de datos consiste en:


Una sola tabla (base de datos plana), o
Una serie de tablas relacionadas (base de datos
relacionados, Relational Data Base, RDB)
Tabla

RDB: Tablas relacionadas


DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 4
Tablas

Una tabla es bidimensional y tiene como


elementos estructurales:
Filas (o registros)
Columnas (o campos, variables)
Celdas conteniendo valores (es donde se cruzan una
fila y una columna)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 5


Tablas
Identificador nico
Columna

Fila
Celda

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 6


Tablas: entidades

Una fila representa una entidad: un elemento de


la realidad que no puede ser dividido en
elementos del mismo tipo:
Un centro poblado
Una ciudad
Un parque nacional
Una carretera
Etc.
El conjunto de todas las filas representa la
totalidad de elementos representados en la
tabla
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 7
Tablas: entidades

Un objeto es la representacin digital de una


entidad. Como consecuencia vale:
Entidad = Objeto
En ese caso especfico de datos espaciales, una
entidad puede ser representada por varios
objetos digitales:
Tramos (objetos) que forman una solo ruta (entidad)
Islas que pertenecen al mismo departamento
Este tipo de objetos se llama multi-part
features
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 8
Tablas: entidades

Cada entidad suele tener un identificador nico


(primary key) que la distingue de todas las otras
entidades
El identificador nico suele ser un nmero, pero
tambin puede ser alfanumrico (ms lento en
el caso de bases de datos grandes)
Para aumentar el rendimiento de bases de
datos (velocidad de bsqueda), se suele
establecer un ndice sobre el identificador
nico (especie de orden interno)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 9


Tablas: variables

Cada columna (campo, variable) representa una


caracterstica de las entidades, por ejemplo:
Los nombres de reas protegidas
Los identificadores nicos
Las reas en hectreas
Los tipos de rea protegida
Cada caracterstica debe ser descrita
inequvocamente y documentada
adecuadamente, especialmente en lo que se
refiere a la unidad de medicin (km, ha, m?)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 10


Tablas: variables

Durante la creacin de la base de datos, se


asigna un nombre y se define un formato digital
para cada una de las variables
Por ejemplo, la definicin de la variable NOM
puede ser texto, 20 caracteres. Esto despus
permite ingresar letras, nmeros, smbolos y
espacios en blanco hasta 20 dgitos en total

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 11


Tablas: variables
Tenga cuidado con la asignacin de nombres a
variable y siga las siguientes reglas:
Utilice nombres cortos que no tengan ms de diez
caracteres
No utilice letras especiales (, , )
No utilice smbolos (@, $, , -, !, ) salvo el guin
bajo _
No introduzca espacios en blanco
Siempre comience con una letra
Aunque muchas RDBMS (Relational Data Base
Management System) acepten letras especiales,
suelen ocurrir problemas despus
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 12
Tablas: variables

Las siguientes diapositivas muestran posibles


formatos para variables. Note que la
disponibilidad y definicin de los formatos vara,
dependiendo del RDBMS
Siempre intente de mantener el tamao de la
base de datos tan pequeo como sea posible

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 13


Tablas: variables

Formatos Numricos Estndares para Columnas


Tipo Descripcin Espacio
Decimal Representacin exacta del nmero Mucho
Hasta 38 dgitos, incluyendo punto
y decimales
Floating point Aproximacin numrica Mediano
(Double) dependiendo del sistema binario 8 bytes
Valores entre -1.79E+308 y
1.79E+308

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 14


Tablas: variables

Formatos Numricos Estndares para Columnas


Tipo Descripcin Espacio
Long integer Representacin exacta de nmeros Poco
enteros positivos y negativos 4 bytes
Valores entre -2,147,483,648 y
2,147,483,648
Integer Representacin exacta de nmeros Muy poco
enteros positivos y negativos 2 bytes
Valores entre -32,768 y 32,768

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 15


Tablas: variables

Otros Formatos Estndares para Columnas


Tipo Descripcin Espacio
Text Caracteres alfanumricos Depende de
Hasta 255 caracteres los valores
Se define el nmero mximo ingresados
permitido de caracteres 1 bytes por car.
Unicode Caracteres alfanumricos de Depende de
diferentes idiomas (ms de 4000 los valores
letras definidas) ingresados
Se define el nmero mximo 2 bytes por car.
permitido de caracteres

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 16


Tablas: variables

Otros Formatos Estndares para Columnas


Tipo Descripcin Espacio

Date Fecha Mediano


8 bytes
Boolean Almacena slo yes o no Muy poco
1 bit
Binary large Varios tipos de datos que no No aplicable
object (BLOB) cuadran con los tipos estndares
Utilizado para datos multimedia
En general, slo se almacena una
referencia en la tabla

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 17


Tablas: valores

Una celda (celdilla) almacena el valor de una


caracterstica de una entidad

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 18


Tablas y hojas de clculo

Una tabla se puede parecer a una hoja de


clculo. Sin embargo, existen diferencias
importantes:
El formato es ms estricto y no puede variar:
Filas entidades, columnas variables
Cada columna tiene un formato definido
En la tabla no existen elementos secundarios como:
Ttulos
Lneas en blanco
Grficos
Una hoja de clculo puede contener varias tablas (en
un sentido ms amplio)
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 19
Tablas y hojas de clculo

Una tabla se puede convertir fcilmente en una


hoja de clculo
Antes de convertir una hoja de clculo en una
tabla, hay que limpiarla:
Eliminar elementos secundarios
Eventualmente: reducir el contenido
Ajustar la estructura de filas y columnas
Definir el formato de las columnas
Asignar nombres a las columnas / variables

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 20


Reflexin

Porqu hay que prestar tanta atencin a


definicin de formatos de variable?
Porqu, en general, no se pueden acceder
archivos de hojas de clculo desde un programa
SIG?
Qu utilidad tienen programas de hojas de
clculo en el contexto de SIG?
Nmeros se pueden almacenar en variables
definidas como de texto y como numricas.
Correcto o falso?
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 21
Reflexin

Describa en propias palabras y con ejemplos la


diferencia conceptual entre entidad y objeto!

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 22


RDB

Para poder almacenar y manejar grandes


conjuntos de datos, y tambin para poder
modelar realidades ms complejas, se han
elaborado modelos ms sofisticados que la
simple tabla
Una de las metas fue: reduccin de la
redundancia de datos
El modelo ms exitoso ha sido el de la
Relational Data Base (RDB)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 23


RDB

La RDB trabaja con una serie de tablas


relacionadas
Para relacionar una tabla con otra, se necesita:
Una clave interna (una variable en la primera tabla)
Una clave externa (una variable en la segunda tabla)
Un vnculo
Ojo: las variables de las dos claves deben ser
del mismo tipo (ambas definidas como texto, o
integer, etc.)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 24


RDB

El vnculo conecta filas de las dos tablas que


tienen el mismo valor en la respectiva clave
Existen diferentes tipos de vnculos:
Uno-a-uno (1:1)
Uno-a-varios (1:n)
Varios-a-uno (n:1)
Varios-a-varios (n:n)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 25


RDB

Dos tablas relacionadas (n:1) en un RDBMS

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 26


RDB

La misma relacin en un simple diagrama


entidad relacin (Entity Relationship Diagram, ERD)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 27


RDB

Los RDBMS permiten unir los contenidos de


tablas vinculadas mediante consultas (queries)
cuyos resultados se visualizan en vistas (views)

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 28


RDB

Consulta SQL para unir los contenidos de las dos


tablas

Vista resultante
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 29
RDB: normalizacin

Una RDB debe ser consistente y sin


redundancias
El respectivo proceso se llama normalizacin y
comprende tres pasos:
Regla 1: Eliminacin de relaciones internas / atributos
repetidos de una tabla
Regla 2: Todas las variables deben depender
directamente de la clave primaria / deben referirse a
la entidad
Regla 3: Eliminacin de variables que se refieren ms
que todo a otras variables
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 30
RDB: normalizacin

Regla 1: Eliminacin de relaciones internas /


atributos repetidos de una tabla
Ejemplo antes de la normalizacin:

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 31


RDB: normalizacin

Ejemplo despus de la normalizacin:

2 tablas individuales

Vnculo 1:n
Consulta
DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 32
RDB: normalizacin

Regla 2: Todas las variables deben depender


directamente de la clave primaria / deben
referirse a la entidad
Ejemplo antes de la normalizacin:

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 33


RDB: normalizacin

Ejemplo despus de la normalizacin:

2 tablas individuales

Vnculo n:1 Consulta

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 34


RDB: normalizacin

Regla 3: Eliminacin de variables que se


refieren ms que todo a otras variables
Ejemplo antes de la normalizacin:

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 35


RDB: normalizacin

Ejemplo despus de la normalizacin:

2 tablas individuales

Vnculo n:1 Consulta

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 36


De la realidad a la base de datos

Modelamiento de datos:
Identificar los objetos del estudio
Identificar las caractersticas (variables) de inters
Agrupar los objetos en clases
Sobre esta base se desarrollan dos modelos:
El modelo externo, que muestra la estructura de la
base de datos desde la perspectiva del usuario
El modelo interno, describiendo la forma como se
almacenan los datos dentro del RDBMS

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 37


Reflexin

Diseemos una base de datos relacionados


con informacin sobre los estudiantes del curso!

DIPLO-GIS 2005 Mdulo 1 / Captulo 2: Fundamentos de bases de datos 38

También podría gustarte