Está en la página 1de 38

Mdulo 1:

Cartografa, SIG y Tecnologas Asociadas

Captulo 2:
Fundamentos de Bases de Datos
Diplomado en SIG DIPLO-GIS 2005
Lima, Septiembre 2005

Temario
Aspectos

generales
Estructura de una base de datos
Tablas y sus elementos
Bases de datos relacionados (RDB)
De la realidad a la base de datos

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Aspectos generales de datos


Exigencias

generales: datos tiles deberan ser:

Relevantes

(con respecto al problema o tema de

estudio)
Completos (para ver todo el contexto)
Exactos (como requerido por el estudio)
Actuales (dependiendo del objetivo del estudio)
Econmicos (levantamiento y actualizacin)
Interpretables e inequvocos (para contribuir a
conclusiones correctas)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Estructura de una base de datos


Una

base de datos consiste en:

Una

sola tabla (base de datos plana), o


Una serie de tablas relacionadas (base de datos
relacionados, Relational Data Base, RDB)
Tabla

RDB: Tablas relacionadas


DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Tablas
Una

tabla es bidimensional y tiene como


elementos estructurales:
Filas

(o registros)
Columnas (o campos, variables)
Celdas conteniendo valores (es donde se cruzan una
fila y una columna)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Tablas
Identificador nico
Columna

Fila
Celda

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Tablas: entidades
Una

fila representa una entidad: un elemento de


la realidad que no puede ser dividido en
elementos del mismo tipo:
Un

centro poblado
Una ciudad
Un parque nacional
Una carretera
Etc.
El

conjunto de todas las filas representa la


totalidad de elementos representados en la tabla

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Tablas: entidades
Un

objeto es la representacin digital de una


entidad. Como consecuencia vale:
Entidad = Objeto
En ese caso especfico de datos espaciales, una
entidad puede ser representada por varios
objetos digitales:
Tramos

(objetos) que forman una solo ruta (entidad)


Islas que pertenecen al mismo departamento
Este

DIPLO-GIS 2005

tipo de objetos se llama multi-part features

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Tablas: entidades
Cada

entidad suele tener un identificador nico


(primary key) que la distingue de todas las otras
entidades
El identificador nico suele ser un nmero, pero
tambin puede ser alfanumrico (ms lento en el
caso de bases de datos grandes)
Para aumentar el rendimiento de bases de datos
(velocidad de bsqueda), se suele establecer un
ndice sobre el identificador nico (especie de
orden interno)
DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Tablas: variables
Cada

columna (campo, variable) representa una


caracterstica de las entidades, por ejemplo:
Los

nombres de reas protegidas


Los identificadores nicos
Las reas en hectreas
Los tipos de rea protegida
Cada

caracterstica debe ser descrita


inequvocamente y documentada
adecuadamente, especialmente en lo que se
refiere a la unidad de medicin (km, ha, m?)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

10

Tablas: variables
Durante

la creacin de la base de datos, se


asigna un nombre y se define un formato digital
para cada una de las variables
Por ejemplo, la definicin de la variable NOM
puede ser texto, 20 caracteres. Esto despus
permite ingresar letras, nmeros, smbolos y
espacios en blanco hasta 20 dgitos en total

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

11

Tablas: variables
Tenga

cuidado con la asignacin de nombres a


variable y siga las siguientes reglas:
Utilice

nombres cortos que no tengan ms de diez


caracteres
No utilice letras especiales (, , )
No utilice smbolos (@, $, , -, !, ) salvo el guin bajo
_
No introduzca espacios en blanco
Siempre comience con una letra
Aunque

muchas RDBMS (Relational Data Base


Management System) acepten letras especiales,
suelen ocurrir problemas despus

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

12

Tablas: variables
Las

siguientes diapositivas muestran posibles


formatos para variables. Note que la
disponibilidad y definicin de los formatos vara,
dependiendo del RDBMS
Siempre intente de mantener el tamao de la
base de datos tan pequeo como sea posible

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

13

Tablas: variables
Formatos Numricos Estndares para Columnas
Tipo
Decimal

Descripcin

Floating point
(Double)

DIPLO-GIS 2005

Representacin exacta del nmero


Hasta 38 dgitos, incluyendo punto
y decimales
Aproximacin numrica
dependiendo del sistema binario
Valores entre -1.79E+308 y
1.79E+308

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

Espacio
Mucho

Mediano
8 bytes

14

Tablas: variables
Formatos Numricos Estndares para Columnas
Tipo
Long integer

Descripcin

Integer

DIPLO-GIS 2005

Espacio

Representacin exacta de nmeros


enteros positivos y negativos
Valores entre -2,147,483,648 y
2,147,483,648

Poco
4 bytes

Representacin exacta de nmeros


enteros positivos y negativos
Valores entre -32,768 y 32,768

Muy poco
2 bytes

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

15

Tablas: variables
Otros Formatos Estndares para Columnas
Tipo
Text

Descripcin

Unicode

DIPLO-GIS 2005

Espacio

Caracteres alfanumricos
Hasta 255 caracteres
Se define el nmero mximo
permitido de caracteres

Depende de
los valores
ingresados
1 bytes por car.

Caracteres alfanumricos de
diferentes idiomas (ms de 4000
letras definidas)
Se define el nmero mximo
permitido de caracteres

Depende de
los valores
ingresados
2 bytes por car.

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

16

Tablas: variables
Otros Formatos Estndares para Columnas
Tipo

Descripcin

Espacio

Date

Fecha

Mediano
8 bytes

Boolean

Almacena slo yes o no

Muy poco
1 bit

Binary large
object (BLOB)

Varios tipos de datos que no


cuadran con los tipos estndares
Utilizado para datos multimedia
En general, slo se almacena una
referencia en la tabla

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

No aplicable

17

Tablas: valores
Una

celda (celdilla) almacena el valor de una


caracterstica de una entidad

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

18

Tablas y hojas de clculo


Una

tabla se puede parecer a una hoja de clculo.


Sin embargo, existen diferencias importantes:
El

formato es ms estricto y no puede variar:

Filas

entidades, columnas variables


Cada columna tiene un formato definido
En

la tabla no existen elementos secundarios como:

Ttulos
Lneas

en blanco
Grficos
Una

hoja de clculo puede contener varias tablas (en un


sentido ms amplio)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

19

Tablas y hojas de clculo


Una

tabla se puede convertir fcilmente en una


hoja de clculo
Antes de convertir una hoja de clculo en una
tabla, hay que limpiarla:
Eliminar

elementos secundarios
Eventualmente: reducir el contenido
Ajustar la estructura de filas y columnas
Definir el formato de las columnas
Asignar nombres a las columnas / variables

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

20

Reflexin
Porqu

hay que prestar tanta atencin a


definicin de formatos de variable?
Porqu, en general, no se pueden acceder
archivos de hojas de clculo desde un programa
SIG?
Qu utilidad tienen programas de hojas de
clculo en el contexto de SIG?
Nmeros se pueden almacenar en variables
definidas como de texto y como numricas.
Correcto o falso?
DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

21

Reflexin
Describa

en propias palabras y con ejemplos la


diferencia conceptual entre entidad y objeto!

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

22

RDB
Para

poder almacenar y manejar grandes


conjuntos de datos, y tambin para poder
modelar realidades ms complejas, se han
elaborado modelos ms sofisticados que la
simple tabla
Una de las metas fue: reduccin de la
redundancia de datos
El modelo ms exitoso ha sido el de la
Relational Data Base (RDB)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

23

RDB
La

RDB trabaja con una serie de tablas


relacionadas
Para relacionar una tabla con otra, se necesita:
Una

clave interna (una variable en la primera tabla)


Una clave externa (una variable en la segunda tabla)
Un vnculo
Ojo:

las variables de las dos claves deben ser


del mismo tipo (ambas definidas como texto, o
integer, etc.)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

24

RDB
El

vnculo conecta filas de las dos tablas que


tienen el mismo valor en la respectiva clave
Existen diferentes tipos de vnculos:
Uno-a-uno

(1:1)
Uno-a-varios (1:n)
Varios-a-uno (n:1)
Varios-a-varios (n:n)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

25

RDB

Dos tablas relacionadas (n:1) en un RDBMS


DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

26

RDB

La misma relacin en un simple diagrama


entidad relacin (Entity Relationship Diagram, ERD)
DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

27

RDB
Los

RDBMS permiten unir los contenidos de


tablas vinculadas mediante consultas (queries)
cuyos resultados se visualizan en vistas (views)

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

28

RDB

Consulta SQL para unir los contenidos de las dos tablas

Vista resultante
DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

29

RDB: normalizacin
Una

RDB debe ser consistente y sin redundancias


El respectivo proceso se llama normalizacin y
comprende tres pasos:
Regla

1: Eliminacin de relaciones internas / atributos


repetidos de una tabla
Regla 2: Todas las variables deben depender
directamente de la clave primaria / deben referirse a la
entidad
Regla 3: Eliminacin de variables que se refieren ms
que todo a otras variables

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

30

RDB: normalizacin
Regla

1: Eliminacin de relaciones internas /


atributos repetidos de una tabla
Ejemplo antes de la normalizacin:

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

31

RDB: normalizacin
Ejemplo

despus de la normalizacin:

2 tablas individuales

Vnculo 1:n
DIPLO-GIS 2005

Consulta
Mdulo 1 / Captulo 2: Fundamentos de bases de datos

32

RDB: normalizacin
Regla

2: Todas las variables deben depender


directamente de la clave primaria / deben
referirse a la entidad
Ejemplo antes de la normalizacin:

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

33

RDB: normalizacin
Ejemplo

despus de la normalizacin:

2 tablas individuales

Consulta

Vnculo n:1
DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

34

RDB: normalizacin
Regla

3: Eliminacin de variables que se


refieren ms que todo a otras variables
Ejemplo antes de la normalizacin:

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

35

RDB: normalizacin
Ejemplo

despus de la normalizacin:

2 tablas individuales

Consulta

Vnculo n:1
DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

36

De la realidad a la base de datos


Modelamiento

de datos:

Identificar

los objetos del estudio


Identificar las caractersticas (variables) de inters
Agrupar los objetos en clases
Sobre

esta base se desarrollan dos modelos:

El

modelo externo, que muestra la estructura de la


base de datos desde la perspectiva del usuario
El modelo interno, describiendo la forma como se
almacenan los datos dentro del RDBMS

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

37

Reflexin
Diseemos

una base de datos relacionados


con informacin sobre los estudiantes del curso!

DIPLO-GIS 2005

Mdulo 1 / Captulo 2: Fundamentos de bases de datos

38

También podría gustarte