Está en la página 1de 38

Mdulo 1: Cartografa, SIG y Tecnologas Asociadas

Captulo 2: Fundamentos de Bases de Datos


Diplomado en SIG DIPLO-GIS 2005 Lima, Septiembre 2005

Temario
Aspectos generales Estructura de una base de datos Tablas y sus elementos Bases de datos relacionados (RDB) De la realidad a la base de datos

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Aspectos generales de datos


Exigencias generales: datos tiles deberan ser:
Relevantes (con respecto al problema o tema de estudio) Completos (para ver todo el contexto) Exactos (como requerido por el estudio) Actuales (dependiendo del objetivo del estudio) Econmicos (levantamiento y actualizacin) Interpretables e inequvocos (para contribuir a conclusiones correctas)

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Estructura de una base de datos


Una base de datos consiste en:
Una sola tabla (base de datos plana), o Una serie de tablas relacionadas (base de datos relacionados, Relational Data Base, RDB)
Tabla

RDB: Tablas relacionadas


DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 4

Tablas
Una tabla es bidimensional y tiene como elementos estructurales:
Filas (o registros) Columnas (o campos, variables) Celdas conteniendo valores (es donde se cruzan una fila y una columna)

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Tablas
Identificador nico Columna

Fila Celda

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Tablas: entidades
Una fila representa una entidad: un elemento de la realidad que no puede ser dividido en elementos del mismo tipo:
Un centro poblado Una ciudad Un parque nacional Una carretera Etc.

El conjunto de todas las filas representa la totalidad de elementos representados en la tabla


DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 7

Tablas: entidades
Un objeto es la representacin digital de una entidad. Como consecuencia vale: Entidad = Objeto En ese caso especfico de datos espaciales, una entidad puede ser representada por varios objetos digitales:
Tramos (objetos) que forman una solo ruta (entidad) Islas que pertenecen al mismo departamento

Este tipo de objetos se llama multi-part features


DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 8

Tablas: entidades
Cada entidad suele tener un identificador nico (primary key) que la distingue de todas las otras entidades El identificador nico suele ser un nmero, pero tambin puede ser alfanumrico (ms lento en el caso de bases de datos grandes) Para aumentar el rendimiento de bases de datos (velocidad de bsqueda), se suele establecer un ndice sobre el identificador nico (especie de orden interno)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 9

Tablas: variables
Cada columna (campo, variable) representa una caracterstica de las entidades, por ejemplo:
Los nombres de reas protegidas Los identificadores nicos Las reas en hectreas Los tipos de rea protegida

Cada caracterstica debe ser descrita inequvocamente y documentada adecuadamente, especialmente en lo que se refiere a la unidad de medicin (km, ha, m?)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 10

Tablas: variables
Durante la creacin de la base de datos, se asigna un nombre y se define un formato digital para cada una de las variables Por ejemplo, la definicin de la variable NOM puede ser texto, 20 caracteres. Esto despus permite ingresar letras, nmeros, smbolos y espacios en blanco hasta 20 dgitos en total

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

11

Tablas: variables
Tenga cuidado con la asignacin de nombres a variable y siga las siguientes reglas:
Utilice nombres cortos que no tengan ms de diez caracteres No utilice letras especiales (, , ) No utilice smbolos (@, $, , -, !, ) salvo el guin bajo _ No introduzca espacios en blanco Siempre comience con una letra

Aunque muchas RDBMS (Relational Data Base Management System) acepten letras especiales, problemas suelen ocurrir despus
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 12

Tablas: variables
Las siguientes diapositivas muestran posibles formatos para variables. Note que la disponibilidad y definicin de los formatos vara, dependiendo del RDBMS Siempre intente de mantener el tamao de la base de datos tan pequeo como sea posible

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

13

Tablas: variables
Formatos Numricos Estndares para Columnas
Tipo Decimal Descripcin Representacin exacta del nmero Hasta 38 dgitos, incluyendo punto y decimales Aproximacin numrica dependiendo del sistema binario Valores entre -1.79E+308 y 1.79E+308 Espacio Mucho

Floating point (Double)

Mediano 8 bytes

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

14

Tablas: variables
Formatos Numricos Estndares para Columnas
Tipo Long integer Descripcin Representacin exacta de nmeros enteros positivos y negativos Valores entre -2,147,483,648 y 2,147,483,648 Representacin exacta de nmeros enteros positivos y negativos Valores entre -32,768 y 32,768 Espacio Poco 4 bytes

Integer

Muy poco 2 bytes

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

15

Tablas: variables
Otros Formatos Estndares para Columnas
Tipo Text Descripcin Caracteres alfanumricos Hasta 255 caracteres Se define el nmero mximo permitido de caracteres Caracteres alfanumricos de diferentes idiomas (ms de 4000 letras definidas) Se define el nmero mximo permitido de caracteres Espacio Depende de los valores ingresados 1 bytes por car. Depende de los valores ingresados 2 bytes por car.

Unicode

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

16

Tablas: variables
Otros Formatos Estndares para Columnas
Tipo Date Boolean Binary large object (BLOB) Fecha Almacena slo yes o no Varios tipos de datos que no cuadran con los tipos estndares Utilizado para datos multimedia En general, slo se almacena una referencia en la tabla
Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Descripcin

Espacio Mediano 8 bytes Muy poco 1 bit No aplicable

DIPLO-GIS 2005 DIPLO-

17

Tablas: valores
Una celda (celdilla) almacena el valor de una caracterstica de una entidad

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

18

Tablas y hojas de clculo


Una tabla se puede parecer a una hoja de clculo. Sin embargo, existen diferencias importantes:
El formato es ms estricto y no puede variar:
Filas entidades, columnas variables Cada columna tiene un formato definido

En la tabla no existen elementos secundarios como:


Ttulos Lneas en blanco Grficos

Una hoja de clculo puede contener varias tablas (en un sentido ms amplio)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 19

Tablas y hojas de clculo


Una tabla se puede convertir fcilmente en una hoja de clculo Antes de convertir una hoja de clculo en una tabla, hay que limpiarla:
Eliminar elementos secundarios Eventualmente: reducir el contenido Ajustar la estructura de filas y columnas Definir el formato de las columnas Asignar nombres a las columnas / variables

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

20

Reflexin
Porqu hay que prestar tanta atencin a definicin de formatos de variable? Porqu, en general, no se pueden acceder archivos de hojas de clculo desde un programa SIG? Qu utilidad tienen programas de hojas de clculo en el contexto de SIG? Nmeros se pueden almacenar en variables definidas como de texto y como numricas. Correcto o falso?
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 21

Reflexin
Describa en propias palabras y con ejemplos la diferencia conceptual entre entidad y objeto!

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

22

RDB
Para poder almacenar y manejar grandes conjuntos de datos, y tambin para poder modelar realidades ms complejas, se han elaborado modelos ms sofisticados que la simple tabla Una de las metas fue: reduccin de la redundancia de datos El modelo ms exitoso ha sido el de la Relational Data Base (RDB)

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

23

RDB
La RDB trabaja con una serie de tablas relacionadas Para relacionar una tabla con otra, se necesita:
Una clave interna (una variable en la primera tabla) Una clave externa (una variable en la segunda tabla) Un vnculo

Ojo: las variables de las dos claves deben ser del mismo tipo (ambas definidas como texto, o integer, etc.)

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

24

RDB
El vnculo conecta filas de las dos tablas que tienen el mismo valor en la respectiva clave Existen diferentes tipos de vnculos:
Uno-a-uno (1:1) Uno-a-varios (1:n) Varios-a-uno (n:1) Varios-a-varios (n:n)

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

25

RDB

Dos tablas relacionadas (n:1) en un RDBMS


DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 26

RDB

La misma relacin en un simple diagrama entidad relacin (Entity Relationship Diagram, ERD)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 27

RDB
Los RDBMS permiten unir los contenidos de tablas vinculadas mediante consultas (queries) cuyos resultados se visualizan en vistas (views)

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

28

RDB

Consulta SQL para unir los contenidos de las dos tablas

Vista resultante
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 29

RDB: normalizacin
Una RDB debe ser consistente y sin redundancias El respectivo proceso se llama normalizacin y comprende tres pasos:
Regla 1: Eliminacin de relaciones internas / atributos repetidos de una tabla Regla 2: Todas las variables deben depender directamente de la clave primaria / deben referirse a la entidad Regla 3: Eliminacin de variables que se refieren ms que todo a otras variables
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 30

RDB: normalizacin
Regla 1: Eliminacin de relaciones internas / atributos repetidos de una tabla Ejemplo antes de la normalizacin:

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

31

RDB: normalizacin
Ejemplo despus de la normalizacin:

2 tablas individuales

Vnculo 1:n
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Consulta
32

RDB: normalizacin
Regla 2: Todas las variables deben depender directamente de la clave primaria / deben referirse a la entidad Ejemplo antes de la normalizacin:

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

33

RDB: normalizacin
Ejemplo despus de la normalizacin:

2 tablas individuales

Vnculo n:1
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Consulta

34

RDB: normalizacin
Regla 3: Eliminacin de variables que se refieren ms que todo a otras variables Ejemplo antes de la normalizacin:

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

35

RDB: normalizacin
Ejemplo despus de la normalizacin:

2 tablas individuales

Vnculo n:1
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

Consulta

36

De la realidad a la base de datos


Modelamiento de datos:
Identificar los objetos del estudio Identificar las caractersticas (variables) de inters Agrupar los objetos en clases

Sobre esta base se desarrollan dos modelos:


El modelo externo, que muestra la estructura de la base de datos desde la perspectiva del usuario El modelo interno, describiendo la forma como se almacenan los datos dentro del RDBMS

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

37

Reflexin
Diseemos una base de datos relacionados con informacin sobre los estudiantes del curso!

DIPLO-GIS 2005 DIPLO-

Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap

38

También podría gustarte