Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Temario
Aspectos generales Estructura de una base de datos Tablas y sus elementos Bases de datos relacionados (RDB) De la realidad a la base de datos
Tablas
Una tabla es bidimensional y tiene como elementos estructurales:
Filas (o registros) Columnas (o campos, variables) Celdas conteniendo valores (es donde se cruzan una fila y una columna)
Tablas
Identificador nico Columna
Fila Celda
Tablas: entidades
Una fila representa una entidad: un elemento de la realidad que no puede ser dividido en elementos del mismo tipo:
Un centro poblado Una ciudad Un parque nacional Una carretera Etc.
Tablas: entidades
Un objeto es la representacin digital de una entidad. Como consecuencia vale: Entidad = Objeto En ese caso especfico de datos espaciales, una entidad puede ser representada por varios objetos digitales:
Tramos (objetos) que forman una solo ruta (entidad) Islas que pertenecen al mismo departamento
Tablas: entidades
Cada entidad suele tener un identificador nico (primary key) que la distingue de todas las otras entidades El identificador nico suele ser un nmero, pero tambin puede ser alfanumrico (ms lento en el caso de bases de datos grandes) Para aumentar el rendimiento de bases de datos (velocidad de bsqueda), se suele establecer un ndice sobre el identificador nico (especie de orden interno)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 9
Tablas: variables
Cada columna (campo, variable) representa una caracterstica de las entidades, por ejemplo:
Los nombres de reas protegidas Los identificadores nicos Las reas en hectreas Los tipos de rea protegida
Cada caracterstica debe ser descrita inequvocamente y documentada adecuadamente, especialmente en lo que se refiere a la unidad de medicin (km, ha, m?)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 10
Tablas: variables
Durante la creacin de la base de datos, se asigna un nombre y se define un formato digital para cada una de las variables Por ejemplo, la definicin de la variable NOM puede ser texto, 20 caracteres. Esto despus permite ingresar letras, nmeros, smbolos y espacios en blanco hasta 20 dgitos en total
11
Tablas: variables
Tenga cuidado con la asignacin de nombres a variable y siga las siguientes reglas:
Utilice nombres cortos que no tengan ms de diez caracteres No utilice letras especiales (, , ) No utilice smbolos (@, $, , -, !, ) salvo el guin bajo _ No introduzca espacios en blanco Siempre comience con una letra
Aunque muchas RDBMS (Relational Data Base Management System) acepten letras especiales, problemas suelen ocurrir despus
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 12
Tablas: variables
Las siguientes diapositivas muestran posibles formatos para variables. Note que la disponibilidad y definicin de los formatos vara, dependiendo del RDBMS Siempre intente de mantener el tamao de la base de datos tan pequeo como sea posible
13
Tablas: variables
Formatos Numricos Estndares para Columnas
Tipo Decimal Descripcin Representacin exacta del nmero Hasta 38 dgitos, incluyendo punto y decimales Aproximacin numrica dependiendo del sistema binario Valores entre -1.79E+308 y 1.79E+308 Espacio Mucho
Mediano 8 bytes
14
Tablas: variables
Formatos Numricos Estndares para Columnas
Tipo Long integer Descripcin Representacin exacta de nmeros enteros positivos y negativos Valores entre -2,147,483,648 y 2,147,483,648 Representacin exacta de nmeros enteros positivos y negativos Valores entre -32,768 y 32,768 Espacio Poco 4 bytes
Integer
15
Tablas: variables
Otros Formatos Estndares para Columnas
Tipo Text Descripcin Caracteres alfanumricos Hasta 255 caracteres Se define el nmero mximo permitido de caracteres Caracteres alfanumricos de diferentes idiomas (ms de 4000 letras definidas) Se define el nmero mximo permitido de caracteres Espacio Depende de los valores ingresados 1 bytes por car. Depende de los valores ingresados 2 bytes por car.
Unicode
16
Tablas: variables
Otros Formatos Estndares para Columnas
Tipo Date Boolean Binary large object (BLOB) Fecha Almacena slo yes o no Varios tipos de datos que no cuadran con los tipos estndares Utilizado para datos multimedia En general, slo se almacena una referencia en la tabla
Mdulo 1 / Captulo 2: Fundamentos de bases de datos Cap
Descripcin
17
Tablas: valores
Una celda (celdilla) almacena el valor de una caracterstica de una entidad
18
Una hoja de clculo puede contener varias tablas (en un sentido ms amplio)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 19
20
Reflexin
Porqu hay que prestar tanta atencin a definicin de formatos de variable? Porqu, en general, no se pueden acceder archivos de hojas de clculo desde un programa SIG? Qu utilidad tienen programas de hojas de clculo en el contexto de SIG? Nmeros se pueden almacenar en variables definidas como de texto y como numricas. Correcto o falso?
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 21
Reflexin
Describa en propias palabras y con ejemplos la diferencia conceptual entre entidad y objeto!
22
RDB
Para poder almacenar y manejar grandes conjuntos de datos, y tambin para poder modelar realidades ms complejas, se han elaborado modelos ms sofisticados que la simple tabla Una de las metas fue: reduccin de la redundancia de datos El modelo ms exitoso ha sido el de la Relational Data Base (RDB)
23
RDB
La RDB trabaja con una serie de tablas relacionadas Para relacionar una tabla con otra, se necesita:
Una clave interna (una variable en la primera tabla) Una clave externa (una variable en la segunda tabla) Un vnculo
Ojo: las variables de las dos claves deben ser del mismo tipo (ambas definidas como texto, o integer, etc.)
24
RDB
El vnculo conecta filas de las dos tablas que tienen el mismo valor en la respectiva clave Existen diferentes tipos de vnculos:
Uno-a-uno (1:1) Uno-a-varios (1:n) Varios-a-uno (n:1) Varios-a-varios (n:n)
25
RDB
RDB
La misma relacin en un simple diagrama entidad relacin (Entity Relationship Diagram, ERD)
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 27
RDB
Los RDBMS permiten unir los contenidos de tablas vinculadas mediante consultas (queries) cuyos resultados se visualizan en vistas (views)
28
RDB
Vista resultante
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 29
RDB: normalizacin
Una RDB debe ser consistente y sin redundancias El respectivo proceso se llama normalizacin y comprende tres pasos:
Regla 1: Eliminacin de relaciones internas / atributos repetidos de una tabla Regla 2: Todas las variables deben depender directamente de la clave primaria / deben referirse a la entidad Regla 3: Eliminacin de variables que se refieren ms que todo a otras variables
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap 30
RDB: normalizacin
Regla 1: Eliminacin de relaciones internas / atributos repetidos de una tabla Ejemplo antes de la normalizacin:
31
RDB: normalizacin
Ejemplo despus de la normalizacin:
2 tablas individuales
Vnculo 1:n
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap
Consulta
32
RDB: normalizacin
Regla 2: Todas las variables deben depender directamente de la clave primaria / deben referirse a la entidad Ejemplo antes de la normalizacin:
33
RDB: normalizacin
Ejemplo despus de la normalizacin:
2 tablas individuales
Vnculo n:1
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap
Consulta
34
RDB: normalizacin
Regla 3: Eliminacin de variables que se refieren ms que todo a otras variables Ejemplo antes de la normalizacin:
35
RDB: normalizacin
Ejemplo despus de la normalizacin:
2 tablas individuales
Vnculo n:1
DIPLO-GIS 2005 DIPLOMdulo 1 / Captulo 2: Fundamentos de bases de datos Cap
Consulta
36
37
Reflexin
Diseemos una base de datos relacionados con informacin sobre los estudiantes del curso!
38