0% encontró este documento útil (0 votos)

123 vistas102 páginas

Introducción A Base Da Datos

Este documento introduce los conceptos básicos de las bases de datos, incluyendo la definición de un sistema de gestión de base de datos, las características de una base de datos, el modelo entidad-relación y los tipos de datos. También explica cómo diseñar una base de datos, crear tablas, normalizar datos y manipular datos usando el lenguaje SQL.

Cargado por

Over Luis Marzola Oviedo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

123 vistas102 páginas

Introducción A Base Da Datos

Cargado por

Over Luis Marzola Oviedo

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

INTRODUCCIÓN A

BASE DE DATOS

Dra. D.ª Liliana Gavidia Ceballos

GRADO EN INGENIERTÍA INFORMÁTICA

Modulo de Formación Obligatoria
Este material es de uso exclusivo para los alumnos
de la Universidad Internacional de Valencia. No
Internacional está permitida la reproducción total o parcial de su
contenido ni su tratamiento por cualquier método
de Valencia por aquellas personas que no acrediten su relación
con la Universidad Internacional de Valencia, sin
autorización expresa de la misma.

Edita
Universidad Internacional de Valencia
Grado en
Ingeniería Informática

Base de datos
Modulo de Formación Obligatoria
6 ECTS

Dra. D.ª Liliana Gavidia Ceballos

Leyendas

Enlace de interés Ejemplo Importante

Los términos resaltados a lo largo del contenido en color naranja se recogen en el apartado GLOSARIO.
Índice

UNIDAD DE APRENDIZAJE 1. INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1. Definición de un Sistema de Gestión de Base de Datos (SGBD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2. Características de una base de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3. Modelo Entidad-Relación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.1. Entidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.2. Atributos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.3. Relación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4. Diseño de una Base de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.5. Tipos de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.6. Creación de una Base de Datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.7. Creación de una tabla. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.1. Primera Forma de Normalización (1NF). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.2. Segunda Forma de Normalización (2NF). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3. Tercera Forma de Normalización (3NF) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.4. Creación de un modelo de datos relacional usando los conceptos aprendidos anteriormente. . . . . . . 25

2.4.1. De Alto Nivel, Conceptuales o Semánticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.4.2. De Implementación, Lógicos o Tradicionales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.4.3. De Bajo Nivel o Físicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.5. Jupyter Notebook como herramienta de familiarización con el Lenguaje SQL. . . . . . . . . . . . . . . . . . . . . . . . 27

UNIDAD DE APRENDIZAJE 2. CÓMO MANIPULAR DATOS CON EL LENGUAJE SQL . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1. Lenguaje de Definición de Datos (DDL). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1.1. CREATE (DATABASE, ROLE, TABLE, VIEW). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1.2. ALTER TABLE nombre_tabla ADD COLUMN nombre_columna tipo_ variable . . . . . . . . . . . . . . . . . . . . . . 30

3.1.3. DROP(DATABASE, ROLE, TABLE, VIEW). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2. Lenguaje de Manipulación de Datos (DML). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2.1. SELECT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.2.2. INSERT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.2.3. UPDATE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.2.4. DELETE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.3. Lenguaje de Control de Datos (DCL) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.3.1. GRANT. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

5
Índice
Internacional
de Valencia

3.3.2. REVOKE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.4. Expresiones de búsquedas selectivas, agrupación y orden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4.1. LIKE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4.2. Funciones de agregacion SUM, MAX, MIN, COUNT, AVG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.4.3. GROUP BY. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.4.4. ORDER BY. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.5. Expresiones avanzadas SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.5.1. Índices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.5.2. Restricciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.5.3. Uniones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

UNIDAD DE APRENDIZAJE 3. CONCEPTOS Y FUNCIONES DE UN SISTEMA DE GESTIÓN DE BASES DE

DATOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1. Propiedades deseables en las transacciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1.1. Atomicidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1.2. Consistencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1.3. Aislamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.1.4. Durabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.2. Niveles de aislamiento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.2.1. Serializable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.2.2. Lecturas Comprometidas (Committed Read). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.2.3. Lecturas No Comprometidas (Uncommitted Read) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3. Estados de una transacción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3.1. Activa (Active). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3.2. Fallida (Failed). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.3.3. Abortada (Rolled Back) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.3.4. Parcialmente Confirmada (Uncommitted) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.3.5. Confirmada (Committed). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.5. Planificaciones y concurrencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.6. Problemas con la concurrencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.6.1. Actualización Perdida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.6.2. Lectura sucia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.6.3. Lectura No Repetible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.6.4. Lectura Fantasma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

6
Introducción a Base de Datos
Internacional
de Valencia

4.7. Bloqueos de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.7.1. Lectura Comprometida (Committed Read). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.7.2. Lectura Repetible (Repeatable Read). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.7.3. Serializable (Serializable). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

[Link] de la seguridad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.8.1. Cifrado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.8.2. Métodos de autenticación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.8.3. Mecanismos de control de acceso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.8.4. Vulnerabilidades y ataques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.8.5. Ataque de Inyección SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

UNIDAD DE APRENDIZAJE 4. BASES DE DATOS NO RELACIONALES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.1. NoSQL (Not only Structured Query Language) (No solo Lenguaje de Consulta Estructurado). . . . . . . . 63

5.2. Clasificación de las bases de datos NoSQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.2.1. Orientadas a documentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.2.2. Orientadas a columnas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2.3. De clave valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2.4. En grafos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.3. MongoDB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.3.1. Instalación de MongoDB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.4. ¿Qué es CRUD?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.5. Programación orientada a objetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.6. Endpoints . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.7. API . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.8. REST. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.9. JSON. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

UNIDAD DE APRENDIZAJE 5. DESARROLLO DE APLICACIONES BAJO ENTORNO WEB USANDO BASES DE

DATOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.1. Modelo Vista Controlador (MVC). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.2. ORM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

6.3. SQLALCHEMY. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.4. Procesador de Plantillas (Template Engine). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

6.5. Framework de desarrollo Flask . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

7
Índice
Internacional
de Valencia

6.5.1. Estructura de una aplicación de Flask. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

6.5.2. Formularios web usando Flask como framework. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

6.6. ¿Qué es Big Data?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6.7. Internet de las Cosas (IoT) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

GLOSARIO. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

ENLACES DE INTERÉS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Referencias bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

BIBLIOGRAFÍA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Bibliografía recomendada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

8
Unidad de aprendizaje 1

Introducción

Las bases de datos son entidades o sistemas informáticos que funcionan como almacén para guardar
grandes volúmenes de información, con la menor redundancia posible. La idea principal de las bases
de datos, además de almacenar información, es que estos datos estén disponibles para diferentes
usuarios y programas. Esto nos lleva a relacionar el concepto de base de datos con conceptos de
redes informáticas para poder acceder a los datos desde cualquier dispositivo, específicamente
a través del modelo cliente-servidor, que revisaremos más adelante. Se revisa el modelo de datos
Entidad- Relación, las formas de normalización que ayuda a seguir de forma ordenada un procedi-
miento que reúne las mejores prácticas para el modelado de datos, se ve en detalle la sintaxis del
lenguaje SQL, que permite crear tablas y bases de datos, y realizar consultas y actualizaciones de los
datos almacenados en las mismas.

1.1. Definición de un Sistema de Gestión de Base de Datos (SGBD)

Los Sistemas de Gestión de Base de Datos, abreviado SGBD, del inglés Data Base Management
System (DBMS) son aquellos que permiten almacenar y posteriormente acceder a los datos de forma
rápida y estructurada. Pueden definirse como una colección de rutinas de software que sirven para
definir, crear y poblar, y manipular una base de datos. Entre los principales SGBD utilizados actual-
mente tenemos: Oracle, MySQL, Microsoft SQL SERVER, PostgreSQL, entre otros.

9
Unidad de aprendizaje 1. Introducción
Internacional
de Valencia

Las bases de datos se dividen principalmente entre relacionales y no relacionales (No SQL o Not Only
SQL). En este curso nos centraremos principalmente en las bases de datos relacionales, pero también
revisaremos diversos conceptos fundamentales de las bases de datos no relacionales, para hacer
algunos ejemplos prácticos de su uso en Internet de las Cosas (Internet of Things).

1.2. Características de una base de datos

Entre las principales características de los sistemas de base de datos se puede mencionar:

•• Independencia lógica y física de los datos. Las bases de datos no deben depender del sistema
operativo o los programas que interactúen con ella.

•• Redundancia mínima. Cada pieza de información es almacenada una sola vez y en un único lugar,
evitando problemas de inconsistencias que pueden generarse al hacer cambios sobre informa-
ción que se guarda con múltiples copias.

•• Acceso concurrente por parte de múltiples usuarios. Múltiples operaciones pueden llevarse a
cabo al mismo tiempo en la misma base de datos.

•• Integridad de los datos. La información se mantiene sin pérdidas.

•• Consultas complejas optimizadas.

•• Seguridad de acceso y auditoría. Sólo usuarios autorizados pueden acceder al sistema, y el sis-
tema lleva un registro de las transacciones realizadas, por lo que es auditable.

•• Respaldo y recuperación.

•• Acceso a través de lenguajes de programación estándar.

Vídeo. Características de una

Base de datos

1.3. Modelo Entidad-Relación

El modelo Entidad-Relación es una herramienta para el modelado de datos de un sistema de infor-
mación, y una sintaxis visual para el diseño de DB que permite representar las entidades, es decir los
objetos reales o elementos principales que se identifican en el problema a resolver, y las relaciones y
asociaciones entre las diversas entidades.

10
Introducción a Base de Datos
Internacional
de Valencia

Vídeo. Modelo Entidad - Relación

1.3.1. Entidad

Una entidad es cualquier cosa u objeto, ya sea real o abstracto sobre los que deseamos almacenar
algún tipo de información.

Son los objetos individuales. Como ejemplo de entidades podemos mencionar: pasajeros, vuelos,
tarifas, tarjetas de embarque, etc.

1.3.2. Atributos

Los atributos son características que describe a la entidad. El dominio es el conjunto de valores posi-
bles de los atributos.

En el diseño de una base de datos relacional, normalmente lo primero que se hace es definir las enti-
dades a considerar según el problema que se desea abordar y cuáles son los atributos (campos)
asociados de manera directa a cada entidad. Se define una tabla por cada entidad, la cual se repre-
senta mediante un recuadro. En ella:

•• El título representa la entidad.

•• La lista de elementos en el interior del recuadro representa los atributos que describen a la entidad.

A continuación se muestra la representación de la entidad: vuelos.

Vuelos
id
origen
destino
hora-salida
hora-llegada
aerolínea

Tabla 1. Representación de una entidad en una tabla.

En ella, el atributo id es el identificador único de la identidad, es decir, de cada vuelo en particular, por
lo que id se escogerá como clave primaria en la tabla que represente a la entidad vuelos. Los campos
de la tabla serán entonces: id, origen, destino, hora-salida, hora-llegada, aerolínea.

11
Unidad de aprendizaje 1. Introducción
Internacional
de Valencia

En el caso que ninguno de los atributos pudiera usarse como clave primaria, podría escogerse una
combinación de múltiples campos como clave primaria, que proporcionará la característica de identi-
ficar de manera única a la entidad.

1.3.3. Relación

En un modelo de datos, una vez definidas las entidades que componen la base de datos, y los atri-
butos que la describen, se establecen las relaciones entre las diversas entidades. Como dijimos ante-
riormente, se define una tabla por cada entidad.

Las relaciones entre tablas pueden ser del tipo:

•• Uno a Uno: En esta relación, un registro de una tabla se asocia a un único registro de la otra tabla
y viceversa.

Ejemplo: cada pasajero tiene una única tarjeta de embarque y cada tarjeta de embarque perte-
nece a un único pasajero.

Pasajeros Tarjeta-embarque
id-pasajero id-tarjeta-embarque
apellido id-pasajero
nombre fecha-vuelo
fecha-nacimiento nro-vuelo
sexo clase
teléfono asiento
email sala-embarque

Tabla 2. Relación Uno a Uno entre tablas.

•• Uno a Muchos: En esta relación, un registro de una tabla se asocia a uno o varios registros de
la otra tabla.

Ejemplo: cada vuelo tiene muchos pasajeros.

A continuación se ilustra la relación Uno a Muchos entra las tablas vuelos y pasajeros.

Vuelos Pasajeros Listado-pasajeros-vuelos

id id-pasajero id-vuelo
origen apellido id-pasajero
destino nombre fecha
hora-salida fecha-nacimiento
hora-llegada sexo
aerolínea teléfono
email

Tabla 3. Relación Uno a Muchos entre tablas.

12
Introducción a Base de Datos
Internacional
de Valencia

Para manejar esta relación de manera adecuada, se crea la tabla listado-pasajeros-vuelos, con los
campos id-vuelo, id-pasajero y fecha, para eliminar la redundancia de un mismo número de vuelo
agendado en diferentes días de la semana.

•• Muchos a muchos: En esta relación, varios registros de una tabla se asocian a varios registros
de la otra tabla 6.

Ejemplo: un pasajero puede tener varias reservaciones y a su vez una reservación puede estar
asociada a varios pasajeros, lo cual ilustra la relación Muchos a Muchos.

Pasajeros Reserva-vuelos
id-pasajero id-reserva
apellido trayecto
nombre tramo
fecha-nacimiento id-vuelo
sexo fecha-salida
teléfono fecha-llegada
email nro-adultos
nro-niños
nro-tercera-edad
clase

Tabla 4. Relación Muchos a Muchos entre tablas.

Nota: En la tabla reserva-vuelos, el campo trayecto puede tomar los valores ida o retorno; el campo
tramo toma los valores 1, 2, 3, etc. El registro de cada tramo corresponde a cada vuelo (inicial y cone-
xiones) como parte de la ruta hasta llegar al destino final. Si el vuelo es directo, la reserva tendrá un
solo tramo.

Este tipo de relaciones (1:1, 1: N, M: N) establecen la Cardinalidad de la base de datos.

Aquellas relaciones que sean de muchos a muchos pueden generar duplicidad de datos en la misma
tabla, lo cual es una condición no deseable, pues genera ambigüedades, y posibles errores e inconsis-
tencias. Para evitar esto, se puede definir una tercera tabla cuya clave primaria sea la combinación de
las claves externas de las tablas que tienen la relación muchos a muchos.

A continuación se ilustra cómo en la relación Muchos a Muchos entra las tablas pasajeros y reserva-
vuelos se reducen las redundancias al definir una tercera tabla detalles-viajeros, cuya clave primaria
es la combinación de las claves primarias de las dos tablas anteriores.

13
Unidad de aprendizaje 1. Introducción
Internacional
de Valencia

Pasajeros Reserva-vuelos Detalles-viajeros

id-pasajero id-reserva id-reserva
apellido trayecto id-pasajero
nombre tramo
fecha-nacimiento id-vuelo
sexo fecha-salida
teléfono fecha-llegada
email nro-adultos
nro-niños
nro-tercera-edad
clase

Tabla 5. Eliminación de redundancias en una relación Muchos a Muchos.

En este ejemplo, la relación muchos a muchos se lleva a uno a muchos cuando se introduce el id de
la reservación y el id de cada pasajero en la tabla detalles-viajeros. La clave primaria (única) de esta
tabla es la combinación de ambos id (id-reservación e id-pasajero).

1.4. Diseño de una Base de Datos

Se requiere aplicar una serie de principios en el diseño de bases de datos para su correcto funciona-
miento y su efectividad a la hora de realizar búsquedas y manipulación de los datos almacenados en ella.

El punto de entrada es la creación de un modelo de datos que permita:

•• Eliminar los datos redundantes, evitando consumos innecesarios de espacio en disco.

•• Mantener la integridad de los datos almacenados.

•• Permitir un acceso rápido y eficiente a la información sensible.

Una base de datos se descompone en tablas que contienen datos relacionados entre sí. Las varia-
bles de la tabla se conocen como campos o atributos, y los nombres de los campos encabezan las
columnas de la tabla. Las columnas de los campos contienen un solo tipo de información.

Vídeo. Diseño de una Base de Datos

Los registros de la base de datos se corresponden con las filas de las tablas. Un registro viene a ser
una ocurrencia de los campos de las tablas.

A continuación se muestra una tabla vuelos, que contiene 7 registros con los campos: id, nº de vuelo,
origen, destino, aerolínea, hora-salida, hora-llegada.

14
Introducción a Base de Datos
Internacional
de Valencia

id nro-vuelo origen destino aerolínea hora-salida hora-llegada

1 IB6674 CARACAS MADRID IBERIA 19:50 10:15
1 IB6674 CARACAS MADRID IBERIA 19:50 10:15
1 IB6674 CARACAS MADRID IBERIA 19:50 10:15
2 TK1836 BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40
3 LH0920 FRANCFORT LONDRES LUFTHANSA 20:00 20:40
4 LX0633 PARIS ZURICH SWISS 9:50 11:10
5 AA5823 DALLAS BEIJING AMERICAN 11:20 14:15
AIRLINES

Tabla 6. Ejemplo de una tabla en una base de datos.

En cada columna se asigna un tipo de datos que garantice consistencia.

El tipo de datos de cada campo (entero, decimal, texto, fecha, etc.) se define en el esquema de la base
de datos, al cual nos referiremos de ahora en adelante como schema.

A continuación se mencionan los tipos de datos más comúnmente usados:

1.5. Tipos de datos

Los datos que se almacenan en una base de datos tienen que ser de un determinado tipo:

INTEGER: usado cuando se quiere almacenar un número entero, es decir, que no contiene ningún
decimal.

DECIMAL: usado cuando se quiere almacenar un número que típicamente contiene algún decimal.

SERIAL: es también un entero, pero con la particularidad que se va incrementando automáticamente,

es decir, cada vez que se añade un nuevo registro, incrementa su valor en una unidad de manera auto-
mática.

VARCHAR: cadena de caracteres de longitud variable. Este sería el tipo a usar si se quiere almacenar
algún texto, frase o palabra.

TIMESTAMP: usado cuando se quiere almacenar fecha y hora.

BOOLEAN: usado para almacenar valores verdadero o falso de una variable.

ENUM: usado para almacenar uno de varios posibles valores discretos que puede tomar una variable.

15
Unidad de aprendizaje 1. Introducción
Internacional
de Valencia

Vídeo. Tipos de datos

1.6. Creación de una Base de Datos

Para crear una base de datos: sistema-reservaciones, mostramos a continuación la sintaxis de SQL
correspondiente.

CREATE DATABASE sistema-reservaciones;

Figura 1. Creación de una base de datos.

1.7. Creación de una tabla

Para crear una tabla vuelos, con los campos: id, origen, destino, duración, mostramos a continuación
la sintaxis de SQL correspondiente.

CREATE TABLE vuelos (

id SERIAL PRIMARY KEY,
origen VARCHAR NOT NULL,
destino VARCHAR NOT NULL,
duración INT NOT NULL
);

Figura 2. Creación de una tabla.

En este caso, vuelos es el nombre de la tabla, y luego se especifica qué tipo de información va a
contener la tabla:

El id es la referencia de cada vuelo individual.

El atributo SERIAL indica que la referencia id es un entero que se va incrementando uno a uno de
manera automática. El primer vuelo sería el número 1, el segundo el número 2 y así sucesivamente.

El atributo PRIMARY KEY indica que id es la referencia principal y que además identifica a cada vuelo
de manera única. La referencia hace más fácil ubicar un vuelo. Por ejemplo, se ubica el vuelo por la
referencia 2734 y se obtienen todos los detalles asociados a él. De no tenerla, tendría que indicarse un
vuelo cuyo origen es tal y cual y cuyo destino es tal y cual, que sería mucho más engorroso. Tener una
referencia en cada tabla permite ubicar los registros de manera más práctica y eficiente.

16
Introducción a Base de Datos
Internacional
de Valencia

Tanto el parámetro origen como destino son de tipo VARCHAR, y corresponden a la ciudad en la que
se origina el vuelo y la ciudad de destino, respectivamente.

El atributo duración es de tipo ENTERO y representa la duración del vuelo en minutos.

El atributo NOT NULL indica que el parámetro siempre debe tomar un valor, no puede ser vacío. Un
vuelo siempre tiene que tener un origen, un destino y una duración, por eso se le añade el atributo NOT
NULL. Si se trata de ingresar un vuelo sin indicar un origen o destino, o la duración, el sistema lo va a
rechazar. Esta es una manera de asignar restricciones (constraints) sobre la base de datos.

Vídeo. Creación de una Tabla

17
Unidad de aprendizaje 2

Normalización de la base de datos

Se conoce como Formas de Normalización a una serie de técnicas y recomendaciones aplicadas siste-
máticamente al modelo de datos a fin de eliminar información redundante en las tablas de una base
de datos. Esto evita problemas y errores que pudieran ocurrir al insertar, eliminar o actualizar regis-
tros en las tablas. A su vez, permite el uso eficiente del espacio que ocupan en memoria las tablas de
la base de datos, así como mantener la integridad de los datos y su escalabilidad.

Vídeo. Normalización de la BD

Considere la siguiente tabla: vuelos.

19
Id Nro-vuelo Origen Destino Aerolínea Hora-salida Hora-llegada Pasaporte Apellido Nombre

1 IB6674 CARACAS MADRID IBERIA 19:50 10:15 06678450 Gavidia Liliana

1 IB6674 CARACAS MADRID IBERIA 19:50 10:15 32775484 Jiménez José

1 IB6674 CARACAS MADRID IBERIA 19:50 10:15 02115537 Ceballos Olga

2 TK1836 BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40 15978124 Rodríguez Ernesto
Unidad de aprendizaje 2. Normalización de la Base de datos

3 LH0920 FRANCFORT LONDRES LUFTHANSA 20:00 20:40 21447895 Pérez Pedro

4 LX0633 PARIS ZURICH SWISS 9:50 11:10 82139600 González Judith

5 AA5823 DALLAS BEIJING AMERICAN AIRLINES 11:20 14:15 12115432 González Elena

Tabla 7. Ejemplo de una tabla en una base de datos con problemas de redundancia y potenciales problemas de inconsistencia.
de Valencia
Internacional

20
Introducción a Base de datos
Internacional
de Valencia

Nótese que en los registros 1, 2 y 3 hay información repetida al tener los tres pasajeros el mismo vuelo
(problemas de redundancia).

Si quisiéramos ingresar un nuevo vuelo que aún no tiene pasajeros, tendríamos que esperar a que
tuviera algún pasajero para ingresarlo, o tendríamos que colocar como nulos (NULL) los datos del
pasajero. Por otra parte, si quisiéramos ingresar 150 pasajeros de un mismo vuelo, tendríamos que
repetir la misma información del vuelo ciento cincuenta veces (problemas de inserción y redundancia).

Si se produce un retraso en el vuelo Caracas-Madrid, tendríamos que actualizar la hora de salida de

todos los pasajeros de ese vuelo. Si por error omitimos algún pasajero, generaríamos una inconsis-
tencia en los datos (problemas de actualización). También tenemos información faltante (fecha de
salida del vuelo), lo cual generaría problemas de actualización al no saber si los pasajeros tienen el
mismo número de vuelo pero viajan en fechas distintas.

Por último, si elimináramos cualquier pasajero en los registros 4 al 7, perderíamos la información de

su vuelo correspondiente (problemas de eliminación). Esto sucede debido a que la tabla contiene
información de dos entidades diferentes (vuelos y pasajeros).

En el proceso de normalización, lo que se hace es dividir la tabla en relaciones más pequeñas, de

manera de eliminar las dependencias redundantes.

A continuación se ilustra la división de una tabla en relaciones más pequeñas a fin de eliminar
de redundancias.

Tabla códigos-vuelo
Id Nro-vuelo
1 IB6674
1 IB6674
1 IB6674
2 TK1836
3 LH0920
4 LX0633
5 AA263

Tabla vuelos
Id-vuelo Origen Destino Aerolínea Hora-salida Hora-llegada
1 CARACAS MADRID IBERIA 19:50 10:15
1 CARACAS MADRID IBERIA 19:50 10:15
1 CARACAS MADRID IBERIA 19:50 10:15
2 BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40
3 FRANCFORT LONDRES LUFTHANSA 20:00 20:40
4 PARIS ZURICH SWISS 9:50 11:10
5 DALLAS BEIJING AMERICAN AIRLINES 11:20 14:15

Tabla 8. División de una tabla en una base de datos en relaciones más pequeñas a fin de eliminar de redundancias.

21
Unidad de aprendizaje 2. Normalización de la Base de datos
Internacional
de Valencia

Tabla pasajeros
Id-pasajero Pasaporte Apellido Nombre
1 06678450 Gavidia Liliana
2 32775484 Jiménez José
3 02115537 Ceballos Olga
4 15978124 Rodríguez Ernesto
5 21447895 Pérez Pedro
6 82139600 González Judith
7 12115432 González Elena

Tabla tarjeta-embarque
Id-vuelo Id-pasajero Fecha-salida
1 1 06/06/2018
1 2 06/06/2018
1 3 06/06/2018
2 4 16/06/2018
3 5 30/06/2018
4 6 06/07/2018
5 7 07/07/2018

Tabla 9. División de una tabla en una base de datos en relaciones más pequeñas a fin de eliminar de redun-
dancias (Cont.).

Adicionalmente, se podrían añadir los campos clase, asiento y sala a la tabla tarjeta-embarque.

Los problemas antes mencionados se suelen corregir al aplicar de manera sistemática las reglas de
normalización en la creación del modelo de datos, las cuales se subdividen en las siguientes formas
normales:

2.1. Primera Forma de Normalización (1NF)

La Primera Forma de Normalización establece que cada campo contiene un solo valor, es decir, no
puede tomar múltiples valores.

La clave primaria de la tabla que representa una entidad, representa a cada instancia de la entidad de
manera única, por lo que no hay registros repetidos.

El campo (o combinación de campos) escogidos como clave primaria no tienen valores repetidos ni
duplicados en la tabla.

Ejemplo: La tabla mostrada a continuación no cumple con la primera forma de normalización porque
hay múltiples elementos en el campo días-semana de un mismo registro y porque hay dos registros
repetidos (no existe clave primaria).

22
Introducción a Base de datos
Internacional
de Valencia

Días- Hora- Hora-

Id-vuelo Origen Destino Aerolínea
semanas salida llegada
IB6674 mar, jue CARACAS MADRID IBERIA 19:50 10:15
TK1836 mar BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40
LH0920 lun, jue FRANCFORT LONDRES LUFTHANSA 20:00 20:40
LH0920 lun, jue FRANCFORT LONDRES LUFTHANSA 20:00 20:40

Tabla 10. Ejemplo de una tabla en una base de datos que no cumple con la primera forma de normalización 1NF.

La misma tabla modificada, de manera que cumpla con la norma 1NF.

Días- Hora-lle- Hora-lle-

Id-vuelo Origen Destino Aerolínea
semanas gada gada
IB6674 mar, jue CARACAS 10:15 10:15 MADRID IBERIA
IB6674 mar, jue CARACAS 10:15 10:15 MADRID IBERIA
TK1836 mar BARCELONA 17:40 17:40 ESTAMBUL TURKISH AIRLINES
LH0920 lun, jue FRANCFORT 20:40 20:40 LONDRES LUFTHANSA
LH0920 lun, jue FRANCFORT 20:40 20:40 LONDRES LUFTHANSA

Tabla 11. Ejemplo de una tabla en una base de datos que sí cumple con la primera forma de normalización 1NF.

La clave primaria escogida es la combinación id-vuelo junto con días-semana.

2.2. Segunda Forma de Normalización (2NF)

La Segunda Forma de Normalización establece que todos los campos que no son claves o índices
dependen de todos los componentes de la clave primaria.

Ejemplo: La tabla mostrada a continuación no cumple con la segunda forma de normalización porque
los campos origen, destino, aerolínea, hora-salida, hora-llegada dependen del vuelo, pero no del día
de la semana.

Días Hora- Hora-

Id-vuelo Origen Destino Aerolínea
semanas salida llegada
IB6674 mar, jue CARACAS MADRID IBERIA 19:50 10:15
IB6674 mar, jue CARACAS MADRID IBERIA 19:50 10:15
TK1836 mar BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40
LH0920 lun, jue FRANCFORT LONDRES LUFTHANSA 20:00 20:40
LH0920 lun, jue FRANCFORT LONDRES LUFTHANSA 20:00 20:40

Tabla 12. Ejemplo de una tabla en una base de datos que no cumple con la segunda forma de normalización 2NF.
La misma tabla modificada, de manera que cumpla con la norma 2NF:

23
Unidad de aprendizaje 2. Normalización de la Base de datos
Internacional
de Valencia

Id-vuelo Días-semana
IB6674 mar
IB6674 jue
TK1836 mar
LH0920 lun
LH0920 jue

Id-vuelo Origen Destino Aerolínea Hora-salida Hora-llegada

IB6674 CARACAS MADRID IBERIA 19:50 10:15
TK1836 BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40
LH0920 FRANCFORT LONDRES LUFTHANSA 20:00 20:40

Tabla 13. Ejemplo de una tabla en una base de datos que sí cumple con la segunda forma de normalización 2NF.

2.3. Tercera Forma de Normalización (3NF)

La Tercera Forma de Normalización establece que los campos dependen únicamente de la clave
primaria y no tienen dependencia entre sí.

Ejemplo: La tabla mostrada a continuación no cumple con la tercera forma de normalización porque el
IVA depende del precio, no de id-vuelo.

Hora- Hora-
Id-vuelo Origen Destino Aerolínea Precio IVA
salida llegada
IB6674 CARACAS MADRID IBERIA 19:50 10:15 1200 120
TK1836 BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40 350 35
LH0920 FRANCFORT LONDRES LUFTHANSA 20:00 20:40 200 220

Tabla 14. Ejemplo de una tabla en una base de datos que no cumple con la tercera forma de normalización 3NF.

24
Introducción a Base de datos
Internacional
de Valencia

La misma tabla modificada, de manera que cumpla con la norma 3NF.

Id-vuelo Origen Destino Aerolínea Hora-salida Hora-llegada

IB6674 CARACAS MADRID IBERIA 19:50 10:15
TK1836 BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40

LH0920 FRANCFORT LONDRES LUFTHANSA 20:00 20:40

Precio IVA
1200 120
350 35
200 220

Tabla 15. Ejemplo de una tabla en una base de datos que sí cumple con la tercera forma de normalización 3NF.

2.4. Creación de un modelo de datos relacional usando los conceptos

aprendidos anteriormente
Tradicionalmente los modelos de datos se clasifican en tres grandes grupos, asociado al nivel de
abstracción que provee el modelo:

2.4.1. De Alto Nivel, Conceptuales o Semánticos

Permiten representar la realidad a través de estructuras que visualizan los datos de forma más
cercana a como el hombre los percibe. Usualmente estos modelos de datos proporcionan una gran
cantidad de constructores que permiten representar las propiedades de los entes de la manera más
fiel posible. El Modelo Entidad Interrelación (ER) se encuentra en esta categoría.

2.4.2. De Implementación, Lógicos o Tradicionales

Permiten representar la realidad a través de estructuras que pueden ser entendidas por usuarios,
pero que se acercan más a la forma como se almacenan en el ordenador. En esta categoría se incluyen
los modelos de datos implementados en los SGBD, tales como el jerárquico, y relacional.

2.4.3. De Bajo Nivel o Físicos

Representan cómo están almacenados los datos en memoria secundaria; cada SGBD posee un
modelo físico particular. El que se utilizó originalmente en el procesamiento de datos fue el registro y
el registro variante.

25
Unidad de aprendizaje 2. Normalización de la Base de datos
Internacional
de Valencia

A manera de ejemplo, se creó parte del modelo de datos para un sistema de reserva de vuelos de una
aerolínea, el cual se muestra a continuación:

Un pasajero realiza una reserva de vuelo que tiene uno o varios pasajeros

Pasajeros Reserva-vuelos Detalles-viajeros

id-pasajero id-reserva id-reserva
nro-pasaporte fecha-salida id-pasajero
apellido fecha-retorno
nombre nro-adultos
fecha-nacimiento nro-niños
sexo nro-tercera-edad
dirección clase
teléfonol

La reserva tiene un itinerario

El pasajero compra un boleto que genera una o más tarjetas de embarque.

Boleros Itinerarios Tarjeta de embarque

id-boleto id-reserva id-reserva
id-pasajero trayecto embarque
id-reserva tramo id-pasajero
clase id-vuelo nro-vuelo
precio fecha-vuelo fecha-vuelo
clase
asiento
sala-embarque

Cada bolero puede tener uno o más vuelos

Cada vuelo tiene muchos pasajeros

Vuelos Listado-pasajeros-vuelos
id id-vuelo
origen id-pasajero
destino fecha
hora-salida
hora-llegada
aerolínea

Tabla 16. Ejemplo de un modelo de datos para un sistema de reserva de vuelos de una aerol.

26
Introducción a Base de datos
Internacional
de Valencia

Para su creación, se siguieron paso a paso las recomendaciones de las formas de normalización, a fin
de eliminar información redundante, y de garantizar la integridad de los datos y su escalabilidad. En él
muestran las entidades, que aparecen resaltadas en color encabezando la tabla, junto con sus respec-
tivos atributos, así como relaciones uno a uno y uno a muchos entre las tablas.

2.5. Jupyter Notebook como herramienta de familiarización con el

Lenguaje SQL
Jupyter Notebook es una aplicación web que te permite crear y compartir documentos que contienen
código que corre en vivo, ecuaciones, gráficos y notas del código, trabaja con un amplio número de
lenguajes de programación y es ideal para el análisis de datos.

Algunas de sus características son:

•• Puede trabajar con bases de datos no relacionales y relacionales.

•• Al poder combinar texto, códigos y resultados, es ideal para documentar sobre el código y sobre
el análisis de datos con una interfaz sencilla.

•• Puedes importar una gran cantidad de paquetes para trabajar con diversas aplicaciones.

•• Tiene opciones para ocultar códigos y resultados que no deseas mostrar. Por ejemplo, si tienes
una abrumadora cantidad de código o quieres mostrar solo los resultados en gráficos para ha-
cer un reporte más limpio del código.

•• Puedes guardar la página en múltiples formatos, incluyendo HTML y PDF.

Entre los lenguajes usados por Jupyter Notebook se incluye Python, que junto con el ORM SQL
Alchemy nos facilitará la familiarización de con el Lenguaje SQL, que incluye soporte para SQLite,
MySQL, PostgreSQL, Oracle, MS SQL, entre otros.

SQLAlchemy presenta un método para asociar clases de Python definidas por el usuario con tablas de
bases de datos, e instancias de esas clases (objetos) con filas en sus tablas correspondientes. Incluye
un sistema que sincroniza de forma transparente todos los cambios de estado entre objetos y sus filas
relacionadas, llamada unidad de trabajo (work unit), así como un sistema para expresar consultas de
bases de datos en términos de las clases definidas por el usuario y sus relaciones definidas entre sí.

Existen otras librerías adicionales, como Pandas, disponible en Python para el análisis y manipu-
lación de datos. En Pandas, los DataFrames son unidades básicas, junto con las series. Las series
son arreglos de una dimensión mientras que los DataFrames son estructuras de datos bidimensio-
nales, con columnas de diversos tipos. Están basadas también en conceptos de vectores, así que se
pueden realizar operaciones vectoriales. Los DataFrames en general pueden usarse para importar
archivos de datos y luego con otras librerías como Numpy y Matplotlib para manipular los datos, y
realizar gráficas y visualizaciones de los mismos. La librería Pandas hace posible llevar a cabo todo
el proceso (lectura de datos, depuración, análisis y modelización) sin necesidad de cambiar a un
lenguaje más específico.

27
Unidad de aprendizaje 2. Normalización de la Base de datos
Internacional
de Valencia

Algunas de las funcionalidades de Pandas son las siguientes:

•• Un rápido y eficiente uso del objeto Dataframe para manipular datos con indexación integrada.

•• Herramientas para la lectura y escritura de datos de forma rápida y eficiente manejadas en me-
moria, como el DataFrame, y con posibilidad de trasladarlos a la mayoría de los formatos conoci-
dos para el manejo de datos, entre ellos: CSV y archivos de texto, Excel, bases de datos SQL, etc.

•• Proporciona una alineación inteligente de datos y un manejo integrado de los datos faltantes;
con estas funciones podemos obtener una ganancia de desempeño en los cálculos entre Data-
Frames y una fácil manipulación y ordenamiento de los datos de la colección de datos usada.

•• Flexibilidad para manipular y redimensionar las colecciones de datos, facilidad para construir
tablas pivote.

•• Posibilidad de filtrar los datos, agregar o eliminar columnas.

•• Indexación jerárquica que proporciona una forma intuitiva de trabajar con datos de alta dimen-
sión en una estructura de datos de menor dimensión.

•• Posibilidad de realizar cálculos agregados o transformaciones de datos.

•• Flexibles en la manipulación de datos de las hojas de cálculo y bases de datos relacionales como SQL.

•• Gran número de funcionalidades para el manejo de series de tiempo ideales para el análisis fi-
nanciero.

Todas sus funciones y estructuras de datos están optimizadas para el alto rendimiento, con las partes
críticas del código escritas en Python o C.

En algunas sesiones prácticas del presente curso, mostraremos algunos ejemplos de su uso.

28
Unidad de aprendizaje 3

Cómo manipular datos con el lenguaje SQL

SQL es un lenguaje sencillo, versátil y poderoso, que permite crear, consultar y manipular datos y
estructuras en una base de datos. También puede definirse como un lenguaje que permite especificar
consultas en una base de datos relacional.

3.1. Lenguaje de Definición de Datos (DDL)

El Lenguaje de Definición de Datos (DDL) es utilizado en la definición del schema, lo que permite
definir cómo se estructuran los datos en una base de datos relacional. Los comandos asociados a la
definición del schema se indican a continuación:

3.1.1. CREATE (DATABASE, ROLE, TABLE, VIEW)

Vídeo. Sintaxis Crear Tabla

29
Unidad de aprendizaje 3. Cómo manipular datos con el lenguaje SQL
Internacional
de Valencia

La sintaxis para crear una nueva tabla es la siguiente:

CREATE TABLE nombre_tabla (

nombre-columna1 tipo_variable,
nombre-columna2 tipo_variable,
nombre-columna3 tipo_variable,
nombre-columna4 tipo_variable
);

Figura 3. Sintaxis de Creación de tabla en SQL.

A continuación mostramos un ejemplo de creación de una tabla en SQL:

CREATE TABLE vuelos (

id-vuelo SERIAL PRIMARY KEY,
origen VARCHAR NOT NULL,
destino VARCHAR NOT NULL,
hora-salida TEXT,
hora-llegada TEXT,
aerolínea VARCHAR NOT NULL
);

Figura 4. Creación de una tabla en SQL.

3.1.2. ALTER TABLE nombre_tabla ADD COLUMN nombre_columna tipo_ variable

Vídeo. Sintaxis Modificar Tabla

El comando ALTER TABLE se utiliza para modificar la estructura de una tabla.

Para añadir una columna en una tabla ya existente, la sintaxis es la siguiente:

ALTER TABLE nombre_tabla

ADD COLUMN nombre_columna tipo_variable;

Figura 5. Sintaxis para añadir una columna en una tabla en SQL.

Ejemplo:
ALTER TABLE vuelos
ADD COLUMN fecha_vuelo TIMESTAMP;

Figura 6. Generación de una nueva columna en una tabla en SQL.

30
Introducción a Base de datos
Internacional
de Valencia

Para eliminar una columna en una tabla ya existente, la sintaxis es la siguiente:

ALTER TABLE nombre_tabla

ADD COLUMN nombre_columna

Figura 7. Sintaxis para eliminar una columna en una tabla en SQL.

Ejemplo:
ALTER TABLE vuelos
DROP COLUMN fecha-vuelo;

Figura 8. Eliminación de una columna en una tabla en SQL.

3.1.3. DROP(DATABASE, ROLE, TABLE, VIEW)

La sintaxis para eliminar completamente una tabla con todos sus datos es la siguiente:

DROP TABLE nombre_tabla;

Figura 9. Sintaxis para eliminar por completo una tabla en SQL.

Ejemplo:

DROP TABLE vuelos;

Figura 10. Eliminación por completo de una tabla en SQL.

Si por el contrario se desea eliminar la base de datos completa, el comando es el siguiente:

DROP DATABASE nombre_basedatos;

Figura 11. Sintaxis para eliminar por completo una base de datos en SQL.

En donde nombre_basedatos es el nombre de la base de datos.

3.2. Lenguaje de Manipulación de Datos (DML)

Una vez definido el schema, y después de introducir los valores de los campos, se puede proceder
a realizar búsquedas y consultas sobre la base de datos. Para ello se utiliza el Lenguaje de Consulta
o Manipulación de Datos (DML), que es el usado en las consultas y modificación de los datos. Sus
comandos se mencionan a continuación:

31
Unidad de aprendizaje 3. Cómo manipular datos con el lenguaje SQL
Internacional
de Valencia

3.2.1. SELECT

El comando SELECT se usa para consultar y obtener los datos de una tabla. Podemos realizar
consultas para obtener los datos de la tabla completa, o podemos obtener parte de los resultados al
especificar condiciones de búsqueda usando la cláusula WHERE.

Vídeo. Sintaxis para Obtener datos de

la Tabla

La sintaxis es la siguiente:

SELECT nombre_columna1,
nombre_columna2... Nombre_columna N
FROM nombre_tabla;

Figura 12. Sintaxis para consultar datos en una tabla en SQL.

Ejemplo:

SELECT * FROM vuelos;

Figura 13. Selección de todos los registros y columnas en una tabla en SQL.

A continuación se muestra la sintaxis para mostrar el valor de algunos parámetros seleccionados a

partir de una tabla:

SELECT id-vuelo, aerolínea FROM vuelos;

Figura 14. Selección de sólo las columnas indicadas (id, aerolínea) de todos los registros en la tabla vuelos en
SQL. Fuente: elaboración propia.

Ejemplo:

SELECT id-vuelo, aerolínea FROM vuelos

WHERE origen = 'caracas' AND
destino= 'madrid';

Figura 15. Selección de sólo las columnas indicadas (id, aerolínea) de los registros cuyo origen sea caracas y
cuyo destino sea Madrid en la tabla vuelos en SQL.

3.2.2. INSERT

El comando INSERT se usa para crear nuevos registros (llenar una fila en la tabla).

32
Introducción a Base de datos
Internacional
de Valencia

Vídeo. Sintaxis para Insertar datos en

la Tabla

La sintaxis es la siguiente:

INSERT INTO nombre_tabla

VALUES (data1, data2, ...);

Figura 16. Sintaxis para añadir datos en una tabla en SQL.

Ejemplo:

INSERT INTO vuelos

VALUES (ib6674, caracas, madrid, iberia, 19:50, 10:15);

Figura17. Inserción de datos en una tabla en SQL.

También es posible crear un nuevo registro en el que se insertan selectivamente valores en algunos
campos (no en todos):

INSERT INTO vuelos (id-vuelo, origen, destino, aerolínea)

VALUES (ib6674, caracas, madrid, iberia)
WHERE id-vuelo = 'IB6674';

Figura 18. Inserción selectiva de datos en una tabla en SQL.

3.2.3. UPDATE

El comando UPDATE es utilizado para actualizar cualquier valor en el registro de una tabla.

Vídeo. Sintaxis para Actualizar datos

de la Tabla

La sintaxis es la siguiente:

UPDATE nombre-tabla SET

nombre-columna = nuevo-valor WHERE alguna-condición;

Figura 19. Sintaxis para actualizar datos en una columna en una tabla en SQL.

33
Unidad de aprendizaje 3. Cómo manipular datos con el lenguaje SQL
Internacional
de Valencia

Supongamos que en el registro del vuelo en la tabla vuelos se cometió un error en el campo aerolínea
y hora-salida para el vuelo IB6674:

Id-vuelo Origen Destino Aerolínea Hora-salida Hora-llegada

IB6674 CARACAS MADRID SWISS 16:50 10:15
TK1836 BARCELONA ESTAMBUL TURKISH AIRLINES 13:15 17:40
LH0920 FRANCFORT LONDRES LUFTHANSA 20:00 20:40

Tabla 17. Ejemplo de una tabla en una base de datos con errores en los valores de los campos aerolínea y hora-salida
en un registro.

Si solo queremos corregir el error en la aerolínea:

UPDATE vuelos SET aerolínea = 'IBERIA'

WHERE id-vuelo = 'IB6674';

Figura 20. Corrección del valor de un dato en una tabla en SQL.

Si queremos corregir ambos errores en una misma línea de comandos:

UPDATE vuelos SET aerolínea = 'IBERIA'; hora-salida = '19:50'

WHERE id-vuelo = 'IB6674';

Figura 21. Corrección del valor de varios datos en una tabla en SQL.

3.2.4. DELETE

El comando DELETE se usa para eliminar datos de una tabla.

Vídeo. Sintaxis para Eliminar datos de

la Tabla

La sintaxis es la siguiente:

DELETE FROM nombre_tabla;

Figura 22. Sintaxis para eliminar datos en una tabla en SQL.

34
Introducción a Base de datos
Internacional
de Valencia

DELETE FROM vuelos;

Figura 23. Eliminación de todos los registros en una tabla en SQL.

A continuación se muestra un ejemplo de eliminación de registros de una tabla que cumplen una
determinada condición.

DELETE FROM vuelos WHERE id-vuelo = 'IB6674';

Figura 24. Eliminación de un solo registro en una tabla en SQL.

(Este registro es el único que cumple con la condición dada en la cláusula WHERE).

3.3. Lenguaje de Control de Datos (DCL)

Los comandos DCL se usan para proveer seguridad de la base de datos en un ambiente multiusuarios.
Se utiliza para otorgar o revocar privilegios a un usuario sobre un objeto de la base de datos. En otras
palabras, es lo que permite controlar los privilegios en la DB.

3.3.1. GRANT

El comando GRANT es usado para otorgar al usuario privilegios de acceso u otro tipo de privilegios
sobre la base de datos.

Ejemplos:

GRANT CREATE TABLE TO username;

Figura 25. Sintaxis SQL para permitir a un usuario crear una tabla.

GRANT DROP ANY TABLE TO username;

Figura 26. Sintaxis SQL para permitir a un usuario eliminar una tabla.

3.3.2. REVOKE

El comando REVOKE es usado para al usuario privilegios de acceso u otro tipo de privilegios sobre la
base de datos.

Seguidamente se muestra la sintaxis del comando.

REVOKE CREATE TABLE TO username;

Figura 27. Sintaxis SQL para permitir a un usuario eliminar una tabla

35
Unidad de aprendizaje 3. Cómo manipular datos con el lenguaje SQL
Internacional
de Valencia

Vídeo. Sintaxis para crear Usuarios y

conceder permisos en la Tabla

3.4. Expresiones de búsquedas selectivas, agrupación y orden

3.4.1. LIKE

La cláusula LIKE se usa en las consultas de SQL conjuntamente con la cláusula WHERE como parte de
la condición a cumplir, comparando datos extraídos de la tabla con una expresión que contiene como-
dines o caracteres especiales (como ‘%’ y ‘_’).

En ella:

•• El símbolo de porcentaje (%) representa ninguno, uno o más caracteres.

•• El símbolo de guion bajo (_) representa un solo carácter.

Vídeo. Sintaxis para hacer búsquedas

selectivas

Considere los siguientes datos de la tabla pasajeros:

Id-pasajero Pasaporte Apellido Nombre

1 06678450 Gavidia Liliana
2 32775484 Jimenez José
3 02115537 Ceballos Olga
4 15978124 Rodriguez Ernesto
5 21447895 Pérez Pedro
6 82139600 González Judith
7 12115432 González Elena

Tabla 18. Ejemplo de una tabla pasajeros en una base de datos.

Ejemplo 1:

SELECT*FROM pasajeros WHERE nombre LIKE ‘j%’;

Figura 28. Selección de todos los registros en la tabla pasajeros en SQL cuyo nombre empieza por "j".

36
Introducción a Base de datos
Internacional
de Valencia

Resultado:

Id-pasajero Pasaporte Apellido Nombre

2 32775484 Jimenez José
6 82139600 González Judith

Tabla 19. Resultado de la consulta de todos los registros en la tabla pasajeros en SQL cuyo nombre empieza por ‘j’.

Ejemplo 2:

SELECT*FROM pasajeros WHERE nombre LIKE ‘%a’;

Figura 29. Selección de todos los registros en la tabla pasajeros en SQL cuyo nombre finaliza con una ‘a’.

Resultado:

Id-pasajero Pasaporte Apellido Nombre

1 06678450 Gavidia Liliana
3 02115537 Ceballos Olga
7 12115432 González Elena

Tabla 20. Resultado de la consulta de todos los registros en la tabla pasajeros en SQL cuyo nombre finaliza con
una ‘a’.

Ejemplo 3:

SELECT*FROM pasajeros WHERE nombre LIKE ‘_o%’;

Figura 30. Selección de todos los registros en la tabla pasajeros en SQL cuyo nombre tiene una ‘o’ en la segunda
posición de los caracteres.
Resultado:

Id-pasajero Pasaporte Apellido Nombre

2 32775484 Jimenez José

Tabla 21. Resultado de la consulta de todos los registros en la tabla pasajeros en SQL cuyo nombre tiene una ‘o’
en la segunda posición de los caracteres.

3.4.2. Funciones de agregacion SUM, MAX, MIN, COUNT, AVG

Vídeo. Funciones de agregación

37
Unidad de aprendizaje 3. Cómo manipular datos con el lenguaje SQL
Internacional
de Valencia

La función SUM () retorna la suma total de una columna numérica. A continuación se muestra la
sintaxis de este comando.