Claudio Casares - Apuntes de SQL

Apuntes de
Lenguaje
y bases de datos relacionales
SQL
Claudio Casares
personal.lobocom.es/claudio/
SQL y bases de datos relacionales Claudio Casares
ndicedecontenido
1. Generalidades..........................................................................................................................................5
1.1. Arquitecturas..................................................................................................................................................5
1.1.1. Cliente / Servidor............................................................................................................5 1.1.2. Motor Distribuido............................................................................................................5 1.1.3. Componentes Distribuidos..............................................................................................5

1.2. Cursores y Bferes.........................................................................................................................................5
1.2.1. Ubicacin de los cursores................................................................................................6 1.2.2. Tipos de cursores.............................................................................................................6 1.2.3. Tipos de bferes..............................................................................................................7 2. Modelo de datos.......................................................................................................................................9
2.1. Introduccin...................................................................................................................................................9 2.2. Los Usuarios.................................................................................................................................................10 2.3. Ciclo de vida de una base de datos...............................................................................................................11
2.3.1. Anlisis de las necesidades............................................................................................11 2.3.2. Estudio de viabilidad.....................................................................................................11 2.3.3. Definicin de requisitos.................................................................................................11 2.3.4. Diseo...........................................................................................................................12 2.3.5. Implementacin.............................................................................................................12 2.3.6. Evaluacin y Perfeccionamiento...................................................................................12
2.4. Criterios de calidad.......................................................................................................................................12 2.5. Indicadores de calidad..................................................................................................................................15 2.6. El modelo lgico..........................................................................................................................................15 2.7. Restricciones de integridad..........................................................................................................................17
3. Modelo Relacional.................................................................................................................................20
3.1. Introduccin.................................................................................................................................................20
3.1.1. Clave primaria...............................................................................................................20 3.1.2. Dominio........................................................................................................................21 3.1.3. Integridad referencial.....................................................................................................21 3.1.4. lgebra relacional.........................................................................................................21
3.2. Proceso de normalizacin.............................................................................................................................23
3.2.1. Definicin de la clave....................................................................................................23 3.2.2. Primera forma normal (1NF).........................................................................................23 3.2.3. Segunda forma normal (2NF)........................................................................................24 3.2.4. Tercera forma normal (3NF).........................................................................................25 3.2.5. Cuarta forma normal (4NF)...........................................................................................26 3.2.6. Otras formas normales...................................................................................................26
3.3. Las interrelaciones........................................................................................................................................26
3.3.1. Interrelaciones uno a uno...............................................................................................26 3.3.2. Interrelaciones uno a varios...........................................................................................27
3.3.3. Interrelaciones varios a varios.......................................................................................27 3.3.4. Problemas con las interrelaciones..................................................................................28 3.3.5. Atributos de las interrelaciones.....................................................................................28
3.4. lgebra relacional........................................................................................................................................29
3.4.1. Unin.............................................................................................................................29 3.4.2. Interseccin...................................................................................................................30 3.4.3. Diferencia......................................................................................................................30 3.4.4. Producto........................................................................................................................30 3.4.5. Seleccin.......................................................................................................................30 3.4.6. Proyeccin.....................................................................................................................31 3.4.7. Reunin (Unin natural) ...............................................................................................31 3.4.8. Divisin.........................................................................................................................31 3.4.9. Asignacin.....................................................................................................................32
3.5. Clculo relacional.........................................................................................................................................32
4. Lenguaje SQL.........................................................................................................................................33
4.1. Introduccin.................................................................................................................................................33
4.1.1. Breve historia................................................................................................................33 4.1.2. Componentes del SQL...................................................................................................33

4.2. Consultas de Seleccin.................................................................................................................................36
4.2.1. Consultas bsicas...........................................................................................................36 4.2.2. Devolver literales..........................................................................................................36 4.2.3. Ordenar los registros.....................................................................................................36 4.2.4. Uso de ndices de las tablas...........................................................................................37 4.2.5. Consultas con Predicado................................................................................................37 4.2.6. Recuperar Informacin de una base de Datos Externa...................................................39
4.3. Consultas de Accin.....................................................................................................................................40
4.3.1. DELETE........................................................................................................................40 4.3.2. INSERT INTO..............................................................................................................40 4.3.3. UPDATE.......................................................................................................................42

4.4. Consultas de Unin Internas........................................................................................................................43
4.4.1. Consultas de Combinacin entre tablas.........................................................................43 4.4.2. Consultas de Autocombinacin.....................................................................................46 4.4.3. Consultas de Combinaciones no Comunes....................................................................46 4.4.4. CROSS JOIN (SQL-Server)..........................................................................................47 4.4.5. SELF JOIN....................................................................................................................47 4.4.6. FULL JOIN...................................................................................................................49
4.5. Consultas de Unin Externas.......................................................................................................................50 4.6. Consultas de Referencias Cruzadas..............................................................................................................51
4.6.1. MS-Access....................................................................................................................51
4.7. Criterios de Seleccin...................................................................................................................................54
4.7.1. Operadores Lgicos.......................................................................................................55 4.7.2. Valores Nulos................................................................................................................57 4.7.3. Intervalos de Valores.....................................................................................................57
4.7.4. El Operador Like...........................................................................................................57 4.7.5. El Operador In...............................................................................................................58 4.7.6. La clusula WHERE.....................................................................................................59

4.8. Agrupamiento de Registros..........................................................................................................................60
4.8.1. GROUP BY...................................................................................................................60 4.8.2. AVG..............................................................................................................................61 4.8.3. Count.............................................................................................................................61 4.8.4. Max, Min.......................................................................................................................62 4.8.5. StDev, StDevP...............................................................................................................62 4.8.6. Sum...............................................................................................................................63 4.8.7. Var, VarP.......................................................................................................................63 4.8.8. COMPUTE de SQL-Server...........................................................................................64
4.9. Tipos de Datos..............................................................................................................................................64 4.10. Subconsultas...............................................................................................................................................66 4.11. Estructuras de las Tablas............................................................................................................................71
4.11.1. Creacin de Tablas Nuevas.........................................................................................71 4.11.2. La clusula CONSTRAINT.........................................................................................72 4.11.3. Creacin de ndices.....................................................................................................73 4.11.4. Modificar el Diseo de una Tabla................................................................................74
4.12. Problemas resueltos: Registros duplicados................................................................................................75 4.13. Problemas resueltos: Registros no relacionados........................................................................................76 4.14. Cursores......................................................................................................................................................76 4.15. FREETEXT y CONTAINS (FULLTEXT SQL-Server)...........................................................................79
4.15.1. FULL TEXT SEARCH...............................................................................................79 4.15.2. Consultas e ndices de texto.........................................................................................81 4.15.3. Componentes de las consultas de texto de Transact-SQL............................................82 4.15.4. Funciones de conjunto de filas CONTAINSTABLE y FREETEXTTABLE...............83 4.15.5. CONTAINSTABLE (T-SQL).....................................................................................84 4.15.6. FREETEXTTABLE....................................................................................................89 4.15.7. Utilizar el predicado CONTAINS...............................................................................90 4.15.8. Utilizar el predicado FREETEXT................................................................................92 4.15.9. Funciones de conjunto de filas CONTAINSTABLE y FREETEXTTABLE...............92 4.15.10. Identificacin del nombre de la columna de la clave nica........................................94 4.15.11. Buscar palabras o frases con valores ponderados (trmino ponderado).....................97 4.15.12. Combinar predicados de texto con otros predicados de Transact-SQL......................97 4.15.13. Utilizar predicados de texto para consultar columnas de tipo IMAGE......................98
4.16. MS-Access: Bases externas........................................................................................................................99 4.17. MS-Access: Parmetros...........................................................................................................................100 4.18. MS-Access: Omitir permisos...................................................................................................................100 4.19. MS-Access: Clusula PROCEDURE......................................................................................................101 4.20. Optimizar Sentencias................................................................................................................................102
5. APNDICES........................................................................................................................................104
5.1. Las 12 reglas de Codd que determinan la fidelidad de un sistema relacional al modelo relacional..........104
Generalidades SQL y bases de datos relacionales Claudio Casares
1. Generalidades
1.1. Arquitecturas
En muchas ocasiones, despus de haber realizado un gran estudio detallado del SGBD y haber revisado su diseo, nos podemos encontrar que ha implementado sobre un equipo con insuficientes recursos o no se ha seleccionado la arquitectura adecuada para su explotacin. Entre otras arquitecturas, caben destacar las siguientes:
1.1.1. Cliente / Servidor

Esta arquitectura consta de un cliente inteligente que puede solicitar servicios de un servidor en red. En el lado del cliente de esta arquitectura encontramos una aplicacin frontal bastante sencilla ejecutndose en un ordenador personal. A una aplicacin cliente / servidor se le puede pedir que realice validaciones o que muestre listas de opciones vlidas, pero la mayor parte de las reglas de integridad de los datos y de negocio se imponen en la propia base de datos: relaciones, ndices, valores predeterminados, rangos, disparadores, procedimientos almacenados, etc. En el lado del servidor encontramos un motor de servidor de bases de datos inteligente. El servidor est diseado para aceptar consultas SQL desde la aplicacin frontal, generalmente en forma de llamadas a procedimientos almacenados que devuelven conjunto de resultados claramente definidos y de mbito limitado. Generalmente, la aplicacin cliente es responsable, al menos, de la administracin de la conexin, la captura de los datos, la presentacin de datos y la administracin de los errores. El servidor es el responsable de la administracin inteligente de los recursos, la administracin de la seguridad, la administracin de los datos, de las consultas y sobre todo de la integridad de los datos.
1.1.2. Motor Distribuido

En este caso, cada uno de los clientes posee el motor necesario para acceder a la base de datos y acceden de forma independiente del resto de los usuarios. Esta arquitectura tiene la ventaja del aprovechamiento de los recursos del cliente pero la desventaja del control de versiones.
1.1.3. Componentes Distribuidos

Esta arquitectura aade un tercer elemento al sistema de acceso a la base de datos, se trata de los objetos de lgica de negocio, encargados de procesar las peticiones de los clientes y hacrselas llegar al servidor. Estos objetos pueden estar instalados en mquinas diferentes a la del cliente y del servidor. La principal ventaja radica en el aprovechamiento de los servicios cliente / servidor y en asegurar el control de las versiones del motor de acceso a datos. La aplicacin frontal realiza peticiones a los objetos de lgica de negocio que son trasmitidas al servidor, la respuestas del mismo llegan a los objetos y stos las devuelven al cliente.
1.2. Cursores y Bferes

Bsicamente, un cursor es un conjunto de punteros a las filas devueltas por una consulta, la mayora, son como un conjunto de resultados, excepto por que los datos reales generalmente permanecen en el servidor. Un bfer es un depsito RAM en el lado del cliente donde se guardan los datos del conjunto de resultados de manera temporal hasta que pueden llevarse a otro lugar para su almacenamiento. Las columnas de datos de una o varias filas se dice que son miembros del cursor si la clusula WHERE de la consulta las incluye. Esta columnas, combinadas en filas lgicas se convierten en filas miembro del conjunto de resultados. Por ejemplo:
Generalidades SQL y bases de datos relacionales Claudio Casares SELECT Nombre, Genero FROM Animales WHERE Edad < 10
Cuando se ejecuta esta consulta, el motor cliente empieza inmediatamente a seleccionar miembros para el conjunto de resultados. En este caso son todos los animales menores de diez aos. Si no es necesaria una ordenador, el SGDB pasa las primeras filas de este conjunto de resultados de vuelta a la estacin de trabajo nada ms capturarlas y despus detiene el procesamiento hasta que la estacin recupera las filas capturadas, una vez recuperadas el gestor de datos pasa ms filas y as sucesivamente. Debido a este proceso, si otros usuarios estn actualizando la base de datos, hay posibilidades que se aada otra fila que cumpla las condiciones del conjunto de resultados; en este caso la fila aadida pasa a ser miembro del conjunto y es recuperada por la estacin de trabajo. Tambin existe la posibilidad de la eliminacin o modificacin de una fila, en estos casos, si la fila no ha sido enviada a la estacin de trabajo o no se enva o se enva modificada; pero siempre cabe la posibilidad de que la estacin de trabajo haya ledo una fila que ya no existe o que haya sido modificada por otro usuario. Estas actualizaciones no se incluirn en el conjunto de resultados si la estacin de trabajo ha comenzado a procesar los resultados. El proceso de relleno del cursor finaliza cuando el gestor de datos ha determinado cual es la ltima fila del conjunto de resultados y se considera completamente relleno cuando la estacin de trabajo ha capturado la ltima fila, en este momento cuando se conoce el nmero de filas que componen el cursor. Por este motivo los mtodos o propiedades que informan del nmero de filas devueltas o afectadas no son reales hasta que el cursor no se rellenado completamente.
1.2.1. Ubicacin de los cursores

Como ya se ha comentado un cursor es un conjunto de punteros a un conjunto de resultados. Estos punteros pueden estar ubicados en el servidor o en la estacin de trabajo, originando dos tipos de cursores, los cursores del lado del cliente y los cursores del lado del servidor. Pero no todos los gestores de datos permiten crear cursores en el lado del servidor, slo se pueden crear con aquellos gestores que tengan comportamiento cliente / servidor. Las ventajas e inconvenientes de cada tipo de cursor es muy variable y depende siempre de la explotacin que se desee hacer de los datos, de la topologa de la red y de los equipos empleados. En general los cursores en el lado del servidor reducen los tiempos de acceso a los datos y mejoran el desplazamiento por el conjunto de resultados, si embargo consumen ms cantidad de recursos de servidor y de red.
1.2.2. Tipos de cursores

Conjuntos de resultados sin cursor
Con un conjunto de resultados sin cursor las filas de datos pasan al frontal para su procesamiento. Este el sistema ms rpido para llevar los datos desde el servidor al cliente, pero no ofrece los beneficios del cursor, por que, si bien algunos son actualizables, a menudo no lo son y hay que controlar el proceso desde el frontal para controlar las modificaciones.
Cursores desplazables
Uno de los aspectos ms costosos de la administracin de los cursores es dar soporte a la capacidad de desplazamiento. Esta capacidad significa que, una vez ejecutada una consulta, un cursor desplazable permite la colocacin en cualquier fila del conjunto de resultados. Estos mtodos de reubicacin son
costosos en el sentido que consumen recursos del sistema. Para aumentar el rendimiento se aconseja limitar los cursores y seleccionar los no desplazables.
Cursores de slo avance

Este tipo de cursor slo permite utilizar los mtodos para desplazarse avanzando por las filas del conjunto de resultados, no permiten el retroceso por las mismas. En este caso el gestor de datos enviar las filas del conjunto de resultados tan rpido como le sea posible.
Cursores estticos
Un cursor esttico proporciona la capacidad de direccionamiento por todo el conjunto de resultados generando una copia en la estacin de trabajo de las filas devueltas, todos los trabajos realizados sobre este conjunto de resultados afectar nicamente a la copia local. Por su naturaleza este cursor necesita de un espacio de almacenamiento en el cliente. Este cursor no es la mejor opcin para datos que cambian constantemente, pero para tablas de bsqueda cuyos valores no es probable que cambien, este cursor tiene mucho sentido.
Cursores de conjunto de claves

Un cursor de conjunto de claves, u hoja de respuesta dinmica, almacena un conjunto de claves, bsicamente un conjunto de punteros, y permite volver a capturar una fila seleccionada de acuerdo con la informacin especfica de la fila almacenada en dichas claves. Estos cursores necesitan espacio de almacenamiento independiente para los datos de cada una de las claves que lo componen. Cualquier cambio o modificacin sobre una fila del conjunto de resultados por parte de cualquier usuario es reflejado en cualquier estacin de trabajo al leer la informacin de dicha fila.
Cursores dinmicos
Al igual que en los dos casos anteriores, un cursor dinmico almacena un bloque de claves. Sin embargo, con este tipo de cursor, la consulta que se ha utilizado para generar el conjunto de resultados se vuelve a ejecutar constantemente siempre que se hace referencia al cursor. Debido a esta actividad repetida, los cursores dinmicos consumen gran cantidad de recursos, pero poseen la gran ventaja que jams cierran la pertenencia o no pertenencia de las filas al conjunto de resultados. En los dos casos anteriores una vez rellenado el cursor no se admite la inclusin o exclusin de filas.
Cursores de slo lectura

Todos los tipos de cursores citados admiten la posibilidad de slo lectura, en este caso ninguna de las filas del conjunto de resultados pueden ser modificadas por la estacin de trabajo. Este cursor es muy til para la generacin de consultas o informes en donde se sabe que ningn dato ser modificado. Poseen la ventaja y el inconveniente de no generar bloqueos sobre las filas consultadas, de tal forma que cualquier usuario puede editar las filas contenidas en este cursor.
1.2.3. Tipos de bferes

Bferes de una nica fila
Un bfer de una nica fila no es en realidad un cursor, aunque aqu se apliquen las mismas reglas de pertenencia que se aplican a un cursor de conjunto de claves de slo avance. Con un bfer de una nica fila slo es posible examinar los datos de la fila del conjunto de resultados. Las filas anteriores no estn disponibles y la fila actual no estar accesible despus de pasar a la siguiente fila del conjunto de resultados.
Bferes de n filas
Un bfer de n filas ampla el mbito y la capacidad de desplazamiento del bfer de una nica fila. En este caso, a la estacin de trabajo se le expone un nmero determinado de filas del conjunto de resultados y a la aplicacin se le permite que se desplace libremente por esas filas.
Modelo de datos SQL y bases de datos relacionales Claudio Casares
2. Modelo de datos
2.1. Introduccin
Desde tiempos remotos, los datos han sido registrados por el hombre en algn tipo de soporte (piedra, papel, madera, etc.) a fin de que quedara constancia de un fenmeno o idea. Los datos han de ser interpretados para que se conviertan en informacin til, esta interpretacin supone un fenmeno de agrupacin y clasificacin. En la era actual y con el auge de los medios informticos aparece el almacenamiento en soporte electromagntico, ofreciendo mayores posibilidades de almacenaje, ocupando menos espacio y ahorrando un tiempo considerable en la bsqueda y tratamiento de los datos. Es en este momento donde surge el concepto de bases de datos y con ellas las diferentes metodologas de diseo y tratamiento. El objetivo bsico de toda base de datos es el almacenamiento de smbolos, nmeros y letras carentes de un significado en s, que con un tratamiento adecuado se convierten en informacin til. Un ejemplo podra ser el siguiente dato: 19941224, con el tratamiento correcto podra convertirse en la siguiente informacin: "Fecha de nacimiento: 24 de diciembre de 1994". Segn van evolucionando los tiempos, las necesidades de almacenamiento de datos van creciendo y con ellas las necesidades de transformar los mismos datos en informacin de muy diversa naturaleza. Esta informacin es utilizada diariamente como herramientas de trabajo y como soporte para la toma de decisiones por un gran colectivo de profesionales que toman dicha informacin como base de su negocio. Por este motivo el trabajo del diseador de bases de datos es cada vez ms delicado, un error en el diseo o en la interpretacin de datos puede dar lugar a informacin incorrecta y conducir al usuario a la toma de decisiones equivocadas. Se hace necesario la creacin de un sistema que ayude al diseador a crear estructuras correctas y fiables, minimizando los tiempos de diseo y explotando todos los datos, nace as la metodologa de diseo de bases de datos. La metodologa de diseo de datos divide cada modelo en tres esquemas: A) Modelo Global: se trata de una representacin grfica legible por el usuario y que nos aporta el flujo de informacin dentro de una organizacin. No existen reglas para su construccin y se debe realizar siempre el esquema ms sencillo posible para la comprensin por parte del usuario de la base de datos. Por ejemplo:
10
B) Modelo Lgico: se trata de una representacin grfica, mediante smbolos y signos normalizados, de la base de datos. Su objetivo es representar la estructura de los datos y las dependencias de los mismos, garantizando la consistencia y evitando la duplicidad. Este modelo de datos se estudiar con profundidad en los captulos siguientes. C) Modelo Fsico: se trata del almacn de los datos, es la base de datos en s misma, el soporte donde se almacenan los datos y de donde se extraen para convertir los datos en informacin. En funcin del gestor de bases de datos empleado las reglas de almacenamiento varan.
2.2. Los Usuarios

En todo sistema de base de datos cabe diferenciar tres tipos diferentes de usuarios, entre todos comparten la informacin pero acceden a ella de una forma diferente, siempre en funcin de sus necesidades. 1) El primer grupo de usuarios es el PED (Procesamiento Electrnico de Datos), normalmente compuestos por los operarios de la organizacin. Las necesidades bsicas de este grupo de usuarios son: El foco operativo fundamental se centra en el almacenamiento de los datos, el procesamiento de los mismos y el flujo de datos; Poseen acceso restringido a la informacin; Generan informes de tipo listados.
2) El segundo grupo de usuarios es el SIM (Sistemas de Informacin de Gestin) y suele estar formado por los mandos medios de la organizacin. Las necesidades bsicas de este grupo de usuarios son: El foco operativo se fundamenta en la toma de decisiones, tomando como partida los datos del grupo PED e introduciendo un volumen pequeo de informacin; Poseen acceso medianamente restringido a la informacin; Generan informes de resmenes de datos del grupo PED y listados de la informacin que introducen.
3) El tercer ltimo grupo de usuarios lo forman el STD (Sistema de apoyo a Toma de Decisiones), este grupo se centra en el nivel ms alto de la organizacin y poseen las caractersticas siguientes: El foco operativo se centra en la decisin, con una entrada mnima de datos; No tienen acceso restringido; Generan informes globales que les sirven como apoyo a las tomas de decisiones del negocio, estos son los informes ms importantes y suelen ir acompaados de resmenes, grficas y sobre todo centrados en la evolucin y comparacin de la informacin.
4) Cabe destacar la figura de un cuarto grupo de usuarios, en este caso usuarios avanzados, que est compuesto por los administradores del sistema, cuya opinin es fundamental para seleccionar el soporte de los datos, evitar la duplicacin de informacin ya existente en otros sistemas y sobre todo puede aportar el conocimiento de sus usuarios, sus necesidades y los problemas ya resueltos. En general, podemos decir que los objetivos de una base de datos son los siguientes: Ayudar en la toma de decisiones; Compartir de forma controlada y restringida los datos y el acceso a la informacin; Integrar los datos de una forma lgica, evitando la duplicidad; Asegurar un rpido acceso a la informacin y los datos.
11
2.3. Ciclo de vida de una base de datos

2.3.1. Anlisis de las necesidades
En reunin con el cliente se deben documentar los tres grupos de usuarios definidos en la introduccin, las necesidades de informacin de cada uno de ellos, as como los informes que cada uno necesita para su actividad y el contenido de los mismos. Cuanta ms precisin exista en estos requisitos iniciales ms preciso ser el desarrollo de la base de datos. En esta reunin tambin debe quedar documentados los niveles de seguridad de los grupos de usuarios, los derechos de cada uno de ellos sobre los datos, los requisitos de los sistemas informticos del cliente (sistema operativo, tipo de red, servidores, etc.) y la ubicacin de los usuarios. No hay que olvidar que normalmente en las empresas existen ya sistemas de almacenamiento de datos, por tanto es conveniente analizar los datos ya existentes y analizar las posibles relaciones con la base de datos a desarrollar. Un cuestionario muy sencillo pero muy til para el administrador es el siguiente (a rellenar por todos los usuarios): Nombre: Cargo: rea de responsabilidad: Obligaciones principales que requieren informacin de la base datos: De qu aplicaciones recibe informacin? Con cunta frecuencia recibe informacin? Qu hace con esta informacin? Qu precauciones de seguridad debe tomar con respecto a la informacin? Para que aplicacin proporciona datos? Estn contemplados cambios para alguna de sus actividades actuales que involucren alguna de las informaciones anteriores?
2.3.2. Estudio de viabilidad

Un estudio de viabilidad implica la preparacin de un informe con las caractersticas siguientes: Viabilidad tecnolgica. Hay tecnologa suficiente para el desarrollo? Viabilidad operacional. Existen suficientes recursos humanos, presupuesto, experiencia y formacin para el desarrollo? Viabilidad econmica. Se pueden identificar los beneficios? Los beneficios costearan el desarrollo del sistema? Se pueden medir los costes y los beneficios?
2.3.3. Definicin de requisitos

Los requisitos de desarrollo involucran el software y hardware necesario para la implementacin, los recursos humanos necesarios (tanto internos como externos), la formacin al personal. Aunque un poco al margen del tema es conveniente parar en este momento y planificar las acciones a realizar elaborando un cronograma del proyecto y un organigrama con las responsabilidades de cada miembro del equipo. Conviene sealar quienes van a ser los interlocutores y fijar un calendario de reuniones de seguimiento del proyecto.
12
Hay que definir la figura del validador, esta persona ser la encargada de velar en cada momento que no se est rebasando el alcance del proyecto, as como asegurar que la implementacin est encaminada a subsanar las necesidades del cliente.
2.3.4. Diseo
En esta etapa se crea un esquema conceptual de la base de datos. Se desarrollan las especificaciones hasta el punto en que puede comenzar la implementacin. Durante esta etapa se crean modelos detallados de las vistas de usuario y sobre todo las relaciones entre cada elemento del sistema, documentando los derechos de uso y manipulacin de los diferentes grupos de usuarios. Si parte de la informacin necesaria para crear algn elemento establecido ya se encuentra implementado en otro sistema de almacenamiento hay que documentar que relacin existir entre uno y otro y detallar los sistemas que eviten la duplicidad o incoherencia de los datos. El diseo consta, como se vio anteriormente, de tres fases: el diseo global o conceptual, el diseo lgico y el modelo fsico.
2.3.5. Implementacin
Una vez totalmente detallado el modelo conceptual se comienza con la implementacin fsica del modelo de datos, a medida que se va avanzando en el modelo el administrador del sistema va asegurando la correccin del modelo y el validador la utilidad del mismo. La implementacin consiste en el desarrollo de las tablas, los ndices de los mismos, las condiciones de validacin de los datos, la relacin entre las diferentes tablas. Por otro lado, la definicin de las consultas y los parmetros a utilizar por cada una de ellas. Una vez finalizada la implementacin fsica, se asignan las correspondientes medidas de seguridad y se ubica la base de datos en el lugar correspondiente.
2.3.6. Evaluacin y Perfeccionamiento

En esta ltima etapa todos los usuarios del sistema acceden a la base de datos y deben asegurarse el correcto funcionamiento de la misma, que sus derechos son los adecuados, teniendo a su disposicin cuanta informacin necesiten. Tambin debern asegurarse que el acceso a los datos es cmodo, prctico, seguro y que se han eliminado, en la medida de lo posible, las posibilidades de error. El administrador se asegura que todos los derechos y todas las restricciones han sido implementadas correctamente y que se ha seguido en manual de estilo en la totalidad de la implementacin. El validador se asegurar que todas las necesidades del cliente han sido satisfechas.
2.4. Criterios de calidad

Legibilidad
El diseo de una base de datos ha de estar redactado con la suficiente claridad para que pueda ser entendido rpidamente. El lenguaje utilizado debe ser lo suficientemente claro, conciso y detallado para que explique con total claridad el diseo del modelo, sus objetivos, sus restricciones, en general todo aquello que afecte al sistema de forma directa o indirecta. En este punto conviene aplicar el principio que una imagen vale ms que mil palabras, pero en ocasiones son necesarias esas mil palabras y obviar la imagen.
13
Fiabilidad
Se trata de realizar un sistema de bases de datos lo suficientemente robusto para que sea capaz de recuperarse frente a errores o usos inadecuados. Se deben utilizar gestores con las herramientas necesarias para la reparacin de los posibles errores que las bases de datos pueden sufrir, por ejemplo tras un corte inesperado de luz.
Portabilidad
El diseo deber permitir la implementacin del modelo fsico en diferentes gestores de bases de datos.
Modificabilidad
Ningn sistema informtico es esttico, las necesidades de los usuarios varan con el tiempo y por lo tanto las bases de datos se deben adaptar a las nuevas necesidades, por lo que se precisa que un buen diseo facilite el mantenimiento, esto es, las modificaciones y actualizaciones necesarias para adaptarlo a una nueva situacin.
Eficiencia
Se deben aprovechar al mximo los recursos de la computadora, minimizando la memoria utilizada y el tiempo de proceso o ejecucin, siempre que no sea a costa de los requisitos anteriores. En este punto se debe tener en cuenta los gestores cliente / servidor de bases de datos. En muchas ocasiones es ms rentable cargar de trabajo al servidor y liberar recursos de los clientes, pero no todos los gestores permiten este tipo de trabajo, por lo tanto se ha de tener en cuenta estas dos circunstancias en el diseo de la base de datos.
Auto descripcin
En la documentacin generada debe estar todo el detalle del diseo, evitando referencias a otros documentos que no estn incluidos dentro de la documentacin de la base de datos.
Trivialidad
Tanto el diseo como la implantacin se deben realizar utilizando los estndares fijados a priori, estos estndares debern quedar reflejados al inicio del documento.
Claridad
Todos los documentos deben estar redactados de forma clara y fcil de entender, los nombre utilizados para las tablas, los campos, ndices, etc. deben ser autodescriptivos y estar perfectamente documentados.
Coherencia
Las anotaciones y terminologa utilizada deben ser uniformes, para ello se debe seguir algn tipo de metodologa estndar, indicado cual se ha empleado, en los casos en que se utilice alguna metodologa no estndar se debe adjuntar a la documentacin.
Completo
Todos los elementos constitutivos de la base de datos existen, no se han dejado partes incompletas, sin documentar o sin implementar.
14
Concisin
No existen elementos intiles ni repetitivos. En este apartado hay que hacer un especial hincapi en la repeticin de datos en diferentes tablas, hay que evitar a toda costa que el mismo dato se repita en varias tablas para conseguir as una optimizacin del tamao de la base de datos.
Facilidad de Aprendizaje
La documentacin de la base de datos se puede utilizar sin necesidad de otros conocimientos informticos fuera del alcance del diseo e implementacin de la base de datos.
Facilidad de Uso
Los datos deben ser fciles de elaborar y los resultados fciles de entender.
Generalidad
La base de datos debe ser capaz de adaptarse a cualquier tipo de empresa y a cualquier casustica.
Independencia de Usuario
La base de datos no debe estar ligada a la utilizacin en una nica instalacin, hay que tener en cuenta que, aunque se trate de un desarrollo a medida, en un futuro se podra realizar la instalacin en un cliente diferente al inicial.
Independencia de Sistema
Las prestaciones y diseo de la base de datos no estn vinculadas al entorno.
Independencia de Instalacin
La base de datos se puede transportar fcilmente de una instalacin a otra.
Modularidad
La base de datos puede ser descompuesta en elementos independientes. Si se trata de un diseo grande, en donde hay un gran nmero de tablas, conviene realizar agrupaciones entre ella, creando mdulos funcionales que permitan la mejor compresin del diseo y de la implantacin.
Observable
La base de datos debe permitir observar los accesos a los datos. Siempre que se pueda hay que dejar un rastro de la utilizacin de los datos por parte de los usuarios, esta informacin ayuda al redimensionado de la base de datos y a conocer el nmero de accesos a los datos.
Precisin
Los clculos efectuados se deben realizar con la precisin requerida.
Proteccin
La base de datos debe permitir la proteccin de los datos frente a usos no debidos, para ello hay que elaborar un sistema de accesos definiendo diferentes usuarios con diferentes claves y especificar que autorizaciones tendr cada usuario sobre los diferentes datos.
15
Trazabilidad
Tomando como punto de partida la versin actual se puede remontar su diseo hasta las especificaciones iniciales
2.5. Indicadores de calidad

Al finalizar el diseo de una base de datos podemos utilizar la siguiente tabla para comprobar el grado de calidad del trabajo.
1 Legibilidad Fiabilidad Portabilidad Modificabilidad Eficiencia Auto Descripcin Trivialidad Claridad Coherencia Completo Conciso Facilidad de Aprendizaje Facilidad de Uso Generalidad Independencia de Usuario Independencia del Sistema Independencia de Instalacin Modularidad Observable Precision Proteccin Trazable Legibilidad TOTAL PUNTUACIN FINAL __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 2 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 3 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 4 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 5 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 6 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 7 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 8 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 9 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ 10 __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __ __
2.6. El modelo lgico

Anteriormente se expuso el ciclo de vida del desarrollo de una base de datos. Este captulo se centrar en el diseo del modelo lgico de los datos, por tanto antes de comenzar esta modelacin es necesario tener documentado las necesidades, viabilidad y definicin de los requisitos, as como tener elaborado el modelo global o conceptual del diseo.
16
El paso del modelo global o conceptual de datos al modelo lgico supone una abstraccin, un mecanismo para la conversin del mundo real a un mundo formado por datos, a su agrupacin y clasificacin. El proceso de abstraccin consiste en identificar los elementos o conceptos empleados en el modelo global y transformarlo en lo que denominamos entidades en el modelo lgico. La abstraccin se puede realizar de las siguientes formas:
Clasificacin
Consiste en generar una nica entidad conceptos con caractersticas comunes, todos ellos tendrn las mismas caractersticas y se diferencian unos de otros por los valores que toman dichas caractersticas. Por ejemplo: los conceptos cursos de ingls, cursos de espaol y cursos de francs se pueden agrupar en una nica entidad denominada "CURSOS" que englobe y diferencie cada uno de los diferentes cursos que se imparten.
Agregacin
Consiste en separar cada una de las partes de un concepto para generar distintas entidades, por ejemplo el concepto coche lo podemos definir utilizando las entidades rueda, motor y chasis.
Generalizacin
Consiste en ir generado entidades de diferentes niveles de tal forma que cada entidad de nivel superior agrupe las de nivel inferior.
Asociacin
Consiste en la generalizacin de entidades a partir de entidades ya existentes.
17
2.7. Restricciones de integridad

En el mundo real existen ciertas restricciones que deben cumplir los elementos en l existentes; por ejemplo, una persona slo puede tener un nmero de DNI y una nica direccin oficial. Cuando se disea una base de datos se debe reflejar fielmente el universo del discurso que estamos tratando, lo que es los mismo, reflejar las restricciones existentes en el mundo real.
Los componentes de una restriccin son los siguientes:

La operacin de actualizacin (insercin, borrado o eliminacin) cuya ejecucin ha de dar lugar a la comprobacin del cumplimiento de la restriccin. La condicin que debe cumplirse, la cual es en general una proposicin lgica, definida sobre uno o varios elementos del esquema, que puede tomar uno de los valores de verdad (cierto o falso). La accin que debe llevarse a cabo dependiendo del resultado de la condicin.
En general, se puede decir que existen tres tipos de integridad:

Integridad de dominio: restringimos los valores que puede tomar un atributo respecto a su dominio, por ejemplo EDAD >= 18 - 65. Integridad de entidad: la clave primaria de una entidad no puede tener valores nulos y siempre deber ser nica, por ejemplo DNI. Integridad referencial: las claves ajenas de una tabla hija se tienen que corresponder con la clave primaria de la tabla padre con la que se relaciona. Por ejemplo, en la tabla familiares de los empleados necesitaremos el DNI de empleado, que es la clave ajena de la tabla.
Las restricciones se clasifican en:

A. Inherentes o Estn impuestas por el modelo, o No tiene que ser definidas por el usuario, ya que se encuentran en el propio modelo, o Se activan en el momento de la definicin del esquema cuando se produce un intento de violacin, o Se rechaza todo esquema que no cumple estas restricciones, o Introducen rigideces en el modelo. B. Semnticas o Impuestas por el universo del discurso, o Tienen que ser definidas por los diseadores, o Se activan en el momento de la actualizacin de la base de datos, o Se rechaza todo ejemplar que no cumpla estas restricciones (o se ponen en marcha otros medios a fin de que no se produzca un estado de inconsistencia), o Ayudan a capturar la semntica de los datos y a conseguir su consistencia. 1. Ajenas Se especifican en los programas de aplicacin, No estn almacenadas en el esquema de la base de datos, Pueden ser violadas por actualizaciones en las que no se haya programado la restriccin, El sistema de bases de datos no puede comprobar si son consistentes en s mismas. El optimizador no puede tomarlas en consideracin, Proporcionan el mximo de flexibilidad,
18
Pueden ser programadas en un lenguaje de propsito general o en algn lenguaje propio del sistema de bases de datos, Suponen una importante carga de programacin y mantenimiento.
2. Propias Se identifican en el esquema, Estn almacenadas en el esquema de la base de datos, No pueden ser violadas por ninguna actualizacin. a. Accin General Es obligatorio especificar la condicin y la accin, Son procedimentales (al menos en parte, ya que la accin se especifica siempre mediante un procedimiento), Suponen carga de programacin, Es muy difcil (prcticamente imposible en la mayor parte de los casos) que el sistema de bases de datos pueda comprobar su consistencia, El optimizador no puede tomarlas en consideracin, Hasta ahora no estn estandarizadas, Estn muy ligadas a los productos, Son muy flexibles, Tienen nombre y existencia propia dentro del programa. i. Procedimientos almacenados Es obligatorio especificar la condicin (adems de la accin), Son totalmente procedimentales, Pueden ser tan complejas como imponga la semntica del mundo real (tanto en la condicin como en la accin), Son las ms flexibles dentro de las restricciones propias.

ii.
Disparadores Combinan los enfoques declarativo (en la condicin) y procedimental (en la accin), Pueden ser tan complejas como imponga la semntica del mundo real en cuanto a la accin, y bastantes complejas en la condicin (todo lo que permite la proposicin lgica mediante la que se expresa la condicin), El cumplimiento de la condicin dispara la accin, Son ms flexibles que las restricciones de accin especfica.
b. Accin Especfica La accin est implcita en la misma restriccin, por lo que no hay que definirla, Son declarativas, puesto que no especifica la accin y la condicin, si se define, es declarativa, El no cumplimiento de la condicin lleva a aplicar la accin, Podran ser definidas mediante un lenguaje de tipo general, El sistema de bases de datos puede comprobar si son consistentes en s mismas, El optimizador puede tomarlas en consideracin, No suponen carga de programacin, slo de definicin. i. Condicin General No se especifica la accin, que es siempre de rechazo (el no cumplimiento de la condicin lleva consigo el rechazo de la actualizacin),
19
Es obligatorio declarar la condicin mediante una proposicin lgica que permite condiciones de complejidad arbitraria, Adems de la condicin, se puede especificar algn otro componente, Son ms flexibles que las de condicin especfica, Es ms difcil optimizar su ejecucin que en el caso de las de condicin especfica. I. Verificacin

No tienen existencia en s mismas, Su definicin forma parte de la definicin del elemento afectado por la restriccin, Se aplican a un nico elemento y aunque pueden afectar a otros, en este caso se complica su definicin, Pueden no tener nombre. Tienen existencia por s mismas, Se definen con independencia de cualquier elemento del esquema, Pueden afectar a ms de un elemento, Tienen nombre.
II.
Asercin

ii.

Condicin Especfica Son opciones proporcionadas por el propio modelo, No se especifica ninguno de los componentes relativos a una restriccin (ni la operacin, ni la condicin, ni la accin), Son poco flexibles, El optimizador puede tomarlas en consideracin, Su ejecucin puede ser ms fcilmente optimizada que las de condicin general.
Modelo Relacional SQL y bases de datos relacionales Claudio Casares
20
3. Modelo Relacional
3.1. Introduccin
Las bases de datos relacionales son el tipo de bases de datos actualmente ms difundido. Los motivos de este xito son fundamentalmente dos: 1. ofrecen sistemas simples y eficaces para representar y manipular los datos 2. se basan en un modelo, el relacional, con slidas bases tericas El modelo relacional fue propuesto originariamente por E.F. Codd en un ya famoso artculo de 1970. Gracias a su coherencia y facilidad de uso, el modelo se ha convertido en los aos 80 en el ms usado para la produccin de DBMS (Database Management System). La estructura fundamental del modelo relacional es precisamente esa, "relacin", es decir una tabla bidimensional constituida por lneas (tuplas) y columnas (atributos). Las relaciones representan las entidades que se consideran interesantes en la base de datos. Cada instancia de la entidad encontrar sitio en una tupla de la relacin, mientras que los atributos de la relacin representarn las propiedades de la entidad. Por ejemplo, si en la base de datos se tienen que representar personas, se podr definir una relacin llamada "Personas", cuyos atributos describen las caractersticas de las personas (tabla siguiente). Cada tupla de la relacin "Personas" representar una persona concreta.
Persona Nombre Juan Isabel Micaela Apellido Loza Glvez Ruz Nacimiento 15/06/1971 23/12/1969 02/10/1985 Sexo H M M Estado Civil Soltero Casada Soltera
En realidad, siendo rigurosos, una relacin es slo la definicin de la estructura de la tabla, es decir su nombre y la lista de los atributos que la componen. Cuando se puebla con las tuplas, se habla de "instancia de relacin". Por eso, la tabla anterior representa una instancia de la relacin persona. Una representacin de la definicin de esa relacin podra ser la siguiente:
Personas (nombre, apellido, fecha_nacimiento, sexo, estado_civil)
A continuacin, se indicarn ambas (relacin e instancia de relacin) con el trmino "relacin", a no ser que no quede claro por el contexto a qu acepcin se refiere.
3.1.1. Clave primaria

Las tuplas en una relacin son un conjunto en el sentido matemtico del trmino, es decir una coleccin no ordenada de elementos diferentes. Para distinguir una tupla de otra, se recurre al concepto de clave primaria, o sea a un conjunto de atributos que permiten identificar unvocamente una tupla en una relacin. Naturalmente, en una relacin puede haber ms combinaciones de atributos que permitan identificar unvocamente una tupla ( claves candidatas), pero entre stas se elegir una sola para utilizar como clave primaria. Los atributos de la clave primaria no pueden asumir el valor nulo (que significa un valor no determinado), en tanto que ya no permitiran identificar una tupla concreta en una relacin. Esta propiedad de las relaciones y de sus claves primarias est bajo el nombre de integridad de las entidades (entity integrity). A menudo, para obtener una clave primaria "econmica", es decir compuesta de pocos atributos fcilmente manipulables, se introducen uno o ms atributos ficticios, con cdigos identificativos unvocos para cada tupla de la relacin.
21
3.1.2. Dominio
Cada atributo de una relacin se caracteriza por un nombre y por un dominio. El dominio indica qu valores pueden ser asumidos por una columna de la relacin. A menudo un dominio se define a travs de la declaracin de un tipo para el atributo (por ejemplo diciendo que es una cadena de diez caracteres), pero tambin es posible definir dominios ms complejos y precisos. Por ejemplo, para el atributo sexo de nuestra relacin Personas podemos definir un dominio por el cual los nicos valores vlidos son 'M' y 'F'; o bien por el atributo fecha_nacimiento podremos definir un dominio por el que se consideren vlidas slo las fechas de nacimiento despus del uno de enero de 1960, si en nuestra base de datos no est previsto que haya personas con fecha de nacimiento anterior a esa. El motor de datos se ocupar de controlar que en los atributos de las relaciones se incluyan slo los valores permitidos por sus dominios.
3.1.3. Integridad referencial

Una caracterstica fundamental de los dominios de una base de datos relacional es que sean atmicos, es decir que los valores contenidos en las columnas no se puedan separar en valores de dominios ms simples. Ms formalmente se dice que no es posible tener atributos multivalor (multivalued). Por ejemplo, si una caracterstica de las personas en nuestra base de datos fuese la de tener uno o ms hijos, no sera posible escribir la relacin Personas de la siguiente manera:
Personas (nombre, apellido, fecha_nacimiento, sexo, estado_civil, hijos)
En efecto, el atributo hijos es un atributo no-atmico, bien porque una persona puede tener ms de un hijo o porque cada hijo tendr diferentes caractersticas que lo describen. Para representar estas entidades en una base de datos relacional hay que definir dos relaciones:
Personas (*nmero_persona, nombre, apellido, fecha_nacimiento, sexo, estado_civil) Hijos(*nmero_persona, *nombre_apellido, edad, sexo)
En las relaciones precedentes, los asteriscos (*) indican los atributos que componen sus claves primarias. Ntese la introduccin en la relacin Personas del atributo nmero_persona, a travs del cual se asigna a cada persona un identificativo numrico unvoco que se usa como llave primaria. Estas relaciones contienen slo atributos atmicos. Si una persona tiene ms de un hijo, stos se representarn en tuplas diferentes de la relacin Hijos. Las diferentes caractersticas de los hijos las representan los atributos de la relacin Hijos. La unin entre las dos relaciones est constituida por los atributos nmero_persona que aparecen en ambas relaciones y que permiten que se asigne cada tupla de la relacin Hijos a una tupla concreta de la relacin Personas. Ms formalmente se dice que el atributo nmero_persona de la relacin Hijos es una clave externa (foreign key) hacia la relacin Personas. Una clave externa es una combinacin de atributos de una relacin que son, a su vez, una clave primaria para otra relacin. Una caracterstica fundamental de los valores presentes en una clave externa es que, a no ser que no sean null, tienen que corresponder a valores existentes en la clave primaria de la relacin a la que se refieren. En nuestro ejemplo, esto significa que no puede existir en la relacin Hijos una tupla con un valor del atributo nmero_persona sin que tambin en la relacin Personas exista una tupla con el mismo valor para su llave primaria. Esta propiedad va bajo el nombre de integridad referencial (referential integrity).
3.1.4. lgebra relacional

Una de las grandes ventajas del modelo relacional es que define tambin un lgebra, llamada lgebra relacional. Todas las manipulaciones posibles sobre las relaciones se obtienen gracias a la combinacin de tan slo cinco operadores: RESTRICT, PROJECT, TIMES, UNION y MINUS. Por comodidad, se han definido tambin tres operadores adicionales que de todos modos se pueden obtener aplicando los cinco fundamentales: JOIN, INTERSECT y DIVIDE. Los operadores relacionales reciben como argumento una relacin o un conjunto de relaciones y restituyen una nica relacin como resultado.
22
Veamos brevemente estos ocho operadores: 1. RESTRICT: restituye una relacin que contiene un subconjunto de las tuplas de la relacin a la que se aplica. Los atributos se quedan como estaban. 2. PROJECT: restituye una relacin con un subconjunto de los atributos de la relacin a la que viene aplicado. Las tuplas de la relacin resultado se componen de las tuplas de la relacin original, de manera que siguen siendo un conjunto en sentido matemtico. 3. TIMES: se aplica a dos relaciones y efecta el producto cartesiano de las tuplas. Cada tupla de la primera relacin est concatenada con cada tupla de la segunda. 4. JOIN: se concatenan las tuplas de dos relaciones de acuerdo con el valor de un conjunto de sus atributos. 5. UNION: aplicando este operador a dos relaciones compatibles, se obtiene una que contiene las tuplas de ambas relaciones. Dos relaciones son compatibles si tienen el mismo nmero de atributos y los atributos correspondientes en las dos relaciones tienen el mismo dominio. 6. MINUS: aplicado a dos relaciones compatibles restituye una tercera que contiene las tuplas que se encuentran slo en la primera relacin. 7. INTERSECT: aplicado a dos relaciones compatibles restituye una relacin que contiene las tuplas que existen en ambas. 8. DIVIDE: aplicado a dos relaciones que tengan atributos comunes, restituye una tercera que contiene todas las tuplas de la primera relacin que se puede hacer que correspondan con todos los valores de la segunda relacin. En las siguientes tablas, a ttulo de ejemplo, se representan los resultados de la aplicacin de algunos operadores relacionales a las relaciones Personas e Hijos. Como nombres para las relaciones resultado se han utilizado las expresiones que las producen. Personas
nmero_persona 2 1 3 nombre Mario Giuseppe Alessandra apellido Rossi Russo Mondella fecha_nacimiento sexo estado_civil 29/03/1965 15/11/1972 13/06/1970 M M F Casado Soltero Soltera
Hijos
nmero_persona 2 2 nombre_apellido Maria Rossi Gianni Rossi edad 3 5 sexo F M
RESTRICT (Personas) sexo='M'

nmero_persona 2 1 nombre Mario Giuseppe apellido Rossi Russo fecha_nacimiento 29/03/1965 15/11/1972 sexo estado_civil M M Casado Soltero
Las bases de datos relacionales efectan todas las operaciones en las tablas usando el lgebra relacional, aunque normalmente no le permiten al usuario usarla. El usuario interacciona con la base de datos a travs de una interfaz diferente el lenguaje SQL, un lenguaje declarativo que permite escribir conjuntos de datos. Las instrucciones SQL vienen descompuestas por el motor de datos en una serie de operaciones relacionales.
23
3.2. Proceso de normalizacin

El proceso de normalizacin es un estndar que consiste, bsicamente, en un proceso de conversin de las relaciones entre las entidades, evitando:

La redundancia de los datos: repeticin de datos en un sistema. Anomalas de actualizacin: inconsistencias de los datos como resultado de datos redundantes y actualizaciones parciales. Anomalas de borrado: prdidas no intencionadas de datos debido a que se han borrado otros datos. Anomalas de insercin: imposibilidad de adicionar datos en la base de datos debido a la ausencia de otros datos.
Autores y libros NOMBRE Date Ad.Mig. Ma.Piat. Date NACION USA ESP ITA USA CODLIBRO 999 888 777 666 TITULO IBD CyD CyD BdD EDITOR AW RM RM AW
Tomando como referencia la tabla siguiente:
Se plantean una serie de problemas:

Redundancia: cuando un autor tiene varios libros, se repite la nacionalidad. Anomalas de modificacin: Si "Ad.Mig." y "Ma.Piat." desean cambiar de editor, se modifica en los 2 lugares. A priori no podemos saber cuntos autores tiene un libro. Los errores son frecuentes al olvidar la modificacin de un autor. Se pretende modificar en un slo sitio. Anomalas de insercin: Se desea dar de alta un autor sin libros, en un principio. NOMBRE y CODLIBRO son campos clave, una clave no puede tomar valores nulos. Integridad entre los datos: consistencia de la informacin.
Asegurando:
El proceso de normalizacin nos conduce hasta el modelo fsico de datos y consta de varias fases denominadas formas normales, estas formas se detallan a continuacin.
3.2.1. Definicin de la clave

Antes de proceder a la normalizacin de la tabla lo primero que debemos de definir es una clave, esta clave deber contener un valor nico para cada registro (no podrn existir dos valores iguales en toda la tabla) y podr estar formado por un nico campo o por un grupo de campos. En la tabla de alumnos de un centro de estudios no podemos definir como campo clave el nombre del alumno ya que pueden existir varios alumnos con el mismo nombre. Podramos considerar la posibilidad de definir como clave los campos nombre y apellidos, pero estamos en la misma situacin: podra darse el caso de alumnos que tuvieran los mismo apellidos y el mismo nombre ( Juan Fernndez Martn). La solucin en este caso es asignar un cdigo de alumno a cada uno, un nmero que identifique al alumno y que estemos seguros que es nico. Una vez definida la clave podremos pasar a estudiar la primera forma normal.
3.2.2. Primera forma normal (1NF)
24
Se dice que una tabla se encuentra en primera forma normal ( 1NF) si y solo si cada uno de los campos contiene un nico valor para un registro determinado. Supongamos que deseamos realizar una tabla para guardar los cursos que estn realizando los alumnos de un determinado centro de estudios, podramos considerar el siguiente diseo:
Cdigo* 1 2 3 Nombre Marcos Lucas Marta Cursos Ingls Contabilidad, Informtica Ingls, Contabilidad
Podemos observar que el registro de cdigo 1 si cumple la primera forma normal, cada campo del registro contiene un nico dato, pero no ocurre as con los registros 2 y 3 ya que en el campo cursos contiene ms de un dato cada uno. La solucin en este caso es crear dos tablas del siguiente modo:
TABLA A Cdigo* 1 2 3 Nombre Marcos Lucas Marta Cdigo* 1 2 2 3 3 TABLA B Curso* Ingls Contabilidad Informtica Ingls Informtica
Como se puede comprobar ahora todos los registros de ambas tablas contienen valores nicos en sus campos, por lo tanto ambas tablas cumplen la primera forma normal. Una vez normalizada la tabla en 1NF, podemos pasar a la segunda forma normal.
3.2.3. Segunda forma normal (2NF)

La segunda forma normal compara todos y cada uno de los campos de la tabla con la clave definida. Si todos los campos dependen directamente de la clave se dice que la tabla est es segunda forma normal (2NF). Supongamos que construimos una tabla con los aos que cada empleado ha estado trabajando en cada departamento de una empresa:
Cdigo Empleado* 1 2 3 4 2 Cdigo Dpto.* Nombre 6 3 2 3 6 Juan Pedro Sonia Vernica Pedro Departamento Contabilidad Sistemas I+D Sistemas Contabilidad Aos 6 3 1 10 5
Tomando como punto de partida que la clave de esta tabla est formada por los campos cdigo de empleado y cdigo de departamento, podemos decir que la tabla se encuentra en primera forma normal, por tanto vamos a estudiar la segunda: 1. El campo nombre no depende funcionalmente de toda la clave, slo depende del cdigo del empleado.
25
2. El campo departamento no depende funcionalmente de toda la clave, slo del cdigo del departamento. 3. El campo aos si que depende funcionalmente de la clave ya que depende del cdigo del empleado y del cdigo del departamento (representa el nmero de aos que cada empleado ha trabajado en cada departamento) Por tanto, al no depender todos los campos de la totalidad de la clave la tabla no est en segunda forma normal, la solucin es la siguiente:
Tabla A Cdigo Empleado* 1 2 3 4 Nombre Juan Pedro Sonia Vernica Tabla B Cdigo Departamento* 2 3 6 Dpto. I+D Sistemas Contabilidad Cdigo Empleado* 1 2 3 4 2 Tabla C Cdigo Departamento* 6 3 2 3 6 Aos 6 3 1 10 5
Podemos observar que ahora si se encuentras las tres tabla en segunda forma normal, considerando que la tabla A tiene como ndice el campo Cdigo Empleado, la tabla B Cdigo Departamento y la tabla C una clave compuesta por los campos Cdigo Empleado y Cdigo Departamento.
3.2.4. Tercera forma normal (3NF)

Se dice que una tabla est en tercera forma normal si y solo si los campos de la tabla dependen nicamente de la clave, dicho en otras palabras los campos de las tablas no dependen unos de otros . Tomando como referencia el ejemplo anterior, supongamos que cada alumno slo puede realizar un nico curso a la vez y que deseamos guardar en que aula se imparte el curso. A voz de pronto podemos plantear la siguiente estructura:
Cdigo* 1 2 3 Nombre Marcos Lucas Marta Curso Informtica Ingls Contabilidad Aula Aula A Aula B Aula C
Estudiemos la dependencia de cada campo con respecto a la clave cdigo:

Nombre depende directamente del cdigo del alumno. Curso depende de igual modo del cdigo del alumno. El aula, aunque en parte tambin depende del alumno, est mas ligado al curso que el alumno est realizando.
Tabla A Cdigo* Nombre 1 2 3 Marcos Lucas Marta Curso Informtica Ingls Contabilidad Curso* Informtica Ingls Contabilidad Tabla B Aula Aula A Aula B Aula C
Por esta ltima razn se dice que la tabla no est en 3NF. La solucin sera la siguiente:
26
Una vez conseguida la tercera forma normal, se puede estudiar la cuarta forma normal.
3.2.5. Cuarta forma normal (4NF)

Una tabla est en cuarta forma normal si y slo si para cualquier combinacin de los campos de la clave no existen valores duplicados. Vemoslo con un ejemplo:
Geometra Figura* Cuadrado Cuadrado Cuadrado Crculo Crculo Crculo Color* Rojo Azul Azul Blanco Azul Azul Tamao* Grande Grande Mediano Mediano Pequeo Mediano
Comparemos ahora la clave (Figura) con el atributo Tamao, podemos observar que Cuadrado Grande est repetido; igual pasa con Crculo Azul, entre otras. Estas repeticiones son las que se deben evitar para tener una tabla en 4NF. La solucin en este caso sera la siguiente:
Tamao Figura* Cuadrado Cuadrado Crculo Crculo Tamao* Grande Pequeo Mediano Pequeo Figura* Cuadrado Cuadrado Crculo Crculo Color Color* Rojo Azul Blanco Azul
3.2.6. Otras formas normales

Existen otras dos formas normales, la llamada quinta forma normal (5FN) que no detallo por su dudoso valor prctico ya que conduce a una gran divisin de tablas y la forma normal dominio / clave (FNDLL) de la que no existe mtodo alguno para su implantacin.
3.3. Las interrelaciones

Las interrelaciones son las relaciones que existen entre varias tablas del sistema ( Clientes y Pedidos, por ejemplo). Existen tres formas de interrelaciones dependiendo de la cardinalidad con la que se combinan los elementos de ambas tablas.
3.3.1. Interrelaciones uno a uno

Una interrelacin es de uno a uno entre la tabla A y la tabla B cuando a cada elemento de la clave de A se le asigna un nico elemento de la tabla B y para cada elemento de la clave de la tabla B contiene un nico elemento en la tabla A. Un ejemplo de interrelacin de este tipo es la formada por las tablas Datos Generales de Clientes y Datos Contables de Clientes. En esta relacin cada cliente tiene una nica direccin y una direccin en cada una de las tablas. Representamos la relacin como A 1:1 B. Ante la presencia de este tipo de relacin nos podemos plantear el caso de unificar todos los datos en nica tabla pues no es necesario mantener ambas tablas a la misma vez.
27
Este tipo de relacin se genera cuando aparecen tablas muy grandes, con gran cantidad de campos, disgregando la tabla principal en dos para evitar tener una tabla muy grande. Tambin surge cuando los diferentes grupos de usuario cumplimentan una informacin diferente para un mismo registros; en este caso se crean tantas tablas como registros, evitando as tener que acceder a informacin que el usuario del grupo actual no necesita.
3.3.2. Interrelaciones uno a varios

Una interrelacin es de uno a varios entre las tablas A y B cuando una clave de la tabla A posee varios elementos relacionados en la tabla B y cuando una clave de la tabla B posee un nico elemento relacionado en la tabla A. Estudiemos la relacin entre la tabla de clientes y la tabla de pedidos. Un cliente puede realizar varios pedidos pero un pedido pertenece a un nico cliente, por tanto se trata de una relacin uno a varios y la representamos A 1:n B. Estas relaciones suelen surgir de aplicar la 1NF a una tabla.
3.3.3. Interrelaciones varios a varios

Una interrelacin es de varios a varios entre las tablas A y B cuando una clave de la tabla A posee varios elementos relacionados en la tabla B y cuando una clave de la tabla B posee varios elementos relacionados en la tabla A. Un caso muy caracterstico de esta interrelacin es la que surge entre las tablas de Puestos de Trabajo y Empleados de una empresa. Un Empleado puede desempear realizar varias funciones dentro de una empresa (desempear varios puestos de trabajo), y un puesto de trabajo puede estar ocupado por varios empleados a la misma vez. Esta interrelacin la representamos como A n:n B. No se deben definir relaciones de este tipo en un sistema de bases de datos, debido a su complejidad a la hora de su mantenimiento, por este motivo se debe transformar este tipo de relacin es dos interrelaciones de tipo 1:n, empleando para ello una tabla puente y que estar formada por las claves de ambas tablas. Esta tabla puente debe contener una nica clave compuesta formada por los campos clave de las tablas primeras.
Empleados Cdigo Empleado* 103 105 251 736 Empleado Juan Luisa Martn Ana Mara Tabla Puente Cdigo Empleado* 103 103 105 251 736 736 Cdigo Puesto* 52 73 73 52 52 73 Cdigo Puesto* 52 73 Puestos Puesto Comercial Administrativo
28
Ahora existe una relacin 1:n entre Empleados y Tabla Puente y otra relacin 1:n entre Puestos y Tabla Puente ya que un empleado posee varios cdigos de empleado en la tabla puente pero cada elemento de la tabla puente pertenece a un nico empleado. Por otro la un puesto de trabajo posee varios elementos relacionados en la tabla puente, pero cada elemento de la tabla puente est relacionado con un nico elemento de la tabla puestos.
3.3.4. Problemas con las interrelaciones

A la hora de establecer las interrelaciones existentes en un sistema de bases de datos nos podemos encontrar dos problemas: 1. Interrelaciones recursivas: un elemento se relaciona consigo mismo directamente. 2. Interrelaciones circulares o cclicas : A se relaciona con B, B se relaciona con C y C se relaciona con A. Ambos casos pueden suponer un grave problema si definimos una relacin con integridad referencial y decimos eliminar en cascada (al eliminar una clave de la tabla A se eliminan los elementos relacionados en la tabla B). Supongamos la relacin recursiva existen en la relacin Empleado y Supervisor (ambos son empleados de la empresa). Est claro que un empleado est supervisado por otro empleado. Veamos la forma de solucionarlo:
Empleados Cdigo* 102 105 821 956 Nombre Juan Luis Mara Martn Supervisor NO SI NO SI
Para solucionar la relacin debemos crear una tabla formada por dos campos. Ambos campos deben ser el cdigo del empleado pero como no podemos tener dos campos con el mismo nombre a uno de ellos le llamaremos cdigo supervisor.
Tabla Puente Cdigo Empleado* 102 105 821 956 Cdigo Supervisor* 105 956 105 105
Para terminar de resolver la interrelacin recursiva basta con definir dos interrelaciones entre la tabla empleados y la tabla puente de tipo 1:n. La primera relacin se crea utilizando las claves Empleados[Cdigo] y Tabla Puente[Cdigo Empleado]. La segunda entre Empleados[Cdigo] y Tabla Puente [Cdigo Supervisor]. Las interrelaciones cclicas o circulares no son muy frecuentes y no existe una metodologa estndar para su eliminacin, normalmente son debidas a errores de diseo en la base de datos, principalmente en el diseo conceptual del sistema de datos. Por tanto si llegamos a este punto hay que volver a replantearse todo el diseo de la base de datos.
3.3.5. Atributos de las interrelaciones
29
En la mayora de las interrelaciones definidas ser conveniente exigir integridad relacional entre las claves. Exigiendo la integridad referencial se consigue que en una relacin de tipo 1:n o de tipo 1:1, no se puede aadir ningn valor en la tabla destino si no existe en la tabla origen. Dicho con un ejemplo: en la relacin Clientes y Pedidos, la tabla Pedidos contiene un campo que se corresponde con el cdigo del Cliente, si se exige la integridad referencial no se podr escribir un cdigo de cliente en la tabla Pedidos que no exista en la tabla Clientes; de no exigir la integridad referencial se podrn crear pedidos con cdigos de clientes que no existen, generando incongruencia de datos en la base de datos. Definida la integridad referencial (siempre necesaria) podemos exigir la actualizacin en cascada (siempre necesaria); esta actualizacin implica que si cambiamos el cdigo a un cliente, debemos actualizar dicho cdigo en la tabla de pedidos, de no ser as, al cambiar el cdigo a un cliente, perderemos los pedidos que tena realizados. Para concluir debemos hablar de la eliminacin en cascada (NO siempre necesaria), la eliminacin en cascada consiste en eliminar todos los datos dependientes de una clave. En nuestro ejemplo implica que al borrar un cliente hay que eliminar todos los pedidos que ha realizado. En muchas ocasiones no interesa realizar esta operacin de eliminacin en cascada por motivos diversos. Si en el caso de clientes y pedidos no se exige eliminacin en cascada no se podr borrar ningn cliente en tanto en cuanto tenga realizado algn pedido (de lo contrario tendramos incongruencia de datos).
3.4. lgebra relacional

Las operaciones de lgebra relacional manipulan relaciones. Esto significa que estas operaciones usan uno o dos relaciones existentes para crear una nueva relacin. Esta nueva relacin puede entonces usarse como entrada para una nueva operacin. Este poderoso concepto la creacin de una nueva relacin a partir de relaciones existentes hace considerablemente ms fcil la solucin de las consultas, debido a que se puede experimentar con soluciones parciales hasta encontrar la proposicin con la que se trabajar. El lgebra relacional consta de nueve operaciones: 1. 2. 3. 4. 5. 6. 7. 8. 9. Unin Interseccin Diferencia Producto Seleccin Proyeccin Reunin Divisin Asignacin =
Las cuatro primeras se toman de la teora de conjunto de las matemticas; las cuatro siguientes son operaciones propias del lgebra relacional y la ltima es la operacin estndar de dar un valor a un elemento.
3.4.1. Unin
La operacin de unin () permite combinar datos de varias relaciones. Supongamos que una determinada empresa internacional posee una tabla de empleados para cada uno de los pases en los que opera. Para conseguir un listado completo de todos los empleados de la empresa tenemos que realizar una unin de todas las tablas de empleados de todos los pases. No siempre es posible realizar consultas de unin entre varias tablas, para poder realizar esta operacin es necesario e imprescindible que las tablas a unir tengan las mismas estructuras, que sus campos sean iguales.
30
3.4.2. Interseccin
La operacin de interseccin () permite identificar filas que son comunes en dos relaciones . Supongamos que tenemos una tabla de empleados y otra tabla con los asistentes que han realizado un curso de ingls (los asistentes pueden ser empleados o gente de la calle). Queremos crear una figura virtual en la tabla denominada " Empleados que hablan Ingls", esta figura podemos crearla realizando una interseccin de empleados y curso de ingls, los elementos que existan en ambas tablas sern aquellos empleados que han asistido al curso.
3.4.3. Diferencia
La operacin diferencia (-) permite identificar filas que estn en una relacin y no en otra . Tomando como referencia el caso anterior, deberamos aplicar una diferencia entre la tabla empleados y la tabla asistentes al curso para saber aquellos asistentes externos a la organizacin que han asistido al curso.
3.4.4. Producto
La operacin producto () consiste en la realizacin de un producto cartesiano entre dos tablas dando como resultado todas las posibles combinaciones entre los registros de la primera y los registros de la segunda. Esta operacin se entiende mejor con el siguiente ejemplo:
Tabla A X 10 11 Y 22 25 W 33 37 42 Tabla B Z 54 98 100
El producto de A B dara como resultado la siguiente tabla:

Tabla A Tabla B X 10 10 10 11 11 11 Y 22 22 22 25 25 25 W 33 37 42 33 37 42 Z 54 98 100 54 98 100
3.4.5. Seleccin
La operacin seleccin () consiste en recuperar un conjunto de registros de una tabla o de una relacin indicando las condiciones que deben cumplir los registros recuperados , de tal forma que los registros devueltos por la seleccin han de satisfacer todas las condiciones que se hayan establecido. Esta operacin es la que normalmente se conoce como consulta. Podemos emplearla para saber que empleados son mayores de 45 aos, o cuales viven en Madrid, incluso podemos averiguar los que son mayores de 45 aos y residen en Madrid, los que son mayores de 45 aos y no viven en Madrid, etc.. En este tipo de consulta se emplean los diferentes operadores de comparacin ( =,>, <, >=, <=, <>), los operadores lgicos (and, or, xor) o la negacin lgica (not).
31
3.4.6. Proyeccin
Una proyeccin () es un caso concreto de la operacin seleccin, esta ltima devuelve todos los campos de aquellos registros que cumplen la condicin que he establecido. Una proyeccin es una seleccin en la que seleccionamos aquellos campos que deseamos recuperar. Tomando como referencia el caso de la operacin seleccin es posible que lo nico que nos interese recuperar sea el nmero de la seguridad social, omitiendo as los campos telfono, direccin, etc.. Este ltimo caso, en el que seleccionamos los campos que deseamos, es una proyeccin.
3.4.7. Reunin (Unin natural)

La reunin () se utiliza para recuperar datos a travs de varias tablas conectadas unas con otras mediante clusulas JOIN, en cualquiera de sus tres variantes INNER, LEFT, RIGHT. La operacin reunin se puede combinar con las operaciones seleccin y proyeccin. Un ejemplo de reunin es conseguir los pedidos que nos han realizado los clientes nacionales cuyo importe supere 15.000 unidades de producto, generando un informe con el nombre del cliente y el cdigo del pedido. En este caso se da por supuesto que la tabla clientes es diferente a la tabla pedidos y que hay que conectar ambas mediante, en este caso, un INNER JOIN. Otro tipos de reuniones: Semi-unin izquierda () y semi-unin derecha ( )
3.4.8. Divisin
La operacin divisin () es la contraria a la operacin producto y quizs sea la ms compleja de explicar, por tanto comenzar con directamente con un ejemplo. Una determinada empresa posee una tabla de comerciales, otra tabla de productos y otra con las ventas de los comerciales. Queremos averiguar que comerciales han vendido todo tipo de producto. Lo primero que hacemos es extraer en una tabla todos los cdigos de todos los productos, a esta tabla la denominamos A.
Tabla A Cdigo Producto 1035 2241 2249 5818
En una segunda tabla extraemos, de la tabla de ventas, el cdigo del producto y el comercial que lo ha vendido, lo hacemos con una proyeccin y evitamos traer valores duplicados. El resultado podra ser el siguiente:
Tabla B Cdigo Comercial 10 23 23 39 37 10 23 23 Cdigo Producto 2241 2518 1035 2518 2518 2249 2249 2241
32
Si dividimos la tabla B entre la tabla A obtendremos como resultado una tercera tabla que: 1. Los campos que contiene son aquellos de la tabla B que no existen en la tabla A. En este caso el campo Cdigo Comercial es el nico de la tabla B que no existen en la tabla A. 2. Un registro se encuentra en la tabla resultado si y slo si est asociado en tabla B con cada fila de la tabla A
Tabla Resultado Cdigo Comercial 23
Por qu el resultado es 23?. El comercial 23 es el nico de la tabla B que tiene asociados todos los posibles cdigos de producto de la tabla A.
3.4.9. Asignacin
Esta operacin algebraica consiste en asignar un valor a uno o varios campos de una tabla.
3.5. Clculo relacional

El clculo relacional usa un enfoque completamente diferente al lgebra relacional. No obstante, los dos lenguajes son lgicamente equivalentes. Esto significa que cualquier consulta que pueda resolverse en un lenguaje puede resolverse en el otro. La solucin para toda consulta en este tipo de clculo se define por: 1. Una lista de resultados 2. Una sentencia de cualificacin La lista de resultados est clara, son aquellos registros que cumplen las condiciones que deseamos. La sentencia de cualificacin contiene las condiciones que deseamos que cumplan los registros de la lista de resultados. La diferencia entre el clculo y el lgebra radica en que el clculo realiza la operacin en un nico paso, sin necesidad de tener que obtener tablas intermedias, el lgebra realiza las operaciones paso a paso. Normalmente el clculo relacional se apoya en algn lenguaje de interrogacin de bases de datos como puede ser el SQL y que desarrollar ms adelante. El clculo relacional incluye un concepto nuevo denominado cuantificador, los cuantificadores tratan de averiguar el nmero de registros afectados por una determinada operacin, incluso antes de realizarla. Segn su naturaleza los podemos dividir en dos grupos:
Cuantificadores existenciales
Son aquellos que tratan de averiguar el nmero de registros que devolvera un tipo de consulta. Por ejemplo: saber el nmero de clientes de Madrid que han comprado el producto 2015. Si el nmero de registros que satisfacen esta relacin es mayor que cero, podemos generar la consulta para lanzar posteriormente un informe, en caso contrario se puede enviar un mensaje al usuario para que sepa que no hay ningn cliente con estas caractersticas.
Cuantificadores universales
Son aquellos que indican que una condicin se aplica a todas las filas de algn tipo. Se usa para brindar la misma capacidad que la operacin divisin del lgebra relacional.
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares
33
4. Lenguaje SQL
4.1. Introduccin
El lenguaje de consulta estructurado (SQL) es un lenguaje de base de datos normalizado, utilizado por los diferentes motores de bases de datos para realizar determinadas operaciones sobre los datos o sobre la estructura de los mismos. Pero como sucede con cualquier sistema de normalizacin hay excepciones para casi todo; de hecho, cada motor de bases de datos tiene sus peculiaridades y lo hace diferente de otro motor, por lo tanto, el lenguaje SQL normalizado (ANSI) no nos servir para resolver todos los problemas, aunque si se puede asegurar que cualquier sentencia escrita en ANSI ser interpretable por cualquier motor de datos.
4.1.1. Breve historia

La historia de SQL (que se pronuncia deletreando en ingls las letras que lo componen, es decir "ese-cu-ele" y no "siquel" como se oye a menudo) empieza en 1974 con la definicin, por parte de Donald Chamberlin y de otras personas que trabajaban en los laboratorios de investigacin de IBM, de un lenguaje para la especificacin de las caractersticas de las bases de datos que adoptaban el modelo relacional. Este lenguaje se llamaba SEQUEL (Structured English Query Language) y se implement en un prototipo llamado SEQUEL-XRM entre 1974 y 1975. Las experimentaciones con ese prototipo condujeron, entre 1976 y 1977, a una revisin del lenguaje ( SEQUEL/2), que a partir de ese momento cambi de nombre por motivos legales, convirtindose en SQL. El prototipo ( System R), basado en este lenguaje, se adopt y utiliz internamente en IBM y lo adoptaron algunos de sus clientes elegidos. Gracias al xito de este sistema, que no estaba todava comercializado, tambin otras compaas empezaron a desarrollar sus productos relacionales basados en SQL. A partir de 1981, IBM comenz a entregar sus productos relacionales y en 1983 empez a vender DB2. En el curso de los aos ochenta, numerosas compaas (por ejemplo Oracle y Sybase, slo por citar algunos) comercializaron productos basados en SQL, que se convierte en el estndar industrial de hecho por lo que respecta a las bases de datos relacionales. En 1986, el ANSI adopt SQL (sustancialmente adopt el dialecto SQL de IBM) como estndar para los lenguajes relacionales y en 1987 se transform en estndar ISO. Esta versin del estndar va con el nombre de SQL/86. En los aos siguientes, ste ha sufrido diversas revisiones que han conducido primero a la versin SQL/89 y, posteriormente, a la actual SQL/92. El hecho de tener un estndar definido por un lenguaje para bases de datos relacionales abre potencialmente el camino a la intercomunicabilidad entre todos los productos que se basan en l. Desde el punto de vista prctico, por desgracia las cosas fueron de otro modo. Efectivamente, en general cada productor adopta e implementa en la propia base de datos slo el corazn del lenguaje SQL (el as llamado Entry level o al mximo el Intermediate level), extendindolo de manera individual segn la propia visin que cada cual tenga del mundo de las bases de datos. Actualmente, est en marcha un proceso de revisin del lenguaje por parte de los comits ANSI e ISO, que debera terminar en la definicin de lo que en este momento se conoce como SQL3. Las caractersticas principales de esta nueva encarnacin de SQL deberan ser su transformacin en un lenguaje stand-alone (mientras ahora se usa como lenguaje hospedado en otros lenguajes) y la introduccin de nuevos tipos de datos ms complejos que permitan, por ejemplo, el tratamiento de datos multimediales.
4.1.2. Componentes del SQL

El lenguaje SQL est compuesto por comandos, clusulas, operadores y funciones de agregado. Estos elementos se combinan en las instrucciones para crear, actualizar y manipular las bases de datos.
34
Comandos
Existen dos tipos de comandos SQL: DDL (Data Definition Language) que permiten crear y definir nuevas bases de datos, campos e ndices. DCL (Data Control Language) que permite administrar el control de acceso. Se utilizan los comandos GRANT y REVOKE DML (Data Manipulation Language) que permiten generar consultas para ordenar, filtrar y extraer datos de la base de datos.
Comandos DDL Comando CREATE DROP ALTER Descripcin Utilizado para crear nuevas tablas, campos e ndices Empleado para eliminar tablas e ndices Utilizado para modificar las tablas agregando campos o cambiando la definicin de los campos. Comandos DML Comando SELECT INSERT UPDATE DELETE Descripcin Utilizado para consultar registros de la base de datos que satisfagan un criterio determinado Utilizado para cargar lotes de datos en la base de datos en una nica operacin. Utilizado para modificar los valores de los campos y registros especificados Utilizado para eliminar registros de una tabla de una base de datos
Clusulas
Las clusulas son condiciones de modificacin utilizadas para definir los datos que desea seleccionar o manipular.
Clusula FROM WHERE GROUP BY HAVING ORDER BY Descripcin Utilizada para especificar la tabla de la cual se van a seleccionar los registros Utilizada para especificar las condiciones que deben reunir los registros que se van a seleccionar Utilizada para separar los registros seleccionados en grupos especficos Utilizada para expresar la condicin que debe satisfacer cada grupo Utilizada para ordenar los registros seleccionados de acuerdo con un orden especfico
Operadores Lgicos
Operador AND Uso Es el Y lgico. Evala dos condiciones y devuelve un valor de verdad slo si ambas son ciertas.
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Es el O lgico. Evala dos condiciones y devuelve un valor de verdad si alguna de las dos es cierta. Negacin lgica. Devuelve el valor contrario de la expresin.
35
OR NOT
Operadores de Comparacin
Operador < > <> <= >= = BETWEEN LIKE IN Uso Menor que Mayor que Distinto de Menor o igual que Mayor o igual que Igual que Utilizado para especificar un intervalo de valores. Utilizado en la comparacin de un modelo Utilizado para especificar registros de una base de datos
Funciones de Agregado
Las funciones de agregado se usan dentro de una clusula SELECT en grupos de registros para devolver un nico valor que se aplica a un grupo de registros.
Funcin AVG COUNT SUM MAX MIN Descripcin Utilizada para calcular el promedio de los valores de un campo determinado Utilizada para devolver el nmero de registros de la seleccin Utilizada para devolver la suma de todos los valores de un campo determinado Utilizada para devolver el valor ms alto de un campo especificado Utilizada para devolver el valor ms bajo de un campo especificado
Orden de ejecucin de los comandos

Dada una sentencia SQL de seleccin que incluye todas las posibles clusulas, el orden de ejecucin de las mismas es el siguiente: 1. Clusula SELECT 2. Clusula FROM 3. Clusula WHERE 4. Clusula GROUP BY 5. Clusula HAVING 6. Clusula ORDER BY
36
4.2. Consultas de Seleccin

Las consultas de seleccin se utilizan para indicar al motor de datos que devuelva informacin de las bases de datos, esta informacin es devuelta en forma de conjunto de registros que se pueden almacenar en un objeto recordset. Este conjunto de registros puede ser modificable.
4.2.1. Consultas bsicas

La sintaxis bsica de una consulta de seleccin es la siguiente:
SELECT Campos FROM Tabla
En donde campos es la lista de campos que se deseen recuperar y tabla es el origen de los mismos, por ejemplo:
SELECT Nombre, Telfono FROM Clientes
Esta sentencia devuelve un conjunto de resultados con el campo nombre y telfono de la tabla clientes.
4.2.2. Devolver literales

En determinadas ocasiones nos puede interesar incluir una columna con un texto fijo en una consulta de seleccin, por ejemplo, supongamos que tenemos una tabla de empleados y deseamos recuperar las tarifas semanales de los electricistas, podramos realizar la siguiente consulta:
SELECT Empleados.Nombre, 'Tarifa semanal: ', Empleados.TarifaHora * 40 FROM Empleados WHERE Empleados.Cargo = 'Electricista'
4.2.3. Ordenar los registros

Adicionalmente se puede especificar el orden en que se desean recuperar los registros de las tablas mediante la clusula ORDER BY lista de campos. En donde lista de campos representa los campos a ordenar. Ejemplo:
SELECT CodigoPostal, Nombre, Telefono FROM Clientes ORDER BY Nombre
Esta consulta devuelve los campos CodigoPostal, Nombre, Telefono de la tabla Clientes ordenados por el campo Nombre. Se pueden ordenar los registros por mas de un campo, como por ejemplo:
SELECT
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares CodigoPostal, Nombre, Telefono FROM Clientes ORDER BY CodigoPostal, Nombre
37
Incluso se puede especificar el orden de los registros: ascendente mediante la clusula (ASC se toma por omisin) o descendente (DESC)
SELECT CodigoPostal, Nombre, Telefono FROM Clientes ORDER BY CodigoPostal DESC, Nombre ASC
4.2.4. Uso de ndices de las tablas

Si deseamos que la sentencia SQL utilice un ndice para mostrar los resultados se puede utilizar la palabra reservada INDEX de la siguiente forma:
SELECT ... FROM Tabla (INDEX=Indice) ...
Normalmente los motores de las bases de datos deciden que ndice se debe utilizar para la consulta, para ello utilizan criterios de rendimiento y sobre todo los campos de bsqueda especificados en la clusula WHERE. Si se desea forzar a no utilizar ningn ndice utilizaremos la siguiente sintaxis:
SELECT ... FROM Tabla (INDEX=0) ...
4.2.5. Consultas con Predicado

El predicado se incluye entre la clusula y el primer nombre del campo a recuperar, los posibles predicados son:
Predicado ALL TOP DISTINCT DISTINCTROW Descripcin Devuelve todos los campos de la tabla Devuelve un determinado nmero de registros de la tabla Omite los registros cuyos campos seleccionados coincidan totalmente Omite los registros duplicados basndose en la totalidad del registro y no slo en los campos seleccionados.
ALL
Si no se incluye ninguno de los predicados se asume ALL. El Motor de base de datos selecciona todos los registros que cumplen las condiciones de la instruccin SQL y devuelve todos y cada uno de sus campos. No es conveniente abusar de este predicado ya que obligamos al motor de la base de datos a analizar la estructura de la tabla para averiguar los campos que contiene, es mucho ms rpido indicar el listado de campos deseados.
SELECT ALL FROM Empleados SELECT *
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares FROM Empleados
38
TOP
Devuelve un cierto nmero de registros que entran entre al principio o al final de un rango especificado por una clusula ORDER BY. Supongamos que queremos recuperar los nombres de los 25 primeros estudiantes del curso 1994:
SELECT TOP 25 Nombre, Apellido FROM Estudiantes ORDER BY Nota DESC
Si no se incluye la clusula ORDER BY, la consulta devolver un conjunto arbitrario de 25 registros de la tabla de Estudiantes. El predicado TOP no elige entre valores iguales. En el ejemplo anterior, si la nota media nmero 25 y la 26 son iguales, la consulta devolver 26 registros. Se puede utilizar la palabra reservada PERCENT para devolver un cierto porcentaje de registros que caen al principio o al final de un rango especificado por la clusula ORDER BY. Supongamos que en lugar de los 25 primeros estudiantes deseamos el 10 por ciento del curso:
SELECT TOP 10 PERCENT Nombre, Apellido FROM Estudiantes ORDER BY Nota DESC
El valor que va a continuacin de TOP debe ser un entero sin signo. TOP no afecta a la posible actualizacin de la consulta.
DISTINCT
Omite los registros que contienen datos duplicados en los campos seleccionados. Para que los valores de cada campo listado en la instruccin SELECT se incluyan en la consulta deben ser nicos. Por ejemplo, varios empleados listados en la tabla Empleados pueden tener el mismo apellido. Si dos registros contienen "Lpez" en el campo Apellido, la siguiente instruccin SQL devuelve un nico registro:
SELECT DISTINCT Apellido FROM Empleados
Con otras palabras el predicado DISTINCT devuelve aquellos registros cuyos campos indicados en la clusula SELECT posean un contenido diferente. El resultado de una consulta que utiliza DISTINCT no es actualizable y no refleja los cambios subsiguientes realizados por otros usuarios.
DISTINCTROW
Este predicado no es compatible con ANSI. A da de hoy slo funciona con MS-Access. Devuelve los registros diferentes de una tabla; a diferencia del predicado anterior que slo se fijaba en el contenido de los campos seleccionados, ste lo hace en el contenido del registro completo independientemente de los campos indicados en la clusula SELECT.
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT DISTINCTROW Apellido FROM Empleados
39
Si la tabla empleados contiene dos registros: "Antonio Lpez" y "Marta Lpez" el ejemplo del predicado DISTINCT devuelve un nico registro con el valor "Lpez" en el campo Apellido ya que busca no duplicados en dicho campo. Este ltimo ejemplo devuelve dos registros con el valor "Lpez" en el apellido ya que se buscan no duplicados en el registro completo.
ALIAS
En determinadas circunstancias es necesario asignar un nombre a alguna columna determinada de un conjunto devuelto, otras veces por simple capricho o porque estamos recuperando datos de diferentes tablas y resultan tener un campo con igual nombre. Para resolver todas ellas tenemos la palabra reservada AS que se encarga de asignar el nombre que deseamos a la columna deseada. Tomado como referencia el ejemplo anterior podemos hacer que la columna devuelta por la consulta, en lugar de llamarse Apellido (igual que el campo devuelto) se llame Empleado. En este caso procederamos de la siguiente forma:
SELECT Apellido AS Empleado FROM Empleados
AS no es una palabra reservada de ANSI, existen diferentes sistemas de asignar los alias en funcin del motor de bases de datos. En Oracle para asignar un alias a un campo hay que hacerlo de la siguiente forma:
SELECT Apellido AS "Empleado" FROM Empleados
Tambin podemos asignar alias a las tablas dentro de la consulta de seleccin, en esta caso hay que tener en cuenta que en todas las referencias que deseemos hacer a dicha tabla se ha de utilizar el alias en lugar del nombre. Esta tcnica ser de gran utilidad ms adelante cuando se estudien las vinculaciones entre tablas. Por ejemplo:
SELECT Apellido FROM Empleados AS Trabajadores
Para asignar alias a las tablas en Oracle y SQL-Server los alias se asignan escribiendo el nombre de la tabla, dejando un espacio en blanco y escribiendo el alias (se asignan dentro de la clusula FROM).
SELECT Trabajadores.Apellido AS Empleado FROM Empleados Trabajadores
(1)Esta nomenclatura [Tabla].[Campo] se debe utilizar cuando se est recuperando un campo cuyo nombre se repite en varias de las tablas que se utilizan en la sentencia. No obstante cuando en la sentencia se emplean varias tablas es aconsejable utilizar esta nomenclatura para evitar el trabajo que supone al motor de datos averiguar en que tabla est cada uno de los campos indicados en la clusula SELECT.
4.2.6. Recuperar Informacin de una base de Datos Externa
40
Para concluir este captulo se debe hacer referencia a la recuperacin de registros de bases de datos externas. Es ocasiones es necesario la recuperacin de informacin que se encuentra contenida en una tabla que no se encuentra en la base de datos que ejecutar la consulta o que en ese momento no se encuentra abierta, esta situacin la podemos salvar con la palabra reservada IN de la siguiente forma:
SELECT Apellido AS Empleado FROM Empleados IN 'c:\databases\gestion.mdb'
En donde c:\databases\gestion.mdb es la base de datos que contiene la tabla Empleados. Esta tcnica es muy sencilla y comn en bases de datos de tipo MS-Access en otros sistemas como SQL-Server u Oracle, la cosa es ms complicada la tener que existir relaciones de confianza entre los servidores o al ser necesaria la vinculacin entre las bases de datos. Este ejemplo recupera la informacin de una base de datos de SQL-Server ubicada en otro servidor (se da por supuesto que los servidores estn vinculados):
SELECT Apellido FROM Servidor1.BaseDatos1.dbo.Empleados
4.3. Consultas de Accin

Las consultas de accin son aquellas que no devuelven ningn registro, son las encargadas de acciones como aadir y borrar y modificar registros. Tanto las sentencias de actualizacin como las de borrado desencadenarn (segn el motor de datos) las actualizaciones en cascada, borrados en cascada, restricciones y valores por defecto definidos para los diferentes campos o tablas afectadas por la consulta.
4.3.1. DELETE
Crea una consulta de eliminacin que elimina los registros de una o ms de las tablas listadas en la clusula FROM que satisfagan la clusula WHERE. Esta consulta elimina los registros completos, no es posible eliminar el contenido de algn campo en concreto. Su sintaxis es:
DELETE FROM Tabla WHERE criterio
Una vez que se han eliminado los registros utilizando una consulta de borrado, no puede deshacer la operacin. Si desea saber qu registros se eliminarn, primero examine los resultados de una consulta de seleccin que utilice el mismo criterio y despus ejecute la consulta de borrado. Mantenga copias de seguridad de sus datos en todo momento. Si elimina los registros equivocados podr recuperarlos desde las copias de seguridad.
DELETE FROM Empleados WHERE Cargo = 'Vendedor'
4.3.2. INSERT INTO

Agrega un registro en una tabla. Se la conoce como una consulta de datos aadidos. Esta consulta puede ser de dos tipo: insertar un nico registro insertar en una tabla los registros contenidos en otra tabla.
Para insertar un nico Registro

En este caso la sintaxis es la siguiente:
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares INSERT INTO Tabla (campo1, campo2, ..., campoN) VALUES (valor1, valor2, ..., valorN)
41
Esta consulta graba en el campo1 el valor1, en el campo2 y valor2 y as sucesivamente.
Para seleccionar registros e insertarlos en una tabla nueva

En este caso la sintaxis es la siguiente:
SELECT campo1, campo2, ..., campoN INTO nuevatabla FROM tablaorigen [WHERE criterios]
Se pueden utilizar las consultas de creacin de tabla para archivar registros, hacer copias de seguridad de las tablas o hacer copias para exportar a otra base de datos o utilizar en informes que muestren los datos de un periodo de tiempo concreto. Por ejemplo, se podra crear un informe de Ventas mensuales por regin ejecutando la misma consulta de creacin de tabla cada mes.
Para insertar Registros de otra Tabla

En este caso la sintaxis es:
INSERT INTO Tabla [IN base_externa] (campo1, campo2, , campoN) SELECT TablaOrigen.campo1, TablaOrigen.campo2,,TablaOrigen.campoN FROM Tabla Origen
En este caso se seleccionarn los campos 1,2,..., n de la tabla origen y se grabarn en los campos 1,2,.., n de la Tabla. La condicin SELECT puede incluir la clusula WHERE para filtrar los registros a copiar. Si Tabla y Tabla Origen poseen la misma estructura podemos simplificar la sintaxis a:
INSERT INTO Tabla SELECT Tabla Origen.* FROM Tabla Origen
De esta forma los campos de Tabla Origen se grabarn en Tabla, para realizar esta operacin es necesario que todos los campos de Tabla Origen estn contenidos con igual nombre en Tabla. Con otras palabras que Tabla posea todos los campos de Tabla Origen (igual nombre e igual tipo). En este tipo de consulta hay que tener especial atencin con los campos contadores o autonumricos puesto que al insertar un valor en un campo de este tipo se escribe el valor que contenga su campo homlogo en la tabla origen, no incrementndose como le corresponde. Se puede utilizar la instruccin INSERT INTO para agregar un registro nico a una tabla, utilizando la sintaxis de la consulta de adicin de registro nico tal y como se mostr anteriormente. En este caso, su cdigo especifica el nombre y el valor de cada campo del registro. Debe especificar cada uno de los campos del registro al que se le va a asignar un valor as como el valor para dicho campo. Cuando no se especifica dicho campo, se inserta el valor predeterminado o Null. Los registros se agregan al final de la tabla. Tambin se puede utilizar INSERT INTO para agregar un conjunto de registros pertenecientes a otra tabla o consulta utilizando la clusula SELECT... FROM como se mostr anteriormente en la sintaxis de la consulta de adicin de mltiples registros. En este caso la clusula SELECT especifica los campos que se van a agregar en la tabla destino especificada. La tabla destino u origen puede especificar una tabla o una consulta. Si la tabla destino contiene una clave principal, hay que asegurarse que es nica, y con valores no nulos; si no es as, no se agregarn los registros. Si se agregan registros a una tabla con un campo Contador, no se debe incluir el campo Contador en la consulta. Se puede emplear la clusula IN para agregar registros a una tabla en otra base de datos.
42
Se pueden averiguar los registros que se agregarn en la consulta ejecutando primero una consulta de seleccin que utilice el mismo criterio de seleccin y ver el resultado. Una consulta de adicin copia los registros de una o ms tablas en otra. Las tablas que contienen los registros que se van a agregar no se vern afectadas por la consulta de adicin. En lugar de agregar registros existentes en otra tabla, se puede especificar los valores de cada campo en un nuevo registro utilizando la clusula VALUES. Si se omite la lista de campos, la clusula VALUES debe incluir un valor para cada campo de la tabla, de otra forma fallar INSERT.
Ejemplos
INSERT INTO Clientes SELECT ClientesNuevos.* FROM ClientesNuevos SELECT Empleados.* INTO Programadores FROM Empleados WHERE Categoria = 'Programador'
Esta consulta crea una tabla nueva llamada programadores con igual estructura que la tabla empleado y copia aquellos registros cuyo campo categora sea programador
INSERT INTO Empleados (Nombre, Apellido, Cargo) VALUES ('Luis', 'Snchez', 'Becario' ) INSERT INTO Empleados SELECT Vendedores.* FROM Vendedores WHERE Provincia = 'Madrid'
4.3.3. UPDATE
Crea una consulta de actualizacin que cambia los valores de los campos de una tabla especificada basndose en un criterio especfico. Su sintaxis es:
UPDATE Tabla SET Campo1=Valor1, Campo2=Valor2, CampoN=ValorN WHERE Criterio
UPDATE es especialmente til cuando se desea cambiar un gran nmero de registros o cuando stos se encuentran en mltiples tablas. Puede cambiar varios campos a la vez. El ejemplo siguiente incrementa los valores Cantidad pedidos en un 10 por ciento y los valores Transporte en un 3 por ciento para aquellos que se hayan enviado al Reino Unido:
UPDATE Pedidos
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SET Pedido = Pedidos * 1.1, Transporte = Transporte * 1.03 WHERE PaisEnvo = 'UK'
43
UPDATE no genera ningn resultado. Para saber qu registros se van a cambiar, hay que examinar primero el resultado de una consulta de seleccin que utilice el mismo criterio y despus ejecutar la consulta de actualizacin.
UPDATE Empleados SET Grado = 5 WHERE Grado = 2 UPDATE Productos SET Precio = Precio * 1.1 WHERE Proveedor = 8 AND Familia = 3
Si en una consulta de actualizacin suprimimos la clusula WHERE todos los registros de la tabla sealada sern actualizados.
UPDATE Empleados SET Salario = Salario * 1.1
4.4. Consultas de Unin Internas

4.4.1. Consultas de Combinacin entre tablas
Las vinculaciones entre tablas se realizan mediante la clusula INNER que combina registros de dos tablas siempre que haya concordancia de valores en un campo comn. Su sintaxis es:
SELECT campos FROM tb1 INNER JOIN tb2 ON tb1.campo1 comp tb2.campo2
En donde:
tb1, tb2 campo1, campo2 comp Son los nombres de las tablas desde las que se combinan los registros. Son los nombres de los campos que se combinan. Si no son numricos, los campos deben ser del mismo tipo de datos y contener el mismo tipo de datos, pero no tienen que tener el mismo nombre. Es cualquier operador de comparacin relacional: =, <,<>, <=, =>, >.
Se puede utilizar una operacin INNER JOIN en cualquier clusula FROM. Esto crea una combinacin por equivalencia, conocida tambin como unin interna. Las combinaciones equivalentes son las ms comunes; stas combinan los registros de dos tablas siempre que haya concordancia de valores en un campo comn a ambas tablas. Se puede utilizar INNER JOIN con las tablas Departamentos y Empleados
44
para seleccionar todos los empleados de cada departamento. Por el contrario, para seleccionar todos los departamentos (incluso si alguno de ellos no tiene ningn empleado asignado) se emplea LEFT JOIN o todos los empleados (incluso si alguno no est asignado a ningn departamento), en este caso RIGHT JOIN. Si se intenta combinar campos que contengan datos Memo u Objeto OLE, se produce un error. Se pueden combinar dos campos numricos cualesquiera, incluso si son de diferente tipo de datos. Por ejemplo, puede combinar un campo Numrico para el que la propiedad Size de su objeto Field est establecida como Entero, y un campo Contador. El ejemplo siguiente muestra cmo podra combinar las tablas Categoras y Productos basndose en el campo IDCategoria:
SELECT NombreCategoria, NombreProducto FROM Categorias INNER JOIN Productos ON Categorias.IDCategoria = Productos.IDCategoria
En el ejemplo anterior, IDCategoria es el campo combinado, pero no est incluido en la salida de la consulta ya que no est incluido en la instruccin SELECT. Para incluir el campo combinado, incluir el nombre del campo en la instruccin SELECT, en este caso, Categorias.IDCategoria. Tambin se pueden enlazar varias clusulas ON en una instruccin JOIN, utilizando la sintaxis siguiente:
SELECT campos FROM tabla1 INNER JOIN tabla2 ON (tb1.campo1 comp tb2.campo1 AND ON tb1.campo2 comp tb2.campo2) OR ON (tb1.campo3 comp tb2.campo3)
Tambin puede anidar instrucciones JOIN utilizando la siguiente sintaxis:

SELECT campos FROM tb1 INNER JOIN (tb2 INNER JOIN [( ]tb3 [INNER JOIN [( ]tablax [INNER JOIN ...)] ON tb3.campo3 comp tbx.campox)] ON tb2.campo2 comp tb3.campo3) ON tb1.campo1 comp tb2.campo2
Un LEFT JOIN o un RIGHT JOIN puede anidarse dentro de un INNER JOIN, pero un INNER JOIN no puede anidarse dentro de un LEFT JOIN o un RIGHT JOIN. Ejemplo:
SELECT DISTINCT Sum(PrecioUnitario * Cantidad) AS Sales, (Nombre + ' ' + Apellido) AS Name FROM Empleados INNER JOIN( Pedidos INNER JOIN DetallesPedidos ON Pedidos.IdPedido = DetallesPedidos.IdPedido) ON Empleados.IdEmpleado = Pedidos.IdEmpleado
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares GROUP BY Nombre + ' ' + Apellido
45
(Crea dos combinaciones equivalentes: una entre las tablas Detalles de pedidos y Pedidos, y la otra entre las tablas Pedidos y Empleados. Esto es necesario ya que la tabla Empleados no contiene datos de ventas y la tabla Detalles de pedidos no contiene datos de los empleados. La consulta produce una lista de empleados y sus ventas totales.) Si empleamos la clusula INNER en la consulta se seleccionarn slo aquellos registros de la tabla de la que hayamos escrito a la izquierda de INNER JOIN que contengan al menos un registro de la tabla que hayamos escrito a la derecha. Para solucionar esto tenemos dos clusulas que sustituyen a la palabra clave INNER, estas clusulas son LEFT y RIGHT. LEFT toma todos los registros de la tabla de la izquierda aunque no tengan ningn registro en la tabla de la izquierda. RIGHT realiza la misma operacin pero al contrario, toma todos los registros de la tabla de la derecha aunque no tenga ningn registro en la tabla de la izquierda. La sintaxis expuesta anteriormente pertenece a MS-Access, en donde todas las sentencias con la sintaxis funcionan correctamente. Los manuales de SQL-Server dicen que esta sintaxis es incorrecta y que hay que aadir la palabra reservada OUTER: LEFT OUTER JOIN y RIGHT OUTER JOIN. En la prctica funciona correctamente de una u otra forma. No obstante, los INNER JOIN Oracle no es capaz de interpretarlos, pero existe una sintaxis en formato ANSI para los INNER JOIN que funcionan en todos los sistemas. Tomando como referencia la siguiente sentencia:
SELECT Facturas.*, Albaranes.* FROM Facturas INNER JOIN Albaranes ON Facturas.IdAlbaran = Albaranes.IdAlbaran WHERE Facturas.IdCliente = 325
La transformacin de esta sentencia a formato ANSI sera la siguiente:

SELECT Facturas.*, Albaranes.* FROM Facturas, Albaranes WHERE Facturas.IdAlbaran = Albaranes.IdAlbaran AND Facturas.IdCliente = 325
Como se puede observar los cambios realizados han sido los siguientes: 1. Todas las tablas que intervienen en la consulta se especifican en la clusula FROM. 2. Las condiciones que vinculan a las tablas se especifican en la clusula WHERE y se vinculan mediante el operador lgico AND.
46
Referente a los OUTER JOIN, no funcionan en Oracle y adems conozco una sintaxis que funcione en los tres sistemas. La sintaxis en Oracle es igual a la sentencia anterior pero aadiendo los caracteres ( +) detrs del nombre de la tabla en la que deseamos aceptar valores nulos, esto equivale a un LEFT JOIN:
SELECT Facturas.*, Albaranes.* FROM Facturas, Albaranes WHERE Facturas.IdAlbaran = Albaranes.IdAlbaran (+) AND Facturas.IdCliente = 325
Y esto a un RIGHT JOIN:

SELECT Facturas.*, Albaranes.* FROM Facturas, Albaranes WHERE Facturas.IdAlbaran (+) = Albaranes.IdAlbaran AND Facturas.IdCliente = 325
En SQL-Server se puede utilizar una sintaxis parecida, en este caso no se utiliza los caracteres ( +) sino los caracteres =* para el LEFT JOIN y *= para el RIGHT JOIN.
4.4.2. Consultas de Autocombinacin

La autocombinacin se utiliza para unir una tabla consigo misma, comparando valores de dos columnas con el mismo tipo de datos. La sintaxis en la siguiente:
SELECT alias1.columna, alias2.columna, ... FROM tabla1 as alias1, tabla2 as alias2 WHERE alias1.columna = alias2.columna AND otras condiciones
Por ejemplo, para visualizar el nmero, nombre y puesto de cada empleado, junto con el nmero, nombre y puesto del supervisor de cada uno de ellos se utilizara la siguiente sentencia:
SELECT t.num_emp, t.nombre, t.puesto, t.num_sup,s.nombre, s.puesto FROM empleados AS t, empleados AS s WHERE t.num_sup = s.num_emp
4.4.3. Consultas de Combinaciones no Comunes
47
La mayora de las combinaciones estn basadas en la igualdad de valores de las columnas que son el criterio de la combinacin. Las no comunes se basan en otros operadores de combinacin, tales como NOT, BETWEEN, <>, etc. Por ejemplo, para listar el grado salarial, nombre, salario y puesto de cada empleado ordenando el resultado por grado y salario habra que ejecutar la siguiente sentencia:
SELECT grados.grado,empleados.nombre, empleados.salario, empleados.puesto FROM empleados, grados WHERE empleados.salario BETWEEN grados.salarioinferior And grados.salariosuperior ORDER BY grados.grado, empleados.salario
Para listar el salario medio dentro de cada grado salarial habra que lanzar esta otra sentencia:
SELECT grados.grado, AVG(empleados.salario) FROM empleados, grados WHERE empleados.salario BETWEEN grados.salarioinferior And grados.salariosuperior GROUP BY grados.grado
4.4.4. CROSS JOIN (SQL-Server)

Se utiliza en SQL-Server para realizar consultas de unin. Supongamos que tenemos una tabla con todos los autores y otra con todos los libros. Si deseramos obtener un listado combinar ambas tablas de tal forma que cada autor apareciera junto a cada ttulo, utilizaramos la siguiente sintaxis:
SELECT Autores.Nombre, Libros.Titulo FROM Autores CROSS JOIN Libros
4.4.5. SELF JOIN

SELF JOIN es una tcnica empleada para conseguir el producto cartesiano de una tabla consigo misma. Su utilizacin no es muy frecuente, pero pongamos algn ejemplo de su utilizacin. Supongamos la siguiente tabla (El campo autor es numrico, aunque para ilustrar el ejemplo utilice el nombre):
Autores Cdigo (Cdigo del libro) B0012 B0012 B0012 C0014 C0014 D0120 Autor (Nombre del Autor) 1. Francisco Lpez 2. Javier Alonso 3. Marta Rebolledo 1. Francisco Lpez 2. Javier Alonso 2. Javier Alonso
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares D0120 3. Marta Rebolledo
48
Queremos obtener, para cada libro, parejas de autores:

SELECT A.Codigo, A.Autor, B.Autor FROM Autores A, Autores B WHERE A.Codigo = B.Codigo
El resultado es el siguiente:
Cdigo B0012 B0012 B0012 B0012 B0012 B0012 B0012 B0012 B0012 C0014 C0014 C0014 C0014 D0120 D0120 D0120 D0120 Autor 1. Francisco Lpez 1. Francisco Lpez 1. Francisco Lpez 2. Javier Alonso 2. Javier Alonso 2. Javier Alonso 3. Marta Rebolledo 3. Marta Rebolledo 3. Marta Rebolledo 1. Francisco Lpez 1. Francisco Lpez 2. Javier Alonso 2. Javier Alonso 2. Javier Alonso 2. Javier Alonso 3. Marta Rebolledo 3. Marta Rebolledo Autor 1. Francisco Lpez 2. Javier Alonso 3. Marta Rebolledo 2. Javier Alonso 1. Francisco Lpez 3. Marta Rebolledo 3. Marta Rebolledo 2. Javier Alonso 1. Francisco Lpez 1. Francisco Lpez 2. Javier Alonso 2. Javier Alonso 1. Francisco Lpez 2. Javier Alonso 3. Marta Rebolledo 3. Marta Rebolledo 2. Javier Alonso
Como podemos observar, las parejas de autores se repiten en cada uno de los libros, podemos omitir estas repeticiones de la siguiente forma:
SELECT A.Codigo, A.Autor, B.Autor FROM Autores A, Autores B WHERE A.Codigo = B.Codigo AND A.Autor < B.Autor
El resultado ahora es el siguiente:

Cdigo B0012 B0012 C0014 Autor 1. Francisco Lpez 1. Francisco Lpez 1. Francisco Lpez Autor 2. Javier Alonso 3. Marta Rebolledo 2. Javier Alonso
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares D0120 2. Javier Alonso 3. Marta Rebolledo
49
Ahora tenemos un conjunto de resultados en formato Autor - CoAutor. Si en la tabla de empleados quisiramos extraer todas las posibles parejas que podemos realizar, utilizaramos la siguiente sentencia:
SELECT Hombres.Nombre, Mujeres.Nombre FROM Empleados Hombre, Empleados Mujeres WHERE Hombre.Sexo = 'Hombre' AND Mujeres.Sexo = 'Mujer' AND Hombres.Id <> Mujeres.Id
Para concluir supongamos la tabla siguiente:

Empleados Id 1 2 3 4 5 6 Nombre Marcos Lucas Ana Eva Juan Antonio SuJefe 6 1 2 1 6
Queremos obtener un conjunto de resultados con el nombre del empleado y el nombre de su jefe:
SELECT Emple.Nombre, Jefes.Nombre FROM Empleados Emple, Empleados Jefe WHERE Emple.SuJefe = Jefes.Id
4.4.6. FULL JOIN

Este tipo de operador se utiliza para devolver todas las filas de una combinacin tengan o no correspondencia. Es el equivalente a la utilizacin de LEFT JOIN y RIGHT JOIN a la misma vez. Mediante este operador se obtendrn por un lado las filas que tengan correspondencia en ambas tablas y tambin aquellas que no tengan correspondencia sean de la tabla que sean. Si deseramos obtener un listado que incluyera todos los autores con sus libros correspondientes, pero adems todos los autores que no han escrito ningn libro y todos aquellos libros sin autor (debemos suponer que no existe un autor llamado annimo):
SELECT Autores.*, Libros.* FROM Autores FULL Libros ON Autores.IdAutor = Libros.IdAutor
50
4.5. Consultas de Unin Externas

Se utiliza la operacin UNION para crear una consulta de unin, combinando los resultados de dos o ms consultas o tablas independientes. Su sintaxis es:
[TABLE] consulta1 UNION [ALL] [TABLE] consulta2 [UNION [ALL] [TABLE] consultan [ ... ]]
En donde:
consulta 1, consulta 2, consulta n Son instrucciones SELECT, el nombre de una consulta almacenada o el nombre de una tabla almacenada precedido por la palabra clave TABLE.
Puede combinar los resultados de dos o ms consultas, tablas e instrucciones SELECT, en cualquier orden, en una nica operacin UNION. El ejemplo siguiente combina una tabla existente llamada Nuevas Cuentas y una instruccin SELECT:
TABLE NuevasCuentas UNION ALL SELECT * FROM Clientes WHERE CantidadPedidos > 1000
Si no se indica lo contrario, no se devuelven registros duplicados cuando se utiliza la operacin UNION, no obstante puede incluir el predicado ALL para asegurar que se devuelven todos los registros. Esto hace que la consulta se ejecute ms rpidamente. Todas las consultas en una operacin UNION deben pedir el mismo nmero de campos, no obstante los campos no tienen porqu tener el mismo tamao o el mismo tipo de datos. Se puede utilizar una clusula GROUP BY y/o HAVING en cada argumento consulta para agrupar los datos devueltos. Puede utilizar una clusula ORDER BY al final del ltimo argumento consulta para visualizar los datos devueltos en un orden especfico.
SELECT NombreCompania, Ciudad FROM Proveedores WHERE Pais = 'Brasil' UNION SELECT NombreCompania, Ciudad FROM Clientes WHERE Pais = 'Brasil'
(Recupera los nombres y las ciudades de todos proveedores y clientes de Brasil)

SELECT NombreCompania, Ciudad FROM Proveedores WHERE Pais = 'Brasil' UNION
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT NombreCompania, Ciudad FROM Clientes WHERE Pais = 'Brasil' ORDER BY Ciudad
51
(Recupera los nombres y las ciudades de todos proveedores y clientes radicados en Brasil, ordenados por el nombre de la ciudad)
SELECT NombreCompania, Ciudad FROM Proveedores WHERE Pais = 'Brasil' UNION SELECT NombreCompania, Ciudad FROM Clientes WHERE Pais = 'Brasil' UNION SELECT Apellidos, Ciudad FROM Empleados WHERE Region = 'Amrica del Sur'
(Recupera los nombres y las ciudades de todos los proveedores y clientes de Brasil y los apellidos y las ciudades de todos los empleados de Amrica del Sur)
TABLE Lista_Clientes UNION TABLE ListaProveedores
(Recupera los nombres y cdigos de todos los proveedores y clientes)
4.6. Consultas de Referencias Cruzadas

4.6.1. MS-Access
Una consulta de referencias cruzadas es aquella que nos permite visualizar los datos en filas y en columnas, estilo tabla, por ejemplo:
Producto / Ao Pantalones Camisas Zapatos 1996 1.250 8.560 4.369 1997 3.000 1.253 2.563
Si tenemos una tabla de productos y otra tabla de pedidos, podemos visualizar en total de productos pedidos por ao para un artculo determinado, tal y como se visualiza en la tabla anterior. La sintaxis para este tipo de consulta es la siguiente:
TRANSFORM funcin agregada instruccin select PIVOT campo pivot [IN (valor1[, valor2[, ...]])]
En donde:
funcin agregada Es una funcin SQL agregada que opera sobre los datos seleccionados.
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares instruccin select campo pivot valor1, valor2 Es una instruccin SELECT. Es el campo o expresin que desea utilizar para crear las cabeceras de la columna en el resultado de la consulta. Son valores fijos utilizados para crear las cabeceras de la columna.
52
Para resumir datos utilizando una consulta de referencia cruzada, se seleccionan los valores de los campos o expresiones especificadas como cabeceras de columnas de tal forma que pueden verse los datos en un formato ms compacto que con una consulta de seleccin. TRANSFORM es opcional pero si se incluye es la primera instruccin de una cadena SQL. Precede a la instruccin SELECT que especifica los campos utilizados como encabezados de fila y una clusula GROUP BY que especifica el agrupamiento de las filas. Opcionalmente puede incluir otras clusulas como por ejemplo WHERE, que especifica una seleccin adicional o un criterio de ordenacin. Los valores devueltos en campo pvot se utilizan como encabezados de columna en el resultado de la consulta. Por ejemplo, al utilizar las cifras de ventas en el mes de la venta como pvot en una consulta de referencia cruzada se crearan 12 columnas. Puede restringir el campo pvot para crear encabezados a partir de los valores fijos (valor1, valor2) listados en la clusula opcional IN. Tambin puede incluir valores fijos, para los que no existen datos, para crear columnas adicionales.
Ejemplos
TRANSFORM Sum(Cantidad) AS Ventas SELECT Producto, Cantidad FROM Pedidos WHERE Fecha Between #01-01-1998# And #12-31-1998# GROUP BY Producto ORDER BY Producto PIVOT DatePart("m", Fecha)
(Crea una consulta de tabla de referencias cruzadas que muestra las ventas de productos por mes para un ao especfico. Los meses aparecen de izquierda a derecha como columnas y los nombres de los productos aparecen de arriba hacia abajo como filas.)
TRANSFORM Sum(Cantidad) AS Ventas SELECT Compania FROM Pedidos WHERE Fecha Between #01-01-1998# And #12-31-1998# GROUP BY Compania ORDER BY Compania PIVOT "Trimestre " &
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares DatePart("q", Fecha) In ('Trimestre1', 'Trimestre2', 'Trimestre 3', 'Trimestre 4')
53
(Crea una consulta de tabla de referencias cruzadas que muestra las ventas de productos por trimestre de cada proveedor en el ao indicado. Los trimestres aparecen de izquierda a derecha como columnas y los nombres de los proveedores aparecen de arriba hacia abajo como filas.) Un caso prctico Se trata de resolver el siguiente problema: tenemos una tabla de productos con dos campos, el cdigo y el nombre del producto, tenemos otra tabla de pedidos en la que anotamos el cdigo del producto, la fecha del pedido y la cantidad pedida. Deseamos consultar los totales de producto por ao, calculando la media anual de ventas. Estructura y datos de las tablas
ARTICULOS ID 1 2 3 Nombre Zapatos Pantalones Blusas ID 1 2 3 1 2 3 1 2 3 1 2 3 PEDIDOS Fecha 11/11/1996 11/11/1996 11/11/1996 12/10/1996 04/10/1996 05/08/1996 01/01/1997 02/08/1997 05/10/1997 12/12/1997 15/12/1997 17/10/1997 Cantidad 250 125 520 50 250 100 40 60 70 8 520 1.250
Para resolver la consulta planteamos la siguiente consulta:

TRANSFORM Sum(Pedidos.Cantidad) AS Resultado SELECT Nombre AS Producto, Pedidos.Id AS Cdigo, Sum(Pedidos.Cantidad) AS TOTAL, Avg(Pedidos.Cantidad) AS Media FROM Pedidos, Artculos WHERE Pedidos.Id = Artculos.Id GROUP BY Pedidos.Id, Artculos.Nombre PIVOT Year(Fecha)
Y obtenemos el siguiente resultado:
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Producto Zapatos Pantalones Blusas Cdigo 1 2 3 Total 348 955 1940 Media 87 238,75 485 1996 300 375 620 1997 48 580 1320
54
Comentarios a la consulta: La clusula TRANSFORM indica el valor que deseamos visualizar en las columnas que realmente pertenecen a la consulta, en este caso 1996 y 1997, puesto que las dems columnas son opcionales. SELECT especifica el nombre de las columnas opcionales que deseamos visualizar, en este caso Producto, Cdigo, Total y Media, indicando el nombre del campo que deseamos mostrar en cada columna o el valor de la misma. Si incluimos una funcin de clculo el resultado se har basndose en los datos de la fila actual y no al total de los datos. FROM especifica el origen de los datos. La primera tabla que debe figurar es aquella de donde deseamos extraer los datos, esta tabla debe contener al menos tres campos, uno para los ttulos de la fila, otros para los ttulos de la columna y otro para calcular el valor de las celdas. En este caso en concreto se deseaba visualizar el nombre del producto, como en la tabla de pedidos slo figuraba el cdigo del mismo se aadi una nueva columna en la clusula select llamada Producto que se corresponda con el campo Nombre de la tabla de artculos. Para vincular el cdigo del artculo de la tabla de pedidos con el nombre del mismo de la tabla artculos se insert la clusula INNER JOIN. La clusula GROUP BY especifica el agrupamiento de los registros, contrariamente a los manuales de instruccin esta clusula no es opcional ya que debe figurar siempre y debemos agrupar los registros por el campo del cual extraemos la informacin. En este caso existen dos campos de los que extraemos la informacin: pedidos.cantidad y artculos.nombre, por ello agrupamos por los campos. Para finalizar la clusula PIVOT indica el nombre de las columnas no opcionales, en este caso 1996 y 1997 y como vamos a el dato que aparecer en las columnas, en este caso empleamos el ao en que se produjo el pedido, extrayndolo del campo pedidos.fecha. Otras posibilidades de fecha de la clusula pvot son las siguientes: 1. Para agrupamiento por Trimestres: PIVOT "Tri " & DatePart("q",[Fecha]); 2. Para agrupamiento por meses (sin tener en cuenta el ao) PIVOT Format([Fecha],"mmm") In ("Ene", "Feb", "Mar", "Abr", "May", "Jun", "Jul", "Ago", "Sep", "Oct", "Nov", "Dic"); 3. Para agrupar por das PIVOT Format([Fecha],"Short Date");
4.7. Criterios de Seleccin

En el apartado anterior se vio la forma de recuperar los registros de las tablas, las formas empleadas devolvan todos los registros de la mencionada tabla. A lo largo de este apartado se estudiarn las posibilidades de filtrar los registros con el fin de recuperar solamente aquellos que cumplan unas condiciones preestablecidas. Antes de comenzar el desarrollo de este apartado hay que recalcar tres detalles de vital importancia. El primero de ellos es que cada vez que se desee establecer una condicin referida a un campo de texto la condicin de bsqueda debe ir encerrada entre comillas simples; la segunda es que no es posible establecer condiciones de bsqueda en los campos memo y; la tercera y ltima hace referencia a las fechas. A da de hoy no he sido capaz de encontrar una sintaxis que funcione en todos los sistemas, por lo que se hace necesario particularizarlas segn el banco de datos:
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Banco de Datos SQL-Server Oracle MS-Access Sintaxis Fecha = #mm-dd-aaaa# Fecha = to_date('YYYYDDMM','aaaammdd',) Fecha = #mm-dd-aaaa#
55
Ejemplo
Banco de Datos SQL-Server Oracle MS-Access Ejemplo (para grabar la fecha 18 de mayo de 1969) Fecha = #05-18-1969# Fecha = 19690518 Fecha = to_date('YYYYDDMM', '19690518') Fecha = #05-18-1969#
Referente a los valores lgicos True o False cabe destacar que no son reconocidos en Oracle, ni en este sistema de bases de datos ni en SQL-Server existen los campos de tipo "SI/NO" de MS-Access; en estos sistemas se utilizan los campos BIT que permiten almacenar valores de 0 1. Internamente, MS-Access, almacena en estos campos valores de 0 -1, as que todo se complica bastante, pero aprovechando la coincidencia del 0 para los valores FALSE, se puede utilizar la sintaxis siguiente que funciona en todos los casos: si se desea saber si el campo es falso " ... CAMPO = 0" y para saber los verdaderos " CAMPO <> 0".
4.7.1. Operadores Lgicos

Los operadores lgicos soportados por SQL son: AND, OR, XOR, Eqv, Imp, Is y Not. A excepcin de los dos ltimos todos poseen la siguiente sintaxis:
<expresin1> operador <expresin2>
En donde expresin1 y expresin2 son las condiciones a evaluar, el resultado de la operacin vara en funcin del operador lgico. La tabla adjunta muestra los diferentes posibles resultados:
<expresin1> Verdad Verdad Falso Falso <expresin1> Verdad Verdad Falso Falso <expresin1> Verdad Verdad Operador AND AND AND AND Operador OR OR OR OR Operador XOR XOR <expresin2> Falso Verdad Verdad Falso <expresin2> Falso Verdad Verdad Falso <expresin2> Verdad Falso Resultado Falso Verdad Falso Falso Resultado Verdad Verdad Verdad Falso Resultado Falso Verdad
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares <expresin1> Falso Falso <expresin1> Verdad Verdad Falso Falso <expresin1> Verdad Verdad Verdad Falso Falso Falso Null Null Null Operador XOR XOR Operador Eqv Eqv Eqv Eqv Operador Imp Imp Imp Imp Imp Imp Imp Imp Imp <expresin2> Verdad Falso <expresin2> Verdad Falso Verdad Falso <expresin2> Verdad Falso Null Verdad Falso Null Verdad Falso Null Resultado Verdad Falso Resultado Verdad Falso Falso Verdad Resultado Verdad Falso Null Verdad Verdad Verdad Verdad Null Null
56
Si a cualquiera de las anteriores condiciones le anteponemos el operador NOT el resultado de la operacin ser el contrario al devuelto sin el operador NOT. El ltimo operador denominado Is se emplea para comparar dos variables de tipo objeto <Objeto1> Is <Objeto2>. este operador devuelve verdad si los dos objetos son iguales.
SELECT * FROM Empleados WHERE Edad > 25 AND Edad < 50 SELECT * FROM Empleados WHERE (Edad > 25 AND Edad < 50) OR Sueldo = 100 SELECT * FROM Empleados WHERE NOT Estado = 'Soltero' SELECT * FROM
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Empleados WHERE (Sueldo > 100 AND Sueldo < 500) OR (Provincia = 'Madrid' AND Estado = 'Casado')
57
4.7.2. Valores Nulos

En muchas ocasiones es necesario emplear como criterio de seleccin valores nulos en los campos. Podemos emplear el operacin IS NULL para realizar esta operacin. Por ejemplo:
SELECT * FROM Empleados WHERE DNI IS NULL
Este operador no est reconocido en MS-Access y por ello hay que utilizar la siguiente sintaxis:
SELECT * FROM Empleados WHERE IsNull(DNI)=True
4.7.3. Intervalos de Valores

Para indicar que deseamos recuperar los registros segn el intervalo de valores de un campo emplearemos el operador Between cuya sintaxis es:
campo [Not] Between valor1 And valor2 (la condicin Not es opcional)
En este caso la consulta devolvera los registros que contengan en "campo" un valor incluido en el intervalo valor1, valor2 (ambos inclusive). Si anteponemos la condicin Not devolver aquellos valores no incluidos en el intervalo.
SELECT * FROM Pedidos WHERE CodPostal Between 28000 And 28999
(Devuelve los pedidos realizados en la provincia de Madrid)
4.7.4. El Operador Like

Se utiliza para comparar una expresin de cadena con un modelo en una expresin SQL. Su sintaxis es:
expresin Like modelo
En donde expresin es una cadena modelo o campo contra el que se compara expresin. Se puede utilizar el operador Like para encontrar valores en los campos que coincidan con el modelo especificado. Por modelo puede especificar un valor completo ( Ana Mara), o se puede utilizar una cadena de caracteres comodn como los reconocidos por el sistema operativo para encontrar un rango de valores ( Like An*). El operador Like se puede utilizar en una expresin para comparar un valor de un campo con una expresin de cadena. Por ejemplo, si introduce Like C* en una consulta SQL, la consulta devuelve todos
58
los valores de campo que comiencen por la letra C. En una consulta con parmetros, puede hacer que el usuario escriba el modelo que se va a utilizar. El ejemplo siguiente devuelve los datos que comienzan con la letra P seguido de cualquier letra entre A y F y de tres dgitos:
Like 'P[A-F]###'
Este ejemplo devuelve los campos cuyo contenido empiece con una letra de la A a la D seguidas de cualquier cadena.
Like '[A-D]*'
En la tabla siguiente se muestra cmo utilizar el operador Like para comprobar expresiones con diferentes modelos.
MS-Access Tipo de coincidencia Varios caracteres Carcter especial Varios caracteres Un solo carcter Un solo dgito Rango de caracteres Fuera de un rango Distinto de un dgito Combinada Modelo Planteado 'a*a' 'a[*]a' 'ab*' 'a?a' 'a#a' '[a-z]' '[!a-z]' '[!0-9]' 'a[!b-m]#' Coincide 'aa', 'aBa', 'aBBBa' 'a*a' 'abcdefg', 'abc' 'aaa', 'a3a', 'aBa' 'a0a', 'a1a', 'a2a' 'f', 'p', 'j' '9', '&', '%' 'A', 'a', '&', '~' 'An9', 'az0', 'a99' SQL-Server Ejemplo LIKE 'A%' LIKE '_NG' LIKE '[AF]%' LIKE '[A-F]%' LIKE '[A^B]%' Descripcin Todo lo que comience por A Todo lo que comience por cualquier carcter y luego siga NG Todo lo que comience por A F Todo lo que comience por cualquier letra comprendida entre la A y la F Todo lo que comience por A y la segunda letra no sea una B No coincide 'aBC' 'aaa' 'cab', 'aab' 'aBBBa' 'aaa', 'a10a' '2', '&' 'b', 'a' '0', '1', '9' 'abc', 'aj0'
En determinado motores de bases de datos, esta clusula, no reconoce el asterisco como carcter comodn y hay que sustituirlo por el carcter tanto por ciento (%).
4.7.5. El Operador In
Este operador devuelve aquellos registros cuyo campo indicado coincide con alguno de los en una lista. Su sintaxis es:
expresin [Not] In(valor1, valor2, . . .)
SELECT *
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares FROM Pedidos WHERE Provincia In ('Madrid', 'Barcelona', 'Sevilla')
59
4.7.6. La clusula WHERE

La clusula WHERE puede usarse para determinar qu registros de las tablas enumeradas en la clusula FROM aparecern en los resultados de la instruccin SELECT. Despus de escribir esta clusula se deben especificar las condiciones expuestas en los apartados anteriores. Si no se emplea esta clusula, la consulta devolver todas las filas de la tabla. WHERE es opcional, pero cuando aparece debe ir a continuacin de FROM.
SELECT Apellidos, Salario FROM Empleados WHERE Salario = 21000 SELECT IdProducto, Existencias FROM Productos WHERE Existencias <= NuevoPedido SELECT * FROM Pedidos WHERE FechaEnvio = #05-30-1994# SELECT Apellidos, Nombre FROM Empleados WHERE Apellidos = 'King' SELECT Apellidos, Nombre FROM Empleados WHERE Apellidos Like 'S*' SELECT Apellidos, Salario FROM Empleados WHERE Salario Between 200 And 300 SELECT Apellidos, Salario FROM Empleados WHERE
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Apellidos Between 'Lon' And 'Tol' SELECT IdPedido, FechaPedido FROM Pedidos WHERE FechaPedido Between #01-01-1994# And #12-31-1994# SELECT Apellidos, Nombre, Ciudad FROM Empleados WHERE Ciudad In ('Sevilla', 'Los Angeles', 'Barcelona')
60
4.8. Agrupamiento de Registros

4.8.1. GROUP BY
Combina los registros con valores idnticos, en la lista de campos especificados, en un nico registro. Para cada registro se crea un valor sumario si se incluye una funcin SQL agregada, como por ejemplo Sum o Count, en la instruccin SELECT. Su sintaxis es:
SELECT campos FROM tabla WHERE criterio GROUP BY campos del grupo
GROUP BY es opcional. Los valores de resumen se omiten si no existe una funcin SQL agregada en la instruccin SELECT. Los valores Null en los campos GROUP BY se agrupan y no se omiten. No obstante, los valores Null no se evalan en ninguna de las funciones SQL agregadas. Se utiliza la clusula WHERE para excluir aquellas filas que no desea agrupar, y la clusula HAVING para filtrar los registros una vez agrupados. A menos que contenga un dato Memo u Objeto OLE, un campo de la lista de campos GROUP BY puede referirse a cualquier campo de las tablas que aparecen en la clusula FROM, incluso si el campo no esta incluido en la instruccin SELECT, siempre y cuando la instruccin SELECT incluya al menos una funcin SQL agregada. Todos los campos de la lista de campos de SELECT deben o bien incluirse en la clusula GROUP BY o como argumentos de una funcin SQL agregada.
SELECT IdFamilia, Sum(Stock) AS StockActual FROM Productos GROUP BY IdFamilia
Una vez que GROUP BY ha combinado los registros, HAVING muestra cualquier registro agrupado por la clusula GROUP BY que satisfaga las condiciones de la clusula HAVING. HAVING es similar a WHERE, determina qu registros se seleccionan. Una vez que los registros se han agrupado utilizando GROUP BY, HAVING determina cuales de ellos se van a mostrar.
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT IdFamilia, Sum(Stock) AS StockActual FROM Productos GROUP BY IdFamilia HAVING StockActual > 100 AND NombreProducto Like BOS*
61
4.8.2. AVG
Calcula la media aritmtica de un conjunto de valores contenidos en un campo especificado de una consulta. Su sintaxis es la siguiente
Avg(expr)
En donde expr representa el campo que contiene los datos numricos para los que se desea calcular la media o una expresin que realiza un clculo utilizando los datos de dicho campo. La media calculada por Avg es la media aritmtica (la suma de los valores dividido por el nmero de valores). La funcin Avg no incluye ningn campo Null en el clculo.
SELECT Avg(Gastos) AS Promedio FROM Pedidos WHERE Gastos > 100
4.8.3. Count
Calcula el nmero de registros devueltos por una consulta. Su sintaxis es la siguiente
Count(expr)
En donde expr contiene el nombre del campo que desea contar. Los operandos de expr pueden incluir el nombre de un campo de una tabla, una constante o una funcin (la cual puede ser intrnseca o definida por el usuario pero no otras de las funciones agregadas de SQL). Puede contar cualquier tipo de datos incluso texto. Aunque expr puede realizar un clculo sobre un campo, Count simplemente cuenta el nmero de registros sin tener en cuenta qu valores se almacenan en los registros. La funcin Count no cuenta los registros que tienen campos null a menos que expr sea el carcter comodn asterisco ( *). Si utiliza un asterisco, Count calcula el nmero total de registros, incluyendo aquellos que contienen campos null. Count(*) es considerablemente ms rpida que Count(Campo). No se debe poner el asterisco entre dobles comillas ('*').
SELECT Count(*) AS Total FROM Pedidos
Si expr identifica a mltiples campos, la funcin Count cuenta un registro slo si al menos uno de los campos no es Null. Si todos los campos especificados son Null, no se cuenta el registro. Hay que separar los nombres de los campos con ampersand (&).
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT Count(FechaEnvo & Transporte) AS Total FROM Pedidos
62
Podemos hacer que el gestor cuente los datos diferentes de un determinado campo
SELECT Count(DISTINCT Localidad) AS Total FROM Pedidos
4.8.4. Max, Min

Devuelven el mnimo o el mximo de un conjunto de valores contenidos en un campo especifico de una consulta. Su sintaxis es:
Min(expr) Max(expr)
En donde expr es el campo sobre el que se desea realizar el clculo. Expr pueden incluir el nombre de un campo de una tabla, una constante o una funcin (la cual puede ser intrnseca o definida por el usuario pero no otras de las funciones agregadas de SQL).
SELECT Min(Gastos) AS ElMin FROM Pedidos WHERE Pais = 'Espaa' SELECT Max(Gastos) AS ElMax FROM Pedidos WHERE Pais = 'Espaa'
4.8.5. StDev, StDevP

Devuelve estimaciones de la desviacin estndar para la poblacin (el total de los registros de la tabla) o una muestra de la poblacin representada (muestra aleatoria). Su sintaxis es:
StDev(expr) StDevP(expr)
En donde expr representa el nombre del campo que contiene los datos que desean evaluarse o una expresin que realiza un clculo utilizando los datos de dichos campos. Los operandos de expr pueden incluir el nombre de un campo de una tabla, una constante o una funcin (la cual puede ser intrnseca o definida por el usuario pero no otras de las funciones agregadas de SQL). StDevP evala una poblacin, y StDev evala una muestra de la poblacin. Si la consulta contiene menos de dos registros (o ningn registro para StDevP), estas funciones devuelven un valor Null (el cual indica que la desviacin estndar no puede calcularse).
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT StDev(Gastos) AS Desviacin FROM Pedidos WHERE Pas = 'Espaa' SELECT StDevP(Gastos) AS Desviacin FROM Pedidos WHERE Pas = 'Espaa'
63
4.8.6. Sum
Devuelve la suma del conjunto de valores contenido en un campo especifico de una consulta. Su sintaxis es:
Sum(expr)
En donde expr representa el nombre del campo que contiene los datos que desean sumarse o una expresin que realiza un clculo utilizando los datos de dichos campos. Los operandos de expr pueden incluir el nombre de un campo de una tabla, una constante o una funcin (la cual puede ser intrnseca o definida por el usuario pero no otras de las funciones agregadas de SQL).
SELECT Sum(PrecioUnidad * Cantidad) AS Total FROM DetallePedido
4.8.7. Var, VarP

Devuelve una estimacin de la varianza de una poblacin (sobre el total de los registros) o una muestra de la poblacin (muestra aleatoria de registros) sobre los valores de un campo. Su sintaxis es:
Var(expr) VarP(expr)
VarP evala una poblacin, y Var evala una muestra de la poblacin. Expr el nombre del campo que contiene los datos que desean evaluarse o una expresin que realiza un clculo utilizando los datos de dichos campos. Los operandos de expr pueden incluir el nombre de un campo de una tabla, una constante o una funcin (la cual puede ser intrnseca o definida por el usuario pero no otras de las funciones agregadas de SQL) Si la consulta contiene menos de dos registros, Var y VarP devuelven Null (esto indica que la varianza no puede calcularse). Puede utilizar Var y VarP en una expresin de consulta o en una Instruccin SQL.
SELECT Var(Gastos) AS Varianza FROM Pedidos WHERE Pas = 'Espaa'
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT VarP(Gastos) AS Varianza FROM Pedidos WHERE Pas = 'Espaa'
64
4.8.8. COMPUTE de SQL-Server

Esta clusula aade una fila en el conjunto de datos que se est recuperando, se utiliza para realizar clculos en campos numricos. COMPUTE acta siempre sobre un campo o expresin del conjunto de resultados y esta expresin debe figurar exactamente igual en la clusula SELECT y siempre se debe ordenar el resultado por la misma o al memos agrupar el resultado. Esta expresin no puede utilizar ningn ALIAS.
SELECT IdCliente, Count(IdPedido) FROM Pedidos GROUP BY IdPedido HAVING Count(IdPedido) > 20 COMPUTE Sum(Count(IdPedido)) SELECT IdPedido, (PrecioUnidad * Cantidad - Descuento) FROM [Detalles de Pedidos] ORDER BY IdPedido COMPUTE Sum((PrecioUnidad * Cantidad - Descuento)) // Calcula el Total BY IdPedido // Calcula el Subtotal
4.9. Tipos de Datos

Los tipos de datos SQL se clasifican en 13 tipos de datos primarios y de varios sinnimos vlidos reconocidos por dichos tipos de datos. Los tipos de datos primarios son:
Datos BINARY BIT BYTE COUNTER CURRENCY DATETIME SINGLE Longitud 1 byte 1 byte 1 byte 4 bytes 8 bytes 8 bytes 4 bytes Descripcin Para consultas sobre tabla adjunta de productos de bases de datos que definen un tipo de datos Binario. Valores Si/No True/False Un valor entero entre 0 y 255. Un nmero incrementado automticamente (de tipo Long) Un entero escalable entre 922.337.203.685.477,5808 y 922.337.203.685.477,5807. Un valor de fecha u hora entre los aos 100 y 9999. Un valor en punto flotante de precisin simple con un
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares rango de - 3.402823*1038 a -1.401298*10-45 para valores negativos, 1.401298*10- 45 a 3.402823*1038 para valores positivos, y 0. Un valor en punto flotante de doble precisin con un rango de - 1.79769313486232*10308 a -4.94065645841247*10-324 para valores negativos, 4.94065645841247*10-324 a 1.79769313486232*10308 para valores positivos, y 0. Un entero corto entre -32,768 y 32,767. Un entero largo entre -2,147,483,648 y 2,147,483,647. De cero a un mximo de 1.2 gigabytes. De cero 1 gigabyte. Utilizado para objetos OLE. De cero a 255 caracteres.
65
DOUBLE
8 bytes
SHORT LONG LONGTEXT LONGBINARY TEXT
2 bytes 4 bytes 1 byte por carcter Segn se necesite 1 byte por carcter
La siguiente tabla recoge los sinnimos de los tipos de datos definidos:

Tipo de Dato BINARY BIT BYTE COUNTER CURRENCY DATETIME Sinnimos VARBINARY BOOLEAN LOGICAL LOGICAL1 YESNO INTEGER1 AUTOINCREMENT MONEY DATE TIME TIMESTAMP FLOAT4 IEEESINGLE REAL FLOAT FLOAT8 IEEEDOUBLE NUMBER NUMERIC INTEGER2 SMALLINT INT INTEGER INTEGER4 GENERAL OLEOBJECT LONGCHAR
SINGLE
DOUBLE
SHORT LONG LONGBINARY LONGTEXT
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares MEMO NOTE TEXT VARIANT (No Admitido) ALPHANUMERIC CHAR - CHARACTER STRING - VARCHAR VALUE
66
4.10. Subconsultas
Una subconsulta es una instruccin SELECT anidada dentro de una instruccin SELECT, SELECT...INTO, INSERT...INTO, DELETE, o UPDATE o dentro de otra subconsulta. Puede utilizar tres formas de sintaxis para crear una subconsulta:
comparacin [ANY | ALL | SOME] (instruccin sql) expresin [NOT] IN (instruccin sql) [NOT] EXISTS (instruccin sql)
En donde:
comparacin expresin instruccin SQL Es una expresin y un operador de comparacin que compara la expresin con el resultado de la subconsulta. Es una expresin por la que se busca el conjunto resultante de la subconsulta. Es una instruccin SELECT, que sigue el mismo formato y reglas que cualquier otra instruccin SELECT. Debe ir entre parntesis.
Se puede utilizar una subconsulta en lugar de una expresin en la lista de campos de una instruccin SELECT o en una clusula WHERE o HAVING. En una subconsulta, se utiliza una instruccin SELECT para proporcionar un conjunto de uno o ms valores especificados para evaluar en la expresin de la clusula WHERE o HAVING. Se puede utilizar el predicado ANY o SOME, los cuales son sinnimos, para recuperar registros de la consulta principal, que satisfagan la comparacin con cualquier otro registro recuperado en la subconsulta. El ejemplo siguiente devuelve todos los productos cuyo precio unitario es mayor que el de cualquier producto vendido con un descuento igual o mayor al 25 por ciento:
SELECT * FROM Productos WHERE PrecioUnidad ANY ( SELECT PrecioUnidad FROM DetallePedido WHERE Descuento = 0 .25 )
El predicado ALL se utiliza para recuperar nicamente aquellos registros de la consulta principal que satisfacen la comparacin con todos los registros recuperados en la subconsulta. Si se cambia ANY por ALL en el ejemplo anterior, la consulta devolver nicamente aquellos productos cuyo precio unitario sea
67
mayor que el de todos los productos vendidos con un descuento igual o mayor al 25 por ciento. Esto es mucho ms restrictivo. El predicado IN se emplea para recuperar nicamente aquellos registros de la consulta principal para los que algunos registros de la subconsulta contienen un valor igual. El ejemplo siguiente devuelve todos los productos vendidos con un descuento igual o mayor al 25 por ciento:
SELECT * FROM Productos WHERE IDProducto IN ( SELECT IDProducto FROM DetallePedido WHERE Descuento = 0.25 )
Inversamente se puede utilizar NOT IN para recuperar nicamente aquellos registros de la consulta principal para los que no hay ningn registro de la subconsulta que contenga un valor igual. El predicado EXISTS (con la palabra reservada NOT opcional) se utiliza en comparaciones de verdad/falso para determinar si la subconsulta devuelve algn registro. Supongamos que deseamos recuperar todos aquellos clientes que hayan realizado al menos un pedido:
SELECT Clientes.Compaa, Clientes.Telfono FROM Clientes WHERE EXISTS ( SELECT FROM Pedidos WHERE Pedidos.IdPedido = Clientes.IdCliente )
Esta consulta es equivalente a esta otra:

SELECT Clientes.Compaa, Clientes.Telfono FROM Clientes WHERE IdClientes IN ( SELECT Pedidos.IdCliente FROM Pedidos )
68
Se puede utilizar tambin alias del nombre de la tabla en una subconsulta para referirse a tablas listadas en la clusula FROM fuera de la subconsulta. El ejemplo siguiente devuelve los nombres de los empleados cuyo salario es igual o mayor que el salario medio de todos los empleados con el mismo ttulo. A la tabla Empleados se le ha dado el alias T1:
SELECT Apellido, Nombre, Titulo, Salario FROM Empleados AS T1 WHERE Salario = ( SELECT Avg(Salario) FROM Empleados WHERE T1.Titulo = Empleados.Titulo ) ORDER BY Titulo
En el ejemplo anterior, la palabra reservada AS es opcional.

SELECT Apellidos, Nombre, Cargo, Salario FROM Empleados WHERE Cargo LIKE 'Agente Ven*' AND Salario ALL ( SELECT Salario FROM Empleados WHERE Cargo LIKE '*Jefe*' OR Cargo LIKE '*Director*' )
(Obtiene una lista con el nombre, cargo y salario de todos los agentes de ventas cuyo salario es mayor que el de todos los jefes y directores).
SELECT DISTINCT NombreProducto, Precio_Unidad FROM Productos WHERE PrecioUnidad = ( SELECT PrecioUnidad FROM Productos WHERE
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares NombreProducto = 'Almbar anisado' )
69
(Obtiene una lista con el nombre y el precio unitario de todos los productos con el mismo precio que el "almbar anisado").
SELECT DISTINCT NombreContacto, NombreCompania, CargoContacto, Telefono FROM Clientes WHERE IdCliente IN ( SELECT DISTINCT IdCliente FROM Pedidos WHERE FechaPedido <#07/01/1993# )
(Obtiene una lista de las compaas y los contactos de todos los clientes que han realizado un pedido en el segundo trimestre de 1993.)
SELECT Nombre, Apellidos FROM Empleados AS E WHERE EXISTS ( SELECT * FROM Pedidos AS O WHERE O.IdEmpleado = E.IdEmpleado )
(Selecciona el nombre de todos los empleados que han reservado al menos un pedido.)
SELECT DISTINCT Pedidos.Id_Producto, Pedidos.Cantidad, ( SELECT Productos.Nombre FROM Productos WHERE Productos.IdProducto = Pedidos.IdProducto ) AS ElProducto FROM Pedidos WHERE Pedidos.Cantidad = 150 ORDER BY Pedidos.Id_Producto
(Recupera el Cdigo del Producto y la Cantidad pedida de la tabla pedidos, extrayendo el nombre del producto de la tabla de productos.)
SELECT NumVuelo, Plazas FROM
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Vuelos WHERE Origen = 'Madrid' AND Exists ( SELECT T1.NumVuelo FROM Vuelos AS T1 WHERE T1.PlazasLibres > 0 AND T1.NumVuelo=Vuelos.NumVuelo )
70
(Recupera nmeros de vuelo y capacidades de aquellos vuelos con destino Madrid y plazas libres Supongamos ahora que tenemos una tabla con los identificadores de todos nuestros productos y el stock de cada uno de ellos. En otra tabla se encuentran todos los pedidos que tenemos pendientes de servir. Se trata de averiguar que productos no se podemos servir por falta de stock.
SELECT PedidosPendientes.Nombre FROM PedidosPendientes GROUP BY PedidosPendientes.Nombre HAVING SUM (PedidosPendientes.Cantidad < ( SELECT Productos.Stock FROM Productos WHERE Productos.IdProducto = PedidosPendientes.IdProducto ) )
Supongamos que en nuestra tabla de empleados deseamos buscar todas las mujeres cuya edad sea mayor a la de cualquier hombre:
SELECT Empleados.Nombre FROM Empleados WHERE Sexo = 'M' AND Edad > ANY ( SELECT Empleados.Edad FROM Empleados WHERE Sexo ='H' )
lo que sera lo mismo:

SELECT Empleados.Nombre FROM Empleados WHERE Sexo = 'M' AND Edad > (SELECT Max( Empleados.Edad )FROM Empleados WHERE Sexo ='H')
La siguiente tabla muestra algn ejemplo del operador ANY y ALL
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Valor 1 3 3 3 3 3 Operador > ANY = ANY = ANY > ALL < ALL Valor 2 (2,5,7) (2,5,7) (2,3,5,7) (2,5,7) (5,6,7) Resultado Cierto Falso Cierto Falso Falso
71
La operacin =ANY es equivalente al operador IN, ambos devuelven el mismo resultado. Para concluir este apartado comentar que: la clusula EXISTS se puede emplear para generar la interseccin entre dos consultas y, por tanto, la clusula NOT EXISTS para generar la diferencia entre consultas.
4.11. Estructuras de las Tablas

Una base de datos en un sistema relacional est compuesta por un conjunto de tablas, que corresponden a las relaciones del modelo relacional. En la terminologa usada en SQL no se alude a las relaciones, del mismo modo que no se usa el trmino atributo, pero s la palabra columna, y no se habla de tupla, sino de lnea.
4.11.1. Creacin de Tablas Nuevas

CREATE TABLE tabla ( campo1 tipo (tamao) ndice1, campo2 tipo (tamao) ndice2,... , ndice multicampo , ... )
En donde:
tabla campo1 campo2 tipo tamao ndice1 ndice2 ndice multicampos Es el nombre de la tabla que se va a crear. Es el nombre del campo o de los campos que se van a crear en la nueva tabla. La nueva tabla debe contener, al menos, un campo. Es el tipo de datos de campo en la nueva tabla. (Ver Tipos de Datos) Es el tamao del campo slo se aplica para campos de tipo texto. Es una clusula CONSTRAINT que define el tipo de ndice a crear. Esta clusula en opcional. Es una clusula CONSTRAINT que define el tipo de ndice multicampos a crear. Un ndice multicampo es aquel que est indexado por el contenido de varios campos. Esta clusula en opcional.
CREATE TABLE Empleados ( Nombre TEXT (25), Apellidos TEXT (50) )
(Crea una nueva tabla llamada Empleados con dos campos, uno llamado Nombre de tipo texto y longitud 25 y otro llamado apellidos con longitud 50).
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares CREATE TABLE Empleados ( Nombre TEXT (10), Apellidos TEXT, FechaNacimiento DATETIME ) CONSTRAINT IndiceGeneral UNIQUE ( Nombre, Apellidos, FechaNacimiento )
72
(Crea una nueva tabla llamada Empleados con un campo Nombre de tipo texto y longitud 10, otro con llamado Apellidos de tipo texto y longitud predeterminada (50) y uno ms llamado FechaNacimiento de tipo Fecha/Hora. Tambin crea un ndice nico - no permite valores repetidos - formado por los tres campos.)
CREATE TABLE Empleados ( IdEmpleado INTEGER CONSTRAINT IndicePrimario PRIMARY, Nombre TEXT, Apellidos TEXT, FechaNacimiento DATETIME )
(Crea una tabla llamada Empleados con un campo Texto de longitud predeterminada (50) llamado Nombre y otro igual llamado Apellidos, crea otro campo llamado FechaNacimiento de tipo Fecha/Hora y el campo IdEmpleado de tipo entero el que establece como clave principal.)
4.11.2. La clusula CONSTRAINT

Se utiliza la clusula CONSTRAINT en las instrucciones ALTER TABLE y CREATE TABLE para crear o eliminar ndices. Existen dos sintaxis para esta clusula dependiendo si desea Crear Eliminar un ndice de un nico campo o si se trata de un campo multi-ndice. Si se utiliza el motor de datos de Microsoft, slo podr utilizar esta clusula con las bases de datos propias de dicho motor. Para los ndices de campos nicos:
CONSTRAINT nombre {PRIMARY KEY | UNIQUE | REFERENCES tabla externa [(campo externo1, campo externo2)]}
Para los ndices de campos mltiples:

CONSTRAINT nombre {PRIMARY KEY (primario1[, primario2 [,...]]) | UNIQUE (nico1[, nico2 [, ...]]) | FOREIGN KEY (ref1[, ref2 [,...]]) REFERENCES tabla externa [(campo externo1 ,campo externo2 [,...])]}
En donde:
nombre primarioN nicoN refN tabla externa Es el nombre del ndice que se va a crear. Es el nombre del campo o de los campos que forman el ndice primario. Es el nombre del campo o de los campos que forman el ndice de clave nica. Es el nombre del campo o de los campos que forman el ndice externo (hacen referencia a campos de otra tabla). Es el nombre de la tabla que contiene el campo o los campos referenciados
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares en refN campos externos Es el nombre del campo o de los campos de la tabla externa especificados por ref1, ref2,... , refN
73
Si se desea crear un ndice para un campo cuando se esta utilizando las instrucciones ALTER TABLE o CREATE TABLE la clusula CONTRAINT debe aparecer inmediatamente despus de la especificacin del campo indexado. Si se desea crear un ndice con mltiples campos cuando se est utilizando las instrucciones ALTER TABLE o CREATE TABLE la clusula CONSTRAINT debe aparecer fuera de la clusula de creacin de tabla.
ndice UNIQUE PRIMARY KEY Descripcin Genera un ndice de clave nica. Lo que implica que los registros de la tabla no pueden contener el mismo valor en los campos indexados. Genera un ndice primario el campo o los campos especificados. Todos los campos de la clave principal deben ser nicos y no nulos, cada tabla slo puede contener una nica clave principal. Genera un ndice externo (toma como valor del ndice campos contenidos en otras tablas). Si la clave principal de la tabla externa consta de ms de un campo, se debe utilizar una definicin de ndice de mltiples campos, listando todos los campos de referencia, el nombre de la tabla externa, y los nombres de los campos referenciados en la tabla externa en el mismo orden que los campos de referencia listados. Si los campos referenciados son la clave principal de la tabla externa, no tiene que especificar los campos referenciados, predeterminado por valor, el motor Jet se comporta como si la clave principal de la tabla externa estuviera formada por los campos referenciados.
FOREIGN KEY
4.11.3. Creacin de ndices

Si se utiliza el motor de datos Jet de Microsoft slo se pueden crear ndices en bases de datos del mismo motor. La sintaxis para crear un ndice en una tabla ya definida en la siguiente:
CREATE [ UNIQUE ] INDEX ndice ON Tabla (campo [ASC|DESC][, campo [ASC|DESC], ...]) [WITH { PRIMARY | DISALLOW NULL | IGNORE NULL }]
En donde:
ndice tabla campo ASC|DESC UNIQUE DISALLOW NULL IGNORE NULL PRIMARY Es el nombre del ndice a crear. Es el nombre de una tabla existente en la que se crear el ndice. Es el nombre del campo o lista de campos que constituyen el ndice. Indica el orden de los valores de los campos ASC indica un orden ascendente (valor predeterminado) y DESC un orden descendente. Indica que el ndice no puede contener valores duplicados. Prohbe valores nulos en el ndice Excluye del ndice los valores nulos incluidos en los campos que lo componen. Asigna al ndice la categora de clave principal, en cada tabla slo puede existir un nico ndice que sea "Clave Principal". Si un ndice es clave principal implica que no puede contener valores nulos ni
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares duplicados.
74
En el caso de MS-Access, se puede utilizar CREATE INDEX para crear un pseudo ndice sobre una tabla adjunta en una fuente de datos ODBC tal como SQL-Server que no tenga todava un ndice. No necesita permiso o tener acceso a un servidor remoto para crear un pseudo ndice, adems la base de datos remota no es consciente y no es afectada por el pseudo ndice. Se utiliza la misma sintaxis para las tablas adjuntas que para las originales. Esto es especialmente til para crear un ndice en una tabla que sera de slo lectura debido a la falta de un ndice.
CREATE INDEX MiIndice ON Empleados (Prefijo, Telefono)
(Crea un ndice llamado MiIndice en la tabla empleados con los campos Prefijo y Telfono).
CREATE UNIQUE INDEX MiIndice ON Empleados (IdEmpleado) WITH DISALLOW NULL
(Crea un ndice en la tabla Empleados utilizando el campo IdEmpleado, obligando que el campo IdEmpleado no contenga valores nulos ni repetidos.)
4.11.4. Modificar el Diseo de una Tabla

Modifica el diseo de una tabla ya existente, se pueden modificar los campos o los ndices existentes. Su sintaxis es:
ALTER TABLE tabla {ADD {COLUMN tipo de campo[(tamao)] [CONSTRAINT ndice] CONSTRAINT ndice multicampo} | DROP {COLUMN campo I CONSTRAINT nombre del ndice}}
En donde:
tabla campo tipo tamao ndice ndice multicampo Es el nombre de la tabla que se desea modificar. Es el nombre del campo que se va a aadir o eliminar. Es el tipo de campo que se va a aadir. Es el tamao del campo que se va a aadir (slo para campos de texto). Es el nombre del ndice del campo (cuando se crean campos) o el nombre del ndice de la tabla que se desea eliminar. Es el nombre del ndice del campo multicampo (cuando se crean campos) o el nombre del ndice de la tabla que se desea eliminar.
Operacin ADD COLUMN ADD DROP COLUMN
Descripcin Se utiliza para aadir un nuevo campo a la tabla, indicando el nombre, el tipo de campo y opcionalmente el tamao (para campos de tipo texto). Se utiliza para agregar un ndice de multicampos o de un nico campo. Se utiliza para borrar un campo. Se especifica nicamente el nombre
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares del campo. DROP Se utiliza para eliminar un ndice. Se especifica nicamente el nombre del ndice a continuacin de la palabra reservada CONSTRAINT.
75
ALTER TABLE Empleados ADD COLUMN Salario CURRENCY
(Agrega un campo Salario de tipo Moneda a la tabla Empleados.)

ALTER TABLE Empleados DROP COLUMN Salario
(Elimina el campo Salario de la tabla Empleados.)

ALTER TABLE Pedidos ADD CONSTRAINT RelacionPedidos FOREIGN KEY (IdEmpleado) REFERENCES Empleados (IdEmpleado)
(Agrega un ndice externo a la tabla Pedidos. El ndice externo se basa en el campo IdEmpleado y se refiere al campo IdEmpleado de la tabla Empleados. En este ejemplo no es necesario indicar el campo junto al nombre de la tabla en la clusula REFERENCES, pues ID_Empleado es la clave principal de la tabla Empleados.)
ALTER TABLE Pedidos DROP CONSTRAINT RelacionPedidos
(Elimina el ndice de la tabla Pedidos.)
4.12. Problemas resueltos: Registros duplicados

Para generar este tipo de consultas lo ms sencillo es utilizar el asistente de consultas de MS-Access, editar la sentencia SQL de la consulta y pegarla en nuestro cdigo. No obstante este tipo de consulta se consigue de la siguiente forma:
SELECT DISTINCT Lista de Campos a Visualizar FROM Tabla WHERE CampoDeBusqueda In (SELECT CampoDeBusqueda FROM Tabla As psudnimo GROUP BY CampoDeBusqueda HAVING Count(*) > 1 ) ORDER BY CampoDeBusqueda
Un caso prctico, si deseamos localizar aquellos empleados con igual nombre y visualizar su cdigo correspondiente, la consulta sera la siguiente:
SELECT DISTINCT
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Empleados.Nombre, Empleados.IdEmpleado FROM Empleados WHERE Empleados.Nombre In ( SELECT Nombre FROM Empleados As Tmp GROUP BY Nombre HAVING Count(*) > 1) ORDER BY Empleados.Nombre
76
4.13. Problemas resueltos: Registros no relacionados

Este tipo de consulta se emplea en situaciones tales como saber que productos no se han vendido en un determinado periodo de tiempo:
SELECT DISTINCT Productos.IdProducto, Productos.Nombre FROM Productos LEFT JOINPedidos ON Productos.IdProducto = Pedidos.IdProducto WHERE (Pedidos.IdProducto Is Null) AND (Pedidos.Fecha Between #01-01-1998# And #01-30-1998#)
La sintaxis es sencilla, se trata de realizar una unin interna entre dos tablas seleccionadas mediante un LEFT JOIN, estableciendo como condicin que el campo relacionado de la segunda sea NULL.
4.14. Cursores
En algunos SGDB es posible la abertura de cursores de datos desde el propio entorno de trabajo, para ello se utilizan, normalmente procedimientos almacenados. La sintaxis para definir un cursor es la siguiente:
DECLARE nombre-cursor FOR especificacion-consulta [ORDER BY]
Por ejemplo:
DECLARE Mi_Cursor FOR SELECT num_emp, nombre, puesto, salario FROM empleados WHERE num_dept = 'informatica'
Este comando es meramente declarativo, simplemente especifica las filas y columnas que se van a recuperar. La consulta se ejecuta cuando se abre o se activa el cursor. La clusula [ ORDER BY] es opcional y especifica una ordenacin para las filas del cursor; si no se especifica, la ordenacin de las filas es definida el gestor de SGBD. Para abrir o activar un cursor se utiliza el comando OPEN del SQL, la sintaxis en la siguiente:
OPEN nombre-cursor
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares [USING lista-variables]
77
Al abrir el cursor se evala la consulta que aparece en su definicin, utilizando los valores actuales de cualquier parmetro referenciado en la consulta, para producir una coleccin de filas. El puntero se posiciona delante de la primera fila de datos (registro actual), esta sentencia no recupera ninguna fila. Una vez abierto el cursos se utiliza la clusula FETCH para recuperar las filas del cursor, la sintaxis es la siguiente:
FETCH nombre-cursor INTO lista-variables
Lista - variables son las variables que van a contener los datos recuperados de la fila del cursor, en la definicin deben ir separadas por comas. En la lista de variables se deben definir tantas variables como columnas tenga la fila a recuperar. Para cerrar un cursor se utiliza el comando CLOSE, este comando hace desaparecer el puntero sobre el registro actual. La sintaxis es:
CLOSE nombre-cursor
Por ltimo, y para eliminar el cursor se utiliza el comando DROP CURSOR. Su sintaxis es la siguiente:
DROP CURSOR nombre-cursor
Ejemplo (sobre SQL-Server):

'Abrir un cursor y recorrelo DECLARE Employee_Cursor CURSOR FOR SELECT LastName, FirstName FROM Northwind.dbo.Employees WHERE LastName like 'B%' OPEN Employee_Cursor FETCH NEXT FROM Employee_Cursor WHILE @@FETCH_STATUS = 0 BEGIN FETCH NEXT FROM Employee_Cursor END CLOSE Employee_Cursor DEALLOCATE Employee_Cursor
'Abrir un cursor e imprimir su contenido SET NOCOUNT ON DECLARE @au_id varchar(11), @au_fname varchar(20), @au_lname varchar(40), @message varchar(80), @title varchar(80)
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares PRINT "-------- Utah Authors report --------" DECLARE authors_cursor CURSOR FOR SELECT au_id, au_fname, au_lname FROM authors WHERE state = "UT" ORDER BY au_id OPEN authors_cursor FETCH NEXT FROM authors_cursor INTO @au_id, @au_fname, @au_lname WHILE @@FETCH_STATUS = 0 BEGIN PRINT " " SELECT @message = "----- Books by Author: " + @au_fname + " " + @au_lname PRINT @message DECLARE titles_cursor CURSOR FOR SELECT t.title FROM titleauthor ta, titles t WHERE ta.title_id = t.title_id AND ta.au_id = au_id OPEN titles_cursor FETCH NEXT FROM titles_cursor INTO @title IF @@FETCH_STATUS <> 0 PRINT " <<No Books>>" WHILE @@FETCH_STATUS = 0 BEGIN SELECT @message = " " + @title PRINT @message FETCH NEXT FROM titles_cursor INTO @title END CLOSE titles_cursor DEALLOCATE titles_cursor FETCH NEXT FROM authors_cursor INTO @au_id, @au_fname, @au_lname END CLOSE authors_cursor DEALLOCATE authors_cursor GO
78
'Recorrer un cursor USE pubs GO DECLARE authors_cursor CURSOR FOR SELECT au_lname FROM authors WHERE au_lname LIKE "B%" ORDER BY au_lname
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares OPEN authors_cursor FETCH NEXT FROM authors_cursor WHILE @@FETCH_STATUS = 0 BEGIN FETCH NEXT FROM authors_cursor END CLOSE authors_cursor DEALLOCATE authors_cursor
79
'Recorrer un cursor guardando los valores en variables USE pubs GO DECLARE @au_lname varchar(40) DECLARE @au_fname varchar(20) DECLARE authors_cursor CURSOR FOR SELECT au_lname, au_fname FROM authors WHERE au_lname LIKE "B%" ORDER BY au_lname, au_fname OPEN authors_cursor FETCH NEXT FROM authors_cursor INTO @au_lname, @au_fname WHILE @@FETCH_STATUS = 0 BEGIN PRINT "Author: " + @au_fname + " " + @au_lname FETCH NEXT FROM authors_cursor INTO @au_lname, @au_fname END CLOSE authors_cursor DEALLOCATE authors_cursor
4.15. FREETEXT y CONTAINS (FULLTEXT SQL-Server)

4.15.1. FULL TEXT SEARCH
Se utilizan en campos de texto de gran tamao utilizando unos ndices denominados catlogos. Estos catlogos slo se pueden utilizar con tablas que tengan definidas claves primarias y almacenan todas las palabras del contenido de las tablas a excepcin de los artculos, preposiciones, etc. Los catlogos no se actualizan automticamente ni se guardan junto con la base de datos y cada tabla puede tener un nico catlogo. Para la utilizacin de estos catlogos dentro de una consulta, podemos utilizar dos mtodos, el primero consiste en incluir los criterios dentro de una clusula WHERE (CONTAINS FREETEXT) y la segunda es utilizando una tabla temporal que contiene el ratio de acierto en la consulta (CONTAINSTABLE FREETEXTTABLE).
El predicado CONTAINS
Se utiliza este predicado para buscar un texto especfico en una tabla. Su funcionamiento es similar al predicado LIKE, a diferencia que ste no puede realizar bsquedas en los campos grandes de texto. CONTAINS no diferencia entre maysculas y minsculas.
80
Sintaxis:
SELECT <Campos> FROM <Tabla> WHERE CONTAINS(<Campo>,<Cadena>) OR/AND CONTAINS(<Campo>,<Cadena>)
El predicado CONTAINS soporta sintaxis complejas para buscar: Una o ms palabras utilizando los operadores lgicos AND/OR. Familias de palabras Una palabra o una frase que comiencen por un determinado texto. Palabras o frases que estn unas cerca de otra.
Para buscar una palabra en un campo:

SELECT title_id, title, notes FROM titles WHERE CONTAINS(notes,business)
Para localizar una frase en un campo:

SELECT title_id, titles, notes FROM titles WHERE CONTAINS(notes, "common business applications" )
Para localizar una frase en todos los campos habilitados:

SELECT title_id, titles, notes FROM titles WHERE CONTAINS(*, "common business applications" )
Utilizando AND, OR y NOT

SELECT title, notes FROM titles WHERE CONTAINS(notes, "favorite recipes" OR "gourmet recipes" ) SELECT titles, notes FROM titles WHERE CONTAINS(notes, cooking AND NOT ("computer*") ) SELECT titles, notes FROM titles WHERE CONTAINS(notes, beer AND ales ) SELECT titles, notes FROM titles WHERE CONTAINS(*, ("ice skating" OR hockey) AND NOT olympics)
Utilizando caracteres comodines

SELECT titles, notes FROM titles WHERE CONTAINS(notes, "ice*" ) SELECT titles, notes FROM titles WHERE CONTAINS(notes, "light bread*" )
Bsqueda de palabras o frases indicando la importancia de las palabras: Esta bsqueda permite indicar el peso que tendr cada una de las palabras o frases que se buscan sobre el resultado de la bsqueda, el peso oscila entre el valor ms bajo 0.0 y el valor ms alto 1.0.
SELECT Cliente, Nombre, Direccion FROM Cliente WHERE CONTAINS (Direccion, ISABOUT ( "Calle*", Velazquez WEIGHT(0.5), Serrano(0.9))
(Se encontrarn todos aquellos registros que en el campo direccin exista la cadena calle seguida de cualquier valor, ordenando primero los de " Calle Serrano", luego los de "Calle Velzquez" y despus el resto.
81
Bsqueda de palabras cercanas: Podemos realizar bsquedas por dos palabras e indicar que se encuentren prximas una de otra. El orden de las palabras no altera el resultado de la bsqueda.
SELECT titulo, notas FROM libros WHERE CONTAINS (notas, "usuario NEAR computadora") SELECT titulo, notas FROM libros WHERE CONTAINS (notas, "usuario ~ computadora")
Se pueden indicar tres palabras, de tal forma que la segunda y la primera deben estar prximas al igual que la segunda y la tercera.
SELECT titulo, notas FROM libros WHERE CONTAINS (notas, "usuario ~ principiante ~ computadora")
Bsquedas con frases:

... WHERE CONTAINS(Descripcion, " salsas ~ "mezcl*" ") ... WHERE CONTAINS(Descripcion, " "carne*" ~ "salsa empanada*" ")
El predicado FREETEXT
Al utilizar este predicado se analizan todas las palabras de las frases y nos devuelve como resultado, aquellos registros que contiene la frase completa o algn fragmento de la misma. La sintaxis es igual que el predicado CONTAINS.
... FREETEXT(descripcion, "En un lugar de la mancha de cuyo nombre no quiero acordarme" )
El predicado CONTAINSTABLE
Este predicado tiene igual funcionamiento y sintaxis que CONTAINS a diferencia que en este caso devuelve una tabla con dos columnas, la primera llamada [ KEY] contiene el valor de la clave primaria de la tabla que la que buscamos, la segunda llamada RANK devuelve un valor indicando el porcentaje de acierto en la bsqueda para cada registro.
SELECT Preguntas.Pregunta, Preguntas.Respuesta, Resultado.RANK FROM Preguntas, CONTAINSTABLE(Respuesta, " SQL Server") AS Resultado WHERE Preguntas.IdPregunta = Resultado.[KEY] ORDER BY Resultado.RANK Desc SELECT Preguntas.Pregunta, Preguntas.Respuesta, Resultado.RANK FROM Preguntas INNER JOIN CONTAINSTABLE (Respuesta, "SQL Server") AS Resultado ON Preguntas.IdPregunta = Resultados.KEY
El predicado FREETEXTTABLE
Es el equivalente a CONTAINSTABLE pero realizando bsquedas de FREETEXT.
4.15.2. Consultas e ndices de texto

El principal requisito de diseo de los ndices, consultas y sincronizacin de texto es la presencia de una columna de clave exclusiva de texto (o clave principal de columna nica) en todas las tablas que se registren para realizar bsquedas de texto. Un ndice de texto realiza el seguimiento de las palabras significativas que ms se usan y dnde se encuentran.
82
Por ejemplo, imagine un ndice de texto para la tabla DevTools. Un ndice de texto puede indicar que la palabra "Microsoft" se encuentra en la palabra nmero 423 y en la palabra 982 de la columna Abstract para la fila asociada con el ProductID igual a 6. Esta estructura de ndices admite una bsqueda eficiente de todos los elementos que contengan palabras indizadas y operaciones de bsqueda avanzadas, como bsquedas de frases y bsquedas de proximidad. Para impedir que los ndices de texto se inunden con palabras que no ayudan en la bsqueda, las palabras innecesarias (vacas de significado), como " un", "y", "es" o "el", se pasan por alto. Por ejemplo, especificar la frase "los productos pedidos durante estos meses de verano " es lo mismo que especificar la frase " productos pedidos durante meses verano". Se devuelven las filas que contengan alguna de las cadenas. En el directorio \Mssql7\Ftdata\Sqlserver\Config se proporcionan listas de palabras que no son relevantes en las bsquedas de muchos idiomas. Este directorio se crea, y los archivos de palabras no relevantes se instalan, cuando se instala Microsoft SQL Server con la funcionalidad de bsqueda de texto. Los archivos de palabras no relevantes se pueden modificar. Por ejemplo, los administradores del sistema de las empresas de alta tecnologa podran agregar la palabra " sistema" a su lista de palabras no relevantes. (Si modifica un archivo de palabras no relevantes, debe volver a rellenar los catlogos de texto para que los cambios surtan efecto). Consulte la ayuda de SQL-Server para conocer los correspondientes ficheros. Cuando se procesa una consulta de texto, el motor de bsqueda devuelve a SQL-Server los valores de clave de las filas que coinciden con los criterios de bsqueda. Imagine una tabla CienciaFiccin en la que la columna NmLibro es la columna de clave principal:
NmLibro A025 A027 C011 V109 Escritor Asimov Asimov Clarke Verne Ttulo Los lmites de la fundacin Fundacin e imperio El fin de la infancia La isla misteriosa
Suponga que desea usar una consulta de recuperacin de texto para buscar los ttulos de los libros que incluyen la palabra Fundacin. En este caso, del ndice de texto se obtienen los valores A025 y A027. SQL-Server usa, a continuacin, estas claves y el resto de la informacin de los campos para responder a la consulta.
4.15.3. Componentes de las consultas de texto de Transact-SQL

SQL-Server proporciona estos componentes de Transact-SQL para las consultas de texto: Predicados de Transact-SQL: CONTAINS FREETEXT
Los predicados CONTAINS y FREETEXT se pueden usar en cualquier condicin de bsqueda (incluida una clusula WHERE) de una instruccin SELECT. Funciones de conjuntos de filas de Transact-SQL: CONTAINSTABLE FREETEXTTABLE
Las funciones CONTAINSTABLE y FREETEXTTABLE se pueden usar en la clusula FROM de una instruccin SELECT.
83
Propiedades de texto de Transact-SQL: stas son algunas de las propiedades que se usan con las consultas de texto y las funciones que se utilizan para obtenerlas: La propiedad IsFullTextEnabled indica si una base de datos est habilitada para texto y se encuentra disponible mediante la funcin DatabaseProperty. La propiedad TableHasActiveFulltextIndex indica si una tabla est habilitada para texto y se encuentra disponible mediante la funcin ObjectProperty. La propiedad IsFullTextIndexed indica si una columna est habilitada para texto y se encuentra disponible mediante la funcin ColumnProperty. La propiedad TableFullTextKeyColumn proporciona el identificador de la columna de clave exclusiva de texto y se encuentra disponible mediante la funcin ObjectProperty. Los procedimientos almacenados que definen los ndices de texto e inician el relleno de los ndices de texto, como, por ejemplo, sp_fulltext_catalog, sp_fulltext_table y sp_fulltext_column. Los procedimientos almacenados que consultan los metadatos de los ndices de texto que se han definido mediante los procedimientos almacenados del sistema mencionados anteriormente, como, por ejemplo, sp_help_fulltext_catalogs, sp_help_fulltext_tables, sp_help_fulltext_columns, y una variacin de stos que permite utilizar cursores sobre los conjuntos de resultados devueltos.
Procedimientos de texto almacenados del sistema de Transact-SQL:
Estos procedimientos almacenados se pueden usar en conjuncin con la escritura de una consulta. Por ejemplo, puede usarlos para buscar los nombres de las columnas indizadas de texto de una tabla y el identificador de una columna de clave nica de texto antes de especificar una consulta.
4.15.4. Funciones de conjunto de filas CONTAINSTABLE y FREETEXTTABLE

Las funciones CONTAINSTABLE y FREETEXTTABLE se usan para especificar las consultas de texto que devuelve la clasificacin por porcentaje de aciertos de cada fila. Estas funciones son muy similares a los predicados de texto CONTAINS y FREETEXT, pero se utilizan de forma diferente. Aunque tanto los predicados de texto como las funciones de conjunto de filas de texto se usan para las consultas de texto y la instruccin Transact-SQL usada para especificar la condicin de bsqueda de texto es la misma en los predicados y en las funciones, hay importantes diferencias en la forma en la que stas se usan: CONTAINS y FREETEXT devuelven ambos el valor TRUE o FALSE, con lo que normalmente se especifican en la clusula WHERE de una instruccin SELECT. Slo se pueden usar para especificar los criterios de seleccin, que usa SQL-Server para determinar la pertenencia al conjunto de resultados. CONTAINSTABLE y FREETEXTTABLE devuelven ambas una tabla de cero, una o ms filas, con lo que deben especificarse siempre en la clusula FROM.Se usan tambin para especificar los criterios de seleccin. La tabla devuelta tiene una columna llamada KEY que contiene valores de claves de texto. Cada tabla de texto registrada tiene una columna cuyos valores se garantizan como nicos. Los valores devueltos en la columna KEY de CONTAINSTABLE o FREETEXTTABLE son los valores nicos, procedentes de la tabla de texto registrada, de las filas que coinciden con los criterios de seleccin en la condicin de bsqueda de texto.
84
Adems, la tabla que producen CONTAINSTABLE y FREETEXTTABLE tiene una columna denominada RANK, que contiene valores de 0 a 1000. Estos valores se utilizan para ordenar las filas devueltas de acuerdo al nivel de coincidencia con los criterios de seleccin. Las consultas que usan las funciones CONTAINSTABLE y FREETEXTTABLE son ms complejas que las que usan los predicados CONTAINS y FREETEXT porque las filas que cumplen los criterios y que son devueltas por las funciones deben ser combinadas explcitamente con las filas de la tabla original de SQL-Server.
4.15.5. CONTAINSTABLE (T-SQL)

Devuelve una tabla con cero, una o ms filas para aquellas columnas de tipos de datos carcter que contengan palabras o frases en forma precisa o "aproximada" (menos precisa), la proximidad de palabras medida como distancia entre ellas, o coincidencias medidas. A CONTAINSTABLE se le puede hacer referencia en una clusula FROM de una instruccin SELECT como si fuera un nombre de tabla normal. Las consultas que utilizan CONTAINSTABLE especifican consultas de texto contenido que devuelven un valor de distancia (RANK) por cada fila. La funcin CONTAINSTABLE utiliza las mismas condiciones de bsqueda que el predicado CONTAINS.
Sintaxis
CONTAINSTABLE (tabla, {columna | *}, '<condicinBsquedaContenido>') <condicinBsqueda> ::= { | <trminoGeneracin> | <trminoPrefijo> | <trminoProximidad> | <trminoSimple> | <trminoPeso> } | { (<condicinBsqueda>) {AND | AND NOT | OR} <condicinBsqueda> [...n] } <trminoPeso> ::= ISABOUT ({{ <trminoGeneracin>) | <trminoPrefijo>) | <trminoProximidad>) | <trminoSimple>) } [WEIGHT (valorPeso)] } [,...n] ) <trminoGeneracin> ::= FORMSOF (INFLECTIONAL, <trminoSimple> [,...n] ) <trminoPrefijo> ::= { "palabra * " | "frase * " } <trminoProximidad> ::= {<trminoSimple> | <trminoPrefijo>} { {NEAR | ~} {<trminoSimple> | <trminoPrefijo>} } [n] <trminoSimple> ::= palabra | " frase "
85
Argumentos
Argumento tabla Descripcin Es el nombre de la tabla que ha sido registrada para bsquedas de texto. tabla puede ser el nombre de un objeto de una base de datos de una sola parte o el nombre de un objeto de una base de datos con varias partes. Para obtener ms informacin, consulte Convenciones de sintaxis de Transact-SQL. Es el nombre de la columna que se va a examinar, que reside en tabla. Las columnas de tipos de datos de cadena de caracteres son columnas vlidas para bsquedas de texto. Especifica que todas las columnas de la tabla que se hayan registrado para bsquedas de texto se deben utilizar en las condiciones de bsqueda. Especifica el texto que se va a buscar en columna. En la condicin de bsqueda no se puede utilizar variables. Es una cadena de caracteres sin espacios ni signos de puntuacin. Es una o varias palabras con espacios entre cada una de ellas. Nota: Algunos idiomas, como los orientales, pueden tener frases que contengan una o varias palabras sin espacios entre ellas. Especifica que las filas coincidentes (devueltas por la consulta) coincidan con una lista de palabras y frases a las que se asigna opcionalmente un valor de peso. Especifica la palabra clave <trminoPeso>. Especifica el valor de peso como nmero entre 0,0 y 1,0. Cada componente de <trminoPeso> puede incluir un valorPeso. valorPeso es una forma de modificar cmo varias partes de una consulta afectan al valor de distancia asignado a cada fila de la consulta. El peso hace una medida diferente de la distancia de un valor porque todos los componentes de <trminoPeso> se utilizan para determinar la coincidencia. Se devuelven las filas que contengan una coincidencia con cualquiera de los parmetros ISABOUT, aunque no tengan un peso asignado. Especifica una operacin lgica entre dos condiciones de bsqueda. Cuando <condicinBsqueda> contiene grupos entre parntesis, dichos grupos entre parntesis se evalan primero. Despus de evaluar los grupos entre parntesis, se aplican las reglas siguientes cuando se utilizan estos operadores lgicos con condiciones de bsqueda: NOT se aplica antes que AND. NOT slo puede estar a continuacin de AND, como en AND NOT. No se acepta el operador OR NOT. No se puede especificar NOT antes del primer trmino (por ejemplo, CONTAINS(mycolumn, 'NOT "fraseBuscada" ' ). AND se aplica antes que OR. Los operadores booleanos del mismo tipo (AND, OR) son asociativos y, por tanto, se pueden aplicar en cualquier orden. Especifica la coincidencia de palabras cuando los trminos simples incluyen variaciones de la palabra original que se busca.
columna
<condicinBsqueda> palabra frase
<trminoPeso>
ISABOUT WEIGHT (valorPeso)
AND | AND NOT | OR
<trminoGeneracin>
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Argumento INFLECTIONAL Descripcin Especifica que se acepten las coincidencias de las formas plurales y singulares de los nombres y los distintos tiempos verbales. Un <trminoSimple> dado dentro de un <trminoGeneracin> no coincide con nombres y verbos a la vez. Especifica la coincidencia de palabras o frases que comiencen con el texto especificado. Enmarque el prefijo entre comillas dobles ("") y un asterisco (*) antes de la segunda comilla doble. Coincide todo el texto que comience por el trmino simple especificado antes del asterisco. El asterisco representa cero, uno o varios caracteres (de la palabra o palabras raz de la palabra o la frase). Cuando < trminoPrefijo> es una frase, todas las palabras de dicha frase se consideran prefijos. Por tanto, una consulta que especifique el prefijo "local wine *" hace que se devuelvan todas las filas que contengan el texto " local winery", "locally wined and dined", etc. Especifica la coincidencia de palabras o frases que estn cercanas entre ellas. <trminoProximidad> opera de forma similar al operador AND: ambos requieren que existan varias palabras o frases en la columna examinada. Cuanto ms prximas estn las palabras de <trminoProximidad>, mejor ser la coincidencia. Indica que la palabra o frase del lado izquierdo del operador NEAR o ~ tiene que estar bastante cerca de la palabra o frase del lado derecho del operador NEAR o ~. Se pueden encadenar varios trminos de proximidad, por ejemplo:
86
<trminoPrefijo>
<trminoProximidad>
NEAR | ~
a NEAR b NEAR c
Esto significa que la palabra o frase a tiene que estar cerca de la palabra o frase b, que, a su vez, tiene que estar cerca de la palabra o frase c. SQL-Server mide la distancia entre la palabra o frase izquierda y derecha. Un valor de distancia bajo (por ejemplo, 0) indica una distancia grande entre las dos. Si las palabras o frases especificadas estn lejos unas de las otras, satisfacen la condicin de la consulta; sin embargo, la consulta tiene un valor de distancia muy bajo (0). Sin embargo, si <condicinBsqueda> slo consta de uno o varios trminos de proximidad NEAR, SQL-Server no devuelve filas con un valor de distancia de 0. <trminoSimple> Especifica la coincidencia con una palabra exacta (uno o varios caracteres sin espacios o signos de puntuacin en idiomas con caracteres de un solo byte) o una frase (una o varias palabras consecutivas separadas por espacios y signos de puntuacin opcionales en idiomas con caracteres de un solo byte). Ejemplos de trminos simples vlidos son "blue berry", blueberry y "Microsoft SQL Server". Las frases tienen que ir entre comillas dobles (""). Las palabras de una frase tienen que aparecer en la columna de la base de datos en el mismo orden que el especificado en <condicinBsqueda>. La bsqueda de caracteres en la palabra o la frase distingue entre maysculas y minsculas. Las palabras de una sola slaba (como un, y, la) de las columnas de texto indizadas no se almacenan en los ndices de los textos. Si nicamente se utiliza una de estas palabras en una bsqueda, SQL-Server devuelve un
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Argumento Descripcin mensaje de error indicando que en la consulta slo hay monoslabos. SQL-Server incluye una lista estndar de palabras monoslabas en el directorio \Mssql7\Ftdata\Sqlserver\Config. Los signos de puntuacin se omiten. Por lo tanto, el valor "Dnde est mi equipo?" satisface la condicin CONTAINS(testing, "fallo del equipo") El fallo de la bsqueda sera grave. n Es un marcador de posicin que indica que se pueden especificar varias condiciones y trminos de bsqueda.
87
Observaciones
CONTAINS no se reconoce como palabra clave si el nivel de compatibilidad es menor de 70. Para obtener ms informacin, consulte sp_dbcmptlevel. La tabla devuelta por la funcin CONTAINSTABLE tiene una columna llamada KEY que contiene valores de claves de texto. Todas las tablas con textos indizados tienen una columna cuyos valores se garantizan que son nicos y los valores devueltos en la columna KEY son los valores de claves de textos de las filas que satisfacen los criterios de seleccin especificados en la condicin de bsqueda. La propiedad TableFulltextKeyColumn, obtenida mediante la funcin OBJECTPROPERTY, proporciona la identidad de esta columna de clave nica. Para obtener las filas de la tabla original que desee, especifique una combinacin con las filas de CONTAINSTABLE. La forma tpica de la clusula FROM de una instruccin SELECT que utilice CONTAINSTABLE es:
SELECT select_list FROM table AS FT_TBL INNER JOIN CONTAINSTABLE(table, column, contains_search_condition) AS KEY_TBL ON FT_TBL.unique_key_column = KEY_TBL.[KEY]
La tabla que produce CONTAINSTABLE incluye una columna llamada RANK. La columna RANK es un valor (entre 0 y 1000) que para cada fila indica lo bien que cada una de ellas satisface los criterios de seleccin. Este valor de distancia se suele utilizar en las instrucciones SELECT de una de estas maneras: En la clusula ORDER BY, para devolver las filas de mayor valor al principio. En la lista de seleccin, para ver el valor de distancia asignado a cada fila. En la clusula WHERE, para filtrar las filas con valores de distancia bajos.
CONTAINSTABLE no se reconoce como palabra clave si el nivel de compatibilidad es menor de 70. Para obtener ms informacin, consulte sp_dbcmptlevel.
Ejemplos
A. Devolver valores de distancia mediante CONTAINSTABLE Este ejemplo busca todos los nombres de productos que contengan las palabras "breads", "fish" o "beers", y los distintos pesos asignados a cada palabra. Por cada fila devuelta que cumpla los criterios de la bsqueda, se muestra la precisin relativa (valor de distancia) de la coincidencia. Adems, las filas de mayor valor de distancia se devuelven primero.
USE Northwind GO SELECT FT_TBL.CategoryName, FT_TBL.Description, KEY_TBL.RANK FROM Categories AS FT_TBL INNER JOIN CONTAINSTABLE(Categories, Description,
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares 'ISABOUT (breads weight (.8), fish weight (.4), beers weight (.2) )' ) AS KEY_TBL ON FT_TBL.CategoryID = KEY_TBL.[KEY] ORDER BY KEY_TBL.RANK DESC GO
88
B. Devolver valores de distancia mayores que uno especificado mediante CONTAINSTABLE Este ejemplo devuelve la descripcin y el nombre de la categora de todas las categoras de alimentos en las que la columna Description contenga las palabras "sweet" y "savory" cerca de la palabra "sauces" o de la palabra "candies". Todas las filas cuya categora sea "Seafood" no se devuelven. Slo se devuelven las filas cuyo grado de coincidencia sea igual o superior a 2.
USE Northwind GO SELECT FT_TBL.Description, FT_TBL.CategoryName, KEY_TBL.RANK FROM Categories AS FT_TBL INNER JOIN CONTAINSTABLE (Categories, Description, '("sweet and savory" NEAR sauces) OR ("sweet and savory" NEAR candies)' ) AS KEY_TBL ON FT_TBL.CategoryID = KEY_TBL.[KEY] WHERE KEY_TBL.RANK > 2 AND FT_TBL.CategoryName <> 'Seafood' ORDER BY KEY_TBL.RANK DESC
C. Utilizar CONTAINS con <trminoSimple> Este ejemplo busca todos los productos cuyo precio sea $15,00 que contengan la palabra "bottles".
USE Northwind GO SELECT ProductName FROM Products WHERE UnitPrice = 15.00 AND CONTAINS(QuantityPerUnit, 'bottles') GO
D. Utilizar CONTAINS y una frase en <trminoSimple> Este ejemplo devuelve todos los productos que contengan la frase "sasquatch ale" o "steeleye stout".
USE Northwind GO SELECT ProductName FROM Products WHERE CONTAINS(ProductName, ' "Sasquatch ale" OR "steeleye stout" ') GO
E. Utilizar CONTAINS con <trminoPrefijo> Este ejemplo devuelve todos los nombres de productos que tengan al menos una palabra que empiece por el prefijo "choc" en la columna ProductName.
USE Northwind GO
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT ProductName FROM Products WHERE CONTAINS(ProductName, ' "choc*" ') GO
89
F. Utilizar CONTAINS y OR con <trminoPrefijo> Este ejemplo devuelve todas las descripciones de categoras que contengan las cadenas "sea" o "bread".
USE Northwind SELECT CategoryName FROM Categories WHERE CONTAINS(Description, '"sea*" OR "bread*"') GO
G. Utilizar CONTAINS con <trminoProximidad> Este ejemplo devuelve todos los nombres de los productos que tengan la palabra "Boysenberry" cerca de la palabra "spread".
USE Northwind GO SELECT ProductName FROM Products WHERE CONTAINS(ProductName, 'spread NEAR Boysenberry') GO
H. Utilizar CONTAINS con <trminoGeneracin> Este ejemplo busca todos los productos que tengan palabras derivadas de "dry": "dried", "drying", etc.
USE Northwind GO SELECT ProductName FROM Products WHERE CONTAINS(ProductName, ' FORMSOF (INFLECTIONAL, dry) ') GO
I. Utilizar CONTAINS con <trminoPeso> Este ejemplo busca todos los nombres de productos que contengan las palabras "spread", "sauces" o "relishes", y los distintos pesos asignados a cada palabra.
USE Northwind GO SELECT CategoryName, Description FROM Categories WHERE CONTAINS(Description, 'ISABOUT (spread weight (.8), sauces weight (.4), relishes weight (.2) )' ) GO
4.15.6. FREETEXTTABLE
Devuelve una tabla de cero, una o varias filas cuyas columnas contienen datos de tipo carcter cuyos valores coinciden con el significado, no literalmente, con el texto especificado en cadenaTexto. Se puede hacer referencia a FREETEXTTABLE en las clusula FROM de las instrucciones SELECT como a otro nombre de tabla normal.
90
Las consultas que utilizan FREETEXTTABLE especifican consultas de texto que devuelven el valor de coincidencia (RANK) de cada fila.
Sintaxis
FREETEXTTABLE (tabla, {columna | *}, 'cadenaTexto')
Argumentos
tabla Es el nombre de la tabla que se ha marcado para bsquedas de texto. tabla puede ser el nombre de un objeto de una base de datos de una sola parte o el nombre de un objeto de una base de datos con varias partes. Es el nombre de la columna de tabla en la que se va a buscar. Las columnas cuyos datos sean del tipo de cadena de caracteres son columnas vlidas para buscar texto. Especifica que todas las columnas que hayan sido registradas para la bsqueda de texto se tienen que utilizar para buscar la cadenaTexto dada. Es el texto que se va a buscar en la columna especificada. No se pueden utilizar variables.
columna
cadenaTexto
Observaciones
FREETEXTTABLE utiliza las mismas condiciones de bsqueda que el predicado FREETEXT. Al igual que en CONTAINSTABLE, la tabla devuelta tiene columnas llamadas KEY y RANK, a las que se hace referencia en la consulta para obtener las filas apropiadas y utilizar los valores de distancia. FREETEXTTABLE no se reconoce como palabra clave si el nivel de compatibilidad es menor que 70. Para obtener ms informacin, consulte sp_dbcmptlevel.
Ejemplos
En este ejemplo se devuelve el nombre y la descripcin de todas las categoras relacionadas con sweet, candy, bread, dry y meat.
USE Northwind SELECT FT_TBL.CategoryName, FT_TBL.Description, KEY_TBL.RANK FROM Categories AS FT_TBL INNER JOIN FREETEXTTABLE(Categories, Description, 'sweetest candy bread and dry meat') AS KEY_TBL ON FT_TBL.CategoryID = KEY_TBL.[KEY] GO
4.15.7. Utilizar el predicado CONTAINS

Puede usar el predicado CONTAINS para buscar una determinada frase en una base de datos. Por supuesto, dicha consulta puede escribirse con el predicado LIKE. Sin embargo, algunas formas de CONTAINS proporcionan mayor variedad de consultas de texto que la que se puede obtener con LIKE.
91
Adems, al contrario que cuando se utiliza el predicado LIKE, una bsqueda con CONTAINS no distingue entre maysculas y minsculas.
Nota. Las consultas de bsqueda de texto se comportan de forma que no distinguen entre maysculas y minsculas en aquellos idiomas (mayoritariamente los latinos) en los que tiene sentido distinguir entre maysculas y minsculas. Sin embargo, en japons, hay muchas ortografas fonticas en las que el concepto de normalizacin ortogrfica implica no distinguir las maysculas de las minsculas (por ejemplo, las letras kana no tienen maysculas y minsculas). Este tipo de normalizacin ortogrfica no se admite.
Suponga que desea buscar en la base de datos Northwind la frase "bean curd". Si usa el predicado CONTAINS, sta es una consulta bastante fcil.
USE Northwind USE Northwind GO SELECT Description FROM Categories WHERE Description LIKE '%bean curd%' GO
O, con CONTAINS:
USE Northwind GO SELECT Description FROM Categories WHERE CONTAINS(Description, ' "bean curd" ') GO
El predicado CONTAINS usa una notacin funcional en la que el primer parmetro es el nombre de la columna que se est buscando y el segundo parmetro es una condicin de bsqueda de texto. La condicin de bsqueda, en este caso "bean curd", puede ser bastante compleja y est formada por uno o ms elementos, que se describen posteriormente. El predicado CONTAINS admite una sintaxis compleja para buscar en las columnas basadas en caracteres: Una o ms palabras y frases especficas (trminos simples). Una palabra est compuesta por uno o ms caracteres sin espacios ni signos de puntuacin. Una frase vlida consta de varias palabras con espacios y con o sin signos de puntuacin entre ellas. Por ejemplo, croissant es una palabra y caf au lait es una frase. Las palabras y frases como stas se llaman trminos simples. Forma no flexionada de una palabra determinada (trmino de generacin). Por ejemplo, buscar la forma no flexionada de la palabra "conducir". Si hay varias filas en la tabla que incluyen las palabras "conducir", "conduce", "condujo", "conduciendo" y "conducido", todas estaran en el conjunto de resultados porque cada una de estas palabras se puede generar de forma inflexiva a partir de la palabra "conducir". Una palabra o frase en la que las palabras empiezan con un texto determinado (trmino prefijo). En el caso de una frase, cada palabra de la frase se considera un prefijo. Por ejemplo, el trmino "tran* auto" coincide con "transmisin automtica" y "transductor de automvil". Palabras o frases que usan valores ponderados (trmino ponderado). Por ejemplo, podra desear encontrar una palabra que tuviera un peso designado superior a otra palabra. Devuelve resultados de consulta clasificados. Una palabra o frase que est cerca de otra palabra o frase (trmino de proximidad). Por ejemplo, podra desear encontrar las filas en las que la palabra "hielo" aparece cerca de la palabra "hockey" o en las que la frase "patinaje sobre hielo" se encuentra prxima a la frase "hockey sobre hielo".
92
Un predicado CONTAINS puede combinar varios de estos trminos si usa AND y OR, por ejemplo, podra buscar todas las filas con "leche" y "caf al estilo de Toledo" en la misma columna de base datos habilitada para texto . Adems, los trminos se pueden negar con el uso de AND NOT, por ejemplo, "pastel AND NOT queso de untar". Cuando use CONTAINS, recuerde que SQL-Server rechaza las palabras vacas de los criterios de bsqueda. Las palabras irrelevantes son aquellas como "un", "y", "es" o "el", que aparecen con frecuencia pero que, en realidad, no ayudan en la bsqueda de un texto determinado.
4.15.8. Utilizar el predicado FREETEXT

Con un predicado FREETEXT, puede escribir cualquier conjunto de palabras o frases, e incluso una frase completa. El motor de consultas de texto examina este texto, identifica todas las palabras y frases de nombres significativas y construye internamente una consulta con esos trminos. En este ejemplo se usa un predicado FREETEXT en una columna llamada description. FREETEXT (description, ' "The Fulton County Grand Jury said Friday an investigation of Atlanta's recent primary election produced no evidence that any irregularities took place." ') El motor de bsqueda identifica palabras y frases nominales tales como las siguientes:
Palabras:
Fulton, county, grand, jury, Friday, investigation, Atlanta, recent, primary, election, produce, evidence, irregularities
Frases:
Fulton county grand jury, primary election, grand jury, Atlanta's recent primary election Las palabras y frases de la cadena FREETEXT (y sus variaciones generadas de forma inflexiva) se combinan internamente en una consulta, ponderada para clasificarla adecuadamente y, a continuacin, se realiza la bsqueda real.
4.15.9. Funciones de conjunto de filas CONTAINSTABLE y FREETEXTTABLE

Las funciones CONTAINSTABLE y FREETEXTTABLE se usan para especificar las consultas de texto que devuelve la clasificacin por porcentaje de aciertos de cada fila. Estas funciones son muy similares a los predicados de texto CONTAINS y FREETEXT, pero se utilizan de forma diferente.
Los predicados de texto de las funciones

Aunque tanto los predicados de texto como las funciones de conjunto de filas de texto se usan para las consultas de texto y la instruccin Transact-SQL usada para especificar la condicin de bsqueda de texto es la misma en los predicados y en las funciones, hay importantes diferencias en la forma en la que stas se usan: CONTAINS y FREETEXT devuelven ambos el valor TRUE o FALSE, con lo que normalmente se especifican en la clusula WHERE de una instruccin SELECT. CONTAINSTABLE y FREETEXTTABLE devuelven ambas una tabla de cero, una o ms filas, con lo que deben especificarse siempre en la clusula FROM. CONTAINS y FREETEXT slo se pueden usar para especificar los criterios de seleccin, que usa SQL-Server para determinar la pertenencia al conjunto de resultados. CONTAINSTABLE y FREETEXTTABLE se usan tambin para especificar los criterios de seleccin. La tabla devuelta tiene una columna llamada KEY que contiene valores de claves de texto. Cada tabla de texto registrada tiene una columna cuyos valores se garantizan como nicos.
93
Los valores devueltos en la columna KEY de CONTAINSTABLE o FREETEXTTABLE son los valores nicos, procedentes de la tabla de texto registrada, de las filas que coinciden con los criterios de seleccin en la condicin de bsqueda de texto. Adems, la tabla que producen CONTAINSTABLE y FREETEXTTABLE tiene una columna denominada RANK, que contiene valores de 0 a 1000. Estos valores se utilizan para ordenar las filas devueltas de acuerdo al nivel de coincidencia con los criterios de seleccin. Las consultas que usan las funciones CONTAINSTABLE y FREETEXTTABLE son ms complejas que las que usan los predicados CONTAINS y FREETEXT porque las filas que cumplen los criterios y que son devueltas por las funciones deben ser combinadas explcitamente con las filas de la tabla original de SQL-Server. Este ejemplo devuelve la descripcin y el nombre de categora de todas las categoras de alimentos en las que la columna Description contenga las palabras "sweet and savory" cerca de la palabra "sauces" o de la palabra "candies". Todas las filas cuyo nombre de categora sea "Seafood" no se devuelven. Slo se devuelven las filas cuyo valor de distancia sea igual o superior a 2.
USE Northwind GO SELECT FT_TBL.Description, FT_TBL.CategoryName, KEY_TBL.RANK FROM Categories AS FT_TBL INNER JOIN CONTAINSTABLE (Categories, Description, '("sweet and savory" NEAR sauces) OR ("sweet and savory" NEAR candies)') AS KEY_TBL ON FT_TBL.CategoryID = KEY_TBL.[KEY] WHERE KEY_TBL.RANK > 2 AND FT_TBL.CategoryName <> 'Seafood' ORDER BY KEY_TBL.RANK DESC
Este ejemplo devuelve la descripcin y el nombre de categora de las 10 categoras superiores de alimentos donde la columna Description contenga las palabras "sweet and savory" cerca de la palabra "sauces" o de la palabra "candies".
SELECT FT_TBL.Description, FT_TBL.CategoryName, KEY_TBL.RANK FROM Categories AS FT_TBL INNER JOIN CONTAINSTABLE (Categories, Description, '("sweet and savory" NEAR sauces) OR ("sweet and savory" NEAR candies)', 10) AS KEY_TBL ON FT_TBL.CategoryID = KEY_TBL.[KEY]
Comparacin entre CONTAINSTABLE y CONTAINS

La funcin CONTAINSTABLE y el predicado CONTAINS utilizan condiciones de bsqueda similares. Sin embargo, en CONTAINSTABLE se especifica la tabla en la que tendr lugar la bsqueda de texto, la columna (o todas las columnas) de la tabla en las que se buscar y la condicin de bsqueda. Un cuarto parmetro, opcional, hace posible que el usuario indique que se devuelva slo el nmero ms alto especificado de coincidencias. Para obtener ms informacin, consulte la seccin Limitar los conjuntos de resultados. CONTAINSTABLE devuelve una tabla que incluye una columna denominada RANK. Esta columna RANK contiene un valor para cada fila que indica el grado de coincidencia de cada fila con los criterios de seleccin. En esta consulta se especifica la utilizacin de CONTAINSTABLE para devolver un valor de clasificacin por cada fila.
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares USE Northwind GO SELECT K.RANK, CompanyName, ContactName, Address FROM Customers AS C INNER JOIN CONTAINSTABLE(Customers,Address, 'ISABOUT ("des*", Rue WEIGHT(0.5), Bouchers WEIGHT(0.9))') AS K ON C.CustomerID = K.[KEY]
94
Comparacin entre FREETEXTTABLE y FREETEXT

En la consulta siguiente se ampla una consulta FREETEXTTABLE para que devuelva primero las filas con clasificacin superior y agregue la clasificacin de cada fila a la lista de seleccin. Para especificar la consulta, debe saber que CategoryID es la columna de clave nica de la tabla Categories.
USE Northwind GO SELECT KEY_TBL.RANK, FT_TBL.Description FROM Categories AS FT_TBL INNER JOIN FREETEXTTABLE(Categories, Description, 'How can I make my own beers and ales?') AS KEY_TBL ON FT_TBL.CategoryID = KEY_TBL.[KEY] ORDER BY KEY_TBL.RANK DESC GO
La nica diferencia en l sintaxis de FREETEXTTABLE y FREETEXT es la insercin del nombre de la tabla como el primer parmetro. Esto es una ampliacin de la misma consulta que slo devuelve las filas con un valor de clasificacin de 10 o superior:
USE Northwind GO SELECT KEY_TBL.RANK, FT_TBL.Description FROM Categories FT_TBL INNER JOIN FREETEXTTABLE (Categories, Description, 'How can I make my own beers and ales?') AS KEY_TBL ON FT_TBL.CategoryID = KEY_TBL.[KEY] WHERE KEY_TBL.RANK >= 10 ORDER BY KEY_TBL.RANK DESC GO
4.15.10. Identificacin del nombre de la columna de la clave nica

Las consultas que usan funciones que toman valores de conjuntos de filas son complicadas porque es necesario saber el nombre de la columna de clave exclusiva. Cada tabla habilitada para texto tiene la propiedad TableFulltextKeyColumn que contiene el nmero de ID de la columna que ha sido seleccionada para tener filas nicas en la tabla. En este ejemplo se muestra cmo se puede obtener el nombre de la columna de clave y usarse en la programacin.
USE Northwind GO DECLARE @key_column sysname SET @key_column = Col_Name(Object_Id('Categories'),
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares ObjectProperty(Object_id('Categories'), 'TableFulltextKeyColumn') ) print @key_column EXECUTE ('SELECT Description, KEY_TBL.RANK FROM Categories FT_TBL INNER JOIN FreetextTable (Categories, Description, ''How can I make my own beers and ales?'') AS KEY_TBL ON FT_TBL.' + @key_column +' = KEY_TBL.[KEY] WHERE KEY_TBL.RANK >= 10 ORDER BY KEY_TBL.RANK DESC ') GO
95
Puede evitar la complejidad de la utilizacin de CONTAINSTABLE y FREETEXTTABLE si escribe procedimientos almacenados que acepten unos cuantos supuestos acerca de la consulta y, a continuacin, creen y ejecuten la consulta adecuada. A continuacin se muestra un procedimiento simplificado que emite una consulta FREETEXTTABLE. La tabla muestra los parmetros del procedimiento (todas las entradas).
Parmetros @additional_predicates @freetext_column @freetext_search @from_table @order_by_list @select_list Opcional Opcional SI SI SI Opcional SI KEY_TBL.RANK puede ser una de las columnas especificadas. KEY_TBL.RANK puede ser una de las columnas especificadas. Condicin de Bsqueda Descripcin Si hay algn predicado adicional, ste se agrega con AND detrs del predicado FREETEXT. KEY_TBL.RANK se puede usar en expresiones.
El cdigo del procedimiento es el siguiente:

CREATE PROCEDURE freetext_rank_proc @select_list nvarchar(1000), @from_table nvarchar(517), @freetext_column sysname, @freetext_search nvarchar(1000), @additional_predicates nvarchar(500) = '', @order_by_list nvarchar(500) = '' AS BEGIN DECLARE @table_id integer, @unique_key_col_name sysname, @add_pred_var nvarchar(510), @order_by_var nvarchar(510) -- Get the name of the unique key column for this table. SET @table_id = Object_Id(@from_table) SET @unique_key_col_name =
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares Col_Name( @table_id, ObjectProperty(@table_id, 'TableFullTextKeyColumn') ) -- If there is an additional_predicate, put AND() around it. IF @additional_predicates <> '' SET @add_pred_var = 'AND (' + @additional_predicates + ')' ELSE SET @add_pred_var = '' -- Insert ORDER BY, if needed. IF @order_by_list <> '' SET @order_by_var = 'ORDER BY ' + @order_by_var ELSE SET @order_by_var = '' -- Execute the SELECT statement. EXECUTE ( 'SELECT ' + @select_list + ' FROM ' + @from_table + ' AS FT_TBL, FreetextTable(' + @from_table + ',' + @freetext_column + ',''' + @freetext_search + ''') AS KEY_TBL ' + 'WHERE FT_TBL.' + @unique_key_col_name + ' = KEY_TBL.[KEY] ' + @add_pred_var +'' + @order_by_var ) END
96
Este procedimiento se puede usar para emitir la consulta:

USE Northwind GO EXECUTE freetext_rank_proc 'Description, KEY_TBL.RANK', -- Select list 'Categories', -- From 'Description', -- Column 'How can I make my own beers and ales?', -- Freetext search 'KEY_TBL.RANK >= 10', -- Additional predicate 'KEY_TBL.RANK DESC' -- Order by GO
Limitar los conjuntos de resultados

En muchas consultas de texto, el nmero de elementos que coinciden con la condicin de bsqueda es muy grande. Para evitar que las consultas devuelvan demasiadas coincidencias, utilice el argumento opcional, top_n_by_rank, en CONTAINSTABLE y FREETEXTTABLE para especificar el nmero de coincidencias, ordenadas, que desea que se devuelvan.
97
Con esta informacin, SQL-Server ordena las coincidencias y devuelve slo hasta completar el nmero especificado. Esta opcin puede aumentar significativamente el rendimiento. Por ejemplo, una consulta que por lo general devolvera 100.000 filas de una tabla de 1 milln se procesar de forma ms rpida si slo se piden las 100 primeras filas. Si slo se desea que se devuelvan las 3 coincidencias mayores del ejemplo anterior, mediante CONTAINSTABLE, la consulta tendr esta forma:
USE Northwind GO SELECT K.RANK, CompanyName, ContactName, Address FROM Customers AS C INNER JOIN CONTAINSTABLE(Customers, Address, 'ISABOUT ("des*", Rue WEIGHT(0.5), Bouchers WEIGHT(0.9))', 3) AS K ON C.CustomerID = K.[KEY]
4.15.11. Buscar palabras o frases con valores ponderados (trmino ponderado)

Puede buscar palabras o frases y especificar un valor ponderado. El peso, un nmero entre 0,0 y 1,0, indica el grado de importancia de cada palabra o frase en un conjunto de palabras y frases. El valor 0,0 es el peso ms pequeo disponible, y el valor 1,0 es el peso ms grande. Por ejemplo, en esta consulta se buscan todas las direcciones de los clientes, con valores ponderados, en los que cualquier texto que comience con la cadena "des" est cerca de Rue o Bouchers. SQL-Server da una clasificacin superior a aquellas filas que contienen la mayor cantidad de palabras especificadas. Por tanto, SQL-Server da una clasificacin superior a una fila que contiene des Rue Bouchers que a una fila que contiene des Rue.
USE Northwind GO SELECT CompanyName, ContactName, Address FROM Customers WHERE CONTAINS(Address, 'ISABOUT ("*des*", Rue WEIGHT(0.5), Bouchers WEIGHT(0.9) )') GO
Un trmino ponderado se puede usar en conjuncin con cualquiera de los otros cuatro tipos de trminos.
4.15.12. Combinar predicados de texto con otros predicados de Transact-SQL

Los predicados CONTAINS y FREETEXT se pueden combinar con el resto de predicados de Transact-SQL, como, por ejemplo, LIKE y BETWEEN; tambin se pueden usar en una subconsulta. En este ejemplo se buscan descripciones cuya categora no sea "Seafood" y que contengan la palabra "sauces" y la palabra "seasonings".
USE Northwind GO SELECT Description FROM Categories WHERE CategoryName <> 'Seafood' AND CONTAINS(Description, ' sauces AND seasonings ') GO
98
En la siguiente consulta se usa CONTAINS dentro de una subconsulta. Con la base de datos pubs, la consulta obtiene el valor del ttulo de todos los libros de la tabla titles del publicador que se encuentra prximo al platillo volante de Moonbeam, Ontario. (Esta informacin acerca del publicador se encuentra en la columna pr_info de la tabla pub_info y slo hay uno de estos publicadores.)
USE pubs GO -- Add some interesting rows to some tables. INSERT INTO publishers VALUES ('9970', 'Penumbra Press', 'Moonbeam', 'ON', 'Canada') INSERT INTO pub_info (pub_id, pr_info) VALUES ('9970', 'Penumbra press is located in the small village of Moonbeam. Moonbeam is well known as the flying saucer capital of Ontario. You will often find one or more flying saucers docked close to the tourist information centre on the north side of highway 11.') INSERT INTO titles VALUES ('FP0001', 'Games of the World', 'crafts', '9970', 9.85, 0.00, 20, 213, 'A crafts book! A sports book! A history book! The fun and excitement of a world at play beautifully described and lavishly illustrated', '1977/09/15') GO -- Given the full-text catalog for these tables is pubs_ft_ctlg, -- repopulate it so new rows are included in the full-text indexes. sp_fulltext_catalog 'pubs_ft_ctlg', 'start_full' WAITFOR DELAY '00:00:30' -- Wait 30 seconds for population. GO -- Issue the query. SELECT T.title, P.pub_name FROM publishers P, titles T WHERE P.pub_id = T.pub_id AND P.pub_id = (SELECT pub_id FROM pub_info WHERE CONTAINS (pr_info, ' moonbeam AND ontario AND "flying saucer" ')) GO
4.15.13. Utilizar predicados de texto para consultar columnas de tipo IMAGE

Los predicados CONTAINS y FREETEXT pueden utilizarse para buscar columnas IMAGE indizadas. En una sola columna IMAGE es posible almacenar muchos tipos de documentos. SQL-Server admite ciertos tipos de documento y proporciona filtros para los mismos. Esta versin proporciona filtros para documentos de MS-Office, archivos de texto y archivos HTML. Cuando una columna IMAGE participa en un ndice de texto, el servicio de texto comprueba las extensiones de los documentos de la columna IMAGE y aplica el filtro correspondiente, para interpretar los datos binarios y extraer la informacin de texto necesaria para la indizacin y la consulta. As, cuando configure la indizacin de texto sobre una columna IMAGE de una tabla, deber crear una columna separada para que contenga la informacin relativa al documento. Esta columna de tipo debe ser de cualquier tipo de datos basado en caracteres y contendr la extensin del archivo, como por ejemplo DOC para los documentos de MS-Word. Si el tipo de columna es NULL, el servicio de texto asumir que el documento es un archivo de texto.
99
En el Asistente para indizacin de texto, si selecciona una columna IMAGE para la indizacin, deber especificar tambin una Columna de enlace para que contenga el tipo de documento. El procedimiento almacenado sp_fulltext_column acepta tambin un argumento para la columna que contendr los tipos de documento. El procedimiento almacenado sp_help_fulltext_columns devuelve tambin el nombre de columna y el Id. de columna de la columna de tipo de documento.
Una vez indizada, podr consultar la columna IMAGE como lo hara con cualquier otra columna de la tabla, mediante los predicados CONTAINS y FREETEXT.
4.16. MS-Access: Bases externas

Para el acceso a bases de datos externas se utiliza la clusula IN. Se puede acceder a bases de datos dBase, Paradox o Btrieve. Esta clusula slo permite la conexin de una base de datos externa a la vez. Una base de datos externa es una base de datos que no sea la activa. Aunque para mejorar los rendimientos es mejor adjuntarlas a la base de datos actual y trabajar con ellas. Para especificar una base de datos que no pertenece a Access Basic, se agrega un punto y coma (;) al nombre y se encierra entre comillas simples. Tambin puede utilizar la palabra reservada DATABASE para especificar la base de datos externa. Por ejemplo, las lneas siguientes especifican la misma tabla:
FROM Tabla IN '[dBASE IV; DATABASE=C: \DBASE\DATOS\VENTAS;]'; FROM Tabla IN 'C: \DBASE\DATOS\VENTAS' 'dBASE IV;'
Acceso a una base de datos externa de MS-Access:

SELECT IdCliente FROM Clientes IN 'C:\MISDATOS.MDB' WHERE IDCliente Like 'A*'
(En donde MISDATOS.MDB es el nombre de una base de datos de MS-Access que contiene la tabla Clientes.) Acceso a una base de datos externa de dBASE III o IV:
SELECT IdCliente FROM Clientes IN 'C:\DBASE\DATOS\VENTAS' 'dBASE IV'; WHERE IDCliente Like 'A*'
(Para recuperar datos de una tabla de dBASE III+ hay que utilizar 'dBASE III+;' en lugar de 'dBASE IV;'.) Acceso a una base de datos de Paradox 3.x o 4.x:
SELECT IdCliente FROM Clientes IN 'C:\PARADOX\DATOS\VENTAS' 'Paradox 4.x;'
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares WHERE IDCliente Like 'A*'
100
(Para recuperar datos de una tabla de Paradox versin 3.x, hay que sustituir 'Paradox 4.x;' por 'Paradox 3.x;'.) Acceso a una base de datos de Btrieve:
SELECT IdCliente FROM Clientes IN 'C:\BTRIEVE\DATOS\VENTAS\FILE.DDF' 'Btrieve;' WHERE IDCliente Like 'A*'
(C:\BTRIEVE\DATOS\VENTAS\FILE.DDF es la ruta de acceso y nombre de archivo del archivo de definicin de datos de Btrieve.)
4.17. MS-Access: Parmetros

Las consultas con parmetros son aquellas cuyas condiciones de bsqueda se definen mediante parmetros. Si se ejecutan directamente desde la base de datos donde han sido definidas aparecer un mensaje solicitando el valor de cada uno de los parmetros. Si deseamos ejecutarlas desde una aplicacin hay que asignar primero el valor de los parmetros y despus ejecutarlas. Su sintaxis es la siguiente:
PARAMETERS nombre1 tipo1, nombre2 tipo2, ... , nombreN tipoN Consulta
En donde:
nombre tipo consulta Es el nombre del parmetro Es el tipo de datos del parmetro Una consulta SQL
Se pueden utilizar nombres pero no tipos de datos en una clusula WHERE o HAVING.
PARAMETERS PrecioMinimo Currency, FechaInicio DateTime; SELECT IdPedido, Cantidad FROM Pedidos WHERE Precio = PrecioMinimo AND FechaPedido = FechaInicio
4.18. MS-Access: Omitir permisos

En entornos de bases de datos con permisos de seguridad para grupos de trabajo se puede utilizar la clusula WITH OWNERACCESS OPTION para que el usuario actual adquiera los derechos de propietario a la hora de ejecutar la consulta. Su sintaxis es:
instruccin sql WITH OWNERACCESS OPTION
Lenguaje SQL SQL y bases de datos relacionales Claudio Casares SELECT Apellido, Nombre, Salario FROM Empleados ORDER BY Apellido WITH OWNERACCESS OPTION
101
Esta opcin requiere que est declarado el acceso al fichero de grupo de trabajo (generalmente system.mda system .mdw) de la base de datos actual.
4.19. MS-Access: Clusula PROCEDURE

Esta clusula es poco usual y se utiliza para crear una consulta a la misma vez que se ejecuta, opcionalmente define los parmetros de la misma. Su sintaxis es la siguiente:
PROCEDURE NombreConsulta Parmetro1 tipo1, .... , ParmetroN tipon ConsultaSQL
En donde:
NombreConsulta Parmetro tipo ConsultaSQL Es el nombre con se guardar la consulta en la base de datos. Es el nombre de parmetro o de los parmetros de dicha consulta. Es el tipo de datos del parmetro Es la consulta que se desea grabar y ejecutar.
PROCEDURE ListaCategorias; SELECT DISTINCTROW NombreCategoria, IdCategoria FROM Categorias ORDER BY NombreCategoria
(Asigna el nombre Lista_de_categoras a la consulta y la ejecuta.)

PROCEDURE Resumen FechaInicio DATETIME, FechaFinal DATETIME; SELECT DISTINCTROW FechaEnvio, IdPedido, ImportePedido, Format(FechaEnvio, "yyyy") AS Ao FROM Pedidos WHERE FechaEnvio Between FechaInicio And FechaFinal
(Asigna el nombre Resumen a la consulta e incluye dos parmetros.)
102
4.20. Optimizar Sentencias

Introduccin
El lenguaje SQL es no procedimental, es decir, en las sentencias se indica que queremos conseguir y no como lo tiene que hacer el interprete para conseguirlo. Esto es pura teora, pues en la prctica a todos los gestores de SQL hay que especificar sus propios truquitos para optimizar el rendimiento. Por tanto, muchas veces no basta con especificar una sentencia SQL correcta, sino que adems, hay que indicarle como tiene que hacerlo si queremos que el tiempo de respuesta sea el mnimo. En este apartado veremos como mejorar el tiempo de respuesta de nuestro interprete ante unas determinadas situaciones:
Diseo de las tablas

Normaliza las tablas, al menos hasta la tercera forma normal, para asegurar que no hay duplicidad de datos y se aprovecha al mximo el almacenamiento en las tablas. Si hay que desnormalizar alguna tabla piensa en la ocupacin y en el rendimiento antes de proceder. Los primeros campos de cada tabla deben ser aquellos campos requeridos y dentro de los requeridos primero se definen los de longitud fija y despus los de longitud variable. Ajusta al mximo el tamao de los campos para no desperdiciar espacio. Es muy habitual dejar un campo de texto para observaciones en las tablas. Si este campo se va a utilizar con poca frecuencia o si se ha definido con gran tamao, por si acaso, es mejor crear una nueva tabla que contenga la clave primaria de la primera y el campo para observaciones.
Gestin y eleccin de los ndices

Los ndices son campos elegidos arbitrariamente por el constructor de la base de datos que permiten la bsqueda a partir de dicho campo a una velocidad notablemente superior. Sin embargo, esta ventaja se ve contrarrestada por el hecho de ocupar mucha ms memoria (el doble ms o menos) y de requerir para su insercin y actualizacin un tiempo de proceso superior. Evidentemente, no podemos indexar todos los campos de una tabla extensa ya que doblamos el tamao de la base de datos. Igualmente, tampoco sirve de mucho el indexar todos los campos en una tabla pequea ya que las selecciones pueden efectuarse rpidamente de todos modos. Un caso en el que los ndices pueden resultar muy tiles es cuando realizamos peticiones simultneas sobre varias tablas. En este caso, el proceso de seleccin puede acelerarse sensiblemente si indexamos los campos que sirven de nexo entre las dos tablas. Los ndices pueden resultar contraproducentes si los introducimos sobre campos triviales a partir de los cuales no se realiza ningn tipo de peticin ya que, adems del problema de memoria ya mencionado, estamos ralentizando otras tareas de la base de datos como son la edicin, insercin y borrado. Es por ello que vale la pena pensrselo dos veces antes de indexar un campo que no sirve de criterio para bsquedas o que es usado con muy poca frecuencia por razones de mantenimiento.
Campos a Seleccionar
En la medida de lo posible hay que evitar que las sentencias SQL estn embebidas dentro del cdigo de la aplicacin. Es mucho ms eficaz usar vistas o procedimientos almacenados por que el gestor los guarda compilados. Si se trata de una sentencia embebida el gestor debe compilarla antes de ejecutarla. Seleccionar exclusivamente aquellos que se necesiten
103
No utilizar nunca SELECT * por que el gestor debe leer primero la estructura de la tabla antes de ejecutar la sentencia Si utilizas varias tablas en la consulta especifica siempre a que tabla pertenece cada campo, le ahorras al gestor el tiempo de localizar a que tabla pertenece el campo. En lugar de SELECT Nombre, Factura FROM Clientes, Facturacion WHERE IdCliente = IdClienteFacturado, usa: SELECT Clientes.Nombre, Facturacion.Factura WHERE Clientes.IdCliente = Facturacion.IdClienteFacturado.
Campos de Filtro
Se procurar elegir en la clusula WHERE aquellos campos que formen parte de la clave del fichero por el cual interrogamos. Adems se especificarn en el mismo orden en el que estn definidos en la clave. Interrogar siempre por campos que sean clave. Si deseamos interrogar por campos pertenecientes a ndices compuestos es mejor utilizar todos los campos de todos los ndices. Supongamos que tenemos un ndice formado por el campo NOMBRE y el campo APELLIDO y otro ndice formado por el campo EDAD. La sentencia WHERE NOMBRE='Juan' AND APELLIDO Like '%' AND EDAD = 20 sera ms optima que WHERE NOMBRE = 'Juan' AND EDAD = 20 por que el gestor, en este segundo caso, no puede usar el primer ndice y ambas sentencias son equivalentes por que la condicin APELLIDO Like '%' devolvera todos los registros.
Orden de las Tablas

Cuando se utilizan varias tablas dentro de la consulta hay que tener cuidado con el orden empleado en la clausula FROM. Si deseamos saber cuantos alumnos se matricularon en el ao 1996 y escribimos: FROM Alumnos, Matriculas WHERE Alumno.IdAlumno = Matriculas.IdAlumno AND Matriculas.Ao = 1996 el gestor recorrer todos los alumnos para buscar sus matriculas y devolver las correspondientes. Si escribimos FROM Matriculas, Alumnos WHERE Matriculas.Ao = 1996 AND Matriculas.IdAlumno = Alumnos.IdAlumnos, el gestor filtra las matrculas y despus selecciona los alumnos, de esta forma tiene que recorrer menos registros.
104
5. APNDICES
5.1. Las 12 reglas de Codd que determinan la fidelidad de un sistema relacional al modelo relacional
En la dcada de los 80 comenzaron a aparecer numerosos SGBD que se anunciaban como "relacionales". Sin embargo estos sistemas carecan de muchas caractersticas que se consideran importantes en un sistema relacional, perdiendo muchas ventajas del modelo relacional. Como ejemplo extremo de esto "sistemas relacionales" eran simplemente sistemas que utilizaban tablas para almacenar la informacin, no disponiendo de elementos como claves primarias, etc. En 1984 Codd public 12 reglas que un verdadero sistema relacional debera de cumplir. En la prctica algunas de ellas son difciles de realizar. Un sistema podr considerarse "ms relacional" cuanto ms siga estas reglas.
Regla 0
Para que un sistema se denomine sistema de gestin de bases de datos relacionales, este sistema debe usar (exclusivamente) sus capacidades relacionales para gestionar la base de datos.
Regla 1: Regla de la informacin

Toda la informacin en una base de datos relacional se representa explcitamente en el nivel lgico exactamente de una manera: con valores en tablas. Por tanto los metadatos (diccionario, catlogo) se representan exactamente igual que los datos de usuario. Y puede usarse el mismo lenguaje (ej. SQL) para acceder a los datos y a los metadatos (regla 4) Un valor posible es el valor nulo, con sus dos interpretaciones: Valor desconocido (ej. direccin desconocida) Valor no aplicable (ej. empleado soltero no tiene esposa).
Regla 2: Regla del acceso garantizado

Para todos y cada uno de los datos (valores atmicos) de una BDR se garantiza que son accesibles a nivel lgico utilizando una combinacin de nombre de tabla, valor de clave primaria y nombre de columna.

Cualquier dato almacenado en una BDR tiene que poder ser direccionado unvocamente. Para ello hay que indicar en qu tabla est, cul es la columna y cul es la fila (mediante la clave primaria). Por tanto se necesita el concepto de clave primaria, que no es soportado en muchas implementaciones. En estos casos, para lograr un efecto similar se puede hacer lo siguiente:

Hacer que los atributos clave primaria no puedan ser nulos (NOT NULL). Crear un ndice nico sobre la clave primaria. No eliminar nunca el ndice.
APNDICES SQL y bases de datos relacionales Claudio Casares
105
Regla 3: Tratamiento sistemtico de valores nulos

Los valores nulos (que son distintos de la cadena vaca, blancos, 0, ...) se soportan en los SGBD totalmente relacionales para representar informacin desconocida o no aplicable de manera sistemtica, independientemente del tipo de datos.

Se reconoce la necesidad de la existencia de valores nulos, para un tratamiento sistemtico de los mismos. Hay problemas para soportar los valores nulos en las operaciones relacionales, especialmente en las operaciones lgicas. o Lgica trivaluada. Es una posible solucin. Existen tres (no dos) valores de verdad: Verdadero, Falso y Desconocido (null). Se crean tablas de verdad para las operaciones lgicas: - null Y null = null - verdadero Y null = null - falso Y null = falso - verdadero O null = verdadero - etc. Un inconveniente es que de cara al usuario el manejo de los lenguajes relacionales se complica pues es ms difcil de entender.
id 1 2 3 4 5 6 7 8 9 a null null null false false false true true true b null false true null false true null false true a and b null false null false false false null false true a or b null null true null false true true true true a xor b null null null null false true null true false not a null null null true true true false false false not b null true false null true false null true false
Regla 4: Catlogo dinmico en lnea basado en el modelo relacional

La descripcin de la base de datos se representa a nivel lgico de la misma manera que los datos normales, de modo que los usuarios autorizados pueden aplicar el mismo lenguaje relacional a su consulta, igual que lo aplican a los datos normales.
Es una consecuencia de la regla 1 que se destaca por su importancia. Los metadatos se almacenan usando el modelo relacional, con todas las consecuencias.
Regla 5: Regla del sublenguaje de datos completo

Un sistema relacional debe soportar varios lenguajes y varios modos de uso de terminal (ej: rellenar formularios, etc.). Sin embargo, debe existir al menos un lenguaje cuyas sentencias sean expresables, mediante una sintaxis bien definida, como cadenas de caracteres y que sea completo, soportando:

Definicin de datos Definicin de vistas Manipulacin de datos (interactiva y por programa)
106
Limitantes de integridad Limitantes de transaccin (iniciar, realizar, deshacer) ( Begin, Commit, Rollback). Adems de poder tener interfaces ms amigables para hacer consultas, etc. siempre debe de haber una manera de hacerlo todo de manera textual, que es tanto como decir que pueda ser incorporada en un programa tradicional. Un lenguaje que cumple esto en gran medida es SQL.
Regla 6: Regla de actualizacin de vistas

Todas las vistas que son tericamente actualizables se pueden actualizar por el sistema.

El problema es determinar cules son las vistas tericamente actualizables, ya que no est muy claro. Cada sistema puede hacer unas suposiciones particulares sobre las vistas que son actualizables.
Regla 7: Insercin, actualizacin y borrado de alto nivel

La capacidad de manejar una relacin base o derivada como un solo operando se aplica no slo a la recuperacin de los datos (consultas), si no tambin a la insercin, actualizacin y borrado de datos.
Esto es, el lenguaje de manejo de datos tambin debe ser de alto nivel (de conjuntos). Algunas bases de datos inicialmente slo podan modificar las tuplas de la base de datos de una en una (un registro de cada vez).
Regla 8: Independencia fsica de datos

Los programas de aplicacin y actividades del terminal permanecen inalterados a nivel lgico cundo quiera que se realicen cambios en las representaciones de almacenamiento o mtodos de acceso. El modelo relacional es un modelo lgico de datos, y oculta las caractersticas de su representacin fsica.
Regla 9: Independencia lgica de datos

Los programas de aplicacin y actividades del terminal permanecen inalterados a nivel lgico cundo quiera que se realicen cambios a las tablas base que preserven la informacin. Cuando se modifica el esquema lgico preservando informacin (no valdra p. ej. eliminar un atributo) no es necesario modificar nada en niveles superiores. Ejemplos de cambios que preservan la informacin: o o Aadir un atributo a una tabla base. Sustituir dos tablas base por la unin de las mismas. Usando vistas de la unin puedo recrear las tablas anteriores...
Regla 10: Independencia de integridad

Los limitantes de integridad especficos para una determinada base de datos relacional deben poder ser definidos en el sublenguaje de datos relacional, y almacenables en el catlogo, no en los programas de aplicacin. El objetivo de las bases de datos no es slo almacenar los datos, si no tambin sus relaciones y evitar que estas (limitantes) se codifiquen en los programas. Por tanto en una BDR se deben poder definir limitantes de integridad.
107
Cada vez se van ampliando ms los tipos de limitantes de integridad que se pueden utilizar en los SGBDR, aunque hasta hace poco eran muy escasos. Como parte de los limitantes inherentes al modelo relacional (forman parte de su definicin) estn: o o Una BDR tiene integridad de entidad. Es decir, toda tabla debe tener una clave primaria. Una BDR tiene integridad referencial. Es decir, toda clave externa no nula debe existir en la relacin donde es primaria.
Regla 11: Independencia de distribucin

Una BDR tiene independencia de distribucin. Las mismas rdenes y programas se ejecutan igual en una BD centralizada que en una distribuida. Las BDR son fcilmente distribuibles: Se parten las tablas en fragmentos que se distribuyen. Cuando se necesitan las tablas completas se recombinan usando operaciones relacionales con los fragmentos. Sin embargo se complica ms la gestin interna de la integridad, etc. Transparencia de localizacin. El usuario tiene la impresin de que trabaja con una BD local. (aspecto de la regla de independencia fsica) Transparencia de fragmentacin. El usuario no se da cuenta de que la relacin con que trabaja est fragmentada. (aspecto de la regla de independencia lgica de datos). Transparencia de replicacin. El usuario no se da cuenta de que pueden existir copias (rplicas) de una misma relacin en diferentes lugares.
Esta regla es responsable de tres tipos de transparencia de distribucin:
Regla 12: Regla de la no subversin

Si un sistema relacional tiene un lenguaje de bajo nivel (un registro de cada vez), ese bajo nivel no puede ser usado para saltarse (subvertir) las reglas de integridad y los limitantes expresados en los lenguajes relacionales de ms alto nivel (una relacin (conjunto de registros) de cada vez). Algunos problemas no se pueden solucionar directamente con el lenguaje de alto nivel. Normalmente se usa SQL inmerso en un lenguaje anfitrin para solucionar estos problemas. Se utiliza el concepto de cursor para tratar individualmente las tuplas de una relacin. En cualquier caso no debe ser posible saltarse los limitantes de integridad impuestos al tratar las tuplas a ese nivel.

Claudio Casares - Apuntes de SQL

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Claudio Casares - Apuntes de SQL

Cargado por

Copyright:

Formatos disponibles

Apuntes de

y bases de datos relacionales

SQL y bases de datos relacionales Claudio Casares

3.3.1. Interrelaciones uno a uno...............................................................................................26 3.3.2. Interrelaciones uno a varios...........................................................................................27

SQL y bases de datos relacionales Claudio Casares

4.1.1. Breve historia................................................................................................................33 4.1.2. Componentes del SQL...................................................................................................33

SQL y bases de datos relacionales Claudio Casares

Generalidades SQL y bases de datos relacionales Claudio Casares

1.1.1. Cliente / Servidor

1.1.2. Motor Distribuido

1.1.3. Componentes Distribuidos

1.2. Cursores y Bferes

1.2.1. Ubicacin de los cursores

1.2.2. Tipos de cursores

Generalidades SQL y bases de datos relacionales Claudio Casares

Cursores de slo avance

Cursores de conjunto de claves

Cursores de slo lectura

1.2.3. Tipos de bferes

Generalidades SQL y bases de datos relacionales Claudio Casares

Modelo de datos SQL y bases de datos relacionales Claudio Casares

Modelo de datos SQL y bases de datos relacionales Claudio Casares

2.2. Los Usuarios

Modelo de datos SQL y bases de datos relacionales Claudio Casares

2.3. Ciclo de vida de una base de datos

2.3.2. Estudio de viabilidad

2.3.3. Definicin de requisitos

Modelo de datos SQL y bases de datos relacionales Claudio Casares

2.3.6. Evaluacin y Perfeccionamiento

2.4. Criterios de calidad

Modelo de datos SQL y bases de datos relacionales Claudio Casares

Modelo de datos SQL y bases de datos relacionales Claudio Casares

Modelo de datos SQL y bases de datos relacionales Claudio Casares

2.5. Indicadores de calidad

2.6. El modelo lgico

Modelo de datos SQL y bases de datos relacionales Claudio Casares

Modelo de datos SQL y bases de datos relacionales Claudio Casares

2.7. Restricciones de integridad

Los componentes de una restriccin son los siguientes:

En general, se puede decir que existen tres tipos de integridad:

Las restricciones se clasifican en:

Modelo de datos SQL y bases de datos relacionales Claudio Casares

Modelo de datos SQL y bases de datos relacionales Claudio Casares

Modelo Relacional SQL y bases de datos relacionales Claudio Casares

3.1.1. Clave primaria

Modelo Relacional SQL y bases de datos relacionales Claudio Casares

3.1.3. Integridad referencial

3.1.4. lgebra relacional

Modelo Relacional SQL y bases de datos relacionales Claudio Casares

RESTRICT (Personas) sexo='M'

Modelo Relacional SQL y bases de datos relacionales Claudio Casares

3.2. Proceso de normalizacin

Tomando como referencia la tabla siguiente:

Se plantean una serie de problemas:

3.2.1. Definicin de la clave

3.2.2. Primera forma normal (1NF)

Modelo Relacional SQL y bases de datos relacionales Claudio Casares

3.2.3. Segunda forma normal (2NF)

Modelo Relacional SQL y bases de datos relacionales Claudio Casares

3.2.4. Tercera forma normal (3NF)

Estudiemos la dependencia de cada campo con respecto a la clave cdigo:

Modelo Relacional SQL y bases de datos relacionales Claudio Casares

3.2.5. Cuarta forma normal (4NF)

3.2.6. Otras formas normales