Documentos de Académico
Documentos de Profesional
Documentos de Cultura
la Información
n
Unidad II
Tecnologías de la información
administración de bases de datos
MTE. Rafael Colorado
MTI. Carlos Guillermo Ochoa Foglia
Junio 2016
Tecnologías de la información
administración de bases de datos
Contenido
www.iuv.edu.mx 2
Tecnologías de la información
administración de bases de datos
En esta unidad puntualizaremos sobre el análisis y diseño de las bases de datos, así como
la importancia de los Sistemas Manejadores de Bases de Datos. Iniciemos hablando un poco
sobre los antecedentes de éstas.
Ahora bien, una base de datos te permite guardar información relacionada con un tema
específico de manera organizada. Además de guardar datos, también puedes clasificar,
extraer y resumir información relacionada con los datos.
Las bases de datos tradicionales se organizan por campos, registros y archivos. Un campo
es una pieza única de información; un registro es un sistema completo de campos; y un
archivo es una colección de registros. Por ejemplo, una guía de teléfono es análoga a un
www.iuv.edu.mx 3
Tecnologías de la información
administración de bases de datos
archivo. Contiene una lista de registros, cada uno de los cuales consiste en tres campos:
nombre, dirección, y número de teléfono.
Según Date, C.J. “Una base de datos es como una especie de armario electrónico para
archivar, es decir, un depósito o contenedor de una colección de archivos de datos
computarizados.”
Definiciones y conceptos
Dato: Del vocablo latín "datum" que significa hecho. Un dato es la unidad mínima de
información, hechos sin valuar o un valor sin significado.
Hechos, ideas o conceptos que pueden ser reunidos y representados para dar lugar a una
idea específica.
De forma genérica se dice que un dato se puede definir como un hecho aislado y en bruto,
que debe ser procesado por varias operaciones para obtener resultados relacionados con
la evaluación e identificación de personas, eventos y objetos.
www.iuv.edu.mx 4
Tecnologías de la información
administración de bases de datos
www.iuv.edu.mx 5
Tecnologías de la información
administración de bases de datos
Análisis de la información
www.iuv.edu.mx 6
Tecnologías de la información
administración de bases de datos
www.iuv.edu.mx 7
Tecnologías de la información
administración de bases de datos
Las bases de datos pueden clasificarse de varias maneras, de acuerdo al criterio elegido
para su clasificación:
Bases de datos estáticas: son bases de datos de sólo lectura, utilizadas primordialmente
para almacenar datos históricos que posteriormente se pueden utilizar para estudiar el
comportamiento de un conjunto de datos a través del tiempo, para así realizar
proyecciones y tomar decisiones.
Además de la clasificación por la función de las bases de datos, éstas también se pueden
clasificar de acuerdo a su modelo de administración de datos.
www.iuv.edu.mx 8
Tecnologías de la información
administración de bases de datos
Los modelos de datos no son cosas físicas: son abstracciones que permiten la
implementación de un sistema eficiente de base de datos, por lo general se refieren a
algoritmos y conceptos matemáticos.
Éstas son bases de datos que almacenan su información en una estructura jerárquica. En
este modelo los datos se organizan en una forma similar a un árbol, en donde un nodo
padre de información puede tener varios hijos. El nodo que no tiene padres es llamado raíz,
y a los nodos que no tienen hijos se les conoce como hojas.
Ejemplo:
www.iuv.edu.mx 9
Tecnologías de la información
administración de bases de datos
El modelo jerárquico facilita relaciones padre-hijo, es decir, relaciones 1: N (de uno a varios)
del modelo relacional. Pero a diferencia de este último, las relaciones son unidireccionales.
En justicia, dichas relaciones son hijo-padre, pero no padre-hijo. Esto implica que
solamente se pueda consultar la base de datos desde los nodos hoja hacia el nodo raíz. La
consulta en el sentido contrario requiere una búsqueda secuencial por todos los registros
de la base de datos (por ejemplo, para consultar todos los empleados de un departamento).
En las bases de datos jerárquicas no existen índices que faciliten esta tarea.
Las relaciones se establecen mediante punteros entre registros. Es decir, un registro hijo
contiene la dirección física en el medio de almacenamiento de su registro padre. Esto tiene
una ventaja fundamental sobre las bases de datos relacionales: el rendimiento. El acceso
de un registro a otro es prácticamente inmediato sin necesidad de consultar tablas de
correspondencia.
Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que
manejan un gran volumen de información y datos compartidos permitiendo crear
estructuras estables y de gran rendimiento.
www.iuv.edu.mx 10
Tecnologías de la información
administración de bases de datos
Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una solución
eficiente al problema de redundancia de datos; pero, aun así, la dificultad que implica
administrar la información en una base de datos de red ha significado que sea un modelo
utilizado en su mayoría por programadores más que por usuarios finales.
Son bases de datos cuyo único fin es el envío y recepción de datos a grandes velocidades,
estas bases son muy poco comunes y están dirigidas por lo general al entorno de análisis
de calidad, datos de producción e industrial, es importante entender que su fin único es
recolectar y recuperar los datos a la mayor velocidad posible, por lo tanto la redundancia y
duplicación de información no es un problema como sucede con las demás bases de datos,
por lo general para poderlas aprovechar al máximo permiten algún tipo de conectividad a
bases de datos relacionales.
www.iuv.edu.mx 11
Tecnologías de la información
administración de bases de datos
www.iuv.edu.mx 12
Tecnologías de la información
administración de bases de datos
En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a
diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable
ventaja de que es más fácil de entender y de utilizar para un usuario esporádico de la base
de datos. La información puede ser recuperada o almacenada mediante "consultas" que
ofrecen una amplia flexibilidad y poder para administrar la información.
El lenguaje más habitual para construir las consultas a bases de datos relacionales es SQL,
Structured Query Language o Lenguaje Estructurado de Consultas, un estándar
implementado por los principales motores o sistemas de gestión de bases de datos
relacionales.
Durante su diseño, una base de datos relacional pasa por un proceso al que se le conoce
como normalización de una base de datos.
Durante los años '80 (1980-1989) la aparición de dBASE produjo una revolución en los
lenguajes de programación y sistemas de administración de datos. Aunque nunca debe
olvidarse que dBase no utilizaba SQL como lenguaje base para su gestión.
www.iuv.edu.mx 13
Tecnologías de la información
administración de bases de datos
Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creación de
Cubos OLAP. Básicamente no se diferencian demasiado de las bases de datos relacionales
(una tabla en una base de datos relacional podría serlo también en una base de datos
multidimensional), la diferencia está más bien a nivel conceptual; en las bases de datos
multidimensionales los campos o atributos de una tabla pueden ser de dos tipos, o bien
representan dimensiones de la tabla, o bien representan métricas que se desean estudiar.
Este modelo, bastante reciente, y propio de los modelos informáticos orientados a objetos,
trata de almacenar en la base de datos los objetos completos (estado y comportamiento).
Una base de datos orientada a objetos es una base de datos que incorpora todos los
conceptos importantes del paradigma de objetos:
www.iuv.edu.mx 14
Tecnologías de la información
administración de bases de datos
Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a distintos
tipos de objetos.
En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre los
datos como parte de la definición de la base de datos. Una operación (llamada función) se
especifica en dos partes. La interfaz (o signatura) de una operación incluye el nombre de la
operación y los tipos de datos de sus argumentos (o parámetros). La implementación (o
método) de la operación se especifica separadamente y puede modificarse sin afectar la
interfaz. Los programas de aplicación de los usuarios pueden operar sobre los datos
invocando a dichas operaciones a través de sus nombres y argumentos, sea cual sea la
forma en la que se han implementado. Esto podría denominarse independencia entre
programas y operaciones.
SQL: 2003, es el estándar de SQL92 ampliado, soporta los conceptos orientados a objetos y
mantiene la compatibilidad con SQL92.
www.iuv.edu.mx 15
Tecnologías de la información
administración de bases de datos
principalmente en reglas y hechos que son almacenados en la base de datos. También las
bases de datos deductivas son llamadas bases de datos lógicas, a raíz de que se basa en
lógica matemática.
www.iuv.edu.mx 16
Tecnologías de la información
administración de bases de datos
Los sistemas manejadores de bases de datos son importantes porque ofrecen muchos tipos
de procesos de datos, como: simplicidad y generalidad, seguridad, facilidad de uso para el
usuario final, periodos cortos de procesamiento y las consultas de información se
especifican de forma sencilla. Las tablas son un medio para representar la información de
una forma más compacta, organizada y al mismo tiempo se puede acceder a información
contenida en dos o más tablas con relativa facilidad.
Las ventajas anteriores conllevan a satisfacer las necesidades de contar con información
completa, oportuna, confiable, precisa, no redundante para la toma de decisiones
presentes y futuras, orientadas al desarrollo y crecimiento de las empresas e instituciones.
Instalación costosa.
El costo de actualización del hardware y software son elevados.
Personal especializado. El salario de un Administrador de Bases de Datos es elevado.
Implantación larga y difícil.
Falta de rentabilidad a corto plazo.
Escasa estandarización.
Desfase entre teoría y práctica.
Un mal adiestramiento a los usuarios puede provocar problemas a futuro que
conlleve a la pérdida de confianza.
El mal diseño de la BD puede originar problemas a futuro.
www.iuv.edu.mx 17
Tecnologías de la información
administración de bases de datos
El primer paso para crear una base de datos es planificar el tipo de información que se
quiere almacenar en la misma, teniendo en cuenta dos aspectos: la información disponible
y la información que necesitamos. La planificación de la estructura de la base de datos, en
particular de las tablas, es vital para la gestión efectiva de la misma.
El diseño de la estructura de una tabla consiste en una descripción de cada uno de los
campos que componen el registro y los valores o datos que contendrá cada uno de esos
campos.
Los campos son los distintos tipos de datos que componen la tabla, por ejemplo: nombre,
apellido, domicilio. La definición que un campo requiere principalmente es:
Generalmente los diferentes tipos de campos que se pueden almacenar son los siguientes:
Texto (caracteres), Numérico (números), Fecha / Hora, Lógico (informaciones lógicas si/no,
verdadero/falso, etc.), imágenes.
www.iuv.edu.mx 18
Tecnologías de la información
administración de bases de datos
Redundancia
Incremento del trabajo: como un mismo dato está almacenado en dos o más lugares, esto
hace que cuando se graben o actualicen los datos, deban hacerse en todos los lugares a la
vez.
Inconsistencia de datos: esto sucede cuando los datos redundantes no son iguales entre sí.
Esto puede suceder, por ejemplo, cuando se actualiza el dato en un lugar, pero el dato
duplicado en otro lugar no es actualizado.
Si una base de datos está bien diseñada, no debería haber redundancia de datos
(exceptuando la redundancia de datos controlada, que se emplea para mejorar el
rendimiento en las consultas a las bases de datos).
La redundancia conduce a muchos problemas que tienen que ver con la integridad y
consistencia de los datos. La redundancia de los datos requiere múltiples procedimientos
de entrada y actualización.
Dentro de una base de datos relacional la redundancia debe ser mínima y controlada. En
ocasiones existirán motivos válidos de negocios o técnicas para mantener varias copias de
los mismos datos almacenados.
Consistencia
Es la unión y relación adecuada de todos los datos que forman a una base de datos, dichos
datos deben ser coherentes.
www.iuv.edu.mx 19
Tecnologías de la información
administración de bases de datos
Integridad
Otro error en la integridad en una base de datos puede ser la existencia de un valor
numérico (por ejemplo, cliente) en la compra de un producto por parte de un cliente que
no existe en su correspondiente tabla con ese número (integridad referencial).
También puede suceder que se elimine una fila padre con dos o más filas hijos que
quedarían "huérfanas".
www.iuv.edu.mx 20
Tecnologías de la información
administración de bases de datos
Seguridad
Hoy en día se considera a la información de una empresa como uno de los activos más
valiosos e importantes, por lo que la seguridad de la misma es muy importante.
Por otro lado, una base de datos debe cumplir con las siguientes condiciones:
Los datos son compartidos por diferentes usuarios y programas de aplicación; existe
un mecanismo común para inserción, actualización, borrado y consulta de los datos.
Los procedimientos de actualización y recuperación, comunes, y bien
determinados, habrán de ser capaces de conservar la integridad, seguridad y
confidencialidad del conjunto de datos.
www.iuv.edu.mx 21
Tecnologías de la información
administración de bases de datos
El aspecto lógico se refiere al aspecto conceptual que el usuario tiene de los datos,
incluyendo los nombres y el contenido de los elementos de los datos, así como la
manera en que están organizados, se elige cierto aspecto debido a la forma en que los
datos se utilizarán por parte de un individuo o en una aplicación.
El aspecto físico de los datos es la manera en que los datos se organizan y almacenan
en la computadora y en el almacenamiento secundario, incluyendo las estructuras de
archivos que almacenan los datos y los métodos de acceso que recaban los detalles.
www.iuv.edu.mx 22
Tecnologías de la información
administración de bases de datos
Los datos se organizan independientemente de las aplicaciones que los vayan a usar
(independencia lógica) y de los ficheros en los que vayan a almacenarse (independencia
física).
Los Sistemas de Administración de Base de Datos (en inglés Data Base Management
System) son un tipo de software muy específico, dedicado a servir de interfaz entre la
base de datos, el usuario y las aplicaciones que la utilizan. Se compone de un lenguaje
de definición de datos, de un lenguaje de manipulación de datos y de un lenguaje de
consulta.
www.iuv.edu.mx 23
Tecnologías de la información
administración de bases de datos
Los SGBD también proporcionan métodos para mantener la integridad de los datos,
para administrar el acceso de usuarios a los datos y para recuperar la información si el
sistema se corrompe. Permite presentar la información de la base de datos en variados
formatos. Los SGBD permitieron a todo tipo de usuarios crear y mantener sus bases de
datos, dotándolos de una herramienta que era capaz de transformar el nivel lógico de
sus diseños en un conjunto de datos, representaciones y relaciones traducidos al nivel
físico correspondiente.
Un sistema de base de datos se encuentra dividido en módulos, cada uno de los cuales
controla una parte de la responsabilidad total del sistema. En la mayoría de los casos,
el sistema operativo proporciona únicamente los servicios más básicos y el sistema de
la base de datos debe partir de esa base y controlar además el manejo correcto de los
datos.
www.iuv.edu.mx 24
Tecnologías de la información
administración de bases de datos
Una forma gráfica de representar los componentes antes mencionados y la relación que
existe entre ellos es la siguiente:
www.iuv.edu.mx 25
Tecnologías de la información
administración de bases de datos
Nivel conceptual: Describe la estructura de toda la base de datos para una comunidad de
usuarios. Oculta los detalles físicos de almacenamiento y trabaja con elementos lógicos
como entidades, atributos y relaciones.
Nivel externo o de vistas: tiene varios esquemas externos o vistas de usuario. Cada
esquema describe la visión que tiene de la base de datos a un grupo de usuarios, ocultando
el resto.
www.iuv.edu.mx 26
Tecnologías de la información
administración de bases de datos
La mayoría de los SGBD no distinguen del todo los tres niveles. Algunos incluyen detalles
del nivel físico en el esquema conceptual. En casi todos los SGBD que se manejan vistas de
usuario, los esquemas externos se especifican con el mismo modelo de datos que describe
la información a nivel conceptual, aunque en algunos se pueden utilizar diferentes modelos
de datos en los niveles conceptuales y externos.
Hay que destacar que los tres esquemas no son más que descripciones de los mismos datos,
pero con distintos niveles de abstracción. Los únicos datos que existen realmente están a
nivel físico, almacenados en un dispositivo como puede ser un disco. En un SGBD basado
en la arquitectura de tres niveles, cada grupo de usuarios hace referencia exclusivamente
a su propio esquema externo. Por lo tanto, el SGBD debe transformar cualquier petición
expresada en términos de un esquema externo a una petición expresada en términos del
esquema conceptual, y luego, a una petición en el esquema interno, que se procesará sobre
la base de datos almacenada. Si la petición es de una obtención (consulta) de datos, será
preciso modificar el formato de la información extraída de la base de datos almacenada,
para que coincida con la vista externa del usuario. El proceso de transformar peticiones y
resultados de un nivel a otro se denomina correspondencia o transformación. Estas
correspondencias pueden requerir bastante tiempo, por lo que algunos SGBD no cuentan
con vistas externas.
www.iuv.edu.mx 27
Tecnologías de la información
administración de bases de datos
Definir una estrategia de respaldo y recuperación: Otra función esencial del DBA es
tener amplio conocimiento de las técnicas de recuperación. Esto se basa en un
esquema de seguridad más amplio cuyo objetivo es la operación exitosa del
sistema.
Además, es necesario que posea un buen entendimiento de DBMS para optimizar
las consultas, ajustar la configuración de DBMS o para sincronizar en forma precisa
las herramientas de control del acceso a las bases de datos.
www.iuv.edu.mx 28
Tecnologías de la información
administración de bases de datos
www.iuv.edu.mx 29
Tecnologías de la información
administración de bases de datos
MySQL: Está disponible para la mayoría de las plataformas de sistemas operativos. Su bajo
consumo lo hace apto para ser ejecutado en una máquina con escasos recursos sin ningún
problema. El conjunto de aplicaciones ApachePHP-MySQL es uno de los más utilizados en
aplicaciones en ambiente Web, tiene gran velocidad a la hora de realizar las operaciones.
Según las cifras del fabricante, existen más de 5 millones de copias de MySQL corriendo en
la actualidad, lo que supera la base instalada de cualquier otra herramienta de bases de
datos. Como nota importante, en enero de 2008 lo adquiere Sun Microsystems y ésta a su
vez es adquirida por Oracle Corporation desde abril de 2009.
Oracle: Diseñado para trabajar con enormes bases de datos (más de 20 megas), es el motor
de base de datos relacional más usado a nivel mundial.
www.iuv.edu.mx 30
Tecnologías de la información
administración de bases de datos
Desventajas
Microsoft Access: Es una base de datos amigable. Incluye expertos para realizar
indagaciones, ellos pueden ayudar a encontrar entradas duplicadas y realizar relaciones
cruzadas de los datos. Para aprender el programa basta tener la ayuda en línea, ya que es
completa e informativa. Es una buena opción para la pequeña y mediana empresa, es muy
visual, el inconveniente es que para bases de datos de más de 20 megas es lenta, otro punto
negativo es que, al acceder con Access a otras bases de datos de otros productos mediante
ODBC, como por ejemplo DB2, destroza cualquier tipo de seguridad que la base original
pudiera tener.
IBM DB2:
www.iuv.edu.mx 31
Tecnologías de la información
administración de bases de datos
Desventajas
PosgreSQL: muy buen motor, tiene fama de ser muy seguro y fiable, maneja integridad
referencial cosa que no hacía MySQL hasta su versión 4, es multiplataforma y de libre
distribución.
IBM Informix: Es una familia de productos de bases de datos que incluye un sistema de
administración de bases de datos relacionales basado en SQL, un lenguaje de cuarta
generación y herramientas para la inclusión de SQL en programas de aplicación.
Sybase ASE: es una base de datos corporativa, programable, soporta gran cantidad de datos
y usuarios. Soporta multi-procesadores.
www.iuv.edu.mx 32
Tecnologías de la información
administración de bases de datos
Entre otros DBMS se pueden mencionar Firebird, mSQL (mini SQL), SQLite, dBase, etc.
Como se pueden dar cuenta en la actualidad existen varios SMBD, por lo que la tarea del
Licenciado en Sistemas de Información consiste en conocer cuáles son las ventajas y
desventajas que ofrecen estos sistemas en la administración de información de las
instituciones. ¡¡Sigamos en este maravilloso mundo de la Bases de Datos¡¡¡¡¡¡
Bibliografía
Montero del Ángel, M. A. (2014). ORACLE-MySQL una visión práctica sobre ambos
manejadores de bases de datos. Xalapa: Universidad Veracruzana.
www.iuv.edu.mx 33