0% encontró este documento útil (0 votos)
29 vistas23 páginas

Introducción a Sistemas de Bases de Datos

El documento habla sobre la diferencia entre datos e información y la importancia de las bases de datos. Las bases de datos permiten almacenar y recuperar grandes cantidades de datos de manera rápida y eficiente para apoyar la toma de decisiones.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
29 vistas23 páginas

Introducción a Sistemas de Bases de Datos

El documento habla sobre la diferencia entre datos e información y la importancia de las bases de datos. Las bases de datos permiten almacenar y recuperar grandes cantidades de datos de manera rápida y eficiente para apoyar la toma de decisiones.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

lOMoARcPSD|33794541

Coronel-2011-Capitulo 1-Sistemas de Bases de Datos

Informatica (Universidad de Otavalo)

Studocu no está patrocinado ni avalado por ningún colegio o universidad.


Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])
lOMoARcPSD|33794541

4 C A P Í T U L O 1

1
CAPÍTULO Sistemas de Bases de datos

En este capítulo, el lector aprenderá:


La diferencia entre datos e información

Qué es una base de datos, los diversos tipos de bases de datos y por qué son elementos valiosos
para la toma de decisiones

La importancia del diseño de bases de datos

La forma en que evolucionaron las bases de datos modernas a partir de sistemas de archivos

Acerca de defectos en la administración de datos del sistema de archivos

Los principales componentes del sistema de bases de datos

Las principales funciones de un sistema de administración de bases de datos (DBMS)

Las buenas decisiones requieren información útil que se derive de datos sin procesar.
Éstos se conocen precisamente como datos. Es probable que éstos se manejen en forma más
eficiente si se guardan en una base de datos. En este capítulo, el lector aprenderá qué es una
base de datos, qué hace y por qué da mejores resultados que otros métodos de adminis-
tración de datos. También aprenderá acerca de varios tipos de bases de datos y por qué su
Vista
diseño es tan importante.
Previa
Las bases de datos evolucionaron a partir de sistemas de archivos para computadora. Aun
cuando la administración de datos del sistema de archivos, es ahora anticuada en su mayor
parte, entender sus características es importante porque son la fuente de serias limitaciones
en la administración de datos. En este capítulo, el lector aprenderá también el modo en que
el método del sistema de bases de datos ayuda a eliminar casi todas las deficiencias de la
administración de datos de un sistema de archivos.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 5

1.1 ¿Por qué bases de datos?

Imaginemos que el lector trata de operar un negocio sin saber quiénes son sus clientes, qué producto vende, quién tra-
baja para él, quién le debe y a quién le debe dinero. Todos los negocios deben tener este tipo de datos y muchos más;
igual de importante es tener esos datos disponibles para quienes toman decisiones cuando los necesiten. Se puede decir
que el propósito final de los sistemas de información de todos los negocios es ayudarlos a usar la información como
un recurso organizacional. En el corazón de todos estos sistemas están la captura, el almacenamiento, agregado, la
manipulación, la diseminación y la administración de datos.

Segun el tipo de sistema de información y las características de un negocio, estos datos podrían variar desde unos
pocos megabytes sobre sólo uno o dos temas hasta terabytes que cubran cientos de temas dentro del ambiente interno
y externo del negocio. Se sabe que las compañías de telecomunicaciones como Sprint y AT&T tienen sistemas que
conservan datos sobre billones de llamadas telefónicas, con nuevos datos agregados al sistema a una rapidez de hasta
70 000 llamadas por segundo.1 Estas compañías no sólo deben guardar y manejar estas inmensas cantidades de datos,
sino que también tienen que hallar rápidamente cualquier dato determinado en esos datos. Considere el caso del clásico
buscador Google de internet. Si bien es cierto que Google se resiste a dar a conocer muchos detalles acerca de sus
especificaciones de almacenamiento de datos, se estima que la compañía responde a más de 91 millones de búsquedas
diarias en un conjunto de datos de varios terabytes de tamaño. Es impresionante que se pueda disponer de los resultados
de estas búsquedas en forma casi instantánea.

¿Cómo pueden estas compañías procesar esta enorme cantidad de datos? ¿Cómo pueden guardarla y después recupe-
rar rápidamente sólo los datos que desean conocer quienes toman decisiones, justo cuando quieran verlos? La respuesta
es que usan bases de datos. Las bases de datos, como se explica en detalle en este libro, son estructuras especializadas
que permiten a sistemas computarizados guardar, manejar y recuperar datos con gran rapidez. Prácticamente todos los
sistemas modernos se apoyan en bases de datos, por lo cual una buena comprensión de cómo se crean estas estructu-
ras y cómo se usan es vital para cual quier profesional de sistemas de información. Incluso si la carrera profesional del
lector no lo lleva por la asombrosa vía del diseño y desarrollo de bases de datos, estas bases de datos serán un compo-
nente fundamental de los sistemas con los que vaya a trabajar. En cualquier caso, es muy probable que, en su carrera
profesional, el lector esté tomando decisiones con base en información generada a partir de estos datos. Entonces, es
importante que conozca la diferencia entre datos e información.

1.2 DATOS VS. INFORMACIÓN

Para entender qué pone en movimiento el diseño de bases de datos es necesario entender la diferencia entre datos e
información. Los datos son datos sin procesar. Las palabras sin modificar indican que los datos todavía no han sido
procesados para revelar su significado. Por ejemplo, supongamos que el lector desea saber qué es lo que los usuarios
de un laboratorio de computación piensan de los servicios de éste. Por lo general, el lector empezaría por estudiar a los
usuarios para evaluar la actuación del laboratorio. La figura 1.1, panel a, muestra el formato del estudio web que hace
posible que los usuarios respondan preguntas. Cuando se haya completado el formato del estudio, los datos sin procesar
se guardan en un depósito de datos como el que se presenta en la figura 1.1, panel b. Aun cuando ahora se tengan los
datos a la mano, no son particularmente útiles en este formato, ya que no es probable que leer una página tras otra de
ceros y unos den muchos conocimientos. Por tanto, se transforman los datos sin elaborar en un resumen de datos como
el que se ve en la figura 1.1, panel C. Ahora es posible obtener respuestas rápidas; por ejemplo: ¿cuál es la composición
de la base del cliente de nuestro laboratorio?, En este caso, se puede determinar con gran rapidez que casi todos sus
clientes son jóvenes (24.59%) y adultos (53.01%). Debido a que las gráficas pueden mejorar su capacidad de extraer
rápidamente un significado de esos datos, se muestra la gráfica de barras del resumen de datos en la figura 1.1, panel d.

La información es el resultado de procesar datos sin elaborar para dejar ver su significado. El procesamiento de datos
puede ser tan sencillo como organizar éstos para revelar patrones, o tan complejos como hacer pronósticos o sacar
inferencias con el uso de modelos estadísticos. Para revelar un significado, la información requiere de un contexto. Por
ejemplo, una lectura promedio de temperatura de 105 grados no significa mucho, a menos que se conozca su contexto:

1 “Top Ten Largest Database in the World”, Business Intelligen Lowdown,


15 de febrero de 207, [Link]

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

6 C A P Í T U L O 1

FIGURA Transformación de datos sin refinar en información


1.1

a) Pantalla inicial del estudio b) Datos sin refinar

c) Información en formato de resumen d) Información en formato de gráfica

¿Esto está en grados Fahrenheit o Celsius? ¿Esta temperatura es de una máquina, de un cuerpo o del aire a la intem-
perie? La información se puede usar como base para tomar decisiones. Por ejemplo, el resumen de datos para cada
pregunta del formato de estudio puede señalar los puntos fuertes y los débiles del laboratorio, lo cual ayuda a tomar
decisiones informadas para satisfacer mejor las necesidades de los clientes del laboratorio.

Téngase en mente que los datos sin elaborar deben estar debidamente formateados para guardarse, procesarse y
presentarse. Por ejemplo, en el panel c de la figura 1.1, la clasificación de estudiante está formateada para mostrar los
resultados basados en las categorías Primer Año, Segundo Año, Tercer año y Graduado. Es posible que sea necesario
que las respuestas sí/no de quienes respondieron se conviertan a un formato S/N para guardar los datos. Se requiere
de un formateo más complejo al trabajar con tipos de datos complejos por ejemplo; sonidos, videos o imágenes.

En esta “era de la información”, la producción de información precisa, relevante y oportuna es la clave para
una buena toma de decisiones. A su vez, la buena toma de decisiones es la clave para la operación continua de

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 7

negocios en un mercado globalizado. Se nos dice que ahora estamos entrando en la “era del conocimiento”.2 Los datos
son la base de la información, que es el fundamento del conocimiento, es decir, el cuerpo de información y datos
acerca de un tema específico. El conocimiento implica familiaridad, conciencia y comprensión de la información en lo
que se refiere a un ambiente. Una clave característica del conocimiento es que se puede derivar conocimiento “nuevo”
a partir del “anterior”.

Resumamos algunos puntos clave:


• Los datos constituyen el material de construcción de la información.
• La información se produce al procesar datos.
• La información se usa para revelar el significado de los datos.
• Una información precisa, relevante y oportuna es la clave para una buena toma de decisiones.
• Una buena toma de decisiones es la clave de una operación organizacional en un ambiente globalizado.

La información oportuna y útil requiere datos precisos. Estos datos deben ser generados y guardados en forma apro-
piada en un formato que sea fácil de acceder y procesar. Y, al igual que cualquier recurso básico, el ambiente de datos
debe ser manejado con todo cuidado. La administración de datos es una disciplina que se concentra en la adecua-
da generación, almacenamiento y recuperación de datos. Dado el papel esencial que desempeñan los datos, no debe
sorprender que la administración de datos sea una actividad de máxima importancia para cualquier negocio, agencia
gubernamental, organización de servicio o institución de caridad.

1.3 INTRODUCCIÓN A LAS BASES DE DATOS

Por lo general, una eficiente administración de datos requiere el uso de una base de datos de computadora. Una base
de datos es una estructura computarizada compartida e integrada que guarda un conjunto de:

• Datos del usuario final, es decir, datos sin elaborar que son de interés para el usuario final.
• Metadatos, o datos acerca de datos, por medio de los cuales los datos del usuario final son integrados y ma-
nejados.

Los metadatos dan una descripción de las características de los datos y del conjunto de relaciones que enlaza los datos
encontrados dentro de la base de datos. Por ejemplo, el componente de metadatos guarda información como el nombre
de cada elemento de datos, el tipo de valores (numérico, fechas o texto) guardados en cada elemento de datos, si el ele-
mento de datos puede dejarse vacío y así sucesivamente. Los metadatos dan información que complementa y expande
el valor y uso de los datos. En pocas palabras, los metadatos presentan una imagen más completa de los datos en la
base de datos. Dadas las características de los metadatos, es posible que el lector halle una definición de base de datos
descrita como “conjunto de datos que se describen a sí mismos”.

Un sistema de administración de bases de datos (DBMS, por sus siglas en inglés) es un conjunto de
programas que maneja la estructura de la base de datos y controla el acceso a los datos guardados en ella. En cierto
sentido, una base de datos se asemeja a un muy bien organizado gabinete electrónico de archivos en el que un poderoso
software, conocido como sistema de administración de base de datos, ayuda a manejar el contenido del gabinete.

1.3.1 Función y ventajas del DBMS

El DBMS sirve como intermediario entre el usuario y la base de datos. La estructura misma de la base de datos está
guardada como un conjunto de archivos y la única forma de tener acceso a los datos de estos archivos es a través del
DBMS. La figura 1.2 destaca el punto de que el DBMS presenta al usuario final una sola vista integrada de los datos
de la base de datos (o programa de aplicación). El DBMS recibe todas las peticiones de aplicación y las traduce en las
complejas operaciones requeridas para cumplirlas. El DBMS oculta gran parte de la complejidad interna de la base de
datos de los programas de aplicación a los usuarios. El programa de aplicación puede ser escrito por un programador
usando un lenguaje de programación como Visual [Link], Java o C, o podría ser creado por medio de un programa
de utilería del DBMS.

2 Peter Drucker acuño la frase “trabajador del conocimiento” en 1959 en su obra Landmarks of Tomorrow. En 1994 Esther Dyson, George Keyworth y Alvin Toffler
introdujeron el concepto de la “era del conocimiento”

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

8 C A P Í T U L O 1

FIGURA El DBMS maneja la interacción entre el usuario final y la base de datos


1.2

Usuarios finales
Estructura de base de datos

Petición de Metadatos
Datos aplicación

Clientes

Sistema de Sencilla
http://
Vista de los datos Datos del
administración Facturas usuario
de base de datos (DBMS) final
Integrada
Usuarios finales
Productos
Petición de
Datos
aplicación

Tener un DBMS entre las aplicaciones del usuario final y la base de datos ofrece algunas ventajas importantes. Primero,
el DBMS hace posible que los datos de la base sean compartidos entre múltiples aplicaciones o usuarios. En segundo
término, el DBMS integra las numerosas y diferentes vistas de usuarios de los datos en un solo depósito de datos que
lo abarca todo.

Debido a que los datos son el material sin elaborar esencial del cual se deriva información, se debe tener un buen méto-
do para manejarlos. Como se verá en este libro, el DBMS ayuda a hacer que la administración de datos sea más eficiente
y efectiva. En particular, el DBMS proporciona ventajas como:

• Los datos se comparten mejor. El DBMS ayuda a crear un ambiente en el que los usuarios finales tienen mejor
acceso a más datos y mejor manejados. Este acceso hace posible que usuarios finales respondan rápidamente a
cambios en su ambiente.
• Mejor seguridad de datos. Mientras más usuarios tengan acceso a los datos, mayores son los riesgos para
la seguridad de los datos. Las compañías invierten mucho tiempo, trabajo y dinero en asegurar que los datos
corporativos se usen en forma apropiada. Un DBMS ofrece un marco para la aplicación eficaz de privacidad de
datos y políticas de seguridad.
• Mejor integración de datos. Un acceso más amplio a datos bien manejados promueve una vista integrada de
las operaciones de la organización y una vista más clara de todo lo que sucede en ella. Se vuelve más fácil ver
cómo las actividades en un segmento de la compañía afectan a otros segmentos.
• Mínima inconsistencia de datos. Hay inconsistencia de datos cuando diferentes versiones de éstos apa-
recen en lugares diferentes. Por ejemplo, existe inconsistencia de datos cuando el departamento de ventas de
una compañía guarda el nombre de un representante como “William G. Brown”, y el departamento de personal
como Bill Brown o cuando la oficina regional de ventas de una compañía muestra el precio de un producto como
$45.95 y su oficina nacional de ventas muestra el precio del mismo producto como $43.95. La probabilidad de
inconsistencia de datos se reduce en gran medida en una base de datos diseñada en forma correcta.
• Mejor acceso a datos. El DBMS hace posible producir respuestas rápidas a consultas ad hoc. Desde
la perspectiva de una base de datos, una consulta es una petición específica hecha al DBMS para mani-
pulación de datos, por ejemplo leer o actualizar los datos. Dicho en pocas palabras, una consulta es una
pregunta y una consulta ad hoc es una pregunta hecha a propósito para la ocasión. El DBMS en-
vía una respuesta (llamada conjunto de resultados sobre la consulta) a la aplicación. Por ejemplo,

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 9

usuarios finales, al trabajar con grandes cantidades de datos de ventas, podrían desear respuestas rápidas a pre-
guntas (consultas ad hoc) como:
- ¿Cuál fue el volumen de ventas en dólares por producto durante los últimos seis meses?
- ¿Cuál es la cifra de bono de ventas para cada uno de los vendedores durante los últimos tres meses?
- ¿Cuántos de nuestros clientes tienen saldos de crédito de $3 000 o más?
• Mejor toma de decisiones. Los datos mejor manejados y un destacado acceso a ellos hacen posible generar
información de mayor calidad, en la que se basan las mejores decisiones. La calidad de la información gene-
rada depende de la calidad de los datos fundamentales. La calidad de datos es un método completo para
promover la precisión, validez y puntualidad de los datos. Si bien el DBMS no garantiza calidad de datos, da
una estructura para facilitar iniciativas de calidad de datos. Los conceptos de calidad de datos se tratarán más
detalladamente en el capítulo 15, Administración y seguridad de bases de datos.
• Productividad aumentada del usuario final. La disponibilidad de datos, combinada con las herramientas que
transforman datos en información útil, hacen posible que los usuarios finales tomen decisiones rápidas e infor-
madas que pueden hacer la diferencia entre éxito y fracaso en la economía global.

Las ventajas de usar un DBMS no están limitadas a las que acabamos de ver. De hecho, el estudiante descubrirá muchas
más ventajas a medida que aprenda más acerca de los detalles técnicos de las bases de datos y su diseño apropiado.

1.3.2 Tipos de bases de datos

Un DBMS puede soportar numerosos tipos de bases de datos. Las bases de datos se pueden clasificar según el número
de usuarios, ubicación(es) de la base de datos y el tipo y grado de uso esperado.

El número de usuarios determina si la base de datos se clasifica como de un solo usuario o de usuarios múltiples. Una
base de datos de un solo usuario soporta a un solo usuario a la vez. En otras palabras, si el usuario A usa la
base de datos, los usuarios B y C deben esperar hasta que el usuario A termine. Una base de datos de un solo usuario
que se ejecute en una computadora personal se llama base de datos de escritorio. En contraste, una base de
datos de usuarios múltiples soporta a múltiples usuarios al mismo tiempo. Cuando una base de datos de usuarios
múltiples soporta a un número relativamente pequeño de usuarios (por lo general menos de 50) o a un departamento
específico dentro de una organización, se le da el nombre de base de datos de grupo de trabajo. Cuando la
base de datos es utilizada por toda la organización y soporta a numerosos usuarios (más de 50, por lo general cientos)
de muchos departamentos, la base de datos se conoce como base de datos empresarial.

La ubicación también podría usarse para clasificar la base de datos. Por ejemplo, una base de datos que soporte datos
ubicados en un solo sitio se denomina base de datos centralizada. Una base de datos que soporte datos distri-
buidos en varios lugares diferentes recibe el nombre de base de datos distribuida. La magnitud en que se pueda
distribuir una base de datos y la forma en que se maneje esa distribución se estudian con detalle en el capítulo 12,
Sistemas de administración de bases de datos distribuidas.

La forma más popular de clasificar bases de datos en la actualidad, está basada en el modo en que se usarán y en la
sensibilidad de tiempo de la información captada por ellas. Por ejemplo, transacciones como la venta de un producto
o servicio, pagos y compras de materias primas reflejan las operaciones de importancia esencial en la actualidad. Estas
transacciones deben ser registradas con toda precisión y de inmediato. Una base de datos diseñada básicamente para
soportar operaciones diarias de una compañía se clasifica como base de datos operacional (a veces conocida
como base de datos de transacciones o de producción). En contraste, un almacén de datos se concentra
principalmente en guardar datos empleados para generar información requerida para tomar decisiones tácticas o
estratégicas. Estas decisiones por lo general requieren de extenso “masajeo de datos” (manipulación de datos) para
extraer información para establecer decisiones de precios, pronósticos de ventas, posicionamiento en el mercado, etc.
La mayor parte de los datos para sustentar decisiones está fundamentada en datos obtenidos de bases de datos opera-
cionales en tiempo y guardados en almacenes de datos. Además, el almacén de datos puede guardar datos derivados
de numerosas fuentes. Para facilitar su recuperación, la estructura del almacén de datos es bastante diferente de la de
una base de datos operacional o de transacciones. El diseño, implementación y uso de almacenes de datos se trata con
detalle en el capítulo 13, Inteligencia de negocios y almacenes de datos.

Las bases de datos también se pueden clasificar para reflejar el grado en que están estructurados los datos. Los datos
no estructurados son datos que existen en su estado original (sin refinar), es decir, en el formato en el que se recolec-
taron. Por tanto, existen datos no estructurados en un formato que no se presta al procesamiento que da información.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

10 C A P Í T U L O 1

Los datos estructurados son el resultado de tomar datos estructurados y formatearlos (estructurarlos) para facilitar
el almacenamiento, uso y generación de información. Se aplica una estructura (formato) con base en el tipo de procesa-
miento que se pretenda ejecutar en los datos. Algunos datos podrían no estar listos (no estructurados) para algunos tipos
de procesamiento, pero podrían estar listos (estructurados) para otros. Por ejemplo, el valor de datos 37890 podría
referirse a un código postal, un valor de ventas o un código de producto. Si este valor representa un código postal o
el código de un producto y se guarda como texto, no se pueden hacer cálculos matemáticos con ese número. Por otra
parte, si este valor representa una transacción de ventas, es necesario darle formato numérico.

Para ilustrar aún más el concepto de estructura, imaginemos una pila de facturas de papel impreso. Si se desea simple-
mente guardar estas facturas como imágenes para recuperación y exhibición futura, es posible escanearlas y guardarlas
en formato gráfico. Por otra parte, si se desea derivar información como ventas totales mensuales promedio y totales,
este almacenamiento gráfico no sería útil. En cambio, se podrían guardar los datos de facturas en un formato de hoja
de cálculo (estructurado) de modo que se puedan efectuar los cálculos necesarios. En realidad, casi todos los datos que
se encuentren se clasifican mejor como semiestructurados. Los datos semiestructurados son datos que ya han
sido procesados en alguna medida. Por ejemplo, si observamos una página web cualquiera, los datos se presentan en
formato arreglado previamente para presentar alguna información.

Los tipos de bases de datos mencionados hasta este punto se concentran en el almacenamiento y la administración
de datos altamente estructurados. No obstante, las corporaciones no están limitadas al uso de datos estructurados.
También usan datos semiestructurados y no estructurados. Sólo pensemos en la muy valiosa información que se puede
encontrar en los correos de empresas, memorandos, documentos tales como procedimientos y reglas, páginas web, etc.
Las necesidades de almacenamiento y administración de datos no estructurados y semiestructurados se manejan por
medio de una nueva generación de bases de datos conocida como bases de datos XML. El Lenguaje de marcado
extensible (Extensible Markup Language XML), por sus siglas en inglés es un lenguaje especial que se emplea
para representar y manipular elementos de datos en un formato textual*. Una base de datos XML soporta el alma-
cenamiento y la administración de datos XML semiestructurados.

La tabla 1.1 compara las funciones de varios sistemas de administración de datos bien conocidos.

TABLA Tipos de bases de datos


1.1
Número de usuarios Ubicación de datos Uso de datos XML
Producto Un Multiusuarios Almacén
Usuario Grupo de Trabajo Empresa Centralizada Distribuida Operacional de Datos
MS Access X X X X
MS SQL X3 X X X X X X X
Server
IBM DB2 X3 X X X X X X X
MySQL X X X X X X X X*
Oracle X3 X X X X X X
X
RDBMS
* Soporta sólo funciones XML. Los datos XML se guardan en grandes objetos de texto.

1.4 POR QUÉ ES IMPORTANTE EL DISEÑO DE BASES DE DATOS

El diseño de bases de datos se refiere a las actividades que se concentran en el diseño de la estructura de la bases
de datos que se usará para guardar y administrar datos del usuario final. Una base de datos que satisfaga todas las ne-
cesidades de un usuario no ocurre así nada más, sino que su estructura debe estar diseñada cuidadosamente. De hecho,
el diseño de base de datos es un aspecto de tal importancia para trabajar con bases de datos que la mayor parte de este
libro está dedicada al desarrollo de buenas técnicas de diseño de bases de datos. Incluso un buen DBMS funcionará mal
con una base de datos mal diseñada.

Un correcto diseño de base de datos exige que el diseñador identifique con toda precisión el uso esperado de la base de
datos. En el diseño de una base de datos de transacciones se destaca la precisión y consistencia de los datos, así como
la rapidez operacional. Diseñar una base de datos de almacén de datos supone enfatizar el uso de datos históricos y

*Nota de RT: XML es un metalenguaje, es decir, un lenguaje que permite definir nuevos lenguajes para diversas necesidades.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 11

agregados. Diseñar una base de datos para uso en un ambiente centralizado y de un usuario requiere un método dife-
rente al empleado en el diseño de una base de datos distribuida y de usuarios múltiples. Este libro destaca el diseño de
bases de datos de transacciones, centralizadas, de un usuario y de usuarios múltiples. Los capítulos 12 y 13 también
examinan problemas críticos a los que se enfrenta el diseñador de bases de datos distribuidas y de almacenes de datos.

El diseño de depósitos de información integrada apropiados para datos que usen las estructuras bidimensionales de
tabla, que se encuentran en la mayor parte de las bases de datos, es un proceso de descomposición. Los datos inte-
grados deben descomponerse en forma adecuada en sus partes constituyentes, con cada parte guardada en su propia
tabla. Además, las relaciones entre estas tablas deben ser cuidadosamente consideradas e implementadas para que la
vista integrada de los datos pueda ser recreada más adelante como información para el usuario final. Una base de datos
bien diseñada facilita la administración de los datos y genera información precisa y valiosa. Es probable que una base
de datos mal diseñada se convierta en terreno fértil para errores difíciles de rastrear que pueden llevar a tomar ma-
las decisiones, y una mala toma de decisiones puede llevar al fracaso de una organización. El diseño de bases de datos es
simplemente demasiado importante para dejarse a la suerte. Ésta es la razón por lo que los estudiantes universitarios
aprenden el diseño de bases de datos y por lo que organizaciones de todo tipo y tamaño envían personal a seminarios
de diseño de bases de datos; también es la razón de que, la mayoría consultores de diseño de bases de datos vivan muy
bien.

1.5 EVOLUCIÓN DEL PROCESAMIENTO DE DATOS


DE UN SISTEMA DE ARCHIVOS

Entender qué es una base de datos, qué hace y la forma apropiada de usarla puede ser más fácil de aclarar si se consi-
dera lo que no es una base de datos. Una breve explicación de la evolución del procesamiento de datos de un sistema
de archivos puede ser útil para entender las limitaciones de acceso a los datos que las bases de datos tratan de superar.
Entender estas limitaciones es algo relevante para diseñadores y perfeccionadores de bases de datos, porque las tecnolo-
gías de bases de datos no hacen desaparecer estos problemas como por arte de magia; las tecnologías de bases de datos
sólo hacen más fácil crear soluciones que evitan estos problemas. La creación de diseños de bases de datos que eviten
las dificultades de sistemas anteriores requiere que el diseñador entienda cuáles eran esos problemas y cómo evitarlos,
porque, de otro modo, las tecnologías de bases de datos no son mejores (potencialmente pueden ser incluso peores)
que las tecnologías y técnicas a las que han sustituido.

1.5.1 Sistemas de archivos manuales

Para tener éxito, una organización propone sistemas para manejar labores esenciales de negocios. Históricamente, esos
sistemas eran manuales, hechos con papel y lápiz. Los papeles de estos sistemas estaban organizados para facilitar el
uso esperado de los datos. Por lo general, esto se lograba mediante un sistema de carpetas de archivos y gabinetes para
guardarlas. Mientras un conjunto de datos fuera relativamente pequeño y los financieros de una organización tuvieran
pocas necesidades de informar, el sistema manual cumplía con su función en forma satisfactoria como depósito de
datos. No obstante, a medida que las organizaciones crecieron y que las necesidades de informar se hicieron más com-
plejas, dar seguimiento a datos en un sistema manual de archivos se hizo más difícil. Por tanto, las empresas buscaron
ayuda en la tecnología de computadoras.

1.5.2 Sistemas de archivos computarizados

Elaborar informes a partir de sistemas manuales de archivos era lento y engorroso. De hecho, los gerentes de algunos
negocios se enfrentaban a requerimientos de informes que el gobierno imponía y que suponían semanas de intenso
trabajo cada trimestre, aun cuando se usaba un sistema manual bien diseñado. Por tanto, un especialista en pro-
cesamiento de datos (DP) era contratado para crear un sistema computarizado que rastrearía datos y elaboraría
los informes solicitados.

Inicialmente, los archivos computarizados dentro del sistema de archivos eran semejantes a los archivos manuales. Un
ejemplo sencillo del archivo de datos de un cliente para una pequeña compañía de seguros se presenta en la figura
1.3. (Más adelante se verá que la estructura de archivos que se observa en la figura 1.3, aun cuando por lo general se
encuentra en los primeros sistemas de archivo, no es satisfactoria para una base de datos.)

La descripción de archivos computarizados requiere un vocabulario especializado. Toda disciplina desarrolla su propio
argot para hacer posible que sus practicantes se comuniquen con más facilidad. El vocabulario sobre archivos presenta-
dos en la tabla 1.2 le ayudará a comprender mejor los apartados siguientes.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

12 C A P Í T U L O 1

FIGURA Contenido del archivo CUSTOMER (CLIENTE)


1.3

C_NAME = Nombre del cliente A_NAME = Nombre del agente


C_PHONE = Teléfono del cliente A_PHONE = Teléfono del agente
C_ADDRESS = Dirección del cliente TP = Tipo de seguro
C_ZIP = Código postal del cliente AMT = Cantidad de póliza de seguro, en miles de dólares
REN = Fecha de renovación de seguro

C O N T E N I D O E N L Í N E A
Las bases de datos empleadas en cada uno de los capítulos se encuentran en el sitio web Premium para este libro.
En toda la obra, los cuadros Contenido en línea destacan material relacionado con el contenido del capítulo ubi-
cado en el sitio web Premium.

TABLA Terminología básica de archivos


1.2
TÉRMINO DEFINICIÓN
Datos “Datos sin refinar”, por ejemplo un número de teléfono, fecha de un cumpleaños, nombre de un cliente y un valor acumulado
de ventas. Los datos tienen poco significado a menos que hayan sido organizados de un modo lógico.
Campo Carácter o grupo de caracteres (alfabéticos o numéricos) que tiene significado específico. Se usa un campo para definir y guardar
datos.

Registro Conjunto de uno o más campos conectados lógicamente que describen una persona, lugar o cosa. Por ejemplo, los campos que
constituyen un registro para un cliente podrían consistir en nombre del cliente, dirección, número telefónico, fecha de nacimiento,
límite de crédito y saldo no pagado.

Archivo Conjunto de registros relacionados. Por ejemplo, un archivo podría contener datos acerca de los estudiantes actualmente
registrados en la Gigantic University.

Con la terminología de archivos dada en la tabla 1.2 se pueden identificar los componentes del archivo mostrado en
la figura 1.3. La fila CUSTOMER de la figura 1.3 contiene 10 registros, cada uno de los cuales está compuesto por
nueve campos: C_NAME, C_PHONE, C_ADDRESS, C_ZIP, A_NAME, A_PHONE, TP, AMT y REN. Los 10 registros
están guardados en un archivo con nombre. Debido a que el archivo de la figura 1.3 contiene datos de los clientes de
la compañía de seguros, su nombre es CUSTOMER.

Cuando los usuarios de negocios deseaban datos del archivo computarizado enviaban peticiones de datos al especialista
en DP. Por cada petición, el especialista en DP tenía que crear programas para recuperar los datos desde el archivo,
manipular de algún modo los que el usuario había pedido y presentarlos como un informe impreso. Si una petición
era sobre un informe que se había ejecutado previamente, el especialista en DP podría volver a ejecutar el programa
existente y dar los resultados impresos al usuario. Cuando otros usuarios de negocios vieron las nuevas e innovadoras
formas en que se presentaban los datos del cliente, querían ver sus datos en forma similar. Esto generaba más peticiones
para que el especialista en DP creara más archivos computarizados de otros datos, lo que a su vez significaba que tenían
que crearse más programas de administración de datos y más peticiones de informes. Por ejemplo, el departamento
de ventas de la compañía de seguros creó un archivo llamado SALES, que ayudaba a dar seguimiento a las ventas dia-

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 13

rias. El éxito del departamento de ventas fue tan obvio que el gerente del departamento de personal solicitó acceso al
especialista en DP para automatizar el procesamiento de nóminas y otras funciones del personal. En consecuencia,
al especialista en DP se le solicitó crear el archivo AGENT que se ve en la figura 1.4. Los datos del archivo AGENT se
emplearon para escribir cheques, dar seguimiento a impuestos pagados y resumir la cobertura de seguros, entre otros
trabajos.

FIGURA Contenido del archivo AGENT


1.4

A_NAME = Nombre del agente YTD_PAY = Pago acumulado


A_PHONE = Teléfono del agente YTD_FIT = Impuesto federal acumulado pagado
A_ADDRESS = Dirección del agente YTD_FICA = Impuestos de Seguro Social acumulados pagados
ZIP = Código postal del agente YTD_SLS = Ventas acumuladas
HIRED = Fecha de contratación del agente DEP = Número de empleados

A medida que más y más archivos computarizados se elaboraron, los problemas con este tipo de sistema de archivos
se hicieron evidentes. Si bien estos problemas se abordan brevemente en la siguiente sección, se ve que se centraron
en tener gran cantidad de archivos de datos que contenían datos relacionados entre sí, a veces traslapados, sin medios
para controlarlos o manejarlos de manera consistente en todos los archivos. Como se ilustra en la figura 1.5, cada uno
de los archivos del sistema utilizó su propio programa de aplicación para guardar, recuperar y modificar datos. Cada
archivo era propiedad de la persona o del departamento que encargó su creación.

FIGURA Sistema sencillo de archivos


1.5

Departamento de ventas Departamento de personal

Archivo de
SALES
(ventas)

Programas Programa Programas Programa


de para de para
administración elaborar administración elaborar
de archivos informes de archivos informes

Archivo Archivo
CUSTOMER AGENT
(clientes) (agentes)

El advenimiento de archivos computarizados para guardar datos de una compañía fue importante; no sólo estable-
ció un hecho destacado en el uso de tecnologías computarizadas, sino que también representó un enorme paso en
la capacidad de un negocio para procesar datos. Previamente, los usuarios tenían acceso directo y práctico a to-
dos los datos del negocio. Pero no tenían las herramientas para convertirlos en la información que necesitaban. La
creación de sistemas computarizados de archivos les dio mejores herramientas para manipular la información de la
compañía, lo que les permitió crear información nueva. No obstante, lo anterior tuvo el efecto adicional de introducir

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

14 C A P Í T U L O 1

una división entre los usuarios finales y sus datos. El deseo de cerrar la brecha entre los usuarios finales y los datos in-
fluyó en el desarrollo de todo tipo de tecnologías computarizadas, diseños de sistemas y usos de numerosas tecnologías
y técnicas. Con todo, estos desarrollos también crearon una división entre las formas en que los especialistas en DP y
los usuarios finales veían los datos.
• Desde la perspectiva del especialista en DP, los archivos de computadora dentro del sistema de archivos fueron
creados para ser similares a los archivos manuales. Los programas para la administración de datos se crearon
para agregar, actualizar y eliminar datos del archivo.
• Desde la perspectiva del usuario, los sistemas separaron a usuarios y datos. Cuando el entorno competitivo
de los usuarios los presionó para tomar más y más decisiones en cada vez menos tiempo, la demora desde cuando
los usuarios concebían una nueva forma de crear información a partir de datos, hasta que el especialista en DP
podía crear los programas para generar esa información, era una fuente de gran frustración.

1.5.3 El sistema de archivos revisitado: modernas herramientas


de productividad para el usuario final

El deseo de los usuarios de tener acceso directo y práctico a los datos ayudó a activar la adopción de computadoras
personales para su uso en negocios. Aun cuando no está relacionado directamente con la evolución de un sistema de
archivos, el uso generalizado de herramientas personalizadas de producción puede introducir los mismos problemas que
los anteriores sistemas de archivos.

Los programas de hojas de cálculo de una computadora personal, como Microsoft Excel, son utilizados con frecuencia
por usuarios financieros y permiten introducir datos en una serie de filas y columnas, para que los datos se puedan
manipular mediante una amplia variedad de funciones. La popularidad de las hojas de cálculo ha hecho posible que los
usuarios realicen un análisis refinado de los datos, lo que ha incrementado en mucho su capacidad para entender
los datos y tomar mejores decisiones. Desafortunadamente, como dice el viejo adagio: “Cuando la única herramienta
que hay es un martillo, todo problema se ve como un clavo”. Los usuarios que se han hecho adeptos a trabajar con
hojas de cálculo tienden a usarlas para emprender tareas para las que no son apropiadas.

Uno de los usos erróneos de las hojas de cálculo es como sustituto de una base de datos. Es interesante ver que con fre-
cuencia los usuarios finales toman los limitados datos a los que tienen acceso directo y los ponen en una hoja de cálculo
en un formato similar a los sistemas tradicionales, manuales, para el almacenamiento de datos, que es precisamente
lo que los primeros especialistas en procesamiento de datos (DP) hicieron cuando crearon archivos computarizados de
datos. Debido al gran número de usuarios de hojas de cálculo, cada uno haciendo copias separadas de los datos, el
“sistema de archivos” resultante de hojas de cálculo sufre de los mismos problemas que los sistemas de archivos creados
por los primeros especialistas en DP; los cuales se abordarán en la siguiente sección.

1.6 PROBLEMAS CON EL PROCESAMIENTO DE DATOS DEL


SISTEMA DE ARCHIVOS

El método de sistema de archivos para organizar y manejar datos fue una mejora definitiva sobre el sistema manual
y cumplió un propósito útil en el manejo de datos durante más de dos décadas, tiempo muy largo en la era de las
computadoras. No obstante, muchos problemas y limitaciones se manifestaron en este método. Hacer una crítica al
método del sistema de archivos tiene dos propósitos principales:
• Entender los defectos del sistema de archivos hace posible comprender el desarrollo de bases de datos modernas.
• Muchos de los problemas no son únicos a sistemas de archivos. Es probable que el no entender estos problemas
lleve a su duplicación en un ambiente de bases de datos, aun cuando la tecnología de bases de datos facilite
evitarlos.

Los siguientes problemas asociados con los sistemas de archivos, ya sean creados por especialistas en DP o mediante
una serie de hojas de cálculo, desafían gravemente los tipos de información que se pueden crear a partir de los datos,
así como a la precisión de la información:
• Largos tiempos de desarrollo. El primer problema con el método de sistemas de archivos, y el más notorio,
es que hasta la tarea más sencilla de recuperación de datos requiere extensa programación. Con los anteriores
sistemas de archivos, los programadores tenían que especificar lo que debía hacerse y cómo tenía que hacerse.
Como se verá en próximos capítulos, las bases de datos modernas utilizan un lenguaje de manipulación de datos
que no es de procedimientos, lo cual permite al usuario indicar lo que debe hacerse sin que haya que especificar
cómo hacerlo.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 15

• Dificultad para obtener respuestas rápidas. La necesidad de escribir programas para obtener hasta los infor-
mes más sencillos hace imposibles las consultas ad hoc. Los acosados especialistas en DP que trabajan con sis-
temas de archivos preparados cuidadosamente reciben a veces numerosas peticiones de nuevos informes. Con
frecuencia se ven forzados a decir que el informe estará listo “la semana próxima” o hasta “el próximo mes”. Si
una persona necesita de inmediato la información, tenerla la semana o el mes próximo no servirá para nada a
sus necesidades de información.
• Administración de un sistema complejo. La administración de un sistema se hace más difícil a medida que
se amplía el número de archivos. Hasta el más sencillo sistema de archivos requiere la creación y el manteni-
miento de varios programas de administración de archivos (cada archivo debe tener sus propios programas de
administración que permitan al usuario agregar, modificar y eliminar registros; para hacer una lista del contenido
de archivos y para generar informes). Como las consultas ad hoc no son posibles, los programas de informes de
archivos se pueden multiplicar con gran rapidez. El problema se complica con el hecho de que cada departamen-
to de la organización “posee” sus datos al crear sus propios archivos.
• Falta de seguridad y compartición limitada de datos. Otra falla de un depósito de datos de un sistema de
archivos es la falta de seguridad y una compartición limitada de datos. El compartir datos y la seguridad están es-
trechamente relacionados. Compartir datos entre múltiples usuarios dispersos desde el punto de vista geográfico
introduce numerosos riesgos de seguridad. En términos de datos de una hoja de cálculo, si bien muchos progra-
mas de hojas de cálculo contienen rudimentarias opciones de seguridad, no siempre se usan e incluso cuando se
usan son insuficientes para una robusta compartición de datos entre usuarios. En términos de la creación de
programas de administración de datos e informes, las funciones de seguridad y compartir datos son difíciles
de programar y, por tanto, se omiten en un ambiente del sistema de archivos. Estas funciones incluyen protección
efectiva de contraseña, capacidad para bloquear partes de archivos o partes del sistema mismo, así como otras
medidas diseñadas para salvaguardar datos confidencialmente. Incluso cuando se haga un intento por mejorar la
seguridad del sistema y de los datos, los dispositivos de seguridad tienden a ser limitados en propósito y eficacia.
• Programación extensa. Hacer cambios a una estructura de archivos existente puede ser difícil en un ambiente
de sistema de archivos. Por ejemplo, cambiar sólo un campo en el archivo original CUSTOMER requeriría de
un programa que:
1. Lea un registro del archivo original.
2. Transforme los datos originales para apegarse a las necesidades de almacenamiento de la nueva estructura.
3. Escriba los datos transformados en una nueva estructura del archivo.
4. Repita los pasos 2 al 4 por cada registro del archivo original.

De hecho, cualquier cambio a una estructura de archivos, no importa lo pequeño que sea, obliga a hacer modificaciones
en todos los programas que usen los datos de ese archivo. Es probable que las modificaciones produzcan errores (bugs),
por eso hay necesidad de emplear tiempo en un proceso de depuración. Estas limitaciones, a su vez, llevan a problemas
de dependencia estructural y de datos.

1.6.1 Dependencia estructural y de datos

Un sistema de archivos presenta dependencia estructural, lo cual significa que tener acceso a un archivo depende
de la estructura del sistema. Por ejemplo, agregar el campo de fecha de nacimiento de un cliente al archivo CUSTOMER
que se muestra en la figura 1.3 requeriría los cuatro pasos descritos en la sección previa. Dado este cambio, ninguno de
los programas previos funcionará con la nueva estructura del archivo CUSTOMER. Por tanto, todos los programas del
sistema de archivos deben ser modificados para apegarse a la nueva estructura. En pocas palabras, como los programas
de aplicación del sistema de archivos son afectados por el cambio en la estructura del archivo, presentan dependencia
estructural. Por el contrario, existe independencia estructural cuando es posible hacer cambios en la estructura de
los archivos sin afectar la capacidad del programa para tener acceso a los datos.

Hasta los cambios en las características de los datos, como cambiar un campo de entero a decimal, requiere modifica-
ciones en todos los programas que tienen acceso al archivo. Como todos los programas de acceso a datos están sujetos
a variaciones cuando se modifica cualquiera de las características de almacenamiento de datos (es decir, cambia el tipo
de datos), se dice que el sistema de datos exhibe dependencia de datos. Por el contrario, existe independencia
de datos cuando es posible hacer cambios en las características de almacenamiento de datos sin afectar la capacidad
del programa de aplicación para tener acceso a los datos.

La importancia práctica de la dependencia de datos es la diferencia entre el formato lógico de datos (el modo en
que una persona ve los datos) y el formato físico de datos (el modo en que la computadora debe trabajar con los

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

16 C A P Í T U L O 1

datos). Cualquier programa que tenga acceso a un archivo del sistema de archivos debe decir a la computadora no sólo
qué hacer sino también cómo hacerlo. En consecuencia, cada programa debe contener líneas que determinen la aper-
tura de un tipo específico de archivo, la particularidad de sus registros y las definiciones de sus campos. La dependencia
de datos hace que el sistema de archivos sea extremadamente engorroso desde el punto de vista de un programador y
un administrador de una base de datos.

1.6.2 Redundancia de datos

La estructura del sistema de archivos hace difícil combinar datos desde múltiples fuentes y su falta de seguridad lo
hace vulnerable. La estructura organizacional promueve el almacenamiento de los mismos datos básicos en diferentes
lugares. (Los profesionales de bases de datos usan el término islas de información para estos lugares dispersos de
datos.) La dispersión de datos es exacerbada por el uso de hojas de cálculo para guardar datos. En un sistema de archi-
vos, todo el departamento de ventas compartiría el acceso al archivo SALES por medio de programas de administración
y reporte de datos creados por el especialista en DP. Con el uso de hojas de cálculo es posible que cada uno de los
miembros del departamento de ventas pueda crear su propia copia de los datos de ventas. Como es improbable que los
datos almacenados en diferentes lugares siempre sean actualizados de manera consistente, es frecuente que las islas de
información contengan diferentes versiones de los mismos datos. Por ejemplo, en las figuras 1.3 y 1.4, los nombres y
números de teléfono de agentes aparecen en los archivos CUSTOMER y AGENT. Sólo se necesita de una copia correc-
ta de los nombres y números de teléfono del agente. Hacer que aparezcan en más de un lugar produce redundancia
de datos. Existe redundancia de datos cuando los mismos datos se guardan innecesariamente en diferentes lugares.

La redundancia no controlada de datos prepara el escenario para:


• Deficiente seguridad de datos. Tener múltiples copias de datos aumenta las probabilidades de que una copia de
éstos sea susceptible a un acceso no autorizado. El capítulo 15, Administración y seguridad de bases de datos,
explora los problemas y técnicas asociadas con la seguridad de los datos.
• Inconsistencia de datos. Existe inconsistencia de datos cuando diferentes y conflictivas versiones de los mismos
datos aparecen en lugares diferentes. Supóngase que se cambia el número de teléfono o la dirección de un
agente en el archivo AGENT. Si se olvida hacer los cambios correspondientes en el archivo CUSTOMER, los
archivos contienen diferentes datos para el mismo agente. Los informes darán resultados inconsistentes que
dependen de qué versión de los datos se utilice.

Nota

Los datos que presentan inconsistencia se conocen también como datos que carecen de integridad. La inte-
gridad de datos se define como la condición en la que todos los datos de la base de datos son consistentes
con los hechos y condiciones del mundo real. En otras palabras, la integridad de datos significa que:
• Los datos son precisos; no hay inconsistencia de datos.
• Los datos son verificables; los datos siempre darán resultados consistentes.

Es más probable que ocurran errores en la entrada de datos cuando se hagan entradas complejas (por ejemplo,
números telefónicos de 10 dígitos) en varios archivos diferentes, o se presenten con frecuencia en uno o más
archivos. De hecho, el archivo CUSTOMER que se ve en la figura 1.3 contiene justo ese error de entrada: el
tercer registro del archivo CUSTOMER tiene un dígito traspuesto en el número de teléfono del agente (615-
882-2144 en lugar de 615-882-1244).

Es posible introducir el nombre y número de teléfono de un agente de ventas inexistente en el archivo CUSTO-
MER, pero no es probable que los clientes se impresionen si la agencia de seguros da el nombre y número de
teléfono de un agente que no exista. ¿El gerente de personal debe permitir que un agente inexistente acumule
bonos y prestaciones? En realidad, un error de entrada de datos como lo es un nombre mal escrito o un número
incorrecto de teléfono da la misma clase de problemas de integridad de datos.
• Anomalías de datos. El diccionario define anomalía como “una anormalidad”. En el ideal, el cambio en un
valor de campo debe hacerse sólo en un lugar. La redundancia de datos, sin embargo, favorece una condición
anormal al forzar cambios en el valor de ese campo en muchos lugares. Véase el archivo CUSTOMER de la figu-
ra 1.3. Si la agente Leah F. Hahn decide casarse y cambiar de domicilio, es probable que modifiquen el nombre
del agente, su dirección y número telefónico. En lugar de hacer sólo un cambio en nombre y/o teléfono/direc-
ción en un solo archivo (AGENT), también debe hacerse la modificación cada vez que se presente el nombre,
número telefónico y dirección del agente en el archivo CUSTOMER. Podríamos vernos frente a la posibilidad

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 17

de hacer cientos de correcciones, una por cada uno de los clientes a los que atendió ese agente. El mismo pro-
blema ocurre cuando un agente decide renunciar. A cada cliente atendido por ese agente se le debe asignar un
nuevo agente. Cualquier cambio en algún valor de campo debe hacerse correctamente en muchos lugares para
mantener la integridad de datos. Se crea una anomalía de datos cuando no todos los cambios requeridos en los
datos redundantes se hacen correctamente. Las anomalías de datos que se encuentran en la figura 1.3 por
lo general se definen como sigue:
- Anomalías de actualización. Si la agente Leah F. Hahn tiene un nuevo número telefónico, ese número debe
introducirse en cada uno de los registros del archivo CUSTOMER en los que se muestre su número telefó-
nico. En este caso deben hacerse sólo tres cambios. En un sistema de archivos grande, ese cambio podría
presentarse en cientos o hasta miles de registros. Es evidente que el potencial para inconsistencias de datos
es grande.
- Anomalías de inserción. Si sólo existiera el archivo CUSTOMER, para agregar un nuevo agente se agregaría
también una entrada ficticia de datos de cliente para reflejar la adición del nuevo agente. Otra vez, el potencial
para crear inconsistencias de datos sería muy grande.
- Anomalías de eliminación. Si se eliminan los clientes Amy B. O’Brian, George Williams y Olette K. Smith,
también se eliminarán los datos del agente John T. Okon. Es claro que esto no es deseable.

1.6.3 Falta de capacidad para diseñar y modelar datos

Un nuevo problema que ha evolucionado con el uso de herramientas de productividad personal, como hojas de cálculo y
las bases de datos de escritorio, es que por lo general los usuarios carecen de conocimientos para hacer un diseño apro-
piado y modelar datos. Naturalmente, las personas tienen una visión integral de los datos en sus entornos. Por ejemplo,
considere el programa de clases de un estudiante. Es probable que el programa contenga el número de identificación
y nombre del estudiante, su código de clase, descripción de clase, horas crédito en clase, el nombre del profesor que
imparta la clase, días y horas de reunión en clase, así como el número del salón de clases. En la mente del estudiante,
estos diversos renglones componen una sola unidad. Si una organización de estudiantes desea llevar un registro de los
programas de todos los miembros de la organización, un usuario podría hacer una hoja de cálculo para guardar la infor-
mación de los programas. Incluso si el estudiante hace una incursión en el campo de las bases de datos de escritorio, es
probable que cree una estructura compuesta por una sola tabla que se asemeje a la estructura del programa. Como se
verá en los capítulos siguientes, forzar este tipo de datos integrados en una sola estructura de tabla de dos dimensiones
es un mal diseño de datos que lleva a un elevado grado de redundancia para varios renglones de datos.

Las habilidades para modelar datos son también una parte vital del proceso de diseño. Es importante que el diseño
creado se encuentre debidamente documentado. La documentación del diseño es necesaria para facilitar la comunica-
ción entre el diseñador de la base de datos, el usuario final y el desarrollador. El modelado de datos, como se introduce
más adelante en este texto, es el método más común de documentar diseños de bases de datos. El uso de una técnica
estandarizada de modelado de datos asegura que el modelo cumpla su función al facilitar la comunicación entre diseña-
dor, usuario y desarrollador. El modelo de datos también es una fuente de gran valor cuando se mantenga o modifique
una base de datos cuando cambian las necesidades de negocios. Los diseños de datos creados por usuarios finales raras
veces son documentados y nunca se hacen con una técnica estandarizada y apropiada de modelado de datos. En una
nota positiva, sin embargo, si el estudiante lee este libro, entonces participa en el tipo de capacitación indispensable
para desarrollar las habilidades en diseño de bases de datos y modelado de datos, necesarios para diseñar con éxito una
base de datos que asegure consistencia de los datos, aplique integridad y contenga una plataforma estable y flexible para
dar a los usuarios una información oportuna y precisa.

1.7 SISTEMAS DE BASES DE DATOS

Los problemas propios de los sistemas de archivos hacen bastante deseable un sistema de bases de datos. A diferencia
del sistema de archivos, con sus numerosos archivos separados y sin relación entre si, el sistema de bases de datos está
formado por datos relacionados lógicamente en un solo depósito lógico. (La etiqueta “lógico” refleja el hecho de que,
aun cuando el depósito de datos parece ser una sola unidad para el usuario final, su contenido puede en realidad estar
físicamente distribuido entre múltiples equipos de almacenamiento de datos o lugares.) Como el depósito de datos de la
base de datos es una sola unidad lógica, la base de datos representa un cambio importante en la forma en que los datos
del usuario final son guardados, se tiene acceso a ellos y son administrados. El DBMS de la base de datos que se ve en
la figura 1.6 contiene numerosas ventajas sobre la administración de un sistema de archivos, que se muestra en la figura
1.5, al hacer posible eliminar casi toda la inconsistencia de datos del sistema, las anomalías de datos, la dependencia de

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

18 C A P Í T U L O 1

datos y problemas de dependencia estructural. Además, la actual generación de software guarda no sólo las estructuras
de datos, sino también las relaciones entre esas estructuras y las vías de acceso a ellas, todo en un lugar central. La actual
generación de software de los DBMS también pone cuidado en definir, guardar y administrar todas las vías de acceso
requeridas para esos componentes.

FIGURA Comparación de una bases de datos con un sistema de archivos


1.6

Un sistema de base de datos

Departamento de personal Base de datos


Empleados
DBMS Clientes
Ventas
Departamento de ventas Inventario
Cuentas

Departamento de contabilidad

Un sistema de archivos
Departamento Departamento
de personal Departamento de ventas de contabilidad

Empleados Clientes Ventas Inventario Cuentas

Recuerde que el DBMS es sólo uno de varios componentes de importancia crítica de un sistema de base de datos. El
DBMS puede incluso considerarse como el corazón del sistema de base de datos. No obstante, así como se necesita más
que sólo el corazón para que funcione un ser humano, también es necesario más que sólo un DBMS para hacer que
funcione un sistema de base de datos. En las secciones que siguen aprenderemos qué es un sistema de base de datos,
cuáles son sus componentes y cómo se ajusta el DBMS en él.

1.7.1 El ambiente de un sistema de base de datos

El término sistema de base de datos se refiere a una organización de componentes que define y regula la captura,
almacenamiento, administración y uso de datos dentro de un ambiente de base de datos. Desde el punto de vista de una
administración general, el sistema de base de datos está compuesto de cinco partes principales que se ven en la figura
1.7: hardware, software, personas, procedimientos y datos.

Veamos más de cerca los cinco componentes de la figura 1.7:


• Hardware. El hardware se refiere a todos los equipos físicos del sistema; por ejemplo, computadoras (PC, ter-
minales de trabajo, servidores y supercomputadoras), equipos de almacenamiento, impresoras, equipos de redes
(centros, conmutadores, ruteadores, fibras ópticas), así como otros equipos (cajeros automáticos, lectores de
identificación, etcétera).

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 19

FIGURA El ambiente de un sistema de base de datos


1.7

Procedimientos escribe
y hace supervisa
y normas cumplir

Administrador de Administrador
base de datos del sistema
Diseñador de
Analistas base de datos administra

diseña Hardware

Usuarios finales Programadores

Programas utilerías del DBMS


usan de aplicación escriben

DBMS

tienen acceso a
Datos

• Software. Aun cuando el software que se identifica con más facilidad es el DBMS en sí, para que el sistema de
base de datos funcione a plenitud se requieren tres tipos de software: el sistema operativo, software el DBMS y
programas de aplicación y utilerías.
- El software del sistema operativo maneja todos los componentes del hardware y hace posible que todo el
demás software se ejecute en las computadoras. Ejemplos de sistemas operativos son Microsoft Windows,
Linux, Mac OS, UNIX y MVS.
- El software del DBMS maneja la base de datos dentro del sistema de base de datos. Algunos ejemplos de
DBMS son SQL Server de Microsoft, Oracle de Oracle Corporation, MySQL de Sun y DB2 de IBM.
- Los programas de aplicación y utilerías se usan para tener acceso y manipular datos en el DBMS y manejar
el ambiente de computadora en el que tienen lugar el acceso y la manipulación de datos. Los programas de
aplicación por lo general se usan para tener acceso a datos que se encuentran dentro de la base de datos para
generar informes, tablas y otros recursos para facilitar la toma de decisiones. Las utilerías son las herramien-
tas empleadas para ayudar a manejar los componentes de computadora del sistema de base de datos. Por
ejemplo, todos los principales vendedores de DBMS ahora contienen interfaz gráfica de usuario (GUI) para
ayudar a crear estructuras, controlar el acceso y monitorear operaciones de bases de datos.
• Personas. Este componente incluye a todos los usuarios del sistema de base de datos. A partir de las funciones
centrales de un trabajo, se pueden identificar cinco tipos de usuario en un sistema de base de datos: administra-
dores del sistema, administradores de la base de datos, diseñadores de la base de datos, analistas y programado-
res del sistema y, por último, usuarios finales. Cada tipo de usuario, descrito a continuación, ejecuta funciones
ya sea únicas o complementarias.
- Los administradores del sistema supervisan las operaciones generales del sistema de base de datos.
- Los administradores de la base de datos, también conocidos como los DBA, manejan el DBMS y aseguran
que la base de datos se encuentre funcionando en forma correcta. La función del DBA es suficientemente
importante para justificar una exploración detallada en el capítulo 15, Administración y seguridad de bases
de datos.
- Los diseñadores de bases de datos proyectan la estructura de la base de datos. Son, en efecto, los arquitectos
de una base de datos. Si el diseño de una base de datos es deficiente, incluso los mejores programadores de
aplicación y los más dedicados DBA no pueden producir un ambiente útil para bases de datos. Como las orga-
nizaciones se esfuerzan por optimizar sus recursos de bases de datos, la descripción del trabajo del diseñador
de una base de datos se ha ampliado para abarcar nuevas dimensiones y crecientes responsabilidades.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

20 C A P Í T U L O 1

- Los analistas y programadores del sistema diseñan y ponen en práctica los programas de aplicación.
Diseñan y crean las pantallas para introducir datos, informes y procedimientos por medio de los cuales los
usuarios finales tienen acceso y manipulan los datos de una base de datos.
- Los usuarios finales son las personas que usan los programas de aplicación para ejecutar las operaciones
diarias de una organización. Por ejemplo, los vendedores, supervisores, gerentes y directores estarían clasifi-
cados como usuarios finales. Los usuarios finales de alto nivel emplean la información obtenida desde la base
de datos para tomar decisiones de negocios tácticas y estratégicas.
• Procedimientos. Son las instrucciones y reglas que gobiernan el diseño y uso del sistema de base de datos. Los
procedimientos son un elemento crítico del sistema, aun cuando a veces es olvidado. Los procedimientos de-
sempeñan una importante función en una compañía porque hacen cumplir las normas por medio de las cuales
se realizan los negocios dentro de la organización y con sus clientes. Los procedimientos también se emplean
para asegurar que hay una forma organizada de vigilar y auditar tanto los datos que entran a la base de datos
como la información que se genera con ellos.
• Datos. La palabra datos comprende el conjunto de datos almacenados en la base de datos. Como los datos son
la materia prima de la que se genera información, la determinación de cuáles han de introducirse en la base de
datos y cómo han de organizarse es una parte vital del trabajo del diseñador de una base de datos.

Un sistema de base de datos agrega una nueva dimensión a la estructura administrativa de una organización. Lo com-
plejo de esta estructura depende del tamaño de la organización, sus funciones y cultura corporativa. Por tanto, los siste-
mas de bases de datos pueden ser tratados y manejados a diferentes niveles de complejidad y con adherencia variable a
normas precisas. Por ejemplo, compare un sistema de renta de películas de su localidad contra un sistema nacional de
reclamaciones de seguros. El sistema de renta de películas puede ser manejado por dos personas, el hardware empleado
es probablemente una sola PC, también es factible que los procedimientos sean sencillos y que el volumen de datos
tienda a ser bajo. Es posible que el sistema nacional de reclamaciones de seguros tenga al menos un administrador de
sistemas, varios administradores de bases de datos (DBA) de tiempo completo y numerosos diseñadores y programa-
dores; es probable que el hardware incluya varios servidores en muchos lugares en todo el país; con toda seguridad los
procedimientos son numerosos, complejos, rigurosos y el volumen de datos tiende a ser alto.

Además de los diferentes niveles de complejidad de un sistema de base de datos, los administradores también deben to-
mar en cuenta otro hecho importante: las soluciones de una base de datos deben ser eficaces en cuanto a costo y táctica
y deben ser estratégicamente eficientes. Producir una solución de un millón de dólares, para un problema de mil dólares
no es ejemplo de una buena selección de sistema de base de datos o de un buen diseño y administración de base de
datos. Por último, es probable que la tecnología de base de datos ya en uso afecte la selección de un sistema de base
de datos.

1.7.2 Funciones de un DBMS

Un DBMS realiza varias funciones importantes que garantizan la integridad y consistencia de los datos en la base de da-
tos. Casi todas esas funciones son transparentes a los usuarios finales y la mayor parte se pueden realizar sólo mediante
un DBMS. Incluyen la administración de un diccionario de datos, administración de almacenamiento de datos, trans-
formación y presentación de datos, administración de seguridad, control de acceso a múltiples usuarios, administración
de respaldo y recuperación, administración de integridad de datos, lenguajes de acceso a la base de datos, así como
interfaz de programación de aplicación e interfaz de comunicación de una base de datos. Cada una de estas funciones
se explica a continuación.
• Administración de un diccionario de datos. El DBMS guarda definiciones de los elementos de datos y sus
relaciones (metadatos) en un diccionario de datos. A su vez, todos los programas que tienen acceso a los
datos en la base de datos funcionan por medio del DBMS. El DBMS emplea el diccionario de datos para buscar
las estructuras y relaciones requeridas de componentes de datos, relevando así al usuario de tener que codificar
esas complejas relaciones en cada programa. Además, cualesquier cambios hechos en una estructura de bases de
datos se registran automáticamente en el diccionario de datos, con lo cual el usuario queda liberado de tener que
modificar todos los programas que tienen acceso a la estructura modificada. En otras palabras, el DBMS brinda
abstracción de datos y elimina la dependencia estructural y de datos del sistema. Por ejemplo, la figura 1.8 mues-
tra el modo en que Microsoft SQL Server Express presenta la definición de datos para la tabla CUSTOMER.
• Administración de almacenamiento de datos. El DBMS crea y maneja las complejas estructuras requeridas
para el almacenamiento de éstos datos, liberando así al usuario de la difícil tarea de definir y programar las ca-
racterísticas físicas de datos.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 21

FIGURA Ilustración de metadatos con Microsoft SQL Server Express


1.8

Metadatos

Un DBMS moderno proporciona almacenamiento no sólo para los datos, sino también para formatos de intro-
ducción de datos relacionados o definiciones de pantalla, definiciones de informes, reglas de validación de datos,
código de procedimiento, estructuras para manejar video y formatos de imágenes, etc. La administración de
almacenamiento de datos también es importante para afinar la operación de una base de datos. La afinación
de operación se relaciona con las actividades que hacen que la base de datos opere más eficientemente en
términos de rapidez de almacenamiento y acceso. Aun cuando el usuario ve la base de datos como una sola
unidad de almacenamiento, el DBMS en realidad guarda la base de datos en múltiples archivos físicos de datos.
(véase la figura 1.9). Estos archivos de datos pueden incluso guardarse en diferentes medios de almacenamiento.
Por tanto, el DBMS no tiene que esperar una petición de disco para terminar antes que se inicie la siguiente. En
otras palabras, el DBMS puede satisfacer las peticiones de bases de datos en forma concurrente. Los aspectos
de la administración del almacenamiento de datos y la afinación de operación se estudian en el capítulo 11,
Afinación de operación de una base de datos y optimización de consulta.
• Transformación y presentación de datos. El DBMS transforma los datos introducidos para apegarse a las
estructuras de datos requeridas. El DBMS libera al usuario del trabajo de hacer una distinción entre el formato
de datos lógico y el formato de datos físico. Esto es, el DBMS da formato a los datos físicamente recuperados
para hacer que se apeguen a las expectativas lógicas del usuario. Imaginemos una base de datos utilizada por
una compañía multinacional. Un usuario final en Inglaterra esperaría introducir datos como, por ejemplo, 11
de julio de 2010, como “11/07/2010”. En contraste, la misma fecha se introduciría en Estados Unidos como
“07/11/2010”. Cualquiera que sea el formato de presentación de datos, el DBMS debe manejar la fecha en el
formato apropiado para cada país.
• Administración de seguridad. El DBMS crea un sistema de seguridad que hace cumplir la seguridad del usuario
y la privacidad de datos. Las reglas de seguridad determinan cuáles usuarios pueden tener acceso a la base de
datos, a qué elementos puede tener acceso el usuario y cuáles operaciones (leer, agregar, eliminar, o modificar)
puede realizar el usuario. Esto es especialmente importante en sistemas de base de datos de usuarios múltiples.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

22 C A P Í T U L O 1

FIGURA Ilustración de la administración de almacenamiento de datos con Oracle


1.9

Nombre de la base de datos: [Link]

La base de datos ORALAB en La interfaz Oracle DBA Studio


realidad se guarda en nueve Management también muestra
archivos ubicados en la uni- la cantidad de espacio emplea-
dad C: de la computadora del da por cada uno de los archivos
servidor de base de datos. que constituyen la base de
datos lógica individual.

La interfaz gráfica de Oracle DBA Studio Administrator muestra las carac-


terísticas de administración de almacenamiento de datos para la base de
datos ORALAB.

El capítulo 15, Administración y seguridad de bases de datos, examina más detalladamente los problemas de
seguridad y privacidad de los datos. Todos los usuarios de una base de datos pueden ser autentificados frente al
DBMS por medio de un nombre de usuario y una contraseña, o mediante autentificación biométrica como lo
es un escaneo de huella digital. El DBMS emplea esta información para asignar privilegios de acceso a varios
componentes de bases de datos como consultas e informes.
• Control de acceso a múltiples usuarios. Para dar integridad y consistencia de datos, el DBMS utiliza algorit-
mos complejos para asegurar que múltiples usuarios tengan acceso concurrentemente a la base de datos sin
comprometer la integridad de ésta. El capítulo 10, Administración de transacciones y control de concurrencia,
aborda los detalles del control de acceso a usuarios múltiples.
• Administración de respaldo y recuperación. El DBMS suministra respaldo y recuperación de datos para garan-
tizar la seguridad e integridad de los datos. Los DBMS actuales cuentan con utilerías especiales que permiten al
administrador de la base de datos (DBA) ejecutar la rutina y procedimientos de respaldo y restauración. La ad-
ministración de recuperación se ocupa de la restauración de la base de datos después de una falla; por ejemplo,
un mal sector del disco o una falla de energía eléctrica. Esta capacidad es de importancia crítica para preservar
la integridad de la base de datos. El capítulo 15 se ocupa de problemas de respaldo y recuperación.
• Administración de la integridad de datos. El DBMS promueve y hace cumplir las reglas de integridad, redu-
ciendo al mínimo la redundancia y maximizando la consistencia de los datos. Las relaciones de datos guardadas
en el diccionario de datos se usan para hacer cumplir la integridad de los datos. Asegurar la integridad de los
datos es especialmente importante en sistemas de bases de datos orientados a transacciones. Los problemas
de administración de integridad y transacción de datos se abordan en el capítulo 7, Introducción al lenguaje de
consulta estructurado (SQL) y en el capítulo 10.
• Lenguajes de acceso a base de datos e interfaz de programación de aplicación. El DBMS proporciona acceso
a los datos por medio de un lenguaje de consulta. Un lenguaje de consulta no es un lenguale de procedi-
miento; es un lenguaje que permite al usuario especificar qué debe hacerse sin tener que especificar cómo debe

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

S I S T E M A S D E B A S E S D E D A T O S 23

hacerse. Un lenguaje de consulta estructurado (SQL) es, de hecho, el lenguaje de consulta y norma
de acceso a datos apoyado por la mayoría de vendedores de DBMS. El capítulo 7, Introducción al lenguaje de
consulta estructurado (SQL), y el capítulo 8, SQL avanzado, se ocupan de SQL. El DBMS también contiene
interfaz de programación de aplicación a lenguajes de procedimiento como COBOL, C, Java, Visual [Link]
y C#. Además, el DBMS contiene utilerías administrativas empleadas por el DBA y el diseñador de bases de
datos para crear, implementar, monitorear y mantener la base de datos.
• Interfaz de comunicación de una base de datos. Los DBMS de la generación actual aceptan peticiones de un
usuario final hechas a través de múltiples y diferentes ambientes de red. Por ejemplo, el DBMS podría dar acceso
a la base de datos a través de internet mediante navegadores web como Mozilla Firefox o Microsoft Internet
Explorer. En este ambiente, las comunicaciones pueden realizarse de varias formas:
- Los usuarios finales pueden generar respuestas a consultas al llenar formas en pantalla mediante su navega-
dor web preferido.
- El DBMS puede publicar informes automáticamente predefinidos en un sitio web.
- El DBMS puede conectar a sistemas de terceros para distribuir información vía cibercorreo u otras aplicacio-
nes de productividad.

La interfaz de comunicación de una base de datos se examinan en mayor detalle en el capítulo 12, Sistemas para ad-
ministración de bases de datos distribuidas; en el capítulo 14, Conectividad de bases de datos y tecnologías web y en el
Apéndice I, Bases de datos en comercio electrónico. (Los apéndices se encuentran en el sitio web Premium.)

Nota

Por qué una hoja de cálculo no es una base de datos


Si bien una hoja de cálculo permite la creación de múltiples tablas, no soporta incluso la funcionalidad más
esencial de una base de datos como el soporte para autodocumentación a través de metadatos, imposición de
tipos o dominios de datos para asegurar la consistencia de los datos dentro de una columna, relaciones defini-
das entre tablas, o restricciones para asegurar la consistencia de los datos en tablas relacionadas. La mayoría
de los usuarios carecen de la capacitación necesaria para reconocer las limitaciones de las hojas de cálculo
para estos tipos de tareas.

1.7.3 Administración del sistema de base de datos: un cambio en enfoque

La introducción de un sistema de base de datos sobre el sistema de archivos produce un marco en el que se pueden
imponer estrictos procedimientos y normas. En consecuencia, la función del componente humano cambia de un énfasis
en programación (en el sistema de archivos) a un enfoque en los aspectos más generales de los recursos de datos de la
organización y en la administración del complejo software de bases de datos.

El sistema de bases de datos hace posible el uso mucho más complejo de los recursos de los datos, mientras la base
de datos esté diseñada para ocupar la fuerza disponible. Las clases de estructuras de datos creadas dentro de la base de
datos y la magnitud de relaciones entre ellas desempeñan una poderosa función para determinar la eficacia del siste-
ma de base de datos.

Aun cuando el sistema de base de datos da considerables ventajas sobre anteriores métodos de administración de datos,
también tiene desventajas considerables. Por ejemplo:
• Costos más altos. Los sistemas de base de datos requieren hardware y software complejos y personal altamente
capacitado. El costo de mantener hardware, software y personal requerido para operar y manejar un sistema
de base de datos puede ser considerable. Los costos de capacitación, licencia y apego a reglamentos suelen
descuidarse cuando se implementan sistemas de base de datos.
• Complejidad de administración. Los sistemas de base de datos interactúan con numerosas tecnologías y tie-
nen un considerable impacto en los recursos y en la cultura de una compañía. Los cambios introducidos por la
adopción de un sistema de base de datos deben ser manejados en forma apropiada para asegurar que ayuden
a alcanzar los objetivos de la compañía. Dado el hecho de que los sistemas de bases de datos contienen datos
de importancia esencial de una compañía, a los que se tiene acceso desde múltiples fuentes, los problemas de
seguridad deben evaluarse constantemente.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

24 C A P Í T U L O 1

• Mantener una actualización general. Para maximizar la eficiencia de un sistema de base de datos es necesario
mantener actualizado ese sistema. Por tanto, el usuario debe realizar constantes actualizaciones y aplicar los
últimos parches y medidas de seguridad a todos los componentes. Como la tecnología de bases de datos avanza
rápidamente, los costos de capacitar personal tienden a ser considerables.
• Dependencia de vendedores. Dada la fuerte inversión en tecnología y capacitación de personal, las empresas
podrían ser reacias a cambiar vendedores de bases de datos. En consecuencia, es menos probable que los ven-
dedores ofrezcan precios ventajosos a clientes ya existentes y éstos podrían estar limitados en sus elecciones de
componentes de sistemas de base de datos.
• Ciclos frecuentes de actualización/remplazo. Los vendedores de los DBMS actualizan sus productos cuando
agregan nueva funcionalidad. Es frecuente que estas nuevas funciones se ofrezcan en paquete en recientes ver-
siones actualizadas del software. Algunas de estas versiones requieren actualizaciones del hardware, que no sólo
cuestan dinero sino que también hacen necesario capacitar usuarios y administradores de bases de datos, para
emplear y manejar correctamente las nuevas funciones.

Ahora que hemos considerado qué es una base de datos y un DBMS y por qué son necesarios, es natural que abor-
demos las ventajas del diseño de una base de datos. No obstante, antes que podamos crear un diseño, debemos saber
cuáles herramientas están a nuestra disposición. En todo este capítulo hemos generalizado el estudio de la tecnología de
una base de datos, de modo que parece que es un método individual y común para el diseño de una base de datos. No
obstante, como diseñador y perfeccionador de una base de datos, el usuario debe entender que hay diferentes métodos
y tiene que conocer la forma como éstos influyen en los diseños que haya creado y cómo se modelan.

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])


lOMoARcPSD|33794541

SISTEMAS DE BASES DE DATOS 25

R E S U M E N

Los datos son datos sin refinar. La información es el resultado de procesar datos para dejar ver su significado.
Una información precisa, relevante y oportuna es la clave para una buena toma de decisiones, que a su vez es
la clave del éxito organizacional en un ambiente global.

Los datos suelen ser almacenados en una base de datos. Para implementar una base de datos y administrar su
contenido, se requiere un sistema de administración de bases de datos (DBMS). El DBMS sirve como interme-
diario entre el usuario y la base de datos. La base de datos contiene los datos que se han capturado y los “datos
acerca de datos”, conocidos como metadatos.

El diseño de una base de datos define la estructura de una base de datos. Una base de datos mal diseñada puede
llevar a tomar malas decisiones, lo cual a su vez puede llevar al fracaso de una organización.

Las bases de datos evolucionaron a partir de sistemas de archivos manuales y luego computarizados. En un sis-
tema de archivos, los datos se guardan en archivos independientes, cada uno de los cuales requiere sus propios
programas de administración de datos. Aun cuando este método de administración es ahora anticuado, entender
sus características hace que el diseño de bases de datos sea más fácil de entender.

Algunas limitaciones de la administración de datos de un sistema de archivos son que requiere de una extensa
programación, la administración del sistema puede ser compleja y difícil, hacer cambios a estructuras existentes
es difícil y es probable que las funciones de seguridad sean inadecuadas. Del mismo modo, los archivos indepen-
dientes tienden a contener datos redundantes, lo cual lleva a problemas de dependencia estructural y de datos.

Los sistemas de administración de bases de datos se perfeccionaron para manejar las debilidades inherentes del
sistema de archivos. Más que depositar datos en archivos independientes, un DBMS presenta la base de datos al
usuario final como un solo depósito. Esta disposición hace posible que los datos se compartan, lo cual elimina el
problema potencial de las islas de información. Además, el DBMS hace cumplir la integridad de datos, elimina
la redundancia y promueve la seguridad de datos.

T É R M I N O S C L A V E

administración de datos, 7 conjunto de resultados de consulta, 8 información, 5


afinación de operación, 21 conocimiento, 7 integridad de datos, 16
almacén de datos, 9 consulta, 8 islas de información, 16
anomalía de datos, 17 consulta ad hoc, 8 Lenguaje de consulta estructurado
archivos, 12 datos, 5 (SQL), 22
base de datos, 7 datos estructurados, 10 lenguaje de consulta, 22
base de datos centralizada, 9 datos no estructurados, 9 lenguaje de marca extensible
base de datos de empresa, 9 datos semiestructurados, 10 (XML), 10
base de datos de escritorio, 9 dependencia de datos, 15 metadatos, 7
base de datos de grupo de trabajo, 9 dependencia estructural, 15 registro, 12
base de datos de producción, 9 diccionario de datos, 20 redundancia de datos, 16
base de datos de transacción, 9 diseño de base de datos, 10 sistema de administración
base de datos de un solo usuario, 9 especialista en procesamiento de base de datos (DBMS), 7
base de datos de usuarios múltiples, 9 de datos (DP), 11 sistema de base de datos, 18
base de datos distribuida, 9 formato físico de datos, 15
base de datos operacional, 9 formato lógico de datos, 15
base de datos XML, 10 inconsistencia de datos, 8
calidad de datos, 9 independencia de datos, 15
campo, 12 independencia estructural, 15

Descargado por ALEXA SOFIA ROJAS ROMERO (alexsofirr@[Link])

También podría gustarte