Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Monografia Base de Datos
Monografia Base de Datos
Introducción:
En la actualidad las organizaciones manejan una gran cantidad de información, al ser estos
datos parte fundamental, por lo cual debe tenerlos almacenados en una base de datos y
manejados de una forma autónoma para poder evitar la pérdida de tiempo dinero lo cual
generaría perjuicios para la corporación.
Uno de los pasos fundamentales en el proceso de la construcción de una aplicación fiable en
el mundo real es el diseño de la base de datos. La complejidad en el diseño de la base de
datos, dependerá de cuanta y que tipo de información será almacenada en la misma y es
irrepetible. Pero todo se basará en los principios que trataremos en el presente documento.
Administración de datos
Jerarquía de datos:
En la mayoría de los casos los datos están organizados de manera que comienza con la unidad
más pequeña de información (bit) y de manera sucesiva se llega a formar la base de datos.
Al continuar en la jerarquía de la base de datos, nos encontramos con el campo el cual esta
conformadora los caracteres que describen un atributo de un objeto; a su vez el conjunto de
campos da lugar a los registros los cuales están relacionados de igual manera forma un
archivo que es el conjunto de registros ordenados de manera coherente para dar una
información de acuerdo al contexto en el cual se le haga la consulta.
Entidades, Atributos y llaves de datos
Procedamos a definir los conceptos propuestos. Afirmaremos que la entidad de la clase
generalizada de personas lugares o cosas para los cuales se recaban y mantienen datos. De
manera distinta un atributo es una característica relevante de una entidad, lo cual le da un
valor especifico con respecto al resto. Afirmamos que tanto las entidades como los atributos
son cruciales en las bases de datos por lo que representan en su conjunto.
La llave constituye un registro utilizado para identificar este, de manera similar la llave
primaria representa un medio de identificación único en un registro, de tal manera ningún
registro puede llevar la misma clase primaria por el uso de identificación entre los registros
para poder modificar, acceso y organizar. Para una mayor fiabilidad en la base datos, se
recurre a la llave secundaria la cual guarda mayor información relacionada al individuo u
objeto, con la posibilidad de almacenar mayor información que la llave primaria.
Enfoque de la base de datos:
Bajo el enfoque tradicional de la base de datos, al momento de realizar una consulta las
aplicaciones un archivo independiente diseñado para esa aplicación en específico, es decir se
encuentran aislados de otros aplicativos de consulta. En la actualidad se usa el enfoque de
base datos para la administración de datos, en el cual múltiples aplicaciones comparten
información entre si lo cual genera una red de información mucho más amplio y diverso.
Esto se logra con el DBMS que utiliza un grupo de programas que genera una interfaz entre
las bases de datos, el usuario y los programas de aplicación.
Modelado de datos y características de la base de datos
Una base de datos debe diseñarse para almacenar y organizar los datos que puede haber en
un negocio y ofrecer un rápido acceso a ellos así como para modificarlos y reflejar los
procesos de negocios de una organización. Para construirla se debe tener en cuenta:
Entre las consideraciones clave que se deben tomar en cuenta para organizar los datos en una
base se encuentran la determinación de qué datos almacenar, quién tendrá acceso a ellos y de
qué forma se utilizarán.
El diseño lógico es un modelo abstracto de la forma en que deben estar estructurados y
dispuestos los datos para satisfacer las necesidades informativas de una organización. Por
ello, involucra la identificación de las relaciones entre los elementos de datos y su agrupación
de manera ordenada. Debido a que las bases de datos proporcionan la entrada a, y la salida
de los sistemas de información de un negocio, los usuarios de todas las áreas funcionales
deben ayudar a crear el diseño lógico con el fi n de garantizar que sus necesidades sean
identificadas y satisfechas.
El diseño físico comienza en el diseño lógico de la base de datos y lo adapta considerando el
desempeño y costo.
Una de las herramientas que usan los diseñadores de bases de datos para representar las
relaciones lógicas entre éstos es el modelo de datos, que no es otra cosa que un diagrama
que muestra las entidades y las relaciones que existen entre ellas. Por lo general, el modelado
de datos involucra la comprensión de un problema específico de negocios y el análisis de los
datos y la información necesaria para llegar a una solución.
Los diagramas entidad-relación (ER) utilizan símbolos gráficos básicos para mostrar la
organización y las relaciones entre los datos, los diagramas (ER) muestran los elementos de
datos en forma de tablas (entidades), así como la forma en que se relacionan.
Los diagramas (ER) ayudan a garantizar que las relaciones entre las entidades de una base de
datos estén correctamente estructuradas, de tal forma que cualquier programa de aplicación
que se desarrolle sea consistente con las operaciones del negocio y las necesidades del
usuario.
Manejo de datos
Después de ingresar los datos en una base relacional, los usuarios los consultan y analizan.
Entre las operaciones básicas que se pueden hacer con los datos se encuentran la selección,
la proyección y la unión.
Selección involucra la eliminación de renglones de acuerdo con cierto criterio.
Proyección Manipulación de datos para eliminar columnas en una tabla.
Unión Manipulación de datos para combinar dos o más tablas.
Siempre y cuando compartan al menos un atributo de datos, las tablas de una base de datos
relacional se pueden enlazar para brindar información y reportes útiles. Ser capaz de enlazar
tablas entre sí a través de atributos de datos comunes representa uno de los aspectos
principales de la flexibilidad y capacidad de las bases de datos relacionales.
organizaciones utilizan el número deseguro social (NSS) en vez del número de empleado.
Una de las ventajas principales de la base de datos relacional es que permite enlazar tablas
como se muestra en la tabla anterior. Este enlace es de suma utilidad cuando se necesita
información de múltiples tablas. Por ejemplo, el número del seguro social del gerente se
conserva en la tabla gerente. Si se llegara a necesitar este número, se puede obtener
mediante un enlace con dicha tabla.
El modelo de base de datos relacional es, de manera definitiva, el que más se emplea
en la actualidad. Es más fácil de controlar, más flexible y más intuitivo que otros
modelos, debido a que su organización se basa en la utilización de tablas.
Debido a las ventajas del modelo relacional, muchas compañías lo usan en grandes bases de
datos corporativas como las de marketing y contabilidad. Este modelo se utiliza con
computadoras personales y sistemas mainframe.
Los datos valiosos son precisos, completos, económicos, flexibles, confiables, relevantes,
sencillos, oportunos, verificables, accesibles y seguros. La base de datos también debe estar
diseñada de manera adecuada. El propósito de la depuración de datos es desarrollarlos con
estas características. Considere la base de datos de un centro deportivo diseñada para
registrar los pagos de los socios. La tabla contiene los atributos nombre, número telefónico,
género, cuotas pagadas y fecha de pagos. Como se muestra en los registros de la tabla,
Anita Brown y Sim Thomas ya pagaron sus cuotas del mes de septiembre. Sim liquidó su
cuota en dos pagos. Observe que ninguna llave primaria identifica de manera única cada
registro. Como se verá a continuación, este problema debe corregirse.
Tabla de
Pago de
cuotas del
centro
deportivo
Debido a que Sim Thomas pagó su cuota dos veces en el mes de septiembre, los datos que
se encuentran en la base son redundantes. El nombre, número telefónico y género de Tomas
aparece en dos registros. Observe también que los datos son inconsistentes: Thomas cambió
su número telefónico, pero sólo uno de los registros refleja el cambio. Algo que reduce aún
más la confiabilidad de esta base de datos es la falta de una llave primaria que identifica de
manera única el registro de Sim Thomas. El primer Thomas podría ser Sim, pero el
segundo podría ser Steve Thomas. Dichos problemas e irregularidades en los datos se
llaman anomalías y, a menudo, dan como resultado información incorrecta, lo que ocasiona
que los usuarios de la base no obtengan información confiable acerca de las condiciones
reales. Las anomalías deben corregirse. Para resolver estos problemas que enfrenta el centro
deportivo, podemos agregar una llave primaria como el número de socio, y poner los datos
en dos tablas: una tabla de los socios del centro deportivo con su género, número telefónico
e información relacionada, y otra de cuotas pagadas con el monto del pago y la fecha.
Ambas tablas incluyen el atributo número de socio, de tal forma que se pueden enlazar.
Tabla de
Socios
del
centro
deportivo
Tabla de
Cuotas pagadas
Las relaciones de las tablas reducen la redundancia y eliminan el problema potencial que
representa tener dos números telefónicos diferentes para un mismo socio. Asimismo,
observe que el nos proporciona una llave primaria a cada registro de la tabla Socios del
centro deportivo. Debido a que la tabla Cuotas pagadas muestra dos registros de pago (15
dólares cada uno) con el mismo número de socio (ns656), sólo una persona hizo los pagos,
no dos. A menudo se utilizan métodos de formalización, por ejemplo, la normalización de
bases de datos, para depurar problemas que pudieran presentar los datos.
El diseño e implantación del sistema de base de datos correcto garantiza que esta
herramienta soportará actividades y objetivos de negocios. Sin embargo, ¿de qué forma, en
realidad, diseñamos, implantamos, usamos y actualizamos una base de datos? La respuesta
la podemos encontrar en el sistema de administración de base de datos. Como ya se
comentó, un dbms es un grupo de programas que se utilizan como interfaz entre una base
de datos y los programas de aplicación, o entre una base de datos y el usuario. Sin embargo,
las facilidades y tipos de sistemas de bases de datos varían de manera notable.
Archivo plano
Un archivo plano consiste en un simple programa de base de datos cuyos registros no están
relacionados entre sí. Con frecuencia, se utiliza para almacenar y manipular una sola tabla o
archivo y no usa ninguno de los modelos de bases de datos que ya se estudiaron, como el
modelo relacional. Muchos programas de hoja de cálculo y procesador de palabra cuentan
con facilidades de archivo plano. Estos paquetes de software pueden clasificar tablas y
efectuar cálculos y comparaciones sencillas. OneNote, de Microsoft, está diseñado para que
la gente escriba ideas, pensamientos y notas en un archivo de computadora. Cuando se
emplea este programa, cada nota puede colocarse en cualquier lugar de la página o en una
caja dentro de ésta llamada contenedor.
Un solo usuario
Por lo general, una base de datos instalada en una computadora personal es para un solo
usuario. Office
Access y FileMaker Pro, de Microsoft, están diseñadas para soportar implantaciones de un
solo usuario.
InfoPath, también de Microsoft, constituye otro ejemplo de un programa de base de datos
que soporta a un solo usuario. Este software es parte de la suite Office que ayuda a las
personas a recabar y organizar información proveniente de un número variado de fuentes.
Además, cuenta con formas integradas que se utilizan para ingresar información acerca de
gastos, datos de horarios y una gran variedad de información.
Múltiples usuarios
Los negocios pequeños, medianos y grandes necesitan dbms multiusuario para compartir
información con
toda la organización a través de una red. Estos sistemas, más caros y poderosos, permiten
que decenas o cientos de personas accedan al mismo sistema de base de datos de manera
simultánea. Entre los proveedores más populares de sistemas de bases de datos
multiusuario destacan Oracle, Microsoft, Sybase e IBM. Un gran número de bases de datos
para un solo usuario como Access puede implantarse para soporte multiusuario a través de
una red, aunque a veces estas bases están limitadas en cuanto a la cantidad de usuarios que
pueden soportar. Todos los dbms comparten funciones comunes, como ofrecer una vista al
usuario, el almacenamiento y recuperación física de datos de la base de datos, modifi car
ésta, manipular los datos y generar reportes. Con estas herramientas se manejan las tareas
más complejas de procesamiento de datos y, debido a que son accesadas a través de una
red, una base de datos puede dar servicio en muchos sitios en todo el mundo
Debido a que el dbms es responsable del acceso a la base de datos, uno de los primeros
pasos de la instalación y uso de una base de datos de gran tamaño implica informar al dbms
acerca de la estructura lógica y física de los datos y las relaciones entre los que
corresponden a cada usuario. A esta descripción se le llama esquema (como un diagrama
esquemático). Por lo general, los grandes sistemas de bases de datos, como Oracle, utilizan
esquemas para definir las tablas y otras características de las bases de datos asociadas con
una persona o usuario.
Los esquemas se ingresan al dbms (por lo general, a través del personal encargado de la
base de datos)
mediante el empleo de un lenguaje de defi nición de datos (DDL, por sus siglas en inglés:
data definition language), que no es otra cosa que un conjunto de instrucciones y comandos
que se usan para definir y describir los datos y relaciones en una base de datos específica.
Un ddl permite al diseñador de la base de datos describirlos y las relaciones que contendrá
el esquema. En general, un ddl describe trayectorias de acceso lógicas y registros lógicos de
la base de datos. Se muestra un ejemplo simplificado de un ddl que se empleó para
desarrollar un esquema general. Las X que aparecen en la figura revelan dónde debe
ingresarse la información específi ca relacionada con la base de datos. Las expresiones
descripción de archivos, descripción de áreas, descripción de registros y descripción de
conjuntos son términos que el ddl define y emplea en este ejemplo. Pueden utilizarse otros
términos y comandos según el dbms en particular que se utilice.
Los sistemas de bases de datos requieren un administrador de bases de datos (DBA) con
muchas destrezas. Se espera que éste posea una idea muy clara de los negocios principales
de la organización, maneje con mucha habilidad determinados sistemas de administración
de bases de datos y esté actualizado en las tecnologías de vanguardia y los nuevos métodos
de diseño.
El DBA trabaja en conjunto con los usuarios para decidir el contenido de la base de datos,
esto es, para determinar exactamente qué entidades son de interés y qué atributos se
registrarán acerca de ellas.
El DBA también trabaja con programadores, ya que la función de éstos es diseñar
aplicaciones para garantizar que sus programas cumplan con los estándares y convenciones
del sistema de administración de la base de datos.
BASE DE DATOS DISTRIBUIDAS Base de datos en la cual los datos pueden estar
repartidas en varias bases mas pequeñas conectadas a traves de dispositivos de
telecomunicaciones.
USO DE UNA BASE DE DATOS DISTRIBUIDA
Para un fabricante de ropa, las computadoras pueden estar colocadas en la matriz del
corporativo, en el centro de investigacion y desarrollo, en el almacen y en las tiendas al
menudeo propiedad de la compañia. Las bases de datos distribuidas brindan mas
flexibilidad en cuanto a la forma de organizacion y empleo de las bases de datos
Además de a los datos crudos, las organizaciones se enfrentan cada vez más a la necesidad
de almacenar enormes cantidades de señales visuales y audibles de una manera ordenada.
Combinar y analizar datos provenientes de diferentes bases de datos representa un reto cada
vez más importante. En ocasiones, las compañías globales deben analizar datos sobre
ventas y contabilidad almacenados en todo el mundo en diferentes sistemas de bases de
datos. Además de las bases de datos visuales, audibles y virtuales, otros sistemas de bases
de datos de propósito especial satisfacen las necesidades particulares de negocio. La
tecnología de datos espaciales, por ejemplo, involucra el uso de una base de datos para
almacenar y acceder a los datos de acuerdo con los lugares que describe y para permitir el
análisis y las consultas espaciales.