Está en la página 1de 31

ADMINISTRACION DE RECURSOS DE DATOS

Índice
ÍNDICE..................................................................................................................................................... 2

OBJETIVOS DEL TRABAJO................................................................................................................. 4

INTRODUCCIÓN.................................................................................................................................... 5

CONCEPTOS FUNDAMENTALES DE LOS DATOS..........................................................................6

1.1. CARÁCTER..........................................................................................................................................6
1.2. CAMPO.............................................................................................................................................6
1.3. REGISTRO........................................................................................................................................6
1.4. ARCHIVO...........................................................................................................................................6
1.5. BASE DE DATOS...............................................................................................................................7

1. TIPOS DE BASE DE DATOS........................................................................................................ 7

2.1. BASE DE DATOS OPERATIVAS..........................................................................................................7


2.2. BASE DE DATOS DISTRIBUIDOS........................................................................................................7
2.2.1. Diseño de la base de datos distribuida...............................................................................7
2.2.2. Procesamiento de consultas.................................................................................................8
2.2.3. Control de concurrencia.........................................................................................................8
2.2.4. Confiabilidad............................................................................................................................9
2.3. BASE DE DATOS EXTERNAS.............................................................................................................9
2.4. BASE DE DATOS HIPERMEDIAS........................................................................................................9

2. ALMACENES DE DATOS Y MINERÍA DE DATOS.....................................................................9

3.1. Data Warehousing....................................................................................................................10


3.2. Características del Almacén de Datos...................................................................................10
3.3. Arquitectura Data Warehouse.................................................................................................11
3.4. Estructura lógica del Almacén de Datos................................................................................11
3.5. 1.7 Estructura física del Almacén de Datos.........................................................................12
3.6. Software Data Warehouse.......................................................................................................13

3. PROCESAMIENTO TRADICIONAL DE ARCHIVOS.................................................................13

4.1. PROBLEMAS DEL PROCESAMIENTO DE ARCHIVOS.........................................................................13

4. ENFOQUE DE ADMINISTRACIÓN DE BASE DE DATOS.......................................................13

5. SOFTWARE DE ADMINISTRACIÓN DE DATOS......................................................................14

6. CONSULTA DE BASE DE DATOS............................................................................................. 14

7. MANTENIMIENTO DE BASE DE DATOS..................................................................................14

8. DESARROLLO DE APLICACIONES..........................................................................................15

9. ADMINISTRADOR DE BASE DE DATOS..................................................................................15

10.1. EL ADMINISTRADOR DE BASES DE DATOS ES RESPONSABLE PRIMORDIALMENTE DE:...........16


10.1.1. Administrar la estructura de la Base de Datos.................................................................16
10.1.2. Administrar la actividad de los datos.................................................................................16
10.1.3. Administrar el Sistema Manejador de Base de Datos....................................................17
10.1.4. Establecer el Diccionario de Datos....................................................................................17
10.1.5. Asegurar la confiabilidad de la Base de Datos................................................................17
10.1.6. Confirmar la seguridad de la Base de Datos....................................................................18

10. ESTRUCTURA DE BASE DE DATOS....................................................................................19

11.1. ESTRUCTURA JERÁRQUICA..........................................................................................................19


11.2. ESTRUCTURA DE RED................................................................................................................20
11.3. ESTRUCTURA RELACIONAL........................................................................................................20
11.4. ESTRUCTURA MULTIDIMENSIONAL.............................................................................................21
11.5. ESTRUCTURA ORIENTADA A OBJETOS.......................................................................................21

11. EVALUACIÓN DE LAS ESTRUCTURA DE BASE DE DATOS............................................22

12. DESARROLLO DE BASE DE DATOS...................................................................................22

13. PLANEACIÓN DE DATOS Y DISEÑO DE BASE DE DATOS..............................................23

14.1. RECOPILAR LA INFORMACIÓN....................................................................................................24


14.2. IDENTIFICAR LOS OBJETOS........................................................................................................24
14.3. CREAR UN MODELO DE LOS OBJETOS.......................................................................................25
14.4. IDENTIFICAR LOS TIPOS DE INFORMACIÓN PARA CADA OBJETO...............................................25
14.5. IDENTIFICAR LA RELACIÓN ENTRE OBJETOS..............................................................................26

CONCLUSIÓN...................................................................................................................................... 28

CASO PRÁCTICO I............................................................................................................................. 29

CASO DE PRACTICÓ II....................................................................................................................... 30


Objetivos del trabajo

 Explicar el valor de negocio de implementar procesos y tecnología de


administración de recursos de datos en una organización

 Destacar las ventajas de un enfoque de administración de base de datos


para administrar los recursos de datos de un negocio, comparado con un
enfoque de procesamiento de archivos

 Explicar como el software de administración de base de datos ayuda a los


profesionales de negocios, y da soporte a las operaciones y a la
administración de un negocio

 Dar ejemplos para ilustrar cada uno de los siguientes conceptos:


a. Tipos principales de base de datos
b. Almacenas de datos y minería de datos
c. Elementos lógicos de datos
d. Estructuras fundamentales de base de datos
e. Desarrollo de base de datos
Introducción

La información es un recurso vital de las organizaciones, que tiene que administrar


como cualquier otro activo importante de un negocio. En la actualidad, las
empresas no pueden sobrevivir o tener éxito sin información de calidad acerca de
sus operaciones internas y de su ambiente externo
Conceptos fundamentales de los datos

1.1. Carácter

Es el elemento más básico de los datos lógicos es el carácter, que consiste en


un símbolo único alfabético, numérico u otro tipo.

1.2. Campo

En las bases de datos un campo es la mínima unidad de almacenamiento de


información accesible.

O puede considerar en una agrupación de caracteres relacionados.

1.3. Registro

Un registro (también llamado fila) representa un objeto único de datos


implícitamente estructurados en una tabla. En términos simples, una tabla de
una base de datos puede imaginarse formada de filas y columnas o campos.
Cada fila de una tabla representa un conjunto de datos relacionados, y todas
las filas de la misma tabla tienen la misma estructura.

1.4. Archivo

Un archivo es un elemento de información conformado por un conjunto de


registros. Estos registros a su vez están compuestos por una serie de
caracteres o bytes. Los archivos, alojados en dispositivos de almacenamiento
conocidos como memoria secundaria, pueden almacenarse de dos formas
diferentes: archivos convencionales o bases de datos.
1.5. Base de datos

Una base de datos es una recopilación de información relativa a un asunto o


propósito particular, como el seguimiento de pedidos de clientes o el
mantenimiento de una colección de música. Si la base de datos no está
almacenada en un equipo, o sólo están instaladas partes de la misma, puede
que deba hacer un seguimiento de información procedente de varias fuentes
en orden a coordinar y organizar la base de datos.

1. Tipos de base de datos

2.1. Base de datos operativas

Las bases de datos operativas almacenan datos detallados necesarios para


apoyar los procesos y operaciones de negocios de unas empresas.

2.2. Base de datos distribuidos

Una base de datos distribuida (BDD) es un conjunto de múltiples bases de


datos lógicamente relacionadas las cuales se encuentran distribuidas entre
diferentes sitios interconectados por una red de comunicaciones.

2.2.1. Diseño de la base de datos distribuida

En el diseño de bases de datos distribuidas se debe considerar el problema de


cómo distribuir la información entre diferentes sitios. Existen razones
organizacionales las cuales determinan en gran medida lo anterior. Sin
embargo, cuando se busca eficiencia en el acceso a la información, se deben
abordar dos problemas relacionados. Primero, como fragmentar la información.
Segundo, como asignar cada fragmento entre los diferentes sitios de la red. En
el diseño de la BDD también es importante considerar si la información está
replicada, es decir, si existen copias múltiples del mismo dato y, en este caso,
como mantener la consistencia de la información. Finalmente, una parte
importante en el diseño de una BDD se refiere al manejo del directorio. Si
existen únicamente usuarios globales, se debe manejar un solo directorio
global. Sin embargo, si existen también usuarios locales, el directorio combina
información local con información global.

2.2.2. Procesamiento de consultas

El procesamiento de consultas es de suma importancia en bases de datos


centralizadas. Sin embargo, en BDD éste adquiere una relevancia mayor. El
objetivo es convertir transacciones de usuario en instrucciones para
manipulación de datos. No obstante, el orden en que se realizan las
transacciones afecta grandemente la velocidad de respuesta del sistema. Así,
el procesamiento de consultas presenta un problema de optimización en el cual
se determina el orden en el cual se hace la menor cantidad de operaciones.
Este problema de optimización es NP-difícil, por lo que en tiempos razonables
solo se pueden obtener soluciones aproximadas. En BDD se tiene que
considerar el procesamiento local de una consulta junto con el costo de
transmisión de información al lugar en donde se solicitó la consulta.

2.2.3. Control de concurrencia

El control de concurrencia es la actividad de coordinar accesos concurrentes a


la base de datos. El control de concurrencia permite a los usuarios accesar la
base de datos en una forma multiprogramada mientras se preserva la ilusión
de que cada usuario está utilizándola solo en un sistema dedicado. El control
de concurrencia asegura que transacciones múltiples sometidas por usuarios
diferentes no interfieran unas con otras de forma que se produzcan resultados
incorrectos. En BDD el control de concurrencia es aún más complejo que en
sistemas centralizados. Los algoritmos más utilizados son variaciones de
aquellos usados en sistemas centralizados: candados de dos fases,
ordenamiento por estampas de tiempo, ordenamiento por estampas de tiempo
múltiples y control de concurrencia optimista. Un aspecto interesante del
control de concurrencia es el manejo de interbloqueos. El sistema no debe
permitir que dos o más transacciones se bloqueen entre ellas.
2.2.4. Confiabilidad

En cualquier sistema de bases de datos, centralizado o distribuido, se debe


ofrecer garantías de que la información es confiable. Así cada consulta o
actualización de la información se realiza mediante transacciones, las cuales
tienen un inicio y fin. En sistemas distribuidos, el manejo de la atomicidad y
durabilidad de las transacciones es aún más complejo, ya que una sola
transacción puede involucrar dos o más sitios de la red. Así, el control de
recuperación en sistemas distribuidos debe asegurar que el conjunto de
agentes que participan en una transacción realicen todo un compromiso
(commit) al unísono o todos al mismo tiempo restablezcan la información
anterior (roll-back).

2.3. Base de datos externas

Una base de datos externa es una base de datos que no sea la activa. Aunque
para mejorar los rendimientos es mejor adjuntarlas a la base de datos actual y
trabajar con ellas.

2.4. Base de datos hipermedias

Son las bases de datos que usan en página web multimedia.

2. Almacenes de datos y minería de datos

Un Almacén de Datos (o Data Warehouse) es una gran colección de datos que


recoge información de múltiples sistemas fuentes u operacionales dispersos, y
cuya actividad se centra en la Toma de Decisiones -es decir, en el análisis de
la información- en vez de en su captura. Una vez reunidos los datos de los
sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a
datos históricos; así los almacenes de datos proporcionan al usuario una
interfaz consolidada única para los datos, lo que hace más fácil escribir las
consultas para la toma de decisiones.
3.1. Data Warehousing

Data Warehousing es el proceso que facilita la creación y explotación de un


Almacén de Datos.

Los Sistemas de Data Warehousing incluyen funcionalidades como:

Integración de bases de datos heterogéneas (relacionales, documentales,


geográficas, archivos, etc.)

Ejecución de consultas complejas no predefinidas visualizando el resultado en


forma gráfica y en diferentes niveles de agrupamiento y totalización de datos.

Agrupamiento y des agrupamiento de datos en forma interactiva.

Análisis del problema en términos de dimensiones.

Control de calidad de datos.

3.2. Características del Almacén de Datos

Organizado en torno a temas. La información se clasifica en base a los


aspectos que son de interés para la empresa.

Integrado. Es el aspecto más importante. La integración de datos consiste en


convenciones de nombres, codificaciones consistentes, medida uniforme de
variables, etc.

Dependiente del tiempo. Esta dependencia aparece de tres formas:

La información representa los datos sobre un horizonte largo de tiempo.

Cada estructura clave contiene (implícita o explícitamente) un elemento de


tiempo (día, semana, mes, etc.).

La información, una vez registrada correctamente, no puede ser actualizada.

No volátil. El Almacén de Datos sólo permite cargar nuevos datos y acceder a


los ya almacenados, pero no permite ni borrar ni modificar los datos.
3.3. Arquitectura Data Warehouse

La estructura básica de la arquitectura Data Warehouse incluye:

Datos operacionales. Origen de datos para el componente de almacenamiento


físico del Almacén de Datos.

Extracción de datos. Selección sistemática de datos operacionales usados


para formar parte del Almacén de Datos.

Transformación de datos. Procesos para sumarizar y realizar cambios en los


datos operacionales.

Carga de datos. Inserción de datos en el Almacén.

Almacén. Almacenamiento físico de datos de al arquitectura Data Warehouse.

Herramienta de acceso. Herramientas que proveen acceso a los datos.

3.4. Estructura lógica del Almacén de Datos

La estructura lógica de un Almacén de Datos está compuesta por los


siguientes niveles:

Metadatos. Describen la estructura de los datos contenidos en el almacén.

Están en una dimensión distinta al resto de niveles.

Datos detallados actuales. Obtenidos directamente del procesado de los datos.

Forman el nivel más bajo de detalle.

Ocupan mucho espacio.

Se almacenan en disco, para facilitar el acceso.


Datos detallados históricos. Igual que los anteriores, pero con datos
correspondientes al pasado.

Se suelen almacenar en un medio externo, ya que su acceso es poco


frecuente.

Datos ligeramente resumidos. Primer nivel de agregación de los datos


detallados actuales.

Corresponden a consultas habituales.

Se almacenan en disco.

Datos muy resumidos. Son el nivel más alto de agregación.

Corresponden a consultas que se realizan muy a menudo y que se deben


obtener muy rápidamente.

Suelen estar separados del Almacén de datos, formando Supermercados de


Datos (Data Marts).

3.5. 1.7 Estructura física del Almacén de Datos

La estructura física puede presentar cualquiera de las siguientes


configuraciones:

Arquitectura centralizada. Todo el Almacén de datos se encuentra en un único


servidor.

Arquitectura distribuida. Los datos del Almacén se reparten entre varios


servidores. Asignando cada servidor a uno o varios temas lógicos.

Arquitectura distribuida por niveles. Refleja la estructura lógica del Almacén,


asignando los servidores en función del nivel de agregación de los datos que
contienen. Un servidor está dedicado para los datos de detalle, otro para los
resumidos y otro para los muy resumidos.

Cuando los datos muy resumidos se duplican en varios servidores para agilizar
el acceso se habla de Supermercados de datos (Data Marts).
3.6. Software Data Warehouse

Red Brick Warehouse

Essbase

Pilot Decission Support Suite

Microsoft SQL Server

3. Procesamiento tradicional de archivos

Proceso en los cuales los datos se organizan, almacenan y procesasen en


archivos independientes de registros de datos

4.1. Problemas del procesamiento de archivos

Redundancia no controlada, ingreso repetido del dato para actualizar los


archivos donde este. Inconsistencia de datos, el dato esta en varias partes y no
se modifica en todas cuando se actualiza.

4. Enfoque de administración de base de datos

El enfoque de procesamiento de archivos fue reemplazado por el enfoque de


administración de base de datos, como la base de los métodos modernos de
administrar datos organizativos. El enfoque de administración de base de datos
consolida de manera formal los registros de datos en archivos separados
dentro de base de datos, que pueden ser asesadas por muchos programas de
aplicación diferentes.
5. Software de administración de datos

El DBMS es un conjunto de programas que se encargan de manejar la


creación y todos los accesos a las bases de datos. Se compone de un
Lenguaje de Definición de Datos (DDL: Data Definition Languaje), de un
Lenguaje de Manipulación de Datos (DML: Data Manipulation Languaje), y de
un Lenguaje de Consulta (SQL: Structured Query Languaje).

6. Consulta de base de datos

En bases de datos, una consulta es el método para acceder a los datos en las
bases de datos. Con las consultas se puede modificar, borrar, mostrar y
agregar datos en una base de datos. Para esto se utiliza un lenguaje de
consultas. El lenguaje de consultas a base de datos más utilizado es el SQL.

7. Mantenimiento de base de datos

Dentro de las tareas habituales de Mantenimiento de las Bases de Datos se


encuentran aquellas destinadas al control y respaldo de las mismas como ser:
Control de Integridad, Chequeo de Consistencia, Copias de Seguridad o
Compactación de las bases. Pero también es necesario ejecutar trabajos de
mantenimiento cuyos objetivos sean el de mantener la performance de las
bases de datos y evitar su degradación. Esos trabajos son la Reorganización
de Índices y la Actualización de Estadísticas. Estos trabajos son
independientes del estado de la base de datos. Puede ocurrir que a la base le
falten estudios de optimización pero, al menos, mantendremos la performance
actual. Si la base se encuentra optimizada, entonces más aún, son necesarios
para evitar la degradación producto del uso continuo. Cualquiera de estos
trabajos deben realizarse fuera de línea por motivos de: alto consumo de
recurso y bloqueo de las tablas en el momento de ejecución. Por lo tanto
debemos agentarlos en horarios, en donde las bases de datos se encuentren
libres de cualquier actividad de producción. La frecuencia de ejecución de
estos trabajos depende básicamente de dos factores: tamaño de la base y
tiempo libre para ejecutarlos. La frecuencia ideal sería reorganizar todos los
índices de todas las tablas una vez por semana y, de aquellas tablas más
accedidas, una vez entre semana. La misma frecuencia sería deseable para la
actualización de las estadísticas.

8. Desarrollo de aplicaciones

Los paquetes de sistemas de administración de base de datos también


desempeñan una función primordial en el desarrollo de aplicaciones. Los
usuarios finales, analistas de sistemas y los desarrolladores de otras
aplicaciones pueden utilizar el lenguaje de programación 4GL y herramientas
de desarrollo de software integradas proporcionadas por muchos paquetes de
sistemas de administración de base de datos, para desarrollar programas de
aplicación a la medida

9. Administrador de base de datos

Es la persona encargada de definir y controlar las bases de datos corporativas,


además proporciona asesoría a los desarrolladores, usuarios y ejecutivos que
la requieran. Es la persona o equipo de personas profesionales responsables
del control y manejo del sistema de base de datos, generalmente tiene(n)
experiencia en DBMS, diseño de bases de datos, Sistemas operativos,
comunicación de datos, hardware y programación.

Un Administrador de Base de Datos de tiempo completo normalmente


tiene aptitudes técnicas para el manejo del sistema en cuestión a demás, son
cualidades deseables nociones de administración, manejo de personal e
incluso un cierto grado de diplomacia. La característica más importante que
debe poseer es un conocimiento profundo de las políticas y normas de la
empresa, así como el criterio de la empresa para aplicarlas en un momento
dado. La responsabilidad general del DBA es facilitar el desarrollo y el uso de
la Base de Datos dentro de las guías de acción definidas por la administración
de los datos.
10.1. El Administrador de Bases de Datos es responsable
primordialmente de:

10.1.1. Administrar la estructura de la Base de Datos.

Esta responsabilidad incluye participar en el diseño inicial de la base de datos y


su puesta en práctica así como controlar, y administrar sus requerimientos,
ayudando a evaluar alternativas, incluyendo los DBMS a utilizar y ayudando en
el diseño general de la bases de datos. En los casos de grandes aplicaciones
de tipo organizacional, el DBA es un gerente que supervisa el trabajo del
personal de diseño de la BD.

Una vez diseñada las bases de datos, es puesta en práctica utilizando


productos del DBMS, procediéndose entonces a la creación de los datos
(captura inicial). El DBA participa en el desarrollo de procedimientos y controles
para asegurar la calidad y la alta integridad de la BD.

Los requerimientos de los usuarios van modificándose, estos


encuentran nuevas formas o métodos para lograr sus objetivos; la tecnología
de la BD se va modificando y los fabricantes del DBMS actualizan sus
productos. Todas las modificaciones en las estructuras o procedimientos de BD
requieren de una cuidadosa administración.

10.1.2. Administrar la actividad de los datos.

El DBA no es usuario del sistema, no administra valores de datos; sino la


actividad de datos; protege los datos, no los procesa. Dado que la base de
datos es un recurso compartido, el DBA debe proporcionar estándares, guías
de acción, procedimientos de control y la documentación necesaria para
garantizar que los usuarios trabajen en forma cooperativa y complementaria al
procesar datos en la bases de datos.
10.1.3. Administrar el Sistema Manejador de Base de Datos.

Existe una gran actividad al interior de un DBMS. La concurrencia de múltiples


usuarios requiere la estandarización de los procesos de operación; el DBA es
responsable de estas especificaciones y de asegurarse que estas lleguen a
quienes concierne. Todo el ámbito de la base de datos se rige por estándares,
desde la forma de como se captura la información (tipo de dato, longitud,
formato), como es procesada y presentada. El nivel de estandarización alcanza
hasta los aspectos más internos de la base de datos; como sé acceso a un
archivo, como se determinan los índices primarios y auxiliares, registros, etc.

El DBA debe procurar siempre que los estándares que serán aplicados
beneficien también a los usuarios, privilegiando siempre la optimización en la
operación del DBMS y el apego de las políticas de la empresa. Entre las
funciones del DBA se encuentra la de revisar los estándares periódicamente
para determinar su operatividad, ajustarlos, ampliarlos o cancelarlos y hacer
que éstos se cumplan.

10.1.4. Establecer el Diccionario de Datos.

Cuando se definen estándares sobre la estructura de la base de datos, se


deben de registrarse en una sección del diccionario de datos a la que todos
aquellos usuarios relacionados con ese tipo de proceso pueden acceder. Este
metadato debe precisar información que nos indique con claridad el tipo de
datos que serán utilizados, sus ámbitos de influencia y sus limitantes de
seguridad.

10.1.5. Asegurar la confiabilidad de la Base de Datos.

Se trata de realizar un sistema de bases de datos lo suficientemente robusto


para que sea capaz de recuperarse frente a errores o usos inadecuados. Se
deben utilizar gestores con las herramientas necesarias para la reparación de
los posibles errores que las bases de datos pueden sufrir, por ejemplo tras un
corte inesperado de luz.
10.1.6. Confirmar la seguridad de la Base de Datos.

Coordinar las nuevas propuestas para realizar ajustes en los derechos de


acceso a datos compartidos y aplicaciones específicamente propuestas serían
analizados en conjunto con los supervisores o directivos de las áreas
involucradas para determinar si procede pudieran aparecer problemas cuando
dos o más grupos de usuarios quedan autorizados para notificar los mismos
datos. Uno de tales conflictos es el de la actualización perdida; este ocurre
cuando el trabajo de un usuario queda sobrescrito sobre por el de un segundo
usuario. El DBA queda responsabilizado para identificar la posible ocurrencia
de dichos problemas así como de crear normas y procedimientos para su
eliminación. Se obtendrán este tipo de garantías cuando el DBMS sea capaz
de implementar las restricciones aplicables al acceso concurrente, y este sea
utilizado adecuadamente por programadores y usuarios; para borrar lo anterior,
se hace indispensable el apego a los estándares el seguimiento de instructivos
y manuales y las reglas establecidas para los diversos procesamientos y
procedimientos que se llevan a cabo.

Entre las alternativas más utilizadas por el DBA para tratar de resolver o
minimizar este problema se encuentran las siguientes:

Restringir el acceso a los procedimientos para ciertos usuarios.

Restringir al acceso a los datos para ciertos usuarios procedimientos y/o datos.

Evitar la coincidencia de horarios para usuarios que comparten.

Las técnicas de recuperación son otra función esencial del DBA al


administrar la actividad de datos. A pesar de que el DBMS lleva a cabo una
parte del proceso de recuperación, los usuarios determinan en forma critica la
operatividad de esos sistemas de protección. El DBA debe anticipar fallas y
definir procedimientos estándares de operación; los usuarios deben saber qué
hacer cuando el sistema este caído y que es lo primero que debe realizarse
cuando el sistema este puesto en marcha nuevamente. El personal de
operación deberá saber cómo iniciar el proceso de recuperación de la BD que
copias de seguridad utilizar; como programar la re ejecución del tiempo perdido
y de las tareas pendientes; es importante también establecer un calendario
para llevar a cabo estas actividades sin afectar a otros sistemas dentro de la
organización que hagan uso de los mismos recursos de computo. Destacan
por su importancia en el proceso de recuperación y a su vez en la atención que
prestan a otros sectores de la organización. Los dispositivos de comunicación
remota, los sistemas de interconexión y otros accesorios de uso compartido.

El DBA es el responsable de la publicación y mantenimiento de la


documentación en relación con la actividad de los datos, incluyendo los
estándares de la BD, los derechos de recuperación y de acceso a la BD, los
estándares para la recuperación de caídas y el cumplimiento de las políticas
establecidas. Los productos DBMS más populares que se encuentran en el
mercado proporcionan servicios de utilerías para ayudar al DBA en la
administración de los datos y su actividad. Algunos sistemas registran en forma
automática los nombres de los usuarios y de las aplicaciones a las que tienen
acceso así como a otros objetos de la BD. Incorpora también utilerías que
permitan definir en el diccionario de datos las restricciones para que
determinadas aplicaciones o módulos de ellas solo tengan acceso a
segmentos específicos de la BD.

10. Estructura de base de datos

La estructura de una base de datos hace referencia a los tipos de datos, los
vínculos o relaciones y las restricciones que deben cumplir esos datos
(integridad de datos y redundancia de datos). La estructura de una base de
datos es diseñada o descripta empleando algún tipo de modelo de datos.

11.1. Estructura jerárquica

Una Base de datos jerárquica es un tipo de Sistema Gestor de Bases de Datos


que, como su nombre indica, almacenan la información en una estructura
jerárquica que enlaza los registros en forma de estructura de árbol (similar a un
árbol visto al revés), en donde un nodo padre de información puede tener
varios nodos hijo.
Esta relación jerárquica no es estrictamente obligatoria, de manera que pueden
establecerse relaciones entre nodos hermanos. En este caso la estructura en
forma de árbol se convierte en una estructura en forma de grafo dirigido.

11.2. Estructura de red

Una base de datos de red es una base de datos conformada por una colección
o set de registros, los cuales están conectados entre sí por medio de enlaces
en una red. El registro es similar al de una entidad como las empleadas en el
modelo relacional.

Un registro es una colección o conjunto de campos (atributos), donde cada uno


de los que contiene solamente un único valor almacenado, exclusivamente el
enlace es la asociación entre dos registros, así que podemos verla como una
relación estrictamente binaria.

Una estructura de base de datos de red, llamada algunas veces estructura de


plex, abarca más que la estructura de árbol, porque un nodo hijo en la
estructura red puede tener más de un nodo padre. En otras palabras, la
restricción de que en un árbol jerárquico cada hijo puede tener sólo un padre,
se hace menos severa.

Así, la estructura de árbol se puede considerar como un caso especial de la


estructura de red.

11.3. Estructura relacional

Una base de datos relacional es una base de datos que cumple con el modelo
relacional, el cual es el modelo más utilizado en la actualidad para implementar
bases de datos ya planificadas. Permiten establecer interconexiones
(relaciones) entre los datos (que están guardados en tablas), y a traves de
dichas conexiones relacionar los datos de ambas tablas, de ahí proviene su
nombre: "Modelo Relacional". Tras ser postuladas sus bases en 1970 por
Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó
en consolidarse como un nuevo paradigma en los modelos de base de datos.

11.4. Estructura multidimensional


Las bases de datos multidimensionales se utilizan principalmente para crear
aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su
peculiaridad es que por cada dimensión tienen un campo (o columna), y otro
campo por cada métrica o hecho, es decir estas tablas almacenan registros
cuyos campos son de la forma:

(d1,d2,d3,...,f1,f2,f3,...)

Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los
campos 'fi' a las métricas o hechos que se quiere almacenar, estudiar o
analizar.

11.5. Estructura orientada a objetos

Una base de datos o banco de datos (en ocasiones abreviada BB.DD.) es un


conjunto de datos pertenecientes a un mismo contexto y almacenados
sistemáticamente para su posterior uso. En este sentido, una biblioteca puede
considerarse una base de datos compuesta en su mayoría por documentos y
textos impresos en papel e indexados para su consulta. En la actualidad, y
debido al desarrollo tecnológico de campos como la informática y la
electrónica, la mayoría de las bases de datos están en formato digital
(electrónico), que ofrece un amplio rango de soluciones al problema de
almacenar datos.

Existen programas denominados sistemas gestores de bases de datos,


abreviados SGBD, que permiten almacenar y posteriormente acceder a los
datos de forma rápida y estructurada. Las propiedades de estos SGBD, así
como su utilización y administración, se estudian dentro del ámbito de la
informática.

Las aplicaciones más usuales son para la gestión de empresas e instituciones


públicas. También son ampliamente utilizadas en entornos científicos con el
objeto de almacenar la información experimental.
11. Evaluación de las estructura de base de datos

12. Desarrollo de base de datos

Las BDOO se desarrollan al describir en primer lugar los tipos de objetos


importantes del dominio de aquellos tipos de objetos. Estos tipos de objetos
determinan las clases que conformarán la definición de la BDOO.

Tres Enfoques de Construcción de Bases de Datos OO

Las BDOO se pueden construir mediante alguno de los tres enfoques


siguientes:

El Primero.- se puede utilizar el código actual altamente complejo de los


sistemas de administración de las bases de datos, de modo que una BDOO se
implante más rápido sin tener que iniciar de cero. Las técnicas orientadas a
objetos se pueden utilizar como medios para el diseño sencillo de sistemas
complejos. Los sistemas se construyen a partir de componentes ya probados
con un formato definido para las solicitudes de las operaciones del
componente.

El Segundo: considera a la BDOO como una extensión de la tecnología de las


bases de datos por relación. De este modo, las herramientas, técnicas, y vasta
experiencia de la tecnología por relación se utilizan para construir un nuevo
SABD. Se pueden añadir apuntadores a las tablas de relación para ligarlas con
objetos binarios de gran tamaño (BLOB). La base de datos también debe
proporcionar a las aplicaciones clientes un acceso aleatorio y por partes a
grandes objetos, con el fin de que sólo sea necesario recuperar a través de la
red la parte solicitada de los datos.

El Tercero: reflexiona sobre la arquitectura de los sistemas de bases de datos


y produce una nueva arquitectura optimizada, que cumple las necesidades de
la tecnología OO. Las compañías como Versant, Objectivity, Itasca, etc.
Utilizan esté enfoque y afirman que la tecnología de relación es un subconjunto
de una capacidad más general. Además que las BDOO no de relación son
aproximadamente dos veces más rápidas que las bases de datos por relación
para almacenar y recuperar la información compleja. Por lo tanto, son
esenciales en aplicaciones como CAD y permitirían que un depósito CASE
fuera una facilidad de tiempo real en vez de una facilidad por lotes.
La Arquitectura de Versant está designada al soporte Cliente/Servidor con
acercamiento a la computación distribuida; cualquier aplicación de Cliente el
servidor la procesa, usa las EDT y las máquinas servidoras que pueden
cooperar en una BD distribuida de Versant. Las BD pueden estar levantadas
como un sistema m-Cliente/n-Servidor.

Un servidor en el medioambiente de Versant es una máquina que está


corriendo los procesos del servidor, esta soporta accesos concurrentes por
usuarios múltiples de una o más BD. Un cliente es un proceso de aplicación
este tiene acceso a espacios de trabajo de BD persistentes privadas y en
adición puede accesar diversas BD sobre servidores concurrentes con otras
aplicaciones de cliente.

13. Planeación de datos y diseño de base de datos

El primer paso al crear una base de datos consiste en elaborar un plan que
sirva de guía para la implementación de la base de datos y, al mismo tiempo,
como especificación funcional después de su implementación. La complejidad
y los detalles de diseño de una base de datos dependen de la complejidad y el
tamaño de la aplicación de bases de datos, así como de los usuarios.

La naturaleza y complejidad de una aplicación de bases de datos, así como el


proceso de diseño, pueden variar significativamente. Una base de datos puede
ser relativamente sencilla y estar diseñada para que la utilice una sola persona,
o bien ser grande y compleja, y estar diseñada para procesar, por ejemplo, las
transacciones bancarias de miles de clientes. En el primer caso, el diseño de la
base de datos puede consistir en poco más que unas anotaciones en un papel.
En el segundo caso, el diseño puede ser un documento formal de cientos de
páginas que contenga todos y cada uno de los posibles detalles relacionados
con la base de datos.
Al diseñar la base de datos, independientemente de su tamaño y complejidad,
lleve a cabo los siguientes pasos básicos:

 Recopile la información.

 Identifique los objetos.

 Cree modelos de los objetos.

 Identifique los tipos de información para cada objeto.

 Identifique las relaciones entre los objetos.

14.1. Recopilar la información

Antes de crear una base de datos, debe conocer con detalle el cometido
previsto de la base de datos. Si la base de datos va a reemplazar a un sistema
de información manual o en papel, dicho sistema le proporcionará la mayor
parte de la información que necesita. Debería consultar a todas las personas
involucradas en el sistema para determinar lo que hacen y qué necesitan de la
base de datos. También es importante identificar qué es lo que desean que
haga el nuevo sistema, así como los problemas, las limitaciones y los cuellos
de botella del sistema existente. Recopile copias de las instrucciones del
cliente, listas de inventarios, informes de administración y, en general, de todos
aquellos documentos que formen parte del sistema existente, porque le
servirán para diseñar la base de datos y las interfaces.

14.2. Identificar los objetos

Durante el proceso de recopilación de información, deberá identificar los


objetos o las entidades más importantes que vayan a ser administrados por la
base de datos. El objeto puede ser tangible (una persona o un producto, por
ejemplo) o bien intangible (como una transacción empresarial, un
departamento de una compañía o un período de liquidación de nóminas).
Normalmente hay unos cuantos objetos principales; una vez identificados, se
evidencian los elementos relacionados. Cada elemento diferenciado de la base
de datos debe tener su tabla correspondiente.
El objeto principal de la base de datos de ejemplo AdventureWorks2008R2 que
se incluye con SQL Server es una bicicleta. Los objetos relacionados con la
bicicleta en las operaciones empresariales de esta compañía son los
empleados que fabrican la bicicleta, los proveedores que venden los
componentes utilizados para fabricar la bicicleta, los clientes que los compran y
las transacciones comerciales realizadas con los clientes. Cada uno de estos
objetos es una tabla de la base de datos.

14.3. Crear un modelo de los objetos

Cuando se identifican los objetos del sistema, debería registrarlos de una


manera que represente visualmente el sistema. Puede utilizar su modelo de
base de datos como referencia durante la implementación de la misma.

Con este propósito, los programadores de bases de datos utilizan herramientas


que varían en complejidad técnica: desde papel y bolígrafo hasta procesadores
de texto y hojas de cálculo e, incluso, programas de software creados
específicamente para la elaboración de modelos de datos destinados al diseño
de bases de datos. Sea cual sea la herramienta que decida utilizar, es
importante que la mantenga actualizada.

14.4. Identificar los tipos de información para cada objeto

Una vez identificados los objetos principales de la base de datos como


candidatos para las tablas, el siguiente paso es identificar los tipos de
información que deben almacenarse para cada objeto. Estos tipos son las
columnas de la tabla del objeto. Las columnas de una tabla de base de datos
contienen algunos tipos de información comunes:

Columnas de datos sin procesar

Estas columnas almacenan información tangible, como por ejemplo nombres,


determinada por un origen externo a la base de datos.

Columnas de categorías
Estas columnas clasifican o agrupan los datos y almacenan una selección
limitada de datos, tales como verdadero o falso; casado o soltero; presidente,
director o responsable de equipo; etc.

Columnas de identificadores

Estas columnas proporcionan un mecanismo para identificar cada elemento


almacenado en la tabla. Estas columnas suelen incluir un Id. o un número en el
nombre (por ejemplo, IdDeEmpleado, númeroDeFactura y IdDeEditor. La
columna del identificador es el componente principal para los usuarios y las
funciones internas de proceso de la base de datos para el acceso a una fila de
datos de la tabla. Algunas veces el objeto tiene una forma tangible de Id.
utilizada en la tabla (por ejemplo, un número de la seguridad social), aunque en
la mayoría de los casos se puede definir la tabla para poder crear un Id.
confiable y artificial para la fila.

Columnas relacionales o diferenciales

Estas columnas establecen un vínculo entre la información de una tabla y la


información relacionada que se encuentra en otra tabla. Por ejemplo, una tabla
que realiza el seguimiento de transacciones comerciales puede tener un
vínculo con una tabla clientes, de modo que pueda asociarse toda la
información del cliente a la transacción comercial.

14.5. Identificar la relación entre objetos

Uno de los puntos fuertes de una base de datos relacional es la posibilidad de


relacionar o asociar información acerca de varios elementos de la base de
datos. Pueden almacenarse por separado tipos aislados de información, pero
el motor de base de datos puede combinar los datos cuando sea necesario.
Para identificar la relación entre los objetos durante el proceso de diseño se
necesita llevar a cabo un examen de las tablas con el fin de determinar sus
relaciones lógicas y agregar columnas relacionales que establezcan un vínculo
entre las tablas.

Por ejemplo, el diseñador de la base de datos AdventureWorks2008R2 ha


creado tablas para los productos y modelos de producto de la base de datos.
La tabla Production.Product contiene información de cada producto que incluye
una columna de identificador denominada ProductID, así como columnas de
datos para el nombre, el precio, el color, el tamaño y el peso del producto. La
tabla contiene columnas de categorías, como Class o Style, que permiten
agrupar los productos por estos tipos. Cada producto tiene también un modelo
del producto, pero esa información se almacena en otra tabla. Por lo tanto, la
tabla Production.Product tiene la columna ProductModelID solo para almacenar
el Id. Del modelo del producto. Cuando se agrega una fila de datos para un
producto, el valor de ProductModelID debe existir en la tabla
Production.ProductModel.
Conclusión

Destacamos que el manejo de información en una empresa es vital sin ella la


empresa no lograra tener un éxito o no tendrá la capacidad de competir en el
mercado, por ello se hace la utilización de la base de datos para administrar y
llevar un orden en el manejo de las información.
Caso práctico I

Argosy Gaming Co: Retos en la construcción de un almacén de datos

Preguntas del practicó de estudio

1. ¿Cuál es el valor de negocio de un almacén de datos? Utilice a Argosy Gaming


como ejemplo.

El valor de una almacén de datos es muy importante en la toma de decisiones,


por ende es muy crucial administra de manera ordenada y segura. En el caso
de Argosy Gaming su valor fue un elemento clave para realizar los proceso de
automatización y el ETL (extracción, transformación y carga)

2. ¿Por qué Argosy Gaming utilizo una herramienta de software de extracción,


transformación y carga? ¿Qué beneficio y problemas surgieron? ¿Cómo los
resolvieron?

Argosy Gaming tenía las informaciones divididas y los juegos tenían reglas
diferentes por eso los especialistas usa un sistema de ETL. Los beneficios son
reunir los datos en un solo sistema, satifacer los crecientes flujos de datos y las
futuras demandas de información. Los problemas que surgieron son: La
extracción de las informaciones en fuentes diferentes, transformar las
informaciones extraídas, y cargar las informaciones. Para resolver los
problemas se proceden a reordenar los campos desde un registro desde el
sistema origen.

3. ¿Cuáles son algunas de las principales responsabilidades que los


profesionales y los administradores de negocio tienen en el desarrollo de
almacén de datos? a Argosy Gaming como ejemplo.

 Manejar las información de manera ordenada y segura


 Buscar soluciones alternativas en la resolución de problemas
 Administrar los datos por el buen manejo de los datos

Caso de practicó II
Harrah’s entertainmente y otras: La protección de las joyas de la información

Preguntas.

1. ¿Por qué los desarrolladores de TI han ayudado a incrementar el valor de los


recursos de datos de muchas empresas?

En primer lugar, con el uso de una base de datos de clientes y unas


herramientas analíticas de soporte a la toma de decisiones con lo que lograron
ampliar aún más el espacio que les separa de las empresas

Operadoras de casinos cuya estrategia de incentivo se basa más en la


intuición que en la evidencia. En segundo lugar, ofrecen la excelencia de
servicio que todo cliente exige. En pocas palabras, lo que les ha llevado al
liderazgo ha sido el uso exhaustivo de la extracción de datos de su base de
datos de clientes

Junto con la puesta en marcha de experimentos de mercado y la aplicación


final de los resultados obtenidos, que a su vez han sido aprovechados para
crear e implantar estrategias de marketing y oferta de servicios

Consistía en un programa de tarjetas destinadas a cada jugador que se basaba


en el diseño de

Las iniciativas emprendidas por las compañías aéreas para premiar la


frecuencia de uso de los clientes. “Total Gold” fue lanzado en 1997, y su
intención era la de incentivar a los clientes habituales para que visitasen los
establecimientos de Harrah’s diseminados por todo el país. La idea era que los
clientes insertaban la tarjeta en las máquinas tragaperras y de esta forma
acumulaban puntos cada vez que jugaban. Finalmente recibían un premio, que
era el paquete habitual en la oferta de cualquier casino: habitaciones de hotel,
comidas, entradas para espectáculos y vales de regalo, todo ello gratis. Sin
embargo, el programa tenía 3 inconvenientes:

• No se diferenciaba de la competencia

• El programa carecía de uniformidad

• Los clientes interesados en el juego no se encontraban con alicientes que los


incitarán a elegir a Harrah’s como establecimiento habitual

2. Como han incrementar estas capacidades los retos de seguridad asociados


con la protección de los recursos de datos de una empresa

Los retos de seguridad siempre han sido un reto para las empresas debido a
que las personas que laboran en los departamento de TI suelen llevar
información importante, para eso se utilizar software diseñado para eso como
Opsware Inc y servicio de escaneo de correo electrónico que permite analizar
los mensajes que sospeche que podría tener archivo de propiedad.

3. ¿Cómo pueden las empresas utilizar la TI para satisfacer los retos de


seguridad de los recursos de datos

 Utilizan software de seguridad


 Utilizan firewall
 U hacer uso de escaneo de correo electrónica saliente de la empresa.

También podría gustarte