Está en la página 1de 20

Sistema de bases de datos e inteligencia de negocios

Introducción:
En la actualidad las organizaciones manejan una gran cantidad de información, al ser estos
datos parte fundamental, por lo cual debe tenerlos almacenados en una base de datos y
manejados de una forma autónoma para poder evitar la pérdida de tiempo dinero lo cual
generaría perjuicios para la corporación.
Uno de los pasos fundamentales en el proceso de la construcción de una aplicación fiable en
el mundo real es el diseño de la base de datos. La complejidad en el diseño de la base de
datos, dependerá de cuanta y que tipo de información será almacenada en la misma y es
irrepetible. Pero todo se basará en los principios que trataremos en el presente documento.

Comenzaremos por un caso modelo sobre el manejo de grandes flujos de información de


manera eficiente. Wal-Mart es una de las empresas transnacionales más exitosa con cerca de
800 millones transacciones diarias. Podemos notar la gran cantidad de tráfico de datos se
deben realizar en un periodo corto para tomar decisiones acertadas.
La tecnología de almacenamiento se basa en el Neoview creado por la empresa HP. Este
sistema recurre a la recolección de información de administrativos y empleados. Básicamente
este sistema, al poder recolectar información de diversas fuentes tanto externas como internas
pude predecir tendencias de consumo de los productos vendidos, lo cual le genera una ventaja
ante la competencia. Al ser la información procesada de una manera entendible pude ser
interpretados por todos los eslabones en la cadena de mando de la empresa, por lo cual la
toma de decisiones se hace más sencillo a lo largo del tiempo.
Según Delobel,1992 “Conjunto estructurado de datos registrados sobre soportes accesibles
por ordenador para satisfacer simultáneamente a varios usuarios de forma selectiva y en
tiempo oportuno”. Podemos afirmar que las bases de datos son un conglomerado de datos
que por sí solos no representa mayor importancia, pero al ser estructurado de manera
coherente genera información de interés para el consultante. De igual manera Elsmari y
Navathe,1989 “Colección de datos interrelacionados” concuerda con lo afirmado
anteriormente.
Por otro lado, Frank, 1988 “Conjunto de ficheros maestros, organizados y administrados de
una manera flexible de un modo que los ficheros puedan ser fácilmente adaptados a nuevas
tareas imprevisibles”. Podemos entender que las bases de datos son el conjunto de ficheros
maestros los cuales se encargan de forma constante de actualizar campos de información para
una disponibilidad actualizada de los archivos para una oportuna toma de decisiones por el
consultante, de igual manera deben estar preparadas para situaciones imprevistas en el
contexto exterior a las misma y ser una fuente fiable bajo cualquier circunstancia de la
información.
En conclusión, podemos afirmar que una base de datos es un conjunto interrelacionados de
ficheros maestros estructurados de manera selectiva para la proporción de información
actualizada, constante y preparada para adecuarse a las situaciones imprevistas.
De esta manera afirmamos que es los cimientos de los proyectos de desarrollo. Paralelamente
existe programas como los DBMS se encargan de la manipulación de datos y brinda una
interfaz amigable para la consulta.

Administración de datos
Jerarquía de datos:
En la mayoría de los casos los datos están organizados de manera que comienza con la unidad
más pequeña de información (bit) y de manera sucesiva se llega a formar la base de datos.
Al continuar en la jerarquía de la base de datos, nos encontramos con el campo el cual esta
conformadora los caracteres que describen un atributo de un objeto; a su vez el conjunto de
campos da lugar a los registros los cuales están relacionados de igual manera forma un
archivo que es el conjunto de registros ordenados de manera coherente para dar una
información de acuerdo al contexto en el cual se le haga la consulta.
Entidades, Atributos y llaves de datos
Procedamos a definir los conceptos propuestos. Afirmaremos que la entidad de la clase
generalizada de personas lugares o cosas para los cuales se recaban y mantienen datos. De
manera distinta un atributo es una característica relevante de una entidad, lo cual le da un
valor especifico con respecto al resto. Afirmamos que tanto las entidades como los atributos
son cruciales en las bases de datos por lo que representan en su conjunto.
La llave constituye un registro utilizado para identificar este, de manera similar la llave
primaria representa un medio de identificación único en un registro, de tal manera ningún
registro puede llevar la misma clase primaria por el uso de identificación entre los registros
para poder modificar, acceso y organizar. Para una mayor fiabilidad en la base datos, se
recurre a la llave secundaria la cual guarda mayor información relacionada al individuo u
objeto, con la posibilidad de almacenar mayor información que la llave primaria.
Enfoque de la base de datos:
Bajo el enfoque tradicional de la base de datos, al momento de realizar una consulta las
aplicaciones un archivo independiente diseñado para esa aplicación en específico, es decir se
encuentran aislados de otros aplicativos de consulta. En la actualidad se usa el enfoque de
base datos para la administración de datos, en el cual múltiples aplicaciones comparten
información entre si lo cual genera una red de información mucho más amplio y diverso.
Esto se logra con el DBMS que utiliza un grupo de programas que genera una interfaz entre
las bases de datos, el usuario y los programas de aplicación.
Modelado de datos y características de la base de datos

Una base de datos debe diseñarse para almacenar y organizar los datos que puede haber en
un negocio y ofrecer un rápido acceso a ellos así como para modificarlos y reflejar los
procesos de negocios de una organización. Para construirla se debe tener en cuenta:

 Contenido: los datos que deben recabarse y sus costos.


 Acceso: los datos que se van a proporcionarse a que usuarios y cuando.
 Estructura Lógica: como estarán dispuestos los datos.
 Organización Física: donde deben almacenarse los datos.

Modelado de base de datos

Entre las consideraciones clave que se deben tomar en cuenta para organizar los datos en una
base se encuentran la determinación de qué datos almacenar, quién tendrá acceso a ellos y de
qué forma se utilizarán.
El diseño lógico es un modelo abstracto de la forma en que deben estar estructurados y
dispuestos los datos para satisfacer las necesidades informativas de una organización. Por
ello, involucra la identificación de las relaciones entre los elementos de datos y su agrupación
de manera ordenada. Debido a que las bases de datos proporcionan la entrada a, y la salida
de los sistemas de información de un negocio, los usuarios de todas las áreas funcionales
deben ayudar a crear el diseño lógico con el fi n de garantizar que sus necesidades sean
identificadas y satisfechas.
El diseño físico comienza en el diseño lógico de la base de datos y lo adapta considerando el
desempeño y costo.
Una de las herramientas que usan los diseñadores de bases de datos para representar las
relaciones lógicas entre éstos es el modelo de datos, que no es otra cosa que un diagrama
que muestra las entidades y las relaciones que existen entre ellas. Por lo general, el modelado
de datos involucra la comprensión de un problema específico de negocios y el análisis de los
datos y la información necesaria para llegar a una solución.
Los diagramas entidad-relación (ER) utilizan símbolos gráficos básicos para mostrar la
organización y las relaciones entre los datos, los diagramas (ER) muestran los elementos de
datos en forma de tablas (entidades), así como la forma en que se relacionan.
Los diagramas (ER) ayudan a garantizar que las relaciones entre las entidades de una base de
datos estén correctamente estructuradas, de tal forma que cualquier programa de aplicación
que se desarrolle sea consistente con las operaciones del negocio y las necesidades del
usuario.

Modelo de base de datos relacional


El modelo relacional describe los datos mediante el uso de un formato tabular estándar. En
una base de datos estructurada de acuerdo con este modelo, todos los elementos de datos se
colocan en tablas bidimensionales llamadas relaciones, que constituyen el equivalente lógico
de los archivos. Las tablas de las bases de datos relacionales organizan los datos en renglones
y columnas, es decir, simplifican su acceso y manejo.
En el modelo relacional, cada renglón (registro) de una tabla representa una entidad de datos,
mientras que cada columna (campo) representa atributos, cada uno de los cuales sólo puede
aceptar ciertos valores, que cuando están permitidos, se llaman dominio. El dominio de un
atributo en particular indica qué valores pueden colocarse en cada columna de la tabla
relacional.

Manejo de datos

Después de ingresar los datos en una base relacional, los usuarios los consultan y analizan.
Entre las operaciones básicas que se pueden hacer con los datos se encuentran la selección,
la proyección y la unión.
 Selección involucra la eliminación de renglones de acuerdo con cierto criterio.
 Proyección Manipulación de datos para eliminar columnas en una tabla.
 Unión Manipulación de datos para combinar dos o más tablas.

Siempre y cuando compartan al menos un atributo de datos, las tablas de una base de datos
relacional se pueden enlazar para brindar información y reportes útiles. Ser capaz de enlazar
tablas entre sí a través de atributos de datos comunes representa uno de los aspectos
principales de la flexibilidad y capacidad de las bases de datos relacionales.

Diagrama ER simplificado que


muestra la relación entre las
tablas gerente, departamento
y proyecto.
Figura

Enlace de tablas de datos para atender una consulta


Para encontrar el nombre y la fecha de contratación del gerente que trabaja en el proyecto
del manual de ventas, el presidente necesita tres tablas: proyecto, departamento y gerente.
La descripción del proyecto (manual de ventas) nos lleva al número de departamento (598)
en la tabla de proyecto, la cual nos conduce al NSS del gerente (098-40-1370) en la tabla de
departamento, que a su vez nos guía hasta el nombre del gerente (Fiske) y la fecha de su
contratación (01-05-1985) registrada en la tabla degerente. Observe que algunas

organizaciones utilizan el número deseguro social (NSS) en vez del número de empleado.
Una de las ventajas principales de la base de datos relacional es que permite enlazar tablas
como se muestra en la tabla anterior. Este enlace es de suma utilidad cuando se necesita
información de múltiples tablas. Por ejemplo, el número del seguro social del gerente se
conserva en la tabla gerente. Si se llegara a necesitar este número, se puede obtener
mediante un enlace con dicha tabla.

El modelo de base de datos relacional es, de manera definitiva, el que más se emplea
en la actualidad. Es más fácil de controlar, más flexible y más intuitivo que otros
modelos, debido a que su organización se basa en la utilización de tablas.

Debido a las ventajas del modelo relacional, muchas compañías lo usan en grandes bases de
datos corporativas como las de marketing y contabilidad. Este modelo se utiliza con
computadoras personales y sistemas mainframe.

Diseño y modificación de una base de datos relacional


Las bases de datos relacionales proporcionan muchas herramientas, consejos y atajos para
simplificar el proceso de diseño y modificación de una base de datos.
Depuración de datos
Proceso de búsqueda y reparación de inconsistencias para garantizar que los datos sean
precisos y completos.

Los datos valiosos son precisos, completos, económicos, flexibles, confiables, relevantes,
sencillos, oportunos, verificables, accesibles y seguros. La base de datos también debe estar
diseñada de manera adecuada. El propósito de la depuración de datos es desarrollarlos con
estas características. Considere la base de datos de un centro deportivo diseñada para
registrar los pagos de los socios. La tabla contiene los atributos nombre, número telefónico,
género, cuotas pagadas y fecha de pagos. Como se muestra en los registros de la tabla,
Anita Brown y Sim Thomas ya pagaron sus cuotas del mes de septiembre. Sim liquidó su
cuota en dos pagos. Observe que ninguna llave primaria identifica de manera única cada
registro. Como se verá a continuación, este problema debe corregirse.

Tabla de
Pago de
cuotas del
centro
deportivo
Debido a que Sim Thomas pagó su cuota dos veces en el mes de septiembre, los datos que
se encuentran en la base son redundantes. El nombre, número telefónico y género de Tomas
aparece en dos registros. Observe también que los datos son inconsistentes: Thomas cambió
su número telefónico, pero sólo uno de los registros refleja el cambio. Algo que reduce aún
más la confiabilidad de esta base de datos es la falta de una llave primaria que identifica de
manera única el registro de Sim Thomas. El primer Thomas podría ser Sim, pero el
segundo podría ser Steve Thomas. Dichos problemas e irregularidades en los datos se
llaman anomalías y, a menudo, dan como resultado información incorrecta, lo que ocasiona
que los usuarios de la base no obtengan información confiable acerca de las condiciones
reales. Las anomalías deben corregirse. Para resolver estos problemas que enfrenta el centro
deportivo, podemos agregar una llave primaria como el número de socio, y poner los datos
en dos tablas: una tabla de los socios del centro deportivo con su género, número telefónico
e información relacionada, y otra de cuotas pagadas con el monto del pago y la fecha.
Ambas tablas incluyen el atributo número de socio, de tal forma que se pueden enlazar.

Tabla de
Socios
del
centro

deportivo

Tabla de
Cuotas pagadas
Las relaciones de las tablas reducen la redundancia y eliminan el problema potencial que
representa tener dos números telefónicos diferentes para un mismo socio. Asimismo,
observe que el nos proporciona una llave primaria a cada registro de la tabla Socios del
centro deportivo. Debido a que la tabla Cuotas pagadas muestra dos registros de pago (15
dólares cada uno) con el mismo número de socio (ns656), sólo una persona hizo los pagos,
no dos. A menudo se utilizan métodos de formalización, por ejemplo, la normalización de
bases de datos, para depurar problemas que pudieran presentar los datos.

SISTEMAS DE ADMINISTRACIÓN DE BASES DE DATOS

El diseño e implantación del sistema de base de datos correcto garantiza que esta
herramienta soportará actividades y objetivos de negocios. Sin embargo, ¿de qué forma, en
realidad, diseñamos, implantamos, usamos y actualizamos una base de datos? La respuesta
la podemos encontrar en el sistema de administración de base de datos. Como ya se
comentó, un dbms es un grupo de programas que se utilizan como interfaz entre una base
de datos y los programas de aplicación, o entre una base de datos y el usuario. Sin embargo,
las facilidades y tipos de sistemas de bases de datos varían de manera notable.

Panorama de los tipos de bases de datos


Los sistemas de administración de bases de datos pueden variar desde pequeños paquetes
de software no muy costosos, hasta complejos sistemas que cuestan cientos de miles de
dólares. Las secciones siguientes analizan algunas de las alternativas más comunes.

Archivo plano

Un archivo plano consiste en un simple programa de base de datos cuyos registros no están
relacionados entre sí. Con frecuencia, se utiliza para almacenar y manipular una sola tabla o
archivo y no usa ninguno de los modelos de bases de datos que ya se estudiaron, como el
modelo relacional. Muchos programas de hoja de cálculo y procesador de palabra cuentan
con facilidades de archivo plano. Estos paquetes de software pueden clasificar tablas y
efectuar cálculos y comparaciones sencillas. OneNote, de Microsoft, está diseñado para que
la gente escriba ideas, pensamientos y notas en un archivo de computadora. Cuando se
emplea este programa, cada nota puede colocarse en cualquier lugar de la página o en una
caja dentro de ésta llamada contenedor.
Un solo usuario

Por lo general, una base de datos instalada en una computadora personal es para un solo
usuario. Office
Access y FileMaker Pro, de Microsoft, están diseñadas para soportar implantaciones de un
solo usuario.
InfoPath, también de Microsoft, constituye otro ejemplo de un programa de base de datos
que soporta a un solo usuario. Este software es parte de la suite Office que ayuda a las
personas a recabar y organizar información proveniente de un número variado de fuentes.
Además, cuenta con formas integradas que se utilizan para ingresar información acerca de
gastos, datos de horarios y una gran variedad de información.

Múltiples usuarios

Los negocios pequeños, medianos y grandes necesitan dbms multiusuario para compartir
información con
toda la organización a través de una red. Estos sistemas, más caros y poderosos, permiten
que decenas o cientos de personas accedan al mismo sistema de base de datos de manera
simultánea. Entre los proveedores más populares de sistemas de bases de datos
multiusuario destacan Oracle, Microsoft, Sybase e IBM. Un gran número de bases de datos
para un solo usuario como Access puede implantarse para soporte multiusuario a través de
una red, aunque a veces estas bases están limitadas en cuanto a la cantidad de usuarios que
pueden soportar. Todos los dbms comparten funciones comunes, como ofrecer una vista al
usuario, el almacenamiento y recuperación física de datos de la base de datos, modifi car
ésta, manipular los datos y generar reportes. Con estas herramientas se manejan las tareas
más complejas de procesamiento de datos y, debido a que son accesadas a través de una
red, una base de datos puede dar servicio en muchos sitios en todo el mundo

Una vista al usuario

Debido a que el dbms es responsable del acceso a la base de datos, uno de los primeros
pasos de la instalación y uso de una base de datos de gran tamaño implica informar al dbms
acerca de la estructura lógica y física de los datos y las relaciones entre los que
corresponden a cada usuario. A esta descripción se le llama esquema (como un diagrama
esquemático). Por lo general, los grandes sistemas de bases de datos, como Oracle, utilizan
esquemas para definir las tablas y otras características de las bases de datos asociadas con
una persona o usuario.

Creación y modificación de la base de datos

Los esquemas se ingresan al dbms (por lo general, a través del personal encargado de la
base de datos)
mediante el empleo de un lenguaje de defi nición de datos (DDL, por sus siglas en inglés:
data definition language), que no es otra cosa que un conjunto de instrucciones y comandos
que se usan para definir y describir los datos y relaciones en una base de datos específica.
Un ddl permite al diseñador de la base de datos describirlos y las relaciones que contendrá
el esquema. En general, un ddl describe trayectorias de acceso lógicas y registros lógicos de
la base de datos. Se muestra un ejemplo simplificado de un ddl que se empleó para
desarrollar un esquema general. Las X que aparecen en la figura revelan dónde debe
ingresarse la información específi ca relacionada con la base de datos. Las expresiones
descripción de archivos, descripción de áreas, descripción de registros y descripción de
conjuntos son términos que el ddl define y emplea en este ejemplo. Pueden utilizarse otros
términos y comandos según el dbms en particular que se utilice.

Otra etapa importante en la creación de una base de datos consiste en establecer un


diccionario de
datos, esto es, una descripción detallada de todos los que se utilizan en la base de datos.
Dicho diccionario contiene la información siguientes:

• Nombre del elemento de datos.


• Alias u otros nombres que pueden utilizarse para describir el elemento.
• Rango de valores que pueden utilizarse.
• Tipo de datos (por ejemplo, alfanuméricos o numéricos).
• Cantidad de espacio de almacenamiento necesario para el elemento.
• Datos acerca de la persona responsable de actualizar el diccionario y de los diferentes
usuarios que pueden tener acceso a él.
• Lista de los reportes que utilizan el elemento de datos.

ALMACENAMIENTO Y RECUPERACION DE DATOS


Una función del DBMS es servir como interfaz entre un programa de aplicación y la base
de datos. Cuando un programa de aplicación necesita datos, los solicita a través de un
DBMS.
El programa de aplicación solicita estos datos al DBMS. En el proceso, el programa sigue
una trayectoria lógica de acceso. Enseguida, el DBMS, que trabaja en conjunto con los
diferentes programas del sistema, accede a un dispositivo de almacenamiento, por ejemplo,
una unidad de disco donde se almacenan los datos.

MANIPULACION DE DATOS Y GENERACION DE REPORTES


Una vez que el DBMS se encuentra instalado, los empleados, administradores y
consumidores pueden usarlo para revisar los reportes y obtener información relevante.
Los comandos de la base de datos se utilizan en un lenguaje de programación. Por ejemplo,
los comandos de C++ pueden utilizarse en programas simples que accederán o manipularán
ciertas secciones en la base de datos
En general, los comandos que se utilizan para manipular la base de datos son parte del
lenguaje de manipulación de datos
Este lenguaje específico, incluido en el DBMS, permite a los administradores y a otros
usuarios acceder, modificar y realizar consultas en la base de datos para generar reportes.
De nuevo, los programas de aplicación revisan los esquemas y el DBMS antes de acceder a
los datos físicamente almacenados en un dispositivo, por ejemplo un disco.
Control de concurrencia
Método para manejar una situación en la que dos o más personas necesitan acceder de
manera simultánea al mismo registro de una base de datos

EJEMPLOS DE COMANDOS SQL

ADMINISTRACIÓN DE LA BASE DE DATOS

Los sistemas de bases de datos requieren un administrador de bases de datos (DBA) con
muchas destrezas. Se espera que éste posea una idea muy clara de los negocios principales
de la organización, maneje con mucha habilidad determinados sistemas de administración
de bases de datos y esté actualizado en las tecnologías de vanguardia y los nuevos métodos
de diseño.
El DBA trabaja en conjunto con los usuarios para decidir el contenido de la base de datos,
esto es, para determinar exactamente qué entidades son de interés y qué atributos se
registrarán acerca de ellas.
El DBA también trabaja con programadores, ya que la función de éstos es diseñar
aplicaciones para garantizar que sus programas cumplan con los estándares y convenciones
del sistema de administración de la base de datos.
BASE DE DATOS DISTRIBUIDAS Base de datos en la cual los datos pueden estar
repartidas en varias bases mas pequeñas conectadas a traves de dispositivos de
telecomunicaciones.
USO DE UNA BASE DE DATOS DISTRIBUIDA
Para un fabricante de ropa, las computadoras pueden estar colocadas en la matriz del
corporativo, en el centro de investigacion y desarrollo, en el almacen y en las tiendas al
menudeo propiedad de la compañia. Las bases de datos distribuidas brindan mas
flexibilidad en cuanto a la forma de organizacion y empleo de las bases de datos

Procesamiento analítico en línea (OLAP)


(OLAP, por sus siglas en inglés: online analytic processing) Software que permite a los
usuarios explorar datos desde muchas perspectivas. Dicho programa se utiliza en la
actualidad para acopiar y generar información para el almacén de datos de una manera
eficiente. Entre los fabricantes líderes en la venta de software olap se destacan Microsoft,
Cognos, SAP, Business Objects, MicroStrategy, Applix, Infor y Oracle.
El valor de los datos depende, en resumidas cuentas, de las decisiones que ayudan a tomar.
Las herramientas poderosas para el análisis de información en áreas como olap y minería de
datos, cuando se incorporan a una arquitectura de almacén de datos, permiten enfocar la
atención en las condiciones del mercado y ayudan a las organizaciones a generar un mayor
valor competitivo. El software olap brinda el análisis de datos de arriba hacia abajo y
mediante consultas; la minería brinda el análisis de datos de abajo hacia arriba y mediante
la búsqueda.

Característica OLAP Minería de datos


Soporta el análisis de
Soporta el análisis de datos
Propósito datos y la toma de
y la toma de decisiones
decisiones
Análisis de datos de
Análisis de datos se abajo
Tipo de análisis arriba hacia abajo y
hacia arriba y mediante la
que soporta mediante
búsqueda
consultas
Debe confiar en las
Un conocimiento
Destrezas que se herramientas de minería
profundo
requieren del de datos para encontrar
de los datos y su contexto
usuario hipótesis válidas y que
de negocios
valgan la pena

Sistemas de administración de bases de datos objeto-relacional

Una base de datos orientada a objeto utiliza el mismo enfoque general de la


programación orientada a objeto. En este enfoque, tanto los datos como las instrucciones de
procesamiento se almacenan en la base de datos. Por ejemplo, una base de datos orientada a
objeto podría almacenar los gastos mensuales y las instrucciones necesarias para calcular
un presupuesto mensual a partir de dichos gastos.
Una base de datos orientada a objeto utiliza un sistema de administración de bases de
datos orientada a objeto (OODBMS, por sus siglas en inglés: object-oriented database
management system) para proporcionar una interfaz de usuario y conexiones hacia otros
programas. Un OODBMS es un grupo de programas que manipulan una base de datos
orientada a objeto y que ofrece una interfaz de usuario y conexiones hacia otros programas
de aplicación.
Un sistema de administración de bases de datos objeto-relacional (ORDBMS, por sus
siglas en inglés: object-relational database management system) ofrece un conjunto
completo de facilidades de base de datos relacionales y la capacidad de terceros para
agregar nuevos tipos de datos y operaciones a la base de datos. Los tipos de datos nuevos
pueden ser de audio, imágenes, texto no estructurado, espaciales o datos de series de tiempo
que requieren características novedosas de indexado, optimización y recuperación.

Sistemas de bases de datos visuales, audibles y otros

Además de a los datos crudos, las organizaciones se enfrentan cada vez más a la necesidad
de almacenar enormes cantidades de señales visuales y audibles de una manera ordenada.
Combinar y analizar datos provenientes de diferentes bases de datos representa un reto cada
vez más importante. En ocasiones, las compañías globales deben analizar datos sobre
ventas y contabilidad almacenados en todo el mundo en diferentes sistemas de bases de
datos. Además de las bases de datos visuales, audibles y virtuales, otros sistemas de bases
de datos de propósito especial satisfacen las necesidades particulares de negocio. La
tecnología de datos espaciales, por ejemplo, involucra el uso de una base de datos para
almacenar y acceder a los datos de acuerdo con los lugares que describe y para permitir el
análisis y las consultas espaciales.

También podría gustarte