Teoria de Base de Datos

BASES DE DATOS
Las Bases de Datos son el núcleo del sistema de información de cualquier empresa. La administración y gestión de las
mismas constituye, por tanto, un trabajo muy importante dentro de cualquier organización.
Una Base de Datos requiere de mantenimiento, basado en una buena Administración y Gestión de los datos que
contiene, de los procesos asociados y de los usuarios que pueden acceder.
El Diseño de la Base de Datos es fundamental para obtener cualidades como

- La Integridad de los datos,
- La seguridad
- El tiempo de respuesta,
- La concurrencia,
- La redundancia
- ...
Características que deben ser mantenidas mediante el la Evaluación y el Análisis, una vez que la Base de Datos entra en
funcionamiento.
TEORIA DE BASES DE DATOS
Una parte muy importante de las aplicaciones que se desarrollan actualmente hacen uso extensivo de las Bases de Datos
(arquitecturas cliente/servidor, Servicios Web, Servidores de Correos, Administradores de Bases de datos, Responsables
de la recepción y procesamiento de formularios via Internet, etc …).
Entender la arquitectura interna de una Base de Datos es una ayuda muy importante de cara al diseño y la construcción de
Bases de Datos relacionales. Conocer la teoría nos permite realizar consultas más eficientes y detectar los problemas más
rápidamente, así como elaborar una solución para los mismos.
Los elementos básicos de una Base de Datos Relacional son las tablas y las relaciones entre ellas. La forma de distribuir
los datos y de establecer las relaciones queda fijada en el diseño, y es muy costoso cambiar esta distribución una vez se ha
pasado a fases posteriores. Si nuestro objetivo es aprender a diseñar Bases de Datos debemos conocer y aplicar la teoría
de la normalización, basada en extraer las redundancias innecesarias de nuestros sistemas de forma que se eviten
problemas tales como la corrupción de los datos o los errores.
ADMINISTRACION DE UNA BASE DE DATOS
El mantenimiento de una Base de Datos incluye puntos tales como la realización de las copias de seguridad (Backups), la
monitorización constante del funcionamiento, las revisiones al registro de transacciones realizadas o la replicación o
redundancia de los datos de forma que podamos conseguir una mayor protección contra pérdidas de información.
Una vez que la Base de Datos entra en funcionamiento, el administrador debe prestar una especial atención a su
mantenimiento y asegurar una alta disponibilidad de la información contenida en nuestro sistema.
Un administrador debe tener constancia en cada momento de qué usuarios acceden al sistema y con qué permisos lo
hacen, así como mantener la Base de Datos lo más actualizada posible y libre de fallos de seguridad conocidos.
El seguimiento de una Base de Datos nos permitirá detectar problemas pequeños antes que crezcan y se conviertan en
problemas potenciales. Detectar y solucionar los problemas a tiempo nos permitirá obtener un ahorro importante de trabajo,
y una mayor satisfacción del usuario.
EVALUACION, ANALISIS Y DISEÑO
Un buen diseño inicial es el pilar básico de una Base de Datos eficiente. Las optimizaciones en el rendimiento son menos
costosas de implementar, si se plantean en la fase de diseño con una perspectiva al futuro.
Mediante el ajuste de los parámetros de nuestra Base de Datos podemos conseguir mejorar el rendimiento de nuestro
sistema. No obstante, no se deben descuidar elementos tales del Sistema Operativo sobre el que se encuentra instalada la
Base de Datos, y revisar la configuración de memoria o los accesos a disco que realizamos.
Un análisis del funcionamiento nos permitirá controlar y corregir los pequeños problemas que puedan surgir en el sistema.
Para realizar el análisis podemos ayudarnos de diferentes herramientas externas que nos darán una visión detallada de
cuáles son los patrones de funcionamiento de la Base de Datos y centrarnos en aquellos apartados más conflictivos.
DISEÑO DE UNA BASE DE DATOS
Gran parte de las cualidades esperadas en una buena base de datos se basan en su diseño inicial, que constituye los
cimientos de cualquier sistema de información actual. El diseño de la Base de Datos debe estar bien definido antes de
pasar a cualquier otra etapa, dada la dificultad y el coste de realizar cambios en el diseño en etapas posteriores. El diseño
de Bases de Datos se compone de dos fases altamente diferenciadas: diseño lógico y diseño físico.
El diseño lógico consiste en analizar los requerimientos de la empresa y cuáles van a ser los componentes de la Base de
Datos, como por ejemplo las tablas y las restricciones. El diseño lógico no tiene en cuenta dónde o cómo van a estar
almacenados físicamente los datos.
El uso efectivo de cualquier base de datos se basa en un buen diseño normalizado. La normalización consiste en el proceso
de evitar las redundancias de los datos, evitando la actualización, modificación y borrado de datos en múltiples posiciones.
Además, eliminando la repetición innecesaria de información reducimos la probabilidad que nuestra base de datos se
vuelva inconsistente o contenga errores.
No obstante, la normalización también presenta sus contrapartidas, ya que según el tipo de Bases de Datos, nos interesa
mantener algún tipo de redundancia. De todas formas, los datos no normalizados son un problema más grave y frecuente
que una normalización excesiva de los mismos.
En contrapartida al diseño lógico, el diseño físico consiste en implementar el diseño lógico sobre los recursos físicos que
disponemos, aprovechando las capacidades de nuestro sistema software/hardware. Y de esta forma conseguir un acceso
eficiente a los datos.
ARQUITECTURA DE UNA BASE DE DATOS
Los datos de Microsoft® SQL Server™ 2000 son almacenados en bases de datos. Los datos en una base de datos están
organizados en componentes lógicos visibles a los usuarios. Una base de datos es también implementado mediante el uso
de dos o más archivos en disco.
Cuando se usa una base de datos, inicialmente se trabaja con componentes lógicos tales como tablas, vistas,
procedimientos y usuarios. La implementación física de los archivos es ampliamente transparente a los usuarios. En otras
palabras, solo el administrador de la base de datos necesita trabajar con la implementación física.
Cada instancia (copia) del Servidor SQL tiene cuatro sistemas de bases de datos: master, model, templb msdb y uno o más
bases de datos de usuario. Algunas organizaciones tienen solo una base de datos, conteniendo todos los datos de su
organización. Otrgas tienen diferentes tipos de datos para cada grupo (sección, departamento, gerencia, etc.) y algunas
veces una base de datos es usada por una aplicación singular. Por ejemplo, una organización podría tener una base de
datos para sus ventas, otra base de datos para su nómina, uno para aplicaciones que administran sus documentos, etc. En
algunos casos una aplicación usa solo una base de datos; otras aplicaciones pueden acceder a múltiples bases de datos.
No es necesario ejecutar múltiples copias de la base de datos del SQL Server ya que un manejo eficiente de éste permite
que múltiples usuarios accedan a las bases de datos sobre el servidor. Una instancia (copia) del SQL Server Estándar o
Enterprise Edition, son capaces de manejar miles de usuarios trabajando en múltiples bases de datos al mismo tiempo.
Cada instancia dell servidor SQL permite que todas las bases de datos en dicha instancia, estén disponibles para todos los
usuarios que se conectan a dicha instancia, sujeto a los respectivos procedimientos de seguridad en el acceso y permisos
respectivos.
Cuando se conecta a una instancia del SQL Server, su conexión está asociada con una base de datos particular sobre el
servidor. Esta base de datos es llamada base de datos actual. Toda vez que está conectado a una base de datos, lo hace a
uno definido por default por el administrador del sistema, aunque puede emplear opciones de conexión y dependiendo del
tipo de acceso que tenga podrá conectarse a otras bases de datos.
DATA WAREHOUSE
La información es todo lo que somos capaces de comprender de la realidad. Su representación informática se denomina
dato, las Bases de Datos de una empresa utilizan a los computadores como medio para organizar estos datos de forma
que sean comprensibles para las personas. Este proceso es conocido como Data Warehouse. La comprensión de los
datos almacenados es esencial para cualquier organización, ya que constituye un elemento básico en la toma de
decisiones.
El objetivo del Data Warehouse es agrupar los datos con el propósito de facilitar su posterior análisis, de forma que sean
útiles para acceder y analizar información sobre la propia empresa. A este tipo de datos se les conoce como “informativos”.
Los sistemas que manejan los datos se denominan OLAP (Online Analytical Processing).
Por otra parte, muchos de los datos de una empresa se utilizan como soporte a los negocios. A este tipo de datos se les
denomina “operacionales”. Los sistemas usados con el fin de recogerlos reciben el nombre de OLTP (On Line Transaction
Processing).
¿Qué es un Data Warehouse?
Simplificando el tema, no es más que un conjunto de información cuyo principal objetivo es permitir acceder a los
indicadores del negocio en forma rápida y flexible.
Este banco de datos es alimentado desde otras bases de datos operacionales en forma periódica y automática, lo que
permite a los dirigentes de la empresa evaluar el progreso de la misma a tiempo, en forma dinámica, y sin depender de
terceros que suministren la información. Como consecuencia, las decisiones que se tomen podrán basarse cada vez más
en el conocimiento y menos en la intuición.
Es fundamental tener un buen sistema de seguridad, ya que esto permite tener estricto control del acceso a este tipo de
información. Por ejemplo, se puede permitir ver la información estadística del sector Farmacia al sector Dirección de
Sanatorio pero sólo en lo que respecta al consumo de este último, mientras que la Gerencia General podrá acceder a la
información integrada de los diferentes sectores. En definitiva se pueden crear grupos, niveles de acceso y vistas de la
información según corresponda.
Es importante agregar que el resultado de la consulta al Data Warehouse se vuelca sobre herramientas de uso popular (Ej.
Microsoft Excel) que permiten al usuario manejar los datos obtenidos en gráficas, procesos, consultas o informes propios
Es innegable que en la actualidad son muy pocas las empresas que pueden considerar como un tema de baja prioridad el
estudio del impacto de la tecnología en su negocio.
Este impacto puede asumir múltiples formas en una organización. Desde obligarla a incorporar nuevas tecnologías para
lograr un aumento en la eficacia, productividad, calidad, etc., o dicho de otra manera, hacer lo mismo más barato, más
rápido, mejor, hasta situaciones en que la tecnología cambia totalmente el marco dentro del cual se mueve la empresa, la
competencia, la forma de hacer negocios.
La introducción del video tuvo impactos más que evidentes en las salas de cine, esto no sorprende a nadie; pero ¿que
pasará con la industria cuando tecnologías como las de video bajo demanda nos permitan acceder a un título cualquiera
dentro de una gran base de datos multimedia, utilizando el control remoto del televisor (o como quiera que llamemos al
dispositivo)? Ni siquiera el video club tradicional más grande y completo tendrá semejante variedad y mucho menos podrá
responder con la misma velocidad.
Dentro de este marco de cambio tecnológico y su impacto en los negocios, se encuentra el concepto de Data Warehouse,
tal vez en forma menos evidente para el gran público, pero sin duda igualmente significativa para las organizaciones.
Otra forma de definir una Data Warehouse
En la actualidad hay una importante cantidad de confusión respecto a lo que es un Data Warehouse que, afortunadamente,
está comenzando a despejarse. No obstante, parece que cada proveedor de un producto o servicio relacionado con la
tecnología informática tiene su definición y, lo que es peor, en su propia jerga no siempre comprensible.
El punto es que el Data Warehouse o Bodega de Datos es un concepto de difusión relativamente reciente, un tanto amplia y
en evolución. Esto hace que sea un tanto difícil categorizarlo adecuadamente y que, por consiguiente, distintos proveedores
de tecnología informática puedan adecuar el mensaje de venta de su producto a la palabra de moda.
Una definición de Data Warehouse que considero adecuada es la siguiente: Es un proceso, no un producto. Es una técnica
para consolidar y administrar datos de variadas fuentes con el propósito de responder preguntas de negocios y tomar
decisiones, de una forma que no era posible hasta ahora.
Ahora, ¿qué es lo novedoso de esto? ¿no es lo que se ha estado pregonando desde hace un buen tiempo? Lo novedoso es
que los avances en la tecnología de hardware y software han desarrollado medios más adecuados para:
Consolidar datos desde una variedad de fuentes. Dentro del marco conceptual de Data Warehousing los
agruparemos dentro del proceso de Transformación de Datos.
Manejar grandes volúmenes de datos de una forma que no era posible, o no era costo efectiva. A estos medios
los agruparemos en Procesamiento y Administración de Datos.
Acceder a los datos de una forma más directa, en "el lenguaje del negocio", y analizarlos para obtener relaciones
complejas entre los mismos. Estos procesos se engloban en dos categorías que serán explicadas más adelante:
Acceso a los Datos y Descubrimiento o Data Mining.
Estos desarrollos tecnológicos, correctamente organizados e interrelacionados, constituyen lo que se ha dado en llamar un
Data Warehouse o Bodega de Datos. Veamos un poco más en detalle los grupos mencionados.
Transformación de Datos (Data Transformation)
Son procesos que permiten extraer grandes volúmenes de datos de variadas fuentes a efectos de ser consolidados para su
explotación. Se instrumenta con herramientas de software que brindan una gran flexibilidad para acceder a distintas
plataformas tecnológicas y para homogenizar y compatibilizar datos originalmente organizados de diferentes formas.
Además, y esto es tan importante como lo anterior, facilitan grandemente la continuidad del proceso de carga del Data
Warehouse.
Este proceso de Transformación de Datos puede ser aplicado a distintas fuentes dentro de una misma organización, a
través de múltiples departamentos y áreas funcionales, como primer paso para obtener una "visión única de la empresa”, o
para incorporar fuentes externas (datos provenientes de los sistemas de otras empresas, información demográfica, bases
de datos de potenciales clientes, información transaccional de tarjetas de crédito, bases de datos como las de Nielson
Market Research, EDI, etc. Un caso típico, y de gran impacto organizacional, de necesidad de consolidar información de
sistemas heterogéneos es el de fusiones y adquisiciones de empresas.
No obstante esta Transformación de Datos tiene que ser acompañada de los medios para realizar el posterior
aprovechamiento de los mismos. Para ello se deben implementar los demás componentes del Data Warehouse.
Procesamiento y Administración de los Datos
Con el desarrollo del Hardware y del Software se ha hecho posible procesar mayores volúmenes de datos y hacer sobre los
mismos, preguntas más variadas y complejas. El manejo de las grandes bases de datos se ha vuelto mucho más flexible y,
fundamentalmente, se han logrado reducir los costos. Los grandes sistemas de Procesamiento Paralelo Masivo y sus
software de bases datos asociados permiten el manejo de volúmenes de datos que eran impensables hasta hace poco y
ofrecen una gran flexibilidad y tiempo de respuesta a preguntas complejas, aquellas que relacionan grandes cantidades de
datos, haciendo comparaciones y cálculos de la más variada índole. Al computador y la base de datos del Data Warehouse
se los suele llamar "corazón del Data Warehouse".
Un caso muy conocido por su magnitud y por lo visionario de su enfoque es el de la cadena minorista más grande del
mundo. Esta lleva un registro completo y detallado (Artículos, precios, cantidades, número de pasillo, sucursal, etc.) de cada
una de las transacciones que se realizaron en sus 2500 tiendas en las últimas sesenta semanas. Como fácilmente podemos
imaginar, el potencial que tiene esa información desde el punto de vista del negocio es impresionante. Las utilizaciones
pueden ser muy variadas: fijación de precios, descuentos, promociones, seguimiento de clientes, segmentación, inventarios,
negociación con los proveedores, etc.
No obstante, el volumen de datos a manejar por un Data Warehouse variará dentro un amplio entorno que será función de
la naturaleza del negocio y de los objetivos estratégicos de aplicación que se definan para cada empresa en particular.
Con el proceso de Transformación de Datos disponemos de los medios para alimentar el "corazón del Data Warehouse" y,
a su vez, permite procesar una importante cantidad de datos. Ahora necesitamos acceder a los mismos.
Acceso a los Datos
Esa infraestructura de transformación y ese depósito de datos no podría ser aprovechado plenamente si no se hubieran
desarrollado herramientas que permitieran hacer un acceso inteligente al mismo. Las mismas se han desarrollado de
manera que las consultas puedan ser realizadas en forma sencilla, interactiva y en "lenguaje de negocios". La idea es que
las preguntas sean realizadas por el usuario final -sea este un alto ejecutivo, un especialista de marketing, o un analista
financiero- en su propio lenguaje, sin necesidad de conocer la tecnología subyacente, ni de hacer el requerimiento al área
de sistemas o a un grupo especializado; como en el caso de aquellas empresas que a comienzos de los ochenta instalaron
centros de información (Data Centers) destinados a proveer información ejecutiva.
Seguramente una sola herramienta no satisfará las necesidades de todas las posiciones dentro de la organización; pero
existe una variedad tal que es posible cubrir los distintos requerimientos. Típicamente permiten un acceso orientado a
"temas", es decir: cliente, proveedor, producto, actividad, etc. y desde una perspectiva histórica y geográfica. Es muy
importante la interactividad, porque muchas respuestas a una pregunta de negocios sin duda sugerirán alguna otra
pregunta relacionada que se deseará responder a efectos de la toma de decisiones.
Descubrimiento o Data Mining
Son procesos destinados a la explotación avanzada de los datos que se apoyan en herramientas de software que permiten
encontrar esas "pepitas de oro" que se encuentran en los datos.
Estas herramientas son las más sofisticadas y específicas de un Data Warehouse, son las que más demanda ejercerán
sobre la infraestructura del mismo y pondrán a prueba su diseño, especialmente en lo que respecta a la capacidad de
Procesamiento y Administración de Datos, a su vez son las que permiten obtener las relaciones más complejas y ocultas.
Son de distinto tipo: estadísticas, redes neuronales, de inteligencia artificial, etc. Permiten encontrar patrones de relación
sugeridos e incluso sugerir relaciones entre datos no previstos.
Algunas de las preguntas típicas a ser respondidas por estas herramientas son:
¿Qué productos son generalmente comprados juntos?

¿Que otros productos son comprados con las promociones?
¿Cuál es la afinidad entre las distintas forma de pago?
¿Cómo afectó la última campaña la venta de un determinado producto?
¿Cuáles fueron los clientes más sensibles a una determinada publicidad?
¿Cuáles son los clientes con mayor probabilidad de irse a la competencia?
¿Quiénes y para qué lo usan?
Dadas las características de un sistema de Data Warehouse, su aplicación puede tener variados fines, en una diversidad de
industrias. No obstante, en términos generales, podemos decir que su aplicación más rica corresponde a entornos de
empresas en los que se identifican grandes volúmenes de datos, asociados a: cantidad de clientes, variedad de productos y
cantidad de transacciones. A continuación veremos ejemplos de aplicaciones típicas y algunos casos puntuales en distintas
industrias.
Comercio Minorista
Utilizan grandes sistemas de Procesamiento Paralelo Masivo para acceder a meses o años de historia transaccional
tomada directamente en los puntos de venta de cientos, o miles, de sucursales. Con esta información detallada pueden
efectuar en forma más precisa y eficiente actividades de compra, fijación de precios, manejo de inventarios, configuración
de góndolas, etc.
Las promociones y las ofertas de cupones son seguidas, analizadas y corregidas. Modas y tendencias son cuidadosamente
administradas a efectos de maximizar utilidades y reducir costos de inventario. El stock es reasignado por sucursales o
regiones según ventas y tendencias. Estos sistemas con capacidad de procesar gran cantidad de datos detallados permiten
implementar eficientemente prácticas de mercadería "en consignación", en esta modalidad la cadena minorista paga al
proveedor recién cuando los productos son vendidos y pasados por el lector de códigos de barras (scanner) del punto de
venta.
Esta información detallada permite ejercer mayor poder de negociación sobre los proveedores, dado que el comercio
minorista puede llegar a saber más que el fabricante sobre sus productos: quién lo compra, dónde, cuándo, con que otros
productos, etc.
En su libro "Made in America: My Story" el fundador de Wal*Mart, Sam Walton, escribe: "...me dicen que es la base de
datos comercial más grande del mundo. Lo que me gusta es la clase de información que puedo obtener de ella al instante
¡todos esos números!, llevamos 65 semanas de historia de cada artículo que vendemos. Esto significa que puedo elegir
cualquiera y decir exactamente cuantos vendimos... no en promedio, sino en cualquier región, distrito o sucursal. Es difícil
que un proveedor sepa más acerca de su producto de lo que sabemos nosotros. Nos da el poder de la ventaja competitiva."
Para poner esto en perspectiva debemos considerar que las sucursales a las que hace referencia Sam Walton son unas
2500 y que cada una de ellas tiene una variedad de entre 50.000 y 80.000 artículos, todas las noches 20 millones de
actualizaciones se realizan en el Data Warehouse. Wal*Mart es un excelente ejemplo práctico del concepto planteado por
A. Tofler en su libro "Powershift": el poder se desplaza del fabricante al minorista por el manejo de la información.
Otras instalaciones de Data Warehousing de magnitud en la industria minorista son las de Kmart, Sears, Meijer, Kohl's
Department Stores, American Stores (Jewel/OSCO/Lucky/Savon/ACME/SuperSaver), Mervyn's, Buttrey Food & Drug, QVC
Home Shopping, Canadian Tyre, WH Smith Books (Gran Bretaña), Great Universal (GB), Supermercados Casino (Francia),
Migrosgenossenschaftsbund (Suiza), Otto Versand (Alemania).
Manufactura de Bienes de Consumo Masivo
Las empresas de este sector necesitan hacer un manejo cada vez más ágil de la información para mantenerse competitivas
en la industria. Los Data Warehouses se utilizan para predecir la cantidad de producto que se venderá a un determinado
precio y, por consiguiente, producir la cantidad adecuada para una entrega "justo a tiempo". A su vez se coordina el
suministro a las grandes cadenas minoristas con inmensas cantidades de productos "en consignación", que no son pagados
hasta que estos productos son vendidos al consumidor final.
Las cadenas minoristas y sus proveedores utilizan sus Data Warehouses para compartir información, permitiéndole a las
empresas de manufactura conocer el nivel de stock en las góndolas y eventualmente hacerse responsables de la reposición
de inventario de la cadena minorista. Como es de esperar esto reduce fuertemente la intermediación. También se utilizan
para campañas de marketing, planificación de publicidad y promociones y se coordinan las ofertas de cupones y
promociones con las cadenas minoristas.
Un ejemplo interesante es el de Whirlpool. Este fabricante global de electrodomésticos con base en Benton Harbor,
Michigan, utiliza su Data Warehouse para hacer un seguimiento directo de sus casi 15 millones de clientes y de sus más de
20 millones de aparatos instalados. Las mayores aplicaciones del sistema son para marketing, ventas, mantenimiento,
garantía y diseño de productos. Permite mantener stock de partes más ajustados y mejorar las condiciones de negociación
con los proveedores de las mismas. Si, por ejemplo, un determinado motor se identifica como poseedor de una tasa de falla
superior, Whirlpool puede utilizar la información para hacer renegociaciones de garantía con el proveedor.
Como anécdota interesante se puede mencionar que durante el verano de 1993 los ingenieros de Whirlpool detectaron una
tasa de falla muy alta en una manguera de conexión en una serie de lavarropas que se estaba vendiendo. A partir de allí se
detuvo la producción, se identificaron los clientes y se enviaron técnicos a reemplazar la parte defectuosa antes de que
entrara en falla. Esto no solo tuvo un impacto muy importante en satisfacción de clientes sino que se redujeron los costos de
garantía por el reemplazo planificado y, especialmente, ¡se evitaron costosos reclamos por daño a la propiedad debidos a
pérdidas de agua!
Otras empresas del sector que cuentan con Data Warehouses de importancia son: Coca Cola, Nike, Procter & Gamble,
Hallmark, Maybelline, Helene Curtis, 3M, Owens Corning Glass, Karsten Ping Golf Clubs, Walt Disney.
Transporte de Cargas y Pasajeros
Se utilizan Data Warehouses para almacenar y acceder a meses o años de datos de clientes y sistemas de reservas para
realizar actividades de marketing, planeamiento de capacidad, monitoreo de ganancias, proyecciones y análisis de ventas y
costos, programas de calidad y servicio a clientes.
Las empresas de transporte de cargas llevan datos históricos de años, de millones de cargamentos, capacidades, tiempos
de entrega, costos, ventas, márgenes, equipamiento, etc..
Las aerolíneas utilizan sus Data Warehouses para sus programas de viajeros frecuentes, para compartir información con los
fabricantes de naves, para la administración del transporte de cargas, para compras y administración de inventarios, etc.
Hacen un seguimiento de partes de repuesto, cumplimiento con las regulaciones aeronáuticas, desempeño de los
proveedores, seguimiento de equipaje, historia de reservas, ventas y devoluciones de tickets, reservas telefónicas,
desempeño de las agencias de viajes, estadísticas de vuelo, contratos de mantenimiento, etc.
Algunas empresas que cuentan con Data Warehouses de magnitud: Cornrail, Union Pacific, Norfolk Southern, American
President Lines, Delta, Lufthansa, QANTAS, British Airways, American Airlines, Canadian Airlines, SNFC.
Telecomunicaciones
Estas empresas utilizan sus Data Warehouses para operar en un mercado crecientemente competitivo, desregulado y
global que, a su vez, atraviesan profundos cambios tecnológicos. Se almacenan datos de millones de clientes: sus circuitos,
facturas mensuales, volúmenes de llamados, servicios utilizados, equipamiento vendido, configuraciones de redes, etc. así
como también información de facturación, utilidades, y costos son utilizadas con propósitos de marketing, contabilidad,
reportes gubernamentales, inventarios, compras y administración de redes.
AT&T utiliza un sistema NCR/Teradata que le permite responder a preguntas como:

¿Cuáles potenciales clientes de larga distancia de AT&T son los que con mayor probabilidad responderían favorablemente
a una oferta?
¿Cuáles son los candidatos a adoptar nuevas tecnologías, productos y servicios en una fase temprana?
¿Cuáles son los clientes más susceptibles de aceptar una oferta de un competidor?
¿Cuáles clientes tienen probabilidad de comprar otros productos, o de consumir más? ¿qué probabilidad?
¿Cuánto puedo esperar que gasten determinados grupos de clientes en determinados productos y servicios?
¿Cuáles clientes y potenciales clientes tienen el mayor valor actual (Valor que resulta de calcular el flujo de utilidades
esperado de este cliente)?
¿Cuánto se justifica gastar para adquirir cada potencial nuevo cliente?
¿Cuál es el tiempo esperado que un nuevo cliente permanecerá como abonado?
En general el sistema de AT&T se utiliza para segmentación de clientes, identificación y análisis de mercados objetivo,
programas de retención de clientes, cálculo de probabilidad de pérdida de clientes, medición de efectividad de campañas,
valuación y adquisición de clientes, cálculo de valor presente esperado de un cliente, etc..
Las mayores instalaciones de Data Warehouses en esta industria incluyen: Ameritech, AT&T, Belgacom (Bélgica), Bell
Atlantic, Bell South, British Telecom, GTE, New Zeland Telecom, Sprint, Telecom Italia, Unitel (Canadá), etc..
Obras Sociales
Utilizan sus Data Warehouses para el manejo de sus distintos programas y prácticas de "captación". Se almacenan muchos
años de lo que en la industria se denominan las "siete Pes": Pacientes, Prestadores, Procedimientos, Precios, Performance,
Planes y Premios. Además de las aplicaciones típicas de análisis de costos, desempeño de prestadores, análisis de
tendencias y marketing. Esta información se utiliza para crear perfiles de enfermedades, con ellos se evalúa si los patrones
de tratamientos se encuentran dentro de los marcos normales y, eventualmente, se detectan situaciones de fraude.
Bancos y Entidades Financieras
Se utilizan Data Warehouses para crear perfiles unificados de clientes que permitan actividades de cross-marketing o la
implementación de conceptos de banca relacional. La información de distintas líneas de negocios es extraída de diversos
sistemas operacionales en múltiples ubicaciones y puesta en un solo lugar para su explotación. Aplicaciones típicas de
entornos de Data Warehouse son: marketing y promociones, identificación de mercados objetivo, manejo de riesgo
crediticio, servicio a clientes, integración de sistemas en situaciones de fusiones y adquisiciones.
La máxima utilidad de estos sistemas se obtiene a partir de la unificación de los datos de clientes y el almacenamiento de la
información transaccional histórica. Esto permite realizar más eficientemente tareas de segmentación de clientes,
identificación y análisis de mercados objetivos, cálculo de probabilidad de pérdida de clientes e implementación de
campañas de retención, medición de efectividad de campañas, cálculo del valor presente esperado de clientes, análisis de
costos de adquisición de clientes vs. valores esperados presentes, análisis de elasticidad-precio, etc.
El Data Warehouse más grande de la industria bancaria es el del Bank of America. Se utiliza fundamentalmente para
actividades de "target marketing", "cross marketing", análisis de portafolio, adquisiciones, seguimiento de tarjetas de crédito,
banca minorista, y análisis de riesgo. Almacena información de 36 millones de cuentas de clientes, consolidada a partir de
23 diferentes sistemas operacionales. Incluye datos de cuentas corrientes, cuentas de ahorro, depósitos a plazos,
transacciones de cajeros automáticos, propiedades y préstamos personales y comerciales. Se analizan tendencias y
relaciones a partir de la información detallada de clientes para determinar quienes son los que tienen mayor probabilidad de
adquirir un determinado producto o servicio del banco. De esta manera se pueden hacer e-mails promocionales "a medida",
considerando los intereses específicos de cada cliente. El Data Warehouse también da lugar para almacenar información de
unos 28.000 millones de U$S en préstamos hipotecarios.
Cuando el 17 de Junio de 1994 un terremoto causó daños devastadores en Los Angeles, distintas áreas del BofA,
especialmente el grupo responsable de préstamos para viviendas pudo acceder al sistema utilizando los códigos postales y
ver en minutos la información relacionada con los créditos hipotecarios y toda la información de los clientes del área
afectada.
Potenciales adquisiciones también son analizadas en este Data Warehouse, el sistema puede computar rápidamente el
valor del candidato al "takeover" integrando las cintas con los archivos maestros al formato del sistema de análisis de
inversión del BofA. La desregulación interestatal permitió al banco expandirse por medio de adquisiciones (Security Pacific
en 1993, Continental Bank en 1994, etc.) el Data Warehouse posibilitó integrar rápidamente al sistema la información de
clientes de los bancos adquiridos. Actualmente gran parte de los usuarios finales acceden directamente a la información, de
acuerdo a sus permisos, sin tener que hacer sus requerimientos a través del área de sistemas, todo un cambio de
paradigma en la industria bancaria.
A continuación se da un listado de algunas de las mayores instalaciones de Data Warehouses en esta industria: Chemical
Bank, Chase Manhattan, Bank of America, Citibank, Banc One, Nationsbank, Dime Savings of NY, Lloyds (UK), Barclays
(UK), National Westminister (UK), Abbey National (UK), and Trustee Savings - TSB (UK), Royal (Canada), Bawag (Austria),
Credit Commercial de France (CCF), Caisse d'Epargne (France), National Bank (Australia), Advance Bank Australia,
Reuters News Service (UK), Merrill Lynch, Kemper Financial, TRW Credit, Fidelity Investments, Capital Group, Chicago
Board of Options Exchange, Federal Home Loan Mortgage (Freddie Mac) y Central Provident Fund Board (Singapore).
Otras Industrias
Muchas otras industrias y actividades utilizan actualmente, o están comenzando a instalar, Data Warehouse: entidades
gubernamentales, especialmente para el control impositivo, empresas de servicios públicos, de entretenimiento, editoriales,
fabricantes de automóviles, empresas de petróleo y gas, laboratorios farmacéuticos, droguerías, etc.
En la industria informática NCR dispone de los Data Warehouses de mayor magnitud y antigüedad. Sus mayores
instalaciones se encuentran en distintos centros de la compañía en Estados Unidos. La de NCR El Segundo, California, es
una de las más antiguas del mundo, su primera aplicación fue el seguimiento histórico y detallado de la base de clientes:
llamados de servicios, productos instalados, performances, etc. Esta instalación es herencia de Teradata, compañía
fundada en 1979 para la producción de sistemas de procesamiento paralelo masivo destinados a aplicaciones de soporte a
la toma de decisiones y posteriormente adquirida por NCR.
En NCR San Diego, California, se encuentra el centro de desarrollo de los computadores WorldMark. Sobre los mismos se
realizó la demostración del Data Warehouse más grande del mundo: 10 Terabytes de información (=10.000
Gigabytes=10.000.000 Megabytes), para poner esto en términos manejables debemos considerar que toda la información
escrita de la Biblioteca del Congreso de los Estados Unidos se podría almacenar en unos 20 Terabytes.
En NCR Dayton, Ohio, la compañía dispone de un Data Warehouse de 1 Terabyte (=1000 Gigabytes) destinado
fundamentalmente a tareas de marketing, producción y finanzas. A la fecha tiene almacenados 281.154 documentos,
agrupados en 36 grupos de interés temático, que pueden ser accedidos 24 Hs. al día, los siete días de la semana, por
16.100 usuarios distribuidos en 46 países. A principios del año 1996 el sistema estaba respondiendo un promedio de
242.707 consultas mensuales.
Conclusión
Para concluir debemos aclarar que, si bien la mayoría de las aplicaciones consideradas involucran grandes volúmenes de
datos y una importante inversión, esto no tiene que ser necesariamente así. Depende del tipo de actividad y,
fundamentalmente, de los objetivos del negocio a enfocar. Esto último, junto con un adecuado diseño que contemple el
posterior crecimiento, su administración y flexibilidad para admitir nuevas funcionalidades, es la clave del éxito.
El tamaño del Data Warehouse es proporcional al detalle de los datos a almacenar. Estos a su vez dependen, en términos
generales, del número de clientes, de la cantidad de transacciones por cliente y de la variedad de productos
comercializados. Como se puede intuir, la utilidad económica de un Data Warehouse bien implementado guarda relación
con el detalle de la información, de ser posible información transaccional, almacenada por un plazo mayor a un año, o
período necesario para medir estacionalidades y tendencias.
Según un estudio de International Data Corp (IDC), el retorno a la inversión promedio de las instalaciones de Data
Warehouse, tomando como base un período de tres años, es del 401%. Según el mismo estudio, 90% de los casos
estudiados tuvo un ROI superior al 40% y un cuarto de ellos un ROI superior al 600%. Todo parece indicar que es un
emprendimiento digno de ser considerado.
El siguiente esquema es un ejemplo de las diversas formas de acceder a un Data Warehouse mediante el uso de diversas
metodologías de acceso entre ellas los sistemas de consultas con el SQL Server (System Query Language), los cubos
OLAP (On Line Analytical Processing) y para propósitos transaccionales (OLTP).
A continuación haremos un breve comentario sobre el manejo de datos en Excel.
Qué es un origen de datos en Office?
Los datos con los cuales Microsoft Office realiza diversos tipos de operaciones, provienen de diversas fuentes u orígenes de
datos. Un origen de datos es un conjunto almacenado de “información” de origen utilizado para conectarse a una base de
datos. Un origen de datos puede incluir el nombre y la ubicación del servidor de la base de datos, el nombre del controlador
de la base de datos y la información requerida cuando se inicia una sesión de acceso.
Microsoft Office facilita un conjunto de controladores que pueden ser usados para recuperar los datos que provengan desde
el mismo Office o desde fuentes externas. La recuperación de datos puede realizarse desde diversos orígenes de datos:
Servicios OLAP: Tecnología de base de datos que se ha optimizado para la elaboración de consultas e informes,
en lugar de procesar transacciones. Los datos OLAP se organizan jerárquicamente y se almacenan en cubos en
lugar de tablas. Estos servicios son gestionados por Microsoft SQL Server. Tecnología OLAP: conjunto de
software que proporciona acceso a un tipo concreto de base de datos OLAP. Este tipo de software puede incluir
un tipo determinado de controlador de origen de datos y software de cliente necesario para conectarse a una
base de datos.
Microsoft Acces
dBase
Microsoft FoxPro
Oracle
Paradox
SQL Server
Microsoft Visual FoxPro
Base de datos de archivos de planos
Otros proveedores
Pueden utilizarse controladores ODBC de otros fabricantes para obtener información de orígenes de datos que no están en
la lista anterior incluyendo otros tipos de bases de datos OLAP (Un controlador ODBC = Open Data Base Connectivity, es
un archivo de programa utilizado para conectarse a una base de datos concreta. Cada programa de base de datos como el
Access o el dBase o un sistema de administración de base de datos como el SQL Server, requiere de un controlador
diferente.
Instalar controladores ODBC en Excel
Los controladores ODBC suministrados por Microsoft se instalan junto con Microsoft Excel. Si la base de datos externa a la
que desee obtener acceso no es compatible con estos controladores ODBC, deberá conseguir e instalar un controlador
ODBC compatible con Microsoft Office de otro proveedor, como el fabricante de la base de datos. Póngase en contacto con
el proveedor de la base de datos para obtener las instrucciones de instalación.
Nota Las bases de datos OLAP no requieren controladores ODBC. Cuando se instala Excel, se instalan los controladores y
el soporte para tener acceso a las bases de datos creadas utilizando los servicios OLAP de Microsoft SQL Server. Para
conectarse a bases de datos OLAP de otros proveedores, deberá instalar un controlador de origen de datos y software de
cliente.
MICROSOFT QUERY
¿Qué es Microsoft Query?
Microsoft Query es un programa que permite incorporar datos de orígenes externos a otros programas de Microsoft
Office, especialmente a Microsoft Excel. Si utiliza Query para recuperar datos de las bases de datos y de los archivos
corporativos, no es necesario que vuelva a escribir en Excel los datos que desee analizar.
También puede actualizar los informes y resúmenes de Excel automáticamente de la base de datos de origen inicial
siempre que la base de datos se actualice con información nueva.
Tipos de bases de datos a los que se puede obtener acceso
Es posible recuperar datos de varios tipos de bases de datos, incluidos Microsoft Access, Microsoft SQL Server y los
servicios OLAP de Microsoft SQL Server. También puede recuperar datos de las listas de Excel y de archivos de texto.
En Excel, también se pueden recuperar datos de páginas Web y no es necesario tener Query para ello.
Seleccionar datos de una base de datos
Se puede recuperar datos de una base de datos creando una consulta, que es una pregunta que se hace acerca de los
datos almacenados en una base de datos externa. Por ejemplo, si los datos están almacenados en una base de datos de
Access, puede ser que desee conocer las cifras de ventas de un producto determinado, por regiones. Es posible
seleccionar parte de los datos seleccionando sólo los datos del producto y la región que desee analizar y omitir los datos
que no necesite. Esto es lo que se muestra en la siguiente figura (extraído de la ayuda de Microsoft Excel).
1. Columnas seleccionadas en el Asistente para consultas
2. Columnas seleccionadas incorporadas a Excel
Actualizar la hoja de cálculo en una operación
Cuando disponga de datos externos en un libro de Excel, siempre que cambie la base de datos puede actualizar los datos
y, a su vez, el análisis, sin tener que volver a crear los informes y los gráficos de resumen. Por ejemplo, puede crear un
resumen de ventas mensual y actualizarlo cada mes cuando disponga de nuevas cifras de ventas.
Utilizar Query para recuperar datos
La incorporación de datos externos a Excel con Query consiste en realzar un proceso de tres pasos:
Primero se establece un origen de datos para conectar con la base de datos,

En segundo lugar se utiliza el Asistente para consultas para seleccionar los datos deseados y
En tercer lugar se devuelven los datos a Excecl donde se les puede aplicar formato, resumirlos y crear informes con ellos.
Desde este punto de vista,¿Qué es un origen de datos? Un origen de datos (digamos un archivo de datos con
extensión TXT, CSV, PRN, entre otros) es un conjunto de información almacenado que permite que Microsoft Excel y
Microsoft Query se conecten con una base de datos externa. Cuando utilice Query para establecer un origen de datos,
asigne un nombre al origen de datos y, a continuación, proporcione el nombre y la ubicación de la base de datos, el tipo de
base de datos y la información de conexión o la contraseña. En esta información también se incluye el nombre de un
controlador ODBC o un controlador del origen de datos (Microsft Text Driver, por ejemplo), que es un programa que realiza
conexiones con un tipo de base de datos determinado.
Para algunos tipos de bases de datos externas (los cubos OLAP), lo único que hay que hacer para recuperar los datos es
establecer un origen de datos.
Forma en la que Query utiliza los orígenes de datos
Una vez establecido un origen de datos para una base de datos determinada, lo podrá utilizar siempre que desee crear una
consulta, para seleccionar y recuperar los datos de esa base de datos, sin tener que volver a escribir toda la información de
conexión.
Query utiliza el origen de datos para conectarse con la base de datos externa y mostrar los datos que están disponibles.
Después de crear la consulta y devolver los datos a Excel, Query recupera los datos y proporciona al libro de Excel la
información de la consulta y de los datos de modo que pueda volverse a conectar con la base de datos cuando desee
actualizar los datos.
Un origen de datos es el medio por el que Query y Excel se conectan con una base de datos determinada y recuperan
datos.
Utilizar el Asistente para consultas
El Asistente para consultas, que forma parte de Microsoft Query, está diseñado para los usuarios que no están
familiarizados con la creación de consultas (los cuales se realiza en Microsoft Access). El asistente facilita la selección y la
recuperación de los datos de las diferentes tablas y campos de la base de datos. Una vez seleccionados los datos, puede
utilizar también el asistente para filtrar y ordenar los resultados de la consulta. Puede utilizar el Asistente para consultas
para crear una consulta completa o para comenzar una consulta en la que efectúe cambios adicionales directamente en
Query.
Trabajar directamente en Query con otros tipos de consultas
Si está familiarizado con la creación de consultas o si desea crear una consulta más compleja, puede trabajar directamente
en Query. Puede utilizar Query para ver y cambiar las consultas que haya comenzado a crear en el Asistente para
consultas, o puede crear consultas nuevas sin utilizar el asistente.
Query puede usar directamente si desea crear consultas que hagan lo siguiente:
Seleccionar datos específicos de un campo:
En una base de datos grande, puede elegir algunos de los datos de un campo y omitir los datos no necesarios. Por ejemplo,
si necesita los datos de dos de los productos de un campo que contiene información de muchos productos, puede utilizar
criterios para seleccionar los datos únicamente de los dos productos que desea.
Combinar datos de diferentes maneras
Puede utilizar Query para combinar o unir los datos de tablas diferentes en la base de datos. Por ejemplo, si tiene una tabla
con información sobre ventas de productos (una base de datos llamada VENTAS) y una tabla con información de clientes
(llamada CLIENTES), puede unir estas tablas de modo que se muestre qué clientes no han hecho compras recientemente.
Crear un cubo OLAP a partir de los datos de una consulta
El procesamiento analítico con conexión (OLAP) es una manera de organizar los datos para realizar consultas o generar
informes en vez de procesar transacciones. En una base de datos OLAP, los datos se organizan jerárquicamente y se
almacenan en cubos en lugar de en tablas.
Puede utilizar Query para crear un cubo OLAP a partir de los datos de una consulta de modo que sea más rápido y más
fácil crear informes de Microsoft Excel basados en los datos. Para crear un cubo OLAP, se ejecuta el Asistente para cubos
OLAP desde el Asistente para consultas o directamente desde Query. Puede devolver los datos a Excel en forma de
informe de tabla dinámica.
Trabajar con los datos en Microsoft Excel
Cuando se crea una consulta en el Asistente para consultas o en Microsoft Query, se pueden devolver los datos a una hoja
de cálculo de Microsoft Excel. Los datos se convierten en un rango de datos externos o en un informe de tabla dinámica al
que se puede aplicar formato, analizar y actualizar.
Aplicar formato y analizar los datos

En Excel, puede utilizar herramientas como el Asistente para gráficos o los subtotales automáticos para presentar y resumir
los datos. Puede aplicar formato a los datos y dicho formato se conservará cuando actualice los datos externos de la base
de datos de origen. Si agrega columnas de fórmulas al rango de datos externos, las fórmulas se pueden copiar
automáticamente en las filas nuevas que agregan al rango cuando se actualizan los datos. Puede utilizar rótulos de
columna propios en vez de los nombres de campo y agregar números de fila automáticamente.
Volver a utilizar y compartir consultas
Tanto en el Asistente para consultas como en Query, puede guardar un archivo de consulta .dqy que podrá modificar,
volver a utilizar y compartir. Excel puede abrir archivos .dqy directamente, por lo que se podrán crear rangos de datos
adicionales desde la misma consulta.
Si desea compartir un resumen o un informe que esté basado en datos externos, puede dar a otros usuarios un libro que
contenga un rango de datos externos o puede crear una plantilla de informe. Una plantilla de informe permite guardar el
resumen o informe sin guardar los datos externos con el fin de que el archivo sea más pequeño. Los datos externos se
recuperan cuando un usuario abre la plantilla de informe. Para obtener información sobre cómo crear plantillas de informe,
consulte la Ayuda de Excel.
Actualizar datos externos
Cuando se actualizan los datos externos, se ejecuta la consulta para recuperar todos los datos nuevos o modificados que
coincidan con las especificaciones. Una consulta se puede actualizar tanto en Query como en Excel. Excel proporciona
diversas opciones para actualizar consultas, entre las que se incluye la actualización de datos cada vez que se abra el libro
y la actualización automática del mismo a intervalos de tiempo determinados. Puede continuar trabajando en Excel mientras
los datos se están actualizando y también puede comprobar el estado en todo momento. Para obtener información sobre
cómo actualizar los datos externos en Excel, consulte la Ayuda de Excel.
PROCEDIMIENTO PARA UTILIZAR MICROSFT QUERY EN UNA TABLA
Vamos a realizar diversos tipos de consultas en el archivo BDVentas.xls que contiene varias tablas, entre ellas:
Ventas
Productos
Empleados
Cajeros
Proveedores
Tiendas
Vamos a recuperar los datos de la tabla Ventas (que es la hoja Base de datos del libro BDVentas.xls) para luego agregar la
tabla Productos. Luego vamos a añadir los campos Productos.Categoría, Productos.Procveedor y Productos.Oferta.
Finalmente ordenaremos los datos por Zona, Distrito y Nombre de producto.
A continuación y después de cerrar el programa MS Query, guardaremos la consulta para consultas futuras devolveremos
los datos al Excel y lo guardaremos como QVentas.xls.
Procedimiento:
- Abra un libro vacío

- Use la secuencia: <Datos> - <Obtener datos externos> - <Nueva consulta de base de datos> - <Siguiente>
- Haga clic en <Obtener datos> de la ventana que aparezca.
- La siguiente figura muestra la ventana que se obtendrá:
Como puede ver, esta ventana permite recuperar los datos desde una <Base de datos>, desde una <Consulta> o
desde un <Cubo OLAP>. De manera que,
Si se desea obtener un informe de tabla dinámica usando <Fuente de datos externa> se elegirá la ficha <Base de
datos> y luego seleccionar el origen de datos de la lista en la parte inferior
Si se desea obtener datos desde una consulta ya existente, se usará la ficha <Consultas>. Por este medio se
podrá realizar otras consultas u obtener los datos hacia el Excel para realizar un informe de tablas dinámicas.
Si desea usar un cubo OLAP ya creado, se usará la ficha <Cubos OLAP>. Por este medio y luego de recuperar
los datos, se pasará también a realizar un informe de tabla dinámica.
En nuestro caso no hay consulta (la vamos a crear) y no hay cubos; por tanto, debemos recuperar datos desde
una de las fuentes que aparece en la lista de la ficha de <Base de datos>.
- Haga clic en <Excel Files*> y luego clic en

<Aceptar>
- En la ventana que siga se deberá ubicar la
unidad, carpeta y el nombre del archivo a ser
usado en la consulta. En este caso seleccione el
archivo BDVentas en la unidad y carpeta donde
se encuentra dicho archivo.
- Seleccione el archivo y luego haga clic en
<Aceptar>. Obtendrá la siguiente ventana.
- Haga clic en la tabla Ventas y luego haga clic en
el botón ( > ) para pasar los campos de la tabla
Ventas hacia el cuadro de lista llamada
<Columnas en la consulta>. Observe que en este
cuadro debe aparecer los campos (columnas)
contenidas en la tabla Ventas.
- A continuación haga clic en <Siguiente>.
- Ahora, en la ventana que sigue se debe seleccionar el campo por el cual se debe filtrar los datos a ser obtenidos.
En el caso nuestro no vamos a filtrar los datos, por lo que haga clic en <Siguiente>.Igualmente haga clic en
<Siguiente> ya que no vamos a ordenar por ningún campo los datos.
- La ventana que se obtenga, se muestra en la siguiente figura.
En esta ventana
Se elegirá la primera opción, si lo que se desea es devolver los datos al Excel para crear un informe, por ejemplo.
Se elegirá la segunda opción, si lo que se desea es realizar consultas con Microsoft Query.
Se elegirá la tercera opción, si lo que se desea es crear un cubo OLAP.
En el caso nuestro seleccionar la segunda opción y luego hacer clic en <Finalizar>.
- A continuación maximice la (s) ventana (s) del Query.

- Navegue por los datos y tome nota de los campos, número de campos, etc.
- Ante todo vamos a agregar otra tabla a nuestra consulta. Para ello haga clic en el comando <Tabla>, luego haga
clic en la opción <Agregar tablas>. De la lista que se obtenga seleccione la tabla Producto, haga clic en
<Agregar> y luego clic en <Cerrar> para cerrar la ventana <Agregar tablas>.
- Haga que se vea el campo CodProducto de la tabla Ventas y el campo Código de la tabla Producto.
- A continuación haciendo clic en el campo CodProducto de Ventas, arrastre dicho botón hacia el botón del campo
Código de la tabla Productos y suéltelo.
- Observe la variación y usando los botones de vaya al primero y último
registro.
- Ahora vamos a añadir los campos: Categoría, Oferta y Proveedor de la tabla Productos hacia la tabla en uso
Ventas. Para ello usando la barra de desplazamiento horizontal del Query, vaya hasta el último campo (última
columna); haga clic en el cuadro en blanco de la siguiente columna vacía y seleccione (haciendo clic) de la lista el
campo Producto.Categoría; en la siguiente columna en blanco inserte el campo Producto.Oferta y haga lo mismo
con Producto.Proveedor.
- Ahora vamos a ordenar por los siguientes campos: Zona, Almacén, Disrito, Tienda y NombreCajero. Para ello
haga clic en el comando <Registros>, luego seleccione la opción <Ordenar> y de la lista seleccione el campo
Ventas.Zona y luego haga clic en <Agregar>. Observe cómo este campo pasa a la lista inferior y simultáneamente
la tabla se ordena por dicho campo. Haga lo mismo con los siguientes campos, haciendo clic en <Agregar> luego
de seleccionar dichos campos.
- Grabe la consulta con el nombre Consulta desde BdVentas. Tome nota de la extensión (DQY) y de la carpeta
donde se va a grabar. Si desea, cambie la unidad y/o carpeta. Si lo graba en la carpeta definida por default, al
querer acceder a la consulta el Excel lo mostrará automáticamente; de otra manera deberá usar el botón
examinar para ubicar el archivo.
Esto da por terminado nuestra gestión en el Microsoft Query. Por tanto debemos cerrar la ventana para que devuelva
los datos hacia el Excel. Para ello cierre la ventana principal del Query.
- A continuación obtendrá la siguiente ventana
Hacer clic en <Aceptar> para recibir los datos en Excel a partir de la celda que se indique.
- Copie las columnas completas: Zona, Almacén y Distrito al final de la tabla; copie tres veces (hacia tres columnas,
la columna Tienda). Esto nos permitirá definir dimensiones del cubo usando un mismo campo varias veces.
- Seleccione todo el rango de datos, y usando <Insertar> - <Nombre> - <Definir> digite Ventas.
- Luego grabe el libro como Nuevo Ventas.
- Hasta aquí ya tenemos preparado los datos que nos permitirán crear cubos OLAP.
CUBOS OLAP
Un cubo es una estructura de datos moderna para almacenar información proveniente de grandes bases de datos o de
otras estructuras más modernas de almacenamiento como son los data warehouse y que permite realizar análisis
multidimensionales basados en ciertas formas de medición sobre cruces de datos referenciales llamados dimensiones.
La siguiente figura es una muestra de cómo se entiende a un cubo de información.
OLAP significa Procesamiento Analítico en Línea (On Line Analytical Processing); es decir, mediante un cubo podemos
realizar diversos tipos de análisis y reportes en forma dinámica, en línea, en tiempo real.
CREACIÓN DE CUBOS OLAP
Antes de crear un cubo OLAP se debe preparar los datos.
Esto significa que

- Se debe eliminar objetos como botones, comentarios, cuadros de texto, dibujos, gráficos, las filas que contienen totales
y subtotales, filas en blanco, etc., es más, ni siquiera debieran tener formato de subrayado, color de fuente, tamaño,
negrita, etc.
- La hoja que contiene los datos debe estar dispuesta de tal forma que tenga la estructura de una base de datos; esto
es, debe tener cabecera de columna a la cual le llamamos nombre de campo, cada fila debe representar un registro.
Los ítems que describen al registro deben ocupar una y sólo una fila y todas las columnas (una para cada ítem o
campo) que sean necesarias.
- La primera fila debe contener los nombres de los campos ( o cabecera en Excel). Si las primeras filas estuvieran
vacías, elimínelas.
- Por otro lado, si se desea realizar cruces de un variable (digamos Tienda) en más de una vez, dicha variable (campo o
columna) debe estar repetida en la tabla.
PROCEDIMIENTO PARA CREAR UN CUBO OLAP
Paso 0: Completar los campos necesarios y dar nombre a la hoja como base de datos.
En esta demostración haremos uso del archivo Nuevo Ventas.xls.
 Abra el libro: Nuevo Ventas.xls

 Observe que todo el rango de datos tiene el nombre Ventas. De manera que la base de datos o tabla que usaremos
será Ventas. Cuántos registros tiene? Cuántos campos tiene?. Observe también que tenemos repetido el campo
tienda hasta cuatro veces.
 Cierre este libro y abra uno vacío.
Paso 1 Generación del Informe

 Use la secuencia: <Datos> - <Informe de tablas y gráficos dinámicos> - Seleccione
 <Fuente de datos externa> y clic en <Siguiente>
 Clic en <Obtener datos>
 Seleccionar <Excel files*> - <Aceptar>
 Seleccionar unidad/carpeta/archivo - *.xls – Cuando vea el nombre del Nuevo Ventas.xls en el recuadro superior
izquierdo, selecciónelo y haga clic en <Aceptar>.
 Estando seleccionado Ventas (en el libro pudieron haber más tablas) – pasar sus campos a la derecha haciendo clic
en el botón
 En el recuadro de la derecha <Columnas en la consulta> debe aparecer la relación de los campos (columnas) que
contiene esta base de datos llamada Ventas.
 Si desea haga clic en un campo cualquiera y luego clic en <Vista previa de los datos>
 Luego haga clic en <Siguiente>.
 A continuación se nos pide si se desea filtrar los datos (por ejemplo: en una base de datos de cuenta corriente, tal vez
se quiera trabajar con los registros de Lima y no de provincias). En el caso nuestro no vamos a filtrar los datos.
Pasemos a la siguiente etapa haciendo clic en <Siguiente>.
 En esta ventana se pide si desea ordenar los datos por algún campo, no lo haremos, de manera que haga clic en
<Siguiente>.
 En la ventana que aparece, tenemos tres opciones:
 Devolver los datos al Excel (en nuestro libro vacío para realizar un informe de tablas dinámicas)
 Generar una consulta usando el utilitario Query de Micrsoft
 Generar un cubo OLAP
 Haga clic en la tercera opción <Crear un Cubo OLAP>
 Luego haga clic en <Finalizar>
Luego de breves momentos, pasaremos al Asistente para Cubos OLAP
Paso 2 Asistente para Cubos OLAP(Analytical Processing On Line)

 Luego de leer las tres formas de cubo que se pueden generar, haga clic en <Siguiente>
 La ventana que se obtiene lista los campos que serán usados para realizar operaciones como sumar, promediar,
obtener máximo, mínimo; es decir para sumarizar. A estos campos se les denomina campos de sumarización. Los
otros campos serán usados para realizar cruces o referencias, con los cuales construiremos las dimensiones en el
cubo.
 Desactive (NroVenta es un campo que no puede ser usado para sumarizar) – Haga clic en <Siguiente>
 A continuación se obtendrá la siguiente ventana:

 Seleccione campos de datos y arrástrelo hacia la derecha y luego suéltelo en <Coloque campos aquí para crear una
dimensión>, como se muestra en el esquema.
 Los segundos campos debe soltarlos encima del botón anterior ya trasladado.
 Haga clic en el botón (>>) para pasar los otros campos que han quedado libres. En el informe los usaremos como
campos unidimensionales; si no los incluye, no estarán disponibles en el informe ni para futuras modificaciones del
cubo..
 Cuando termine haga clic en <Siguiente>.
 Lea las tres opciones que se dispone respecto a los cubos. Como queremos guardar todo lo construido, seleccione la
última opción.
 Ahora seleccione la Unidad/Carpeta y déle nombre al cubo (puede usar <Browse> o <Examinar> para ubicar la carpeta
e incluso conectarse a la red si desea grabar en el Servidor de Intranet o Internet). La extensión de un cubo es *.CUB
 Luego haga clic en <Finalizar>
 Para guardar la consulta, que se ha generado paralelo al cubo, seleccionar Unidad/Carpeta/y luego dar un nombre a la
consulta. El nombre puede ser el mismo del cubo ya que éste tendrá como extensión *.Oqy
 Haga clic en <Guardar>
 Luego de breves instantes se habrá generado el cubo y la consulta; y se habrán recuperado los datos, por ello
volvemos a la ventana del Informe de tablas dinámicas (paso 2 de 3). Y esta ventana nos es familiar si hemos creado
antes un informe de tablas dinámicas. Haga clic en <Siguiente>
Paso 3 Diseño dinámico del Informe
 Lo que viene a continuación es lo que haríamos cada vez que queramos usar un cubo para generar un informe de
tablas y gráficos dinámicos.
 A continuación haga clic en <Diseño>
 Colocar las dimensiones en <Fila> (Una de las dimensiones, digamos Zona).
 Colocar los campos resumen (Suma de Monto) en el área de datos.
 No incluya más campos, después lo puede hacer.
 Haga clic en <Siguiente>
 Luego clic en <Finalizar>
Paso 4 Visualizar el informe dinámicamente

 Haga clic en la dimensión colocada en el área de fila (Zona> para desplegar la lista (en este caso haga clic en la flecha
de Almacén. Luego haga clic en el “Check” que ya tiene para que haya dos checks. Puede desplegar la lista haciendo
clic en el botón “+” y luego clic en los que desee.
 Clic en uno o más ítems (debe quedar doblemente seleccionado)
Puede modificar el informe quitando Zona y colocando otros, por ejemplo Distrito. Luego despliegue las dimensiones para
visualizar su contenido usando el mismo criterio del párrafo anterior.
Ejercicio:
Haga que se muestre el siguiente contenido:
Paso 5 Gráfico
 Haga clic en el asistente para gráfico (botón en la barra de Tabla dinámica)
 Añadir/Cambiar/Retirar los botones del gráfico
 Botón derecho sobre uno de los objetos – <Formato> Seleccionar <Opciones>
 Modificar ancho / Modificar colores
 Botón derecho en el eje vertical – Modificar parámetros
 Haga clic en los puntos del gráfico - Modificar su presentación tridimensional

Teoria de Base de Datos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoria de Base de Datos

Cargado por

Copyright:

Formatos disponibles

BASES DE DATOS

El Diseño de la Base de Datos es fundamental para obtener cualidades como

TEORIA DE BASES DE DATOS

ADMINISTRACION DE UNA BASE DE DATOS

EVALUACION, ANALISIS Y DISEÑO

DISEÑO DE UNA BASE DE DATOS

ARQUITECTURA DE UNA BASE DE DATOS

¿Qué es un Data Warehouse?

Otra forma de definir una Data Warehouse

Transformación de Datos (Data Transformation)

Procesamiento y Administración de los Datos

Acceso a los Datos

Descubrimiento o Data Mining

¿Qué productos son generalmente comprados juntos?

Transporte de Cargas y Pasajeros

AT&T utiliza un sistema NCR/Teradata que le permite responder a preguntas como:

Bancos y Entidades Financieras

Qué es un origen de datos en Office?

Instalar controladores ODBC en Excel

Tipos de bases de datos a los que se puede obtener acceso

Seleccionar datos de una base de datos

Actualizar la hoja de cálculo en una operación

Utilizar Query para recuperar datos

Primero se establece un origen de datos para conectar con la base de datos,

Forma en la que Query utiliza los orígenes de datos

Utilizar el Asistente para consultas

Trabajar directamente en Query con otros tipos de consultas

Seleccionar datos específicos de un campo:

Crear un cubo OLAP a partir de los datos de una consulta

Trabajar con los datos en Microsoft Excel

Aplicar formato y analizar los datos

Volver a utilizar y compartir consultas

Actualizar datos externos

PROCEDIMIENTO PARA UTILIZAR MICROSFT QUERY EN UNA TABLA

- Abra un libro vacío

- Haga clic en <Excel Files*> y luego clic en

En el caso nuestro seleccionar la segunda opción y luego hacer clic en <Finalizar>.

- A continuación maximice la (s) ventana (s) del Query.

- A continuación obtendrá la siguiente ventana

La siguiente figura es una muestra de cómo se entiende a un cubo de información.

CREACIÓN DE CUBOS OLAP

Antes de crear un cubo OLAP se debe preparar los datos.

Esto significa que

PROCEDIMIENTO PARA CREAR UN CUBO OLAP

En esta demostración haremos uso del archivo Nuevo Ventas.xls.

 Abra el libro: Nuevo Ventas.xls

Paso 1 Generación del Informe

Luego de breves momentos, pasaremos al Asistente para Cubos OLAP

Paso 2 Asistente para Cubos OLAP(Analytical Processing On Line)

Paso 4 Visualizar el informe dinámicamente

Haga que se muestre el siguiente contenido:

También podría gustarte