Está en la página 1de 15

Un Data warehousing es una colección de tecnologías datos históricos, resumidos y consolidados son más

de soporte de decisiones, dirigido a permitir al trabajador importantes que los detalles y registros individuales.
del conocimiento (ejecutivo, administrador, analista) Como un data warehouse contiene datos consolidados,
tomar mejores y más rápidas decisiones. En los últimos quizás de varias bases de datos operacionales, por
tres años ha aumentado el número de productos y largos períodos de tiempo.
servicios ofrecidos así como la adopción de esta
tecnología por la industria. De acuerdo al grupo META, el
mercado de data warehousing, incluye hardware,
software de base de datos y herramientas. En 1997 se
proyectó un crecimiento de $2 billones en 1995 a $8 De acuerdo con W.H. Inmon, quien es considerado como
billones en 1998. Las tecnologías de data warehousing el padre del data warehouse: “
han sido aplicadas en muchas industrias:
manufactureras (ordenes de envío y soporte de clientes),
ventas al por menor (perfiles de usuarios y
administración de inventarios), servicios financieros .”
(análisis de reclamos, análisis de riesgo, análisis de Metas: obtener la información correcta para las personas
tarjetas de créditos y detección de fraudes), utilidades adecuadas en el momento conveniente para que tomen
(poderosos análisis de uso), y cuidados de salud decisiones que pueden valer millones de dólares.
(resultado de análisis).
Típicamente, el data warehouse es mantenido
Los data warehouses apuntan al soporte de decisiones. separadamente de las bases de datos operacionales de
El data warehousing (almacenamiento de datos) la organización. El data warehouse soporta
representa el proceso de reunir información histórica de procesamientos analíticos en líneas (OLAP).
una organización en un depósito central, y se ha
convertido en una tecnología común y fundamental. Los

Esta arquitectura incluye herramientas para: Carga de un dato en un data warehouse.


Extracción de datos desde múltiples bases de datos Refrescar periódicamente el warehouse para reflejar
operacionales y fuentes externas. día a día las fuentes y depurar los datos del
Depuración, transformación e integración de esos warehouse, quizás sobre almacenamientos más
datos. lentos de archivos.

2
de una variedad de herramientas de front end:
En adición al warehouse principal, pueden haber varios herramientas de consultas, reportes escritos,
mercados de datos departamentales. Los datos en el herramientas de análisis, y herramientas de data mining.
warehouse y los mercados de datos están almacenados Finalmente, hay un repositorio de almacenamiento y
y administrados por uno o más servidores warehouse, administración de metadatos, y herramientas de
los cuales presentan vistas multidimensionales de datos monitoreo y administración de sistemas de warehousing.

Arquitectura de un
Data Warehouse

En muchos casos, el data warehouse se basa en examinar y consultar herramientas que ofrecen diversas
resúmenes de información provenientes de sistemas de funciones de reporte, las cuales incluyen la capacidad de
producción. Construir un data warehouse, en algunos exponer progresivamente más detalles (profundizar). Las
casos, implica comprender la forma de como estos técnicas de comunicación proporcionan a una
sistemas manejan y almacenan datos (las definiciones organización interfaces gráficas para usuario final
de sus datos, ). Asimismo, significa entender convenientes y fáciles de usar para apoyar las tareas de
cómo construir extractores, los cuales transfieren datos análisis. Una importante consideración es el uso
de los sistemas de producción al data warehouse, y el apropiado de técnicas gráficas como la graficación,
software de sincronización que conserva despliegues en forma de árbol, despliegues en red, las
razonablemente actualizado el data warehouse con la curvas de tendencias y análisis multidimensionales.
información del sistema de producción.
Básicamente, el data warehouse es una implementación
de base de datos que usa su propio sistema de
Un data warehouse guarda información histórica (y en administración. Este sistema deriva su información de
algunas ocasiones actual) de un negocio de manera otros sistemas de bases de datos que sustentan las
organizada, permitiendo consultas especializadas y operaciones empresariales diariamente. Las bases de
recuperaciones de datos con facilidad. Esta capacidad datos operacionales se implementan en diversas
es aprovechada por el usuario final para conocer, tecnologías, tales como DB2, IMS, VSAM, Oracle,

3
Sybase, Informix, DL/I, y Flat Files. Muchos significa codificar datos que se han
administradores de bases de datos actuales que decodificado en forma inconsistente en diferentes
sustentan la base de datos real son relacionales. fuentes (por ejemplo, abreviaturas de estados, código de
Algunos ejemplos son la familia DB2/X, Oracle, Sybase e productos y lugares de negocios). El software de
Informix. Diversos mecanismos de transporte llevan los transformación convierte los datos durante el traslado
datos de las fuentes de producción al data warehouse. para asegurar que la información sea compatible con la
Se usan distintos métodos de propagación y duplicación base de datos que la recibe. Desarrollar, seleccionar e
para mantener información consistente en todas las integrar estas piezas de software requiere técnicas de
bases de datos. Se emplean extractores para obtener y administración de datos y de administración de base de
cargar información de una base de datos a otra. datos. También se requieren técnicas en el área de
afinar la ejecución de consultas en la base de datos para
Los datos extraídos deben ser uniformes para poder obtener un rendimiento aceptable de la solución del data
combinar los datos de diferentes fuentes dentro del data warehouse.
warehouse. Este proceso se llama transformación. La

Conforme las organizaciones confían más y más en la Una aplicación de software se vuelve un sistema de
disponibilidad de información y en el acceso a un data Misión Crítica cuando se tiene confianza en sus
warehouse, éste se convierte en un operaciones y se usa todos los días. También se torna
. fundamental para la misión del negocio que apoya. Su
falla puede provocar una falla en el negocio mismo.

Cómo se incorpora una nueva


tecnología en un importante
sistema de Misión Crítica (Ciclo
de madurez de la tecnología).
Sólido
Uso diario
Uso operacional y
estratégico. Se mueve
Implementación expandida hacia un sistema primario
Ámbito más grande
Uso del personal
Uso para apoyar decisiones
Sistema secundario
Piloto Inicial
Ámbito pequeño
Resuelve un problema
determinado

Prueba de conceptos
Demostración de la
tecnología
Experimentos iniciales

4
Conforme la compañía comienza ha usar cada vez más Actividades basadas en requerimientos
la información del data warehouse para las actividades Compatibilidad con la tecnología existente y la
diarias, su disponibilidad comienza a ser cada vez más infraestructura de base.
importante. Los patrones empíricos de uso de Uso diario
información indican que conforme hay más información Uso amigable
de consulta rápida y fácil, más personas posponen hasta Desempeño
el último minuto las solicitudes de información. Cuando Verificable
esto ocurre, se vuelve muy importante que el sistema de Seguridad
data warehouse, y todas las aplicaciones que lo
acceden, estén disponibles todo el tiempo. Entender los requerimientos para un sistema de Misión
Los requerimientos para un sistema de Misión Crítica Crítica permite definir los requerimientos de data
incluyen lo siguiente: warehouse.
Disponibilidad
Consistencia y precisión
Fuerza
Estándares

El data warehouse sigue el mismo ciclo de


perfeccionamiento que todos los desarrollos de software. Ciclo de desarrollo de
Las fases son las mismas, lo mismo que su secuencia. software utilizado para el
data warehouse

Los pasos que deben seguirse para implementar la fase Es uno de los primeros pasos más importantes. La
de planeación del sistema del data warehouse son: decisión tiene mucho que ver con la cultura de la
organización y se basa en cómo se llevan a cabo
las tareas dentro de la organización. Las siguientes

5
son estrategias de implementación que han
demostrado su popularidad:
El enfoque de arriba hacia abajo (de lo (un data warehouse hace copias
general a lo particular). de información operacional e histórica y las
El enfoque de abajo hacia arriba (de lo almacena para uso privado).
particular a lo general). (por lo general, todas las
Una combinación de los anteriores. aplicaciones del data warehouse requieren
diversas operaciones que se aplican sobre las
fuentes de datos).
En teoría, un data warehouse puede desarrollarse (cada departamento
por medio de cualquier metodología. En realidad, funcional en una organización tiene sus propias
los requerimientos de la implementación de un data necesidades específicas y que un solo data
warehouse descartan el uso de cualquier warehouse corporativo no puede satisfacer
metodología que requiera una fase prolongada de todas las necesidades).
acopio de requerimientos y análisis, una fase de (las
desarrollo monolítico que tome muchos meses y necesidades del data warehouse específicas de
una fase de despliegue que ocupe también varios un departamento se deben abordar junto con la
meses. Las dos metodologías populares en el necesidad de un data warehouse corporativo.
desarrollo de software son:
Método de análisis y diseño estructurado (los cortes arquitectónicos se usan para separar
(en cascada). la plataforma para el data warehouse, los
Método de desarrollo espiral. mercados de datos, las fuentes de datos y las
herramientas del usuario final, posee flexibilidad
y se pueden compartir plataformas).
En la mayoría de las organizaciones, la motivación
principal del proyecto de data warehouse es una (es el empleo de dos capas de plataformas, una
primera implementación que produzca beneficios capa contiene a los clientes –aplicaciones
inmediatos a un grupo de usuarios. Después de gráficas- y la otra al servidor –estación de
definir un rumbo general y un conjunto general de trabajo, macrocomputadora-).
objetivos para el data warehouse, se hace
necesario derivar con rapidez un ámbito limitado (hay tres capas: una capa cliente –estación de
para la primera implementación. El ámbito del trabajo -, una capa intermedia con base en un
proyecto de data warehouse puede restringirse servidor y una tercera capa establecida en una
entre muchas dimensiones. Las dimensiones se macrocomputadora).
dividen en dos categorías principales:
Ámbito determinado a partir de la
perspectiva del usuario empresarial del
data warehouse. Uno de los aspectos más importantes de la
Determinación del ámbito con base en planeación consiste en poder realizar:
consideraciones tecnológicas. Articular tanto un plan de programa como un
conjunto de planes de proyecto (un plan de
programa es una visión general de la actividad
El implementador dispone de las siguientes del data warehouse y su función en la vida
opciones arquitectónicas: diaria y semanal de la organización. El plan de

6
programa proporciona la estrategia y los planes
de proyecto proporcionan la táctica). Recopilar varios elementos de diseño relacionados
Reservar un presupuesto adecuado para el con los metadatos. es el término que se
programa al tiempo que se compromete el gasto emplea para las definiciones de datos. Los
para proyectos específicos. La planeación de metadatos son usados para el anteproyecto
este presupuesto se basa en dos enfoques: utilizado para la construcción del data warehouse.
• Estimación del costo, con base en el historial Los metadatos reunidos durante la fase de
de la organización en el desarrollo de planeación del data warehouse provienen de las
software. siguientes fuentes:
• Estimación del costo, con base en la Los modelos empresariales (deben basarse en
arquitectura de referencia. la naturaleza del negocio) construidos por la
Proporcionar medidas para la estimación de la organización son modelos de datos abstractos
retribución del data warehouse. utilizados para caracterizar los tipos de
información que necesita, recopila y utiliza una
organización.
Las personas que utilizan el data warehouse son Los depósitos y diccionarios de datos que
distintas a los desarrolladores y gerentes, por lo manejan los administradores de datos contienen
que puede ser útil que los usuarios finales se definiciones de datos operacionales ubicados en
involucren en el establecimiento de las expectativas diversas bases de datos relacionales y no
de lo que puede ofrecer el data warehouse. Los relacionales.
escenarios empresariales son una importante Las fuentes externas de datos que se requieren
herramienta del prototipo de requerimientos. Estos para responder consultas empresariales pueden
escenarios ayudan a definir las expectativas del estar estructuradas o no para el acceso y
usuario final con respecto al data warehouse. recuperación.

Algunos de estos pasos que constituyen la planeación pueden efectuarse al mismo tiempo (en paralelo), lo cual acorta
la duración de esta fase.

Es una especificación precisa de las funciones que se toma el enfoque de abajo hacia arriba, la mayoría de los
obtendrán del data warehouse. Los requerimientos requerimientos se construyen de manera oportunista con
describirán con claridad el ambiente operativo en el que base en las esperanzas y expectativas. Aquí, el
se entregará el data warehouse, así como las conductor principal es la implementación rápida y de bajo
características y funciones necesarias. costo.
El volumen de acopio de requerimientos que se debe
realizar depende del enfoque de implementación que se •
tome. Si se toma el enfoque de arriba hacia abajo, la
actividad de acopio de requerimientos es Se trata de ver a un sistema de información desde
significativamente grande, pero debido a que las la perspectiva de varios depositarios. Cada
actividades están conducidas por el negocio están bien depositario tiene expectativas distintas del sistema,
entendidas y pueden catalogarse con facilidad. Si se

7
los requerimientos del sistema. Pasos del análisis
de requerimientos.

Los requerimientos para la


solución del data warehouse
desde varias perspectivas de la
gente involucrada en su
planeación e implementación.

Significa convertir los requerimientos acopiados en la información del data warehouse. Especificación de
fase anterior de requerimientos, en un conjunto de los tipos de herramientas y técnicas de exhibición
especificaciones que puedan apoyar el diseño. En lo que usan.
abstracto, hay tres especificaciones principales de
entrada para el data warehouse: El proceso de análisis consiste en derivar modelos
físicos y lógicos de datos para el data warehouse y los
Requerimientos de enfoque empresarial que mercados de datos y definir los procesos necesarios
delinean las fronteras de la información que debe para conectar las fuentes de datos, el data warehouse,
comprender el data warehouse; determinará la los mercados de datos y las herramientas de acceso del
audiencia y sus requerimientos. usuario final.
Especificaciones de requerimientos de fuentes de
datos que delinean las fronteras de información
disponible en las fuentes de datos actuales.
Especificaciones de requerimientos de usuario final
y acceso, las cuales definen cómo se utilizará la

Los modelos lógicos desarrollados en la fase de análisis warehouse/mercado de datos con herramientas de
se convierten en modelos físicos. Los procesos estación de trabajo del usuario final, se convierten en
identificados en la fase de análisis para conectar las diseños para programas que realizarán las tareas
fuentes de datos con el data warehouse, el data requeridas por los procesos. También se identifican y
warehouse con los mercados de datos y el data detallan los procesos que requiere, de manera interna,

8
cada bloque de la arquitectura de referencia del data extracciones parciales de información y
warehouse. procesos que conectan las fuentes de datos
En la fase de diseño se encuentran dos actividades con el data warehouse (o los mercados de
principales: datos si no necesitan un data warehouse).
Procesos que son internos al data warehouse y
se usan para fines de manejo interno.
Comprende las siguientes actividades: Procesos que conectan al data warehouse con
Desarrollo de modelos físicos de datos para las los mercados de datos (si se usan).
bases de datos de almacenamiento del data Procesos que son internos a los mercados de
warehouse y mercado de datos. Pudiera datos (si se usan) y se emplean para fines de
requerirse también el desarrollo de modelos manejo interno.
físicos para el almacenamiento local necesario Procesos que conectan al data warehouse (o a
para las herramientas de usuario final. los mercados de datos) con herramientas de
Correspondencia de los modelos físicos de usuario final.
datos de las fuentes de datos con los modelos Procesos que son internos al data warehouse y
físicos del data warehouse/mercados de datos. a los mercados de datos y para iniciar
Esta correspondencia ayuda a los procesos de herramientas de análisis.
extracción, refinamiento y reingeniería a Procesos que sustentan tareas de manejo,
efectuar sus funciones dentro del data administración y prácticas internas para el data
warehouse/mercado de datos. warehouse como sistema.

Está comprendido en las siguientes aplicaciones:


Procesos que son internos a las fuentes de
datos y se relacionan con depuraciones o

Esta fase es la responsable de implementar físicamente Programas que realicen transformaciones de datos,
los diseños desarrollados durante la fase de diseño. tales como integración, resumen y adición. También
La construcción del data warehouse es similar a la los fabricantes ofrecen facilidades para la
construcción de un sistema de base de datos relacional generación automática de estos programas.
grande. La mayoría de las aplicaciones que se necesitan Programas que realicen actualizaciones de bases de
construir son las siguientes: datos relacionales.
Programas que efectúen búsquedas en bases de
Programas que creen y modifiquen las bases de datos muy grandes. Varias herramientas de usuario
datos para el data warehouse y los mercados de final han optimizado utilerías de búsqueda para las
datos. Los fabricantes ofrecen capacidades de consultas que generan. También varios fabricantes
generación automática para dichos programas. de bases relacionales ofrecen utilerías de
Programas que extraigan datos de fuentes aceleración de consultas y capacidades para
relacionales y no relacionales. Algunos fabricantes recuperación en paralelo.
ofrecen facilidades para la generación automática de
estos programas.

9
Esta fase tiene que ver principalmente con los retos de contenida en el data warehouse en términos y
instalación, puesta en servicio y uso de la solución de lenguajes que comprendan.
data warehouse. Varias organizaciones tienen ya Al principio, el data warehouse se percibe
experiencia en el despliegue y puesta en marcha de principalmente como una capacidad de apoyo a las
sistemas de información empresarial, actividades en las decisiones, no una capacidad de misión crítica. La
que han adquirido experiencia: mayoría de los sistemas de información empresarial
Proporcionar la instalación inicial, incluyendo que proporcionan apoyo operacional están
facilidades para las conexiones básicas de datos enlazados a los resultados, a veces sin desearlo,
con las fuentes y para la actualización y como sistemas de misión crítica. Debido a estas
sincronización de datos. diferencias en la percepción, existe una necesidad
Planeación y entrega de una implementación por de promover activamente entre los usuarios finales
etapas. la información que proporciona el data warehouse.
Proporcionar capacitación y orientación a todo tipo Sólo después de que los usuarios finales usen
de usuarios. diariamente la información del data warehouse, éste
Planeación e implementación de la actualización de se convertirá en un sistema de Misión Crítica.
plataformas y el mantenimiento necesario por el
data warehouse cuando se requiere. El despliegue del data warehouse requiere las siguientes
Proporcionar la administración de usuarios y capacidades adicionales:
sistemas. este es el
Proporcionar la capacidad de generar archivos proceso de tratar a la información en sí como si
permanentes y respaldos. fuera un producto de mercancía. Un producto de
Proporcionar la capacidad de recuperación. mercancía ha exhibido con claridad los aspectos de
Asegurar la integración dentro de la infraestructura creación de demanda, atractivo y utilidad percibida
existente. por el consumidor. Para el vendedor que analiza las
Proporcionar controles de acceso y seguridad. tendencias e historia de ventas en su computadora
Asegurar la completa disponibilidad y los procesos portátil, la información de ventas del data warehouse
para manejar caídas de los sistemas y sus es simplemente una mercancía requerida para el
componentes de infraestructura. momento. Se requiere en un formato compatible con
una hoja de cálculo que se ejecute en esta estación
Además de los requerimientos normales de despliegue de trabajo. La comercialización también es mostrar a
para cualquier sistema de información empresarial, el los usuarios finales cómo desplegar la información
sistema de data warehouse tiene los siguientes del data warehouse para su provecho, mostrando
requerimientos adicionales: ejemplos de escenarios de uso.
La mayoría de los sistemas de información son el catálogo
construidos y manejados por personal técnico. El de información para el data warehouse contiene
nivel de documentación de los metadatos en dichos listas de elementos de información, consultas
sistemas con frecuencia sólo es adecuado para una empresariales estándar y reportes estándar
audiencia de técnicos. La mayoría de los usuarios disponibles a partir del data warehouse. Las listas
finales del data warehouse no son técnicos. están en un lenguaje (y posiblemente en multimedia)
Necesitan ver definiciones de la información familiar y obvio para el usuario. Los catálogos de

10
información se actualizan y se entregan a los El data warehouse es un método para ofrecer la
usuarios con la regularidad de suscripción. información que en el pasado controlaba y manejaba un
con el departamento en tecnología de la información para un
amplio interés y popularidad de los examinadores, la grupo de usuarios finales que entienden el negocio, pero
información del data warehouse también se no necesariamente la tecnología. El concepto de
presenta y distribuye a los usuarios de manera que apreciar la información como una mercancía fuerza al
les permita examinar y hacer copias locales de proveedor de información a considerar los aspectos de
información en forma selectiva. comercialización de productos de mercancía y apoyarse
en el cuerpo de conocimientos desarrollado en esta área
durante años.

El método de desarrollo en espiral es un ingrediente herramientas de acceso del usuario final


clave para el despliegue rápido inicial de un data consumieron mucho tiempo para la carga inicial de
warehouse. Este método requiere también de una rápida información desde el data warehouse.
evolución de características y funciones basadas en las Otros departamentos no querían configurar sus
lecciones aprendidas en anteriores despliegues. Al propios mercados de datos. Ahora es necesario
comenzarse a utilizar regularmente el data warehouse, incrementar el ámbito del metamodelo del data
se podrían prever algunas de las siguientes áreas de warehouse.
mejoramiento:
Consultas empresariales que no pudieran Para explotar las ventajas que ofrece el modelo en
formularse o satisfacerse debido a las limitaciones espiral, es importante comenzar a reunir requerimientos
impuestas por el metamodelo del data warehouse. para la siguiente iteración del ciclo de desarrollo tan
Estas limitaciones pueden surgir debido a una falta pronto como se entrega una iteración. Para su uso
de ciertos resúmenes o adiciones que no se efectivo, se requiere que la mayoría de las versiones de
realizaron en la implementación inicial. software se distribuyan con intervalos mínimos de seis
Consultas empresariales que comprendieran fuentes meses. Gran parte de los proyectos de desarrollo de
de datos externos que no formaron parte de la aplicaciones se debe entregar aproximadamente dentro
implementación inicial. Ciertas consultas del mismo marco de tiempo para que la administración la
empresariales requerían información de fuentes de atienda y apruebe.
datos adquiridos que se relacionen con factores
ambientales.
Desempeño no satisfactorio de componentes clave
del data warehouse. El data warehouse no se
actualizó con suficiente frecuencia. Las

11
Los data warehouses responden a las necesidades de tienen diferentes niveles de confianza y experiencia con
soporte de decisiones para un rango de usuarios que la tecnología computarizada.

Perfiles del usuario

Fu n c i o n e s

J e r a r q u ía o r g a n i za c i o n al

N i v e l de c o m p et e n c i a de u s u ar i os

Desde la perspectiva de un data warehouse, los usuarios Las suposiciones básicas sobre los usuarios comunes
se dividen en categorías por jerarquía, por función, o por del data warehouse elaboradas por la mayoría de los
su nivel de competencia en cómputo en la organización. constructores de data warehouses son las siguientes:
• Los usuarios tienen conocimientos del área de la
El corte de la incluye al empresa que maneja el data warehouse.
director general y al director operativo; ejecutivos de • Los usuarios entienden la semántica de los datos
primer nivel como el director financiero y el contralor; recuperados del data warehouse.
gerentes de mandos medios; analistas empresariales y • Los usuarios aprenderán a acceder y recuperar los
de tecnología de la información; y al personal datos en el data warehouse.
administrativo o de apoyo. • Los usuarios tienen la posibilidad y la capacidad
Un corte constituye departamentos tales como para convertir los datos (recuperados del data
Contabilidad y finanzas, Comercialización y ventas, warehouse) en hechos e información, convertir los
Producción e ingeniería, Servicios de apoyo al cliente y hechos en conocimiento y, utilizar luego ese
Administración. conocimiento para tomar decisiones o plantear
El corte por en cómputo divide a recomendaciones y alternativas.
los usuarios en tres amplios grupos con niveles
crecientes: usuarios ocasionales, regulares y expertos.

12
La recuperación de la inversión en un data warehouse se empresariales pretenden extraer los datos correctos con
basa en la capacidad de los usuarios empresariales para una mínima inversión en tiempo y sin frustraciones. Hay
extraer los datos correctos del data warehouse, varias formas de extraer y analizar información valiosa
convertirlos en información y luego utilizar esa del data warehouse.
información para tomar mejores decisiones. Los usuarios

Plataforma de soporte de
decisiones

El procesamiento informático consta de tres distintos matrices, tablas y gráficas que van de sencillas a
componentes: consultas para acceder y recuperar datos complejas. El ámbito del procesamiento informático por
del data warehouse, análisis de los datos y presentación lo regular está limitado al procesamiento de dos o tres
del análisis en forma de reportes, hojas tabulares y dimensiones (2D o 3D).

Pasos del procesamiento


informático

13
utilizan diversas técnicas de análisis, tales como cuadros
Una hipótesis o cuestión empresarial tal como “¿existe y gráficas; por ejemplo, cuadros de ventas mensuales y
una tendencia por temporada en las ventas trimestrales trimestrales por tienda para cada artículo y ventas por
de artículos deportivos?”, se debe traducir a una consulta territorio y región. La experiencia, intuición y destreza del
de cómputo para proponerla al data warehouse. Esta usuario empresarial tienen un papel principal en el éxito
traducción la lleva a cabo ya sea un profesional de del análisis de los datos y la formulación de
tecnología de la información, o bien, un usuario recomendaciones.
empresarial que utilice herramientas de un fabricante o
una aplicación personalizada. El reto consiste en traducir
los términos empresariales en términos que la Los resultados del análisis se presentan como reportes,
computadora entienda (y, por lo tanto, términos que cuadros y gráficas, o como datos preprocesados para un
comprendan las herramientas de acceso de acceso y mayor análisis. Existen varias opciones, tales como
consulta del data warehouse). reportes de corte simple y tabulares, gráficas de pastel,
de barras en dos o tres dimensiones, histogramas y de
dispersión, y la elección depende de la naturaleza de la
Las herramientas de acceso proponen la consulta de información analizada y de las necesidades particulares,
cómputo al data warehouse y recuperan los datos estilo de comunicación y cultura de la organización.
adecuados. El proceso de acceso y recuperación pudiera
incluir la capacidad de realizar cálculos, tal como
clasificar resultados o crear subtotales por artículo. Por Las recomendaciones se podrían divulgar como una
ejemplo: las cifras de ventas de cada tienda se resumen copia en bruto o con formato, o enviarse por correo
en forma semanal y por artículo. electrónico al usuario empresarial. Ahora, cada vez con
mayor frecuencia, los resultados del análisis se exportan
a herramientas de escritorio como hojas de cálculo, (para
El usuario empresarial puede realizar mayores cálculos y un mayor análisis) o a procesadores de texto para
manipulación sobre los datos reunidos por la consulta. El incorporarse a reportes y documentos.
propósito del análisis adicional sería convertir los datos
recuperados en información o hechos. A fin de convertir
datos en información para derivar recomendaciones, se

Cuando los analistas empresariales utilizan el data Descubrir nociones empresariales vitales que
warehouse para determinar lo que están haciendo sus ayuden a controlar la participación en el mercado y
clientes, ¿por qué lo hacen?. Comprender la conducta de elevar las utilidades.
los clientes o el comportamiento empresarial es Comprender la relación total con cada cliente para
fundamental para mejorar el balance de la empresa y desarrollar las estrategias de precios adecuadas y el
tener clientes complacidos. Los administradores y mayoreo de productos correcto, con base no sólo en
analistas empresariales buscan respuestas para lograr la intuición, sino en el uso real del producto y la
objetivos como: experiencia del cliente.
Localizar y llegar a mejores clientes no sólo a Discernir un valor de por vida para el cliente.
cualquier clienta nuevo.

14
Reducir los gastos promocionales e incrementar al datos es un arma esencial en el arsenal del soporte de
mismo tiempo la efectividad neta de las decisiones del analista.
promociones en general (analizar el comportamiento La minería de datos auxilia a los usuarios empresariales
de compras y la respuesta a las promociones). en el procesamiento de vastas reservas de datos para
descubrir “relaciones insospechadas”, por ejemplo, entre
productos y clientes o patrones de compra de los
Para lograr estos objetivos, el data warehouse clientes. La meta es descubrir “ revelaciones estratégicas
proporciona al gerente empresarial dos ingredientes competitivas” para controlar la participación en el
esenciales: mercado y las utilidades. Una vez extraídas las
Una gran cantidad de datos sobre sus clientes, así relaciones y presentadas a los analistas empresariales,
como la historia entre el cliente y la organización. éstos las examinan y seleccionan las más interesantes y
Mucho más importante, es el carácter único de sus útiles.
datos, ninguno de los competidores los posee.
La empresa tiene su propia mina de datos, y tiene el Los analistas empresariales tienen un rango de
potencial de encontrar y extraer la información de necesidades:
revelaciones fundamentales en el comportamiento de Comprender qué está sucediendo en el negocio.
sus clientes, sus propios productos, e incluso sus Por qué está sucediendo, ¿Cuál es el
proveedores. Para esta capacidad, la solución del data comportamiento de clientes y mercados?
warehouse debe incorporar la minería de datos a su ¿Qué puede hacerse?, ¿Cuáles acciones se pueden
plataforma de soporte de decisiones. La minería de tomar?

Metas del soporte de


decisiones

El valor de un análisis para los gerentes es más alto utilizan el sub-bloque de Análisis y recuperación para
cuando genera una recomendación factible. Comprender tener una interfaz con el data warehouse y con el
el comportamiento y los pronósticos de clientes y mercado de datos. Muchas de las herramientas de la
mercados, y lo que puede hacerse, son retos para las minería de datos también emplean el componente de
técnicas tradicionales de análisis. Las consultas, reportes depósito local del bloque de Acceso y recuperación, a fin
y análisis multidimensional tradicionales se concentran de almacenar los datos en estructuras de datos de
en lo que está sucediendo y, en menor medida, en el por propietario para análisis subsecuentes y presentaciones
qué. La minería de datos se concentra en llenar la de los resultados. La mayoría de las herramientas de
necesidad de descubrir el por qué, para luego predecir y minería de datos puede con facilidad saltarse el data
pronosticar las posibles acciones con cierto factor de warehouse o el mercado de datos y acceder de manera
confianza para cada predicción. directa la fuente de los datos. Tradicionalmente, las
Las herramientas de minería de datos son un herramientas de minería de datos acceden los datos de
componente importante del sub-bloque de Análisis y la fuente. Sin embargo, los datos del data warehouse o
reportes del bloque de Acceso y uso de la arquitectura del mercado de datos están refinados, integrados y
de referencia. Las herramientas de minería de datos estandarizados. La estandarización eliminó aspectos

15
como las convenciones de nombres múltiples, las esencialmente por el analista empresarial. En estos
estructuras ocultas de codificación y los campos casos, este proceso también se conoce como
faltantes. Los datos operacionales en la fuente son por lo (modalidad de descubrimiento del soporte de
general inconsistentes y están dispersos en muchas decisiones, la cual es conducida por los datos y no por el
aplicaciones. Además, se requieren datos históricos para analista empresarial).
descubrir patrones temporales de interés.
Los datos en el data warehouse deben estar al nivel de
detalle correcto. Debido a la naturaleza incipiente de la En las aplicaciones empresariales, a la fecha, la
tecnología de minería de datos, es necesaria (en tecnología de minería de datos se ha utilizado
especial al principio) una estrecha cooperación entre los principalmente en aplicaciones de comercialización,
analistas empresariales y los profesionales en tecnología ventas y análisis de créditos; y se ha aplicado con éxito
de la información. en áreas empresariales con el más alto potencial, tales
Para formar la mezcla correcta de actividades de minería como la segmentación de clientes y del mercado y el
de datos, son cruciales tres ingredientes: usuarios, análisis de comportamiento del cliente, en particular en
aplicaciones empresariales y tecnología y herramientas. los sectores de menudeo, bancario y financiero. Hasta
aquí, la tecnología por lo general era costosa de aplicar y
desplegar pero esta situación esta cambiando con
Los usuarios clave en perspectiva de la minería de datos rapidez. Hoy en día, una confluencia de tres fuerzas
son los analistas empresariales, los peritos en importantes conduce el crecimiento en la minería de
estadística y los profesionales en tecnología de la datos:
información que auxilian a los usuarios empresariales. La tecnología del data warehouse para proporcionar
Quienes obtienen beneficios de los resultados de minería un gran banco de datos bien organizados e
de datos son los gerentes empresariales y los ejecutivos, históricos.
que desean entender los factores de éxito del negocio Hardware en paralelo, productos de base de datos y
con base en datos completos del cliente, y utilizan luego herramientas a precios razonables.
este conocimiento para afinar las estrategias de Tecnologías y herramientas para minería de datos
producción, precios y comercialización; mejorara el nivel cada vez más desarrolladas.
de éxito de las estrategias; e impulsar el balance. Se espera que se acelere el uso de la minería de datos.
Hasta la fecha, las empresas han dependido del La cantidad de aplicaciones del data warehouse crece
procesamiento informático y analítico para medir y con rapidez, y los precios de hardware en paralelo y los
comprender la estabilidad de un negocio. El productos de apoyo de software disminuyen con rapidez.
procesamiento informático (consultas y reportes) es más
sencillo de usar, pero requiere de una estrecha dirección
del analista. Los analistas preguntan cuestiones Existe una amplia variedad de tecnología para la minería
específicas y verifican las cuestiones e hipótesis con los de datos y todavía va a aparecer más en el mercado.
datos. Para este fin, los datos deben estar bien Estas herramientas y tecnologías de datos se clasifican
organizados. El procesamiento analítico (OLAP) requiere en tres grandes categorías:
de menos dirección del analista, aunque los datos deben Análisis estadístico o de datos.
estar organizados en una forma especial (base de los Descubrimiento de conocimientos.
datos multidimensionales), o accederse bien de manera Otros, como sistemas de visualización, sistemas de
especial (visión multidimensional). En ocasiones se información geográfica, análisis fractal y
utiliza una combinación de técnicas de consulta y OLAP herramientas de propietario.
para comprender el comportamiento del cliente o para
construir perfiles de segmentos de mercado; pero el
proceso de aplicar estas técnicas es conducido

16

También podría gustarte