Está en la página 1de 22

1

ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Instituto Politcnico Nacional

Unidad Profesional
Interdisciplinaria de Ingeniera y
Ciencias Sociales y
Administrativas
EQUIPO 1 DATA WAREHOUSE
Administracin Informtica II
Secuencia: 8CM1
Integrantes:
Blancarte Gonzales Alicia
Morales Reyes Aleida Esmeralda
Trejo Snchez Jessica Daniela

Instituto Politcnico Nacional




2
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
NDICE









1. Introduccin.... 3
Desarrollo
2. Importancia de la informacin estratgica... 3
2.1 Planeacin Estratgica... 4
3. Administrador Multidimensional 4
4. Modelacin Multidimensional 6
4.1Concepto 6
4.2 Caractersticas 8
4.3 Ventajas 8
4.4 Conceptos de Base de Datos Multidimensionales 9
4.5 Pasos Bsicos del Modelo Multidimensional 13
5. Data Warehouse........ 14
5,1 Concepto 14
5.2 Caractersticas..
15
5.3 Beneficios.
15
5.4 Datamart
16
5.5 Datamining... 17
5.6 Sistema de Soporte a la Decisin(DSS)... 18
6. Conclusin... 20
7. Hemerografa y Bibliografa.. 21




3
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL

1. INTRODUCCIN
La ciencia no es ms que un refinamiento del pensamiento cotidiano.
(Albert Einstein).
Cada instante en la vida cotidiana est relacionado con los datos y estos
en su conjunto crean informacin, cualquier actividad que se realiza es
informacin, esta es lo ms importante que se tiene ya que sin ella no se
podra realizar nada nosotros los seres humanos estamos llenos de
informacin lo cual nos permite establecer comunicacin con los dems,
desarrollar un pensamiento nico y crear cosas inimaginables y
extraordinarias.
Ahora hay que aprender a manejar la informacin que se tiene para
poder lograr nuestros objetivos, metas y proyectos planeados, esto debe
de ser estratgicamente, teniendo bien planteado hacia dnde vamos,
como se lograra y realizar metodologas para poder lograrlo.
Millones de personas, miles de pensamientos y razonamientos pero t
podras ser esa persona nica entre tantas, aprendiendo a manejar tu
informacin y conocimiento.
La informacin bien manejada, analizada, documentada y estratificada
hacia un objetivo crea resultados positivos, personalmente y
laboralmente.
En este trabajo se desarrolla una investigacin acerca de la informacin
estratgica, modelacin multidimensional y un Data Warehouse.
2. IMPORTANCIA DE LA INFORMACIN ESTRATGICA.
En el mercado global la informacin se ha convertido en un pilar de xito
para la competencia, el manejo del negocio, su marco histrico poder
obtener un pasado, presente y estrategias futuras para lograr objetivos y
mantenerse en un sector de mercado creciente.




4
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
La informacin bien analizada ha emergido como un factor realmente
positivo para una empresa creando resultados increbles.
Para obtener la informacin estratgica se necesita una planeacin
estratgica, colaboracin de los participantes en la planeacin
estratgica que en la mayor parte es la alta direccin y uso de las TI
(Tecnologas de la Informacin).
2.1. Planeacin estratgica.
La planeacin estratgica es lo ms importante para poder hacer que la
informacin se convierta en un factor de xito.
La planeacin estratgica dentro de una empresa sirve para poder
identificar las oportunidades y estrategias a seguir para poder mantener
una empresa correctamente.
Se toma la informacin, se procesa y se analiza, con el propsito de
evaluar la empresa y la ayuda en toma de decisiones a base de los
factores de xito obtenidos en la empresa.
3. ADMINISTRADOR MULTIDIMENSIONAL
Una tendencia actual en las empresas modernas es la forma de administrar
la Informacin de una organizacin para apoyar el cumplimiento de su
misin y objetivos, basada en el uso de Tecnologas de Informacin (TI) de
Inteligencia de Negocios u organizacines basadas en informacin (BI
Business Intelligence) la cual rompe con el esquema del administrador
tradicional en una organizacin.
Inteligencia de Negocios:

Se define como proceso para convertir a la informacin en un Arma
Estratgica para los negocios, estableciendo Bases de Datos Estratgicas
en donde la Informacin acta como un recurso vital de la Organizacin y
donde se observan los siguientes aspectos:




5
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Nueva actitud hacia el valor de la informacin
Forma diferente de administrarla
Mximo beneficio esperado: competencia en un ambiente globalizado
Una coordinacin de informacin y toma de decisiones total y profunda,
que mueve a toda una empresa de forma ordenada y armnica y que se
opone al tradicional flujo ascendente de informacin y flujo descendente
de decisiones, ser la respuesta a la organizacin basada en Informacin
para obtener el mayor beneficio posible.
El Administrador Multidimensional (AM)
Un nuevo enfoque de los directivos de una organizacin son en la
actualidad los llamados Administradores Multidimencionales, los cuales
tienen una nueva visin en funcin del manejo de la empresa basada en
informacin.
El AM como elemento clave de una organizacin basada en Informacin
requiere manejo efectivo de la informacin disponible, bsqueda de
Informacin Oportuna Pensamiento Multidimensional (relacin de toda la
informacin del negocio), cambio en el paradigma del uso de Reportes,
cambia el modelo de administracin tradicional, por uno orientado a
administrar informacin, sirve como palanca de cambio para una
organizacin y es un elemento indispensable en una organizacin basada
en Informacin dando como resultado la creacin de una empresa
moderna y competitiva.
Los administradores de TI han comenzado a advertir que Business
Intelligence (BI) no es solamente tecnologas, sino que los directivos de una
compaa puedan tomar decisiones informadas y coordinadas en un
entorno que evoluciona velozmente, y en el cual las cosas que no son
inmediatas simplemente llegan demasiado tarde.
Problemas crticos a resolver:




6
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Dificultad para producir informacin a partir de los datos; la solucin ser el
cambio en la arquitectura y enfoque de las organizaciones.
El Data Warehouse y la Organizacin:
A travs de la tecnologa los problemas no estn resueltos, el desarrollo de
un Data Warehouse debe ser guiado por la misin y visin del negocio y su
avance tecnolgico, de tal manera que explote la tecnologa existente o
se invierta en nueva tecnologa.
4. MODELACIN MULTIDIMENSIONAL.
4.1 CONCEPTO
Es una tcnica para modelar bases de datos simples y entendibles al
usuario final. La idea fundamental es que el usuario visualice fcilmente la
relacin que existe entre los distintos componentes del modelo.
Su representacin se da como una actividad que es objeto de anlisis
(hecho) y las dimensiones que caracterizan la actividad (dimensiones).
La informacin relevante sobre el hecho (actividad) se representa por un
conjunto de indicadores (medidas o atributos de hecho).
La informacin descriptiva de cada dimensin se representa por un
conjunto de atributos (atributos de dimensin).
El modelado multidimensional se puede aplicar utilizando distintos modelos
de datos (conceptuales o lgicos).





7
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL

Para entender ms el concepto, retomemos el ejemplo anterior. La
descripcin de una organizacin tpica es: Nosotros vendemos productos
en varios mercados, y medimos nuestro desempeo en el tiempo.
Un diseador dimensional lo ver como: Nosotros vendemos productos
en varios mercados, y medimos nuestro desempeo en el tiempo. Donde
cada palabra subrayada corresponde a una dimensin.
Esto puede visualizarse como un cubo (Figura 3), donde cada punto
dentro del cubo es una interseccin de coordenadas definidas por los
lados de ste (dimensiones). Ejemplos de medidas son: unidades
producidas, unidades vendidas, costo de unidades producidas, ganancias
($) de unidades vendidas, etc.





8
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Estas aplicaciones informticas clsicas de consulta, orientadas a la
toma de decisiones, deben ser programadas. Atendiendo a las
necesidades del usuario, se crea una u otra interfaz. Sin embargo,
muchos desarrolladores se dieron cuenta de que estas aplicaciones
eran susceptibles de ser generalizadas y servir para casi cualquier
necesidad, esto es, para casi cualquier base de datos. Los sistemas
OLAP evitan la necesidad de desarrollar interfaces de consulta, y
ofrecen un entorno nico vlido para el anlisis de cualquier
informacin histrica, orientado a la toma de decisiones.
OLAP describe una clase de servidores de bases de datos que estn
diseados para permitir acceso y anlisis ad-hoc de los datos. Mientras
que las transacciones residen en Bases de Datos Relacionales (BDR) o
en otro tipo de archivos, OLAP logra su mxima flexibilidad y poder
utilizando la tecnologa de Bases de Datos Multidimensionales (BDM). Es
por esto que ltimamente BDM y OLAP se los utiliza como sinnimos.
Esta nueva y sofisticada tecnologa provee a los usuarios con poderosas
funciones para el anlisis, sntesis y consolidacin de datos (anlisis de
datos multidimensional) con un mnimo conocimiento de la estructura
de los mismos.
4.2 CARACTERSTICAS
En general, la estructura bsica de un DW para el Modelo Multidimensional
est definida por dos elementos: esquemas y tablas.
Tablas DW: como cualquier base de datos relacional, un DW se compone
de tablas. Hay dos tipos bsicos de tablas en el Modelo Multidimensional:
Tablas Fact: contienen los valores de las medidas de negocios, por
ejemplo: ventas promedio en dlares, nmero de unidades vendidas, etc.
Tablas Lock_up: contienen el detalle de los valores que se encuentran
asociados a la tabla Fact.
Esquemas DW: la coleccin de tablas en el DW se conoce como Esquema.
Los esquemas caen dentro de dos categoras bsicas: esquemas estrellas y
esquemas snowflake.
*Tipos de datos Time-Series.




9
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Dimensiones especiales para variables.
Mltiples jerarquas dentro de una dimensin.
Clases dentro de una dimensin.
Variables virtuales.
Variables independientemente dimensionadas.
Alias
Velocidad de consolidacin.
4.3 VENTAJAS.
Lograr el rendimiento rpido de consultas ad hoc en los datos
empresariales. Un modelo multidimensional se compone de cubos y
dimensiones que se pueden anotar y ampliar para admitir construcciones
de consultas complejas. Los desarrolladores de BI crean cubos para admitir
tiempos de respuesta rpida y para proporcionar un nico origen de datos
para informes empresariales. Debido a la mayor importancia de business
Intelligence en todos los niveles de una organizacin, el hecho de tener un
solo origen de datos analticos se garantiza que las discrepancias se
mantienen al mnimo, si no se eliminan por completo.
Otra ventaja importante es la integracin con las herramientas de informes
BI utilizadas habitualmente, como Excel, Reporting Services y
PerformancePoint, as como las aplicaciones personalizadas y las
soluciones de terceros.
4.4 CONCEPTOS DE BASES DE DATOS MULTIDIMENSIONALES
Concepto Descripcin
BDR Base de Datos Relacional. Sistema de
almacenamiento de datos basado en un conjunto
de tablas unidas mediante relaciones.
BDM Base de datos Multidimensional. Base de datos de
estructura basada en dimensiones orientada a
consultas complejas y alto rendimiento. Puede
utilizar un SGBDR en estrella (Base de datos
Multidimensional a nivel lgico) o SGBDM (Base de




10
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
datos Multidimensional a niveles lgico y fsico o
Base de datos Multidimensional Pura)
OLTP On Line Transactional Processing. Procesamiento
Transaccional En Lnea. Se trata de los procesos
clsicos de tratamiento automtico de
informacin, que incluyen Altas, Bajas,
Modificaciones y Consultas.
OLAP On Line Analytical Processing. Procesamiento
Analtico En Lnea. Se trata de procesos de anlisis
de informacin. Estos sistemas estn orientados al
acceso en modo consulta.
DW DataWarehouse. Sistema almacn de datos que
rene la informacin generada por los distintos
departamentos de una organizacin. Pretende
conseguir que cualquier departamento pueda
acceder a informacin de cualquiera de los otros
mediante un nico medio, as como obligar a que
los mismos trminos tengan el mismo significado
para todos. Es un almacen de datos historicos,
utilizado por una herramienta OLAP para procesar
informacin, elaborar informes y vistas. Tambin se
define como un conjunto de datos orientados por
tema, integrados, variables en el tiempo y no
voltiles que se emplea como apoyo a la toma de
decisiones.
Datamart Sistema que mantiene una copia de parte de un
DataWarehouse para un uso departamental.
Almacn de datos historicos relativos a un
departamento de una organizacin, utilizado por
una herramienta OLAP para procesar informacin,
elaborar informes y vistas.
EIS Executive Information Systems. Sistemas de
informacin para directivos.
DSS Decision Support System. Sistema de ayuda a la
toma de decisiones.
Data Mining Proceso no trivial de anlisis de grandes




11
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
cantidades de datos con el objetivo de extraer
informacin til. Por ejemplo, se trata de aplicar
algoritmos de clasificacin de datos para realizar
predicciones futuras, o estudios de correlacin
entre variables aparentemente independientes.
Para ello, es comn la utilizacin de Redes
Neuronales o Algoritmos Evolutivos.
KDD Knowdledge Discovery in Databases.
Rotacin Cambio de dimensiones en un informe.
Drill Down Descomponer (visualmente) en detalle un dato
segn una jerarqua de una dimensin.
Drill Up Agregar (visualmente) un dato segn una
jerarqua de una dimensin.
Roll Up Proceso que calcula para un indicador, y para
una o ms de las dimensiones por las que ese
indicador se mueve, los valores agregados o
padres sucesivos a partir de la suma de sus hijos,
segn las jerarquas especificadas, pudiendo
poseer cada dimensin ms de una jerarqua. Por
ejemplo, es el proceso que suma los ingresos por
cada provincia acumulndolos en los ingresos de
la comunidad autnoma correspondiente. Se
trata de una funcin que relaciona los valores de
dos niveles jerrquicos distintos y adyacentes en
una dimensin, transformando un grupo de datos
de un nivel en un nico dato asignable a otro valor
del nivel superior.
Spread Proceso que produce dentro de una dimensin
una progresin o algn tipo de reparto
proporcional de la cantidad asignada a un
elemento entre otros de acuerdo a algn criterio.
Dimensin Criterio de clasificacin de informacin. Eje de
anlisis. Lista de valores que proporciona un ndice
a los datos. Por ejemplo: <Tiempo>, <Geografa>,
<Producto>




12
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Indicador,
Medida,
Hipercubo,
Variable,
Frmula
Objeto de estudio. Cada indicador tiene asociada
una serie de dimensiones sobre las que se pueden
clasificar sus valores, se dice que se mueve por un
cierto nmero de dimensiones. Por ejemplo,
algunos indicadores son:
Ingresos(<Tiempo>, <Geografa>, <Producto>)
Nmero de Empleados(<Tiempo>, <Geografa>)
Si el indicador contiene datos almacenados se
habla de Variable Multidimensional. Si por el
contrario, lo que se almacena es la expresin para
calcular esos datos a partir de otros (que puede
ser una frmula o un programa), se habla
de Frmula Multidimensional
Elementos de
una dimensin
Posibles valores de un eje de anlisis. Por ejemplo,
"Enero de 1998", "Trimestre 4 de 1998", o "1996" para
la dimensin <Tiempo> y "Bilbao", "Andaluca" o
"Zona Norte" para la dimensin <Geografa>
Jerarqua Forma de agrupar todos o slo algunos de los
elementos de una dimensin con relaciones
padre-hijo. Casi siempre, pero no
obligatoriamente, implican que el padre se
calcula como la suma de sus hijos. Una dimensin
puede tener cero, una o varias jerarquas.
Relaciones o
Atributos
Definen vnculos entre valores de dos dimensiones,
de forma que cada valor de una dimensin
puede estar relacionado con uno o ms valores
de otra dimensin
Celda Estructura mnima de almacenamiento formada
por la interseccin de un valor de cada una de las
dimensiones que componen el cubo. Puede
contener o no contener datos
SQL Structured Query Language. Lenguaje de
Consultas Estructurado. "Select Query Language".
Lenguaje orientado a la creacin de consultas de
bases de datos relacionales.
RDBMS Relational DataBase Management System. Sistema




13
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
de gestin de bases de datos relacionales.
Programa que sirve para crear, disear y
manipular bases de datos relacionales
OLTP to OLAP Proceso de migracin de datos desde un sistema
OLTP a uno OLAP. Esta migracin es
habitualmentwe el elemento crtico en un
desarrollo OLAP
R-OLAP Arquitectura de Base de Datos Multidimensional en
la que los datos se encuentran almacenados en
una Base de Datos Relacional, normalmente con
en forma de estrella (copo de nieve, araa).
M-OLAP Arquitectura de Base de Datos Multidimensional en
la que los datos se encuentran almacenados en
una Base de Datos Multidimensional, que mejora
los tiempos de acceso a costa de mayores
necesidades de almacenamiento y retardos en las
modificaciones.
H-OLAP Arquitectura que combina las tecnologas ROLAP y
MOLAP. En HOLAP, el soporte de almacenamiento
de datos y el motor de generacin de vistas
contienen elementos de ambas tecnologas.
Pretende combinar las ventajas de cada una sin
sus inconvenientes.





14
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL

4.5 PASOS BSICOS DEL MODELAMIENTO MULTIDIMENSIONAL
1. Decidir cules sern los procesos de negocios a modelar, basndose en
el conocimiento de stos y de los datos disponibles. Ejemplo: Gastos
realizados por cada mercado para cada tem a nivel mensual. Productos
vendidos por cada mercado segn el precio en cada mes.
2. Decidir el Grano de la tabla Fact de cada proceso de negocio.
Ejemplo: Producto x mercado x tiempo. En este punto se debe tener
especial cuidado con la magnitud de la base de datos, con la informacin
que se tiene y con las preguntas que se quiere responder. El grano decidir
las dimensiones del DDW. Cada dimensin debe tener el grano ms
pequeo que se pueda puesto que las preguntas que se realicen
necesitan cortar la base en caminos precisos (aunque las preguntas no lo
pidan explcitamente).
3. Decidir las dimensiones a travs del grano. Las dimensiones presentes en
la mayora de los DDW son: tiempo, mercado, producto, cliente. Un grano
bien elegido determina la dimensionalidad primaria de la tabla fact. Es
posible usualmente agregar dimensiones adicionales al grano bsico de la
tabla fact, donde estas dimensiones adicionales toman un solo valor para
cada combinacin de las dimensiones primarias. Si se reconoce que una




15
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
dimensin adicional deseada viola el grano por causar registros
adicionales a los generados, entonces el grano debe ser revisado para
acomodar esta dimensin adicional.
4. Elegir las mediciones del negocio para la tabla fact. Se deben
establecer los temes que quedarn determinados por la clave compuesta
de la tabla fact.

5 DATA WAREHOUSE
5.1 Concepto
Un DATAWAREHOUSE es una base de datos corporativa que se caracteriza
por integrar y depurar informacin de una o ms fuentes distintas, para
luego procesarla permitiendo su anlisis desde infinidad de perspectivas y
con grandes velocidades de respuesta. La creacin de un
DATAWAREHOUSE representa en la mayora de las ocasiones el primer
paso, desde el punto de vista tcnico, para implantar una solucin
completa y fiable de Business Intelligence.


5.2Caracteristicas
El trmino DATAWAREHOUSE fue acuado por primera vez por Bill Inmon, y
se traduce literalmente como almacn de datos. No obstante, y como
cabe suponer, es mucho ms que eso. Segn defini el propio Bill Inmon,
un DATAWAREHOUSE se caracteriza por ser:
Integrado: los datos almacenados en el DATAWAREHOUSE deben
integrarse en una estructura consistente, por lo que las inconsistencias
existentes entre los diversos sistemas operacionales deben ser eliminadas.
La informacin suele estructurarse tambin en distintos niveles de detalle
para adecuarse a las distintas necesidades de los usuarios.




16
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Temtico: slo los datos necesarios para el proceso de generacin del
conocimiento del negocio se integran desde el entorno operacional. Los
datos se organizan por temas para facilitar su acceso y entendimiento por
parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes
pueden ser consolidados en una nica tabla del DATAWAREHOUSE. De
esta forma, las peticiones de informacin sobre clientes sern ms fciles
de responder dado que toda la informacin reside en el mismo lugar.
Histrico: el tiempo es parte implcita de la informacin contenida en un
DATAWAREHOUSE. En los sistemas operacionales, los datos siempre reflejan
el estado de la actividad del negocio en el momento presente. Por el
contrario, la informacin almacenada en el DATAWAREHOUSE sirve, entre
otras cosas, para realizar anlisis de tendencias. Por lo tanto, el
DATAWAREHOUSE se carga con los distintos valores que toma una variable
en el tiempo para permitir comparaciones.
No voltil: el almacn de informacin de un DATAWAREHOUSE existe
para ser ledo, pero no modificado. La informacin es por tanto
permanente, significando la actualizacin del DATAWAREHOUSE la
incorporacin de los ltimos valores que tomaron las distintas variables
contenidas en l sin ningn tipo de accin sobre lo que ya exista.
5.3 Beneficios
Principales aportaciones de un DATAWAREHOUSE
Proporciona una herramienta para la toma de decisiones en cualquier
rea funcional, basndose en informacin integrada y global del negocio.
Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin
para encontrar relaciones ocultas entre los datos del almacn; obteniendo
un valor aadido para el negocio de dicha informacin.
Proporciona la capacidad de aprender de los datos del pasado y de
predecir situaciones futuras en diversos escenarios.
Simplifica dentro de la empresa la implantacin de sistemas de gestin
integral de la relacin con el cliente.




17
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Supone una optimizacin tecnolgica y econmica en entornos de
Centro de Informacin, estadstica o de generacin de informes con
retornos de la inversin espectaculares.
5.4 Datamart
Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se
caracteriza por disponer la estructura ptima de datos para analizar la
informacin al detalle desde todas las perspectivas que afecten a los
procesos de dicho departamento. Un Datamart puede ser alimentado
desde los datos de un datawarehouse, o integrar por si mismo un
compendio de distintas fuentes de informacin.
Los Datamart que estn dotados con estas estructuras ptimas de anlisis
presentan las siguientes ventajas:
Poco volumen de datos
Mayor rapidez de consulta
Consultas SQL y/o MDX sencillas
Validacin directa de la informacin
Facilidad para la historizacin de los datos
5.5 Datamining
El Datamining (minera de datos), es el conjunto de tcnicas y tecnologas
que permiten explorar grandes bases de datos, de manera automtica o
semiautomtica, con el objetivo de encontrar patrones repetitivos,
tendencias o reglas que expliquen el comportamiento de los datos en un
determinado contexto.
Bsicamente, el Datamining surge para intentar ayudar a comprender el
contenido de un repositorio de datos. Con este fin, hace uso de prcticas
estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la
Inteligencia Artificial y a las redes neuronales.




18
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
De forma general, los datos son la materia prima bruta. En el momento que
el usuario les atribuye algn significado especial pasan a convertirse en
informacin. Cuando los especialistas elaboran o encuentran un modelo,
haciendo que la interpretacin que surge entre la informacin y ese
modelo represente un valor agregado, entonces nos referimos al
conocimiento. Vea ms diferencias entre datos, informacin y
conocimiento.
Cuatro etapas principales:
Determinacin de los objetivos. Trata de la delimitacin de los objetivos
que el cliente desea bajo la orientacin del especialista en data mining.
Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el
enriquecimiento, la reduccin y la transformacin de las bases de datos.
Esta etapa consume generalmente alrededor del setenta por ciento del
tiempo total de un proyecto de data mining.
Determinacin del modelo. Se comienza realizando unos anlisis
estadsticos de los datos, y despus se lleva a cabo una visualizacin
grfica de los mismos para tener una primera aproximacin. Segn los
objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse
algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.
Anlisis de los resultados. Verifica si los resultados obtenidos son
coherentes y los coteja con los obtenidos por los anlisis estadsticos
y de visualizacin grfica. El cliente determina si son novedosos y si le
aportan un nuevo conocimiento que le permita considerar sus
decisiones.
5.6 Sistemas de Soporte a la Decisin (DSS)
Un Sistema de Soporte a la Decisin (DSS) es una herramienta de Business
Intelligence enfocada al anlisis de los datos de una organizacin.
En principio, puede parecer que el anlisis de datos es un proceso sencillo,
y fcil de conseguir mediante una aplicacin hecha a medida o un ERP
sofisticado. Sin embargo, no es as: estas aplicaciones suelen disponer de




19
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
una serie de informes predefinidos en los que presentan la informacin de
manera esttica, pero no permiten profundizar en los datos, navegar entre
ellos, manejarlos desde distintas perspectivas.
El DSS es una de las herramientas ms emblemticas del Business
Intelligence ya que, entre otras propiedades, permiten resolver gran parte
de las limitaciones de los programas de gestin. Estas son algunas de sus
caractersticas principales:
Informes dinmicos, flexibles e interactivos, de manera que el usuario no
tenga que ceirse a los listados predefinidos que se configuraron en el
momento de la implantacin, y que no siempre responden a sus dudas
reales.
No requiere conocimientos tcnicos. Un usuario no tcnico puede crear
nuevos grficos e informes y navegar entre ellos,
haciendo drag&drop o drill through. Por tanto, para examinar la
informacin disponible o crear nuevas mtricas no es imprescindible buscar
auxilio en el departamento de informtica.
Rapidez en el tiempo de respuesta, ya que la base de datos
subyacente suele ser un datawarehouse corporativo o un datamart, con
modelos de datos en estrella o copo de nieve. Este tipo de bases de datos
estn optimizadas para el anlisis de grandes volmenes de informacin
(vease nalisis OLTP-OLAP).
Integracin entre todos los sistemas/departamentos de la compaa. El
proceso de ETL previo a la implantacin de un Sistema de Soporte a la
Decisin garantiza la calidad y la integracin de los datos entre las
diferentes unidades de la empresa. Existe lo que se llama: integridad
referencial absoluta.
Cada usuario dispone de informacin adecuada a su perfil. No se trata
de que todo el mundo tenga acceso a toda la informacin, sino de que
tenga acceso a la informacin que necesita para que su trabajo sea lo
ms eficiente posible.




20
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
Disponibilidad de informacin histrica. En estos sistemas est a la orden
del da comparar los datos actuales con informacin de otros perodos
histricos de la compaa, con el fin de analizar tendencias, fijar la
evolucin de parmetros de negocio... etc.
Tipos de Sistemas de Soporte a Decisiones
Sistemas de informacin gerencial (MIS)
Los sistemas de informacin gerencial (MIS, Management Information
Systems), tambien llamados Sistemas de Informacin Administrativa (AIS)
dan soporte a un espectro ms amplio de tareas organizacionales,
encontrndose a medio camino entre un DSS tradicional y una aplicacin
CRM/ERP implantada en la misma compaa.
Sistemas de informacin ejecutiva (EIS)
Los sistemas de informacin ejecutiva (EIS, Executive Information System)
son el tipo de DSS que ms se suele emplear en Business Intelligence, ya
que proveen a los gerentes de un acceso sencillo a informacin interna y
externa de su compaa, y que es relevante para sus factores clave de
xito.
Sistemas expertos basados en inteligencia artificial (SSEE)
Los sistemas expertos, tambin llamados sistemas basados en
conocimiento, utilizan redes neuronales para simular el conocimiento de un
experto y utilizarlo de forma efectiva para resolver un problema concreto.
Este concepto est muy relacionado con el datamining.
Sistemas de apoyo a decisiones de grupo (GDSS)
Un sistema de apoyo a decisiones en grupos (GDSS, Group Decision
Support Systems) es "un sistema basado en computadoras que apoya a
grupos de personas que tienen una tarea (u objetivo) comn, y que sirve
como interfaz con un entorno compartido". El supuesto en que se basa el
GDSS es que si se mejoran las comunicaciones se pueden mejorar las
decisiones.
6 CONCLUSIN.




21
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
El data warehouse es la herramienta, de almacenamiento de datos de
referencia para las empresas que buscan obtener en su organizacin,
satisfaccin, control de la informacin que procesan todos los das, en la
actualidad es la mayor herramienta utilizada para maximizar el valor de la
informacin en la reduccin de tiempo, sin que pierda su veracidad y
confiabilidad. Si queremos que nuestra empresa tenga el mayor xito
debemos implementar un datawarehouse.
El data warehouse, utiliza los OLAP, DLLS, ETL DATAMINIG, DSS, para la
mejora en toma de decisiones importantes, de emergencia, la facilidad de
la utilizacin de los cubos multidimensionales para el anlisis de informacin
estratgica es crucial para realizar la mejor accin.
La informacin estratgica de nuestra empresa es analizada y procesada
por los cubos multidimensionales, en un sistema datawarehouse para as
poder llevar acabo la mejor toma de decisin.





7 HEMEROGRAFA Y BIBLIOGRAFA
http://www.ukessays.com/essays/journalism/the-importance-of-strategic-
information.php 29/abril/2014 13:55pm
http://www.sinnexus.com/business_intelligence/datawarehouse.aspx
30/abril/2014 00:14 am
http://www.sinnexus.com/business_intelligence/datawarehouse.aspx
30/abril/2014 14:31 pm




22
ADMINISTRACIN INFORMTICA
INSTITUTO POLITCNICO NACIONAL
http://www.sites.upiicsa.ipn.mx/polilibros/portal/Polilibros/P_terminados/ad
monInformII-Gaona/POLILIBRO/UMD/UNIDAD%204/INDICE4.htm
2/mayo/ 2014 21:10 pm
http://carlosproal.com/dw/dw04.html
2/ mayo /2014 14:15 pm
Putting Metadata to Work in the Warehouse, http://www.techguide.com/
http://es.scribd.com/doc/94161237/Modelacion-multidimensional
3/mayo/2014 22:17 pm

También podría gustarte