Está en la página 1de 71

Inteligencia de Negocios

Lenin Alevski Huerta Arias A01063834 Jos Pablo Arciga Aragn A01062487 Filiberto Villagmez Gonzlez A01063318

S Es conocida como la habilidad de trasformar datos e

informacin en conocimiento de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.

Datos

S Es un pequeo trozo de informacin que no tiene

significado o no nos es til.

S 5 , 2, 4.0

Information

S En sentido general, la informacin es un conjunto

organizado de datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje.

Conocimiento

S El

conocimiento es un conjunto de informacin almacenada mediante la experiencia o el aprendizaje (a posteriori), o a travs de la introspeccin (a priori). En el sentido ms amplio del trmino, se trata de la posesin de mltiples datos interrelacionados que, al ser tomados por s solos, poseen un menor valor cualitativo.

Anlisis de Canasta de Mercado


S Los esquemas de ventas al por menor nos dicen lo que

fue comprado en cada tienda y bajo que condiciones. No obstante, este esquema no nos permite analizar fcilmente que productos fueron vendidos juntos en la misma canasta de mercado. El anlisis de la canasta de mercado nos da una idea de cmo comercializar varias combinaciones de productos. Por ejemplo: si la pasta congelada se vende bien en conjunto con refrescos, entonces estos 2 productos deberan estar colocados cerca en el supermercado o comercializados con precios complementarios.

Ejemplo

S El concepto del anlisis de la canasta de mercado puede

extenderse fcilmente a otras situaciones. En la industria de la manufactura, por ejemplo, es til para ver qu productos se ordenan juntos, porque la empresa podra querer ofrecer paquetes de productos con precio de paquete.
S La tabla de hechos de ventas al por menor no puede ser usada

fcilmente para realizar anlisis de canasta de mercado ya que en las bases de datos relacionales simples, no fueron diseadas para este propsito. Las herramientas para la minera de datos y las tcnicas OLAP nos pueden ayudar para el anlisis de la canasta de mercado.

Inteligencia de negocios ( informtica)


Desde un punto ms asociado con los sistemas de informacin podemos redefinir esta definicin y decir que la Inteligencia de Negocios es un conjunto de tecnologas, aplicaciones y metodologas que permiten reunir, depurar y trasformar los datos de los sistemas transaccionales e informacin desestructurada, para la explotacin directa de (reportes, anlisis OLTP/OLAP, aletas).

Entre las herramientas de bases de datos encontradas en el apartado de la inteligencia de negocios se encuentran:

S La minera de datos S Las herramientas OLAP S Data Warehouses S Data Marts S Query & Report

S Las

funcionalidades de estas herramientas son complementarias y estn muy relacionadas entre s. El Data Warehousing nos proporciona almacenamiento eficiente, mantenimiento y recuperacin de datos histricos. OLAP es un servicio que proporciona respuestas rpidas a consultas ad hoc a diferencia del data warehouse. Los algoritmos empleados en La minera de datos se encargan de encontrar patrones en los datos y de reportar modelos al usuario final.

S Estas 3 herramientas se relacionan con la manera en que los

datos en un Data Warehouse son lgicamente organizados, y el rendimiento es altamente sensible a las tcnicas utilizadas para el diseo de la base de datos. [Barquin and Edelstein, 1997].

Data Warehouse

S Un Data Warehouse (DW) o almacn de datos es una

coleccin de datos que es extrada desde diferentes fuentes de informacin a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realizacin de consultas y anlisis, fundamentalmente, para ayudar a la toma de decisiones.

Data Warehouse

S Un sistema de DW apunta a disponer de una visin nica

de los clientes y proveer la mayor cantidad posible de informacin a los usuarios de la empresa, facilitndose el monitoreo del negocio.

Data Warehouse

S Los datos del DW poseen algunas cualidades fundamentales. La

primera de ellas es que estn orientados a temas, diferencindose as de los sistemas transaccionales que estructuran los datos en procesos funcionales.

S Por otro lado, se trata de datos integrados, es decir, estn

consolidados, lo cual supone un proceso previo de depuracin y homogeneizacin, etapa que puede ser una de las ms complejas al implementar un DW. Por ltimo, los datos son historiados, ya que mantienen el registro histrico de sus valores, lo cual redunda en que, a diferencia de los sistemas transaccionales, no sean voltiles.

Data Mart

Aunque para algunos se trata casi de un sinnimo de Data Warehouse, un Data Mart o cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se orienta a un rea especfica del negocio, como recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un Data Mart corresponde a un almacn de datos ms restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de la organizacin.

Desde ese punto de vista, se trata de un repositorio que requiere menores costos y tiempo para construirse respecto de un DW, teniendo en comn el que ambos permiten la realizacin de consultas, a travs del uso de las herramientas OLAP.

Herramientas OLAP

S OLAP (Online

Analytical Processing) son un conjunto de herramientas capaces de responder rpida y gilmente a las solicitudes de informacin de los usuarios y que deben reflejar cualquier lgica de negocio por las que se consulte.

S En contraste con los sistemas transaccionales, OLTP (Online

Transaction Processing), las herramientas OLAP presentan informacin multidimensional, es decir, desde mltiples perspectivas. Del mismo modo, los sistemas analticos, al igual que los datos del Data Warehouse, estn orientados a temas, y no slo operan con datos actuales, sino tambin con datos histricos.

Herramientas OLAP

S Una de las principales cualidades de las herramientas de

OLAP es identificar tendencias, es decir, permiten apoyar la toma decisiones considerando diversas variables, as como tambin permiten identificar cambios en las preferencias de los clientes. Sin embargo, aunque pueden responder consultas complejas y ratificar informacin, lo hacen siempre dependiendo del usuario, que es quien define las relaciones a considerar.

Que es OLAP
S

OLAP o Proceso analtico en lnea es el nombre formal para el anlisis de cubos multidimensionales - una forma mas intuitiva de ver la informacin empresarial. Con OLAP se puede ver un conjunto de datos de su negocio de muchas y diversas formas sin mucho esfuerzo. Los archivos OLAP o cubos modelan los datos en dimensiones. Una dimensin es una clasificacin de alguna actividad en una organizacin por la cual se puede medir su xito. Por ejemplo, puede monitorear sus ventas contra los productos o clientes en un periodo de tiempo. Hay dos clases de dimensiones que se pueden utilizar, dimensiones regulares y dimensin de medida.

OLAP: Cubo OLAP

S es una base de datos multidimensional, en la cual el

almacenamiento fsico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliacin de las dos dimensiones de una hoja de clculo.

Ejemplo de aplicacion de cubo OLAP

Un analista financiero podra querer ver los datos de diversas formas, por ejemplo, visualizndolos en funcin de todas las ciudades (que podran figurar en el eje de abscisas) y todos los productos (en el eje de ordenadas), y esto podra ser para un perodo determinado, para la versin y el tipo de gastos. Despus de haber visto los datos de esta forma particular el analista podra entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata. El cubo podra adoptar una nueva orientacin para que los datos aparezcan ahora en funcin de los perodos y el tipo de costo. Debido a que esta reorientacin implica resumir una cantidad muy grande de datos, esta nueva vista de los datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es decir, en cuestin de segundos, en lugar de las horas que seran necesarias en una base de datos relacional convencional.

OLAP: Dimenciones regulares

Son aquellos datos que se quieren medir, por ejemplo, si desea seguir el control de sus ventas, puede utilizar: Clientes: Quines son los mejores, donde se encuentran, que es lo que compran? Productos: Con respecto a los clientes, quien los compra? Qu productos se estn vendiendo? Tiempo: Cmo voy ahora con respecto al ultimo ao o ltimo mes?

OLAP: Dimensiones Regulares


S En otro tipo de aplicaciones, por ejemplo cuentas por cobrar,

se pueden utilizar dimensiones como el Tiempo para llevar control del vencimiento de sus documentos. En contabilidad, una dimensin podra ser su catalogo de cuentas, etc.

S Estas dimensiones se conforman de elementos que estn

dispuestos en niveles jerrquicos o simplemente niveles. Los niveles pueden ser por ejemplo, pas, estado, ciudad. Se puede navegar a travs de esta jerarqua a travs de los niveles o a travs de sus elementos.

OLAP: Dimensin de medida

S Son

los nmeros que aparecen en el anlisis dependiendo de los elementos seleccionados en las dimensiones regulares. Por ejemplo, en un cubo de ventas, podramos escoger ver las ventas, el nmero de artculos vendidos, ganancia, costo, etc.

OLAP: Dimensin de medida

S Una vez que se tienen estos datos, se pueden poner en

una estructura de datos altamente sofisticada que se llama cubo multidimensional. Este cubo puede residir en una base de datos sofisticada como Microsoft Analysis Services o en archivos independientes. Este cubo le permitir analizar su informacin de la manera que desee. Usted podr cruzar todas las dimensiones para obtener nueva informacin que responder a las preguntas que hace y le permitir tomar mejores decisiones.

Microsoft Analysis Services

S Microsoft SQL Server Analysis Services es parte de

Microsoft SQL Server, un sistema de gestin de bases de datos. Microsoft ha incluido una serie de servicios de SQL Server relacionados con la inteligencia empresarial y almacenamiento de datos. Estos servicios incluyen servicios de integracin y servicios de anlisis. El servicio de anlisis incluye un conjunto de capacidades OLAP y de minera de datos.

OLAP: Operaciones basicas.

Hay dos operaciones bsicas que se pueden realizar en un cubo OLAP:


S Rotar y

Rebanar
S Taladrar o

Drilling

OLAP: Rotar y Rebanar

S Usted puede cambiar las dimensiones del cubo que esta

viendo y obtener una nueva vista de informacin. Por ejemplo, 'Ventas por producto' puede cambiarse fcilmente a 'Ventas por vendedor'. Rebanar es cambiar el valor de una dimensin por otro valor, por ejemplo, de las ventas de Enero a las ventas de Febrero. Rotar es aventar el cubo como si fuera un dado para obtener una nueva cara del cubo

OLAP: Taladrar o Drilling

S Los datos de las dimensiones se pueden abrir para

obtener mas detalle. Una especie de taladro que se hunde mas en la informacin. Si usted ve informacin geogrfica, puede pasar de un continente a un pas y luego a una ciudad en particular.
S Con esta simple combinacin de cosas, se puede abrir la

informacin generada por un negocio o informacin corporativa para todos el personal tomador de decisiones en formas que antes no era posible realizarlo.

Los sistemas OLAP deben:

S Soportar requerimientos complejos de anlisis

S Analizar datos desde diferentes perspectivas


S Soportar anlisis complejos contra un volumen ingente

de datos

Data Mining

S El Data Mining (DM) o minera de datos es una tcnica

orientada a extraer informacin desde grandes volmenes de datos y corresponde a una de las claves de la inteligencia de negocios. El DM es un proceso conocido como KDD (Knowledge Discovery in Databases) que consta de tres fases: preparacin de los datos, extraccin de informacin e interpretacin de los resultados.

Data Mining

S Normalmente, el DM se realiza con las llamadas tcnicas de

verificacin -en donde se prueba una hiptesis del usuario- y los mtodos de descubrimiento -bsqueda de patrones (incluyendo las tcnicas de prediccin)-. Lo anterior se traduce en anlisis exploratorios, los cuales se apoyan en herramientas de visualizacin de datos y construccin de modelos, con el objetivo de realizar predicciones utilizando los patrones detectados en los datos conocidos con informacin del pasado. De all que el DM no es una herramienta orientada slo a las asociaciones estadsticas, sino una tecnologa que es fundamentalmente prospectiva, esto es, que permite descubrir nuevos factores, tendencias y asociaciones desconocidas previamente, llegando incluso a ser predictiva.

S Los modelos de minera de datos, se usan con xito

en aplicaciones de control de procesos productivos, como herramienta de ayuda a la planificacin y a la decisin en marketing, finanzas, etc.
S Asimismo, la minera de datos es fundamental en la

investigacin cientfica y tcnica, como herramienta de anlisis y descubrimiento de conocimiento a partir de datos de observacin o de resultados de experimentos.

Protocolo de un proyecto de minera de datos


Un proyecto de minera de datos tiene varias fases necesarias que son, esencialmente:
S S S S S

Comprensin del negocio y del problema que se quiere resolver. Determinacin, obtencin y limpieza de los datos necesarios. Creacin de modelos matemticos. Validacin, comunicacin, etc. de los resultados obtenidos. Integracin, si procede, de los resultados en un sistema transaccional o similar. A travs de la experiencia acumulada en proyectos de minera de datos se han ido desarrollando metodologas que permiten gestionar esta complejidad de una manera ms o menos uniforme.

Proceso general del Data mining


S Seleccin del conjunto de datos

S Anlisis de las propiedades de los datos


S Transformacin del conjunto de datos de entrada S Seleccionar y aplicar la tcnica de minera de datos S Extraccin de conocimiento S Interpretacin y evaluacin de datos

DM: Seleccin del conjunto de datos

S Datos, tanto en lo que se refiere a las variables objetivo

(aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las que sirven para hacer el clculo o proceso), como posiblemente al muestreo de los registros disponibles.

DM: Anlisis de las propiedades de los datos

S En especial los histogramas, diagramas de dispersin,

presencia de valores atpicos y ausencia de datos (valores nulos).

DM: Transformacin del conjunto de datos de entrada

S Se realizar de diversas formas en funcin del anlisis

previo, con el objetivo de prepararlo para aplicar la tcnica de minera de datos que mejor se adapte a los datos y al problema, a este paso tambin se le conoce como preprocesamiento de los datos

DM: Seleccionar y aplicar la tcnica de minera de datos

Se construye:
S Modelo predictivo.
S Modelo de clasificacin . S Modelo de segmentacin.

DM: Modelo predictivo

S Los modelos predictivos permiten estimar cual es el

comportamiento esperado del cliente utilizando los datos de uso de los servicios.

DM: Extraccin de conocimiento

S Mediante una tcnica de minera de datos, se obtiene un

modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar distintos modelos, aunque generalmente cada tcnica obliga a un preprocesado diferente de los datos

DM: Tcnicas de minera de datos


S Las tcnicas de la minera de datos provienen de la

Inteligencia artificial y de la estadstica, dichas tcnicas, no son ms que algoritmos, ms o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados.

DM: tcnicas ms representativas

S Redes neuronales

S Regresin lineal
S rboles de decisin S Modelos estadsticos S Agrupamiento o Clustering

Redes neuronales

S Son un paradigma de aprendizaje y procesamiento automtico

inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexin de neuronas en una red que colabora para producir un estmulo de salida. Algunos ejemplos de red neuronal son:
S El Perceptrn. S El Perceptrn multicapa. S Los Mapas Autoorganizados, tambin conocidos como redes

de Kohonen.

DM: Regresin lineal

S Es la tcnica ms utilizada para formar relaciones entre

datos. Rpida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse ms de 2 variables.

DM: rboles de decisin

S Un rbol de decisin es un modelo de prediccin

utilizado en el mbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolucin de un problema.

Ejemplos de algoritmos de rboles de decisin

S Algoritmo ID3

S Algoritmo C4.5

Algoritmo ID3

S El algoritmo ID3 es utilizado dentro del mbito de la inteligencia

artificial. Su uso se engloba en la bsqueda de hiptesis o reglas en l, dado un conjunto de ejemplos.


S El conjunto de ejemplos deber estar conformado por una serie

de tuplas de valores, cada uno de ellos denominados atributos, en el que uno de ellos, ( el atributo a clasificar ) es el objetivo, el cual es de tipo binario ( positivo o negativo, si o no, vlido o invlido, etc. ).
S De esta forma el algoritmo trata de obtener las hiptesis que

clasifiquen ante nuevas instancias, si dicho ejemplo va a ser positivo o negativo.


S ID3 realiza esta labor mediante la construccin de un rbol de

decisin.

DM: Modelos estadsticos

S Es una expresin simblica en forma de igualdad o

ecuacin que se emplea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que modifican la variable de respuesta.

DM: Agrupamiento o Clustering

S Es un procedimiento de agrupacin de una serie de

vectores segn criterios habitualmente de distancia; se tratar de disponer los vectores de entrada de forma que estn ms cercanos aquellos que tengan caractersticas comunes. Ejemplos:
S Algoritmo K-means. S Algoritmo K-medoids.

DM: Extraccin de conocimiento

S Mediante una tcnica de minera de datos, se obtiene un

modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar distintos modelos, aunque generalmente cada tcnica obliga a un preprocesado diferente de los datos

DM: Interpretacin y evaluacin de datos

S Una vez obtenido el modelo, se debe proceder a su

validacin comprobando que las conclusiones que arroja son vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos

Ejemplos de uso de la minera de datos


S S S S S S S S

Negocios Hbitos de compra en supermercados Patrones de fuga Fraudes Recursos humanos Comportamiento en Internet Terrorismo Juegos

S S S

Ciencia e Ingeniera Gentica Anlisis de gases

Query & Report

S Las herramientas de Query (consulta) y Report (reporte)

son quiz las ms conocidas en este mbito, ya que son fundamentales para el desarrollo y manejo de listados e informes basados en la informacin presente en los almacenes de datos y Data Marts.

Valor estratgico de la inteligencia de negocios

S Tradicionalmente, el BI ha sido visto como una herramienta

para distribuir informacin, sin embargo, hoy est tomando un rol ms estratgico, siendo considerado por los especialistas como una herramienta fundamental para la transformacin del negocio, para innovar y generar ventajas competitivas. Para ello, en los prximos aos los proyectos de este tipo apuntarn ms decididamente a llevar informacin de valor a un mayor nmero de miembros de la organizacin y a visualizarlas como un apoyo a la interconexin con clientes, proveedores y socios de negocios.

Principales Aplicaciones
Esto acta como un factor necesario en las empresas hoy en da ya que es considerado informacin privilegiada para responder a los problemas de negocio (entradas de nuevos mercados, control financiero, etc.), los principales productos de la inteligencia de negocios son:

S Cuadros de mando integrales (mirada global del negocio). S Sistemas de soporte de decisin ( Sistema que sirve de apoyo en la toma
de desiciones).

S Sistemas de informacin ejecutiva(Herramienta de BI monitoriza el


estado de las variables de un area de la empresa apartir de informacion externa o interna).

Acta sobre..
S

Los principales componentes que integran hoy en da la inteligencia de negocios son:


S
S

Una solucin de inteligencia de negocios completa nos permite: Observar qu est ocurriendo? Comprender por qu ocurre? Predecir qu ocurrira? Colaborar qu debera hacer el equipo? Decidir qu camino se debe seguir?

Datamart
Data Warehouse
S S

Inteligencia de negocios atreves del tiempo

Arquitectura

Retroalimentacin de la BI

La Inteligencia de negocios es esencialmente una ciencia de la economa, de acuerdo con el mtodo cientfico. Esto significa que se basa en los datos en lugar de simples conjeturas. Estos datos son recolectados usando justa, exacta, imparcial medios, y organizados de una manera lgica con el fin de producir los mejores resultados.

Bibliografa

Teorey, Toby J. Database modeling & design : logical design. San Francisco, Cal. : Morgan Kaufmann Publishers, 2006. Kimball, Ralph. The data warehouse toolkit : The complete guide to dimensional modeling. New York, N.Y. : Wiley, c2002 http://www.cientec.com/analisis/ana-claves.html

http://www.mitecnologico.com/Main/Introspeccion

Biblioteca Digital

http://0delivery.acm.org.millenium.itesm.mx/10.1145/1460000/1452578/a11sell.pdf?ip=200.34.202.224&CFID=42779719&CFTOKEN=85566243&__a cm__=1316112831_49ca913571de7c32aee07ceb571c8d4d http://0delivery.acm.org.millenium.itesm.mx/10.1145/1970000/1966890/p12park.pdf?ip=200.34.202.224&CFID=42779719&CFTOKEN=85566243&__ acm__=1316113077_9be4b3375928e9e7ae371620a711328a http://0delivery.acm.org.millenium.itesm.mx/10.1145/1460000/1452575/a8van_damme.pdf?ip=200.34.202.224&CFID=42779719&CFTOKEN=85566 243&__acm__=1316113134_8a666acbdda10b8fbd59881bc1f7e416

Bibliografa

S http://www.sitcorp.com/?p=31

S http://www.olapxsoftware.com/es/WhatIsOlap.asp
S http://www.slideshare.net/davidreyblanco/qu-es-un-

modelo-predictivo-y-para-qu-vale roceso

S http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#P
S http://es.wikipedia.org/wiki/Perceptr%C3%B3n