Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los principales productos de Business Intelligence que existen hoy en día son:
· Cuadros de Mando Integrales (CMI)
· Sistemas de Soporte a la Decisión (DSS)
· Sistemas de Información Ejecutiva (EIS)
Por otro lado, los principales componentes de orígenes de datos en el Business Intelligence
que existen en la actualidad son:
· Datamart
· Datawarehouse
Desde un punto de vista académico el término data mining es una etapa dentro de un
proceso mayor llamado extracción de conocimiento en bases de datos en el entorno
comercial. Lo que en verdad hace el data mining es reunir las ventajas de varias áreas.
Desde los años sesenta los estadísticos manejaban términos como data fishing, data mining
o data archaeology, a principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold,
Robert Blum y Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los términos
de data mining. A finales de los años ochenta sólo existían un par de empresas dedicadas a
esta tecnología; en 2002 existen más de 100 empresas en el mundo que ofrecen alrededor
de 300 soluciones.
El data mining es una tecnología compuesta por etapas que integra varias áreas y que no
se debe confundir con un gran software. Actualmente existen aplicaciones o herramientas
comerciales de data mining muy poderosas que contienen un sinfín de utilerías que facilitan
el desarrollo de un proyecto.
Aplicaciones de uso
Podemos decir que "en data mining cada caso es un caso". Sin embargo, en términos
generales, el proceso se compone de cuatro etapas principales:
Procesos:
● Determinación de Objetivos.
● Pre procesamiento de los Datos.
● Determinación del Modelo.
● Análisis de los Resultados.
Web mining
Una de las extensiones del data mining consiste en aplicar sus técnicas a documentos y
servicios del Web, lo que se llama web mining. Las herramientas de web mining analizan y
procesan estos logs para producir información significativa, por ejemplo, cómo es la
navegación de un cliente antes de hacer una compra en línea. Debido a que los contenidos
de Internet consisten en varios tipos de datos, como texto, imagen, vídeo, metadatos o
hiperligas, investigaciones recientes usan el término multimedia data mining (minería de
datos multimedia) como una instancia del web mining (Zaiane y otros, 1998) para tratar ese
tipo de datos.
Text mining
Información que tienen las personas y que puedan compartir con los demás en la
organización.
La administración del conocimiento implica la conversión del conocimiento tácito (el que
sabe un trabajador específico) en explícito (conocimiento documentado y replicable) para
convertirlo en un activo estratégico de la organización.
El conocimiento responde a preguntas que empiezan con ¿Cómo?, es decir, todo aquello
que generalmente sólo algunos miembros de la organización saben y lo tienen en su
cabeza pero no ha sido transformado en un conocimiento explícito.
Procesos:
Con el fin de ampliar más este concepto, se presentan diferentes enfoques desde el punto
de vista de una organización:
1.2.3 Aplicaciones Analíticas.
Son un tipo de negocio de Software aplicaciones que sirve para medir y mejorar el
rendimiento de las operaciones comerciales.
Una aplicación analítica no es solo un juego de informes creados al azar. Tiene cuatro
características importantes las cuales son:
2. Informes Interactivos que permitan a los usuarios acceder, analizar y actuar: Esto
significa que los usuarios pueden penetrar con una vista de nivel más alto de un reporte a
niveles más bajos o inferiores para adicionar información.
4. Dirección de un dominio comercial: Las aplicaciones analíticas son definidas por los
requerimientos de información de la actividad comercial, como las ventas, servicios o
infraestructura.
6. El mapeo de las fuentes: Se definen las transformaciones requeridas para llevar los
datos fuentes dentro del modelo de datos designado.
3. Dashboards y Scorecards
Los scorecards y dashboards proporcionan la información del rendimiento empresarial a
través de sus distintas áreas.
El Jasper Report es una librería para la generación de informes. Está escrita en java y es
libre. http://jasperforge.org/ El funcionamiento consiste en escribir un xml donde se recogen
las particularidades del informe. Este xml lo tratan las clases del Jasper para obtener una
salida. Esta salida puede ser un PDF, XML, HTML, CSV, XLS, RTF, TXT. Otra ventaja de
utilizar Jasper Report es que se integra perfectamente con el JFreeChart que es una librería
libre para la generación de todo tipo de graficas.
Un ejemplo básico:
Para generar un reporte con jasper report debemos seguir los siguientes pasos:
- Exportar el fichero .jrprint al formato que deseemos (pdf, etc). Esto generará el fichero
en cuestión.
Generar el fichero .jrxml
El fichero .jrxml se puede generar a mano con este DTD y esta referencia de atributos. De
todas formas, una opción mejor es usar la herramienta iReport, que permite generar el
fichero .jrxml de forma visual y más fácil.
En este fichero también se configura cual va a ser la fuente de datos (si es una base de
datos, un fichero, etc). Incluso si es base de datos, en este fichero se pone el SELECT que
devuelve los datos que queremos para el informe.
Para compilar el fichero .jrxml y generar el fichero .jasper, desde código podemos poner
algo como esto:
Ahora hay que rellenar el informe con datos. Desde código se hace con algo como esto
1.2.5 Multidimensionalidad
Es el gran almacén de datos que está estructurado para analizar la información, a diferente
nivel de detalle, de todos los procesos de negocios que tiene la organización. Es la Base de
Datos llamada estratégica o multidimensional. Una vez diseñadas mediante el ETL es
poblada o llenada a partir de las Bases de Datos operacionales. El diseño va orientado a
encontrar medidas (Por ejemplo: montos vendidos, montos cobrados, horas hombre
utilizadas, etc) y dimensiones (Clientes, Productos, Tiempo, Organización, Servicios, etc).
Las características de los data warehouse se representan en la siguiente gráfica: