Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. MINERÍA DE DATOS
Desde un punto de vista académico el término data mining es una etapa dentro de un proceso mayor
llamado extracción de conocimiento en bases de datos en el entorno comercial. Lo que en verdad
hace el data mining es reunir las ventajas de varias áreas.
El data mining es una tecnología compuesta por etapas que integra varias áreas y que no se debe
confundir con un gran software. Actualmente existen aplicaciones o herramientas comerciales de
data mining muy poderosas que contienen un sinfín de utilerías que facilitan el desarrollo de un
proyecto.
Aplicaciones de uso
Podemos decir que "en data mining cada caso es un caso". Sin embargo, en términos generales, el
proceso se compone de cuatro etapas principales:
Web mining
Una de las extensiones del data mining consiste en aplicar sus técnicas a documentos y servicios del
Web, lo que se llama web mining. Las herramientas de web mining analizan y procesan estos logs
para producir información significativa, por ejemplo, cómo es la navegación de un cliente antes de
hacer una compra en línea. Debido a que los contenidos de Internet consisten en varios tipos de
datos, como texto, imagen, vídeo, metadatos o hiperligas, investigaciones recientes usan el término
multimedia data mining (minería de datos multimedia) como una instancia del web mining (Zaiane y
otros, 1998) para tratar ese tipo de datos.
Web content mining (minería de contenido web). Es el proceso que consiste en la extracción
de conocimiento del contenido de documentos o sus descripciones.
Web structure mining (minería de estructura web). Es el proceso de inferir conocimiento de la
organización del WWW y la estructura de sus ligas.
Web usage mining (minería de uso web). Es el proceso de extracción de modelos interesantes
usando los logs de los accesos al web.
Text mining
La administración del conocimiento implica la conversión del conocimiento tácito (el que sabe un
trabajador específico) en explícito (conocimiento documentado y replicable) para convertirlo en un
activo estratégico de la organización.
Dicho en otras palabras, implica la adecuada utilización de datos e información para transformarlos
en conocimiento y entendimiento.
El conocimiento responde a preguntas que empiezan con ¿Cómo?, es decir, todo aquello que
generalmente sólo algunos miembros de la organización saben y lo tienen en su cabeza, pero no ha
sido transformado en un conocimiento explícito.
Una aplicación analítica no es solo un juego de informes creados al azar. Tiene cuatro características
importantes las cuales son:
Una aplicación analítica está compuesta por seis elementos primordiales los cuales son:
Los sistemas de reportes tienen como objetivo principal mostrar una visión general de la situación de
la empresa. Consecuentemente, estos muestran la situación de las operaciones regulares de la
empresa para que los directivos puedan controlar, organizar, planear y dirigir. Los reportes se
pueden visualizar, exportar a otros formatos como PDF, HTML, XML, etc. y también se pueden
imprimir en papel.
El Jasper Report es una librería para la generación de informes. Está escrita en java y es libre.
http://jasperforge.org/ El funcionamiento consiste en escribir un xml donde se recogen las
particularidades del informe. Este xml lo tratan las clases del Jasper para obtener una salida. Esta
salida puede ser un PDF, XML, HTML, CSV, XLS, RTF, TXT. Otra ventaja de utilizar Jasper Report
es que se integra perfectamente con el JFreeChart que es una librería libre para la generación de
todo tipo de graficas.
Para generar el xml lo recomendable es bajarse la herramienta iReport que es un editor gráfico que
está implementado en java y se integra perfectamente con el Jasper Report.
El sistema de reportes jasper reports ofrece muchas herramientas que son de gran utilidad
proporciona todo lo necesario para diseñar informes de una complejidad media, y la curva de
aprendizaje para comenzar a tener resultados productivos no es muy elevada. Además, los informes
se pueden realizar directamente sobre los xml descriptores o podemos utilizar la herramienta ireport
para diseñarlo gráficamente.
5. MULTIDIMENSIONALIDAD
La información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc. Es una
herramienta de B.I. que es capaz de reunir información dispersa en toda la empresa e incluso en
diferentes fuentes para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que
necesitan para analizar la información. Por ejemplo, un pronóstico de ventas de un nuevo producto
en varias regiones no está completo si no se toma en cuenta también el comportamiento histórico de
las ventas de cada región y la forma en que la introducción de nuevos productos se ha desarrollado
en cada región en cuestión.
6. DATA WAREHOUSE
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar
información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde
infinidad de perspectivas y con grandes velocidades de respuesta. La creación de un datawarehouse
representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para
implantar una solución completa y fiable de Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena
la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales, etc.). Este tipo
de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento
jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales).