Está en la página 1de 6

Grupo de apoyo a la preparacin de la XXII

convocatoria de oposiciones al Cuerpo Superior de


Sistemas y Tecnologas de la Informacin de la
Administracin del Estado

HERRAMIENTAS DE BUSINESS INTELLIGENCE

Estas herramientas se encargan del anlisis y presentacin de datos, lo que permite el


soporte a la toma de decisiones, elaboracin de estadsticas e informes, anlisis de los
datos involucrados en el sistema (OLAP, Data mining, cuadros de mando, etc.).

Estas herramientas son muy tiles ya que permiten:

Utilizar los propios datos de una organizacin como punto de partida para la toma de
decisiones.
Realizar una optimizacin de procesos.
Realizar reportes operacionales.
Las herramientas de business intelligence pueden ser de cinco estilos diferentes:

Reporte empresarial.
Cubos de anlisis.
Vistas Ad Hoc Query y anlisis.
Data mining y anlisis estadsticos.
Entrega de reportes y alertas.

Recomendacin: Normalmente, en el cuarto examen no se suele pedir una solucin de


business intelligence de forma explcita. No obstante, en algunos casos resulta aconsejable
incluir algn mdulo de explotacin/anlisis de datos para la toma de decisiones de forma
complementaria y adicional.

A continuacin se indican algunas de las herramientas de business intelligence existentes


en el mercado:

1
Grupo de apoyo a la preparacin de la XXII
convocatoria de oposiciones al Cuerpo Superior de
Sistemas y Tecnologas de la Informacin de la
Administracin del Estado

Herramienta Caractersticas Tecnologa Licencia Informacin adicional


Pentaho Corre bajo los sistemas Java Cdigo Incluye herramientas integradas para generar informes,
operativos Windows, abierto minera de datos, ETL, etc.
Linux y Mac OS X (Pentaho
Genera los informes en Communit
diferentes formatos: y Edition
HTML, Excel, CSV, PDF (CE):
y RTF. Apache
Interfaz web muy version
intuitive 2.0)
Acceso a datos
relacionales, OLAP y
XML
JasperReports Multiplataforma Java Cdigo Es una librera que se puede embeber en una aplicacin
Soporta los formatos abierto Java, incluyendo Java EE o aplicaciones web.
PDF, HTML, Microsoft (LGPL)
Excel, RTF, ODT, Es til si slo deseamos elaborar informes y estadsticas.
Comma-separated
values o XML. Varios IDEs de Java (NetBeans, Eclipse, IBM Websphere
Lee las instrucciones Studio Application Developer) proporcionan instrucciones
desde un fichero XML o para integrar JasperReports en un proyecto.
.jasper
Oracle BI Utiliza interfaces ODBC Java SW
2.0 y JDBC propietario

2
Grupo de apoyo a la preparacin de la XXII
convocatoria de oposiciones al Cuerpo Superior de
Sistemas y Tecnologas de la Informacin de la
Administracin del Estado

CLASIFICACION AUTOMTICA DE DOCUMENTOS

Un tipo de sistemas que no est muy extendido en la Administracin pero que puede
ser interesante tener en cuenta en algunas situaciones son los clasificadores
automticos de documentos. Su utilizacin aporta las siguientes mejoras:

permite emplear un menor nmero de personal en la tarea de lectura y


clasificacin de documentos, y emplearlos en otras unidades donde aporten
ms valor.
optimiza el tiempo de respuesta.
homogeniza el resultado en la clasificacin al no incorporar la subjetividad
humana.

Estos sistemas son tiles cuando se reciben documentos de texto libre por parte de los
ciudadanos, y se encargan de clasificarlos de forma automtica y reenviarlos a la
unidad encargada de tratar cada tipo de documento o procedimiento.

Los clasificadores automticos son herramientas no deterministas, y hay que tener


muy en cuenta que nunca van a llegar a un 100% de acierto, de hecho, en los
sistemas con unos documentos de buena calidad se suele llegar como mximo a un
90%.

Elementos de un sistema de clasificacin de documentos

1. Carga de documentos

El primer elemento del sistema es el encargado de la carga de documentos en el


sistema. Puede ser de cualquier tipo: sistema de ficheros, servicios web, cargas batch,
etc.

2. OCR

Si el sistema permite el envo de documentos manuscritos escaneados es necesario la


utilizacin de un OCR (Optical Character Recognition). Hay que tener en cuenta que la
necesidad de un OCR tiene dos implicaciones:

el tiempo de proceso aumenta considerablemente, ya que los OCR suelen ser


lentos.
la precisin del sistema disminuye.

3. Mdulo de anlisis del lenguaje natural (NLP)

3
Grupo de apoyo a la preparacin de la XXII
convocatoria de oposiciones al Cuerpo Superior de
Sistemas y Tecnologas de la Informacin de la
Administracin del Estado

Este mdulo se encarga de realizar un procesamiento muy diverso sobre el lenguaje.


Desde eliminacin de stoptwords, aplicacin de sinnimos, hasta algoritmos ms
avanzados que realizan identificacin sintctica de los elementos del texto.

4. Mdulo de clasificacin

A partir de la informacin que se ha obtenido del mdulo de anlisis del lenguaje, se


aplican algoritmos matemticos para la clasificacin en grupos. Los ms utilizados
suelen ser Mquinas de Vector Soporte, y clasificadores bayesianos.

4
Grupo de apoyo a la preparacin de la XXII
convocatoria de oposiciones al Cuerpo Superior de
Sistemas y Tecnologas de la Informacin de la
Administracin del Estado

Herramienta Caractersticas Tecnologa Licencia Informacin adicional


OCR Tesseract Corre bajo los sistemas C SW libre:
operativos Windows y Linux Apache
Desarrollado por Google version 2.0
Se trata de uno de los OCR
ms usados
No soporta layout de
pginas
OCR Abbyy Windows SW Debido a su elevado coste en la muchos proyectos se suele utilizar
Ofrece una gran calidad de propietario Tesseract
reconocimiento, en la
mayora de los casos por
encima de Tesseract
Soporta layout de pginas
Mahout Multiplataforma Java SW libre: Muchas de sus funciones tienen implementacin para desplegar en
Librera de minera de datos Apache infraestructuras Hadoop / Cloudera de Big Data
ampliamente utilizada. version 2.0
Se integra muy bien en el
ecosistema Apache
R Dispone de versiones para C SW libre: Permite tanto su uso como aplicacin de escritorio en que un
Windows, Linux y Mac GNU usuario realiza clculos estadsticos, como la programacin de
Plataforma de estadstica y funciones que se pueden integrar con otros sistemas.
minera de datos muy
utilizada
Incluye su propio lenguaje

5
Grupo de apoyo a la preparacin de la XXII
convocatoria de oposiciones al Cuerpo Superior de
Sistemas y Tecnologas de la Informacin de la
Administracin del Estado

de scripting para definir los


anlisis que se realicen

También podría gustarte