Documentos de Académico
Documentos de Profesional
Documentos de Cultura
OBJETIVOS
Dentro de esta definición está presente la idea que los sistemas de Bussines
Intelligence se proveen de informacíon relevante para la toma de decisiones, al
momento adecuado y en la forma correcta de tal manera que los responsables
1
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
2
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Fuente: Adaptado de Negash. (2004). Pág.179.
3
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
4
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
poseen en algunos casos una estructura dada por el mismo entorno que las
contiene, por ejemplo, una base de datos en donde las informaciones se
graban en forma de filas y columnas (tablas de datos) o en otros casos las
informaciones que procesa un sistema de Business Intelligence proviene de
fuentes que tienen una estructura diferente por ejemplo: e-mail, faxes, cartas,
etc. Para el primer caso en donde las informaciones presentan una estructura
se las conocen como fuentes de datos estructuradas; caso contrario se los
conocen como fuentes de datos semi-estructuradas.
• Procesos de negocio
• E-mails
• Gráficos
• Archivos con imágenes
• Cartas
• Memos, noticias, etc
Blumberg y Atre (2003) indica que Merryl Linch estima que el 85% de toda la
información de los negocios existe en forma de datos semi-estructurados
comúnmente capturados en formato de hojas de cálculo, es decir, no se
encuentran almacenados bajo la estructura de una base de datos.
5
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
BLUMBER, ROBERT; y, ATRE, SHAKU. (2003). The Problem with Unstructured Data. DM
Review Magazine.
http://dmreview.com/article_sub.cfm?articleId=6287. [Leído: 23 de marzo del 2006].
2
Fuente: Adaptado de Negash. (2004). Pág. 178.
6
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
7
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
- La información1
- La empresa
- El mercado
8
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Esto junto con la capacidad funcional y la cada vez mejor potencia de las
tecnologías, tanto del hardware como del software hacen que los tratamientos
pesados de la información algo posible y accesible.
1
A lo largo del módulo, los términos dato e información se utilizan en muchas ocasiones de
forma intercambiable. Formalmente, la información se elabora a partir de la integración y
asimilación de varios datos. Sin embargo, en un sentido más amplio, se consideran datos e
información como el precedente de el conocimiento, sin contabilizar el orden de una forma
explícita.
El ambiente del mundo de los negocios de hoy exige una aplicación cada vez
más eficiente de la información disponible. Business Intelligence genera un
conocimiento al negocio que se deriva de la correcta utilización de la
información generada dentro y fuera de la empresa. Business Intelligence es
una herramienta que pone a disposición de los usuarios la información correcta
en el lugar correcto generando una ventaja competitiva. Son ya muchas las
empresas que han implementado soluciones de Business Intelligence y se han
visto enormemente beneficiadas.
9
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
"Se han producido más informaciones nuevas en los últimos treinta años que
en el transcurso de los cinco milenios que nos han precedido"
10
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Por esto hay que tener considerar fuerzas externas dentro del Business
Intelligence, la competencia y el consumidor.
1.2.5.1 La competencia
La competencia, tal como se vive hoy en las empresas, necesita comparar sin
cesar el producto propio con el de los demás ofertantes. La sola visión del
producto a través de las informaciones internas disponibles ya no basta.
Hemos pasado de una orientación al producto a una orientación al mercado y
está visión de la competencia es fundamental en la actualidad.
11
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
El objetivo es simplemente hacerlo mejor que los competidores; los cuatro ejes
principales de mejora de la posición con respecto a la competencia son:
- Una mayor rapidez en todas las etapas del ciclo de vida de un producto
(diseño, realización, cadena de producción, etc).
- Un acceso más fácil para los consumidores a los productos y a los servicios.
1
Aunque todavía no se ha dado una definición precisa de lo que se entiende por un sistema de
decisión, la idea es presentarlo en este momento como un conjunto de herramientas de soporte
a la toma de decisiones, sin entrar de momento en mayor detalle.
1.2.5.2 El consumidor
12
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
13
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
14
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
15
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Figura 1.6: Marco de trabajo de los datos en las aplicaciones de Business Intelligence1.
Para crear un sistema de Business Intelligence los datos provistos por las
fuentes de datos son sometidos a un proceso de búsqueda, análisis y de envío
a la persona responsable de la toma de decisiones. Para el caso de los datos
provenientes de una fuente estructurada los analistas utilizan herramientas
tales como sistemas ERP's, ETL's, DW's, Data Mining y herramientas OLAP.
Para el caso de fuentes de datos semi-estructuradas el análisis es realizado
con la ayuda de otras herramientas menos sofisticadas.
16
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Fuente: Adaptado de Negash. (2004). Pág. 183.
- Aplicaciones de inventario
- Repositorio de metadatos
17
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Fuente: Adaptado de Negash. (2004). Pág. 184.
18
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
19
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
ROI: Return of Inversion, Retorno de la Inversión.
2
Fuente: Negash. (2004). Pág.185.
3
Conocido como Análisis de la Competencia o Competitive Intelligence (CI)
OBJETIVOS
20
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Un prerrequisito fundamental para todo esto es que los datos para soportar los
análisis tienen que ser accesibles, tienen que estar actualizados, y su acceso
debe poder hacerse de forma flexible y en un formato válido para los usuarios.
Hasta la fecha se ha realizado mucho hincapié en la tecnología de base que
sustenta el concepto de Data Warehouse, pero no demasiado en el trasfondo
estratégico, la planificación, los procesos de negocio y los servicios que
desarrollan, mantienen y usan la tecnología de Data Warehouse.
21
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Los sistemas que contienen los datos operacionales, aquellos derivados de las
transacciones diarias del negocio, contienen información que es útil para el
analista de negocio. Por ejemplo, los analistas pueden usar información sobre
que productos fueron vendidos en determinadas regiones en un momento
determinado del año con el fin de buscar anomalías o diseñar futuros planes de
venta. Sin embargo, existen diversos problemas cuando los analistas acceden
directamente a los datos operacionales:
22
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
A lo largo de la literatura, este término puede encontrarse escrito de diversas maneras:
básicamente como data warehouse o datawarehouse. Su traducción al castellano pocas veces
se realiza, ya que se presta a confusión. En cualquier caso, es preferible hacerlo como
almacén de información, ya que la traducción literal, almacén de datos, no hace referencia a su
naturaleza informacional.
2.2.1.1 Integración
23
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
2.2.1.2 Profundidad
24
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
2.2.1.3 Detalle
25
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Los Data Mart contienen menos datos y solo están especificados para un
objetivo en la organización; esto hace que tenga menos usuarios, menos
actualizaciones y menos restricciones para su construcción; haciendo que sean
más baratos que un Data Warehouse.
26
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
27
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
- Criterios de negocio.
- Criterios de proceso.
- Criterios tecnológicos.
El primer conjunto de criterios tiene que ver con el problema de negocio que se
debe abordar y los beneficios esperados de la solución que se implemente.
Según Lindsey & Frolick (2002)1 aproximadamente 3000 proyectos de Data Warehousing se
realizan alrededor del mundo y aproximadamente un 70% de estos fracasan aunque desde
1995 se tenga conocimiento documentado únicamente de 17 fracasos. Una posible
discrepancia de estas estadísticas es según Lindsey & Frolick la definición de lo que es una
fracaso en un proyecto de Data Warehouse; ellos proponen una definición estándar la misma
que pueda ser utilizada, tal es así que proponen que un fracaso de un proyecto de Data
Warehouse es la cancelación formal o informal de un proyecto o también como la condición
28
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
ene donde el proyecto de Data Warehouse terminado no cumple con las expectativas de la
organización.
- Soporte de los directores, está considerado como uno de los más importantes factores que
inciden directamente en el éxito de la implementación de un Data Warehouse. El efecto que
produce dentro de las organizaciones es el de motivar a la misma y apoyarla sin importar los
cambios que esta nueva herramienta traiga consigo dentro de la organización.
- Champion, es el encargado de promover la nueva aplicación; entre sus funciones están las de
apoyar consiguiendo la información necesaria, recursos y lo más importante es el nexo político
entre el proyecto y la organización.
- Recursos, esto se refiere a recursos monetarios, humanos y de tiempo que son de suma
importancia para completar exitosamente un proyecto de Data Warehouse.
- Las habilidades del equipo, los integrantes del equipo encargado de la implementación del
nuevo Data Warehouse son la pieza más importante; las habilidades del equipo incluyen las
técnicas y las interpersonales.
- Los sistemas de donde se extraerá la información hacia el Data Warehouse juegan un papel
preponderante dentro de lo que es la implementación de un Data Warehouse. A mayor
heterogeneidad en las fuentes de datos los esfuerzos para la extracción y transformación serán
considerablemente mayores.
Implementar un Data Warehouse exige por parte de las empresas un compromiso financiero y
de recursos humanos; tener los recursos necesarios, los miembros del equipo apropiados y la
participación del usuario final tienen un efecto muy positivo en el resultado final del proyecto.
1
Fuente: Lindsey, K. & Frolick, M.N. (2002). Critical factors of Data Warehousing failures.
Journal of Data Warehousing.
29
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Una vez que los beneficios tecnológicos han sido alineados con los objetivos
de negocio estos deben ser cuantificados. Según (Watson & Haley, 1997)1 el
costo de este tipo de proyectos es de alrededor de $1 millón solo en el primer
año. Por esta razón los gestores deben ser capaces de responder a la
pregunta: ¿Cómo sabré si la adopción de una determinada solución será
beneficiosa? La respuesta debe tener la forma: "la solución será exitosa si
permite a la organización conseguir los siguientes objetivos...". Además debe
tener números, cuando a alguien se le propone una solución que necesita una
inversión grande lo primero que va a preguntar es: ¿Qué gano yo? ¿Cuánto
gano yo?
Lo que era especialmente interesante del estudio, sin embargo, era que las
implementaciones departamentales pequeñas, los Data Marts, tenían un ROI
del 533%, mientras que la soluciones corporativas lo tenían del 322%.
30
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
El estudio del IDC identificó tres tipos de beneficios derivados del uso de un
Data Warehouse:
31
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
- Justificación del costo. Muchos proyectos de DW son implementados sin hacer estimaciones
de los beneficios potenciales.
- Costos del DW. A menudo se incluyen costes técnicamente inportantes, pero no de negocio,
como hardware, software, consultores y contratistas, redes de comunicaciones, capacitación de
personas informáticos y usuarios, y administración de los sistemas operativos y de gestión,
dejando fuera otros, como cambios por reingniería, despidos y contrataciones, etc.
- Total cost of ownership (TCO). El TCO vá más allá de la implantación. Por ejemplo, el coste
anual de mantener un DW va del 40% al 60% del coste inicial.
- Beneficios. Un DW ouede entregar beneficios sustanciales tanto tangibles como intangibles.
Pero medirlos son un reto, por ello se requieren personas experimentadas y seguir buenas
prácticas.
- Medición post-implementación. Costos y beneficios de la post implementación son cruciales
pues ayudan a determinar y fijar objetivos futuros, mejorar estimaciones de coste y propuestas
de expansión y mejora.
- Cálculo del ROI. El cálculo del ROI es sencillo y podría incluir el coste de capital y de riesgo
asociado con el proyecto. Por esto se sufiere usar otros métodos.
1
Ver: Adelman, Sid. (2003). Measuring Dataware Measurement Return on Investment.
http://www.teradata.com/t/pdf.aspx?a=83673&b=86833 [Leído: 18 de marzo del 2006].
32
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Fuente: Bárbara, Wixom.; Paul, Gray.; Hugh, J, Watson. (2001). Data Warehousing and
Business Intelligence. Pág.18.
2
Fuente: Yang, Amoy. (2005). Use Lifetime Value Data Mart to Drive Analytic Efficiency. Junio
13.
http://www.datawarehouse.com/article/?articleid=5429 [Leído: 22 de marzo de 2006, 15:30
GMT-05:00].
3
En los siguientes capítulos se plantearan las distintas herramientas que pueden explotar de
forma efectiva todo el entorno integrado de información, ya sea a nivel de consultas y
verificación de hipótesis, o bien mediante soluciones para el descubrimiento de patrones y
tendencias subyacentes en los datos.
4
Fuente: Adaptación de http://www.teradata.com/t/page/86896/index.html [Leído: 18 de marzo
del 2005].
Los Data Marts constituyen una alternativa rápida y menos costosa para
implementar un sistema informacional. Sin embargo, si una organización
determina que un Data Warehouse corporativo es la estrategia apropiada,
debería comenzar por desarrollar una estrategia global.
33
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
34
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
2.3.3.1 Escalabilidad
35
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
2.3.3.2 Gestión
2.3.3.3 Rendimiento
Por otro lado recordemos que las aplicaciones de Data Warehouse son
plataformas tecnológicas en donde se integra toda la información histórica de
una empresa, la misma que en muchos casos proviene de diferentes fuentes
heterogéneas.
36
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
hace que tenga mucho más impacto, el cómo debe ser recolectada la
información y almacenada; es por esto, que la estructura de la información que
se encuentra a nivel de un sistema transaccional es completamente diferente al
que encontramos en un Data Warehouse.
Con todo esto lo que se puede deducir es que existen diferencias importantes
en cuales son los requerimientos de datos entre los sistemas transaccionales y
los Data Warehouse, las mismas que tienen un impacto importante en el diseño
de los Data Warehouse; entre las que podemos citar están las presentadas a
continuación.
• Tener una visión integral del negocio asegura que toda la información
necesaria este disponible, con esto el producto final (aplicación) cumplirá
los objetivos planteados obteniendo la información que se necesita y en
el formato adecuado; permitiendo ejecutar muchas consultas de
diferentes características. De ahí la importancia que en la fase inicial de
determinación de requerimientos de un Data Warehouse involucrar a
personas con un excelente conocimiento del negocio; esto
complementado con una metodología que permita evaluar diferentes
escenarios del negocio permitirá tener un buen diseño de la aplicación.
• Evitar cambiar constantemente el modelo de datos, esto es algo
bastante complejo en cualquier aplicación y mucho mas en un Data
Warehouse y es básicamente por dos razones: (1) el modelo de datos
en un Data Warehouse es mucho más complejo, y (2) el desempeño de
las consultas se deteriora considerablemente debido a que los Data
Warehouse realizan consultas a grandes cantidades de datos.
• Involucrar a los usuarios finales es muy importante durante la etapa de
definición de los requerimientos del sistema. Las actitudes de los
usuarios a los sistemas y su desempeño están muy influencias por la
medida en la que haya sido involucrado en el desarrollo del sistema. A
diferencia de una aplicación transaccional los Data Warehouse de una
mayor participación de los usuarios en la etapa de determinación de
requerimientos; cuando se habla de usuarios se refiere a los usuarios de
todos los niveles tales como usuarios de los datos hasta los
responsables en la toma de decisiones.
37
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
• Asegurarse que toda la información que poseen los miembros del equipo
sea considerada, con esto se refiere a que en muchos casos los
miembros del equipo obvian mencionar algo que ellos piensa que es
muy propio de su unidad o departamento y que piensan que no agregará
valor dentro de lo que es el diseño de la aplicación; esta información no
revelada puede ser valiosa para validar el modelo ya que en muchos
casos es usada en varias áreas de la empresa sin saberlo.
• También es muy importante que los directores de la empresa y los
usuarios finales tengan bien clara la complejidad de construir un Data
Warehouse y el tiempo que conlleva hacerlo especialmente al obtener
los datos. En muchos casos esta es la parte más demorada debido a la
heterogeneidad de las fuentes de datos, el planear cuanto se demorará
transformar estos datos en el formato del Data Warehouse no es una
ciencia exacta y es por esto que los directores deben tener bien claro
que esto puede afectar el tiempo de implementación de la aplicación.
• Evitar que la información provista por el Data Warehouse este sujeta a
interpretaciones erróneas, esto es común a medida que la aplicación va
siendo introducida dentro de la empresa. Es recomendable que se
provea de ejemplos de tal manera que los mismos responsables del
negocio la validen.
• Es muy importante tener el apoyo de un ejecutivo de la organización,
está muy claro que los miembros del departamento de IT son claves en
el desarrollo del Data Warehouse ya que son ellos los que ayudarán a la
organización a plasmar todo dentro del Data Warehouse, pero también
es verdad que los de IT no son los que deberían diferenciar si al
encontrar algún inconveniente este proviene de un área en especial de
la empresa, es aquí donde entra en juego el ejecutivo de la
organización, ellos son los llamados a dar estas prioridades y a solventar
las dificultades dando los lineamientos necesarios para solucionar los
inconvenientes. Otro aspecto importante de la participación de un
gerente de la empresa por ejemplo es que ellos puedan proveer de
datos o información que posiblemente en ese momento no va a ser
utilizada pero que en un futuro muy cercano pueda ser de gran utilidad.
• El último y tal vez el mas complicado de aplicar es el de poder
diferenciar que es realmente útil para la empresa dentro de una
aplicación de Data Warehouse. El hecho de que se recomienda una
mayor participación de los usuarios de la aplicación en la definición de
las necesidades de información hace que en muchos casos se tenga
una lista muy extensa de "necesidades", hay que saber diferenciar entre
estas necesidades lo que realmente agrega valor a la organización y que
es de utilidad para todos.
1
En muchos casos el cambiar una información del Data Warehouse puede ser considerado
falto de ética o hasta ilegal.
38
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
técnicas de descubrimiento de
información
OBJETIVOS
- Conocer las técnicas, operaciones y aplicaciones de minería de datos, y tipos de análisis por
sectores.
3.1 Introducción
Un SIATD permite no solo construir, validar y refinar modelos aplicándolos a
datos extraídos a partir de la base de datos propia del sistema, de la base de
datos corporativa de la organización o de otros suministradores externos de
datos. También incluye las herramientas necesarias para representar estos
datos o los resultados de las aplicaciones de los modelos, según diferentes
formas gráficas. Esto lo podemos ver con más claridad en la figura 3.1 en
donde se presenta la arquitectura típica de un sistema de apoyo a la toma de
decisiones.
39
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
40
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
41
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
En la figura 3.2 se puede observar el flujo del proceso de consulta con cada
uno de los elementos que lo constituyen.
42
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Hay que decir que con una herramienta de query & reporting se puede atacar cualquier tipo
de base de datos relacional, en el sentido que tanto se pueden efectuar consultas contra un
sistema operacional como contra un datawarehouse. Por los diferentes motivos expuestos a lo
largo de este módulo, la segunda opción es la preferible.
Es frecuente que existan cierto tipo de consultas que se haya que repetir con
frecuencia; la información que se está buscando es la misma, así como el
formato final que se le dará. Lo que cambia son los datos de origen sobre los
que se realizará la consulta.
• Consultas empaquetadas.
Se ejecutan periódicamente, sin necesidad de intervención del usuario.
Desde el punto de vista del administrador del Data Warehouse la carga
de proceso que suponen es estable ya que siempre consumen lo mismo.
Esto es importante, ya que permite planificar su ejecución y ubicación en
función de los tiempos de proceso consumidos y de la carga del sistema.
43
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
• Consultas ad-hoc.
Son consultas recurrentes y aleatorias, en el sentido en que responden a
necesidades de información concretas. La carga de proceso es variable
e impredecible, en este sentido, y cuando estas consultas provienen de
los usuarios finales, hay que tener cuidado con los tiempos de proceso
que requieren, ya que en función del número podría llegar a colapsar el
sistema.
44
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
45
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Procesado OLAP
46
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Fuente: SCHWARZ, S.; SEIFRIED, P.; y WINTER, R. (1998). On-Line Analytical Processing
for Accounting: Potentials, Application, and Design Methodology. En Hoadley, E.; y, Benbasat,
I. (Eds.). Americas Conference on Information Systems. Baltimore, 1998. pp. 42-44.
Los datos relacionales, aquellos manejados por los gestores de bases de datos
convencionales, pueden ser considerados bidimensionales, ya que cada unidad
de dato, denominada hecho, está correlacionada con una fila y una columna,
cada una de las cuales puede ser considerada una dimensión. Una dimensión
es una clasificación de alguna actividad en una organización por la cual se
puede medir su éxito. Por ejemplo, puede monitorear sus ventas contra los
productos o clientes en un periodo de tiempo.
47
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Resumiendo, los hechos son los detalles del negocio que se pretenden medir
(ventas, presupuestos, etc.), mientras que las dimensiones representan los ejes
a través de los cuales se quieren medir los hechos (geografías, productos,
tiempo, etc).
• Rotar y Rebanar (slice & dice): Rotar es aventar el cubo como si fuera
un dado para obtener una nueva cara del cubo. Rebanar es cambiar el
valor de una dimensión por otro valor, por ejemplo, de las ventas de
Enero a las ventas de Febrero, "Ventas por producto" puede cambiarse
fácilmente a "Ventas por vendedor".
• Taladrar (drill down & roll up): Consiste en abrir los datos de las
dimensiones se con el fin de obtener más detalle; es decir una especie
de taladro que se hunde más en la información. Con esta facilidad es
posible ver información geográfica y luego fácilmente pasar de un
continente a un país y luego a una ciudad en particular.
Estas dos características son las que más claramente definen la tecnología
OLAP, sobre todo por que le confieren sus características de interactividad. Por
ejemplo:
- En drill down, el usuario puede analizar sus ventas por continente, bajar a
nivel de región, país, etc.
- Mientras en slice & dice, además, puede cambiar los ejes de búsqueda para
analizar sus ventas mensuales respecto a las diferentes marcas de productos,
observando la cifra de negocio y examinando después los márgenes derivados.
48
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
49
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
50
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
51
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
En la figura 3.7 se puede observar que la línea que une la parte de Data
Warehouse con la de minería de datos tiene dos cabezas. Esto quiere decir
que la minería de datos no es un fin en si mismo, sino que los mejores
resultados se obtienen cuando la información generada por ésta se realimenta
en el Data Warehouse, pudiéndose explotar posteriormente mediante los
sistemas de verificación de hipótesis.
Figura 3.7: Posición de la minería de datos dentro de las soluciones de Business Intelligence.
52
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
No es el objetivo de esta asignatura plantear los fundamentos matemáticos de las técnicas de
minería de datos. En la bibliografía se incluyen algunas referencias que permiten profundizar
en este tema.
53
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Figura 3.8: Entornos de aplicación y ámbitos de decisión sobre los cuales la minería de datos
puede aportar grandes beneficios.
54
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
55
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Fuente: LANGLEY, PAT; y SIMON, HERBERT A. (1995). Applications of machine learning
and rule induction. Communications of the ACM, 38(11):54-64.
56
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Bajo este esquema los analistas debían formular una hipótesis sobre la
existencia de una cierta información de interés, convertir la hipótesis en una
consulta, lanzarla contra el Data Warehouse e interpretar los resultados
obtenidos. Por ejemplo, el gestor bancario debería plantear la hipótesis de que
los clientes casados, con dos sueldos por familia y una renta elevada tienen
una tendencia elevada a la compra fondos de inversión. Es evidente que llegar
a esta hipótesis es un proceso en absoluto trivial; lo importante es que después
de la formulación de la hipótesis el analista plantee la consulta en términos
informáticos, lanzarla e interpretar si el grupo considerado constituye un
conjunto de clientes adecuado para sus fines.
57
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Figura 3.10: Fases del soporte a la decisión sobre la explotación de un Data Warehouse.
58
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Debido a que la minería de datos extrae información de una base datos que el
usuario ignora su existencia, éste en su área debe conocer bien lo que la
herramienta otorga como información, caso contrario su utilidad es nula. El
aprovechamiento al máximo de los modelos generados con un sistema de
minería de datos se consigue explorando sus resultados mediante
herramientas de análisis. Por ejemplo, es posible construir mediante técnicas
de minería de datos un modelo predictivo que asigne un nivel de propensión de
respuesta a una campaña promocional partiendo de una base de datos de
clientes (scoring). Además de otros resultados, uno de los resultados que se
obtendrán será un listado ordenado de los clientes, de mayor a menor índice de
propensión de respuesta. Con base en esto, y dado que el presupuesto para
acciones comerciales suele estar limitado, un analista de marketing se decidiría
por contactar con los primeros clientes de la lista. En este sentido, el modelo es
un fin en sí mismo, pues nos proporciona una información de alto valor de cara
a la selección de público objetivo para la campaña.
59
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Ahora bien los modelos estadísticos tienen un rol muy importante en Data
Mining específicamente en las tareas de desarrollo y evaluación de modelos;
tal es así, que la gran mayoría de los algoritmos de Machine Learning utilizan
técnicas de evaluación estadística para la construcción de regla de decisión.
60
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Figura 3.11: Principales diferencias entre las técnicas estadísticas y las técnicas de minería de
datos.
61
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Uno de los aspectos más importantes del proceso es que es iterativo. Los
resultados de cada fase pueden hacer replantear los pasos anteriores; de esta
manera el ciclo se va depurando hasta obtener los resultados esperados. Al
momento de seleccionar una herramienta de minería de datos es importante
entre otros aspectos que se analizarán más adelante el soporte a todos los
pasos del proceso. Debe ser posible aplicar las funciones de modelización de
forma independiente, iterativamente o utilizando una combinación de ambas
modalidades.
62
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Detección de Predicción
Perfilación de Búsqueda Análisis de
actividades de la
poblaciones de patrones actividades
fraudulentas demanda
de compra bursátiles
Aplicaciones
Detección de
Clasificación Anticipación
nichos de Gestión de Comparación
según de
mercado alarmas de patrones
síntomas abandonos
Comparación
Modelos de Modelos de Clustering de Análisis de
Operaciones de secuencias
clasificación predicción datos relaciones
en el tiempo
Funciones Medición de
Inducción en Clustering
de base asociaciones
árbol relacional Análisis de
radial
Técnicas series
temporales Medición de
Redes Redes
Redes patrones
neuronales neuronales
neuronales secuenciales
63
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
64
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Los análisis de Data Mining permiten también realizar este tipo de análisis a
través de diferente tipo de operaciones posible; entre las que encontramos
están:
- Sumarización de datos.
- Análisis de asociaciones.
- Detección de desviaciones.
Técnica de análisis
de datos: Sumarización
Segmentación Clasificación Predicción Dependencia
(E) Estadística de Datos
(AML) Algoritmos de
65
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Machine Learning
Descriptiva y
(E) de * * *
visualización
Análisis de
(E) *
correlaciones
Análisis de
(E) clusters de *
información
Análisis
(E) *
discriminativo
Análisis de
(E) * *
regresión
Redes
(AML) * * *
Neurales
Razonamiento
(AML) *
baso en casos
Árboles de
(AML) * *
decisión
Reglas de
(AML) *
asociación
66
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
67
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
A medida que una base de datos va creciendo y llenándose con diversos tipos
de datos es necesario particionarla en colecciones de registros relacionados.
Con esto es posible obtener un resumen de su contenido, o bien como tarea
previa a la construcción de un modelo predictivo o un análisis de asociaciones.
Por ejemplo, una aerolínea desea segmentar a sus clientes por pasajeros
frecuentes y pasajeros esporádicos; y de los frecuentes por categoría de vuelo.
68
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Otro ejemplo con mayor detalle son los grandes almacenes que mantienen una
base de datos en la cual cada registro describe los artículos comprados por un
cliente durante una visita determinada.
Esta base de datos puede ser segmentada de forma que se obtengan grupos
homogéneos de transacciones, cuyo estudio particular aportará información
valiosa sobre los hábitos de compra de los clientes. La figura 3.15 muestra un
ejemplo de segmentación de clientes de un supermercado.
69
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Fuente: adaptado de JACKSON, JOYCE. (2002). DATA MINING: A CONCEPTUAL
OVERVIEW. Communications of the Association for Information Systems. Volumen 8, pp. 267-
296.
2
También conocido como outliers. La traducción de este término siempre es complicada.
Básicamente se refiere a valores que se salen de la distribución ordinaria de los datos. En
ocasiones se les denomina puntos erróneos o aberrantes.
Tabla 3.3. Técnicas utilizadas por las diferentes operaciones de minería de datos.
INDUCCIÓN SUPERVISADA
70
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Clasificación neuronal
Ahora bien entre ambas capas existen nodos intermedios que se encargan del
procesado interno de la información. Una de las principales características de
estas redes neuronales es su capacidad de modelar comportamientos de alta
complejidad en especial cuando existe un gran número de puntos espurios y
valores omitidos; adicionalmente se caracteriza por ser métodos no lineales lo
que los hace capaces de aproximar cualquier tipo de función. Su gran
inconveniente radica en la determinación óptima de su arquitectura, es decir:
número de capas intermedias, número de unidades por capa, etc. Además,
aunque pueden llegar a obtenerse modelos de gran calidad y resolución, otro
de sus inconvenientes es que funcionan como cajas negras de tal manera que
es difícil saber por que una red de este tipo efectúa un tipo u otro de
clasificación, independientemente de que ésta sea buena o mala.
Los inconvenientes presentados por los métodos neuronales hacen que los
analistas de minería de datos prefieran a los métodos simbólicos. Su
característica más importante es un naturaleza auto explicativa, es decir,
además de proporcionar una clasificación de los registros son capaces de
explicar los criterios que utilizó para dicha clasificación. Los ejemplos más
clásicos de métodos simbólicos son los árboles de decisión en donde la
población de registros es distribuida en función del cumplimiento de
determinados criterios de alta capacidad discriminante.
71
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
puede generar la siguiente regla: si los ingresos del cliente son superiores a
$25,000, su margen de edad está entre 45 y 55 años y vive en el barrio XYZ,
entonces el cliente es bueno.
INDUCCIÓN SUPERVISADA
Predicción neuronal
72
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
73
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Análisis de asociaciones
Detecta elementos en una transacción que implica la presencia de otros elementos en ésta
misma.
Expresa las afinidades entre elementos en forma de asociación X FB facilitando una serie de
métricas como el soporte, cofianza, tipo de la regla, etc.
Permite especificar los niveles de soporte y confianza mínimas para las reglas que deben ser
detectadas así como los elementos que deben o no incluir.
Permite incorporar taxonomías de productos, habilitando la detección de asociaciones a
diferentes niveles.
Patrones secuenciales
Detectan patrones entre transacciones, lo que permite optimizar las ventas a lo largo tiempo.
Permiten especificar el factor de soporte mínimo para las secuencias que deben ser
detectadas.
1
Un ejemplo típico de esto se encuentra en los modelos de estimación de enfermedades en
función de determinados síntomas. Puede ser tolerable que el modelo de clasificación se
equivoque, en un número relativamente bajo de casos, al decir que un individuo que no está
enfermo si lo está. Sin embargo, la tolerancia en el caso contrario tiene que ser
necesariamente más baja.
2
Las técnicas empleadas en los modelos predictivos son similares a las de los de clasificación.
Además de los algoritmos basados en redes neuronales, las funciones de base radial (RBF,
radial basis functions) son otra de las técnicas más empleadas.
3
Existe un ejemplo canónico para ilustrar el análisis de bolsa de la compra: pañales implica
cerveza.
3.3.4 Segmentación
74
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
- El tipo de los valores de atributos que pueden tomar los registros a segmentar
(numéricos, nominales, estructurados, etc).
Ejemplos de implementación
75
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Segmentación neuronal
1
En este caso, la idea es que, una vez particionada la base de datos, se construye un modelo
de clasificación para cada uno de los segmentos, en lugar de desarrollar un único modelo para
el total de la población. 2 No supervisados en el sentido en que, al contrario que en los modelos
de clasificación o predicción, aquí no existe una variable objetivo que permita mediar la calidad
del proceso de entrenamiento.
Al igual que cualquier tipo de proyecto los proyectos de Data Mining tienen
diferentes actores que realizan tareas específicas para la consecución exitosa
del proyecto. Entre los que se puede destacar están:
76
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
El nombre SEMMA es un acrónimo en inglés que identifica los cinco pasos que
son parte de un proyecto de Data Mining, estos son:
1. Sample
2. Explore
3. Modify
4. Model
5. Assess
77
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
78
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
NCR, Daimler Chrysler, Integral Solutions Limited (ISL) (ahora parte de SPSS)
y OHRA una compañía independiente de seguros noruega.
79
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Data Understanding (conocer los datos), inicia con la recolección inicial de los
datos para luego proceder con actividades para que permitan familiarizarse con
los datos de tal manera que se puedan detectar problemas con la calidad de
los datos, descubrir primeros patrones en los datos que permitan formular
hipótesis para información que se encuentre oculta en los datos.
Data Preparation (preparación de los datos), esta fase consiste en todas las
actividades previas a la preparación de los datos iniciales que se alimentarán a
la herramienta de modelamiento. Esta fase de preparación de los datos
contiene pasos que deben ser realizados en múltiples ocasiones y sin un orden
en particular. Estas tareas incluyen: preparación de las tablas de datos,
almacenamiento, selección de atributos y la transformación y limpieza de los
datos que serán alimentados a las herramientas de modelamiento.
80
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
ejecutaron para la consecución del mismo. Con esto se asegura que el modelo
realmente satisface las necesidades y objetivos planteados por el negocio. Una
forma de determinar esto es verificando si existe algún requerimiento
importante del negocio que no ha sido cubierto completamente por el modelo.
Luego de que se haya validado el modelo se procede a la toma de la decisión
del uso de los resultados obtenido por el mismo.
1
Fuente: JACKSON, JOYCE. (2002). DATA MINING: A CONCEPTUAL OVERVIEW.
Communications of the Association for Information Systems. Volume 8, pp. 279.
2
Fuente: JACKSON, JOYCE. (2002). DATA MINING: A CONCEPTUAL OVERVIEW.
Communications of the Association for Information Systems. Volume 8, pp. 280.
3
Fuente: JACKSON, JOYCE. (2002). DATA MINING: A CONCEPTUAL OVERVIEW.
Communications of the Association for Information Systems. Volume 8, pp. 281.
81
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Con esto vemos que la minería de datos ofrece una amplia gama de
aplicaciones en diferentes industrias y puede ser usada como un medio para
aumentar las ganancias a través de la reducción de costos o ya sea por medio
del aumento de los ingresos.
82
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
83
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
84
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
85
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
OBJETIVOS
- Reconocer los problemas que plantea Internet de cara al acceso a los datos.
86
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Sin embargo, cualquiera que haya buscado información en la web sabe que
estas herramientas automáticas categorizan la información de forma diferente
que las personas. En cierto sentido, el trabajo realizado por las diferentes
herramientas de indexación y catalogación, conocidas como motores de
búsqueda, es altamente democrático al no ejercer prioridades por calidad de
contenido. Esto es así por que su aproximación está basada en un acceso
uniforme e igualitario a toda la información de la Red. En la práctica, este
igualitarismo electrónico perjudica enormemente la búsqueda de información
relevante. Un usuario de un sistema de este tipo, que introduce una petición de
búsqueda en el sistema, se ve normalmente bombardeado por miles de
posibles respuestas donde en muchos documentos sólo nombran esa petición
y no la profundizan. El resultado de la búsqueda contiene, con frecuencia,
referencias a sitios web irrelevantes, dejando fuera otros que contienen
importante material.
87
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
88
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
accedida por el robot que visita el sitio web (la figura 4.1, resume los
principales problemas planteados hasta ahora).
1
Es decir, los metadatos.
Sin embargo, esta iniciativa requiere un grado de consenso que, hoy por hoy,
no parece factible a corto plazo. Por ello, y en un intento de aprovechar al
máximo las capacidades de los sistemas de información, una alternativa más
factible consiste en intentar aplicar las técnicas de Business Intelligence a la
extracción de la información a partir de datos.
89
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Riqueza semántica
Los datos textuales tiene un significado semántico. Los numéricos no.
No es posible hablar de "acceso a los datos", sino de "recuperación de la información"
La falta de un formato tabular dificulta el procesado de los datos mediante técnicas de
computación.
L la existencia de diferentes idiomas dificulta aún más todo el proceso.
Medida de la similitud
La comparación de los dos textos debe hacerse en base a sus características lingüísticas y
semánticas.
La apreciación éstas características está influenciada por el contexto y por el analista que
aborda el problema.
Sumarización automática
Con datos se pueden hacer descriptivas que los resuman, con textos es mucho más
complicado.
Tabla Características de los datos textuales y los principales problemas de acceso a los
4.1. datos textuales.
90
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Figura 4.3: Aplicación de las técnicas de minería de textos en los sistemas de atención a los
clientes.
91
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
1
Quizá pierde algo de sentido el decir aquí que la información extraída se emplee para la toma
de decisiones de negocio.
Por ejemplo:
92
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
APLICACIONES
93
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
TÉCNICAS Y OPERACIONES
94
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
95
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
96
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
97
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Todos los nombres que se refieren a la misma entidad, como por ejemplo el
expresidente de los Estados Unidos Clinton, Mr. Clinton y Bill Clinton, son
reconocidos de la misma forma, en el sentido que se refieren a la misma
persona. A cada grupo de variantes se les asigna una forma canónica, por
ejemplo Bill Clinton, para diferenciarlos de otros grupos que se refieren a otras
entidades, como Clinton, Nueva Jersey. La forma canónica es la más explícita
y menos ambigua de todas las variantes encontradas. Esta tecnología permite
reconocer en torno al 95% de los nombres existentes en un texto, sin
necesidad de una base de datos de estos preexistente. Tiene que quedar claro
que este porcentaje se aplica en ausencia de errores tipográficos y de
escritura. Además, puede manejar las ambigüedades estructurales inherentes
98
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
4.3.1.6 Acrónimos
99
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
100
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Los documentos que se reciben pueden estar en distintos idiomas, que luego
se deben traducir. El documento se abre manualmente mediante un sistema de
correo electrónico, se explora el texto para determinar en qué idioma se ha
escrito el documento y, a continuación, se envía a un traductor. Hasta ahora,
éste ha sido un procedimiento demasiado lento y costoso.
101
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
102
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
103
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
104
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
105
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
106
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
107
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Las frases con puntuación más alta son extraídas para crear el sumario del
documento. La longitud de este puede establecerse a través de un número
máximo de frases o como un porcentaje de la extensión del documento.
108
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
TIPOS DE INDEXACIONES
Indexación lingüística
109
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Los índices requieren de menos espacio en disco, pero la indexación y la búsqueda puede ser
más larga.
La información extraída puede ser empleada para expandir los términos de consulta,
permitiendo un refinado en base a variantes reconocidas.
Esta indexación amplía el número de documentos susceptibles de ser encontrados.
Los índices requieren de menos espacio en disco, pero la indexación y la búsqueda puede ser
más larga.
Indexación precisa
El procesado lingüístico sólo se emplea para determinar los límites de las palabras y frases.
Los términos de los documentos son indexados exactamente en la misma forma en que
aparece en el texto.
Esta indexación permite búsquedas más precisas, siendo la indexación y las consultas más
rápidas.
Los índices requieren más espacio en disco.
Indexación n-gram
110
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Los robots de búsqueda son herramientas clave para construir sitios web
inteligentes, ya sea en Internet o en una Intranet. Estas herramientas permiten
a las empresas potenciar el uso de Internet y de las Intranet de cara al acceso
a la información.
La figura 4.10 muestra una posible integración de todos los componentes para
la construcción de servicios de búsqueda en Internet.
111
COSIM TI – CAPACITACION PROFESIONAL – BIBLIOTECA VIRTUAL
Además tiene como función el controlar los plazos durante los cuales la
documentación permanece en un área, evitando demoras injustificadas y
verificar que no se produzca el vencimiento del plazo por causa imputable a la
gestión documental. También como función manejar el catálogo de
documentos, así cómo seleccionar los algoritmos de búsqueda, acceso,
recuperación y análisis de información.
112