Está en la página 1de 27

Módulo 8

Indexación Full-Text

© 2005 EMC Corporation. All rights reserved.


Objetivos del Módulo

• Describir la arquitectura de indexación full-text del Content


Server 5.3
• Configurar indexación full-text en un ambiente de un
repositorio y un Content Server
• Hacer upgrade de Content Servers más viejos de la versión 5.3
para usar la nueva arquitectura de indexación full-text

Indexación Full-Text 8-2


¿Qué es indexación Full-Text? • Indexación Full-Text
• Instalando los Componentes
• Administrando Indices Full-Text

• La indexación Full-text permite a los usuarios • Upgrade de Repositorios

• Buscar objetos en el repositorio basado en el contenido del archivo


• Los usuarios no buscan dentro del contenido del archivo; buscan en
archivos de índices full-text index generados del archivo de
contenido
• Los archivos de índices full-text son generados cuando se registra el
contenido en el repositorio o cuando se actualiza el contenido

Los usuarios buscan


utilizando los archivos de
índices full-text

Full-Text Index files


El contenido es usado
para crear y actualizar los
archivos de índice full-text

Indexación Full-Text 8-3


Indexación Full-Text Antes y Después del
Content Server 5.3

• El software de búsquedas full-text


­ Versiones del Content Servers anteriores a la 5.3 utilizan el
software Verity para búsquedas full-text
­ Versiones del Content Server 5.3 (y posterior) utilizan un
paquete del servidor: index agent/index server
• La arquitectura
­ Antes del Content Server 5.3: Verity corre en la mísma
máquina que el Content Server
­ Content Server 5.3 y posterior: no se requiere que el index
server corra en la misma máquina que el Content Server
• Este curso describe la funcionalidad para el Content Server 5.3
y posterior

Indexación Full-Text 8-4


Preparando la Indexación Full-Text

• En el repositorio, determine
­ Los objetos que serán indexados
­ Las propiedades de objeto cuyos valores serán tratados
como buscables por el full- text
• Instalar el software de indexación full-text
­ Index server
­ Index Agent Configuration Program
• Crear y configurar los agentes de índices

Indexación Full-Text 8-6


Que Objetos son Indexados

• Todos los objetos creados del tipo dm_sysobject (y sus


subtipos) con archivos de contenido asociado se indexan si su
atributo a_full_text está definido como TRUE
• Por default, a_full_text es definido como TRUE
• Para aquellos objetos que no deben ser indexados, defina
a_full_text como FALSE
­ Considere tener un desarrollador que escriba un programa
que llame un método en un objeto type-based business
object (TBO)

Indexación Full-Text 8-7


Que Propiedades son Indexadas
• Todas las propiedades de dm_sysobject y sus subtipos son tratadas como
buscables por full-text
­ Los valores de las propiedades son incluidas en los archivos de índices full-text
­ Todas las propiedades en los objetos customizados, subtipos de dm_sysobject
también son incluidas en los archivos de índices full-text index
• Esto significa que cuando los usuarios ingresen palabras para una búsqueda
full-text, los valores de los atributos de los objetos también son buscados

dm_document

fox
keywords
sop_document

dog
misc
Indexación Full-Text 8-8
Que Rendiciones serán Indexadas (1 de 2)

• Por default, el contenido primario es indexado


• Sin embargo, es posible configurar que para un formato dado se utilice la
rendición para el índice
• Para indexar un formato con una rendición:
1. En el panel izquierdo del DA, seleccione Administration  Formats.
2. En el panel principal, haga clic en el ícono de propiedades para el
formato que desea indexar con la rendición

Indexación Full-Text 8-9


Que Rendiciones serán Indexadas (2 de 2)
3. Asegúrese que la opción Can Be Indexed este marcada.
4. Haga click en el boton With Rendition y seleccione un formato de
archivo y el formato deseado en la lista de selección.
5. Haga click en
OK.

Indexación Full-Text 8-10


Revisión de Arquitectura Full-text (1 de 2)

Content Server Index Agent

Index Server
 Index agent
­ Polls the Content Server for dmi_queue_items
• Use the Index Agent/Server Administration program to set the polling
interval
­ Uses the dmi_queue_items to send information to the index server
to create, update, or delete from the full-text index files
­ Runs in an instance of Apache Tomcat
­ Multiple instances of the index agent can run simultaneously
against the same repository (for better performance)
­ Version 5.3 only: the index agent must reside on the same
computer as the index server
Indexación Full-Text 8-11
Revisión de Arquitectura Full-text (2 de 2)

Content Server Index Agent

Index Server

• Index server
­ Recibe información de un index agent para crear, actualizar, o
eliminar de los archivos de índices full-text
­ Responde a los queries full-text desde el Content Server
­ Pueden correr múltiples instancias del index server para un
repositorio en particular
• Si el repositorio es muy grande, se mejora el rendimiento del full-text
corriendo múltiples instancias del index contra el repositorio
­ Se recomienda que el index server sea instalado en una
computadora separada del Content Server
Indexación Full-Text 8-12
Instalando el Index Server (1 de 4) • Indexación Full-Text
• Instalando los Componentes
• Administrando Indices Full-Text
• Upgrade de Repositorios
1. Haga download o copie los archivos a la
computadora donde se va a instalar la aplicación
2. Inicie la instalación
• UNIX: En la línea de comandos, ingrese
fulltextoperatingsystemSuiteSetup.bin
(donde operatingsystem es el sistema operativo donde
se está instalando)
• Windows: haga doble click en el archivo
fulltextWinSuiteSetup.exe
3. Cuando se le pregunte que productos instalar, seleccione el
Index Server

Indexación Full-Text 8-13


Instalando el Index Server (2 de 4)

4. Siga las instrucciones mostradas, respondiendo como se necesite:


• Seleccione los directorios en los cuales se instalará el software
• Seleccione si desea o no instalar la documentación del
desarrollador y el Primary Interop Assembly
– El Primary Interop Assembly se necesita para el desarrollo
de aplicaciones utilizando Microsoft .NET
– Si no va a existir desarrollo de aplicaciones en está máquina
no es necesario instalarlo
• Provea el nombre del host y el número del puerto para
especificar el broker de conexión necesario para comunicarse
con el repositorio
• Ingrese su password (este es el password para el usuario que
ejecuta el programa de instalación)
• Ingrese un número de puerto (default: 13000)
– Nota: el index server utiliza 4000 puertos secuenciales,
comenzando con el puerto ingresado en este campo

Indexación Full-Text 8-14


Instalando el Index Server (3 de 4)

• Seleccione los idiomas para la normalización gramatical


– La normalización gramatical asegura que todas las formas
de la palabra son indexadas y que la búsqueda de una
palabra también regresara otras formas de la palabra
• Seleccione las partes del habla que serán indexadas
– Escogiendo las partes del habla que serán indexadas reduce
el tamaño de los archivos de índices full-text y el espacio en
disco requerido para mantener dichos archivos

Indexación Full-Text 8-15


Instalando el Index Server (4 de 4)

5. Revise las selecciones de instalación en el resumen y haga


click en Next para iniciar la instalación.
6. Cuando se le pregunte, reinicie la computadora
7. Abra DOCUMENTUM\fulltext\IndexServer\var\log\all.log,
8. Busque una línea que incluya “fnet: engine up”; si está
presente, el index server esta activo
9. Se puede iniciar ahora un index agent; si no se ha creado uno,
puede ser creado en este momento.

Indexación Full-Text 8-16


Instalando el Index Agent
Configuration Program

• Utilice los mismos archivos de instalación


• Cuando se le pregunte que productos instalar, seleccione el
Index Agent Configuration Program
• Luego de instalar el programa de configuración, utilicelo para
crear y configurar uno o más index agents

Indexación Full-Text 8-17


Iniciar el Index Agent Configuration
Program

• Windows: Seleccione Start  Programs  Documentum


Index Agent Configuration Program
• UNIX: corra el archivo IndexAgentConfiguration.bin

Indexación Full-Text 8-18


Index Agent Configuration Program:
Seleccione el modo del Index Agent (1 de 2)
• Migration Mode:
­ Content Server antes del 5.3.x:
• Reindexa el contenido del repositorio
• Utilizado para crear archivos de índices full-text antes de
hacer upgrade del Content Server y el repositorio a una
versión posterior
• Los archivos de índices full-text no pueden ser buscados o
actualizados por versiones del Content Servers 5.2.x o
anteriores
­ En el Content Server 5.x, este modo es usado sólo para
propósito de migración (upgrade)
­ Content Server 5.3.x y posterior:
• Reindexa todo el contenido del repositorio

Indexación Full-Text 8-19


Index Agent Configuration Program:
Seleccione el modo del Index Agent (2 de 2)

• Normal Mode: (Sólo Content Server 5.3.x y posterior)


­ Indexa nuevos objetos a medida que son creados en el repositorio
­ Utiliza colas generadas por el repositorio para actualizar los
archivos de índices full-text
­ El index agent lee la cola, prepara el objeto para indexación, y
actualiza el elemento de la cola
­ Cuando el index agent envía el objeto al index server para ser
indexado, el index agent elimina el elemento de la cola del
repositorio

Indexación Full-Text 8-20


Index Agent Configuration Program:
Otras Configuraciones del Index Agent

• Ingrese el password del dueño de la instalación


• Ingrese el puerto que el index agent utiliza para comunicarse
con el Apache Tomcat
­ Este puerto NO debe ser usado por cualquier otro proceso / servicio /
programa en la computadora donde resida el index agent
• Seleccione el repositorio para el cual el index agent va a
prepara los objetos para indexación
• Ingrese el host donde está corriendo el index server y el
número de puerto base para el index server
• Pagina Resumen: confirme que la información ingresada es
correcta
• El Index Agent Configuration Program
­ Crea e inicia el index agent basado en los parámetros ingresados
­ Pregunta si se deben crear index agents adicionales
Indexación Full-Text 8-21
Use Documentum Administrator Para…
(1 de 2) •

Indexación Full-Text
Instalando los Componentes
• Administrando Indices Full-Text
• Ver una lista de los index agents y sus estatus • Upgrade de Repositorios

• Ver una lista de los index servers y sus estatus


• Iniciar, detener, habilitar, o deshabilitar index agents (menu Tools)
• Iniciar o detener index server (menu Tools)

Inicie primero el index


server

Indexación Full-Text 8-22


Use Documentum Administrator Para…
(2 de 2)

• Revisar la cola de indexación

Indexación Full-Text 8-23


Utilice la herramienta de administración de Index
Agent/Server Para…
• Configurar parámetros del index agent, como son
­ Polling Interval: la frecuencia con la que el index agent busca elementos
dmi_queue_items en el repositorio
­ Execute Thread Count: el número de hilos de procesamiento disponibles para
el index agent (requiere reiniciar el index agent)
­ Update Frequency: que tan frecuentemente el index agent reporta el estatus de
los elementos de la cola hacia el repositorio

Indexación Full-Text 8-24


Haciendo Upgrade de Repositorios que
usan Content Server < 5.3 •

Indexación Full-Text
Instalando los Componentes
• Administrando Indices Full-Text

• Migración Pre-upgrade : • Upgrade de Repositorios

­ Hace upgrade de los índices full-text indexes a la nueva arquitectura


antes de hacer upgrade al Content Server
­ Los archivos de índices full-text están disponibles para su uso
inmediato luego de hacer upgrade al Content Server y al repositorio
­ Recomendado para
• Repositorios grandes
• Cualquier repositorio donde es un requerimiento de negocio que los
archivos de índices full-text estén disponibles inmediatamente
despues de hacer el upgrade
• Migración Post-upgrade :
­ Hace upgrade de los índices full-text indexes luego de hacer upgrade al
Content Server y al repositorio
­ El contenido de los objetos no estará disponible para ser buscado vía
full-text hasta que no se reconstruyan completamente los índices full-
text

Indexación Full-Text 8-25


Migración Pre-Upgrade

• Instale el Index Agent Configuration Program y el index server


• Corra el Index Agent Configuration Program
­ Cree un index agent usando el modo Migration
­ El Index Agent Configuration Program crea los índices full-text
• Baje el Content Server
• Haga upgrade del Content Server a la versión 5.3 o posterior
• Reinicie el index server y el index agent
• Los índices que fueron preparados antes del upgrade están disponibles
inmediatamente – no se requiere reindexación!
• Haga de las siguientes opciones:
­ Cree un nuevo index agent en modo normal para que los nuevos
documentos se agreguen a los índices full-text
o
­ Usando el programa de administración Index Agent/Server, cambie el
modo del index agent a modo Normal
Indexación Full-Text 8-26
Migración Post-Upgrade

• Haga upgrade del Content Server


• Instale el index server y el index agent configuration program
• Cree un index agent en modo Normal
• Reinicie el Content Server
• Los nuevos índices se crean automáticamente
• El sistema de full-text está en un estado de inconsistencia hasta
que se termine de generar los archivos de índices

Indexación Full-Text 8-27


Pruebe sus Conocimientos

1. Nombre el componente que busca el repositorio para


dmi_queue_items y los preparar para su indexación full-text
2. ¿Es configurable el intervalo de tiempo con el cual se chequea
el repositorio para objetos dmi_queue_items?
3. Nombre el componente que crea/actualiza/elimina los
archivos de índices full-text.

Indexación Full-Text 8-28

También podría gustarte