Está en la página 1de 4

Qu es Oracle Text?

Oracle Text, anteriormente conocido como interMedia Text y ConTextOracle, utiliza SQL estndar para indexar, buscar y analizar datos de texto almacenados en una base de datos Oracle, archivos planos y en la web. Oracle Text Tambin puede realizar un anlisis lingstico de documentos, as como de bsqueda de texto usando una variedad de estrategias que incluyen la palabra clave de bsqueda, las consultas de contexto, operadores booleanos, coincidencia de patrones, mezclando consultas temticas, bsquedas de secciones HTML / XML, y ms. Acerca de Oracle Text Oracle Text soporta la creacin de tres tipos de indices dependiendo de la aplicacin y el origen del texto. Se usar la clusula CREATE INDEX para crear todos los tipos de Oracle Text indexes. A continuacin se describen los tipos de indice y el tipo de aplicacin que se puede construir con ellos, como el operador que utilizaremos en las querys para usar el ndice.

Tipo de ndice

Tipo de Aplicacin

Operador

Utilizar el ndice para crear una aplicacin de recuperacin de texto cuando el texto se encuentra en grandes documentos. Puede CONTEXT CONTAINS indexar documentos de diferentes formatos, como Microsoft Word, PDF, HTML, XML o texto plano. Utilizar este tipo de ndices para mejorar el rendimiento de consultas mixtas. Apto para realizar consultas de pequeos fragmentos CATSEARCH de texto con criterios estructurados como fechas, nombres de elementos y precios que se almacenan en las columnas.

CTXCAT

Se utilizan para construir aplicaciones de clasificacin de documentos. Se crea el CTXRULE ndice en una tabla de consultas, donde cada consulta tiene una clasificacin.

MATCHES

A la hora de pensar en el mantenimiento de los ndices hay que tener en cuenta su optimizacin y sincronizacin. Dicho mantenimiento es necesario despus de producirse un insert, update o delete en la tabla base. Si dicha tabla base es esttica, es decir, no se realizan insert, updates o deletes sobre ella despus de su creacin, no ser necesario sincronizar el ndice. Por el contrario si dicha tabla no es esttica, tendremos que sincronizar el ndice, ya sea de forma manual o automtica. La forma manual se puede llevar a cabo con el procedimiento CTX_DDL.SYNC_INDEX. Si sincronizamos el ndice regularmente, debemos considerar optimizar el ndice para reducir fragmentacin y eliminar datos antiguos. En posteriores artculos se implementar un ejemplo de creacin y mantenimiento de dichos ndices, por el momento slo me interesa exponer los principios tericos sobre Oracle Text.

TABLAS EXTERNAS
Las tablas externas son tablas cuyos datos se almacenan fuera de la base de datos en ficheros planos o binarios. Complementan la funcionalidad de carga de datos de SQL*Loader, o de transmisin de datos/carga de DATAPUMP. Son similares a las tablas SQL normales, pero no residen en la base de datos, por lo tanto su organizacin es externa. Se pueden consultar directamente y tambin en paralelo usando SQL. De hecho, la tabla externa acta como una vista. Los metadatos de la tabla externa, son creados en el diccionario de la base de datos usando la sentencia CREATE TABLE ORGANIZATION EXTERNAL. No se permiten operaciones de manipulacin de datos en la misma (DML), ni tampoco creacin de ndices sobre sus datos. Los datos existen fuera de la base de datos. Una vez que la definicin de la tabla externa (metadatos) exista en el diccionario, puede ser seleccionada, incluso en paralelo, producindose entonces el proceso de extraccin de las fuentes externas, especificadas en

los metadatos de la misma. Se puede realizar una operacin de tipo CREATE TABLE tabla_convencional AS SELECT FROM tabla_externa , permitiendo una variacin del proceso de extraccin y carga. Tambin podemos extraer datos de tablas convencionales y rellenar una tabla externa de tipo DATAPUMP (unload), mover el/los ficheros donde estos datos externos han sido creados y crear los metadatos de esa tabla externa en otra base de datos diferente, facilitando el proceso de transmisin/carga de datos entre bases de datos. Para poder usarlas, es preciso conocer el formato de los ficheros de texto y de los registros que la componen, si el driver que utilizamos es ORACLE_LOADER. Si utilizamos ficheros binarios, es preciso conocer ORACLE_DATAPUMP. 2.- Aplicaciones y beneficios de las Tablas Externas Las tablas externas, nos permiten usar datos externos como si fueran una tabla virtual, y por lo tanto pueden ser consultadas o unidas a tablas normales, sin necesidad de cargar sus datos en tablas convencionales o tablas intermedias. Es decir, cada vez que son accedidas, la informacin se almacena en memoria de usuario (PGA). Veamos algunas caractersticas: - El paralelismo transparente, no est limitado por el nmero de ficheros que lee la tabla externa. - No es preciso almacenar los datos en reas intermedias o de stage para las aplicaciones de tipo ETL en los datawarehouse. - Son muy tiles, cuando una fuente externa, tiene que ser unida o joined con objetos de la base de datos y luego transformada. - Tambin son tiles cuando el volumen de datos es grande, y no se consultan permanentemente. - Complementa las funcionalidades de SQL*Loader en el paralelismo transparente y en las capacidades de insercin directa.

CREATE: Para crear una tabla externa, utilizamos el comando SQL CREATE TABLE ORGANIZATION EXTERNAL, con los siguientes atributos: - TYPE: Tipo de tabla externa. Puede ser ORACLE_LOADER (defecto), o ORACLE_DATAPUMP

- DEFAULT DIRECTORY: Directorio por defecto donde residen los ficheros que son ledos/escritos por las tablas externas. - ACCESS PARAMETERS: Describen las fuentes de datos externas que implementan el tipo de tabla externa especfico. - LOCATION: Nombres de los ficheros donde residen los datos externos. ALTER: Para modificar una tabla externa utilizamos el comando SQL ALTER TABLE, como en las tablas regulares.