1.1 Oracle Endeca Information Discovery Implementacin.
En primer lugar y para una instalacin bsica de Oracle endeca information
Discovery se debe Con unos requerimientos mnimos de sistema: Tabla 1 Requerimientos Mnimos de Sistema Para Instalar Oracle Endeca Requerimiento Detalles Hardware Requerimientos Mnimos de Hardware: Procesador de 64Bits (x64) mnimo a 1.8GHz Al Menos 2GB de Memoria RAM, dependiendo del tamao del conjunto de datos de la aplicacin 80 GB en disco duro, dependiendo del tamao del conjunto de datos de la aplicacin. Requerimientos Recomendados de Hardware: Procesador de 64Bits (x64) a 3.0GHz o superior. 8GB de Memoria RAM o ms, dependiendo del tamao del conjunto de datos de la aplicacin. Conexin de red con almacenamiento de alto rendimiento (Por ejemplo: conexin va dedicado ISCSI 1 o canal de fibra de red) o conexin local de alto rendimiento con almacenamiento RAID 2
Sistema Operativo Windows Server 2008 R2 Enterprise Corriendo en un procesador de 64Bits. Porque este es un ambiente de desarrollo, de igual forma se puede instalar en Windows 7 para un ambiente de produccin pero a Windows 7 no se le brinda soporte.
Para un mejor desempeo se recomienda apagar el Hyper-Threading 3 . Tambin Se puede instalar en distribuciones de Linux Server con procesadores de 64Bits. Espacio en disco WebLogic y Oracle Endeca Server deben tener los siguientes tamaos en disco despus de su instalacin: Oracle WebLogic Server: 425Mb Oracle Application Development Runtime: 1024Mb Oracle Endeca Server: 475Mb El tamao en disco de la instalacin completa es de aproximadamente 1.9Gb Cada Programa de Instalacin usa directorios temporales donde extraen los archivos necesarios para instalar cada software en los sistemas seleccionados. Durante el proceso de instalacin, el directorio temporal debe contener suficiente espacio para alojar esos archivos. Como pauta general. Los archivos en el directorio temporal requiere aproximadamente 2.5 veces el espacio que se requiere en ltima instancia para cada instalacin. Por defecto, los programas de instalacin usan el directorio referenciado por defecto por la variable del sistema TMP. Navegador (Para el endeca Studio) Firefox ESR en Windows. Firefox es el navegador recomendado para el Studio Internet Explorer 8 (Con el modo de compatibilidad deshabilitado) en Windows La ejecucin con el modo de compatibilidad activado en internet Explorer 8 no es soportada. Internet Explorer 9 en Windows Safari en el iPad. En este dispositivo solamente se puede iniciar sesin en el Studio y visualizar las aplicaciones, los usuarios no pueden crear o configurar las aplicaciones del Studio desde el iPad. Plugins para el Navegador (Para el endeca Studio) Para usuarios de Internet Explorer 8, Adobe Flash 10.0 o superior, para visualizar las grficas. Para otros navegadores, las grficas se visualizan usando HTML5. Se recomienda usar la versin ms reciente de Flash soportada por el Navegador que se este utilizando.
1 ISCSI: Es un mtodo de conexin de dispositivos de almacenamiento a travs de una red mediante el protocolo TCP/IP. Puede usarse a travs de una red de rea local (LAN) o una red de rea extensa (WAN) o Internet. 2 RAID: Redundant Array of Independent Disks o Conjunto redundante de discos independientes. Hace referencia a un Sistema de almacenamiento de datos que usa mltiples unidades de almacenamiento de datos (Discos duros o SSD) entre los que se distribuyen o replican los datos. 3 Hyper-Threading: es una tcnica utilizada por Intel para conseguir acelerar las aplicaciones que utilizan ms de 1 un
ncleo. 1.1.1 Oracle Endeca Server. Es un motor de bsqueda de anlisis hibrido que organiza los datos complejos y variados de diferentes fuentes. Es el ncleo del endeca Information Discovery, endeca server es nico con el modelo de datos NoSQL-like y arquitecturas In- Memory 4 . Crea un Framework extremadamente gil para el manejo de las combinaciones complejas de datos, eliminando la necesidad de una compleja modelizacin por adelantado y ofreciendo una escala extrema de desempeo. [27]
1.1.2 Oracle Endeca Studio Oracle endeca information Discovery Studio es una herramienta basada en la web para desarrollar y usar aplicaciones orientadas a buscar, analizar y monitorear datos desde Oracle endeca server. Los usuarios avanzados utilizan conjuntos de visualizacin de datos y herramientas de visualizacin de Studio para construir rpidamente sus aplicaciones. Las aplicaciones constan de colecciones de componentes grficos. Los componentes estndar provistos con Studio pueden incluir funciones como: Navegacin o bsqueda de datos especficos. Exponer informacin detallada acerca de los datos. Manipulacin y anlisis de los datos. Resaltar los valores de datos especficos. Usuarios finales de negocios pueden usar esas aplicaciones para explorar los datos y desarrollar anlisis para descubrir tendencias, descubrir relaciones, monitorear cambios, e investigar problemas. [28] Figura 1 Oracle Endeca Information Discovery Studio Page.
4 In-Memory: Es el almacenamiento de informacin en la capa superior de la memoria de acceso aleatorio (RAM), ayuda a los clientes de negocios, incluyendo a los minoristas, bancos y utilidades, a detectar rpidamente patrones, analizando volmenes masivos de datos sobre la marcha y realizando sus operaciones de forma rpida.
1.1.3 Oracle Endeca Information Discovery Integrator El Oracle Endeca Information Discovery Integrator es un componente basado en las herramientas ETL que le permite al usuario desarrollar poderosas transformaciones de datos en una interface grfica fcil de manejar. A travs de fusin, unin, filtrado, mapeo, lectura y escritura de datos se pueden desarrollar simples o complejas transformaciones. Con el integrador, se pueden arrastrar componentes y conectarlos de forma grfica con una complejidad variada. Una grfica es esencialmente una tubera de componentes que procesan los datos. El grafico ms simple, tiene un componente lector para leer en las fuentes de datos y uno de los componentes de endeca para escribir (enviar) los datos a un almacenamiento de endeca. Muchos grficos ms complejos usan componentes adicionales, como son los Transformadores (Transformers) y ensambladores (joiner). [29]
Figura 2 Oracle Endeca Information Discovery Integrator Interface.
Para el proceso de instalacin y configuracin de Oracle endeca information Discovery lo primero que se debe hacer es acceder al sitio web de oracle en el apartado de documentacin buscar endeca information Discovery documentacin (http://docs.oracle.com/cd/E29805_01/index.htm) En la pgina que aparece buscar el apartado que dice endeca information Discovery guide. Como html, as se podr visualizar la gua de instalacin y configuracin de oracle endeca information discovery. Figura 3 Endeca Information Discovery Instalacin Imagen 1
En primera instancia, se debe descargar el software correspondiente. Para ello se debe acceder a la siguiente direccin https://edelivery.oracle.com e iniciar sesin, aceptando todo los trminos y restricciones. Luego del inicio de sesin, en la siguiente pantalla, se deben elegir e paquete producto a descargar y la plataforma a la cual se va a instalar. En este caso se debe elegir Oracle Endeca. Figura 4 Endeca Information Discovery Instalacin Imagen 2
Al pulsar click en el botn ir se debe desplegar una lista con los paquetes que se pueden descargar para Oracle endeca. Descargar los que indica la gua de instalacin de Oracle endeca. (http://docs.oracle.com/cd/E40518_01/general.310/eid_getting_started/toc.htm#Setting%20up% 20the%20orchestration%20script%20directories) Luego de tener todos los archivos descargados segn la gua de instalacin de Oracle endeca, se deben descomprimir y crear la carpeta eidOrch con los archivos como se muestra en la imagen y siguiendo el tutorial de instalacin de Oracle endeca server with webLogic (http://docs.oracle.com/cd/E40521_01/server.761/ServerInstallGuide.pdf): Figura 5 Endeca Information Discovery Instalacin Imagen 3
Dentro de la carpeta installers colocar los archivos como muestra la imagen: Figura 6 Endeca Information Discovery Instalacin Imagen 4
De igual forma la carpeta orchScripts como muestra la imagen: Figura 7 Endeca Information Discovery Instalacin Imagen 5
La carpeta eidOrch debe ser colocada dentro de una carpeta llama Oracle en el directorio raz. Ejemplo: C:\Oracle si dicha carpeta no existe, se debe crear manualmente. Habiendo hecho esto, se debe regresar a la pgina de Oracle, en la seccin de descargas, buscar la Sun JDK he instalarla. La versin que debe descargarse es la jdk1.6.0_43. Luego de terminada la descarga se debe instalar cambiando la ruta de instalacin de C:\Program Files\java\jdk1.6.0_43 a C:\ jdk1.6.0_43. Esta parte importante porque ms adelante durante la instalacin y configuracin del Orchestration script el buscara la mquina virtual en dicha direccin, cabe resaltar que dicha ruta puede ser modificada en las propiedades del orchestration.
Figura 8 Endeca Information Discovery Instalacin Imagen 6 Despus de terminada la instalacin de la JDK Copiar la Carpeta eidOrch en C:\Oracle. Si la carpeta Oracle no existe, entonces crearla. Una vez copiada la carpeta, navegar a la siguiente direccin C:\Oracle\eidOrch\orchScripts\ y editar el archivo config_EID_win.prop con las opciones como se muestra en la siguiente tabla: Tabla 2 Configuracin del archivo config_EID_win.prop PROPIEDAD DE CONFIGURACION DESCRIPCION VALOR POR DEFECTO START_MODE Configura el modo de inicio (DEV o PROD) del DEV servidor WebLogic USE_SSL Especifica si los componentes de Oracle endeca information Discovery utilizaran SSL para comunicacin segura.
Todos los componentes usan la misma configuracin SSL: o todos los componentes los usan o ninguno lo hace TRUE
Para esta implementacin bsica de ejemplo se colocara en FALSE JAVA_HOME Es la ruta absoluta de la instalacin de JDK Windwos: C:\jdk1.6.0_43 ORACLE_HOME Es la ruta absoluta del directorio middleware de Oracle donde se instalara el servidor WebLogic y el Oracle Endeca Information Discovery Windows: C:\Oracle\Middleware_Orch ORACLE_INV_PTR Esta propiedad es solo para instalaciones en linux /etc/oraInst.loc INSTALLER_LOCATION Ruta absoluta del directorio que contiene los archivos de instalacion C:\Oracle\eidOrch\Installers STOP_EID_PROCESSES Esta propiedad es solo para instalaciones en linux True ENDECA_SERVER_DOMAIN_NAME El nombre del servidor WebLogic para el Servidor Endeca Endeca server ENDECA_SERVER_PORT Es el puerto HTTP donde el servidor Endeca escucha las peticiones desde una comunicacin no segura (cuando no se est usando SSL) 7001 ENDECA_SERVER_SECURE_PORT Es el puerto HTTP donde el servidor Endeca escucha las peticiones desde una comunicacin segura (cuando se est usando SSL) 7002 ENDECA_STUDIO_DOMAIN_NAME Es el nombre del dominio del servidor WebLogic para el Studio Endeca_studio ENDECA_STUDIO_PORT Es el puerto HTTP donde el Endeca Studio escucha las peticiones desde una comunicacin no segura (cuando no se est usando SSL) 8101 ENDECA_STUDIO_SECURE_PORT Es el puerto HTTP donde el Endeca Studio escucha las peticiones desde una comunicacin segura (cuando se est usando SSL) 8102 ENDECA_PS_DOMAIN_NAME Es el nombre del dominio del servidor WebLogic para el servicio de aprovisionamiento (provisioning service) Endeca_provisioning ENDECA_PS_PORT Es el puerto HTTP donde el Servidor de aprovisionamiento escucha las peticiones desde una comunicacin no segura (cuando no se est usando SSL) 8201 ENDECA_PS_SECURE_PORT Es el puerto HTTP donde el servidor de aprovisionamiento escucha las peticiones desde una comunicacin segura (cuando se est usando SSL) 8202
Una vez terminada la edicin del archivo, ejecutar un Smbolo de Sistema en modo administrador, una vez abierto, navegar al directorio eidOrch\orchScripts . Figura 9 Endeca Information Discovery Instalacin Imagen 7 Una vez ubicado en el directorio, se debe ejecutar el siguiente comando: Run_EID_install.bat config_EID_windows.prop Al ejecutar el comando se deben instalar el Endeca Server, endeca Information Discovery y el servidor de aprovisionamiento. Durante dichas instalaciones se deben configurar los siguientes datos: Tabla 3 datos a configurar durante la instalacin MODULO DATO A INGRESAR Endeca Server WebLogic Server usuario administrador WebLogic Server contrasea administrador (y confirmacin) Endeca Server usuario administrador Endeca Server contrasea administrador (y confirmacin) Endeca Information Discovery Studio WebLogic Server nombre de usuario administrador WebLogic Server contrasea administrador (y confirmacin) Provisioning Service WebLogic Server nombre de usuario administrador WebLogic Server contrasea administrador (y confirmacin) Endeca Server Hostname (modificar si y solo si se tiene un host diferente, de lo contrario dejar el que viene por defecto)
Figura 10 Endeca Information Discovery Instalacin Imagen 8
Terminadas las instalaciones y configuraciones, se debe abrir el navegador Mozilla, en la barra de direcciones escribir http://hostname:port/eid-ps/status donde el hostname es el nombre del host o la direccin de IP de la maquina donde se encuentra instalado Oracle Endeca Infomation Discovery y el puerto es del servicio de aprovisionamiento (Provisioning service). En este caso la direccin seria: http://localhost:8201/eid-ps/status. Si todos los servidores estn ejecutndose de forma correcta se ver como en la Figura 26, de lo contrario aparecer un mensaje de error: Error: check logs.
Figura 11 Endeca Information Discovery Instalacin Imagen 8 Ahora para verificar que el endeca Studio ha sido depurado, se debe escribir en la barra de direcciones lo siguiente: http://hostname:port/eid donde el hostname es el nombre del host de la maquina o su direccin IP y el puerto es el puerto del Endeca Studio, por lo que para este ejemplo la direccin debe ser la siguiente: Http://localhost:8101/eid, se debe desplegar la ventana de inicio de sesin de Oracle endeca information Discovery Studio.
Figura 12 Endeca Information Discovery Instalacin Imagen 9 Una vez en la ventana de inicio de sesin del endeca Studio, se debe configurar la conexin entre l y el servidor de aprovisionamiento (Provisioning Service), para iniciar la sesin se deben ingresar los siguientes datos.
Tabla 4 datos de inicio de sesin Oracle Endeca Information Discovery Studio Campo Valor Usuario: admin@oracle.com Contrasea: Welcome123 Inmediatamente inicie la sesin pedir que por favor con figure una nueva contrasea, esta debe contener al menos 6 caracteres y por lo menos 1 carcter numrico. En la ventana siguiente hay que dirigirse a panel de control y abrirlo para ver las opciones de configuracin donde se configurara la conexin entre endeca Studio y el servicio de aprovisionamiento.
Figura 13 Endeca Information Discovery Instalacin Imagen 10
En la ventana de Panel de control hay que dirigirse al apartado donde dice provisioning service y editar el archivo JSON con los datos del servidor de aprovisionamiento previamente instalado (Ver Figura 29):
Figura 14 Endeca Information Discovery Instalacin Imagen 11 El siguiente paso es instalar el Oracle Information Discovery Integrator, para ello y en primera instancia, se debe descargar los archivos necesarios para llevar a cabo la instalacin, la descarga se encuentra en la siguiente url: https://edelivery.oracle.com. En este punto, se debe hacer iniciar sesin con una cuenta Oracle. En caso de no tenerla se puede crear una en pocos pasos. Luego de iniciar sesin, elegir el paquete producto (Oracle Endeca), la plataforma de instalacin (Windows) y pulsar click en ir, se debe elegir: Oracle Endeca Information Discovery Integrator ETL (3.1) Media Pack v1 for Microsoft Windows x64 (64-bit) luego click en continuar. Se despliega una nueva lista en la cual se debe descargar el archivo: Oracle Endeca Information Discovery Integrator ETL (3.1) Media Pack v1 for Microsoft Windows x64 (64-bit) al terminar la descarga, debe quedar un archivo con el siguiente nombre: EID_IETL31_Win.zip Adicionalmente, se deben descargar el Eclipse ndigo y Patch RSE-3.2.2 de eclipse, los cuales se pueden descargar del sitio oficial del fabricante: http://eclipse.org Luego de tener todos los archivos descargados, se tomaran los archivos eclipse.zip y RSE.2.2 se deben copiar a la carpeta raz (C:/)
Figura 15 Endeca Information Discovery Instalacin Imagen 12 Descomprimir EID_IETL31_Win.zip, se obtendrn 4 archivos: EID_3.1.1_IntegratorETL.zip, EID_3.1.1_IntegratorETL_server_tomcat.zip, EID_3.1.1_IntegratorETL_server_weblogic.zip y EID_3.1.1_OTL.zip. Habiendo hecho esto, descomprimir el archivo EID_3.1.1_IntegratorETL.zip. Aparecer una carpeta con el nombre igual al archivo zip. Que contiene dos archivos, una carpeta llamada IntegratorETL y un archivo llamado install.bat. Se debe ejecutar el archivo install.bat.
Figura 16 Endeca Information Discovery Instalacin Imagen 13 Al ejecutado, el instalador preguntara si se desea utilizar el directorio por defecto de instalacin para el integrador o en su defecto se desea cambiar el directorio. Para efectos de este ejemplo se dejara el directorio por defecto, seguidamente se debe escribir la ruta completa del eclipse y el RSE.
Figura 17 Endeca Information Discovery Instalacin Imagen 14
Luego de terminar la instalacin ya es posible empezar con Oracle Endeca Integrator. Crear proyectos que enlazan a fuentes de datos para ser analizadas posteriormente desde Oracle endeca Studio.
Figura 18 Endeca Information Discovery Instalacin Imagen 15