David Cervign Luna Microsoft IT Pro Evangelist davidce@microsoft.com http://blogs.technet.com/davidcervigon
Agenda Introduccin Arquitectura de MSCS Administracin de MSCS Ejemplo prctico: Exchange 2003 en Cluster Solucin de problemas en MSCS DEMOS Introduccin Escalabilidad y Alta Disponibilidad Ambas dirigidas a garantizar los niveles de servicio (SLAs) Escalabilidad Garantizar el servicio ante incrementos sustanciales en la demanda de los mismos. Facilitar la rpida implementacin de nuevos servicios sobre infraestructura existente. Alta Disponibilidad Tolerancia a fallos (hw/sw) Desastres (naturales, accidentes, etc.) Facilitar las operaciones de mantenimiento (backup, Actualizaciones de sw/hw, logsticas, etc.) Usos de Microsoft Cluster Server Servidores conectados a sistemas de almacenamiento compartidos que son capaces de asumir de forma inmediata la carga de trabajo de otro en caso de fallo Los escenarios ms utilizados son aquellos en los que se quiere: Obtener tolerancia a fallos en servicios que almacenan informacin importante en disco y/o registro Aplicaciones que deban mantener el estado entre peticiones sucesivas. Ideal para servicios back-end. Bases de datos: SQL, Oracle, etc. Buzones de correo (Exchange 2000 2003) Aplicaciones LOB (SAP, etc.) Ficheros e Impresoras DHCP y/o WINS Virtual Server Antes de instalar un Cluster Server Software Windows Server 2003 Enterprise Edition o DataCenter Edition en todos los nodos Resolucin de nombres (DNS, WINS) Miembros de un dominio Cuentas de servicio miembros del domino Derechos de Administrador local NO derechos de Administrador del dominio Ojo con los cambios de contrasea Hardware HCL Hardware idntico en todos los nodos participantes Red Al menos dos interfaces de red Direccionamiento IP esttico Almacenamiento compartido SCSI o Fiber Channel (HCL) NTFS, >500MB Tolerancia a fallos de Cluster Server Virtual Server Address Active Server Passive Server Server Cluster Cluster Storage Devices Active Server Escalabilidad: Hasta 8 nodos Servidores Virtuales Una mquina real de cara a los clientes Representada por: Una o varias IPs Nombre de red Otros recursos y servicios o Discos o DHCP, WINS o BBDD (SQL, buzones Exchange) o Ficheros y/o impresoras o Etc. El servidor virtual vive en algunos de los nodos reales (fsicos) que conforman el cluster Un Cluster puede albergar mas de un servidor virtual Arquitectura Arquitectura y Componentes Cluster Service
Node Manager Checkpoint Manager Global Update Manager Database Manager Log Manager Failover Manager Backup/Restore Manager Event Log Replication Manager Resource Monitors Windows File System Windows Registry Resource DLLs Membership Manager Arquitectura: Database Manager Propsito Mantiene la base de datos de configuracin del cluster Maneja la informacin acerca de todas las entidades fsicas y lgicas del cluster Coopera con otras instancias del Database Manager presentes en el cluster Interaccin con otros componentes Ofrece servicios al Failover Manager y al Node Manager Los cambios se escriben el en registro y en el recurso del quorum Los cambios son replicados por el Global Update Manager Implementa APIs usadas por las DLLs de recursos Propsito Se ejecuta en cada nodo Mantiene una lista local con todos los nodos presentes en el cluster Enva los mensajes de heartbeat para detectar fallos en otros nodos (UDP 3345). Agrega nuevos nodos y expulsa nodos existentes Tras detectar un fallo en un nodo: Enva un mensaje para que se inicie un regroup event El servicio de cluster evita las operaciones de escritura en disco hasta que el estado de la pertenencia al cluster de los miembros se estabiliza Mueve los grupos de recursos del nodo que ha fallado a un nodo activo Arquitectura: Node Manager Propsito Arranca y para recursos Gestiona las dependencias entre recursos Determina que nodos poseen que recursos Failover y Failback Suceden por causa de un fallo, pero tambin se pueden iniciar manualmente Los grupos de recursos se mueven a un nodo disponible La recuperacin de una situacin de fallo requiere estabilizar el estado de los recursos del nodo que han fallado Los nodos negocian la propiedad de los recursos a recuperar El proceso de Failback puede transferir la propiedad de los grupos al nodo una vez recuperado, si as se especifica en la configuracin del grupo. Arquitectura: Failover Manager Checkpoint Manager Verifica las entradas del registro cuando un recurso se pone online. Escribe datos de checkpoint en el quorum cuando un recurso se pone offline Replica informacin del registro especfica de la aplicacin Log Manager Interacta con el Checkpoint Manager para asegurar que el recurso del quorum tiene la informacin actualizada. Permite que los cambios de configuracin se lleven a cabo incluso si algunos de los nodos estn cados Los nodos recuperados pueden actualizar su informacin obsoleta desde el recurso del quorum Arquitectura: Checkpoint y Log Manager Global Update Manager Replica los cambios en la base de datos del cluster a todos los nodos que lo forman Backup/Restore Manager Ofrece la funcionalidad para hacer backup y restaurar la base de datos del cluster Opera junto con el Failover Manager y el Database Manager Eventlog Replication Manager Replica los visores de sucesos locales a toso los nodos del cluster Membership Manager Mantiene una vista consistente del estado de todos los nodos del cluster Arquitectura: Otros Managers Usados por MSCS para manejar los recursos clusterizados. Ponen los recursos online Gestiona las interacciones con otros recursos Monitorizan la salud de los recursos DLLs de recursos disponibles para: Recursos comunes (discos, carpetas compartidas, etc.) Aplicaciones Cluster-aware Aplicaciones genricas no cluster-aware Los procesos del Resource Monitor hacen hosting de las DLLs de recursos Se ejecutan separadamente del servicio de cluster Arquitectura: Monitores de Recursos y DLLs de Recursos Arquitectura: El recurso del Quorum Compartido por todos los nodos Ofrece una configuracin consistente del cluster Asegura que un recurso es manejado exclusivamente por un nico nodo Quorum log Mantiene la informacin de la configuracin del cluster Tipos de Quorum Standard. nica base de datos de configuracin almacenada en un disco de la cabina compartida (SCSI o Fibra) Majority Node-Set Se crea si no hay discos compartidos disponibles para almacenar el Quorum en el momento en que se crea el cluster. El Quorum log se copia en el disco de sistema de cada nodo. El recurso Majority Node-Set asegura la consistencia de la informacin replicndose a los quorums locales Un cambio se considera completo si se ha llevado a cabo en mas de la mitad de los nodos. Los nodos no pueden poseer recursos a menos que pertenezcan a esta mayora. Administracin Instalando un Cluster Server Paso Nodo 1 Nodo 2 Cabina Comentarios Configurar la red y la cuenta de dominio Encendido Encendido Apagada Apagar la cabina, encender los nodos Configurar los discos en Nodo 1 Encendido Apagado Encendida Apagar los nodos, encender la cabina, configurarla y arrancar el Nodo 1 Verificar los discos en Nodo 2 Apagado Encendido Encendida Apagar el Nodo 1 y encender el Nodo 2 Configurar Nodo 1 Encendido Apagado Encendida Apagar todos los nodos. Encender el Nodo 1 Configurar Nodo 2 Encendido Encendido Encendida Encender el Nodo 2 Configuracin de los servicios Encendido Encendido Encendida Probar que todo funciona como se espera Componentes de MSCS Cluster Service (Clussvc.exe) C:\Windows\Cluster Cluster Database (ClusDB) C:\Windows\Cluster HKLM\Cluster Replicada en y a travs del Quorum Cluster Disk driver (Clusdisk.sys) HKLM\System\CurrentControlSet\Services\Clusdisk Parameters\Signatures Parameters\AvailableDisks Cluster Network Driver (Clusnet.sys) HKLM\System\CurrentControlSet\Services\ClusNet Resource monitor y DLLs de recursos (resrcmon.exe) C:\Windows\Cluster Creacin de Grupos y Recursos Cada grupo suele estar asociado al menos a un disco fsico. No poner diferentes servidores virtuales en el mismo grupo. Se puede hacer manualmente o por la instalacin de un servicio cluster-aware Decidir los parmetros de cada recursos. Ejecutar en un monitor de recursos independiente Dependencias entre recursos. Un nombre de una IP Un share de un nombre, de una IP y de un disco Si un fallo individual afecta o no al grupo Umbral y periodo: Cuantas veces y en cuento tiempo se intentar recuperar el recurso Chequeo de salud del recurso LooksAlive IsAlive
DEMO: DHCP en Cluster Ejemplo prctico: Exchange Server 2003 Requerimientos: Windows 2000 (SP3 + 329938 o SP4) Advanced Server: 2 nodos Activo/Pasivo 2 nodos Activo/Activo Datacenter Server: 2 nodos Activo/Activo Hasta 4 nodos en Activo/Pasivo Windows Server 2003 (Enterprise o Datacenter) 2 nodos en Activo/Activo Hasta 8 nodos en Activo/Pasivo RECOMENDACIN: Activo/Pasivo es el mejor modelo Limite: N-1 nodos activos siendo N el numero de nodos En un modelo Activo/Activo (n de EVS > n nodos) Menos de 1900 conexiones MAPI concurrentes CPU < 40%
Dependencias entre los recursos Cuanto ms plana, failovers ms rpidos System Attendant Information Store Routing Engine MTA IMAP4 POP3 HTTP SMTP MS Search System Attendant Information Store Routing Engine MTA IMAP4 POP3 HTTP SMTP MS Search Exchange 2000 Exchange 2003 7+1 4+4 6+2 Modelos Activo/Pasivo con 8 nodos Permisos de la cuenta de servicio de Cluster Exchange 2000
Exchange 2003 Administrador Local en cada nodo Administrador (en la organizacin si es el primero, o en el Grupo Administrativo) Admimistrador local en cada nodo No requiere permisos en la organizacin de Exchange Cmo crear un Exchange 2003 Virtual Server en cluster Instalar los nodos y configurar el servicio de cluster Instalar MSDTC en cada nodo del cluster. Instalar Exchange Server 2003 en cada nodo del cluster La instalacin es cluster-aware Copia binarios y registra DLLs de recursos especficas de Exchange Crear el EVS: En un grupo separado Uno o varios discos compartidos (segn modelo del almacenamiento) Al menos una IP Un Nombre de Red Un recurso de Exchange System Attendant En Exchange Server 2003, generara los dems recursos necesarios Eliminar el EVS: Quitar Servidor Virtual de Exchange en: El recurso Exchange System Attendant Diseo del Almacenamiento en el EVS 4 grupos de almacenamiento como mximo por EVS y Nodo (ojo en configuraciones Activo/Activo) 5 bases de datos por grupo de almacenamiento Separar bases de datos y logs en diferentes discos para cada EVS El nmero mximo de unidades de Windows Server 2003 es 24 Solo se soportan 23 discos compartidos Pueden usarse Volume Mount Points Que sean nicos para evitar conflictos con otros discos en el nodo o en el cluster No crearlos entre discos compartidos y discos locales ni con el Quorum No crearlos entre discos pertenecientes a diferentes grupos Establecer correctamente las dependencias entre los discos Diseo Front-End / Back-End Designar los servidores de Front-End Crear los servidores virtuales HTTP en el Administrador del Sistema (Exchange) Balancearlos con NLB, si es necesario Agregar servidores virtuales HTTP en el EVS del cluster que correspondan a los de los frontales Agregando servidores virtuales HTTP Agregando Directorios virtuales Mucha ms informacin en: http://www.microsoft.com/technet/prodtechnol/exchange/2003/library/febetop.mspx DEMO: Exchange 2003 en Cluster Solucin de Problemas en MSCS Herramientas Visor de Sucesos Cluster Log En C:\WINDOWS\CLUSTER ClusterLogLevel=2 por defecto Entradas para cada componente. http://support.microsoft.com/kb/168801/en-us http://support.microsoft.com/kb/286052/en-us Cluster Diagnostics and Verification Tool (ClusDiag.exe) http://www.microsoft.com/downloads/details.aspx?FamilyID=b898f5 87-88c3-4602-84de-b9bc63f02825&DisplayLang=en Cluster MPSReports http://www.microsoft.com/downloads/details.aspx?FamilyId=CEBF3 C7C-7CA5-408F-88B7-F9C79B7306C0&displaylang=en
Sustitucin de Discos compartidos Windows 2000 Dumpcfg.exe para cambiar la firma del disco http://support.microsoft.com/?id=243195 Windows Server 2003 ConfDisk.exe sustituye a DumpCfg.exe ClusterRecovery.exe. Engloba a ConfDisk y Dumpcfg http://support.microsoft.com/kb/305793/en-us http://www.microsoft.com/downloads/details.aspx?familyid=2BE7E BF0-A408-4232-9353-64AAFD65306D&displaylang=en Incluidas en el Kit de Recursos Algunos problemas ms frecuentes How to enable User Mode Hang Detection on a server cluster in Windows Server 2003 and in Windows 2000 Server SP4 http://support.microsoft.com/default.aspx?scid=kb;EN-US;815267 How to troubleshoot Cluster Service Startup Issues http://support.microsoft.com/kb/266274 How to troubleshoot event ID 9, event ID 11, and event ID 15 error messages http://support.microsoft.com/?kbid=154690 Cluster Network Name May Not Come Online with Event ID 1052 http://support.microsoft.com/kb/257903 Troubleshooting Multiple Cluster Symptoms on the Same SAN http://support.microsoft.com/kb/311081/en-us Troubleshooting Cluster Event ID 1068 http://support.microsoft.com/kb/306684/en-us
REFERENCIAS Server Clusters Guide to Creating and Configuring a Server Cluster under Windows Server 2003 White Paper Cluster Configuration Best Practices for Windows Server 2003 Best practices for securing server clusters Cluster support for DHCP servers Deploying Exchange Server 2003 in a Cluster Exchange Server 2003 Cluster Configuration Checklist Solucin de problemas en Cluster Server Ms Acciones desde TechNet Para ver los webcast grabados sobre ste tema y otros temas, dirjase a: http://www.microsoft.com/spain/technet/jornadas/webcasts/webcasts_ant.asp Para informacin y registro de Futuros Webcast de ste y otros temas dirjase a: http://www.microsoft.com/spain/technet/jornadas/webcasts/default.asp Para mantenerse informado sobre todos los Eventos, Seminarios y webcast suscrbase a nuestro boletn TechNet Flash en sta direccin: http://www.microsoft.com/spain/technet/boletines/default.mspx Para estar informado sobre novedades vea nuestros Its Showtime en: http://www.microsoft.com/spain/technet/itsshowtime/default.aspx Para acceder a toda la informacin, betas, actualizaciones, recursos, puede suscribirse a Nuestra Suscripcin TechNet en: http://www.microsoft.com/spain/technet/recursos/cd/default.mspx
PREGUNTAS? David Cervign Luna Microsoft IT Pro Evangelist davidce@microsoft.com http://blogs.technet.com/davidcervigon