Está en la página 1de 106

Machine Translated by Google

NuevoInicio RDS 5.0

Manual de usuario

Guangdong Zhongxing New Fulcrum Technology Co., Limitado.

Guangdong Zhongxing NewStart Technology Ltd.

Publicado: diciembre de 2018

Este manual es aplicable a la versión de la serie cluster rds5.x,


Machine Translated by Google

Tabla de contenido

Prefacio .................................................. .................................................................. ........................ .......................... .......................... 1

Contrato de Libro ......................... ....................... ........................... ........................... ....................... ..........1 Componentes del

Empaque Formal ................................ .... .................................................... .................................................... .... ...........1 Capítulo

1 Descripción general ............................... .. .................................................. ...... ............................................ .....2 Capítulo 2 Preparativos

previos a la instalación................................... ... .................................................... ..................................3 2.1 Vista previa rápida del

proceso de construcción del clúster ....... ......................... ......................... ............................. ..................... ............3 2.2 Lista de

requisitos de hardware (hardware de virtualización) .................. ........................... ....................... ..........3 2.3 Requisitos de

software... .................................. ..................... ............ .................................................... .... ..................3 2.4 Otros ajustes del

sistema y puertos de comunicación .................. ............................................................ ..................................4 2.5 Creación de

secuencias de comandos del clúster de servicios .......... ...................... ................................ .......................... ................................. ........5

Capítulo 3 Instalación y registro ................................ .... .................................................... .................................................... .... ..........6 3.1

Implementación del producto ........................... ..................... ............................. ......................... ......................... ........................6

3.2 Registro del producto ..... ................. ..................................... ............. ............................................. ......... .............7 3.3

Desinstalación del producto ....................... ......................... ......................... ............................. ..................... .......................... .8

Capítulo 4. Gestión de la configuración del clúster a través de cli....... ............................... ................... .......................................... 9 4.1

Planificación de la configuración del clúster (Tome 2+2 como

ejemplo)................................. .................................................... .... ..................................9 4.2 Configuración inicial de

RDS........ ........................................ .......... ............................................ ...... ..........................10 Capítulo 5. Configuración del clúster a

través de la Web .............. ........................................ .......... .....................................26 5.1 Inicio de sesión

web ......... ............................................. ..... .................................................. . .......................... 26 5.2 Configuración de inicialización

del clúster .................. .......................................................... ............... ................................32 5.3 Configuración de inicialización de

imagen.. .............................................. ........................................................ ............. ...........34 5.4 Configuración de inicialización

del servicio de clúster .................. ............................ ...................... ................................ .................. ...............36 5.5 Configuración

de la información de alarma (opcional) .................. ...... ............................................ ...........................................42 5.6 Arranque del

clúster... ............................... ................... ................... .................................................... .... ..................................44 5.7 Cambio de

servicio ......... ........................ .......................... ............................ ...................... .......................... .................45 Capítulo 6. Pruebas de

aceptación para conglomerados ........................................... ..... ............................................. ......... ................................46 Capítulo 7

Comandos interactivos del clúster .. .................................................................. ........................ .......................... ............................ ....47

7.1 Modificación de la configuración......... .................................. ................ ...................................... ............ .....................48 7.2

Gestión de nodos ......................... ........................................................ ............................................................ ..................................59

7.3 Gestión de servicios ............. .................................................................. ........................ .......................... .......61 7.4 Gestión de

recursos .................................................. ..................... ............................. ......................... ... ...........64 7.5 Supervisión de

clústeres ............................... .................................................................... ....................... ........................... ......67 7.6 Configuración

de la supervisión de alarmas SNMP (opcional) ............................... ............................................................... ..........70 7.7 Otros

comandos.. ........................................... .................................................................. ........................ .......................... ..73 Capítulo 8 Comandos no interactivos del clúster .

8.1 nshacluster................................................ .................................................... .........................75

8.2 nshamirror................................................ .................................................... ......................... 77

8.3 nshasrv................................................ ................ .................................. .......................................... ................. ........................78

8.4 nacciones................................................ .................................................... ...............................80

8.5 nshasnmp................................................ .................................................... ............................81 8.6


nshastart.................... .................................................... .................................................... .......82
Machine Translated by Google

8.7 nshastop.............................................. .. ............................................................. ... ...........82 8.8

nshastat............... ..................... ............................ ...................... .......................... .......... 83

8.9 nshaget................................................... .................................................... ..............................83

8.10 nshahide................................................ ................ .................................. .......................................... ................. ....................84

Capítulo 9 Alarmas de clúster y consulta.................................................. .......................... ................................. ............................... .................... .............86

9.1 Ídolo de alarma del clúster y descripción........................... ... ............................................................. ....... ................................86 9.2

Consulta de alarma ....... ............................................. ......... ............................................. ..... .................................................. . ...........87

Apéndices ....................................... ............................................................... .................. ................................ ...................... ......... 89 Apéndice

A: Especificaciones para escribir secuencias de comandos de control empresarial ......... ....................... ........................... .................................. ...89

1 Antes de empezar a crear guiones.................. ..................... ............................. ............................. 89 2 Referencia de

secuencias de comandos ..... .......................................................... ....... ............................................................. ... ...............89 3

Depuración manual de scripts ............... .................................................. ..................... ............................. ........................ ....91 4

Esquemas de secuencias de comandos .................................. ...... ............................................ ..........................................92

Apéndice B - Instrucciones para usar el Sistema de Registro en Línea del Clúster ................................ .............. ........................................ .......... ..95

Apéndice C—Resolución de problemas típicos y recuperación .................................. ............................................................... ..................................................

99 ÿ Fallo de muerte fingida del sistema .................................. ........................................................ ...............................................99

ÿ Servicio inestable fracaso .................................................. ..................................... ............. ..................99 ÿ Falla fuera de línea

del vínculo del cerebro dividido/del latido del clúster .................. ..................................... ............. ..................... 100 ÿ Fallas de

falla de arranque del clúster .................. ........................................................ ............ ................................101 Apéndice D—

Soporte técnico .................................. ................ ...................................... ............ .....................103


Machine Translated by Google

prefacio

convenciones de libros

1. Organización y convenciones de impresión

Formato significado

El comando ingresado está en negrita monoespaciada (Nueva canción Xiao Si)

El comando genera una fuente monoespaciada (New Song Xiao Si)

Anotación del comando (Nueva canción Xiao Si)


Cursiva negrita monoespaciada

2. Convenciones de símbolos de seguridad

Los siguientes símbolos de seguridad pueden aparecer en este manual, y sus significados son los siguientes:

símbolo de seguridad significado

Indica que se pueden producir daños en el equipo o lesiones personales si se ignoran las advertencias de seguridad.
Peligro
lesión grave por accidente

Indica que se pueden producir daños en el equipo o lesiones personales si se ignoran las advertencias de seguridad.
advertir
accidente de lesiones

Indica que si no se ignoran las advertencias de seguridad, se pueden producir daños en el equipo, pérdida de datos,
Aviso
Reducción del rendimiento del dispositivo y otras consecuencias impredecibles

Indica que el contenido es un recordatorio especial


insinuación

Información adicional indicando que el contenido es el cuerpo

ilustrar

Componentes del embalaje oficial

CD de cantidad

instalación de 1

componentes Introducción 1

del producto Manual de configuración 1

de instalación Tarjeta de acuerdo de licencia 1

1
Machine Translated by Google

Capítulo 1 Descripción general

El nombre completo de este producto: NewstartRemoteDisasterRecoverySoftware5.0 (abreviatura: RDS5.0) es una amplia

Los productos de la plataforma Linux desarrollados de forma independiente por Dongzhongxing New Fulcrum Technology Co., Ltd. usan "RDS" para abreviar.

Descripción del producto.

Este manual lo guiará para completar la construcción del entorno y lo presentará en detalle en un formato fácil de entender complementado con imágenes y textos.

Proceso de instalación y uso de NSHA.

Contenido del CD (o archivo iso)

archivo/directorio conf/ Descripción del contenido

doc/instalar kernels Funciones de script comunes para clúster y web

paquetes/herramientas/ Directorio de documentación, incluido el manual del usuario y el manual de instalación fácil, notas de la versión

instalar secuencia de comandos

paquete de kernel reflejado

El directorio donde se encuentra el paquete de clúster

algunos scripts de herramientas

desinstalar secuencia de comandos de desinstalación

actualizar web/ Script de actualización de componentes de clúster

modulo de gestion web

Si la versión del software en el CD del programa no es la última versión comercial, se recomienda que los usuarios la descarguen de nuestro sitio web en:
http://www.gd-linux.com

2
Machine Translated by Google

Capítulo 2 Preparación para la instalación

2.1 Vista previa rápida del proceso de construcción del clúster

1. Familiarizado con los conceptos relacionados y el entorno de instalación del software de clúster, determine la arquitectura y el esquema de configuración, consulte 2.2 a 2.4 para obtener más detalles.

descripción de la sección.

2. Instale software comercial (como un programa de base de datos Oracle) para garantizar que el entorno de software comercial del servidor sea consistente. 3. Instale el

software del clúster y obtenga el archivo de licencia Para obtener más información, consulte el "Capítulo 3 Instalación". 4. Configure el software del clúster, lo que se puede hacer

desde la línea de comandos o la interfaz web. 5. Escriba la secuencia de comandos del clúster del servicio y asegúrese de que la secuencia de comandos del clúster pueda

iniciar, detener y detectar el servicio normalmente mediante la depuración en una sola máquina. Para obtener más información, consulte la "Sección 2.5 Escritura de la secuencia

de comandos del clúster del servicio". ". 6. Inicie el software del clúster, verifique el estado de ejecución del clúster, realice el cambio de servicio manual y la prueba de

simulación de fallas, y confirme que el servicio puede realizar la conmutación por error automáticamente. Para obtener más detalles, consulte el "Capítulo 6".

2.2 Lista de requisitos de hardware (hardware de virtualización)

Lista de requisitos de hardware (hardware virtualizado) (la configuración de hardware del nodo es la

misma) Nodo del servidor cantidad Propósito

Para instalar el sistema operativo Linux, el espacio disponible de /


disco duro ÿ1
var debe reservarse al menos 1GB; 1. Enlace de servicio (gigabit

o más tarjeta de red) 2. Enlace espejo (gigabit o más tarjeta de

red, utilizada en la versión espejo, también se puede usar como


tarjeta de red ÿ2
enlace de latido) 3. Enlace de latido (dos, 100 M o más tarjetas de

red)

cambiar la ÿ1 Se utiliza para conectar la conexión de enlace de la tarjeta de red

matriz de discos 1 para almacenar datos compartidos (opcional)

2.3 Requisitos de software

Lista de soporte del sistema operativo: (si necesita brindar soporte para otros sistemas operativos o núcleos, debe comunicarse con nosotros)

2.6.32-220.77.1.el6.x86_64; 2.6.32-220.el6.x86_64; 2.6.32

-358.el6 .x86_64;2.6.32-431.el6.x86_64;2.6.32-504.el6.x86_64;2.6.32-573.el6.x86_64;2.6.32-642.13.1.el6.x86_64;2.6

.32-642 .el6.x86_64;2.6.32-696.el6.x86_64;

3
Machine Translated by Google

2.6.32-754.14.2.el6.x86_64;

2.6.32-754.2.1.el6.x86_64;

2.6.32-754.6.3.el6.x86_64;

2.6.32-754.9.1.el6.x86_64; 2.6.

32-754.el6.x86_64; 3.0.101-0.47.105-

predeterminado; 3.0.101-63-predeterminado;

3.0.76-0.11-predeterminado;

3.10.0-123.el7.x86_64; 3.10.0-229.1.

el7.x86_64;3.10.0-229.el7.x86_64;3.10.0-327.22.2.el7.10007601.x86_64;3.10.0-327.22.2.el7.x86_64;3.10.0-327.el7.x86_64;

3.10.0-514.10.3.el7.x86_64; 3.10.0-514.26.2.el7.x86_64; 3.10.0-514.6.1.el7.x86_64; 3.10.0-693.21.1.el7.x86_64; 3.10. 0-693.5.2.el7.x86_64; 3.10.0-693.el7.x86_

2.4 Otras configuraciones del sistema y puertos de comunicación

(1) Todas las instalaciones requieren autoridad de usuario raíz, y el shell utilizado por el usuario raíz debe ser bash, como

De lo contrario, modifique la cuenta raíz en /etc/passwd para configurarla.

(2) Establezca el nombre de host del sistema operativo de acuerdo con el plan del sistema. Los pasos de referencia de la

línea de comando se dan a continuación: #vi /etc/HOSTNAME #SuSE


#CGSL, Reddistribution #vi /etc/sysconfig/network
Hat, Red Bandera y otras distribuciones

(3) Asegúrese de que el sistema operativo no haya realizado ninguna operación de refuerzo de seguridad en directorios o archivos (si se ha reforzado,

desbloquéelo primero), de lo contrario, la instalación puede fallar.

(4)

(5) Los siguientes puertos deben abrirse durante la configuración y el funcionamiento del clúster:

Protocolo y descripción del uso del puerto

4
Machine Translated by Google

tcp, 20008 udp, 694 Sincronización de perfiles, etc.

tcp, 10001, 10003 Comunicación de tarjeta de red Heartbeat, este puerto no se puede ocupar, de lo contrario no se puede iniciar el clúster

Administración web, si no usa la web, este puerto puede cerrarse

tcp, 7788ÿ7795 Intervalo de puerto de sincronización predeterminado de sincronización de datos espejo

tcp, 10018 udp, 161 comunicación de procesos locales

udp, 162 puerto de consulta de servicio de alarma snmp, opcional

puerto de envío de servicio de alarma snmp, opcional

2.5 Escribir scripts de clúster para servicios

La secuencia de comandos del clúster del servicio especifica cómo iniciar, detener y detectar programas comerciales, lo cual está relacionado con /etc/init.d

La implementación de los scripts de servicio en el directorio es similar. Para estándares específicos, consulte el "Apéndice A - Reglas de scripting de clúster".

Fan", puede consultar las plantillas/ejemplos de script proporcionados en el directorio /etc/ha.d/resource.d para la escritura real

Escriba rápidamente scripts de servicio de máquina dual, como:

ÿ Las aplicaciones relacionadas con Java (como scripts weblogic, scripts tomcat) pueden hacer referencia a

tomcat_example.sh para escribir;

ÿ Se pueden escribir otras aplicaciones (detectadas al verificar el proceso) haciendo referencia a oracle_example.ps,

El script para combinar la base de datos y la aplicación se escribe con referencia a sybase_app.ps;

Se recomienda que los usuarios no modifiquen estos scripts directamente. Pueden copiar copias de estos scripts y modificarlos sobre la base de las copias.

cambio.

5
Machine Translated by Google

Capítulo 3 Instalación y registro

3.1 Implementación del producto

Coloque el CD de instalación en la unidad de CD-ROM del servidor y monte el CD en el subdirectorio /mnt:

# montar -o ro /dev/cdrom /mnt

Si es un archivo iso, cargue el archivo iso en el directorio /home/ del servidor en modo de transmisión binaria (bin),
Monte el archivo iso en el subdirectorio /mnt:

# montar -o loop /home/xxxx.iso /mnt

Ejecute el script de instalación para iniciar la instalación:

# /mnt/instalar

Bienvenido a usar el software Guangdong NewStart


Asistente de instalación/desinstalación universal de NewStart Cluster Nota:
<y,n,c> -- <sí,no,cancelar>
Correo electrónico de soporte: ha@gd-linux.com 1

Ingrese el SN del producto: ¡Su 44CF61-BA1JL8-22BD1R-50075E 2

SN es el SN del producto NewStart Remote Disaster Recovery Software !


Comprobando el estado del clúster... No corras
Instalando, espere unos minutos...
Instalando /mnt/packages/x86_64/redhat7/newstartha-5.0.1-20180118.x86_64.rpm...
Preparando... ################################ [100%]
Actualizando/instalando...
1:newstartha-5.0.1-20180118################################## ### [100%]
Inicie tserver OK.
[OK]

logrado 3
Haga /etc/ha.d/lic/newstartha.key
ha_kernel_dir: /mnt/kernels/3.10.0-693.5.2.el7.x86_64
Preparando... ############################# [100%]
1:drbd-utils-8.9.6-1 ########################### [ 33%]
2:drbd-proxy-2.0.0-1 ############################[ 67%]
3: drbd-km-3.10.0_693.5.2.el7.x86_64############################### [100% ]
[OK]

¿Desea instalar la herramienta administrativa basada en la Web del clúster [y,n](y)

[OK]

instalación de herramienta administrativa basada en web, implementación, espere...

ha_httpsserver instalado OK!

ha_nginx instalado OK!


6
Machine Translated by Google

ha_web instalado OK!

¡¡Atención!! Si usa la conexión https, necesita agregar dos certificados en su navegador:

/opt/NewStartHA/web/nginx/conf/mykey.p12 (NS predeterminado :HA@NewStart123_)

Configurar la herramienta administrativa basada en web automáticamente como un servicio del sistema...

[OK]

¡Recuerde cambiar la contraseña web predeterminada después de iniciar manualmente la herramienta de administración web!

El(los) componente(s) está(n) instalado(s) por completo, debe configurarlo antes de ejecutarlo.

ilustrar:

1. Buzón de soporte técnico. Si tiene alguna pregunta o problema durante el uso, puede enviar un correo electrónico a este buzón . 2.

Ingrese el número de serie, que se utilizará cuando el producto del clúster se registre más adelante . 3. El archivo clave tiene sido generado

Nota: Todos los servidores deben instalarse con el software del clúster por separado; de lo contrario, el

clúster no se puede configurar. 1. Al cargar un archivo iso al servidor, debe cargarse en modo binario (bin) y en modo texto (ASCII).

Hará que la instalación del software de clúster falle.

2. Todos los servidores deben instalarse con software de clúster por separado.

3.2 Registro del producto

3.2.1 Proceso general: obtenga el número de serie comercial/de prueba --> genere el archivo clave --> use el archivo clave para solicitar el

archivo de licencia --> cargue el archivo de licencia en el servidor correspondiente --> ejecute cli en la línea de comando o inicie sesión en la

web herramienta para confirmar si el registro tiene efecto.

Genere un archivo de clave; durante la implementación del producto, se le pedirá que ingrese el número de licencia del producto (que se puede encontrar en

la tarjeta "Acuerdo de licencia del nuevo producto Pivot" en la caja del producto) y el archivo de clave (newstartha.key) generado después de la implementación

se puede encontrar en / Encontrado en el directorio etc/ha.d/lic/, descargado al local con transmisión binaria (bin) y renombrado para una fácil identificación,

como newstartha_ip132.key, cada nodo en el clúster debe realizar los pasos anteriores. Solicite un archivo de licencia: Hay dos métodos de solicitud: aplicación

web (recomendado) y aplicación manual.

*) Solicitud en línea a través de la web; consulte el "Apéndice 1 - Instrucciones para usar el sistema de registro en línea de Newstart Cluster". *)

Solicitud manual; envíe un correo electrónico al correo electrónico de soporte técnico ha@gd-linux.com para realizar la solicitud, el correo electrónico

debe incluir lo siguiente información: Número de licencia del producto Nombre del artículo (para proyectos no nacionales, se debe agregar el país o

la región) Nombre del solicitante, correo electrónico laboral y número de contacto Todos los archivos clave (tenga en cuenta la distinción entre los

nombres de los archivos) Verifique la validez de la licencia; después obtener el archivo de licencia, cambie el nombre a newstartha.lic, y cada nodo

es newstartha. El contenido de lic es diferente. El archivo clave y el archivo de licencia deben estar en correspondencia uno a uno, y luego cargarse

en /etc. /ha.d/lic/ del servidor correspondiente en modo binario (bin). Finalmente, ejecute cli bajo el shell para verificar si la licencia es válida y se pasa

la verificación. Se mostrará el número de serie correcto y el Se mostrará el mensaje no válido "Archivos de licencia no válidos".

7
Machine Translated by Google

3.2.2 Prueba del producto: ejecute "nshacluster -product-switch rds" en la línea de comando
insinuación:

*) Este comando solo está disponible para sistemas operativos CGSL, el período de prueba es de solo 30 días

*) Si el clúster no se inicializa, cada nodo debe ejecutar este comando. La prueba es de 30 días. Cada entorno de clúster solo tiene

Puede probarlo una vez, si desea continuar con la prueba, debe contactarnos.

*) Número de serie de prueba RDS: 44CF61-BA1JL8-22BD1R-50075E

En este punto, la instalación del software está completa y, para usar el clúster, debe configurarse.

3.3 Desinstalación del producto

# mount -o ro /dev/cdrom /mnt monta el CD


o
# montar -o loop /home/xxxx.iso /mnt montar iso

Ejecute el script de desinstalación

# /mnt/desinstalar

# /mnt/desinstalar

Bienvenido a usar el software Guangdong NewStart

Asistente de instalación/desinstalación universal de NewStart Cluster Nota: <y,n,c>


-- <sí, no, cancelar>

Correo electrónico de soporte: ha@gd-linux.com

Desinstale newstartha-5.0.1-20180124.x86_64, ¿está seguro? [s/n](n)s


Comprobando el estado del clúster... No corras

Desinstalar el newstartha-5.0.1-20180124.x86_64 ...

[OK]

Desinstalar DRBD...

[OK]

Desinstalar administrador web...

[OK]

8
Machine Translated by Google

Capítulo 4 Gestión de configuración de clúster a través de CLI

La herramienta de configuración de administración de NewStart Cluster, cli, es una interfaz de línea de comandos. Aquí hay algunos consejos para usarla:

1. Haga doble clic en la tecla Tabulador o ejecute la ayuda para mostrar todos los comandos en el clúster.

2. Ejecute la ayuda <comando de clúster> para consultar la función del comando.

3. Use la tecla Tabulador para completar automáticamente la entrada de la línea de comando al igual que el shell bash.

4. Pulse el botón de flecha hacia arriba para mostrar el último comando utilizado.

5. Al ingresar un valor de atributo, si el atributo ya tiene un valor anterior o un valor predeterminado, puede presionar directamente la tecla Intro para optar por mantener el valor anterior sin cambios.

O utilice el valor predeterminado.

6. El cli verifica la validez de los valores de los atributos de entrada (nodo local o nodo remoto).Si la verificación es incorrecta, la entrada

Aparece un mensaje de error que le pide que vuelva a ingresar.

7. Ejecute el comando cluster-stat y presione "arriba" o "abajo" para seleccionar el servicio y presione Entrar para ver el estado de ejecución de todos los recursos del servicio.

En este caso, presione "a" para volver a la capa anterior.

8. Cuando ejecute el comando cluster-stat, presione Ctrl+C o "q" para volver a la cli. En el modo cli, presione Ctrl+C para salir de la cli.

4.1 Planificación de la configuración del clúster (Tome 2+2 como ejemplo)

Antes de la operación, planifique primero la configuración del clúster. El plan de configuración de este artículo es el siguiente:

nodo de modo RDS 2+2

de clúster Linux76, Linux77, Linux78, Linux79

192.168.8.76, 192.168.8.77, 192.168.8.78, 192.168.8.79


IP del nodo

enlace de latido
192.168.11.76, 192.168.11.77, 192.168.11.78, 192.168.11.79

192.168.12.76, 192.168.12.77, 192.168.12.78, 192.168.12.79

Esta región (linux76, linux77)


División de dominio de nodo

Diferentes regiones (linux78, linux79)

Enlace de trabajo: ens192


NIC de enlace
Enlace de latido: ens224, ens256

Enlace espejo: ens224, ens256

Recurso espejo (disco espejo) r0, r1

almacenamiento compartido /dev/vg01/lv01 (r0 para dominio local)

/dev/vg01/lv03 (r0 para regiones extranjeras)

Disco de arbitraje (opcional) /dev/vg02/lv02

Servicio de espejo Nombre del servicio: MRsrv (incluidos dos recursos de réplica r0, r1, gestiona la réplica como servicio)

recursos requeridos)

Nombre del servicio de servicio empresarial: ora_tom (una gestión de servicios dos aplicaciones: Oracle + tomcat)

Servicio IP flotante (máscara de subred) 192.168.8.62 (255.255.255.0)

Script de control /inicio/hamount1ÿ/inicio/hamount2

de servicio de punto de montaje /home/tomcat.shÿ/home/oracle.sh

9
Machine Translated by Google

4.2 Configuración inicial de RDS

Resumen de los comandos de inicialización (deben ejecutarse en el siguiente orden numérico de secuencia)

Comando de número Función descriptiva

1 de serie cluster- Configuración inicial del clúster, formato: cluster-init.


2 init mirror-init Configuración inicial de recursos espejo, formato: mirror-init.
3 inicio de servicio Configuración inicial del servicio, formato: service-init.

Sugerencia: El proceso de inicialización en cli es un proceso de operación interactivo. El valor entre corchetes "[]" en el indicador indica que puede ingresar

El valor entre paréntesis "()" indica el valor de entrada recomendado y el retorno de carro indica directamente el valor entre paréntesis.

4.2.1 inicio de clúster

Al ejecutar este comando, se generará un nuevo archivo de configuración del clúster y se perderá la configuración del clúster original. El proceso de inicialización es el siguiente:

(Ubicación del archivo de configuración: /etc/ha.d/ha.cf )


cli:~>cluster-init
======================================

Utilidad de inicialización de clúster


======================================

Esta utilidad configura la información de inicialización del clúster. Te pide


la siguiente información:

- Nombre de host

- Información sobre los canales de latidos del corazón

- Cuánto tiempo entre latidos - Cuánto

tiempo falla la declaración de latidos - Configuración

de vigilancia - Configuración de Worklink_hb -

Configuración de Kernel_panic - Políticas de datos

y servicios

1
Ingrese el nombre del clúster: [q] rds_cluster

Ingrese el nombre del primer nodo y la IP separados por espacios: [q] linux76
192.168.8.76 2
Ingrese el nombre del segundo nodo y la IP separados por espacios: [q] linux77
192.168.8.77
¿Desea continuar agregando nodos? [s/n] (s)

Ingrese el nombre del tercer nodo y la IP separados por espacios: [c,q] linux78
192.168.8.78
¿Desea continuar agregando nodos? [s/n] (s)

Ingrese el nombre del cuarto nodo y la IP separados por espacios: [c,q] linux79
192.168.8.79

10
Machine Translated by Google

¿Desea continuar agregando nodos? [s/n] (s) n Cuánto tiempo entre


3
latidos (en segundos): [q] (3)
4
Cuánto tiempo para declarar que se ha roto el latido del corazón (en segundos): [q] (100)
5
¿Quieres habilitar el perro guardián? [t/n] (n)
Agregar enlaces de latidos: Tipo de IP: 0ÿ
IPv4 1ÿIPv6

6
Seleccione un tipo: [0-1,q] (0)
NIC detectadas en el clúster: ens192 ens224 ens256 Introduzca un

dispositivo de red para latido de unidifusión: [q] (ens192) ens224 7 Introduzca la dirección

IPv4 de linux76 [q] (192.168.11.76)

Ingrese la dirección IPv4 de linux77 [q] (192.168.11.77)

Introduzca la dirección IPv4 de linux78 [q] (192.168.11.78)

Ingrese la dirección IPv4 de linux79 [q] (192.168.11.79)


8
¿Agregar otro enlace de ucast heartbeat? [s/n] (s)
Ingrese un dispositivo de red para el latido de unidifusión: [c,q] (ens192) ens256 Ingrese la
dirección IPv4 de linux76 [q] (192.168.12.76)
Ingrese la dirección IPv4 de linux77 [q] (192.168.12.77)
Introduzca la dirección IPv4 de linux78 [q] (192.168.12.78)
Ingrese la dirección IPv4 de linux79 [q] (192.168.12.79)
¿Agregar otro enlace de ucast heartbeat? [s/n] (s) n ¿Desea
9
habilitar worklink_hb? [s/n] (s) n ¿Desea habilitar auto_failover? [t/
10
n] (n)
Configure las políticas de datos y servicios:
0ÿla maximización de la seguridad de los datos 1ÿ

la maximización de la disponibilidad del servicio Seleccione:

[0-1,q] 0 11 ¿Desea habilitar kernel_panic? [t/n] (n)


12

13
¿Desea agregar un nodo de dominio? [s/n] y Seleccione
nodos para el 1.º nodo de dominio:
0ÿlinux76 1ÿ
linux77 2ÿ

linux78 3ÿ

linux79

Seleccione uno o más nodos separados por espacios: [0-3,q] 0 1 ¿Desea

continuar agregando el nodo de dominio? [s/n] (s)


Seleccione nodos para el segundo nodo de dominio: 0ÿlinux78
1ÿlinux79

Seleccione uno o más nodos separados por espacios: [0-3,q] 0 1 ¿Desea

continuar agregando el nodo de dominio? [t/n] (n)


14
¿Desea agregar un disco de bloqueo (recomendado)? [y/n] (n) y Ingrese el

nombre de la partición (/dev/sdc): [q] /dev/vg02/lv01 Advertencia: todos los datos en/

dev/vg02/lv01 se destruirán, ¿seguro que los formateará? [s/n] (s)

11
Machine Translated by Google

Verificación de la información del clúster:

nombre del clúster: rds_cluster

nodo: linux76 192.168.8.76


nodo: linux77 192.168.8.77
nodo: linux78 192.168.8.78
nodo: linux79 192.168.8.79 archivo

de registro: /var/log/ha-log
keepalive: 3 deadtime: 100
watchdog: off ucast: ens224

192.168.11.76 192.168.11.78
ucast: ens256 192.168.12.76 192.168.11.77
192.168.11.79
192.168.12.77
192.168.12.78 192.168.12.79

worklink_hb:
auto_failover: Apagado

auto_run: en
maximización: seguridad de datos
kernel_panic: off
lockdisk: /dev/vg02/lv01 nodo_dominio:
linux76 linux77 nodo_dominio: linux78 linux79

15
¿Es correcta esta información? [s/n, q] (s)
Ejecute mirror-init para inicializar su recurso espejo.

Instrucciones: 1. Personalice el

nombre del clúster. 2. Ingrese el nombre del nodo y la dirección IP. El nombre del nodo debe ser el mismo que uname -n (es decir, el nombre real de la máquina) y la dirección

IP debe ser la dirección IP física de la tarjeta de red (se recomienda la IP de la tarjeta de red heartbeat). configure varias direcciones IP para cada nodo, separadas por

espacios. 3. Intervalo de comunicación de latidos del grupo, rango de valores: 1~10, en segundos. 4. Juzgando el intervalo de tiempo muerto (también llamado tiempo muerto)

de otros nodos, es decir, cuánto tiempo lleva recibir paquetes de latidos de un nodo, el nodo se considera muerto, el rango de valores: 15 ~ 300, la unidad es segundos. Al

aplicar en escenarios de virtualización, se debe tener en cuenta que el tiempo de inactividad de la configuración del clúster debe ser menor que el tiempo de inicio del sistema

operativo de la máquina virtual (por ejemplo, la diferencia entre los dos es de 5 segundos) para evitar el impacto del sistema operativo. el tiempo de reinicio es demasiado corto.

5. Si desea habilitar la función Watchdog que viene con el clúster. Para obtener más información, consulte las precauciones a continuación. No está habilitada de forma

predeterminada. 6. Configure el enlace de latido, el tipo de latido aquí es latido de unidifusión (el tipo de latido está determinado por el tipo de clúster, el usuario puede operar

de acuerdo con el asistente interactivo, la operación es similar), soporte ipv4 o ipv6, preste atención a la nombres de tarjetas de red de todos los nodos en el clúster Debe ser

coherente, de lo contrario, habrá problemas. Al aplicar en un escenario de virtualización, preste atención: las dos NIC virtuales utilizadas como dos latidos deben corresponder

a diferentes NIC físicas para evitar una situación en la que una NIC física falle y todos los latidos del clúster se desconecten. 7. Ingrese el nombre de la tarjeta de red de latidos

y luego presione Entrar directamente para completar la configuración del primer enlace de latidos.

12
Machine Translated by Google

8. Si desea agregar otro enlace de latido, seleccione y aquí y repita las operaciones en 7 arriba.

9. Si habilitar el enlace NIC en funcionamiento como un enlace de latido de respaldo: cuando está habilitado, si la cantidad de enlaces de latido normales es inferior a dos,

Esta función surte efecto; si el enlace de latido fallido se recupera y el número de enlaces de latido normales es mayor o igual a dos, esta función se desactiva temporalmente.

Efectivo, el tipo de latido habilitado aquí es latido de multidifusión.Si el entorno de red donde se encuentra el clúster tiene restricciones en la transmisión de paquetes de multidifusión, no se establece.

Se recomienda habilitarlo, de lo contrario se recomienda habilitarlo.

10. Estrategia de cambio de servicio, n representa el cambio manual de fallas comerciales e y representa el cambio automático de fallas comerciales.

11. Seleccionar dos estrategias de procesamiento en el proceso de replicación síncrona de datos: maximizar la seguridad de los datos y maximizar el servicio continuo;

El primero enfatiza la seguridad de los datos, dando prioridad a garantizar la consistencia de los datos del usuario, y es adecuado para aplicaciones que requieren una consistencia de datos relativamente alta.

Se da prioridad a garantizar la disponibilidad de los servicios de los usuarios, lo que es adecuado para los usuarios que tienen altos requisitos de disponibilidad del servicio, pero no les preocupa la pérdida de algunos datos.

aplicaciones sensibles.

12. Si habilitar la función de pánico del kernel de Linux (pánico del kernel); para garantizar la seguridad de los datos, cuando el clúster es anormal, el

Por ejemplo, cuando el proceso secundario falla durante la operación o cuando el servicio no se detiene, se activa el pánico del kernel para reiniciar el servidor y el negocio del usuario.

Cambie a la máquina en espera.Dado que la parada del servicio está estrechamente relacionada con el script del clúster, se recomienda desactivar esta función en la etapa de depuración del clúster y la depuración se completa.

Luego habilite esta función y modifíquela con el comando cluster-modify.

13. Configure el dominio de nodos, aquí está la configuración de 2+2 (local + remoto), necesita configurar dos dominios de nodos, cada dominio está configurado con dos nodos

punto, no puede repetir la configuración.

14. Si desea agregar un disco de arbitraje, opcional, complete y aquí.

El disco de quórum es una solución para garantizar la seguridad de los datos cuando se interrumpen todos los latidos del clúster (cerebro dividido).

La matriz de discos se divide en una partición pequeña (más grande que 30 M), no se crea ningún sistema de archivos y los nodos del clúster leen y escriben esta partición al mismo tiempo.

Particionamiento, intercambio de información actual de los miembros, prevención de la ocurrencia de cerebros divididos y garantía de la seguridad de los datos. Se recomienda la configuración si las condiciones lo permiten.

15. Confirme si la información de configuración completada es correcta. Si es incorrecta, ingrese "n" para reiniciar. Si es correcta, ingrese

“y”ÿ

Aviso:

El mecanismo WatchDog se basa en el módulo softdog (comúnmente conocido como "soft dog") que viene con el sistema Linux.

up) o "crash" (choque) reiniciar automáticamente el sistema. Si el servidor está configurado con un perro guardián de hardware (es decir, "perro duro"),

Recomendamos deshabilitar perros suaves. Condiciones para que Watchdog reinicie el sistema:

1) El disco de quórum está configurado y el software de clúster está "suspendido" durante más de 60 segundos y no puede escribir en el disco de quórum;

2) No hay ningún disco de arbitraje configurado y el software de clúster está "suspendido" durante más de 60 segundos y no puede enviar paquetes de latidos.

En este punto, se completa la configuración de cluster-init. Si necesita modificar la configuración, puede usar el comando cluster-modify para modificarla.

4.2.2 inicio espejo

Al ejecutar este comando, se generará un nuevo archivo de configuración de recursos de imagen y se perderá la configuración de imagen original. El proceso de inicialización es el siguiente:

(Ubicación del archivo de configuración: /etc/drbd.d/xx.res)

cli:~> espejo-iniciar

======================================

Utilidad de inicialización de espejo


======================================

Le solicita la siguiente información:


-
Nombre del recurso espejo
- Nombre del dispositivo de disco espejo

- Dirección IP espejo
-
Tipo de sistema de archivos Entrada

13
Machine Translated by Google

1
nombre del recurso: [q] (r0)
2
Número de puerto de entrada: [1-65535,q] (7788)
3
Ingrese la dirección IP del espejo para linux76: [q] 192.168.11.76 192.168.12.76 Ingrese
4
un disco usado para almacenar datos en linux76: [q] /dev/vg01/lv01 Ingrese la dirección
IP del espejo para linux77: [q] 192.168.11.77 192.168. 12.77 Ingrese un disco usado
para almacenar datos en linux77: [q] /dev/vg01/lv01 Ingrese la dirección IP espejo para
linux78: [q] 192.168.11.78 192.168.12.78 Ingrese un disco usado para almacenar datos
en linux78: [q] / dev/vg01/lv03 Ingrese la dirección IP del espejo para linux79: [q]
192.168.11.79 192.168.12.79 Ingrese un disco usado para almacenar datos en linux79:
[q] /dev/vg01/lv03 Ingrese memlimit para proxy r0 [200M/G] : [q] (200M) seleccione
5
política de compresión de datos para proxy

0ÿbaja compresión 1ÿalta


compresión 2ÿsin
compresión
6
Seleccione un elemento: [0-2,q] 0
Verificación de información de recursos DRBD:

nombre: r0
dispositivo:/dev/drbd0

puerto: 7788 nodo:


linux76 disco: /dev/
vg01/lv01 Dirección IP:
192.168.11.76 Dirección IP:
192.168.12.76 nodo: nodo:linux77 disco: /
dev/vg01/lv01 Dirección IP: 192.168. 11.77 Dirección
IP: 192.168.12.77 nodo: nodo:linux78
disco: /dev/vg01/lv03 Dirección IP:
192.168.11.78 Dirección IP: 192.168.12.78
nodo: nodo:linux79 disco: /dev/vg01/lv03 Dirección
IP: 192.168. 11.79 Dirección IP:
192.168.12.79 proxy memlimit: 200M
proxy plugin: zlib ¿Esta información es
correcta? [y/n,q] (y)7 ¿Desea agregar otro recurso
espejo? [t/n] (n)8

14
Machine Translated by Google

Todos los datos de /dev/vg01/lv01 en el nodo linux76 serán destruidos. ¿Estás seguro de

9
continue? [y/n] (y)

Todos los datos de /dev/vg01/lv03 en el nodo linux78 serán destruidos. ¿Estás seguro de continuar? [s/n] (s)

Creando metadatos para el recurso r0...


Crear metadatos para el éxito del recurso r0
Esperando el inicio del espejo... inicio del éxito del espejo. 0ÿlinux76
1ÿlinux78

10
Elija la fuente de sincronización para el recurso r0: [0-1,q] 0

Esperando sincronización r0... r0 Porcentaje

resincronizado: 100.0 %

Qué tipo de sistema de archivos desea formatear /dev/drbd0(recurso espejo: r0) a:11

0) ext2 1)

ext3 2)

ext4 3)

xfs 4)

ninguno

Seleccione un tipo de sistema de archivos

[0, 4]:1 mke2fs 1.42.9 (28 de diciembre de 2013)

Etiqueta del sistema de archivos

= Tipo de sistema operativo:

Linux Tamaño de bloque = 4096 (registro = 2)

Tamaño del fragmento = 4096 (registro = 2)

Stride=0 bloques, Stripe width=0 bloques 131072


inodos, 524263 bloques 26213 bloques (5,00 %)

reservados para el superusuario Primer bloque de datos=0 Bloques


máximos del sistema de archivos=536870912 16 grupos de bloques

32768 bloques por grupo, 32768 fragmentos por grupo 8192 inodos

por grupo Copias de seguridad de superbloques almacenadas en

bloques: 32768, 98304, 163840, 229376, 294912 Asignación de tablas

de grupo: hecho Escritura de tablas de inodos: hecho Creación de diario

(8192 bloques): hecho Escritura de superbloques e información de


contabilidad del sistema de archivos: hecho Formatear

disco /dev/drbd0 para éxito ext3

configurar secundario todo exitoso


¡Mirror init éxito!

Ejecute service-init para inicializar sus servicios.

15
Machine Translated by Google

ilustrar:

1. Personalice el nombre del recurso de imagen para la identificación interna del clúster. 2.

Personalice el puerto de enlace espejo. 3. Ingrese la IP de la tarjeta de red física que el nodo

puede usar para la comunicación de enlace espejo.Se pueden configurar varias IP separadas por espacios. 4. Ingrese el nombre de la partición de almacenamiento

donde se almacenan los datos comerciales

5. Duplicar el tamaño de caché del proxy, el valor predeterminado es 200 M y el rango de valores es ilimitado. El valor apropiado se puede

determinar de acuerdo con el volumen de datos del servicio durante las horas pico. Estimación simple: valor de caché de proxy = (tasa de

volumen de datos del servicio M/s - banda ancha rate M/ s)* tiempo pico/segundo 6. Seleccione la tasa de compresión de los datos transmitidos,

dividida en tasa de compresión baja, tasa de compresión alta y sin compresión

Más equilibrado, adecuado para la configuración recomendada en la mayoría de los escenarios, la relación de compresión alta es

adecuada para escenarios con un gran retraso de red 7. Confirme si la configuración es correcta 8. Si desea agregar un segundo recurso

espejo, seleccione n aquí. 9. La partición de almacenamiento donde se almacenan los datos comerciales debe formatearse por primera vez.

Seleccione y aquí y presione Entrar . 10. Seleccione la fuente de sincronización de datos, donde se sincronizan los datos comerciales. Debe seleccionar el

nodo donde se los datos comerciales existen como la fuente de sincronización.Si no hay datos comerciales, la fuente de sincronización se selecciona primero según

sea necesario. 11. Formatee la partición espejo /dev/drbd0.

En este punto, se completa la configuración de mirror-init. Si necesita modificar la configuración, solo puede eliminar el espejo

antes de volver a configurarlo. Puede agregar o eliminar el comando mirror-adm.

4.2.3 inicio de servicio

En general, este comando solo se utiliza en la configuración inicial del servicio, si se ejecuta este comando, se perderá la configuración original.

El ejemplo de operación del comando es el siguiente: (El archivo de configuración es /etc/ha.d/haservices.xml en Linux) Nota: Antes de configurar

los recursos de IP para los servicios, debe configurar los recursos de la tarjeta de red.

cli:~>inicio-servicio
======================================

Utilidad de inicialización de servicios


======================================

Esta utilidad configura la información de inicialización del servicio en el

sistema HA

Le solicita la siguiente información:


- Servicio de información

- Información de recursos de aplicación - Información


de interfaz de red pública - Información de dirección IP

flotante.

Diagrama de inicialización del servicio 1

dieciséis
Machine Translated by Google

- Información de montaje de disco -

Información de disco sin procesar Nombre

del servicio de entrada: [q] ora_tom1 ¿Es un servicio


2
de múltiples instancias? [t/n, q] (n)
3
¿Está habilitado? [s/n, q] (s)
Seleccione los nodos para ejecutar el servicio:

0) linux76 1)

linux77 2)

linux78 3) linux79

4
Seleccione uno o más nodos separados por espacios: [0-3,q] 0 1 2 3 ¿Desea configurar los nodos
5
preferidos? [t/n, q] (n)
6
Tiempo de espera de inicio de entrada: [q] (240)
7
Tiempo de espera de parada de entrada: [q] (360)
8
Intervalo de verificación de entrada: [q] (30)
9
Tiempo de espera de verificación de entrada: [q] (60)
10
Número máximo de errores de entrada: [q] (1)
11
¿Reiniciar después de que falle el resultado de la verificación? [t/n, q] (n)
12
¿Iniciar el servicio de todos modos cuando existe una IP flotante? [t/n, q] (n)

Verificación de la información del servicio:

nombre: ora_tom

multinstance: no habilitado:

sí starttimeout: 240
stoptimeout: 360

checkinterval: 30

checktimeout: 60

número máximo de errores: 1

maxlockcount: 0

reiniciar después de verificar fallar: no

startanyway: sin lista de


nodos: linux76 linux77 linux78 linux79

lista de inicio automático: linux76 linux77 linux78 linux79

13
¿Es correcta esta información? [s/n, q] (s)

Descripción:

1. Personalice el nombre del servicio, que se utiliza para la identificación interna del

clúster, el llamado "servicio" es un grupo de recursos administrado por el software del clúster, que puede incluir programas comerciales, direcciones IP flotantes,

interfaces de red, almacenamiento dispositivos de bloque, puntos de montaje del sistema de archivos, etc. recurso. El nombre del servicio lo define el usuario y

generalmente está relacionado con el nombre comercial. Por ejemplo, el nombre del servicio de oracle puede ser "oracle", y el nombre del servicio de tomcat

puede ser "tomcat" 2. Ya sea para configurar el servicio de instancias múltiples, el servicio de instancias múltiples puede entenderse simplemente como la

misma aplicación comercial que se ejecuta en varias instancias al mismo tiempo.

17
Machine Translated by Google

Ejecutándose en cada nodo, que es compatible con la propia aplicación. 3.

Si debe ser administrado por el clúster, el valor predeterminado es sí, y presione Entrar directamente, si selecciona no, el clúster no se iniciará cuando se inicie el clúster.

Servicio móvil.

4. Seleccione el nodo que ejecuta el servicio, en resumen, seleccione las máquinas principales y de reserva que ejecutan el

servicio 5. El nodo de prioridad significa que cuando el sistema de clúster implemente automáticamente el servicio, dará prioridad a la ejecución en

este nodo. Si el nodo prioritario falla o se reinicia Después de volver a unirse al clúster, el servicio que se ejecuta en el nodo no prioritario se

revertirá al nodo prioritario. La diferencia entre el nodo prioritario y la prioridad de inicio del servicio es que el primero tiene una función de

reversión del servicio. ;

6. El tiempo máximo para iniciar el servicio, si la aplicación se inicia durante mucho tiempo, se puede aumentar adecuadamente, como 120

segundos, 7. El tiempo máximo para detener el servicio, si la aplicación se detiene durante mucho tiempo, se se puede aumentar adecuadamente,

como 180 segundos 8. Servicio de detección El intervalo de tiempo, es decir, cuánto tiempo para verificar el estado del servicio, el valor predeterminado

es 30 segundos Nota: si hay dependencias entre varios servicios, el intervalo de detección de estos los servicios deben ser consistentes 9. El

tiempo de espera del servicio de detección, es decir, cuánto tiempo para ejecutar el script. Si no se devuelve el tiempo, la detección falla, el valor predeterminado

60 segundos;

10. Ingrese el número máximo de errores y verifique cuántas veces comenzar a

cambiar 11. Si el clúster realiza un reinicio local cuando el servicio no se detecta regularmente, en caso afirmativo, primero detenga los

recursos del servicio y luego inicie el servicio en la máquina local, si el inicio falla, cambie al nodo de copia de seguridad, si no,

primero detenga los recursos del servicio y luego inicie el servicio en el nodo de copia de seguridad, 12. Si desea establecer la

opción de inicio de todos modos del servicio, el valor predeterminado es no, seleccione sí, no haga ping a la IP flotante al iniciar el

servicio, puede acelerar la velocidad de inicio del servicio, solo para probar, 13. Confirme si la información anterior es correcta,

seleccione sí (ingresar directamente) para ejecutar;

Añadir recursos para el servicio:14

Tipos de recursos:

0) NADA

1) propiedad intelectual

2) Aplicación

3) Montaje en disco

4) RawDisk b)

Volver al menú anterior

Seleccione un tipo de recurso: [0-4,b,q] 0 15

Para configurar el recurso NIC, se requiere la siguiente información:16

Nombre del recurso

Crítico

Habilitar

Tipo de NIC, incluidos uno y varios


Dispositivo

Una o más IP de host de red (IP de terceros)

17
¿Quieres continuar? [s/n] (s)
18
Ingrese el nombre de PubNIC: [q] (oracle_nic_0)
19
¿Es crítico el recurso? [s/n, q] (s)
20
¿Está habilitado el recurso? [s/n, q] (s)

Elija un tipo de NIC: 21 0) único 1) múltiple

18
Machine Translated by Google

Seleccione un tipo: [0-1,q] (0) 0


NIC detectadas en linux76: ens192 ens224 ens256 22
23
Introduzca un dispositivo de red: [q] (ens192)
24
¿Está utilizando la misma configuración en los nodos restantes? [s/n] (s)
25
¿Desea agregar una IP de host de red? [s/n] (s)

Introduzca la dirección IP: [c,q] 192.168.8.1 26 ¿Desea


27
agregar otra IP de host de red? [s/n] (s) n Verificación de información de
recursos de NIC:28

nombre: oracle_nic_0 crítico:

sí habilitar: sí networkhostip:

192.168.8.1 tipo: único

nombre de nodo: linux76 dispositivo:

ens192

nombre de nodo: dispositivo linux77: ens192

nombre de nodo: linux78 dispositivo: ens192

nombre de nodo: linux79 dispositivo: ens192


29
¿Es correcta esta información? [s/n, q] (s)
30
¿Agregar otro recurso NIC? [t/n] (n)
31
¿Desea agregar otro recurso? [s/n] (s) Diagrama de inicialización
del servicio 2

14. Comience a configurar los recursos relacionados del servicio, incluida la tarjeta de red comercial, la IP comercial y los servicios comerciales que necesita usar el servicio.

Aplicaciones, recursos de almacenamiento

compartido, etc., 15. Seleccione para agregar

recursos de la tarjeta de red, 16. Enumere las propiedades/información que

debe configurarse para los recursos de la tarjeta de red, 17. Pregunte si desea iniciar la configuración, seleccione y para bajar, seleccione n

para volver al paso anterior, aquí seleccione y 18. El nombre del recurso de la tarjeta de red, identificación interna, simplemente presione Entrar

19. Si desea establecer el recurso de la tarjeta de red como el recurso clave, la llamada clave El recurso es que todo el servicio se cambiará cuando

el recurso sea anormal, solo presione Entrar 20. Si es administrado por el clúster, el valor predeterminado es sí, y presione Entrar

directamente 21. Puede entenderse como la cantidad de enlaces comerciales utilizados para el servicio, si solo hay un enlace, seleccione único, si

hay varios, seleccione múltiples, solo hay un enlace comercial ens192, seleccione único;

22. Enumere los nombres de dispositivos de tarjetas de red

disponibles, 23. Seleccione el dispositivo ens192, 24. Si desea

sincronizar la configuración con otros nodos, seleccione y aquí, 25. Pregunte

si desea aumentar la IP del host existente en la red, se recomienda configurar, seleccione sí;

La función de esta configuración es detectar si la red del propio nodo es normal, el principio es que mientras alguno esté configurado

Si se puede hacer ping a la IP, significa que la red del nodo en sí es normal.Si no se puede hacer ping, significa que la

red es anormal;

PD: si el servicio debe usarse para almacenamiento en red (arreglo de discos iscsi), la IP aquí debe completar la IP del

servidor iscsi. Se recomienda agregar todas las IP en el servicio.

26. Ingrese la IP del host que existe en la red (admite dirección ipv4 o ipv6), esto será verificado y se reportará un error al ingresar una IP no

existente, se pueden configurar múltiples separados por espacios 27 Si desea agregar más hosts que existen en la red IP, uno ha sido

configurado aquí, seleccione No. 28. Indique la lista de información de configuración de recursos de la tarjeta de red;

19
Machine Translated by Google

29. Confirme si la información de configuración es correcta, seleccione y correctamente, de lo contrario, seleccione n para

reconfigurar el recurso 30. Si desea agregar otro recurso de tarjeta de red, que puede admitir más configuraciones,

seleccione no aquí 31. Pregunte si desea agregar otros recursos del servicio, aquí elija sí;

Tipos de recursos:
0) NADA
1) propiedad intelectual

2) Aplicación
3) Montaje en disco

4) RawDisk b)
Volver al menú anterior

Seleccione un tipo de recurso: [0-4,b,q] 1 32


33
Para configurar el recurso IP se requiere la siguiente información:

Nombre del recurso


Crítico
Habilitar

Una NIC con IP flotante adjunta


Una dirección IP

Máscara de red o prefijo

34
¿Quieres continuar? [s/n] (s)
35
Ingrese el nombre de IP: [q] (oracle_ip_0)
36
¿Es crítico el recurso? [s/n, q] (s)
37
¿Está habilitado el recurso? [s/n, q] (s)
Elija un tipo de IP: 0) IPv4 1) IPv6
Seleccione un
tipo: [0-1,q] (0) 0
38 NIC descubiertas en linux76:
ens192 ens224 ens256 39 Ingrese un dispositivo de red: [q] (ens192)
40

41
Dirección IP de entrada: [q]192.168.8.62
42
Máscara de red de entrada: [q] (255.255.255.0)
43
¿Está utilizando la misma configuración en los nodos restantes? [s/n] (s)
Verificación de información de recursos IP:

nombre: oracle_ip_0
crítico: sí habilitar: sí
nombre de nodo: linux76

PubNICResNombre: ens192

dirección IP: 192.168.8.62


máscara de red: 255.255.255.0
nombre de nodo: linux77
PubNICResNombre: ens192

20
Machine Translated by Google

dirección IP: 192.168.8.62


máscara de red: 255.255.255.0

nombre de nodo: linux78

PubNICResName: ens192 dirección

IP: 192.168.8.62 máscara de red:


255.255.255.0

nombre de nodo: linux79

PubNICResNombre: ens192

dirección IP: 192.168.8.62


máscara de red: 255.255.255.0

¿Es correcta esta información? [s/n, q] (s) 44

¿Agregar otro recurso IP? [t/n] (n) 45

¿Desea agregar otro recurso? [s/n] (s) Diagrama de inicialización 46


del servicio 3

32. Seleccione para agregar recursos de IP, principalmente para configurar la

IP empresarial 33. Enumere los atributos/información que debe configurarse

para los recursos de IP 34. Pregunte si desea iniciar la configuración, seleccione

35. sí para ejecutar Nombre del recurso de IP, identificación interna ,

simplemente presione Entrar Sí 36. Si está configurado como un recurso clave,

presione Entrar para seleccionar y 37. Si está administrado por el clúster, presione

Entrar para seleccionar y 38. Seleccione el tipo de IP flotante configurada, admite IPv4 e IPv6, y seleccione IPv4 aquí

39 .Enumere los dispositivos de tarjeta de red disponibles 40. Seleccione la tarjeta de red de enlace de servicio , aquí

seleccione ens19;

41. Ingrese la IP del servicio, que previamente está planificada como 192.168.8.62,

42. configure la máscara de subred de la IP del servicio;

43. Sincronizar la configuración con otros nodos;

44. Confirme si la información del recurso de IP configurado es correcta y seleccione y

correctamente 45. Si desea agregar otro recurso de IP comercial que pueda admitir más configuraciones, seleccione n

aquí 46. Pregunte si desea agregar otros recursos del servicio, seleccione y aquí ;

Tipos de recursos:

0) NADA

1) PI

2) Aplicación

3) Montaje en disco

4) RawDisk b)

Volver al menú anterior

Seleccione un tipo de recurso: [0-4,b,q] 2 47

Para configurar el recurso de la aplicación, se requiere la siguiente información:

Nombre del recurso

Crítico

Habilitar

Un guión de aplicación
Recuento de fallas en el tiempo de espera de verificación

21
Machine Translated by Google

48
¿Quieres continuar? [s/n] (s)
49
Introduzca el nombre de la aplicación: [q] (oracle_app_0)

Ingrese la secuencia de comandos de la aplicación: [q] (/etc/ha.d/resource.d/oracle) /


50
etc/ha.d/resource.d/myfaked.sh Ingrese el recuento de fallas en el tiempo de espera
51
de verificación: [q] ( 0)
52
¿Es crítico el recurso? [s/n, q] (s)
53
¿Está habilitado el recurso? [s/n, q] (s)

Verificación de la información de los recursos de la aplicación:

nombre: oracle_app_0 crítico:

sí habilitar: sí secuencia de

comandos: /home/script/

oracle.ps falla en los tiempos de espera


de verificación: 0

54
¿Es correcta esta información? [s/n, q] (s)
55
¿Añadir otro recurso de aplicación? [t/n] (n)

¿Desea agregar otro recurso? [s/n] (s) Diagrama de inicialización 56


del servicio 4

47. Elija aumentar los recursos de la aplicación, principalmente para configurar aplicaciones comerciales, aquí está Oracle;

48. Pregunte si desea iniciar la configuración, seleccione y y ejecútelo hacia abajo,

49. Aplique el nombre del recurso, identificación interna, solo presione Entrar, 50. Complete

la ruta completa del script del clúster. El denominado script de clúster es el script utilizado por el clúster para gestionar y controlar los servicios 51. Establezca

el número de veces que se agota el tiempo de espera de detección de recursos del servicio como procesamiento de errores, lo que activará el cambio de

servicio. 0 significa que no hay procesamiento de errores y el el valor predeterminado es 0. Al configurar el número de tiempos de espera de detección,

se recomienda usarlo con kernel_panic, es decir, para abrir kernel_panic, consulte la operación: modificación de clúster; PD: cuando el número de

tiempos de espera de detección se establece en mayor que 1, el valor del recuento máximo de errores de entrada previamente configurado debe

permanecer como predeterminado El valor es 1, es decir, los valores de los dos parámetros no se pueden modificar para que sean mayores que 1 al

mismo tiempo 52. Si está configurado como un recurso clave, presione Ingrese para seleccionar y 53. Si está administrado por el clúster, presione Entrar para

seleccionar y 54. Confirme si los recursos de la aplicación configurados son correctos, elija y correctamente 55. Si desea agregar otro recurso de la aplicación,

puede admitir más configuraciones 56. Pregunte si desea agregar otros recursos del servicio, elija y aquí ;

Tipos de recursos:

0) NADA

1) PI

2) Aplicación

3) Montaje en disco

4) RawDisk b)

Volver al menú anterior

Seleccione un tipo de recurso: [0-4,b,q] 4 57

Para configurar el recurso de montaje en disco, se requiere la siguiente información:

22
Machine Translated by Google

Nombre del recurso

Crítico

Habilitar

Tipo de montaje en disco, incluidos disco, NFS y LVM


Un dispositivo

un punto de montaje

NetStorage que solía determinar si el almacenamiento en red

Fstype (tipo de sistema de archivos)


Usuario

Grupo
Modo

Opciones

Cuota del dispositivo

stopWhenRO que se usa para determinar si se detiene el servicio, cuando el sistema de archivos es

de solo lectura

FsckOpt que solía determinar si usar fsck para reparar el sistema de archivos

58
¿Quieres continuar? [s/n] (s)
59
Introduzca el nombre del montaje en disco: [q] (oracle_dm_0)
60
¿Es crítico el recurso? [s/n, q] (s)
61
¿Está habilitado el recurso? [y/n,q] (y) 0)

disco 1) nfs 2) lvm- Almacenamiento


3)drbd compartido
——
NFS
elija un tipo de disco: [0-2,q] de dispositivo de

3 62 elija un disco bloque


espejo:ordinario - Volumen lógico

0) r0 /dev/drbd0 - Dispositivo espejo

seleccione un disco espejo: [0-0,q] 0 63

Introduzca el punto de montaje: [q] /db 64

Introduzca el tipo de sistema de archivos: [q] (ext3)

Usuario de entrada: [q] (raíz) oráculo

Grupo de entrada: [q] (raíz) oinstall Modo

de entrada: [q] (755)

Opciones de entrada: [q] (rw)


sesenta y cinco

Ingrese la cuota del dispositivo: [q] (90)


66
¿Desea detener el servicio cuando el disco es de solo lectura? [s/n, q] (s)
67
Cuando falla el montaje del sistema de archivos, ¿usar fsck para repararlo? [t/n, q] (n)
Verificación de información de recursos de Diskmount:

nombre: oracle_dm_0

crítico: sí habilitar: sí tipo:

drbd dispositivo: /dev/drbd0

punto de montaje: /db


fstype: ext3

23
Machine Translated by Google

usuario: oráculo

grupo: modo oinstall:


755

opciones: rw
limitación: 90

stopWhenRO: sí

FsckOpt: no

almacenamiento de red: no

68
¿Es correcta esta información? [s/n, q] (s)
69
¿Agregar otro recurso de montaje en disco? [t/n] (n)
70
¿Quieres añadir otro recurso? [s/n] (s) n
71
¿Quieres añadir otro servicio? [t/n] (n)

Ejecute cluster-start para iniciar el sistema HA, o ejecute cluster-restart para reiniciar el sistema HA.72 cli:~>

Diagrama de inicialización del servicio 5

57. Elija agregar recursos de almacenamiento DiskMount, el plan aquí es el dispositivo /dev/sdb2 58. Pregunte

si desea iniciar la configuración, seleccione y para ejecutar 59. Nombre del recurso de almacenamiento

compartido, identificación interna, simplemente presione Entrar 60. Si para configurar Establecer como un

recurso clave, presione Entrar para seleccionar y 61. Si está administrado por el clúster, presione Entrar para

seleccionar y Seleccione el tipo de almacenamiento, aquí está la imagen, seleccione drbd, otros tipos de
62.
almacenamiento se describen brevemente como de la siguiente manera: 0) disco: dispositivo de bloque

ordinario (p. ej., /dev/sda) 1) nfs: almacenamiento nfs (p. ej., 192.168.8.x:/nfsshare) 2) lvm: grupo de

volúmenes lógicos (p. ej., /dev/vg01/lv01) 3 ) drbd - dispositivo espejo (por ejemplo, /dev/drbd0)

Sugerencia: Para la versión rds, se agregará automáticamente un servicio espejo (nombre predeterminado: MRsrvx) cuando se agregue el

recurso de almacenamiento de tipo drbd, y el servicio actualmente configurado dependerá del servicio espejo, y también se eliminará

automáticamente cuando se se elimina el recurso. 63. Seleccione el dispositivo espejo drbd0 para configurar. 64. Introduzca el directorio de

montaje y su información relacionada:

punto de montaje punto de montaje del dispositivo (es decir, directorio Linux), dos nodos deben tener el mismo

punto de montaje, tipo de sistema de archivos fstype, usuario usuario operativo para montar el directorio, grupo
de usuarios operativos, permiso de modo para montar el directorio, opciones de montaje 65. Establezca el

porcentaje de uso del espacio del dispositivo. Si el porcentaje de uso excede este valor, el registro generará
información de alarma. Si detener el servicio cuando la partición de datos pasa a ser de solo lectura; aquí se

agrega que el almacenamiento de red (NetStorage) no admite esta propiedad; 67. Cuando el dispositivo no se
monta, si intentar usar fsck para repararlo; 68. Confirme la configuración Si el recurso DiskMount es correcto 69. Si debe
66.
agregar otro recurso DiskMount, que puede admitir múltiples configuraciones;

24
Machine Translated by Google

70. Preguntar si agregar otros recursos del servicio, seleccione n aquí 71.

Preguntar si agregar otro servicio. 72. La configuración del servicio se completa

y el clúster se inicia para que surta efecto.

En este punto, la configuración de inicialización de service-init se completa y la configuración de inicialización del clúster en la cli también se ha completado.

Inicie el clúster para que la configuración surta efecto.

4.2.4 Arranque del clúster

Después de inicializar y configurar el clúster, se puede iniciar el clúster. Aquí hay algunos puntos a

tener en cuenta: *) Para iniciar el clúster, ejecute el comando en cualquier nodo *) Los servicios

(grupos de recursos) administrados por el clúster se iniciarán automáticamente con el clúster *) Entre

servicios El método de inicio es serial (es decir, inicio por servicio), por defecto, de acuerdo con el orden de configuración

del servicio cli:~>cluster-start Archivo de configuración verificado ok.[linux77]Inicio de servicios de alta disponibilidad : Hecho.

.
[linux76] Iniciando servicios de alta disponibilidad: el archivo de
configuración se verificó correctamente.
Hecho.
.
[linux78] Iniciando servicios de alta disponibilidad: el archivo de
configuración se verificó correctamente.
Hecho.
.
[linux79] Iniciando servicios de alta disponibilidad: el archivo de
configuración se verificó correctamente.
Hecho.
.
CLI:~>

25
Machine Translated by Google

Capítulo 5. Configuración del clúster a través de la web

5.1 Iniciar sesión en la web

Ingrese webadminserver start en un nodo para iniciar la web

[root@linux26 lic]# inicio del servidor webadmin

Iniciando el servidor webadmin de NewstartHA......

Ingrese nuevamente al estado del webadminserver , corriendo indica que la web se inició exitosamente

[root@linux26 lic]# webadminserver status El servidor webadmin

de NewstartHA se está ejecutando...

Antes de iniciar sesión en la web , debe importar el certificado. La ruta del certificado es /opt/NewStartHA/web/nginx/conf/mykey.p12.

Navegadores recomendados: Chrome, Firefox, IE10 . Los pasos de la operación son los siguientes: 5.1 .1 Tome Google Chrome como

ejemplo: busque "Configuración— - Avanzado - Certificado de gestión"

5.1.2 Seleccione "Personal" y haga clic en "Importar"

26
Machine Translated by Google

5.1.3 Haga clic en "Siguiente"

5.1.4 Haga clic en "Examinar"

27
Machine Translated by Google

5.1.5 Busque la ruta del archivo del certificado descargado, seleccione "Todos los archivos" en el cuadro desplegable y busque el archivo del

certificado "mykey"

5.1.6 Haga clic en "Siguiente"

28
Machine Translated by Google

5.1.7 Introduzca la contraseña "HA@NewStart123_" y haga clic en "Siguiente"

5.1.8 Seleccione "Seleccionar automáticamente el almacenamiento de certificados según el tipo de certificado" y haga clic en "Siguiente"

29
Machine Translated by Google

5.1.9 Haga clic en "Finalizar"

5.1.10 Importar correctamente

30
Machine Translated by Google

5.1.11 Cierre el navegador, vuelva a abrir el navegador e ingrese los siguientes requisitos para ingresar a la interfaz de inicio de sesión web: https:// IP

física del nodo: 10003 como: https://192.168.1.19:10003, haga clic en "Continuar para ir "

5.1.12 Seleccione el certificado y haga clic en Aceptar

31
Machine Translated by Google

5.1.13 Ingrese a la interfaz de inicio de sesión, de la siguiente manera:

Nombre de usuario/contraseña predeterminados: "SuperAdmin/HA@newstart123_"

Nota:

cuando se produzca una excepción de acceso, compruebe el efecto del cortafuegos y si el puerto está ocupado.

5.2 Configuración de inicialización de clúster (Tome el tipo 2+2 como ejemplo para la configuración)

Configuración de parámetros de clúster

Nota:

32
Machine Translated by Google

Nombre del clúster: identificación interna, nombre de host

autodefinido: si el tipo es 2+1, habrá un nodo menos en el host del clúster y el dominio del nodo; disco de arbitraje: una

solución para garantizar la seguridad de los datos cuando se interrumpen todos los latidos, recomendado Uso, el disco de arbitraje bajo el dominio del nodo es similar y también es opcional;

Una vez completada la configuración, haga clic en Guardar y se le indicará que la modificación se realizó correctamente. No es necesario que reinicie el clúster para la primera configuración.

Después de que la configuración de los parámetros del clúster sea exitosa, saltará automáticamente a la página de monitoreo

Nota:

Configuración básica de parámetros: puede modificar la configuración de parámetros del clúster

33
Machine Translated by Google

Configuración del enlace Heartbeat

Nota:
Enlace de latido de NIC: admite IPv4 e IPv6, se recomienda configurar el latido del corazón de unidifusión y se recomienda configurar dos o más latidos del corazón

5.3 Configuración de inicialización de imagen

34
Machine Translated by Google

Nota:
Nombre del recurso: se puede personalizar, rx predeterminado (x:0,1,2,....) Dispositivo

de disco: el dispositivo de disco se refiere a la partición (también llamada partición de datos) que almacena datos comerciales. Si la partición de datos en el entorno tiene datos, no es

necesario completar el sistema de archivos; de lo contrario, se borrarán todos los datos comerciales. Fuente de sincronización: los datos comerciales se

sincronizan y el nodo con datos comerciales debe seleccionarse como fuente de sincronización. Si no hay datos comerciales, entonces

La fuente de sincronización se selecciona primero según sea necesario.

La partición de datos debe formatearse por primera vez, aquí está sí

Nota:
El disco espejo se está sincronizando

Recurso espejo agregado con éxito

35
Machine Translated by Google

5.4 Configuración de inicialización del servicio de clúster

Agregar parámetros de servicio

36
Machine Translated by Google

Nota:
Nombre del servicio: Se identifica dentro del clúster y se define por sí

mismo. Tipo de servicio: el tipo común hace referencia a los servicios comerciales (como Oracle, Tomcat, etc.) Nodo

de dominio: el nombre del nodo en el clúster, es decir, el nombre del host. Orden de inicio de nodos de dominio: el

orden de inicio de los nodos en el clúster. Nodo de prioridad: principalmente se refleja que cuando se recupera la

falla, el servicio volverá al nodo de prioridad. Número máximo de errores: cuántas veces comenzar a cambiar cuando se

detecta un error.

Agregar configuración de parámetros de servicio con éxito

37
Machine Translated by Google

Nota:
Parámetros de atributos de servicio: se pueden modificar y

eliminar Recursos de servicio de servicio: PubNIC, IP, DiskMount, APP

Configuración de recursos de servicio, se pueden agregar múltiples recursos

Configuración de NIC

Nota:
Nombre del recurso de la tarjeta de red pública: personalizado, el valor predeterminado es el nombre del servicio _nic_x

(x:0,1,2,....) IP de host de terceros: se refiere a la IP válida existente en la red, utilizada para detectar si el propio la red es normal; Nombre del

dispositivo: se refiere a la tarjeta de red de servicio que agrega recursos NIC correctamente

38
Machine Translated by Google

Nota:
Recurso de NIC público: puede agregar varios recursos de NIC

Acción: puede modificar y eliminar la configuración de recursos de NIC

configuración IP

Nota:
Tipo de IP: compatible con IPv4 e IPv6 Tarjeta de

red pública Nombre del recurso: para que sea coherente con la tarjeta de red del recurso configurado

NIC Dirección IP flotante: debe ser una dirección a la que se pueda hacer ping

Agregar IP de recurso con éxito

Nota:
39
Machine Translated by Google

Recurso de IP: puede agregar varios recursos de IP

Operación: puede modificar y eliminar la configuración de recursos de IP

Configuración de montaje en disco

Nota:

Formato de archivo de disco: seleccione el formato drbd Nombre

del dispositivo de disco: si se selecciona drbd para el formato de archivo, el disco seleccionará automáticamente drbd0 Sistema de

archivos: Se admite principalmente cualquier sistema de archivos que se pueda montar correctamente de forma manual. Porcentaje de

umbral de capacidad: significa que cuando la capacidad del almacenamiento compartido supere el porcentaje establecido, se le solicitará. Detener cuando el disco

sea de solo lectura: el servicio se detiene cuando el sistema de archivos del almacenamiento compartido pasa a ser de solo lectura.

Agregue DiskMount con éxito

Nota:

Recurso DiskMount: puede agregar múltiples recursos DiskMount

Operación: puede modificar y eliminar la configuración del recurso DiskMount

Configuración de recursos de la aplicación

40
Machine Translated by Google

Nota:
Ruta de la secuencia de comandos de la aplicación: la secuencia de

comandos empresarial detecta la cantidad de tiempos de espera. Cuando el manejo de errores: cuando se alcanza la cantidad de tiempos de espera, se manejará como un error, que es una excepción de recurso.

Recursos de la aplicación agregados con éxito

Nota:
Recurso de la aplicación: se pueden agregar múltiples recursos de la aplicación

Operación: la configuración del recurso de la aplicación se puede modificar y eliminar

servicio MRsrv0

41
Machine Translated by Google

Nota:
Para la versión rds, se agregará automáticamente un servicio espejo (nombre predeterminado: MRsrvx) cuando se agregue un recurso de almacenamiento de tipo drbd, y el

servicio configurado actualmente dependerá del servicio espejo, y también se eliminará automáticamente cuando el recurso es eliminado El servicio espejo se generará

automáticamente después de configurar el recurso DiskMount.

5.5 Configuración de la información de alarma (opcional)

42
Machine Translated by Google

Haga clic en "Información de configuración básica"--" Configuración de parámetros SNMP"--"+"

Nota:

Atributo de equipo: el valor predeterminado es público, que se puede cambiar a un grupo privado según sea necesario.

Configure la tarjeta de red, la dirección IP, la máscara y el puerto de la fuente de la alarma: es decir, configure el origen de la información de la alarma.

Nota:
Configure la IP y el puerto de destino de la alarma: es decir, configure el receptor de información de la alarma

En este punto, la configuración del clúster bajo la web está completa.

43
Machine Translated by Google

5.6 Arranque del clúster

Haga clic en "Supervisión del servicio" - haga clic con el botón derecho en "cualquier nombre de nodo" - seleccione "Comenzar todo"

Nota:
Se puede iniciar en un solo nodo o se pueden iniciar todos los nodos

Después de la ejecución, en circunstancias normales, la página de seguimiento se mostrará de la siguiente manera:

Nota:
Estado del servicio: vea el estado de ejecución del clúster y del servicio;

Servicio de alarma NshaService, servicio de espejo MRsrv, servicio aaa: el estado del servicio se está ejecutando normalmente, en un estado manejable Estado de

almacenamiento local: se está ejecutando normalmente

44
Machine Translated by Google

5.7 Cambio de servicio

Seleccione el servicio "aaa" > haga clic con el botón derecho en "Migrar" > seleccione el nodo migrado "linux28"

Nota:
El servicio aaa se detiene en el nodo 26 y se ejecuta en el nodo 28, y el cambio de servicio es exitoso;

45
Machine Translated by Google

Capítulo 6. Pruebas de aceptación para clústeres

El software del clúster se ha sometido a varias pruebas rigurosas antes de salir de fábrica, pero está relacionado con el sistema, el hardware y los scripts comerciales.

Las siguientes dos pruebas deben realizarse en el sitio del proyecto para garantizar que la máquina en espera pueda hacerse cargo automáticamente del negocio. y lograr un

funcionamiento continuo cuando falla el host.

I. Inicie el software del clúster, verifique el funcionamiento del clúster y realice la prueba de cambio de servicio para confirmar que el servicio se puede cambiar

correctamente (incluidos dos tipos de cambio del host a la máquina en espera y de la máquina en espera al host) ; realizar pruebas comerciales para

confirmar el estado de ejecución del servicio y el negocio real. El estado es el mismo.

II Prueba de falla: si el programa del clúster de nodos se reinicia automáticamente y se une al clúster, el host se reinicia o se apaga

Si el servicio del servidor se puede cambiar al servidor en espera; generalmente no se requieren otras pruebas de falla.

46
Machine Translated by Google

Capítulo 7 Comandos interactivos de clúster

El comando interactivo (cli) es relativamente simple, siempre que presione el asistente de operaciones interactivas, puede completar rápidamente las operaciones requeridas.

Según el uso se puede dividir en las siguientes categorías.

Comando de clasificación cluster-init cluster- Función descriptiva

modify cluster-show heartbeat- Inicialización de la configuración del clúster, generación de archivos de configuración del clúster

add heartbeat-delete Modificar el archivo de configuración después de la inicialización del clúster

Mostrar información del archivo de configuración del clúster

Añadir enlace de latido

eliminar enlace de latido

inicio de servicio Inicialización de la configuración del servicio, generar archivo de configuración del servicio

servicio-añadir Agregar un servicio (grupo de recursos) al archivo de configuración

eliminar servicio Eliminar un servicio (grupo de recursos) del archivo de configuración

servicio-modificar servicio-mostrar Modificar la información de configuración de un servicio

Mostrar la información de configuración del servicio especificado

depende del servicio recurso- Establecer dependencias entre diferentes servicios.

añadir recurso-borrar recurso- Agregar recursos relacionados para un servicio (grupo de recursos)

modificar recurso-dependiente Eliminar recursos relacionados de un servicio (grupo de recursos)


Modificación de configuración

espejo-iniciar Modificar la configuración de recursos de un servicio

Establecer dependencias entre diferentes recursos.

Inicialización de configuración de imagen, generar archivo de configuración de imagen

espejo-adm Adición o eliminación de recursos espejo

modificar-config Convierta la versión anterior del archivo de configuración a la nueva versión

archivo de configuración

configuración de instancia cambio Adición, eliminación y visualización de instancias

de producto configuración de Cambiar la configuración relacionada con la versión

dominio recuperación de archivos Configuración de dominio de nodo

de configuración lockdisk-adm Restaurar todos los archivos de configuración a otros nodos

Gestión de discos de arbitraje

interruptor de modo espejo inicio de clúster Conmutación de tipo de clúster remoto o dentro de la ciudad

parada de clúster reinicio de clúster inicio iniciar el clúster

Gestión de nodos de servicio detener grupo

Reinicio del clúster

Inicie el servicio manualmente, siempre que el clúster esté activo

servicio-detener servicio- Detenga el servicio manualmente, siempre que el clúster esté activo

migrar servicio-habilitar Cambiar manualmente los servicios

Gestión De Servicios Servicio de gestión y control de clústeres, la configuración por defecto es el estado de gestión y control

estado

servicio-deshabilitar Los servicios están separados de la administración y el control de clústeres y, a menudo, se usan para negocios en línea.

mejora

47
Machine Translated by Google

culpa clara Identificación de errores de software para un servicio claro

recurso-inicio Inicio del manual de recursos

recurso-detener Detener manualmente el recurso

recurso-habilitar recurso- Recursos de gestión y control de clústeres

deshabilitar recurso-crítico Los recursos están fuera del control del clúster
Administracion de recursos

Establezca el recurso como el recurso clave, la falla se cambiará,

El valor predeterminado es un recurso crítico

recursos no críticos Establezca recursos como recursos no críticos, las fallas no fallarán

Cambio

clúster-estadística Muestra continuamente el estado actual de ejecución del clúster


Supervisión de estado
mostrar-estado Mostrar el estado actual del clúster

snmp-add Elimina Configure la IP de origen de la alarma y la IP de la alarma (IP final de gestión de red)

Alerta SNMP la IP de la fuente de alarma y la IP de la alarma


snmp-delete Modificar

la si
snmp-modify comprueba IP de la fuente de alarma y la configuración del puerto

check-config retrieve- todos los archivos de configuración del clúster están configurados correctamente

remote-license restaura el archivo de autorización al nodo especificado para el nodo

otros comandos Recuperación de autorización fallida

salirÿsalir ayuda salir de la CLI

Verifique el uso del comando en cli

7.1 Modificación de la configuración

Operar los archivos de configuración involucrados en el clúster, incluido el archivo de configuración del clúster (/etc/ha.d/ha.cf),

Archivo de configuración de recursos de espejo (/etc/drbd.d/xxx.res) y archivo de configuración de servicio

(/etc/ha.d/haservices.xml). donde los comandos cluster-init mirror-init y ÿ

La configuración de inicialización de service-init se ha explicado anteriormente, por lo que no se repetirá aquí.

modificación de clúster

Modifique los parámetros del archivo de configuración del clúster.

Formato: cli->cluster-modify

cli:~>modificación de clúster

Configuración del sistema HA:

0) nombre del clúster: rds_cluster

1) nodo: linux76 192.168.8.76

2) nodo: linux77 192.168.8.77

3) nodo: linux78 192.168.8.78

4) nodo: linux79 192.168.8.79

5) archivo de registro: /var/log/ha-log

6) mantenimiento: 3

7) tiempo muerto: 60

48
Machine Translated by Google

8) perro guardián:
desactivado 9) ucast: ens224 192.168.11.76 192.168.11.77 192.168.11.78
192.168.11.79
10) ucast: ens256 192.168.12.76 192.168.12.77 192.168.12.78
192.168.12.79
11) worklink_hb: desactivado
12) auto_failover: desactivado
13) auto_run: activado 14)
maximización: seguridad de datos 15)
kernel_panic: activado 16) nodo_dominio:
linux76 linux77 17) nodo_dominio: linux78
linux79 b) Volver al menú anterior Seleccione
un elemento a modificar: [0-17,b,q] 7 Ingrese
un nuevo tiempo muerto: [c,q] (90) 30 ¿Modificar otro
elemento? [t/n] (n)

¿Quieres guardar los cambios? [s/n] (s)


Reinicie el sistema HA para que su modificación entre en vigor.

espectáculo de racimo

Ver el archivo de configuración del

clúster actual. Formato: cli->cluster-show

cli:~>cluster-show
configuración del clúster: clustername:
rds_cluster node: linux76
192.168.8.76
nodo: linux77 192.168.8.77 nodo:
linux78 192.168.8.78 nodo: linux79
192.168.8.79 archivo de registro: /
var/log/ha-log keepalive: 3 deadtime:
30 watchdog: off ucast: ens224
192.168.11.76 192.168.911.17 8

192.168.11.79
ucast: ens256 192.168.12.76 192.168.12.77 192.168.12.78
192.168.12.79
worklink_hb: apagado
auto_failover: apagado
auto_run: encendido
maximización: seguridad de datos

49
Machine Translated by Google

kernel_panic: en
nodo_dominio: linux76 linux77
nodo_dominio: linux78 linux79

latido del corazón-añadir

Agregue un enlace de
latido. Formato: cli->latido-añadir

cli:~>heartbeat-add
Agregar enlaces de latidos:
Tipo de IP: 0) IPv4 1) IPv6
Seleccione un
tipo: [0-1,q] (0)

NIC detectadas en el clúster: ens192 ens224 ens256 Introduzca


un dispositivo de red para latido de unidifusión: [q] (ens192)
Introduzca la dirección IPv4 de linux76 [q] (192.168.8.76)
Introduzca la dirección IPv4 de linux77 [q] (192.168.8.77)
Ingrese la dirección IPv4 de linux78 [q] (192.168.8.78)
Introduzca la dirección IPv4 de linux79 [q] (192.168.8.79)
¿Agregar otro enlace de ucast heartbeat? [s/n] (s) n ¿Desea
guardar la configuración? [s/n] (s)
Reinicie el sistema HA para que su modificación entre en vigor.

latido del corazón-eliminar

Para eliminar un enlace de latido, se requiere mantener al menos un

enlace de latido. Formato: cli->heart-delete

cli:~>heartbeat-delete 0)
ucast: ens224 192.168.11.76 192.168.11.77 192.168.11.78 192.168.11.79 1) ucast: ens256
192.168.12.76 192.168.12.77 192.168.12.78 192.168.12.79 2) ucast: ens192 192.168.8.76
192.168 .8.77 192.168.8.78 192.168.8.79 b) Volver al menú anterior Seleccione un canal de
enlace de latido para eliminar: [0-2,b,q] 2 ¿Desea guardar la configuración? [s/n] (s)

Reinicie el sistema HA para que su modificación entre en vigor.

50
Machine Translated by Google

servicio-añadir

Agregue un servicio (grupo de recursos), ejecute service-add, el proceso de configuración del servicio es similar a

service-init y no se presentará aquí. Formato: cli->servicio-añadir

eliminar servicio

Elimina un servicio (grupo de recursos) que se ha configurado en el archivo de

configuración del servicio. Formato: cli->eliminar servicio

cli:~>service-delete 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio para eliminar: [0-0,b,q] 0

servicio-modificar

Modifique la configuración del servicio, como modificar el tiempo de espera de parada del servicio ora_tom,

como 240 segundos. Formato: cli->servicio-modificar

cli:~>servicio-modificar
Servicios del clúster: 0)
ora_tom
1) MRsrv0
b) Volver al menú anterior
Seleccione un servicio para modificar: [0-1,b,q] 0
Información de propiedad de 'ora_tom':
0) habilitado: sí 1)
multinstance: no 2)
starttimeout: 240 3)
stoptimeout: 360 4)
checkinterval: 30 5)
checktimeout: 60 6)
maxerrcount: 1 7)
maxlockcount: 0 8)
restartaftercheckfail : no 9)
startanyway: no 10) lista de
nodos: linux76 linux77 linux78 linux79 11) lista de
inicio automático: linux76 linux77 linux78 linux79 12)
nodo preferido: b) Volver al menú anterior

51
Machine Translated by Google

Seleccione un elemento para modificar: [0-12,b,q] 3 Ingrese un


nuevo tiempo de espera de parada: [c,q] (360) 240 ¿Modificar
otra propiedad del servicio? [t/n] (n)
¿Modificar otro servicio? [t/n] (n)
¿Quieres guardar los cambios? [s/n] (s)
Reinicie el sistema HA para que su modificación entre en vigor.

depende del servicio

Establezca las dependencias entre diferentes servicios (regla: el servicio principal depende del servicio secundario, el servicio secundario

comienza primero cuando se inicia el servicio y viceversa cuando se detiene el servicio), actualmente admite dos dependencias: 1) forzado

localmente: 2) global-fijo: formato: cli->depende


Todos los serviciosdel servicio se ejecutan
dependientes

localmente Los servicios dependientes pueden ejecutarse local o remotamente

cli:~>depende del servicio


0) Enlace (agregar dependencia de servicio)
1) Desvincular (eliminar dependencia del servicio)
2) Visualización (dependencia del servicio de
visualización) b) Volver al menú anterior
Seleccione una operación: [0-2,b,q] 0

Para configurar la dependencia del servicio se requiere la siguiente información:

Servicio de padres
servicio de niños
Tipo de dependencia, incluidas las fijas y forzadas
Relación, incluyendo local, remota y global.

Aviso: el padre depende de que el niño se esté ejecutando antes de ejecutarse.

Por el contrario, el padre se detiene antes de que el niño lo haga.

¿Quieres continuar? [y/n] (y) 0) ora_tom 1)


MRsrv0 Seleccione un servicio
principal: [0-1,c,q] 0 Seleccione un
servicio secundario: [0-1,c,q] 1 Relación: 0) global 1) local
Seleccione un tipo de relación: [0-1,q] 1 Tipo de dependencia:

52
Machine Translated by Google

0) forzado
Seleccione un tipo de dependencia: [0-0,q] 0 ¿Desea
configurar otra dependencia del servicio? [t/n] (n)
Verificación de la información de dependencia del servicio:

Padre:ora_tom Hijo:MRsrv0 Relación:local


Tipo de dependencia: forzado

¿Es correcta esta información? [s/n, q] (s)

recurso-agregar

Modifique los servicios configurados y agregue recursos relacionados, como agregar una IP comercial según sea necesario, agregar una

matriz magnética, etc. Formato: cli->resource-add

cli:~>resource-add
Servicios del clúster:
0) oráculo
b) Volver al menú anterior
Seleccione un servicio para agregar un recurso: [0-0,b,q] 0
Tipos de recursos:
0) NADA
1) PI
2) Aplicación
3) disco sin procesar

4) DiskMount b)
Volver al menú anterior
Seleccione un tipo de recurso: [0-4,b,q] 1

eliminación de recursos

Elimina recursos relacionados con


servicios existentes. Formato: cli->eliminar recurso

cli:~>eliminar recurso
Servicios del clúster:
0) oráculo
b) Volver al menú anterior
Seleccione un servicio para eliminar el recurso: [0-0,b,q] 0
Recursos del servicio 'oráculo':

53
Machine Translated by Google

0) oracle_nic_0 1)
oracle_ip_0 2)
oracle_app_0 3)
oracle_dm_0 b)
Volver al menú anterior
Seleccione un recurso para eliminar: [0-3,b,q]

recurso-modificar

Modificar los recursos de los servicios existentes, como cambiar ip de

empresa, etc. Formato: recurso-modificar

cli:~>recurso-modificar
Servicios del clúster: 0) Oracle b)
Volver al menú anterior

Seleccione un servicio para modificar el recurso: [0-0,b,q] 0


Recursos del servicio 'oracle': 0)
oracle_nic_0 1) oracle_ip_0 2)
oracle_app_0 3) oracle_dm_0
b) Volver al menú anterior

Seleccione un recurso para modificar: [0-3,b,q] 1

depende de los recursos

Establezca las dependencias entre diferentes recursos en el mismo servicio (principio: el recurso principal depende del recurso secundario, el recurso

secundario comienza primero cuando se inicia el recurso y viceversa cuando se detiene). Formato: cli:~>depende del recurso

cli:~>depende de los recursos


0) Enlace (agregar dependencia de recursos)
1) Desvincular (eliminar dependencia de recursos)
2) Pantalla (dependencia de recursos de pantalla) b)
Volver al menú anterior
Seleccione una operación: [0-2,b,q] 0
Para configurar la dependencia de recursos, se requiere la siguiente información:
Recurso para padres
Recurso hijo

54
Machine Translated by Google

Aviso: el padre depende de que el niño se esté ejecutando antes de ejecutarse.

Por el contrario, el padre se detiene antes de que el niño lo haga.


¿Quieres continuar? [s/n] (s)
Servicios del clúster:
0) oráculo
1) monitor
b) Volver al menú anterior
Seleccione un servicio para configurar la dependencia de recursos: [0-1,b,q] 0
0) oracle_nic_0 1)
oracle_ip_0 2)
oracle_app_0 3)
oracle_dm_0
Seleccione un recurso principal: [0-3,c,q] 1 Seleccione
un recurso secundario: [0-3,c,q] 0 ¿Desea configurar
otro? dependencia de recursos? [t/n] (n)
Verificación de información de dependencia de recursos:

Padre: oracle_ip_0 Niño: oracle_nic_0


¿Esta información es correcta? [s/n, q] (s)

espejo-adm

Se usa para agregar o eliminar un recurso de espejo (mirror).El proceso de agregar recursos de espejo es similar a mirror-init,

que no se repite aquí. Formato: cli:~>mirror-adm

cli:~>mirror-adm 0)
agregar recurso espejo 1)
eliminar recurso espejo b)
Volver al menú anterior
Seleccione una operación: [0-1,b,q] 1 0) r0 b)
Volver al menú anterior que desea
eliminar: [0-0,b,q] 0

modificar-config

Convierta todos los archivos de configuración del clúster para que coincidan con la

versión del clúster actual. Formato: cli:~>modificar-config

55
Machine Translated by Google

cli:~>modify-config
Modificar /etc/ha.d/ha.cf con éxito. Copie manualmente a otro nodo.
Modificar /etc/ha.d/haservices.xml con éxito. Copie manualmente a otro nodo.

instancia-config

Se utiliza para agregar, eliminar y mostrar instancias configuradas. Las instancias pertenecen al concepto de servicios de instancias múltiples. Cada instancia es

también un conjunto de grupos de recursos. Los servicios de instancias múltiples se utilizan para que la misma aplicación comercial se ejecute en diferentes nodos.

al mismo tiempo. Formato: cli:~>instancia-config

cli:~>instancia-config
0) Agregar instancia ————Agregar instancia
1) Eliminar instancia ————Eliminar una instancia
2) Mostrar instancia ————Mostrar la instancia
configurada b) Volver al menú anterior
Seleccione una operación: [0-2,b,q] 0

Para configurar multi-instancia se requiere la siguiente información:

ID de instancia
Seleccionar recurso para la instancia

¿Quieres continuar? [s/n] (s)


Servicios del clúster: 0)
mult_instance b)
Volver al menú anterior Seleccione
un servicio para agregar la instancia: [0-0,b,q] 0 Ingrese la ID de la
instancia: [0-99,q] (0)
Este servicio 'mult_instance' tiene los siguientes recursos: 0) mult_instance_nic_0
1) mult_instance_ip_0 2) mult_instance_ip_1 3) mult_instance_ip_2
4) mult_instance_app_0 Seleccionar recursos separados por
espacios: [0-4,q] 0 1 4 Recursos para verificación de información
de ID de instancia 0:

mult_instance_nic_0
mult_instance_ip_0
mult_instance_app_0

56
Machine Translated by Google

¿Es correcta esta información? [s/n, q] (s)


¿Quieres agregar otra instancia? [s/n] (s)
¿Quieres agregar otra instancia? [s/n] (s)
Ingrese la ID de la instancia: [0-99,q] (1)
Este servicio 'mult_instance' tiene los siguientes recursos: 0)
mult_instance_nic_0 1) mult_instance_ip_0 2) mult_instance_ip_1
3) mult_instance_ip_2 4) mult_instance_app_0 Seleccionar
recursos separados por espacios: [0-4,c,q] 0 2 4 Recursos
para verificación de información de ID de instancia 1 :

mult_instance_nic_0
mult_instance_ip_1
mult_instance_app_0

¿Es correcta esta información? [s/n, q] (s)


¿Quieres agregar otra instancia? [s/n] (s)

cambio de producto

Se utiliza para la conversión de configuración o la prueba de productos de diferentes versiones del clúster (dual-machine, mirroring,

remote, multi-node, rds). cli:~>product-switch ---- configuración del interruptor

Cambie el éxito del producto.

cli:~>product-switch rds -----Producto de prueba 30 días


Cambio de producto exitoso.

Descripción: Proceso de cambio

de versión con un clic: 1) Antes de la operación, detenga el clúster: cli->cluster-

stop 2) Use el SN comercial para regenerar el archivo clave: /usr/lib64/makekey + SN 3) Ingrese el cli y

ejecute el comando de conmutación: product-switch 4) Este paso se divide en varias situaciones,

correspondientes a las siguientes operaciones: Conmutación de máquina dual espejo/remoto) *) Agregar

recursos drbd *) Modificar recursos de disco, modificar dispositivos y parámetros de tipo, espejo y

interruptor remoto) *) No se necesitan operaciones adicionales, salte la

duplicación / máquina dual fuera del sitio)

57
Machine Translated by Google

*) Modifique los recursos del disco, modifique el dispositivo y escriba los

parámetros *) Instrucciones de operación para agregar y eliminar recursos del disco: resource-

add/ resource-delete 5) El reinicio del clúster tiene efecto: cli->cluster-restart PS: 1. Proceso de modificación del recurso del
disco: cli-> modificación de recursos> seleccione recurso dm> seleccione "2) tipo"> última modificación "0) dispositivo". 2. Si

usa la operación web, debe reiniciar la herramienta web después de realizar el paso 3 anterior: webadminserver

reiniciar

configuración de dominio

Se utiliza para agregar y eliminar

dominios de nodos. Formato: cli:~>dominio-config

cli:~>dominio-config
0) Agregar nodo de dominio
1) Eliminar nodo de dominio b)
Volver al menú anterior
Seleccione una operación: [0-1,b,q] 1 nodo de dominio:

0) nodo_dominio linux76 linux77 1)


nodo_dominio linux78 linux79 b) Volver al
menú anterior
Seleccione un nodo de dominio para eliminar: [0-1,b,q] 0 cli:~>domain-config

0) Agregar nodo de dominio


1) Eliminar nodo de dominio b)
Volver al menú anterior
Seleccione una operación: [0-1,b,q] 0
Seleccione nodos para el nodo de dominio: 0) linux76
1) linux77 2) linux78 3) linux79

Seleccione uno o más nodos separados por espacios: [0-3,b,q] 0 1

recuperar archivos de configuración

Restaure todos los archivos de configuración del clúster actual a otros nodos, lo que a menudo se usa para la recuperación del clúster después del reemplazo del hardware

del nodo o la reinstalación del software en el clúster. Formato: cli:~>recover-config-files

58
Machine Translated by Google

cli:~>recover-config-files ¡Restaurar
archivos de configuración a nodos remotos con éxito!

lockdisk-adm

Los comandos de administración de discos de arbitraje se

pueden agregar y eliminar. Formato: cli:~>lockdisk-adm

cli:~>adm de disco de bloqueo

0) añadir disco de
bloqueo 1) eliminar disco
de bloqueo b) Volver al menú anterior
Seleccione una operación: [0-1,b,q]

interruptor de modo espejo

Se utiliza para cambiar con un solo clic tipos de clúster remotos o dentro de la ciudad, donde sync representa el modo dentro de la ciudad

y async representa el modo remoto: Formato: cli:~>mirror-mode-switch

cli:~>cambiar-modo-espejo
Hay dos tipos de modo espejo: 0) sincronizado 1)
asíncrono b) Volver al menú anterior

Seleccione un tipo: [0-1,b,q]

7.2 Gestión de nodos

Inicio de clúster

Inicie el clúster (admite el inicio del clúster de todos los nodos o el inicio del clúster del nodo especificado), y el servicio se

iniciará junto con él. Si el servicio está fuera de la administración del clúster, el inicio del clúster no abrirá el servicio. Formato:

cli:~>cluster-start [nombre de nodo]

cli:~>cluster-start ----Inicie todo el archivo de


configuración del clúster comprobado correctamente.

59
Machine Translated by Google

[linux76]Inicio de servicios de alta disponibilidad: Listo.

.
[linux77] Iniciando servicios de alta disponibilidad: el archivo
de configuración se verificó correctamente.
Hecho.

.
[linux78] Iniciando servicios de alta disponibilidad: el archivo
de configuración se verificó correctamente.
Hecho.

.
[linux79] Iniciando servicios de alta disponibilidad: el archivo
de configuración se verificó correctamente.
Hecho.

cli:~> cluster-start linux76 ----Inicie el clúster de nodos especificado


[linux76]Iniciando servicios de alta disponibilidad: el archivo de
configuración se verificó correctamente.
Hecho.

parada de racimo

Detenga el clúster (admite la detención del clúster de todos los nodos o la detención del clúster del nodo especificado), si el servicio

está fuera de la administración del clúster, la detención del clúster solo detiene el software del clúster. formato: formato: cli:~>cluster-

stop [nombre de nodo]

cli:~> cluster-stop ----Detener todo el clúster


[linux77]Detener los servicios de alta disponibilidad: Listo.

.
[linux78]Detener los servicios de alta disponibilidad: Listo.

.
[linux79]Detener los servicios de alta disponibilidad:

60
Machine Translated by Google

Hecho.

.
[linux76]Detener los servicios de alta disponibilidad: Listo.

.
cli:~> cluster-stop linux79 ----Detener el clúster de nodo
especificado [linux79]Deteniendo los servicios de alta
disponibilidad: Listo.

.Cluster-reiniciar

Reiniciar el software del clúster es equivalente a ejecutar cluster-stop para detener el clúster y luego ejecutar cluster-start para

iniciar el clúster, que no se repite aquí.

7.3 Gestión de servicios

inicio de servicio

Inicie el servicio
manualmente. Formato: Cli:~>servicio-inicio

Cli:~>inicio-servicio
Servicio actual: 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio: [0-0,b,q] 0
Nodo actual:
0) suse11-3
1) suse11-4
b) Volver al menú anterior
Seleccione un nodo: [0-1,b,q] 0 Envíe un
mensaje al sistema HA para iniciar el servicio Oracle en suse11-3.

61
Machine Translated by Google

parada de servicio

ÿÿÿÿÿÿÿ ÿÿ:
Cli:~>service-start Cli:~>service-
stop Servicio actual: 0) oracle b)
Volver al menú anterior Seleccione
un servicio: [0-0,b,q] 0
Enviar mensaje a Sistema HA
para detener el servicio de Oracle.

Servicio-migrar

Cambiar manualmente los servicios Después de la ejecución, puede ejecutar cluster-stat para ver

continuamente el estado del clúster. Formato: cli:~>servicio-migrar

cli:~>servicio-migrar
Seleccione el servicio para migrar:
Servicio actual: 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio: [0-1,b,q] 0
Seleccione el nodo de destino:
Nodo actual:
0) suse11-4
b) Volver al menú anterior
Seleccione un nodo: [0-0,b,q] 0 Enviar
mensaje para migrar el servicio Oracle de suse11-3 a suse11-4.

Servicio-habilitarÿservicio-deshabilitar

Cuando se inicia el clúster, el servicio se inicia automáticamente, y cuando el clúster se detiene, el servicio se detiene. Durante la ejecución del servicio, el

software del clúster detecta regularmente el estado del servicio. Llamamos a esta relación "el servicio es administrado por el clúster" o "servicio se une la

administración del clúster"; cuando el servicio se va Durante la administración del clúster, los servicios no tienen nada que ver con el software del clúster,

por ejemplo: Detener el clúster no afecta la operación del servicio; si hay una dependencia entre los servicios, los servicios dependientes relacionados se

habilitarán o discapacitados juntos.

Formato: Cli:~>habilitar servicio


Cli:~>servicio-deshabilitar

62
Machine Translated by Google

Service-enable permite que el servicio se una a la administración del clúster.La premisa de ejecutar este comando: el clúster se está ejecutando, el

estado del nodo es normal (UP), el estado del servicio está en ejecución/detenido y el atributo de habilitación del servicio es no.

Service-disable elimina el servicio de la administración del clúster.La premisa de ejecutar este comando: el clúster se está ejecutando, el estado

del nodo es normal (ACTIVADO), el estado del servicio está en ejecución/detenido y el atributo de habilitación del servicio es sí.

Cli:~>habilitar servicio
Servicio actual: 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio: [0-1,b,q] 0 Hay
servicios que dependen del servicio Oracle, también se habilitarán.
¿Quieres continuar? [s/n] (s)
Envíe un mensaje al sistema HA para habilitar el servicio Oracle.

Cli:~>service-disable
Servicio actual: 0) Oracle
b) Volver al
menú anterior Seleccione un
servicio: [0-1,b,q] 0 Hay servicios que
dependen del servicio Oracle, también se desactivarán.
¿Quieres continuar? [s/n] (s)
Envíe un mensaje al sistema HA para deshabilitar el servicio Oracle.

ilustrar:

1. Después de habilitar o habilitar el servicio, el atributo de habilitación del servicio es sí, después de que el servicio se deshabilita correctamente, el

atributo de habilitación del servicio es no. 2. La información de estado anterior del clúster se puede ver continuamente a través de cli->cluster-stat.

Borrar falla

Borra el indicador de error de software del servicio. Antes de ejecutar este comando, ejecute el comando cluster-stat para verificar el estado del servicio. Si se

encuentra un indicador de error, use este comando para borrar el estándar de error del software y luego verifique el estado del servicio para confirmar que el

estado del servicio es normal.

Formato: Cli:~>clear-fault

Cli:~>borrar falla
Servicio actual: 0)
Oracle b)
Volver al menú anterior

63
Machine Translated by Google

Seleccione un servicio: [0-1,b,q] 1 ¿Desea borrar la


falla en todos los nodos [sí/no] (sí)
Envíe un mensaje al sistema HA para borrar la falla del monitor de servicio en todos.

Aviso

1. Cuando el servicio está en un estado inestable, ejecutar clear-fault puede hacer que el servicio se detenga. Este comando solo

se puede usar después de que se haya identificado y resuelto la causa de la inestabilidad; utilícelo con precaución en sistemas

comerciales. 2. Si el servicio se detiene en el clúster cuando se ejecuta clear-fault, el servicio permanece en el estado detenido

original después de la ejecución. Para iniciar el servicio, debe ejecutar manualmente service-start.

7.4 Gestión de recursos

Un servicio es una colección de recursos, que puede considerarse como un grupo de recursos. Cuando se inicia el servicio, todos los

recursos relacionados se inician automáticamente, y cuando se detiene el servicio, también se detienen todos los recursos. Esta es la

gestión automática de recursos por el Clúster parte de las necesidades diarias.

recurso-inicio

Inicie un recurso en el servicio, como ip comercial, tarjeta de


red, aplicación, etc. Formato: cli:~>resource-start cli:~>resource-
start
Servicio actual: 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio: [0-1,b,q] 0
0) nombre: oracle_app_0 script: /etc/ha.d/resource.d/myfaked.sh 1) nombre: oracle_dm_0
2) nombre: oracle_ip_0 b) Volver al menú anterior Seleccione un recurso: [0-2,b,q ]

64
Machine Translated by Google

parada de recursos

Detener un recurso en el servicio, como ip comercial, tarjeta de red,


aplicación, etc. Formato: cli:~>resource-stop

cli:~>recurso-parada
Servicio actual:

0) ora_tom 1)
MRsrv0 2) bbbb
b) Volver al
menú anterior Seleccione un servicio:
[0-2,b,q] 2 0) nombre: bbbb_ip_0 1) nombre: bbbb_app_0
script: /home/myfaked.sh b) Volver al menú
anterior Seleccione un recurso: [0-1,b,q] 1 Enviar mensaje al sistema HA
para detener el recurso bbbb_app_0 en servicio bbbb

ilustrar:

1. Si se reinicia el clúster, los recursos de las operaciones anteriores se iniciarán automáticamente con el servicio.

recurso-habilitarÿrecurso-deshabilitar

La habilitación de recursos hace referencia a un recurso específico en el servicio de control, es decir, el clúster supervisa y administra el

estado del recurso. Cuando se produce una excepción, se generará un registro de errores o se desencadenarán algunos eventos. Si el

recurso es un recurso clave, puede incluso desencadenar el cambio de todo el servicio. Todos los recursos del servicio se gestionan de

forma predeterminada. resource-disable no controla un recurso específico en el servicio, es decir, el estado de ejecución del recurso no

afecta la operación de todo el servicio. Formato: Cli:~>resource-enable Cli:~>resource-disable

Cli:~>habilitación de recursos
Servicio actual: 0) oracle

b) Volver al
menú anterior Seleccione un servicio:
[0-1,b,q] 0 0) nombre: oracle_ip_0 1) nombre: oracle_app_0
script: /etc/ha.d/resource.d/ myfaked.sh 2)
nombre: oracle_dm_0 b) Volver al menú anterior Seleccione un recurso: [0-2,b,q] 0

sesenta y cinco
Machine Translated by Google

Reinicie el sistema HA para que su modificación entre en vigencia.

cli:~>resource-disable
Servicio actual: 0)
ora_tom 1)
MRsrv0 2)
bbbb b)
Volver al menú anterior
Seleccione un servicio: [0-2,b,q] 2 0) nombre:
bbbb_ip_0 1) nombre: bbbb_app_0
script: /home/myfaked. sh b) Volver al menú anterior
Seleccione un recurso: [0-1,b,q] 1 Reinicie el sistema HA
para que la modificación entre en vigor.

ilustrar:

1. Las operaciones de habilitación de recursos y desactivación de recursos pueden tener efecto solo después de reiniciar el

clúster, es decir, tendrán efecto la próxima vez. Esta es la mayor diferencia entre desactivación de servicio y activación de servicio.

recurso-críticoÿrecurso -no crítico

La función de resource-critical es establecer un determinado recurso en el servicio como un recurso clave. Cuando su estado de

ejecución es anormal, hará que se cambie todo el servicio. De forma predeterminada, es un recurso relacional. La falla de un

recurso relacional hará que un servicio (grupo de recursos) cambie. El papel de recurso no crítico es el opuesto de recurso

crítico. Formato: Cli:~>recurso crítico

Cli:~>recurso no crítico

Cli:~>recurso crítico
Servicio actual: 0)
oracle b)
Volver al menú anterior
Seleccione un servicio: [0-1,b,q] 0 0) nombre:
oracle_ip_0 1) nombre:
oracle_app_0 script: /etc/ha.d/
resource.d/ myfaked.sh 2) nombre: oracle_dm_0
b) Volver al menú anterior Seleccione
un recurso: [0-2,b,q] 0 Reinicie el
sistema HA para que la modificación entre en
vigencia.

cli:~>recurso no crítico

66
Machine Translated by Google

Servicio actual:
0) ahora_tono
1) MRsrv0
2) bbbb
b) Volver al menú anterior
Seleccione un servicio: [0-2,b,q] 2
0) nombre: bbbb_ip_0
1) nombre: bbbb_app_0 secuencia de comandos: /home/myfaked.sh
b) Volver al menú anterior
Seleccione un recurso: [0-1,b,q] 1
Reinicie el sistema HA para que su modificación entre en vigor.

7.5 Supervisión de clústeres

clúster-estadística

Actualice automáticamente todo el estado del clúster cada 1 segundo, incluido el estado del nodo del clúster, el estado del vínculo del latido y la cadena de arbitraje.

Estado de la carretera y estado de funcionamiento del servicio, etc.

Formato: cli:~>cluster-stat

cli:~>cluster-stat
Presione Ctrl-C o 'Q' para salir
Nota: MI - Espejo, ---- - Enlace anormal

Seleccione un servicio para ver el estado de los recursos: MRsrv0


Use las teclas de flecha para seleccionar: Arriba-Primero, Abajo-Último, Izquierda-Anterior, Derecha-Siguiente

Nombre del nodo Estado HeartbeatLink ServiceName Habilitar estado de servicio


linux76 ARRIBA ens224,ens256 MRsrv0:0 corriendo SÍ
MI(r0,ens224) ora_tom corriendo SÍ
MI(r1,ens256)

linux77 ARRIBA ens224, ens256 MRsrv0 detenido SÍ

67
Machine Translated by Google

ora_tone detenido SÍ

linux78 ARRIBA ens224,ens256 MRsrv0:1 corriendo SÍ


MI(r0,ens224) ora_tom detenido SÍ
MI(r1,ens256)

linux79 ARRIBA ens224, ens256 MRsrv0 detenido SÍ


ora_tone detenido SÍ

ilustrar:

(Tenga en cuenta que si la posición del enlace parpadea en el diagrama de estado, significa que el enlace es anormal)

artículo sentido

Nombre del nodo Nombre de nodo en el clúster

Estado Estado del nodo, dividido en los siguientes tres tipos:

Arriba: El nodo es normal

Abajo: falla del nodo

Desconocido: el estado del nodo es desconocido

HeartbeatLink 1. Enlace Heartbeat, se mostrará el nombre del enlace, si el enlace es anormal, mostrará "-"

2. El disco espejo de configuración se mostrará en esta columna, formato: MI (nombre espejo, enlace)

3. El disco de arbitraje configurado (Ldisk) también se mostrará aquí.

Nombre del Servicio Nombre de servicio definido por el usuario, consulte service_init

ServiceStatus Descripción del estado del servicio:

en ejecución: el servicio se está ejecutando

detenido: el servicio no se está ejecutando

deteniéndose: el servicio se está deteniendo

comenzando: el servicio está comenzando

inestable: el servicio es inestable y el clúster no puede controlar el servicio

desconocido: el estado del servicio es desconocido

Las siguientes palabras clave indican que el estado del servicio es anormal o ha sido anormal:

str: el servicio no pudo iniciarse, como str: (motivo)

stu: el servicio se ejecuta normalmente y el servicio se detecta cuando el servicio se detecta periódicamente.

El estado del servicio es anormal, como stu: (motivo)

stp: el servicio no se detuvo, como: stp: (motivo)

Mostrar la causa de la excepción de servicio:

op: ejecución fallida

N: excepción de almacenamiento en red

Yo: dirección IP

R: Solicitud

M: dispositivo de disco montado en el sistema de archivos

S: almacenamiento, como disco compartido

68
Machine Translated by Google

W: enlace de servicio

T: tiempo de espera

B: La IP flotante existe en el nodo opuesto, el servicio no se inicia y las dos máquinas están en

estado cerebral dividido

P: No se puede hacer ping a ninguna IP que exista en ninguna red

L: El disco de arbitraje no pudo obtener el candado al iniciar el servicio

Habilitar El servicio es manejable o no. Sí significa manejable. la habilitación de servicio está disponible

y modificación de desactivación de servicio

En el diagrama de estado anterior, el primer servicio se selecciona y se muestra de forma predeterminada, y se puede cambiar presionando hacia arriba o hacia abajo o hacia la izquierda o hacia la derecha

Se despliegan diferentes servicios, luego de presionar Enter se puede ver el estado del grupo de recursos, regrese a la capa anterior y presione la letra a, de la siguiente manera:

Presione 'q' o 'Ctrl-C' para salir


Presione 'a' para regresar a la interfaz de estado del clúster

Estado de los recursos del servicio ora_tom:


Nombre Tipo Habilitar nombre de nodo Critl Estado del recurso
ora_tom_nic_0 nic sí sí linux76 correr
linux77 correr
linux78 correr
linux79 correr

ora_tom_ip_0 ip sí sí linux76 correr


linux77 detenido
linux78 detenido
linux79 detenido

disco ora_tom_dm_0(r0) sí sí linux76 correr


linux77 detenido
linux78 detenido
linux79 detenido

disco ora_tom_dm_1(r1) sí sí linux76 correr


linux77 detenido
linux78 detenido
linux79 detenido

ora_tom_app_0 aplicación sí sí linux76 correr


linux77 detenido
linux78 detenido
linux79 detenido

ora_tom_app_1 aplicación sí sí linux76 correr

69
Machine Translated by Google

linux77 detenido

linux78 detenido

linux79 detenido

ilustrar:

artículo sentido

Nombre El nombre del recurso en el servicio, para identificación interna.

escribe Tipos de recursos: como ip, nic (tarjeta de red), disco (almacenamiento compartido) y aplicación (profesional

aplicación de servicio)

Nombre del nodo Nombre de nodo en el clúster

ResourceStatus El estado del estado del recurso es el siguiente:

unknown: el estado del recurso es desconocido, común en el caso de la desactivación del recurso

en ejecución: el recurso se está ejecutando

detenido: el recurso ha sido detenido

comenzando: el recurso está comenzando

deteniéndose: el recurso se está deteniendo

en ejecución|pendiente: este estado indica que la aplicación ha realizado un inicio, pero

Sin éxito por confirmar

detenido|pendiente: este estado indica que la aplicación ha realizado una detención, pero

Sin éxito de parada por confirmar

deteniendo|administrador: el recurso es anormal y requiere intervención manual

Habilitar Recursos manejables o no. Sí significa manejable

Crítico Si se trata de un recurso clave, el recurso clave significa que el servicio se activará cuando el recurso sea anormal.

cambio de servicio

Mostrar estado

Obtenga el estado actual del clúster, consígalo una vez, la información de estado del clúster obtenida es la misma que la salida de cluster-stat

Lo mismo, la diferencia es que solo se obtiene una vez, y no se repite aquí.

Formato: cli:~>mostrar estado

7.6 Configuración del monitoreo de alarmas SNMP (opcional)

El clúster admite el envío de alarmas snmp para alertar a los mantenedores de los cambios del clúster, de modo que los problemas se puedan descubrir y resolver a tiempo.

Para obtener una descripción e interpretación detalladas del contenido de la alarma, consulte el Apéndice: Tipo de mensaje de alarma SNMP y descripción de la consulta

70
Machine Translated by Google

snmp-añadir

Configure la IP de la fuente de alarma y la IP de alarma (IP de

gestión de red). Formato: cli:~>snmp-añadir

cli:~>snmp-añadir

Para configurar SNMP se requiere la siguiente información:

IP de una fuente
Una o más IP trampa

¿Quieres continuar? [s/n] (s)


* 0) IP de origen de SNMP y comunidad de lectura y
* escritura 1) IP de captura de SNMP b) Volver al menú
anterior Seleccione un elemento para agregar: [0-1,b,q]
0a

Para configurar la IP de origen de SNMP, se requiere la siguiente información:

Una tarjeta de interfaz de red (NIC) única


Una IP de origen única
Un número de puerto de origen único entre 0 y 65535

¿Quieres continuar? [s/n, q] (s)


Elija un dispositivo de red: 0) eth3 1) eth2
2) bond0 Seleccione un
dispositivo de red: [0-2,q] 1
Dirección IP de origen de
entrada: [q] 192.168.111.2 Máscara de red
de entrada: [q] (255.255.255.0)

Número de puerto de origen de entrada entre 0 y 65535: [q] (161) 163


b
Comunidad de lectura y escritura de entrada: [q] (público)
Verificación de información SNMP:

Puerto de origen: 163


NIC: eth2
SourceIP: 192.168.111.2
Máscara de red: 255.255.255.0
Rwcommunity: público

¿Es correcta esta información? [s/n, q] (s)

71
Machine Translated by Google

* 0) IP de origen SNMP y comunidad de lectura y escritura


* 1) IP trap SNMP b)
Volver al menú anterior
Seleccione un elemento para agregar: [0-1,b,q] 1 c

Para configurar la IP trap SNMP se requiere la siguiente información:

Una o más trampas IP y su número de puerto entre 0-65535

¿Quieres continuar? [s/n, q] (s)


Dirección IP de trampa de entrada: [q] 192.168.1.194
Número de puerto de trampa de entrada entre 0 y 65535: [q] (162)
¿Agregar otra IP trampa? [t/n] (n)
Verificación de la información del puerto y la IP de la trampa SNMP:

Trampa IP: 192.168.1.194 Puerto: 162

¿Es correcta esta información? [s/n, q] (s)


Reinicie el sistema HA para que su modificación entre en vigor.

ilustrar:

1. Configure la tarjeta de red, la dirección IP, la máscara y el puerto de la fuente de la alarma, es decir, configure la información del originador de

la alarma. 2. Configure snmp para leer y escribir cadenas comunitarias. El valor predeterminado es público, que se puede modificar a cadenas privadas según

sea necesario. 3. Configure la IP y el puerto de la alarma, es decir, configure a qué host se envía la alarma;

snmp-eliminar

Admite la eliminación de toda la configuración de snmp, la IP de origen de alarma configurada y

la IP de alarma. Formato: cli:~>snmp-delete

cli:~>snmp-eliminar
0) Eliminar configuración SNMP
1) Eliminar IP de origen SNMP
2) Borrar IP trap SNMP b)
Volver al menú anterior
Seleccione un elemento para eliminar: [0-2,b,q]

72
Machine Translated by Google

snmp-modificar

Modifique la configuración de la fuente de alarma configurada, como la tarjeta de red, la dirección IP, la

máscara y el puerto. Formato: cli:~>snmp-modificar

cli:~>snmp-modify 0)
SourcePort: 163 1) NIC:
eth2 2) SourceIP:
192.168.111.2 3) Netmask:
255.255.255.0 4) Rwcommunity: public
b) Volver al menú anterior

Seleccione un atributo para modificar: [0-4,b,q]

7.7 Otros comandos

verificar-config

El archivo de configuración utilizado para detectar si

el clúster es normal. Formato: cli:~>check-config

cli:~>check-config Archivo
de configuración comprobado correctamente.

recuperar-licencia-remota

Restaure el archivo de autorización en el nodo especificado, que a menudo se usa para la recuperación de autorización después de

que falla un nodo en el clúster. Formato: cli:~>recover-remote-license

cli:~>recover-remote-license Ingrese el
nombre del nodo remoto: [q] linux77 Recuperación
de licencia exitosa!

salir, salir
Salga de la herramienta de

administración de clústeres cli. Formato:

cli:~>salir cli:~>salir

73
Machine Translated by Google

ayuda

Consulte el uso de comandos no interactivos en

cli. Formato: cli->comando de ayuda

cli:~>ayuda inicio de clúster

NOMBRE

cluster-start: inicia el sistema HA y todos los servicios

SINOPSIS
cluster-start [nombre de host]

DESCRIPCIÓN
Inicie el sistema HA, si no especifica el nombre de host, se iniciará
el sistema HA
en todos los nodos del clúster. Iniciará el sistema HA en remoto
anfitrión al principio,
e inicie el sistema HA en localhost por fin.

hostname: el nombre del nodo en el clúster

74
Machine Translated by Google

Capítulo 8 Comandos no interactivos del clúster

El clúster proporciona los siguientes

comandos no interactivos: Descripción


del comando

nshacluster Configurar y administrar la información básica del clúster

nshamirror Configurar y administrar los recursos del espejo

snmp nshasnmp nshastart Iniciar


Configurar
el clúster
y administrar
nshastop las
Detener
alarmas
el

clúster Obtener la versión del clúster nshaget Configurar y

administrar los recursos nshares Configure y administrar servicios

nshasrv
clúster nshahide para habilitar nshastat
funciones Obtener el estado del
especiales

Descripción: 1) Descripción del símbolo en los

parámetros del comando: {par}, los parámetros entre corchetes son obligatorios,

se selecciona al menos un [par], los parámetros entre corchetes son opcionales

<val>, el valor entre corchetes angulares es obligatorio, reemplazar | con valor real,

usado para separar varias opciones opcionales, generalmente usado con corchetes o corchetes

2) Valor de retorno del comando

general: 255 o -1, la ejecución del comando

falla 0, la ejecución del comando tiene éxito

1, la configuración ya existe 2, la configuración

no existe 5, el comando sale directamente de

otro, código de error del sistema o significado

especial 3) Establezca un cierto valor de atributo Una

cadena vacía o delimitada, encerrada entre comillas dobles. me gusta:


""
nshasrv -modificar srv1 nodo preferido
nshacluster -agregar dominio "nodo1 nodo2"

8.1 nshacluster

Se utiliza para configurar la información básica del Cluster.La información de configuración se almacena en el archivo /etc/ha.d/ha.cf.

Uso: nshacluster [OPCIÓN][ARGUMENTO]... -add


{<nombre-clúster> | -node <nombre-nodo> -ip <ipaddr1 [ipaddr2]
[ipaddr3]> | -hb {-mcast | -mcast6 | -ucast | -ucast6 | -de serie}

75
Machine Translated by Google

<nombre-nic> | -lockdisk <nombre-disco> -format {sí | no}}


-delete {-nodo <nombre-nodo> | -hb {-mcast | -mcast6 | -ucast | -ucast6 | -serial} <nombre-
nic> | -lockdisk <nombre-disco>} -valid-lockdisk

-add-domain <nodos>
-del-domain <nodos>
-modify <clave> <valor>
-product-switch [<tipo-producto>] -upgrade
-display [código | tipo de producto |
<clave>] -ayuda

Explicación
de
parámetros: parámetro Descripción Agregar nombre de clúster, personalizado, usado para

-add <nombre de clúster> -add identificación interna Agregar nodos de clúster y sus IP, se permiten

-node <nombre de nodo> -ip <ipaddr1 múltiples IP, agregar enlaces de latidos separados por espacios *)

[ipaddr2] [ipaddr3]> -add -hb {-mcast Admite ipv4 e ipv6 *) El tipo de latido es unicast (ucast), multicast

| -mcast6 | -ucast | -ucast6 | -serial } (mcast) y puerto serie (serial) *) nic-name agrega un disco de arbitraje

<nombre-nic> para el nombre de la tarjeta de red reconocido por el sistema operativo

*) disk-name, nombre de almacenamiento compartido (como /dev/

sdc1) *) sí o no indica si formatee el disco de arbitraje, por lo general,

-add -lockdisk <nombre-disco> complete sí Eliminar el nodo del clúster eliminar el enlace de latido *)

-formato {sí | no} Compatible con ipv4 e ipv6 *) El tipo de latido es unidifusión (ucast),

multidifusión (mcast) y puerto serie (serial) *) el nombre de nic es

reconocido por el sistema operativo NIC name -delete -lockdisk <disk-

name> Elimine el disco de quórum para que el disco de quórum sea

-delete -node <nombre-nodo> válido, se utiliza para reinicializar el disco de quórum -valid-lockdisk

-delete -hb {-mcast | -mcast6 | -ucast | Modifique la información de configuración del clúster, la clave y el valor

-ucast6 | -serial} <nombre-nic> se pueden ver con -modify <clave> <valor> muestra y el resultado

modificado sin parámetros para mostrar la información de configuración

del clúster, con parámetros para mostrar el valor correspondiente,

la tabla de códigos para devolver el valor, tipo de producto para

consultar el tipo de clúster para agregar el campo de nodo y elimine el campo de nodo para el cambio de tipo de clúster o la prueba del

producto, tipo producto. *) el tipo de tipo de producto se utiliza para la prueba del

-mostrar [código | tipo de producto |


<clave>]

-add-domain <nodos>
-del-domain <nodos>
-product-switch [<tipo-
producto>]

76
Machine Translated by Google

Hay cinco parámetros de ayuda para la actualización de la configuración

-actualizar del clúster: ha, mirror, cluster, rcs y rds, que muestran el uso del comando

-ayuda

8.2 nshamirror

Este comando se utiliza para configurar y administrar imágenes.La información de configuración se almacena en /etc/drbd.d/r0.res.

Uso: nshamirror [OPCIÓN][ARGUMENTO]... -add -res <resname>


-node <nodename> -ip <ipaddrs> [-port <portnum>]
-disk <disco> [-metadisk <mdisk>]
-delete <cambio de nombre>

-modify -res <resname> <clave> <valor> -valid <resname>[-


node <nodo>] -format <fstype> -res <resname> [-mnt

<mountpoint>] -global-modify {global | <resname>} <sección1> [<sección2>]


<clave><valor> -sync-rate <tasa> [<resname>] -start [-res <resname>] [-node <nodo>] -stop [- res <resname>] [-node
<nodo>] -set <res|dev> {-primary | -secundario} [-force] -full-sync <res|dev> -splitbrain-recovery <res|dev> -node
<fuente de sincronización> -state <res|dev> [cs | ds | ro] [xmlonline [<nombre de nodo>]] -resize <res|dev> [<tamaño>K|

M|G] -add-link <res|dev> -node <nodo> -ip <ipaddr> [-port < portnum>] -switch-link <res|dev> [-ip <ipaddr>] [-force]
-switch-mode <modo>

-open-node <res|dev> [-node <nodo>] -create-script <res|


dev> -detect-mirror-mode <ipaddr|res|dev> -status [<res>|
<dev>] [ detalle] -display [código | <resname> | estado-xml |
en línea-xml | dump-xml [cambiar nombre]] -ayuda

Explicación del parámetro:

parámetro

-add -res <resname> -node <nodename> Descripción para

-ip <ipaddrs> [-port <portnum>] -disk <disco> [- agregar recursos espejo: *) cambio de nombre,

metadisk <mdisk>] nombre de recurso, personalizable *) nombre de

nodo, nombre de host *) ipaddrs, ip de enlace espejo,

múltiple *) número de puerto, número de puerto,

personalizable *) disco, disco de datos dispositivo de disco utilizado

77
Machine Translated by Google

*) mdisk, el dispositivo de disco utilizado por el disco de metadatos

-delete <cambio de nombre> Eliminar el recurso de espejo configurado Modificar el archivo de

-modify -res <resname> <clave> <valor> -valid recursos de espejo configurado (por ejemplo: /etc/drbd.d/r0.res)

<resname> Hacer que el recurso de espejo configurado tenga efecto Formatear

los recursos de espejo configurados, que se puede montar

-format <fstype> -res <resname> [-mnt <mountpoint>] directamente en el directorio especificado después de formatear

-global-modify {global | <resname>} <sección1> para modificar el archivo de configuración global de los recursos

[<sección2>] <clave> <valor> -sync-rate <tasa> espejo (por ejemplo, /etc/drbd.d/global_common.conf)

[ <resname>] Modificar temporalmente la velocidad de

sincronización del recurso de espejo especificado para

permitir que el recurso de espejo comience en el nodo especificado -start [-res <resname>] [-node <node>] -stop [-res

-secundario} [-force] -full-sync <res|dev> -splitbrain-recovery <res|dev>


<resname>]
-node
[-node
<fuente
<nodo>
de sincronización>
] -set <res|dev>- estado
{-primary
<res|
|

dev> [cs | ds | ro] [xmlonline [<nombre de nodo>]]

Admite recursos espejo para detenerse en el nodo especificado

Establezca/fuerce la función del recurso espejo para

que sea principal o secundario Especifique un recurso

espejo para realizar una operación de sincronización

completa Recuperación manual de los datos del recurso

espejo split-brain puede admitir la fuente de sincronización

especificada para consultar el estado del recurso espejo

especificado (incluido estado de conexión, estado del

dispositivo subyacente y estado de lectura y escritura),

puede admitir la obtención del estado anterior del nodo especificado -resize <res|dev> [<size>K|M|G] Actualizar el tamaño

del disco espejo para la expansión del disco - add-link <res|dev>tres


-node
-ip <node>
<ipaddr>Añadir
[-port enlace
<portnum>]
de datos,
-switch-link
actualmente
<res|dev>
hasta[-

ip <ipaddr>] [ -force] -switch-mode <modo>

Cambie el enlace de datos, que generalmente se usa con el parámetro de

fuerza para cambiar el modo de clúster a la misma ciudad (sincronización) o

remoto (asincrónico) para hacer que la configuración de duplicación del nodo

especificado surta efecto, que se usa para 2+1 o 2 +2 clúster para recrear la

-open-node <res|dev> [-node <nodo>] -create- secuencia de comandos de control del servicio de duplicación, propósito

script <res|dev> especial para detectar el modo de clúster aplicable al clúster actual: misma

ciudad (sincrónica) o remota (asincrónica)

-detect-mirror-mode <ipaddr|res|

dev> -status [<res>|<dev>] [detalle]

-display [código | <resname> | estado-xml | en línea-xml

| dump-xml [cambiar nombre]] -ayuda Compatibilidad para mostrar el código de retorno de ejecución del comando del espejo

actual, la configuración del espejo, la información del estado actual del espejo

Parámetro de ayuda, que muestra el uso del comando

78
Machine Translated by Google

8.3 nshasrv

Este comando se utiliza para configurar y administrar servicios.La información de configuración se guarda en el archivo: /etc/ha.d/haservices.xml

Uso: nshasrv [OPCIÓN][ARGUMENTO]... -add <srv>

-eliminar <srv>

-modify <srv> <atributo> <valor> -link <srv


principal> <srv secundario> <relación> <tipo de dependencia> -unlink <srv principal> <srv
secundario> -start <srv> [<nodo>] -stop <srv> -habilitar <srv>

-deshabilitar <srv>

-migrate <srv> <nodo de destino> -checkcfg [<srv>]


-display [-name <srv> | código | enlace] -clearfault
<srv> [<nodo>] -ayuda

Explicación de

parámetros:

Parámetro -add <srv> Descripción Agregue servicio, personalice el nombre del servicio, el valor del atributo es el

valor predeterminado para eliminar el servicio agregado

-delete <srv> -modify

<srv> <attr> <value> Modificar los atributos del servicio (es decir, el valor "attr"), los atributos pueden ser
Utilice el parámetro de

-link <srv padre> <srv hijo> <relación> <tipo visualización para ver las

de dependencia> dependencias entre los servicios de configuración.

relación: local y global tipo de dependencia: fijo y

-unlink <srv principal> <srv secundario> forzado Eliminar dependencias entre servicios

-start <srv> [<nodo>] Para iniciar un servicio, el nodo de inicio es opcional. Si no se selecciona, Cluster

selecciona automáticamente el nodo para iniciar. Detenga el servicio de administración

-detener <srv> y control de servicios en ejecución, siempre que el servicio esté en el estado

-habilitar <srv> desconectado. El servicio está desconectado, siempre que el servicio esté en el

-deshabilitar <srv> estado administrado. Migre manualmente el servicio al nodo especificado para su

-migrate <srv> <nodo de destino> -checkcfg ejecución.

[<srv>] -display [-name <srv> | código |

Enlace] Compruebe si la configuración del servicio está completa,

es válida 1. Sin ningún parámetro, se muestran todos los nombres de servicio

en todo el clúster 2. -nombre, se muestra la información de configuración del

servicio especificado

79
Machine Translated by Google

3. código, muestra el código de retorno del resultado de la ejecución del

comando 4. enlace, muestra los parámetros de ayuda de la información de

-ayuda dependencia del servicio configurado, muestra el uso del comando

8.4 acciones

Este comando se utiliza para configurar y administrar recursos.La información de configuración se guarda en el archivo: /etc/ha.d/haservices.xml

Uso: nshares [OPCIÓN][ARGUMENTO]... -add <res> <tipo>

<srv> -delete <res>

-modify <res> <atributo> <valor> -link <res

principal> <res secundario> -unlink <res principal>

<res secundario> -start <res> -stop <res> -enable <res>

-deshabilitar <res>

-critical <res> -noncritical

<res> -checkcfg <res> -display

[-name <res> | tipo | código |

enlace] -ayuda

Explicación de

parámetros: Parámetro -add <res> <tipo> <srv> Descripción: agregue el recurso 1,

res, nombre del recurso y personalizado al servicio

especificado. Puede usar el parámetro de visualización

para hacer referencia a reglas de nomenclatura similares. 2.

Tipo es el tipo de recurso. Puede usar el tipo de visualización

para ver 3. srv. Elimine un recurso de un nombre de servicio

-eliminar <res> existente. El nombre del recurso (res) se puede ver usando el

parámetro de visualización -modify <res> <atributo> <valor>

Para modificar los atributos de recurso 1, res, puede usar el parámetro de visualización para ver 2 , attr, y use el parámetro -display

[-name <res> para ver 3, valor, use el valor real en su lugar

-link <parent res> <child res> Configure las dependencias entre recursos del mismo servicio (grupo de recursos). La regla es que los recursos

principales dependen de los recursos secundarios. El nombre del

recurso (res) se puede ver mediante el parámetro de visualización.

80
Machine Translated by Google

-unlink <parent res> <child res> Eliminar dependencias entre recursos, nombre de recurso (res)
Puede utilizar el parámetro de visualización para ver.

-inicio <res> Inicie el recurso. El nombre del recurso (res) se puede ver usando

el parámetro de visualización. Detener un recurso. Puede usar el

-detener <res> parámetro de visualización para ver el nombre del recurso (res) para ver

el recurso bajo control. La premisa es que el procesamiento del recurso

-habilitar <res> está en un estado fuera de control y reinicia el clúster para que surta efecto. El

nombre del recurso (res) se puede ver a través del parámetro de visualización.

Los recursos se administran por separado, siempre que los recursos se

-deshabilitar <res> procesen y controlen, y el clúster se reinicie para que surta efecto. El nombre

del recurso (res) se puede ver mediante el parámetro de visualización.

Establezca el recurso como un recurso clave. Los recursos predeterminados

-crítico <res> son todos los recursos clave. El nombre del recurso (res) se puede ver usando

el parámetro de visualización. Un recurso se establece como un recurso no

crítico. La premisa es que el recurso está en el estado de administración y

-no crítico <res> control. Una excepción de un recurso no crítico no activará el cambio de servicio.

El nombre del recurso (res) se puede ver usando el parámetro de visualización.

Compruebe si la configuración del recurso está completa. Utilice el parámetro

de visualización para ver el nombre del recurso (res). 1, mostrar, mostrar todos

-checkcfg <res> los nombres de recursos 2, -nombre, mostrar la información de configuración

específica del recurso 3, Tipo, mostrar el tipo de recurso 4, Código, mostrar el

-display [-nombre <res> | tipo | código | Enlace] código de retorno del resultado de la ejecución del comando

5, Enlace, mostrar parámetros de ayuda de información de configuración

-ayuda de dependencia de recursos, mostrar el uso del comando

8.5 nshasnmp

Se utiliza para configurar snmp, la información de configuración se almacena en los archivos /etc/ha.d/

haservices.xml y /etc/ha.d/NSHA-agent.conf

Uso: nshasnmp [OPCIÓN][ARGUMENTO]... -add [-


sourceip <ipaddr> | -trapip <ipaddr> [-port <trapport>]] -delete [-sourceip | -trapip <ipaddr>]
-modify <atributo> <valor> -display [tipo|código] -ayuda

Explicación de

parámetros: ilustrar

Parámetro -add [-sourceip <ipaddr> | -add sin otros parámetros, la configuración básica de SNMP se genera por defecto

81
Machine Translated by Google

-trapip <ipaddr> [-port <trapport>]] La información se puede ver con la pantalla y las propiedades se

pueden modificar con modificar. 1. -sourceip <ipaddr>, agregue la IP

de origen de la alarma 2. -trapip <ipaddr> [-port <trapport>], agregue

la IP y el puerto de destino de la alarma, admita múltiples ejecuciones

para agregar múltiples IP de destino de alarma -delete [- trapip

<ipaddr>] -delete sin parámetros, elimina toda la información de

configuración de snmp.

1. -trapip <ipaddr>, elimine la IP de destino de la alarma,

-modificar <atributo> <valor> modifique los atributos modificables de SNMP 3, código,

muestre el resultado de la ejecución del comando, parámetro de ayuda

del código de retorno, muestre el uso del comando

-mostrar [tipo | código]

-ayuda

8.6 nshastart

Este comando se utiliza para iniciar el clúster.

Uso: nshastart [OPCIÓN][ARGUMENTO]... [nombre de nodo]


-display [código] -ayuda

Explicación del

parámetro: Indica

parámetro [nombre de nodo] parámetros opcionales. Si se inicia con un nombre de nodo, significa iniciar el clúster

en este nodo. De lo contrario, todos los clústeres de nodos se inician sin ningún

-mostrar [código] parámetro o el parámetro de código mostrará el resultado de la ejecución del comando,

el código de retorno, el parámetro de ayuda, y mostrar el uso del comando.

-ayuda

8.7 nshastop

Este comando se utiliza para detener el clúster.

Uso: nshastop [OPCIÓN][ARGUMENTO]... [nombre de nodo]


-display [código] -ayuda

82
Machine Translated by Google

Explicación de parámetros:

ilustrar

parámetro [nombre de nodo] Parámetro opcional, si se detiene con el nombre del nodo, se refiere al

Detenga el clúster en el nodo; de lo contrario, todos los nodos del clúster se detendrán

-mostrar [código] Mostrar la ejecución del comando sin argumentos ni argumentos de código

código de retorno de resultado

-ayuda Parámetro de ayuda, que muestra el uso del comando

8.8 nshastat

Este comando se usa para obtener el estado relevante del clúster, incluido el estado del servicio, el estado del recurso, el estado del nodo y el estado del negocio.

Estado del enlace, estado del enlace de latido, etc.

Uso: nshastat [OPCIÓN][ARGUMENTO]...

-servicio <srv> <nodo>

-resource <res> <nodo>

-nodo <nodo>

-worklink <dispositivo> <nodo>


-hblink <dispositivo> <nodo>
-estado

-anormal <srv> [<nodo>]

-mostrar {código | tipohb}

-ayuda

Explicación de parámetros:

ÿÿ ilustrar

-service <srv> <nodo> -resource <res> Obtener el estado de un servicio en un nodo

<nodo> -node <nodo> -worklink Obtener el estado de un recurso en un nodo

<dispositivo> <nodo> -hblink <dispositivo> Obtener el estado del nodo

Obtener el estado de un vínculo comercial en un nodo

Obtener el estado del enlace de latido

-estado Mostrar todo el estado del clúster

-mostrar {código | tipohb} El parámetro de código muestra el significado del código de estado obtenido,

El parámetro hbtype muestra varios tipos de latidos;

-ayuda Parámetro de ayuda, que muestra el uso del comando

8.9 nshaget

Este comando se utiliza para obtener información del clúster, incluida la versión, el tipo de clúster, el número de serie y la información de autorización de prueba.

83
Machine Translated by Google

Uso: nshaget [OPCIÓN][ARGUMENTO]...


-versión
-version-detalle

-producto [<sn>]
-licencia-días
-sn

-ayuda
Explicación de parámetros:

parámetro ilustrar
-versión Obtenga la versión del clúster, como v3,v4,v5...
-version-detail -product Obtener la información específica de la versión del clúster

[<sn>] -license-days Obtener el tipo de clúster, como espejo

Obtenga los días restantes de la licencia (número de serie de prueba)

-sn Obtener número SN

-ayuda Parámetro de ayuda, que muestra el uso del comando

8.10 nshahide

Este comando se usa para habilitar funciones específicas del clúster.

Uso: nshahide [OPCIÓN][ARGUMENTO]...


-añadir <clave> <valor>
-eliminar <clave>

-mostrar [código|clave]
-ayuda

La clave tiene los siguientes valores:

clave valor

singleNIC mismo 1 sistema de clúster puede usar una sola NIC. predeterminado 0
host 1 nombre de host del sistema de clúster puede ser el mismo. defecto
0

snmpdelay Tiempo de retraso de SNMP del mensaje de captura de envío. predeterminado 0


segundos

comprobación de trampa snmp 1 trampa de envío activa SNMP trap2sink (trap IP)
mensaje, inactivo no enviar. predeterminado 0

enlace de trabajo_hb_trap 0 cierre el mensaje de captura SNMP worklink_hb. predeterminado 1

snmptrapsrv Si el servicio se está ejecutando, envíe un mensaje de captura,


de lo contrario no enviar. nombre del servicio como valor

esperar espejo Tiempo de espera para que se detecte el espejo remoto.


predeterminado 0 segundos

alta seguridad 1 espejo de datos de alta seguridad. predeterminado 0

84
Machine Translated by Google

mirror_remote_mount 1 dispositivo espejo se puede montar durante

sincronización. predeterminado 0

mirror_fence 0 valla de espejo desactivada. predeterminado 1

mirror_link_fast_swi 1 enlace espejo de conmutación rápida. predeterminado 0


tch

srv_disabled_show 1 después de deshabilitar el servicio, se muestran todos los recursos

el estado original. predeterminado 0

proxy_wait_time Tiempo de espera de espejo-proxy para cepillar datos.


por defecto 60 segundos

Explicación de parámetros:

ÿÿ ilustrar

-add <clave> <valor> -delete Para habilitar la función, la clave y el valor se refieren a los valores anteriores

<clave> -display [código|clave] Y desactivar funciones específicas que ya están activadas

-ayuda Mostrar el valor de retorno de la ejecución del comando o qué valores clave existen

Parámetro de ayuda, que muestra el uso del comando

85
Machine Translated by Google

Capítulo 9 Alarmas y consultas del clúster

Los productos de clúster NewStart admiten la notificación de eventos anormales que ocurren durante el funcionamiento del clúster mediante la configuración de alarmas snmp

para facilitar una respuesta rápida por parte de los administradores. Al mismo tiempo, el receptor de alarmas puede enviar una solicitud de consulta de información del clúster al

entorno del clúster donde la alarma se configuró correctamente.

9.1 Oid de alarma de clúster y descripción (si necesita una biblioteca mib, comuníquese con nuestra empresa)

Interfaz de captura SNMP del clúster Newstart

Oído de trampa Nombre de etiqueta de captura de gravedad Descripción de la trampa

Tipo de alerta

1.3.6.1.4.1.36895. resourceMonitorTimeoutT
Advertencia Supervisión de recursos agotada
1.900.1.0.2 rap
1.3.6.1.4.1.36895. ResourceNotGoingOffline Newstart Cluster no puede
Error
1.900.1.0.3 Trampa desconectar los recursos

1.3.6.1.4.1.36895. ResourceWentOnlineByIts elfTrap


Advertencia Recurso automáticamente en línea
1.900.1.0.5
Alerta de recursos

1.3.6.1.4.1.36895. Un recurso falla en un


Error ResourceFaultedTrap
1.900.1.0.6 nodo
1.3.6.1.4.1.36895.
Servicio de informaciónOnlineTrap El servicio comenzó con éxito
1.900.2.0.1

1.3.6.1.4.1.36895.
Servicio de informaciónOfflineTrap El servicio se detuvo con éxito
1.900.2.0.2

1.3.6.1.4.1.36895.
Error serviceFaultedTrap falla en el servicio
1.900.2.0.4

El servicio especificado falló

en todos los nodos que


1.3.6.1.4.1.36895. serviceFaultedAndNother
Error grave podían ponerlo en línea. El
1.900.2.0.5 eToFailoverTrap
alerta de servicio servicio no se puede

conmutar por error a ningún

nodo. El servicio se está

1.3.6.1.4.1.36895. reiniciando en respuesta a


Advertencia serviceRestartingTrap
1.900.2.0.6 la entrada en línea de un

recurso persistente

1.3.6.1.4.1.36895 Servicio de informaciónInitiatingForSwi service ready to switch

86
Machine Translated by Google

1.900.2.0.7 Trampa para picar

El servicio está en línea


1.3.6.1.4.1.36895. servicioConcurrencyViolat
Error grave en varios nodos del
1.900.2.0.8 trampa de iones
clúster.

El grupo de servicios se está

1.3.6.1.4.1.36895. servicioRestInRspnToPers reiniciando porque el recurso


Información
1.900.2.0.9 tResGoOnlineTrap persistente se recuperó del

error.

1.3.6.1.4.1.36895.
Error serviceOPTimeoutTrap tiempo de espera de operación de servicio de pares
1.900.2.0.12

1.3.6.1.4.1.36895. El atributo enable del servicio


Información serviceDisabledTrap
1.900.2.0.3 cambia a no

El usuario reinicia el clúster

manualmente (el usuario ha emitido


1.3.6.1.4.1.36895. clusterSystemReiniciando
Advertencia una instrucción a través de la web o
1.900.3.0.2 manualmenteTrap
la línea de comandos y se iniciará la

acción de detención del clúster)

Ejecutar Newstart

1.3.6.1.4.1.36895. clusterSystemInDangerTr El nodo del clúster entra en un


Error
1.900.3.0.3 ap estado peligroso (segmento

completo de latido)

1.3.6.1.4.1.36895. clusterSystemFaultedTra Clúster de inicio nuevo


Error grave
Alarma de1.900.3.0.4
nodo pags apagado debido a una

falla al ejecutar Newstart


1.3.6.1.4.1.36895. clusterSystemJoinedClus
Información Los nodos del clúster se
1.900.3.0.5 TerTrap
unen al clúster.

Clúster de inicio nuevo

1.3.6.1.4.1.36895. clusterSystemExitedManu allyTrap Salió correctamente de un


Información
1.900.3.0.6 nodo en ejecución anterior.

Corazón 1.3.6.1.4.1.36895.
Latido del corazón de la informaciónRecuperación del latido del corazón de la trampa en línea
Salto 1.900.4.0.1

de 1.3.6.1.4.1.36895.
Advertencia latido del corazónFuera de líneaApagar el latido del corazón desactivado
alarma 1.900.4.0.2

9.2 Consulta de alarma

Actualmente, el clúster solo admite la consulta de "clúster", "nodo" y "servicio", y prevalecerán los detalles en

la siguiente lista.

87
Machine Translated by Google

elemento de consulta describir

Información del clúster Nombre del clúster nombre del clúster

NewstartHAVersion Número de versión del clúster

Recuento total de nodos el número de nodos en el clúster

LiveNodeCount Número de nodos activos en el clúster

ServiceCount El número de servicios en el clúster.

Nombre de nodo actual Nombre de nodo para información actual de retroalimentación

Información del nodo Nombre del nodo Nombre de nodo en el clúster

Estado del nodo Estado de los nodos en el clúster

NodeHblinkCount Información El número de enlaces de latidos

del servicio ServiceName Mostrar el nombre del servicio en el clúster

Habilitar servicio El atributo enable del servicio (controlable)

Estado del servicio El estado de ejecución del servicio.

ServiceNodeListServiceNodeList Un nodo ejecutable para el servicio.

88
Machine Translated by Google

apéndice

Apéndice A: Especificaciones para escribir secuencias de comandos de control comercial

1Antes de escribir guiones

1.1 El script de control empresarial debe contener 4 parámetros: inicio (start), parada (stop), detención forzada (parada forzada) y estado (detección de estado en ejecución).

1.2 Ubicación y permisos de almacenamiento de scripts

En principio, el archivo de script se puede almacenar en cualquier directorio del sistema operativo, pero no se recomienda colocarlo en la matriz de discos; además, el archivo de

script debe estar en formato unix (como modificar el comando: dos2unix script name) y debe tener permisos de lectura y ejecución (como modificar el comando: chmod a+rx scriptname).

1.3 Mecanismo de secuencia de comandos de operación del clúster (actualmente, el clúster solo admite usuarios raíz para ejecutar secuencias de comandos de gestión y control

empresarial) *) El último paso de la puesta en marcha del servicio de inicio de secuencias de comandos de gestión y control empresarial es iniciar el negocio (es decir, ejecutar

"secuencia de comandos"). + parámetro de inicio"), y el valor de retorno de la operación de inicio No se realiza la detección; todos los recursos del servicio se detectan después de 2

segundos, y si todos devuelven 0, el clúster considera que el servicio se ejecuta normalmente y el inicio se realiza correctamente. *) La administración de servicios y la detección de secuencias de

comandos de control están bajo la configuración predeterminada del servicio (el servicio se puede administrar). Después de iniciar el clúster, las máquinas activas y en espera realizarán

periódicamente la detección de servicios (es decir, ejecutarán "secuencia de comandos + estado parámetro"). Si el valor devuelto es 0, significa que el servicio se está ejecutando normalmente, y

si se devuelve un valor distinto de cero, se considera que el servicio está detenido. *) Cuando la secuencia de comandos de control comercial detiene el servicio, se ejecutará "secuencia

de comandos + parámetro de detención" y no se detectará el valor de retorno, y el servidor se detectará después de 2 segundos.

Si todos los recursos del servicio devuelven un valor distinto de 0, el clúster considera que el servicio se ha detenido y la detención se realiza correctamente.

2 Referencia de secuencias de comandos

En circunstancias normales, hay secuencias de comandos de operación correspondientes para el inicio y la detención de la propia empresa. Para el inicio/detención de la secuencia de

comandos del clúster, si el usuario root inicia y detiene la empresa, se llama directamente a la secuencia de comandos empresarial; si es iniciado y detenido por el usuario ordinario, el formato

es el siguiente: su - usuario -c "script comercial"

La detención forzada de los scripts de clúster generalmente es para encontrar procesos comerciales y eliminarlos por la fuerza. Entonces,

lo siguiente se enfoca en cómo escribir la parte de estado del script.

89
Machine Translated by Google

script de tipo ps+grep (pgrep)

Este es nuestro escenario de secuencias de comandos preferido.

1. Usando el método de verificación del nombre del proceso, siempre que exista el nombre del proceso, el negocio se considera normal; el requisito para el

nombre del proceso debe ser único, por ejemplo, las palabras java y tomcat no son adecuadas para dichos scripts.

2. Estipule uniformemente el formato de escritura: ps -fwu, el significado de los parámetros es el

-en siguiente: salida amplia.

-F hace una lista de formato completo. Esta opción se puede combinar con muchas otras

Opciones de estilo UNIX para agregar columnas adicionales.


-en Seleccione por ID de usuario efectivo (EUID) o nombre Especifique ID de usuario o nombre, en caso afirmativo

El usuario root no debe escribir -u, aunque no tiene nada de malo pero no es convencional.

3. grep requiere el parámetro -w (coincidencia de palabras), lo que puede mejorar la eficiencia:

-en: Seleccione solo aquellas líneas que contengan coincidencias que formen palabras completas. La prueba es que la

subcadena coincidente debe estar al principio de la línea o precedida por un carácter constituyente que no sea una palabra.

Del mismo modo, debe estar al final de la línea o seguido de un carácter constituyente que no sea una palabra.

Los caracteres que constituyen la palabra son letras, dígitos y el guión bajo.

4. No utilice más ">/dev/null 2>&1", lo que hará que el registro del clúster no registre errores de secuencia de comandos; sin embargo, se puede utilizar ">/dev/

null".

5. grep -vq grep al final de la declaración para mejorar la eficiencia

6. El script stop prohíbe el uso de kill -9 para detener el proceso, puede usar kill. 7. No llame a exit (salir directamente) en la función de secuencia de

comandos, pero use return para volver; exit solo se llama en la secuencia de comandos principal. Para obtener más información, consulte la secuencia

de comandos propia del clúster /etc/ha.d/resource.d/myfaked .sh.

Los ejemplos

son los siguientes: 1)

Script de Oracle: ps -efww | grep tnslsnr | grep -v grep >/dev/null 2>&1 Este script solo

es aplicable a un SID de Oracle y es ineficiente; debe cambiarse a: ps – fwu oracle |

grep -w ${LISTENER_NAME} | grep -vq grep LISTENER_NAME es el nombre del

oyente definido en el script.

2) secuencia de

comandos de Sybase: ps -fwu $ SYBASE_USER | grep –w servidor de datos | grep -vq grep

Si no está escrito así, este problema puede aparecer en forma de otros síntomas: detener el recurso del disco compartido falla, forzar la

detención tiene éxito

90
Machine Translated by Google

nrmd[13073]: 2011/12/18_23:40:48 depuración:

detener_recurso:/etc/ha.d/resource.d/Filesystem /dev/sda1 /ivasdata/sybase ext3 rw

sybase sybase 755 detener

umount: /ivasdata/sybase: el dispositivo está ocupado umount informa que sybse todavía está accediendo al

dispositivo y luego sigue informando nrmd[13073]: 2011/12/18_23:40:53 depuración: verificación posterior a

la detención del recurso, udb_sybase_for_udb_mount_0 NO está detenido La razón es que Filesystem envió

SIGTERM para detener sybase.

3) Escritura de scripts
zxin: ps -efww |grep -v grep|grep -qw zxmoni debe cambiarse
a: ps -fwu zxin10 | grep -w zxmoni | grep -vq grep Puede
haber varios procesos zxmoni ejecutándose en un servidor, pero
pertenece a un usuario diferente, por lo que no se puede escribir como -efww.

Compruebe el script de tipo de puerto

Como tomcat, weblogic, etc., este tipo de script requiere una máquina virtual Java. Si el resultado de salida de la consulta grep es muy

largo, consulte el script /etc/ha.d/resource.d/tomcat_example.sh para escribir rápidamente un guión.

Ejemplo: consulta los procesos que pertenecen al usuario de Oracle y

escuchan en el puerto 1521 [root@e222 ~]# lsof -a -i :1521 -u oracle

COMANDO USUARIO PID TIPO FD TAMAÑO DEL DISPOSITIVO NOMBRE DEL NODO

oráculo 9932 oráculo 18u IPv4 22313 TCP e222:59034->e222:ncube-lm (ESTABLECIDO)


tnslsnr 10134 oráculo 8u IPv4 22260 TCP *:ncube-lm (ESCUCHAR)
tnslsnr 10134 oráculo 11u IPv4 22314 TCP e222:ncube-lm->e222:59034 (ESTABLECIDO)

3 Depurar manualmente el script

La operación de secuencias de comandos complejas a menudo requiere conectar IP y acceder a la matriz magnética, y configurar el host y las propiedades del punto de montaje

de la matriz magnética. La operación es problemática. Los pasos rápidos para depurar los pasos son los siguientes:

1. Una vez completada la configuración, inicie el clúster, espere a que se inicie el servicio y extraiga la información relevante de /var/log/ha-log

#grep "start_res" /var/log/ha-log grm[14591]:


2013/06/28_16:53:21 depuración: start_resource:/
etc/ha.d/resource.d/Filesystem /dev/sdc2 /home/ db disco ext3 rw oracle oinstall 755 90 0 0 0 inicio

grm[14591]: 2013/06/28_16:53:21 depuración: start_resource:/bin/bash --login /home/script/


oracle.sh inicio

91
Machine Translated by Google

grm[14591]: 2013/06/28_16:53:21
depuración: start_resource:/usr/lib/newstartha/resource.d/LastingRes -t netcard -d
bond0 -o start -i 192.168.1.192 -i 192.168.1.193 - i 192.168.1.247 grm[14591]:
2013/06/28_16:53:23 depuración: start_resource:/etc/ha.d/resource.d/IPaddr
192.168.11.13/24/bond0 inicio

2. Detenga el clúster, pegue la IP de inicio y el punto de montaje en las letras rojas en negrita de arriba, y luego comience a depurar el script como usuario

raíz. Esta es la operación de simulación de un clúster, que es más rápida.

3. Comience a depurar la secuencia de comandos (tome la depuración de secuencias de comandos de Oracle como ejemplo)

1) Probar el inicio de Oracle

#/etc/ha.d/resource.d/ora_script.ps start #sleep 30; /etc/ha.d/resource.d/ora_script.ps status;

echo $? Dado que Oracle tarda un tiempo en iniciarse, suspenda durante 30 segundos Después de verificar el estado, asegúrese de que

el inicio sea exitoso $?

2) Prueba de parada de oráculo

#/etc/ha.d/resource.d/ora_script.ps stop #sleep 60; /etc/ha.d/resource.d/ora_script.ps

status; echo $? Asegúrese de que $? devuelve un valor distinto de 0 después de una parada exitosa (generalmente igual a 1), devuelve

0 en caso de falla, lo que indica que Oracle no se detuvo por completo

3) ¿Si pasa la depuración manual, pero falla el inicio del clúster? Esto generalmente está

relacionado con las variables de entorno del usuario definidas. Consulte el archivo de configuración correspondiente en el script:

punto decimal + espacio + archivo de configuración, como: . /etc/profile . /home/oracle/.bash_profile (Redhat y otras distribuciones) . /

home/oracle/.profile ( Suse y otras distribuciones)

4. Después de completar la depuración, detenga los servicios iniciados manualmente, los puntos de montaje y las direcciones IP, inicie el clúster y luego

cambie los servicios 5. ¿Qué sucede si el clúster inicia el servicio correctamente, pero no puede cambiar a la máquina en espera? Modifique la

configuración y configure el servicio para que se inicie en la máquina en espera. ¿Tiene éxito? 1) Éxito, lo que indica que hay un problema en la parte de

estado del script 2) Fallo, cluster-stat muestra str(A), lo que indica que hay un problema con el entorno de la máquina en espera (o inconsistente con el

host: por ejemplo, la identificación de usuario de Oracle es diferente en los dos nodos);

4 escenarios de secuencias de comandos

El negocio general tiene sus propios scripts de inicio y parada. Para el inicio/detención de los scripts de clúster, si el negocio comienza y se detiene con el

usuario raíz, se llama directamente al script comercial; si el negocio se inicia y se detiene con usuarios normales, el formato es de la siguiente manera: su -

usuario -c "Script de negocios"

La detención forzada de los scripts de clúster generalmente es para encontrar procesos comerciales y eliminarlos

por la fuerza. Entonces, lo siguiente se enfoca en cómo escribir la parte de estado del script.

92
Machine Translated by Google

script de tipo ps+grep (pgrep)

Este es nuestro escenario de secuencias de comandos preferido.

1. Usando el método de verificación del nombre del proceso, siempre que exista el nombre del proceso, el negocio se considera normal; el requisito para el

nombre del proceso debe ser único, por ejemplo, las palabras java y tomcat no son adecuadas para dichos scripts.

2. Estipule uniformemente el formato de escritura: ps -fwu, el significado de los parámetros es el

-en siguiente: salida amplia.

-F hace una lista de formato completo. Esta opción se puede combinar con muchas otras

Opciones de estilo UNIX para agregar columnas adicionales.


-en Seleccione por ID de usuario efectivo (EUID) o nombre Especifique ID de usuario o nombre, en caso afirmativo

El usuario root no debe escribir -u, aunque no tiene nada de malo pero no es convencional.

3. grep requiere el parámetro -w (coincidencia de palabras), lo que puede mejorar la eficiencia:

-en: Seleccione solo aquellas líneas que contengan coincidencias que formen palabras completas. La prueba es que la

subcadena coincidente debe estar al principio de la línea o precedida por un carácter constituyente que no sea una palabra.

Del mismo modo, debe estar al final de la línea o seguido de un carácter constituyente que no sea una palabra.

Los caracteres que constituyen la palabra son letras, dígitos y el guión bajo.

4. No utilice más ">/dev/null 2>&1", lo que hará que el registro del clúster no registre errores de secuencia de comandos; sin embargo, se puede utilizar ">/dev/

null".

5. grep -vq grep al final de la declaración para mejorar la eficiencia

6. El script stop prohíbe el uso de kill -9 para detener el proceso, puede usar kill. 7. No llame a exit (salir directamente) en la función de secuencia de

comandos, pero use return para volver; exit solo se llama en la secuencia de comandos principal. Para obtener más información, consulte la secuencia

de comandos propia del clúster /etc/ha.d/resource.d/myfaked .sh.

Los ejemplos

son los siguientes: 1)

Script de Oracle: ps -efww | grep tnslsnr | grep -v grep >/dev/null 2>&1 Este script solo

es aplicable a un SID de Oracle y es ineficiente; debe cambiarse a: ps – fwu oracle |

grep -w ${LISTENER_NAME} | grep -vq grep LISTENER_NAME es el nombre del

oyente definido en el script.

2) secuencia de

comandos de Sybase: ps -fwu $ SYBASE_USER | grep –w servidor de datos | grep -vq grep

Si no está escrito así, este problema puede aparecer en forma de otros síntomas: detener el recurso del disco compartido falla, forzar la

detención tiene éxito

93
Machine Translated by Google

nrmd[13073]: 2011/12/18_23:40:48 depuración:

detener_recurso:/etc/ha.d/resource.d/Filesystem /dev/sda1 /ivasdata/sybase ext3 rw

sybase sybase 755 parada

umount: /ivasdata/sybase: el dispositivo está ocupado umount informa que sybse todavía está accediendo al dispositivo

Entonces sigue informando

nrmd[13073]: 2011/12/18_23:40:53 depuración: comprobación posterior a la parada del recurso,

udb_sybase_for_udb_mount_0 NO se detiene. El motivo es que el

sistema de archivos envió SIGTERM para detener sybase.

4) Escritura de guiones zxin:

ps -efww |grep -v grep|grep -qw zxmoni


Debería cambiarse a:

pd-fwu zxin10 | grep -w zxmoni | grep -vq grep


Puede haber varios procesos zxmoni ejecutándose en un servidor, pero pertenecen a diferentes usuarios, por lo que no pueden escribir

en - efww.

Compruebe el script de tipo de puerto

Como tomcat, weblogic, etc., este tipo de secuencia de comandos necesita una máquina virtual Java para ejecutarse, si usa grep para consultar

La salida es muy larga, consulte /etc/ha.d/resource.d/tomcat_example.sh para escribir un script rápidamente


guion.

Ejemplo: consulta los procesos que pertenecen al usuario de Oracle y escuchan en el puerto 1521

[root@e222 ~]# lsof -a -i :1521 -u oráculo

COMANDO USUARIO PID TIPO FD TAMAÑO DEL DISPOSITIVO NOMBRE DEL NODO

oráculo 9932 oráculo 18u IPv4 22313 TCP e222:59034->e222:ncube-lm (ESTABLECIDO)


tnslsnr 10134 oráculo 8u IPv4 22260 TCP *:ncube-lm (ESCUCHAR)
tnslsnr 10134 oráculo 11u IPv4 22314 TCP e222:ncube-lm->e222:59034 (ESTABLECIDO)

94
Machine Translated by Google

Apéndice B - Instrucciones para usar el Sistema de Registro en Línea de Clusters

1. Accede al sistema de registro en línea

Use los navegadores principales (IE, firefox, chrome , etc.) para visitar el sitio web oficial de ZTE New Fulcrum (http://www.gd-linux.com), Haga clic en "Ayuda"----"Registro en línea" para saltar al sistema de

registro en línea. La captura de pantalla de referencia es la siguiente:

2. Registro de usuario, inicio de sesión de usuario y recuperación de contraseña de usuario

Inicio de sesión del usuario: ingrese la dirección de acceso en el navegador----salte a la interfaz de inicio de sesión del usuario----ingrese la información de la cuenta para iniciar sesión

Registro de usuario: ingrese la dirección de acceso en el navegador----salte a la interfaz de inicio de sesión de usuario----haga clic en "registro xxx"----salte a la página de registro de usuario----ingrese la

información relevante para completar el nuevo registro de usuario (tenga en cuenta que el correo electrónico debe estar disponible)

95
Machine Translated by Google

Recuperación de contraseña de usuario: ingrese la dirección de acceso en el navegador ---- salte a la interfaz de inicio de sesión de usuario ---- haga clic en "recuperación de contraseña xxx" --- salte

a la interfaz de recuperación de contraseña, la contraseña de usuario se restablecerá y se enviará a el correo de registro

3. Registro en línea del número de serie (SN)

3.1 Inicio de sesión --- Ingrese el número de serie (SN) --- verifique automáticamente la disponibilidad del número de serie y muestre el "nombre del producto", "información de la versión", etc.

96
Machine Translated by Google

3.2 Luego complete la información del solicitante-----haga clic en el botón "Registrarse" en la parte inferior, después de un registro exitoso, habrá un aviso, informe el método de

adquisición de la licencia y salte a la página de descarga correspondiente.

97
Machine Translated by Google

3.3 Descargue la licencia registrada con éxito.

El archivo de licencia descargado se renombra a newstartha.lic y luego se carga en modo binario al directorio /etc/ha.d/lic del servidor

correspondiente para completar el registro.

4. Consulta de información de registro histórico y recuperación de licencia

Inicio de sesión del usuario----haga clic en la "lista de números de serie" a la izquierda----la página de la derecha mostrará el número de serie registrado y admitirá la consulta del número de serie,

y también proporcionará la descarga de la licencia registrada en ese momento

98
Machine Translated by Google

Apéndice C: resolución de problemas y recuperación típicos

ÿ Sistema de animación suspendida

La animación suspendida del sistema es un escenario de falla especial y sigue siendo un problema importante en la industria. Cuando ocurre una posible

falla en un entorno de máquina dual, ¿cómo juzgar y hacer operaciones estandarizadas?

Desde la perspectiva del clúster, se puede juzgar por los siguientes desempeños en el sitio: el nodo

defectuoso no se puede conectar a través de ssh y telnet, no puede responder a otras solicitudes de aplicaciones, la consola no

responde y el sistema puede continuar enviando y recibir paquetes de latidos de máquina dual (esto puede hacer un juicio simple del

sistema de nodo normal en la máquina dual, el registro ha-log del nodo no imprime la información anormal del nodo muerto de la otra parte).

Acción recomendada:

reinicie el servidor muerto falso para que el servidor en espera se haga cargo del servicio (se puede considerar un reinicio completo), no se recomienda la operación manual

Cambie el servicio al servidor de respaldo o reinicie el servidor de respaldo en este caso.

ÿ Fallo inestable del servicio

Durante la operación del clúster de dos máquinas, se puede encontrar un fenómeno de falla: el servicio es inestable. Preste

atención cuando ocurra esta situación, porque el estado del servicio significa que está fuera del control del clúster, es decir, el clúster no

controla todos los recursos del servicio, incluida la IP comercial, la matriz de discos, la aplicación, etc. , que es una actuación de alto

riesgo. Al ingresar al cli para consultar el estado del clúster, el servicio imprimirá algo similar a lo siguiente: Estado del servicio:

Nombre prisa 11-3 prisa 11-4 Habilitar


mi falso inestable:stp(A) inestable:stp(A) SÍ

Operaciones

recomendadas: 1. Comprobar la causa de la inestabilidad del servicio, que se puede localizar a través del registro del clúster, es

necesario comprimir y empaquetar los registros ha-lo de los dos nodos y enviarlos al fabricante para su análisis. Soporte

técnico público. correo electrónico: ha@gd-linux.com. 2. Después de localizar y resolver la falla, ejecute clear-fault para

borrar el estado anormal y finalmente ejecute

service-start para iniciar el servicio.

99
Machine Translated by Google

ÿ Falla fuera de línea del enlace del cerebro dividido/del latido del clúster

El cerebro dividido se refiere al hecho de que los nodos del clúster han perdido el contacto entre sí, pero el software del clúster

Provocar contienda por los recursos, posiblemente corrompiendo los datos.

Las manifestaciones típicas de la falla del cerebro dividido son las siguientes:

1. Todos los negocios están operando normalmente;

2. Cada nodo se ejecuta normalmente, pero otros nodos están inactivos o son desconocidos;

3. El enlace de latido muestra '--', y el servicio en espera generalmente muestra la pantalla de estado de parado: str (B).

La cara es el resultado de que el host ejecute cli->cluster-stat.


NodeName Estado HeartbeatLink ServiceName ServiceStatus Habilitar

prisa 11-3 ARRIBA eth3,eth2,-- oráculo correr SÍ


Disco L (EN LÍNEA)

suse11-4 ABAJO --,--,-- oráculo desconocido SÍ


Disco L (EN LÍNEA)

Acción sugerida:

El punto principal de la falla del cerebro dividido es resolver el problema fuera de línea del enlace del latido del corazón, que se puede verificar mediante los siguientes métodos.

1. Primero asegúrese de hacer ping <IP de la tarjeta de red de enlace de latido del nodo opuesto>

La NIC del enlace de latido y el enlace de servicio deben pertenecer a diferentes VLAN o estar configurados como direcciones IP en diferentes segmentos de red.

sitio. Se puede hacer ping al enlace de latido, pero cli->cluster-stat se muestra fuera de línea porque usan

Diferentes protocolos, Ping usa el protocolo ICMP y el enlace de latido del clúster usa el protocolo de multidifusión UDP.

2. Inicie el cortafuegos del sistema operativo

Ejecute iptables -L para ver las reglas del firewall. Cierre el firewall o abra el puerto udp: 694;

3. Prueba a conectar las tarjetas de red heartbeat de los dos servidores con un cable de red directo para formar una red privada, a ver si se puede solucionar (más

El clúster de nodos debe pasar por el conmutador y no se puede conectar directamente).

4. Para servidor blade/entorno de máquina virtual vmware

Solo se puede solucionar instalando la versión 3.0 o superior, porque se implementa el protocolo IGMP (comúnmente conocido como "Protocolo de multidifusión de capa 3").

propuesta").

5. Otro método de análisis es ver la configuración de la tarjeta de red y el análisis de captura de paquetes:

# tcpdump -ni puerto X1 694

#ifconfig X1

PD: Reemplace X1 con el nombre real de la tarjeta de red, como eth1, bond0, trunk1, etc. Si hay varias tarjetas de red, sí

Se requiere captura y análisis de paquetes para cada tarjeta de red.

P.ej:

[raíz@linux173 ~]#ifconfig eth1

100
Machine Translated by Google

eth1 Enlace encap:Ethernet HWaddr 00:0A:EB:30:81:24 inet


dirección:192.168.10.173 Transmisión: 192.168.10.255
Máscara: 255.255.255.0

dirección inet6: fe80:: 20a: ebff: fe30: 8124/64 Alcance: enlace


UP BROADCAST EJECUTANDO MULTICAST MTU:1500 Métrica:1

Paquetes RX: 2635153 errores: 0 descartados: 0 desbordamientos: 0 marco: 0


EN FUNCIONAMIENTO significa que la tarjeta de red funciona normalmente y la tarjeta de red no tiene esta marca cuando el cable de red no está enchufado;

ÿÿÿÿÿ

[root@e222 ~]# tcpdump -ni eth0 port 694|grep "226.0.12.17" escuchando en eth0, tipo de enlace
EN10MB (Ethernet), tamaño de captura 96 bytes 15:51:19.685283 IP 192.168.1.222. 48628 > 226.0.12.17.ha-cluster:
UDP, longitud 190 15:51:19.731718 IP 192.168.1.223.49469 > 226.0.12.17.ha-cluster: UDP, longitud 191

La descripción anterior captura los paquetes de latidos de 192.168.1.222 y 192.168.1.223 (normal), porque hay varios

clústeres en la LAN. Al capturar paquetes, grep "226.0.12.17" solo muestra los paquetes de latidos de este clúster,
mientras que la multidifusión la dirección es 226.0.12.17 Puede usar el comando cli->cluster-show para ver la
adquisición, como: cli:~>cluster-show Configuración del clúster:

watchdog_fork: off
watchdog_load: 0 nodo: e222
192.168.1.222 nodo: e223 192.168.1.223
archivo de registro: /var/log/ha-log

keepalive: 1 tiempo muerto: 15 mcast:


eth1 226.0.12.17 694 1 0

Si el latido eth1 falla y el paquete de latido enviado desde eth1 no se captura, significa que el paquete de datos de la
otra parte eth1 no ha llegado al nodo, verifique la fluidez de la red; de lo contrario, si el latido eth1 falla pero el paquete
de latido enviado desde eth1 ha sido capturado (muy raro), vea si reiniciar el clúster puede resolverlo.

6. Si el problema aún no se resuelve y se requiere un análisis manual, envíenos el siguiente


análisis: * salida del comando cli * archivos /etc/ha.d/ha.cf y haservices.xml * salida ifconfig
de toda la red de latidos tarjetas de 2 nodos y salida de resultado de captura de paquetes

ÿ Error de error de inicio de clúster

Al iniciar el clúster (cluster-start) en la cli de la herramienta de administración de la línea de comandos del clúster, es posible que encuentre un error de inicio.

101
Machine Translated by Google

Si la operación falla, a continuación se enumeran algunos síntomas y soluciones de problemas relacionados.

1. Ambas máquinas informan falla NewStartHA [rc=6] ..failed.

Acción recomendada:

este error a menudo se informa cuando el clúster no puede obtener algunos recursos en el archivo de configuración. Esta excepción generalmente debe ubicarse

en combinación con el registro /var/log/ha-log. El personal en el sitio puede filtrar la información de error para localizarlo rápidamente Por supuesto, si es necesario

La información relevante también se puede enviar al fabricante para ayudar en el posicionamiento.

2. Error rc=3 al ejecutar cluster-start, como se muestra a


continuación: cli:~>cluster-start [suse11-4]Iniciando servicios
de alta disponibilidad: el archivo de configuración se verificó
correctamente.
Error de NewStartHA [rc=3]. ..ha fallado
Archivo de licencia no válido.

El archivo de configuración se comprobó


correctamente. [suse11-3]Iniciando servicios de alta
disponibilidad: error NewStartHA [rc=3]. ..ha fallado
Archivo de licencia no válido.

Operación

recomendada: este tipo de error se suele informar cuando el archivo de licencia (/etc/ha.d/lic/newstartha.lic) no existe o no es válido.

La solución es regenerar el archivo de clave y enviarlo a ha@gd -linux.com para solicitar una nueva licencia Para el método de

operación específico, consulte el tercer punto del Apéndice C - Preguntas y respuestas más frecuentes.

3. ADVERTENCIA: falló la conexión del tserver 'xxx(hostname)' al ejecutar cluster-start en cli,


consulte ha-log para obtener más detalles.

Acción

recomendada: este aviso se ve a menudo cuando el proceso tsever de dos nodos de una máquina dual no puede establecer una

comunicación normal, lo que generalmente se debe a las siguientes dos razones: ÿ El firewall del sistema operativo se ve afectado,

puede intentar apagar el cortafuegos ÿ El proceso tsever no se inicia (ps –ef | grep tsever), debe eliminar manualmente el tsever

Inicio, consulte la operación: /usr/lib/newstartha/tsever &

102
Machine Translated by Google

Apéndice D - Soporte técnico

Centro de soporte técnico de servicio público de Linux de la provincia de Guangdong (Guangdong Zhongxing New Fulcrum Technology Co.,

Ltd.) sinceramente, gracias por utilizar los productos de clúster de nuestra empresa. Su elección es nuestra fuerza motriz y su apoyo es la piedra

angular de nuestro éxito. Al usar nuestros productos, si encuentra algún problema o tiene alguna sugerencia, contáctenos, estaremos muy

agradecidos.

1. Póngase en contacto con el soporte técnico

Antes de ponerse en contacto con el soporte técnico, asegúrese de que su computadora cumpla con los requisitos del sistema enumerados

en la documentación del producto, proporcione la siguiente información: ÿ Descripción del problema: 1) Los archivos generados por el comando

hareport y la salida de cli->show-status o cluster-stat2 ) Describa cuándo ocurrió el problema por primera vez y qué se hizo en ese momento 3)

Cambios recientes en la configuración del software y cambios en la red ÿ Memoria disponible, espacio en disco ÿ Estructura de la red ÿ

Información sobre el enrutador, la puerta de enlace y la dirección IP

2. Información de contacto

Correo electrónico de servicio técnico: ha@gd-linux.com Teléfono

de servicio técnico: (86) 13318772180, 400-033-0108 extensión 2 Teléfono de la empresa: (86)

020-87048587/87048575/87048576 Fax de la empresa: (86-20) 87048317 Nombre de la empresa:

Guangdong Zhongxing New Pivot Technology Co., Ltd. Sitio web: http://www.gd-linux.com Dirección: Sala

601, Edificio E, No. 1021, Gaopu Road, Gaotang Software Park Base, distrito de Tianhe, Guangzhou

Código postal: 510663

103

También podría gustarte