Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de usuario
Tabla de contenido
Contrato de Libro ......................... ....................... ........................... ........................... ....................... ..........1 Componentes del
previos a la instalación................................... ... .................................................... ..................................3 2.1 Vista previa rápida del
proceso de construcción del clúster ....... ......................... ......................... ............................. ..................... ............3 2.2 Lista de
requisitos de hardware (hardware de virtualización) .................. ........................... ....................... ..........3 2.3 Requisitos de
software... .................................. ..................... ............ .................................................... .... ..................3 2.4 Otros ajustes del
secuencias de comandos del clúster de servicios .......... ...................... ................................ .......................... ................................. ........5
Capítulo 3 Instalación y registro ................................ .... .................................................... .................................................... .... ..........6 3.1
3.2 Registro del producto ..... ................. ..................................... ............. ............................................. ......... .............7 3.3
Capítulo 4. Gestión de la configuración del clúster a través de cli....... ............................... ................... .......................................... 9 4.1
RDS........ ........................................ .......... ............................................ ...... ..........................10 Capítulo 5. Configuración del clúster a
del servicio de clúster .................. ............................ ...................... ................................ .................. ...............36 5.5 Configuración
de la información de alarma (opcional) .................. ...... ............................................ ...........................................42 5.6 Arranque del
servicio ......... ........................ .......................... ............................ ...................... .......................... .................45 Capítulo 6. Pruebas de
7.3 Gestión de servicios ............. .................................................................. ........................ .......................... .......61 7.4 Gestión de
comandos.. ........................................... .................................................................. ........................ .......................... ..73 Capítulo 8 Comandos no interactivos del clúster .
9.1 Ídolo de alarma del clúster y descripción........................... ... ............................................................. ....... ................................86 9.2
A: Especificaciones para escribir secuencias de comandos de control empresarial ......... ....................... ........................... .................................. ...89
Apéndice B - Instrucciones para usar el Sistema de Registro en Línea del Clúster ................................ .............. ........................................ .......... ..95
ÿ Servicio inestable fracaso .................................................. ..................................... ............. ..................99 ÿ Falla fuera de línea
del vínculo del cerebro dividido/del latido del clúster .................. ..................................... ............. ..................... 100 ÿ Fallas de
prefacio
convenciones de libros
Formato significado
Los siguientes símbolos de seguridad pueden aparecer en este manual, y sus significados son los siguientes:
Indica que se pueden producir daños en el equipo o lesiones personales si se ignoran las advertencias de seguridad.
Peligro
lesión grave por accidente
Indica que se pueden producir daños en el equipo o lesiones personales si se ignoran las advertencias de seguridad.
advertir
accidente de lesiones
Indica que si no se ignoran las advertencias de seguridad, se pueden producir daños en el equipo, pérdida de datos,
Aviso
Reducción del rendimiento del dispositivo y otras consecuencias impredecibles
ilustrar
CD de cantidad
instalación de 1
componentes Introducción 1
1
Machine Translated by Google
Los productos de la plataforma Linux desarrollados de forma independiente por Dongzhongxing New Fulcrum Technology Co., Ltd. usan "RDS" para abreviar.
Este manual lo guiará para completar la construcción del entorno y lo presentará en detalle en un formato fácil de entender complementado con imágenes y textos.
paquetes/herramientas/ Directorio de documentación, incluido el manual del usuario y el manual de instalación fácil, notas de la versión
Si la versión del software en el CD del programa no es la última versión comercial, se recomienda que los usuarios la descarguen de nuestro sitio web en:
http://www.gd-linux.com
2
Machine Translated by Google
1. Familiarizado con los conceptos relacionados y el entorno de instalación del software de clúster, determine la arquitectura y el esquema de configuración, consulte 2.2 a 2.4 para obtener más detalles.
descripción de la sección.
2. Instale software comercial (como un programa de base de datos Oracle) para garantizar que el entorno de software comercial del servidor sea consistente. 3. Instale el
software del clúster y obtenga el archivo de licencia Para obtener más información, consulte el "Capítulo 3 Instalación". 4. Configure el software del clúster, lo que se puede hacer
desde la línea de comandos o la interfaz web. 5. Escriba la secuencia de comandos del clúster del servicio y asegúrese de que la secuencia de comandos del clúster pueda
iniciar, detener y detectar el servicio normalmente mediante la depuración en una sola máquina. Para obtener más información, consulte la "Sección 2.5 Escritura de la secuencia
de comandos del clúster del servicio". ". 6. Inicie el software del clúster, verifique el estado de ejecución del clúster, realice el cambio de servicio manual y la prueba de
simulación de fallas, y confirme que el servicio puede realizar la conmutación por error automáticamente. Para obtener más detalles, consulte el "Capítulo 6".
Lista de requisitos de hardware (hardware virtualizado) (la configuración de hardware del nodo es la
red)
Lista de soporte del sistema operativo: (si necesita brindar soporte para otros sistemas operativos o núcleos, debe comunicarse con nosotros)
-358.el6 .x86_64;2.6.32-431.el6.x86_64;2.6.32-504.el6.x86_64;2.6.32-573.el6.x86_64;2.6.32-642.13.1.el6.x86_64;2.6
.32-642 .el6.x86_64;2.6.32-696.el6.x86_64;
3
Machine Translated by Google
2.6.32-754.14.2.el6.x86_64;
2.6.32-754.2.1.el6.x86_64;
2.6.32-754.6.3.el6.x86_64;
2.6.32-754.9.1.el6.x86_64; 2.6.
32-754.el6.x86_64; 3.0.101-0.47.105-
predeterminado; 3.0.101-63-predeterminado;
3.0.76-0.11-predeterminado;
3.10.0-123.el7.x86_64; 3.10.0-229.1.
el7.x86_64;3.10.0-229.el7.x86_64;3.10.0-327.22.2.el7.10007601.x86_64;3.10.0-327.22.2.el7.x86_64;3.10.0-327.el7.x86_64;
(1) Todas las instalaciones requieren autoridad de usuario raíz, y el shell utilizado por el usuario raíz debe ser bash, como
(2) Establezca el nombre de host del sistema operativo de acuerdo con el plan del sistema. Los pasos de referencia de la
(3) Asegúrese de que el sistema operativo no haya realizado ninguna operación de refuerzo de seguridad en directorios o archivos (si se ha reforzado,
(4)
(5) Los siguientes puertos deben abrirse durante la configuración y el funcionamiento del clúster:
4
Machine Translated by Google
tcp, 10001, 10003 Comunicación de tarjeta de red Heartbeat, este puerto no se puede ocupar, de lo contrario no se puede iniciar el clúster
La secuencia de comandos del clúster del servicio especifica cómo iniciar, detener y detectar programas comerciales, lo cual está relacionado con /etc/init.d
La implementación de los scripts de servicio en el directorio es similar. Para estándares específicos, consulte el "Apéndice A - Reglas de scripting de clúster".
Fan", puede consultar las plantillas/ejemplos de script proporcionados en el directorio /etc/ha.d/resource.d para la escritura real
ÿ Las aplicaciones relacionadas con Java (como scripts weblogic, scripts tomcat) pueden hacer referencia a
ÿ Se pueden escribir otras aplicaciones (detectadas al verificar el proceso) haciendo referencia a oracle_example.ps,
El script para combinar la base de datos y la aplicación se escribe con referencia a sybase_app.ps;
Se recomienda que los usuarios no modifiquen estos scripts directamente. Pueden copiar copias de estos scripts y modificarlos sobre la base de las copias.
cambio.
5
Machine Translated by Google
Si es un archivo iso, cargue el archivo iso en el directorio /home/ del servidor en modo de transmisión binaria (bin),
Monte el archivo iso en el subdirectorio /mnt:
# /mnt/instalar
logrado 3
Haga /etc/ha.d/lic/newstartha.key
ha_kernel_dir: /mnt/kernels/3.10.0-693.5.2.el7.x86_64
Preparando... ############################# [100%]
1:drbd-utils-8.9.6-1 ########################### [ 33%]
2:drbd-proxy-2.0.0-1 ############################[ 67%]
3: drbd-km-3.10.0_693.5.2.el7.x86_64############################### [100% ]
[OK]
[OK]
Configurar la herramienta administrativa basada en web automáticamente como un servicio del sistema...
[OK]
¡Recuerde cambiar la contraseña web predeterminada después de iniciar manualmente la herramienta de administración web!
El(los) componente(s) está(n) instalado(s) por completo, debe configurarlo antes de ejecutarlo.
ilustrar:
1. Buzón de soporte técnico. Si tiene alguna pregunta o problema durante el uso, puede enviar un correo electrónico a este buzón . 2.
Ingrese el número de serie, que se utilizará cuando el producto del clúster se registre más adelante . 3. El archivo clave tiene sido generado
Nota: Todos los servidores deben instalarse con el software del clúster por separado; de lo contrario, el
clúster no se puede configurar. 1. Al cargar un archivo iso al servidor, debe cargarse en modo binario (bin) y en modo texto (ASCII).
2. Todos los servidores deben instalarse con software de clúster por separado.
3.2.1 Proceso general: obtenga el número de serie comercial/de prueba --> genere el archivo clave --> use el archivo clave para solicitar el
archivo de licencia --> cargue el archivo de licencia en el servidor correspondiente --> ejecute cli en la línea de comando o inicie sesión en la
Genere un archivo de clave; durante la implementación del producto, se le pedirá que ingrese el número de licencia del producto (que se puede encontrar en
la tarjeta "Acuerdo de licencia del nuevo producto Pivot" en la caja del producto) y el archivo de clave (newstartha.key) generado después de la implementación
se puede encontrar en / Encontrado en el directorio etc/ha.d/lic/, descargado al local con transmisión binaria (bin) y renombrado para una fácil identificación,
como newstartha_ip132.key, cada nodo en el clúster debe realizar los pasos anteriores. Solicite un archivo de licencia: Hay dos métodos de solicitud: aplicación
*) Solicitud en línea a través de la web; consulte el "Apéndice 1 - Instrucciones para usar el sistema de registro en línea de Newstart Cluster". *)
Solicitud manual; envíe un correo electrónico al correo electrónico de soporte técnico ha@gd-linux.com para realizar la solicitud, el correo electrónico
debe incluir lo siguiente información: Número de licencia del producto Nombre del artículo (para proyectos no nacionales, se debe agregar el país o
la región) Nombre del solicitante, correo electrónico laboral y número de contacto Todos los archivos clave (tenga en cuenta la distinción entre los
nombres de los archivos) Verifique la validez de la licencia; después obtener el archivo de licencia, cambie el nombre a newstartha.lic, y cada nodo
es newstartha. El contenido de lic es diferente. El archivo clave y el archivo de licencia deben estar en correspondencia uno a uno, y luego cargarse
en /etc. /ha.d/lic/ del servidor correspondiente en modo binario (bin). Finalmente, ejecute cli bajo el shell para verificar si la licencia es válida y se pasa
la verificación. Se mostrará el número de serie correcto y el Se mostrará el mensaje no válido "Archivos de licencia no válidos".
7
Machine Translated by Google
3.2.2 Prueba del producto: ejecute "nshacluster -product-switch rds" en la línea de comando
insinuación:
*) Este comando solo está disponible para sistemas operativos CGSL, el período de prueba es de solo 30 días
*) Si el clúster no se inicializa, cada nodo debe ejecutar este comando. La prueba es de 30 días. Cada entorno de clúster solo tiene
Puede probarlo una vez, si desea continuar con la prueba, debe contactarnos.
En este punto, la instalación del software está completa y, para usar el clúster, debe configurarse.
# /mnt/desinstalar
# /mnt/desinstalar
[OK]
Desinstalar DRBD...
[OK]
[OK]
8
Machine Translated by Google
La herramienta de configuración de administración de NewStart Cluster, cli, es una interfaz de línea de comandos. Aquí hay algunos consejos para usarla:
1. Haga doble clic en la tecla Tabulador o ejecute la ayuda para mostrar todos los comandos en el clúster.
3. Use la tecla Tabulador para completar automáticamente la entrada de la línea de comando al igual que el shell bash.
4. Pulse el botón de flecha hacia arriba para mostrar el último comando utilizado.
5. Al ingresar un valor de atributo, si el atributo ya tiene un valor anterior o un valor predeterminado, puede presionar directamente la tecla Intro para optar por mantener el valor anterior sin cambios.
6. El cli verifica la validez de los valores de los atributos de entrada (nodo local o nodo remoto).Si la verificación es incorrecta, la entrada
7. Ejecute el comando cluster-stat y presione "arriba" o "abajo" para seleccionar el servicio y presione Entrar para ver el estado de ejecución de todos los recursos del servicio.
8. Cuando ejecute el comando cluster-stat, presione Ctrl+C o "q" para volver a la cli. En el modo cli, presione Ctrl+C para salir de la cli.
Antes de la operación, planifique primero la configuración del clúster. El plan de configuración de este artículo es el siguiente:
enlace de latido
192.168.11.76, 192.168.11.77, 192.168.11.78, 192.168.11.79
Servicio de espejo Nombre del servicio: MRsrv (incluidos dos recursos de réplica r0, r1, gestiona la réplica como servicio)
recursos requeridos)
Nombre del servicio de servicio empresarial: ora_tom (una gestión de servicios dos aplicaciones: Oracle + tomcat)
9
Machine Translated by Google
Resumen de los comandos de inicialización (deben ejecutarse en el siguiente orden numérico de secuencia)
Sugerencia: El proceso de inicialización en cli es un proceso de operación interactivo. El valor entre corchetes "[]" en el indicador indica que puede ingresar
El valor entre paréntesis "()" indica el valor de entrada recomendado y el retorno de carro indica directamente el valor entre paréntesis.
Al ejecutar este comando, se generará un nuevo archivo de configuración del clúster y se perderá la configuración del clúster original. El proceso de inicialización es el siguiente:
- Nombre de host
y servicios
1
Ingrese el nombre del clúster: [q] rds_cluster
Ingrese el nombre del primer nodo y la IP separados por espacios: [q] linux76
192.168.8.76 2
Ingrese el nombre del segundo nodo y la IP separados por espacios: [q] linux77
192.168.8.77
¿Desea continuar agregando nodos? [s/n] (s)
Ingrese el nombre del tercer nodo y la IP separados por espacios: [c,q] linux78
192.168.8.78
¿Desea continuar agregando nodos? [s/n] (s)
Ingrese el nombre del cuarto nodo y la IP separados por espacios: [c,q] linux79
192.168.8.79
10
Machine Translated by Google
6
Seleccione un tipo: [0-1,q] (0)
NIC detectadas en el clúster: ens192 ens224 ens256 Introduzca un
dispositivo de red para latido de unidifusión: [q] (ens192) ens224 7 Introduzca la dirección
13
¿Desea agregar un nodo de dominio? [s/n] y Seleccione
nodos para el 1.º nodo de dominio:
0ÿlinux76 1ÿ
linux77 2ÿ
linux78 3ÿ
linux79
nombre de la partición (/dev/sdc): [q] /dev/vg02/lv01 Advertencia: todos los datos en/
11
Machine Translated by Google
de registro: /var/log/ha-log
keepalive: 3 deadtime: 100
watchdog: off ucast: ens224
192.168.11.76 192.168.11.78
ucast: ens256 192.168.12.76 192.168.11.77
192.168.11.79
192.168.12.77
192.168.12.78 192.168.12.79
worklink_hb:
auto_failover: Apagado
auto_run: en
maximización: seguridad de datos
kernel_panic: off
lockdisk: /dev/vg02/lv01 nodo_dominio:
linux76 linux77 nodo_dominio: linux78 linux79
15
¿Es correcta esta información? [s/n, q] (s)
Ejecute mirror-init para inicializar su recurso espejo.
Instrucciones: 1. Personalice el
nombre del clúster. 2. Ingrese el nombre del nodo y la dirección IP. El nombre del nodo debe ser el mismo que uname -n (es decir, el nombre real de la máquina) y la dirección
IP debe ser la dirección IP física de la tarjeta de red (se recomienda la IP de la tarjeta de red heartbeat). configure varias direcciones IP para cada nodo, separadas por
espacios. 3. Intervalo de comunicación de latidos del grupo, rango de valores: 1~10, en segundos. 4. Juzgando el intervalo de tiempo muerto (también llamado tiempo muerto)
de otros nodos, es decir, cuánto tiempo lleva recibir paquetes de latidos de un nodo, el nodo se considera muerto, el rango de valores: 15 ~ 300, la unidad es segundos. Al
aplicar en escenarios de virtualización, se debe tener en cuenta que el tiempo de inactividad de la configuración del clúster debe ser menor que el tiempo de inicio del sistema
operativo de la máquina virtual (por ejemplo, la diferencia entre los dos es de 5 segundos) para evitar el impacto del sistema operativo. el tiempo de reinicio es demasiado corto.
5. Si desea habilitar la función Watchdog que viene con el clúster. Para obtener más información, consulte las precauciones a continuación. No está habilitada de forma
predeterminada. 6. Configure el enlace de latido, el tipo de latido aquí es latido de unidifusión (el tipo de latido está determinado por el tipo de clúster, el usuario puede operar
de acuerdo con el asistente interactivo, la operación es similar), soporte ipv4 o ipv6, preste atención a la nombres de tarjetas de red de todos los nodos en el clúster Debe ser
coherente, de lo contrario, habrá problemas. Al aplicar en un escenario de virtualización, preste atención: las dos NIC virtuales utilizadas como dos latidos deben corresponder
a diferentes NIC físicas para evitar una situación en la que una NIC física falle y todos los latidos del clúster se desconecten. 7. Ingrese el nombre de la tarjeta de red de latidos
y luego presione Entrar directamente para completar la configuración del primer enlace de latidos.
12
Machine Translated by Google
8. Si desea agregar otro enlace de latido, seleccione y aquí y repita las operaciones en 7 arriba.
9. Si habilitar el enlace NIC en funcionamiento como un enlace de latido de respaldo: cuando está habilitado, si la cantidad de enlaces de latido normales es inferior a dos,
Esta función surte efecto; si el enlace de latido fallido se recupera y el número de enlaces de latido normales es mayor o igual a dos, esta función se desactiva temporalmente.
Efectivo, el tipo de latido habilitado aquí es latido de multidifusión.Si el entorno de red donde se encuentra el clúster tiene restricciones en la transmisión de paquetes de multidifusión, no se establece.
10. Estrategia de cambio de servicio, n representa el cambio manual de fallas comerciales e y representa el cambio automático de fallas comerciales.
11. Seleccionar dos estrategias de procesamiento en el proceso de replicación síncrona de datos: maximizar la seguridad de los datos y maximizar el servicio continuo;
El primero enfatiza la seguridad de los datos, dando prioridad a garantizar la consistencia de los datos del usuario, y es adecuado para aplicaciones que requieren una consistencia de datos relativamente alta.
Se da prioridad a garantizar la disponibilidad de los servicios de los usuarios, lo que es adecuado para los usuarios que tienen altos requisitos de disponibilidad del servicio, pero no les preocupa la pérdida de algunos datos.
aplicaciones sensibles.
12. Si habilitar la función de pánico del kernel de Linux (pánico del kernel); para garantizar la seguridad de los datos, cuando el clúster es anormal, el
Por ejemplo, cuando el proceso secundario falla durante la operación o cuando el servicio no se detiene, se activa el pánico del kernel para reiniciar el servidor y el negocio del usuario.
Cambie a la máquina en espera.Dado que la parada del servicio está estrechamente relacionada con el script del clúster, se recomienda desactivar esta función en la etapa de depuración del clúster y la depuración se completa.
13. Configure el dominio de nodos, aquí está la configuración de 2+2 (local + remoto), necesita configurar dos dominios de nodos, cada dominio está configurado con dos nodos
El disco de quórum es una solución para garantizar la seguridad de los datos cuando se interrumpen todos los latidos del clúster (cerebro dividido).
La matriz de discos se divide en una partición pequeña (más grande que 30 M), no se crea ningún sistema de archivos y los nodos del clúster leen y escriben esta partición al mismo tiempo.
Particionamiento, intercambio de información actual de los miembros, prevención de la ocurrencia de cerebros divididos y garantía de la seguridad de los datos. Se recomienda la configuración si las condiciones lo permiten.
15. Confirme si la información de configuración completada es correcta. Si es incorrecta, ingrese "n" para reiniciar. Si es correcta, ingrese
“y”ÿ
Aviso:
El mecanismo WatchDog se basa en el módulo softdog (comúnmente conocido como "soft dog") que viene con el sistema Linux.
up) o "crash" (choque) reiniciar automáticamente el sistema. Si el servidor está configurado con un perro guardián de hardware (es decir, "perro duro"),
Recomendamos deshabilitar perros suaves. Condiciones para que Watchdog reinicie el sistema:
1) El disco de quórum está configurado y el software de clúster está "suspendido" durante más de 60 segundos y no puede escribir en el disco de quórum;
2) No hay ningún disco de arbitraje configurado y el software de clúster está "suspendido" durante más de 60 segundos y no puede enviar paquetes de latidos.
En este punto, se completa la configuración de cluster-init. Si necesita modificar la configuración, puede usar el comando cluster-modify para modificarla.
Al ejecutar este comando, se generará un nuevo archivo de configuración de recursos de imagen y se perderá la configuración de imagen original. El proceso de inicialización es el siguiente:
cli:~> espejo-iniciar
======================================
- Dirección IP espejo
-
Tipo de sistema de archivos Entrada
13
Machine Translated by Google
1
nombre del recurso: [q] (r0)
2
Número de puerto de entrada: [1-65535,q] (7788)
3
Ingrese la dirección IP del espejo para linux76: [q] 192.168.11.76 192.168.12.76 Ingrese
4
un disco usado para almacenar datos en linux76: [q] /dev/vg01/lv01 Ingrese la dirección
IP del espejo para linux77: [q] 192.168.11.77 192.168. 12.77 Ingrese un disco usado
para almacenar datos en linux77: [q] /dev/vg01/lv01 Ingrese la dirección IP espejo para
linux78: [q] 192.168.11.78 192.168.12.78 Ingrese un disco usado para almacenar datos
en linux78: [q] / dev/vg01/lv03 Ingrese la dirección IP del espejo para linux79: [q]
192.168.11.79 192.168.12.79 Ingrese un disco usado para almacenar datos en linux79:
[q] /dev/vg01/lv03 Ingrese memlimit para proxy r0 [200M/G] : [q] (200M) seleccione
5
política de compresión de datos para proxy
nombre: r0
dispositivo:/dev/drbd0
14
Machine Translated by Google
Todos los datos de /dev/vg01/lv01 en el nodo linux76 serán destruidos. ¿Estás seguro de
9
continue? [y/n] (y)
Todos los datos de /dev/vg01/lv03 en el nodo linux78 serán destruidos. ¿Estás seguro de continuar? [s/n] (s)
10
Elija la fuente de sincronización para el recurso r0: [0-1,q] 0
resincronizado: 100.0 %
Qué tipo de sistema de archivos desea formatear /dev/drbd0(recurso espejo: r0) a:11
0) ext2 1)
ext3 2)
ext4 3)
xfs 4)
ninguno
32768 bloques por grupo, 32768 fragmentos por grupo 8192 inodos
15
Machine Translated by Google
ilustrar:
1. Personalice el nombre del recurso de imagen para la identificación interna del clúster. 2.
Personalice el puerto de enlace espejo. 3. Ingrese la IP de la tarjeta de red física que el nodo
puede usar para la comunicación de enlace espejo.Se pueden configurar varias IP separadas por espacios. 4. Ingrese el nombre de la partición de almacenamiento
5. Duplicar el tamaño de caché del proxy, el valor predeterminado es 200 M y el rango de valores es ilimitado. El valor apropiado se puede
determinar de acuerdo con el volumen de datos del servicio durante las horas pico. Estimación simple: valor de caché de proxy = (tasa de
volumen de datos del servicio M/s - banda ancha rate M/ s)* tiempo pico/segundo 6. Seleccione la tasa de compresión de los datos transmitidos,
Más equilibrado, adecuado para la configuración recomendada en la mayoría de los escenarios, la relación de compresión alta es
adecuada para escenarios con un gran retraso de red 7. Confirme si la configuración es correcta 8. Si desea agregar un segundo recurso
espejo, seleccione n aquí. 9. La partición de almacenamiento donde se almacenan los datos comerciales debe formatearse por primera vez.
Seleccione y aquí y presione Entrar . 10. Seleccione la fuente de sincronización de datos, donde se sincronizan los datos comerciales. Debe seleccionar el
nodo donde se los datos comerciales existen como la fuente de sincronización.Si no hay datos comerciales, la fuente de sincronización se selecciona primero según
En este punto, se completa la configuración de mirror-init. Si necesita modificar la configuración, solo puede eliminar el espejo
En general, este comando solo se utiliza en la configuración inicial del servicio, si se ejecuta este comando, se perderá la configuración original.
El ejemplo de operación del comando es el siguiente: (El archivo de configuración es /etc/ha.d/haservices.xml en Linux) Nota: Antes de configurar
los recursos de IP para los servicios, debe configurar los recursos de la tarjeta de red.
cli:~>inicio-servicio
======================================
sistema HA
flotante.
dieciséis
Machine Translated by Google
0) linux76 1)
linux77 2)
linux78 3) linux79
4
Seleccione uno o más nodos separados por espacios: [0-3,q] 0 1 2 3 ¿Desea configurar los nodos
5
preferidos? [t/n, q] (n)
6
Tiempo de espera de inicio de entrada: [q] (240)
7
Tiempo de espera de parada de entrada: [q] (360)
8
Intervalo de verificación de entrada: [q] (30)
9
Tiempo de espera de verificación de entrada: [q] (60)
10
Número máximo de errores de entrada: [q] (1)
11
¿Reiniciar después de que falle el resultado de la verificación? [t/n, q] (n)
12
¿Iniciar el servicio de todos modos cuando existe una IP flotante? [t/n, q] (n)
nombre: ora_tom
multinstance: no habilitado:
sí starttimeout: 240
stoptimeout: 360
checkinterval: 30
checktimeout: 60
maxlockcount: 0
13
¿Es correcta esta información? [s/n, q] (s)
Descripción:
1. Personalice el nombre del servicio, que se utiliza para la identificación interna del
clúster, el llamado "servicio" es un grupo de recursos administrado por el software del clúster, que puede incluir programas comerciales, direcciones IP flotantes,
interfaces de red, almacenamiento dispositivos de bloque, puntos de montaje del sistema de archivos, etc. recurso. El nombre del servicio lo define el usuario y
generalmente está relacionado con el nombre comercial. Por ejemplo, el nombre del servicio de oracle puede ser "oracle", y el nombre del servicio de tomcat
puede ser "tomcat" 2. Ya sea para configurar el servicio de instancias múltiples, el servicio de instancias múltiples puede entenderse simplemente como la
17
Machine Translated by Google
Si debe ser administrado por el clúster, el valor predeterminado es sí, y presione Entrar directamente, si selecciona no, el clúster no se iniciará cuando se inicie el clúster.
Servicio móvil.
4. Seleccione el nodo que ejecuta el servicio, en resumen, seleccione las máquinas principales y de reserva que ejecutan el
servicio 5. El nodo de prioridad significa que cuando el sistema de clúster implemente automáticamente el servicio, dará prioridad a la ejecución en
este nodo. Si el nodo prioritario falla o se reinicia Después de volver a unirse al clúster, el servicio que se ejecuta en el nodo no prioritario se
revertirá al nodo prioritario. La diferencia entre el nodo prioritario y la prioridad de inicio del servicio es que el primero tiene una función de
6. El tiempo máximo para iniciar el servicio, si la aplicación se inicia durante mucho tiempo, se puede aumentar adecuadamente, como 120
segundos, 7. El tiempo máximo para detener el servicio, si la aplicación se detiene durante mucho tiempo, se se puede aumentar adecuadamente,
como 180 segundos 8. Servicio de detección El intervalo de tiempo, es decir, cuánto tiempo para verificar el estado del servicio, el valor predeterminado
es 30 segundos Nota: si hay dependencias entre varios servicios, el intervalo de detección de estos los servicios deben ser consistentes 9. El
tiempo de espera del servicio de detección, es decir, cuánto tiempo para ejecutar el script. Si no se devuelve el tiempo, la detección falla, el valor predeterminado
60 segundos;
cambiar 11. Si el clúster realiza un reinicio local cuando el servicio no se detecta regularmente, en caso afirmativo, primero detenga los
recursos del servicio y luego inicie el servicio en la máquina local, si el inicio falla, cambie al nodo de copia de seguridad, si no,
primero detenga los recursos del servicio y luego inicie el servicio en el nodo de copia de seguridad, 12. Si desea establecer la
opción de inicio de todos modos del servicio, el valor predeterminado es no, seleccione sí, no haga ping a la IP flotante al iniciar el
servicio, puede acelerar la velocidad de inicio del servicio, solo para probar, 13. Confirme si la información anterior es correcta,
Tipos de recursos:
0) NADA
1) propiedad intelectual
2) Aplicación
3) Montaje en disco
4) RawDisk b)
Crítico
Habilitar
17
¿Quieres continuar? [s/n] (s)
18
Ingrese el nombre de PubNIC: [q] (oracle_nic_0)
19
¿Es crítico el recurso? [s/n, q] (s)
20
¿Está habilitado el recurso? [s/n, q] (s)
18
Machine Translated by Google
sí habilitar: sí networkhostip:
ens192
14. Comience a configurar los recursos relacionados del servicio, incluida la tarjeta de red comercial, la IP comercial y los servicios comerciales que necesita usar el servicio.
debe configurarse para los recursos de la tarjeta de red, 17. Pregunte si desea iniciar la configuración, seleccione y para bajar, seleccione n
para volver al paso anterior, aquí seleccione y 18. El nombre del recurso de la tarjeta de red, identificación interna, simplemente presione Entrar
19. Si desea establecer el recurso de la tarjeta de red como el recurso clave, la llamada clave El recurso es que todo el servicio se cambiará cuando
el recurso sea anormal, solo presione Entrar 20. Si es administrado por el clúster, el valor predeterminado es sí, y presione Entrar
directamente 21. Puede entenderse como la cantidad de enlaces comerciales utilizados para el servicio, si solo hay un enlace, seleccione único, si
hay varios, seleccione múltiples, solo hay un enlace comercial ens192, seleccione único;
si desea aumentar la IP del host existente en la red, se recomienda configurar, seleccione sí;
La función de esta configuración es detectar si la red del propio nodo es normal, el principio es que mientras alguno esté configurado
Si se puede hacer ping a la IP, significa que la red del nodo en sí es normal.Si no se puede hacer ping, significa que la
red es anormal;
PD: si el servicio debe usarse para almacenamiento en red (arreglo de discos iscsi), la IP aquí debe completar la IP del
26. Ingrese la IP del host que existe en la red (admite dirección ipv4 o ipv6), esto será verificado y se reportará un error al ingresar una IP no
existente, se pueden configurar múltiples separados por espacios 27 Si desea agregar más hosts que existen en la red IP, uno ha sido
configurado aquí, seleccione No. 28. Indique la lista de información de configuración de recursos de la tarjeta de red;
19
Machine Translated by Google
29. Confirme si la información de configuración es correcta, seleccione y correctamente, de lo contrario, seleccione n para
reconfigurar el recurso 30. Si desea agregar otro recurso de tarjeta de red, que puede admitir más configuraciones,
seleccione no aquí 31. Pregunte si desea agregar otros recursos del servicio, aquí elija sí;
Tipos de recursos:
0) NADA
1) propiedad intelectual
2) Aplicación
3) Montaje en disco
4) RawDisk b)
Volver al menú anterior
34
¿Quieres continuar? [s/n] (s)
35
Ingrese el nombre de IP: [q] (oracle_ip_0)
36
¿Es crítico el recurso? [s/n, q] (s)
37
¿Está habilitado el recurso? [s/n, q] (s)
Elija un tipo de IP: 0) IPv4 1) IPv6
Seleccione un
tipo: [0-1,q] (0) 0
38 NIC descubiertas en linux76:
ens192 ens224 ens256 39 Ingrese un dispositivo de red: [q] (ens192)
40
41
Dirección IP de entrada: [q]192.168.8.62
42
Máscara de red de entrada: [q] (255.255.255.0)
43
¿Está utilizando la misma configuración en los nodos restantes? [s/n] (s)
Verificación de información de recursos IP:
nombre: oracle_ip_0
crítico: sí habilitar: sí
nombre de nodo: linux76
PubNICResNombre: ens192
20
Machine Translated by Google
PubNICResNombre: ens192
presione Entrar para seleccionar y 37. Si está administrado por el clúster, presione
Entrar para seleccionar y 38. Seleccione el tipo de IP flotante configurada, admite IPv4 e IPv6, y seleccione IPv4 aquí
39 .Enumere los dispositivos de tarjeta de red disponibles 40. Seleccione la tarjeta de red de enlace de servicio , aquí
seleccione ens19;
41. Ingrese la IP del servicio, que previamente está planificada como 192.168.8.62,
correctamente 45. Si desea agregar otro recurso de IP comercial que pueda admitir más configuraciones, seleccione n
aquí 46. Pregunte si desea agregar otros recursos del servicio, seleccione y aquí ;
Tipos de recursos:
0) NADA
1) PI
2) Aplicación
3) Montaje en disco
4) RawDisk b)
Crítico
Habilitar
Un guión de aplicación
Recuento de fallas en el tiempo de espera de verificación
21
Machine Translated by Google
48
¿Quieres continuar? [s/n] (s)
49
Introduzca el nombre de la aplicación: [q] (oracle_app_0)
sí habilitar: sí secuencia de
comandos: /home/script/
54
¿Es correcta esta información? [s/n, q] (s)
55
¿Añadir otro recurso de aplicación? [t/n] (n)
47. Elija aumentar los recursos de la aplicación, principalmente para configurar aplicaciones comerciales, aquí está Oracle;
49. Aplique el nombre del recurso, identificación interna, solo presione Entrar, 50. Complete
la ruta completa del script del clúster. El denominado script de clúster es el script utilizado por el clúster para gestionar y controlar los servicios 51. Establezca
el número de veces que se agota el tiempo de espera de detección de recursos del servicio como procesamiento de errores, lo que activará el cambio de
servicio. 0 significa que no hay procesamiento de errores y el el valor predeterminado es 0. Al configurar el número de tiempos de espera de detección,
se recomienda usarlo con kernel_panic, es decir, para abrir kernel_panic, consulte la operación: modificación de clúster; PD: cuando el número de
tiempos de espera de detección se establece en mayor que 1, el valor del recuento máximo de errores de entrada previamente configurado debe
permanecer como predeterminado El valor es 1, es decir, los valores de los dos parámetros no se pueden modificar para que sean mayores que 1 al
mismo tiempo 52. Si está configurado como un recurso clave, presione Ingrese para seleccionar y 53. Si está administrado por el clúster, presione Entrar para
seleccionar y 54. Confirme si los recursos de la aplicación configurados son correctos, elija y correctamente 55. Si desea agregar otro recurso de la aplicación,
puede admitir más configuraciones 56. Pregunte si desea agregar otros recursos del servicio, elija y aquí ;
Tipos de recursos:
0) NADA
1) PI
2) Aplicación
3) Montaje en disco
4) RawDisk b)
22
Machine Translated by Google
Crítico
Habilitar
un punto de montaje
Grupo
Modo
Opciones
stopWhenRO que se usa para determinar si se detiene el servicio, cuando el sistema de archivos es
de solo lectura
FsckOpt que solía determinar si usar fsck para reparar el sistema de archivos
58
¿Quieres continuar? [s/n] (s)
59
Introduzca el nombre del montaje en disco: [q] (oracle_dm_0)
60
¿Es crítico el recurso? [s/n, q] (s)
61
¿Está habilitado el recurso? [y/n,q] (y) 0)
nombre: oracle_dm_0
23
Machine Translated by Google
usuario: oráculo
opciones: rw
limitación: 90
stopWhenRO: sí
FsckOpt: no
almacenamiento de red: no
68
¿Es correcta esta información? [s/n, q] (s)
69
¿Agregar otro recurso de montaje en disco? [t/n] (n)
70
¿Quieres añadir otro recurso? [s/n] (s) n
71
¿Quieres añadir otro servicio? [t/n] (n)
Ejecute cluster-start para iniciar el sistema HA, o ejecute cluster-restart para reiniciar el sistema HA.72 cli:~>
57. Elija agregar recursos de almacenamiento DiskMount, el plan aquí es el dispositivo /dev/sdb2 58. Pregunte
si desea iniciar la configuración, seleccione y para ejecutar 59. Nombre del recurso de almacenamiento
compartido, identificación interna, simplemente presione Entrar 60. Si para configurar Establecer como un
recurso clave, presione Entrar para seleccionar y 61. Si está administrado por el clúster, presione Entrar para
seleccionar y Seleccione el tipo de almacenamiento, aquí está la imagen, seleccione drbd, otros tipos de
62.
almacenamiento se describen brevemente como de la siguiente manera: 0) disco: dispositivo de bloque
ordinario (p. ej., /dev/sda) 1) nfs: almacenamiento nfs (p. ej., 192.168.8.x:/nfsshare) 2) lvm: grupo de
volúmenes lógicos (p. ej., /dev/vg01/lv01) 3 ) drbd - dispositivo espejo (por ejemplo, /dev/drbd0)
Sugerencia: Para la versión rds, se agregará automáticamente un servicio espejo (nombre predeterminado: MRsrvx) cuando se agregue el
recurso de almacenamiento de tipo drbd, y el servicio actualmente configurado dependerá del servicio espejo, y también se eliminará
automáticamente cuando se se elimina el recurso. 63. Seleccione el dispositivo espejo drbd0 para configurar. 64. Introduzca el directorio de
punto de montaje punto de montaje del dispositivo (es decir, directorio Linux), dos nodos deben tener el mismo
punto de montaje, tipo de sistema de archivos fstype, usuario usuario operativo para montar el directorio, grupo
de usuarios operativos, permiso de modo para montar el directorio, opciones de montaje 65. Establezca el
porcentaje de uso del espacio del dispositivo. Si el porcentaje de uso excede este valor, el registro generará
información de alarma. Si detener el servicio cuando la partición de datos pasa a ser de solo lectura; aquí se
agrega que el almacenamiento de red (NetStorage) no admite esta propiedad; 67. Cuando el dispositivo no se
monta, si intentar usar fsck para repararlo; 68. Confirme la configuración Si el recurso DiskMount es correcto 69. Si debe
66.
agregar otro recurso DiskMount, que puede admitir múltiples configuraciones;
24
Machine Translated by Google
70. Preguntar si agregar otros recursos del servicio, seleccione n aquí 71.
En este punto, la configuración de inicialización de service-init se completa y la configuración de inicialización del clúster en la cli también se ha completado.
Después de inicializar y configurar el clúster, se puede iniciar el clúster. Aquí hay algunos puntos a
tener en cuenta: *) Para iniciar el clúster, ejecute el comando en cualquier nodo *) Los servicios
(grupos de recursos) administrados por el clúster se iniciarán automáticamente con el clúster *) Entre
servicios El método de inicio es serial (es decir, inicio por servicio), por defecto, de acuerdo con el orden de configuración
del servicio cli:~>cluster-start Archivo de configuración verificado ok.[linux77]Inicio de servicios de alta disponibilidad : Hecho.
.
[linux76] Iniciando servicios de alta disponibilidad: el archivo de
configuración se verificó correctamente.
Hecho.
.
[linux78] Iniciando servicios de alta disponibilidad: el archivo de
configuración se verificó correctamente.
Hecho.
.
[linux79] Iniciando servicios de alta disponibilidad: el archivo de
configuración se verificó correctamente.
Hecho.
.
CLI:~>
25
Machine Translated by Google
Ingrese nuevamente al estado del webadminserver , corriendo indica que la web se inició exitosamente
Antes de iniciar sesión en la web , debe importar el certificado. La ruta del certificado es /opt/NewStartHA/web/nginx/conf/mykey.p12.
Navegadores recomendados: Chrome, Firefox, IE10 . Los pasos de la operación son los siguientes: 5.1 .1 Tome Google Chrome como
26
Machine Translated by Google
27
Machine Translated by Google
5.1.5 Busque la ruta del archivo del certificado descargado, seleccione "Todos los archivos" en el cuadro desplegable y busque el archivo del
certificado "mykey"
28
Machine Translated by Google
5.1.8 Seleccione "Seleccionar automáticamente el almacenamiento de certificados según el tipo de certificado" y haga clic en "Siguiente"
29
Machine Translated by Google
30
Machine Translated by Google
5.1.11 Cierre el navegador, vuelva a abrir el navegador e ingrese los siguientes requisitos para ingresar a la interfaz de inicio de sesión web: https:// IP
física del nodo: 10003 como: https://192.168.1.19:10003, haga clic en "Continuar para ir "
31
Machine Translated by Google
Nota:
cuando se produzca una excepción de acceso, compruebe el efecto del cortafuegos y si el puerto está ocupado.
5.2 Configuración de inicialización de clúster (Tome el tipo 2+2 como ejemplo para la configuración)
Nota:
32
Machine Translated by Google
autodefinido: si el tipo es 2+1, habrá un nodo menos en el host del clúster y el dominio del nodo; disco de arbitraje: una
solución para garantizar la seguridad de los datos cuando se interrumpen todos los latidos, recomendado Uso, el disco de arbitraje bajo el dominio del nodo es similar y también es opcional;
Una vez completada la configuración, haga clic en Guardar y se le indicará que la modificación se realizó correctamente. No es necesario que reinicie el clúster para la primera configuración.
Después de que la configuración de los parámetros del clúster sea exitosa, saltará automáticamente a la página de monitoreo
Nota:
33
Machine Translated by Google
Nota:
Enlace de latido de NIC: admite IPv4 e IPv6, se recomienda configurar el latido del corazón de unidifusión y se recomienda configurar dos o más latidos del corazón
34
Machine Translated by Google
Nota:
Nombre del recurso: se puede personalizar, rx predeterminado (x:0,1,2,....) Dispositivo
de disco: el dispositivo de disco se refiere a la partición (también llamada partición de datos) que almacena datos comerciales. Si la partición de datos en el entorno tiene datos, no es
necesario completar el sistema de archivos; de lo contrario, se borrarán todos los datos comerciales. Fuente de sincronización: los datos comerciales se
sincronizan y el nodo con datos comerciales debe seleccionarse como fuente de sincronización. Si no hay datos comerciales, entonces
Nota:
El disco espejo se está sincronizando
35
Machine Translated by Google
36
Machine Translated by Google
Nota:
Nombre del servicio: Se identifica dentro del clúster y se define por sí
mismo. Tipo de servicio: el tipo común hace referencia a los servicios comerciales (como Oracle, Tomcat, etc.) Nodo
de dominio: el nombre del nodo en el clúster, es decir, el nombre del host. Orden de inicio de nodos de dominio: el
orden de inicio de los nodos en el clúster. Nodo de prioridad: principalmente se refleja que cuando se recupera la
falla, el servicio volverá al nodo de prioridad. Número máximo de errores: cuántas veces comenzar a cambiar cuando se
detecta un error.
37
Machine Translated by Google
Nota:
Parámetros de atributos de servicio: se pueden modificar y
Configuración de NIC
Nota:
Nombre del recurso de la tarjeta de red pública: personalizado, el valor predeterminado es el nombre del servicio _nic_x
(x:0,1,2,....) IP de host de terceros: se refiere a la IP válida existente en la red, utilizada para detectar si el propio la red es normal; Nombre del
dispositivo: se refiere a la tarjeta de red de servicio que agrega recursos NIC correctamente
38
Machine Translated by Google
Nota:
Recurso de NIC público: puede agregar varios recursos de NIC
configuración IP
Nota:
Tipo de IP: compatible con IPv4 e IPv6 Tarjeta de
red pública Nombre del recurso: para que sea coherente con la tarjeta de red del recurso configurado
NIC Dirección IP flotante: debe ser una dirección a la que se pueda hacer ping
Nota:
39
Machine Translated by Google
Nota:
del dispositivo de disco: si se selecciona drbd para el formato de archivo, el disco seleccionará automáticamente drbd0 Sistema de
archivos: Se admite principalmente cualquier sistema de archivos que se pueda montar correctamente de forma manual. Porcentaje de
umbral de capacidad: significa que cuando la capacidad del almacenamiento compartido supere el porcentaje establecido, se le solicitará. Detener cuando el disco
sea de solo lectura: el servicio se detiene cuando el sistema de archivos del almacenamiento compartido pasa a ser de solo lectura.
Nota:
40
Machine Translated by Google
Nota:
Ruta de la secuencia de comandos de la aplicación: la secuencia de
comandos empresarial detecta la cantidad de tiempos de espera. Cuando el manejo de errores: cuando se alcanza la cantidad de tiempos de espera, se manejará como un error, que es una excepción de recurso.
Nota:
Recurso de la aplicación: se pueden agregar múltiples recursos de la aplicación
servicio MRsrv0
41
Machine Translated by Google
Nota:
Para la versión rds, se agregará automáticamente un servicio espejo (nombre predeterminado: MRsrvx) cuando se agregue un recurso de almacenamiento de tipo drbd, y el
servicio configurado actualmente dependerá del servicio espejo, y también se eliminará automáticamente cuando el recurso es eliminado El servicio espejo se generará
42
Machine Translated by Google
Nota:
Atributo de equipo: el valor predeterminado es público, que se puede cambiar a un grupo privado según sea necesario.
Configure la tarjeta de red, la dirección IP, la máscara y el puerto de la fuente de la alarma: es decir, configure el origen de la información de la alarma.
Nota:
Configure la IP y el puerto de destino de la alarma: es decir, configure el receptor de información de la alarma
43
Machine Translated by Google
Haga clic en "Supervisión del servicio" - haga clic con el botón derecho en "cualquier nombre de nodo" - seleccione "Comenzar todo"
Nota:
Se puede iniciar en un solo nodo o se pueden iniciar todos los nodos
Nota:
Estado del servicio: vea el estado de ejecución del clúster y del servicio;
Servicio de alarma NshaService, servicio de espejo MRsrv, servicio aaa: el estado del servicio se está ejecutando normalmente, en un estado manejable Estado de
44
Machine Translated by Google
Seleccione el servicio "aaa" > haga clic con el botón derecho en "Migrar" > seleccione el nodo migrado "linux28"
Nota:
El servicio aaa se detiene en el nodo 26 y se ejecuta en el nodo 28, y el cambio de servicio es exitoso;
45
Machine Translated by Google
El software del clúster se ha sometido a varias pruebas rigurosas antes de salir de fábrica, pero está relacionado con el sistema, el hardware y los scripts comerciales.
Las siguientes dos pruebas deben realizarse en el sitio del proyecto para garantizar que la máquina en espera pueda hacerse cargo automáticamente del negocio. y lograr un
I. Inicie el software del clúster, verifique el funcionamiento del clúster y realice la prueba de cambio de servicio para confirmar que el servicio se puede cambiar
correctamente (incluidos dos tipos de cambio del host a la máquina en espera y de la máquina en espera al host) ; realizar pruebas comerciales para
II Prueba de falla: si el programa del clúster de nodos se reinicia automáticamente y se une al clúster, el host se reinicia o se apaga
Si el servicio del servidor se puede cambiar al servidor en espera; generalmente no se requieren otras pruebas de falla.
46
Machine Translated by Google
El comando interactivo (cli) es relativamente simple, siempre que presione el asistente de operaciones interactivas, puede completar rápidamente las operaciones requeridas.
modify cluster-show heartbeat- Inicialización de la configuración del clúster, generación de archivos de configuración del clúster
inicio de servicio Inicialización de la configuración del servicio, generar archivo de configuración del servicio
añadir recurso-borrar recurso- Agregar recursos relacionados para un servicio (grupo de recursos)
archivo de configuración
interruptor de modo espejo inicio de clúster Conmutación de tipo de clúster remoto o dentro de la ciudad
servicio-detener servicio- Detenga el servicio manualmente, siempre que el clúster esté activo
Gestión De Servicios Servicio de gestión y control de clústeres, la configuración por defecto es el estado de gestión y control
estado
servicio-deshabilitar Los servicios están separados de la administración y el control de clústeres y, a menudo, se usan para negocios en línea.
mejora
47
Machine Translated by Google
deshabilitar recurso-crítico Los recursos están fuera del control del clúster
Administracion de recursos
recursos no críticos Establezca recursos como recursos no críticos, las fallas no fallarán
Cambio
snmp-add Elimina Configure la IP de origen de la alarma y la IP de la alarma (IP final de gestión de red)
la si
snmp-modify comprueba IP de la fuente de alarma y la configuración del puerto
check-config retrieve- todos los archivos de configuración del clúster están configurados correctamente
Operar los archivos de configuración involucrados en el clúster, incluido el archivo de configuración del clúster (/etc/ha.d/ha.cf),
modificación de clúster
Formato: cli->cluster-modify
cli:~>modificación de clúster
6) mantenimiento: 3
7) tiempo muerto: 60
48
Machine Translated by Google
8) perro guardián:
desactivado 9) ucast: ens224 192.168.11.76 192.168.11.77 192.168.11.78
192.168.11.79
10) ucast: ens256 192.168.12.76 192.168.12.77 192.168.12.78
192.168.12.79
11) worklink_hb: desactivado
12) auto_failover: desactivado
13) auto_run: activado 14)
maximización: seguridad de datos 15)
kernel_panic: activado 16) nodo_dominio:
linux76 linux77 17) nodo_dominio: linux78
linux79 b) Volver al menú anterior Seleccione
un elemento a modificar: [0-17,b,q] 7 Ingrese
un nuevo tiempo muerto: [c,q] (90) 30 ¿Modificar otro
elemento? [t/n] (n)
espectáculo de racimo
cli:~>cluster-show
configuración del clúster: clustername:
rds_cluster node: linux76
192.168.8.76
nodo: linux77 192.168.8.77 nodo:
linux78 192.168.8.78 nodo: linux79
192.168.8.79 archivo de registro: /
var/log/ha-log keepalive: 3 deadtime:
30 watchdog: off ucast: ens224
192.168.11.76 192.168.911.17 8
192.168.11.79
ucast: ens256 192.168.12.76 192.168.12.77 192.168.12.78
192.168.12.79
worklink_hb: apagado
auto_failover: apagado
auto_run: encendido
maximización: seguridad de datos
49
Machine Translated by Google
kernel_panic: en
nodo_dominio: linux76 linux77
nodo_dominio: linux78 linux79
Agregue un enlace de
latido. Formato: cli->latido-añadir
cli:~>heartbeat-add
Agregar enlaces de latidos:
Tipo de IP: 0) IPv4 1) IPv6
Seleccione un
tipo: [0-1,q] (0)
cli:~>heartbeat-delete 0)
ucast: ens224 192.168.11.76 192.168.11.77 192.168.11.78 192.168.11.79 1) ucast: ens256
192.168.12.76 192.168.12.77 192.168.12.78 192.168.12.79 2) ucast: ens192 192.168.8.76
192.168 .8.77 192.168.8.78 192.168.8.79 b) Volver al menú anterior Seleccione un canal de
enlace de latido para eliminar: [0-2,b,q] 2 ¿Desea guardar la configuración? [s/n] (s)
50
Machine Translated by Google
servicio-añadir
Agregue un servicio (grupo de recursos), ejecute service-add, el proceso de configuración del servicio es similar a
eliminar servicio
cli:~>service-delete 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio para eliminar: [0-0,b,q] 0
servicio-modificar
Modifique la configuración del servicio, como modificar el tiempo de espera de parada del servicio ora_tom,
cli:~>servicio-modificar
Servicios del clúster: 0)
ora_tom
1) MRsrv0
b) Volver al menú anterior
Seleccione un servicio para modificar: [0-1,b,q] 0
Información de propiedad de 'ora_tom':
0) habilitado: sí 1)
multinstance: no 2)
starttimeout: 240 3)
stoptimeout: 360 4)
checkinterval: 30 5)
checktimeout: 60 6)
maxerrcount: 1 7)
maxlockcount: 0 8)
restartaftercheckfail : no 9)
startanyway: no 10) lista de
nodos: linux76 linux77 linux78 linux79 11) lista de
inicio automático: linux76 linux77 linux78 linux79 12)
nodo preferido: b) Volver al menú anterior
51
Machine Translated by Google
Establezca las dependencias entre diferentes servicios (regla: el servicio principal depende del servicio secundario, el servicio secundario
comienza primero cuando se inicia el servicio y viceversa cuando se detiene el servicio), actualmente admite dos dependencias: 1) forzado
Servicio de padres
servicio de niños
Tipo de dependencia, incluidas las fijas y forzadas
Relación, incluyendo local, remota y global.
52
Machine Translated by Google
0) forzado
Seleccione un tipo de dependencia: [0-0,q] 0 ¿Desea
configurar otra dependencia del servicio? [t/n] (n)
Verificación de la información de dependencia del servicio:
recurso-agregar
Modifique los servicios configurados y agregue recursos relacionados, como agregar una IP comercial según sea necesario, agregar una
cli:~>resource-add
Servicios del clúster:
0) oráculo
b) Volver al menú anterior
Seleccione un servicio para agregar un recurso: [0-0,b,q] 0
Tipos de recursos:
0) NADA
1) PI
2) Aplicación
3) disco sin procesar
4) DiskMount b)
Volver al menú anterior
Seleccione un tipo de recurso: [0-4,b,q] 1
eliminación de recursos
cli:~>eliminar recurso
Servicios del clúster:
0) oráculo
b) Volver al menú anterior
Seleccione un servicio para eliminar el recurso: [0-0,b,q] 0
Recursos del servicio 'oráculo':
53
Machine Translated by Google
0) oracle_nic_0 1)
oracle_ip_0 2)
oracle_app_0 3)
oracle_dm_0 b)
Volver al menú anterior
Seleccione un recurso para eliminar: [0-3,b,q]
recurso-modificar
cli:~>recurso-modificar
Servicios del clúster: 0) Oracle b)
Volver al menú anterior
Establezca las dependencias entre diferentes recursos en el mismo servicio (principio: el recurso principal depende del recurso secundario, el recurso
secundario comienza primero cuando se inicia el recurso y viceversa cuando se detiene). Formato: cli:~>depende del recurso
54
Machine Translated by Google
espejo-adm
Se usa para agregar o eliminar un recurso de espejo (mirror).El proceso de agregar recursos de espejo es similar a mirror-init,
cli:~>mirror-adm 0)
agregar recurso espejo 1)
eliminar recurso espejo b)
Volver al menú anterior
Seleccione una operación: [0-1,b,q] 1 0) r0 b)
Volver al menú anterior que desea
eliminar: [0-0,b,q] 0
modificar-config
Convierta todos los archivos de configuración del clúster para que coincidan con la
55
Machine Translated by Google
cli:~>modify-config
Modificar /etc/ha.d/ha.cf con éxito. Copie manualmente a otro nodo.
Modificar /etc/ha.d/haservices.xml con éxito. Copie manualmente a otro nodo.
instancia-config
Se utiliza para agregar, eliminar y mostrar instancias configuradas. Las instancias pertenecen al concepto de servicios de instancias múltiples. Cada instancia es
también un conjunto de grupos de recursos. Los servicios de instancias múltiples se utilizan para que la misma aplicación comercial se ejecute en diferentes nodos.
cli:~>instancia-config
0) Agregar instancia ————Agregar instancia
1) Eliminar instancia ————Eliminar una instancia
2) Mostrar instancia ————Mostrar la instancia
configurada b) Volver al menú anterior
Seleccione una operación: [0-2,b,q] 0
ID de instancia
Seleccionar recurso para la instancia
mult_instance_nic_0
mult_instance_ip_0
mult_instance_app_0
56
Machine Translated by Google
mult_instance_nic_0
mult_instance_ip_1
mult_instance_app_0
cambio de producto
Se utiliza para la conversión de configuración o la prueba de productos de diferentes versiones del clúster (dual-machine, mirroring,
stop 2) Use el SN comercial para regenerar el archivo clave: /usr/lib64/makekey + SN 3) Ingrese el cli y
recursos drbd *) Modificar recursos de disco, modificar dispositivos y parámetros de tipo, espejo y
57
Machine Translated by Google
parámetros *) Instrucciones de operación para agregar y eliminar recursos del disco: resource-
add/ resource-delete 5) El reinicio del clúster tiene efecto: cli->cluster-restart PS: 1. Proceso de modificación del recurso del
disco: cli-> modificación de recursos> seleccione recurso dm> seleccione "2) tipo"> última modificación "0) dispositivo". 2. Si
usa la operación web, debe reiniciar la herramienta web después de realizar el paso 3 anterior: webadminserver
reiniciar
configuración de dominio
cli:~>dominio-config
0) Agregar nodo de dominio
1) Eliminar nodo de dominio b)
Volver al menú anterior
Seleccione una operación: [0-1,b,q] 1 nodo de dominio:
Restaure todos los archivos de configuración del clúster actual a otros nodos, lo que a menudo se usa para la recuperación del clúster después del reemplazo del hardware
58
Machine Translated by Google
cli:~>recover-config-files ¡Restaurar
archivos de configuración a nodos remotos con éxito!
lockdisk-adm
0) añadir disco de
bloqueo 1) eliminar disco
de bloqueo b) Volver al menú anterior
Seleccione una operación: [0-1,b,q]
Se utiliza para cambiar con un solo clic tipos de clúster remotos o dentro de la ciudad, donde sync representa el modo dentro de la ciudad
cli:~>cambiar-modo-espejo
Hay dos tipos de modo espejo: 0) sincronizado 1)
asíncrono b) Volver al menú anterior
Inicio de clúster
Inicie el clúster (admite el inicio del clúster de todos los nodos o el inicio del clúster del nodo especificado), y el servicio se
iniciará junto con él. Si el servicio está fuera de la administración del clúster, el inicio del clúster no abrirá el servicio. Formato:
59
Machine Translated by Google
.
[linux77] Iniciando servicios de alta disponibilidad: el archivo
de configuración se verificó correctamente.
Hecho.
.
[linux78] Iniciando servicios de alta disponibilidad: el archivo
de configuración se verificó correctamente.
Hecho.
.
[linux79] Iniciando servicios de alta disponibilidad: el archivo
de configuración se verificó correctamente.
Hecho.
parada de racimo
Detenga el clúster (admite la detención del clúster de todos los nodos o la detención del clúster del nodo especificado), si el servicio
está fuera de la administración del clúster, la detención del clúster solo detiene el software del clúster. formato: formato: cli:~>cluster-
.
[linux78]Detener los servicios de alta disponibilidad: Listo.
.
[linux79]Detener los servicios de alta disponibilidad:
60
Machine Translated by Google
Hecho.
.
[linux76]Detener los servicios de alta disponibilidad: Listo.
.
cli:~> cluster-stop linux79 ----Detener el clúster de nodo
especificado [linux79]Deteniendo los servicios de alta
disponibilidad: Listo.
.Cluster-reiniciar
Reiniciar el software del clúster es equivalente a ejecutar cluster-stop para detener el clúster y luego ejecutar cluster-start para
inicio de servicio
Inicie el servicio
manualmente. Formato: Cli:~>servicio-inicio
Cli:~>inicio-servicio
Servicio actual: 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio: [0-0,b,q] 0
Nodo actual:
0) suse11-3
1) suse11-4
b) Volver al menú anterior
Seleccione un nodo: [0-1,b,q] 0 Envíe un
mensaje al sistema HA para iniciar el servicio Oracle en suse11-3.
61
Machine Translated by Google
parada de servicio
ÿÿÿÿÿÿÿ ÿÿ:
Cli:~>service-start Cli:~>service-
stop Servicio actual: 0) oracle b)
Volver al menú anterior Seleccione
un servicio: [0-0,b,q] 0
Enviar mensaje a Sistema HA
para detener el servicio de Oracle.
Servicio-migrar
Cambiar manualmente los servicios Después de la ejecución, puede ejecutar cluster-stat para ver
cli:~>servicio-migrar
Seleccione el servicio para migrar:
Servicio actual: 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio: [0-1,b,q] 0
Seleccione el nodo de destino:
Nodo actual:
0) suse11-4
b) Volver al menú anterior
Seleccione un nodo: [0-0,b,q] 0 Enviar
mensaje para migrar el servicio Oracle de suse11-3 a suse11-4.
Servicio-habilitarÿservicio-deshabilitar
Cuando se inicia el clúster, el servicio se inicia automáticamente, y cuando el clúster se detiene, el servicio se detiene. Durante la ejecución del servicio, el
software del clúster detecta regularmente el estado del servicio. Llamamos a esta relación "el servicio es administrado por el clúster" o "servicio se une la
administración del clúster"; cuando el servicio se va Durante la administración del clúster, los servicios no tienen nada que ver con el software del clúster,
por ejemplo: Detener el clúster no afecta la operación del servicio; si hay una dependencia entre los servicios, los servicios dependientes relacionados se
62
Machine Translated by Google
Service-enable permite que el servicio se una a la administración del clúster.La premisa de ejecutar este comando: el clúster se está ejecutando, el
estado del nodo es normal (UP), el estado del servicio está en ejecución/detenido y el atributo de habilitación del servicio es no.
Service-disable elimina el servicio de la administración del clúster.La premisa de ejecutar este comando: el clúster se está ejecutando, el estado
del nodo es normal (ACTIVADO), el estado del servicio está en ejecución/detenido y el atributo de habilitación del servicio es sí.
Cli:~>habilitar servicio
Servicio actual: 0)
Oracle b)
Volver al menú anterior
Seleccione un servicio: [0-1,b,q] 0 Hay
servicios que dependen del servicio Oracle, también se habilitarán.
¿Quieres continuar? [s/n] (s)
Envíe un mensaje al sistema HA para habilitar el servicio Oracle.
Cli:~>service-disable
Servicio actual: 0) Oracle
b) Volver al
menú anterior Seleccione un
servicio: [0-1,b,q] 0 Hay servicios que
dependen del servicio Oracle, también se desactivarán.
¿Quieres continuar? [s/n] (s)
Envíe un mensaje al sistema HA para deshabilitar el servicio Oracle.
ilustrar:
1. Después de habilitar o habilitar el servicio, el atributo de habilitación del servicio es sí, después de que el servicio se deshabilita correctamente, el
atributo de habilitación del servicio es no. 2. La información de estado anterior del clúster se puede ver continuamente a través de cli->cluster-stat.
Borrar falla
Borra el indicador de error de software del servicio. Antes de ejecutar este comando, ejecute el comando cluster-stat para verificar el estado del servicio. Si se
encuentra un indicador de error, use este comando para borrar el estándar de error del software y luego verifique el estado del servicio para confirmar que el
Formato: Cli:~>clear-fault
Cli:~>borrar falla
Servicio actual: 0)
Oracle b)
Volver al menú anterior
63
Machine Translated by Google
Aviso
1. Cuando el servicio está en un estado inestable, ejecutar clear-fault puede hacer que el servicio se detenga. Este comando solo
se puede usar después de que se haya identificado y resuelto la causa de la inestabilidad; utilícelo con precaución en sistemas
comerciales. 2. Si el servicio se detiene en el clúster cuando se ejecuta clear-fault, el servicio permanece en el estado detenido
original después de la ejecución. Para iniciar el servicio, debe ejecutar manualmente service-start.
Un servicio es una colección de recursos, que puede considerarse como un grupo de recursos. Cuando se inicia el servicio, todos los
recursos relacionados se inician automáticamente, y cuando se detiene el servicio, también se detienen todos los recursos. Esta es la
recurso-inicio
64
Machine Translated by Google
parada de recursos
cli:~>recurso-parada
Servicio actual:
0) ora_tom 1)
MRsrv0 2) bbbb
b) Volver al
menú anterior Seleccione un servicio:
[0-2,b,q] 2 0) nombre: bbbb_ip_0 1) nombre: bbbb_app_0
script: /home/myfaked.sh b) Volver al menú
anterior Seleccione un recurso: [0-1,b,q] 1 Enviar mensaje al sistema HA
para detener el recurso bbbb_app_0 en servicio bbbb
ilustrar:
1. Si se reinicia el clúster, los recursos de las operaciones anteriores se iniciarán automáticamente con el servicio.
recurso-habilitarÿrecurso-deshabilitar
La habilitación de recursos hace referencia a un recurso específico en el servicio de control, es decir, el clúster supervisa y administra el
estado del recurso. Cuando se produce una excepción, se generará un registro de errores o se desencadenarán algunos eventos. Si el
recurso es un recurso clave, puede incluso desencadenar el cambio de todo el servicio. Todos los recursos del servicio se gestionan de
forma predeterminada. resource-disable no controla un recurso específico en el servicio, es decir, el estado de ejecución del recurso no
Cli:~>habilitación de recursos
Servicio actual: 0) oracle
b) Volver al
menú anterior Seleccione un servicio:
[0-1,b,q] 0 0) nombre: oracle_ip_0 1) nombre: oracle_app_0
script: /etc/ha.d/resource.d/ myfaked.sh 2)
nombre: oracle_dm_0 b) Volver al menú anterior Seleccione un recurso: [0-2,b,q] 0
sesenta y cinco
Machine Translated by Google
cli:~>resource-disable
Servicio actual: 0)
ora_tom 1)
MRsrv0 2)
bbbb b)
Volver al menú anterior
Seleccione un servicio: [0-2,b,q] 2 0) nombre:
bbbb_ip_0 1) nombre: bbbb_app_0
script: /home/myfaked. sh b) Volver al menú anterior
Seleccione un recurso: [0-1,b,q] 1 Reinicie el sistema HA
para que la modificación entre en vigor.
ilustrar:
1. Las operaciones de habilitación de recursos y desactivación de recursos pueden tener efecto solo después de reiniciar el
clúster, es decir, tendrán efecto la próxima vez. Esta es la mayor diferencia entre desactivación de servicio y activación de servicio.
La función de resource-critical es establecer un determinado recurso en el servicio como un recurso clave. Cuando su estado de
ejecución es anormal, hará que se cambie todo el servicio. De forma predeterminada, es un recurso relacional. La falla de un
recurso relacional hará que un servicio (grupo de recursos) cambie. El papel de recurso no crítico es el opuesto de recurso
Cli:~>recurso no crítico
Cli:~>recurso crítico
Servicio actual: 0)
oracle b)
Volver al menú anterior
Seleccione un servicio: [0-1,b,q] 0 0) nombre:
oracle_ip_0 1) nombre:
oracle_app_0 script: /etc/ha.d/
resource.d/ myfaked.sh 2) nombre: oracle_dm_0
b) Volver al menú anterior Seleccione
un recurso: [0-2,b,q] 0 Reinicie el
sistema HA para que la modificación entre en
vigencia.
cli:~>recurso no crítico
66
Machine Translated by Google
Servicio actual:
0) ahora_tono
1) MRsrv0
2) bbbb
b) Volver al menú anterior
Seleccione un servicio: [0-2,b,q] 2
0) nombre: bbbb_ip_0
1) nombre: bbbb_app_0 secuencia de comandos: /home/myfaked.sh
b) Volver al menú anterior
Seleccione un recurso: [0-1,b,q] 1
Reinicie el sistema HA para que su modificación entre en vigor.
clúster-estadística
Actualice automáticamente todo el estado del clúster cada 1 segundo, incluido el estado del nodo del clúster, el estado del vínculo del latido y la cadena de arbitraje.
Formato: cli:~>cluster-stat
cli:~>cluster-stat
Presione Ctrl-C o 'Q' para salir
Nota: MI - Espejo, ---- - Enlace anormal
67
Machine Translated by Google
ora_tone detenido SÍ
ilustrar:
(Tenga en cuenta que si la posición del enlace parpadea en el diagrama de estado, significa que el enlace es anormal)
artículo sentido
HeartbeatLink 1. Enlace Heartbeat, se mostrará el nombre del enlace, si el enlace es anormal, mostrará "-"
2. El disco espejo de configuración se mostrará en esta columna, formato: MI (nombre espejo, enlace)
Nombre del Servicio Nombre de servicio definido por el usuario, consulte service_init
Las siguientes palabras clave indican que el estado del servicio es anormal o ha sido anormal:
stu: el servicio se ejecuta normalmente y el servicio se detecta cuando el servicio se detecta periódicamente.
Yo: dirección IP
R: Solicitud
68
Machine Translated by Google
W: enlace de servicio
T: tiempo de espera
B: La IP flotante existe en el nodo opuesto, el servicio no se inicia y las dos máquinas están en
Habilitar El servicio es manejable o no. Sí significa manejable. la habilitación de servicio está disponible
En el diagrama de estado anterior, el primer servicio se selecciona y se muestra de forma predeterminada, y se puede cambiar presionando hacia arriba o hacia abajo o hacia la izquierda o hacia la derecha
Se despliegan diferentes servicios, luego de presionar Enter se puede ver el estado del grupo de recursos, regrese a la capa anterior y presione la letra a, de la siguiente manera:
69
Machine Translated by Google
linux77 detenido
linux78 detenido
linux79 detenido
ilustrar:
artículo sentido
escribe Tipos de recursos: como ip, nic (tarjeta de red), disco (almacenamiento compartido) y aplicación (profesional
aplicación de servicio)
unknown: el estado del recurso es desconocido, común en el caso de la desactivación del recurso
detenido|pendiente: este estado indica que la aplicación ha realizado una detención, pero
Crítico Si se trata de un recurso clave, el recurso clave significa que el servicio se activará cuando el recurso sea anormal.
cambio de servicio
Mostrar estado
Obtenga el estado actual del clúster, consígalo una vez, la información de estado del clúster obtenida es la misma que la salida de cluster-stat
El clúster admite el envío de alarmas snmp para alertar a los mantenedores de los cambios del clúster, de modo que los problemas se puedan descubrir y resolver a tiempo.
Para obtener una descripción e interpretación detalladas del contenido de la alarma, consulte el Apéndice: Tipo de mensaje de alarma SNMP y descripción de la consulta
70
Machine Translated by Google
snmp-añadir
cli:~>snmp-añadir
IP de una fuente
Una o más IP trampa
71
Machine Translated by Google
ilustrar:
1. Configure la tarjeta de red, la dirección IP, la máscara y el puerto de la fuente de la alarma, es decir, configure la información del originador de
la alarma. 2. Configure snmp para leer y escribir cadenas comunitarias. El valor predeterminado es público, que se puede modificar a cadenas privadas según
sea necesario. 3. Configure la IP y el puerto de la alarma, es decir, configure a qué host se envía la alarma;
snmp-eliminar
cli:~>snmp-eliminar
0) Eliminar configuración SNMP
1) Eliminar IP de origen SNMP
2) Borrar IP trap SNMP b)
Volver al menú anterior
Seleccione un elemento para eliminar: [0-2,b,q]
72
Machine Translated by Google
snmp-modificar
Modifique la configuración de la fuente de alarma configurada, como la tarjeta de red, la dirección IP, la
cli:~>snmp-modify 0)
SourcePort: 163 1) NIC:
eth2 2) SourceIP:
192.168.111.2 3) Netmask:
255.255.255.0 4) Rwcommunity: public
b) Volver al menú anterior
verificar-config
cli:~>check-config Archivo
de configuración comprobado correctamente.
recuperar-licencia-remota
Restaure el archivo de autorización en el nodo especificado, que a menudo se usa para la recuperación de autorización después de
cli:~>recover-remote-license Ingrese el
nombre del nodo remoto: [q] linux77 Recuperación
de licencia exitosa!
salir, salir
Salga de la herramienta de
cli:~>salir cli:~>salir
73
Machine Translated by Google
ayuda
NOMBRE
SINOPSIS
cluster-start [nombre de host]
DESCRIPCIÓN
Inicie el sistema HA, si no especifica el nombre de host, se iniciará
el sistema HA
en todos los nodos del clúster. Iniciará el sistema HA en remoto
anfitrión al principio,
e inicie el sistema HA en localhost por fin.
74
Machine Translated by Google
nshasrv
clúster nshahide para habilitar nshastat
funciones Obtener el estado del
especiales
parámetros del comando: {par}, los parámetros entre corchetes son obligatorios,
<val>, el valor entre corchetes angulares es obligatorio, reemplazar | con valor real,
usado para separar varias opciones opcionales, generalmente usado con corchetes o corchetes
8.1 nshacluster
Se utiliza para configurar la información básica del Cluster.La información de configuración se almacena en el archivo /etc/ha.d/ha.cf.
75
Machine Translated by Google
-add-domain <nodos>
-del-domain <nodos>
-modify <clave> <valor>
-product-switch [<tipo-producto>] -upgrade
-display [código | tipo de producto |
<clave>] -ayuda
Explicación
de
parámetros: parámetro Descripción Agregar nombre de clúster, personalizado, usado para
-add <nombre de clúster> -add identificación interna Agregar nodos de clúster y sus IP, se permiten
-node <nombre de nodo> -ip <ipaddr1 múltiples IP, agregar enlaces de latidos separados por espacios *)
[ipaddr2] [ipaddr3]> -add -hb {-mcast Admite ipv4 e ipv6 *) El tipo de latido es unicast (ucast), multicast
| -mcast6 | -ucast | -ucast6 | -serial } (mcast) y puerto serie (serial) *) nic-name agrega un disco de arbitraje
-add -lockdisk <nombre-disco> complete sí Eliminar el nodo del clúster eliminar el enlace de latido *)
-formato {sí | no} Compatible con ipv4 e ipv6 *) El tipo de latido es unidifusión (ucast),
-delete -node <nombre-nodo> válido, se utiliza para reinicializar el disco de quórum -valid-lockdisk
-delete -hb {-mcast | -mcast6 | -ucast | Modifique la información de configuración del clúster, la clave y el valor
-ucast6 | -serial} <nombre-nic> se pueden ver con -modify <clave> <valor> muestra y el resultado
consultar el tipo de clúster para agregar el campo de nodo y elimine el campo de nodo para el cambio de tipo de clúster o la prueba del
producto, tipo producto. *) el tipo de tipo de producto se utiliza para la prueba del
-add-domain <nodos>
-del-domain <nodos>
-product-switch [<tipo-
producto>]
76
Machine Translated by Google
-actualizar del clúster: ha, mirror, cluster, rcs y rds, que muestran el uso del comando
-ayuda
8.2 nshamirror
Este comando se utiliza para configurar y administrar imágenes.La información de configuración se almacena en /etc/drbd.d/r0.res.
M|G] -add-link <res|dev> -node <nodo> -ip <ipaddr> [-port < portnum>] -switch-link <res|dev> [-ip <ipaddr>] [-force]
-switch-mode <modo>
parámetro
-ip <ipaddrs> [-port <portnum>] -disk <disco> [- agregar recursos espejo: *) cambio de nombre,
77
Machine Translated by Google
-modify -res <resname> <clave> <valor> -valid recursos de espejo configurado (por ejemplo: /etc/drbd.d/r0.res)
-format <fstype> -res <resname> [-mnt <mountpoint>] directamente en el directorio especificado después de formatear
-global-modify {global | <resname>} <sección1> para modificar el archivo de configuración global de los recursos
permitir que el recurso de espejo comience en el nodo especificado -start [-res <resname>] [-node <node>] -stop [-res
puede admitir la obtención del estado anterior del nodo especificado -resize <res|dev> [<size>K|M|G] Actualizar el tamaño
especificado surta efecto, que se usa para 2+1 o 2 +2 clúster para recrear la
-open-node <res|dev> [-node <nodo>] -create- secuencia de comandos de control del servicio de duplicación, propósito
script <res|dev> especial para detectar el modo de clúster aplicable al clúster actual: misma
-detect-mirror-mode <ipaddr|res|
| dump-xml [cambiar nombre]] -ayuda Compatibilidad para mostrar el código de retorno de ejecución del comando del espejo
actual, la configuración del espejo, la información del estado actual del espejo
78
Machine Translated by Google
8.3 nshasrv
Este comando se utiliza para configurar y administrar servicios.La información de configuración se guarda en el archivo: /etc/ha.d/haservices.xml
-eliminar <srv>
-deshabilitar <srv>
Explicación de
parámetros:
Parámetro -add <srv> Descripción Agregue servicio, personalice el nombre del servicio, el valor del atributo es el
<srv> <attr> <value> Modificar los atributos del servicio (es decir, el valor "attr"), los atributos pueden ser
Utilice el parámetro de
-link <srv padre> <srv hijo> <relación> <tipo visualización para ver las
-unlink <srv principal> <srv secundario> forzado Eliminar dependencias entre servicios
-start <srv> [<nodo>] Para iniciar un servicio, el nodo de inicio es opcional. Si no se selecciona, Cluster
-detener <srv> y control de servicios en ejecución, siempre que el servicio esté en el estado
-habilitar <srv> desconectado. El servicio está desconectado, siempre que el servicio esté en el
-deshabilitar <srv> estado administrado. Migre manualmente el servicio al nodo especificado para su
servicio especificado
79
Machine Translated by Google
8.4 acciones
Este comando se utiliza para configurar y administrar recursos.La información de configuración se guarda en el archivo: /etc/ha.d/haservices.xml
-deshabilitar <res>
enlace] -ayuda
Explicación de
-eliminar <res> existente. El nombre del recurso (res) se puede ver usando el
Para modificar los atributos de recurso 1, res, puede usar el parámetro de visualización para ver 2 , attr, y use el parámetro -display
-link <parent res> <child res> Configure las dependencias entre recursos del mismo servicio (grupo de recursos). La regla es que los recursos
80
Machine Translated by Google
-unlink <parent res> <child res> Eliminar dependencias entre recursos, nombre de recurso (res)
Puede utilizar el parámetro de visualización para ver.
-inicio <res> Inicie el recurso. El nombre del recurso (res) se puede ver usando
-detener <res> parámetro de visualización para ver el nombre del recurso (res) para ver
-habilitar <res> está en un estado fuera de control y reinicia el clúster para que surta efecto. El
nombre del recurso (res) se puede ver a través del parámetro de visualización.
-deshabilitar <res> procesen y controlen, y el clúster se reinicie para que surta efecto. El nombre
-crítico <res> son todos los recursos clave. El nombre del recurso (res) se puede ver usando
-no crítico <res> control. Una excepción de un recurso no crítico no activará el cambio de servicio.
de visualización para ver el nombre del recurso (res). 1, mostrar, mostrar todos
-display [-nombre <res> | tipo | código | Enlace] código de retorno del resultado de la ejecución del comando
8.5 nshasnmp
Se utiliza para configurar snmp, la información de configuración se almacena en los archivos /etc/ha.d/
haservices.xml y /etc/ha.d/NSHA-agent.conf
Explicación de
parámetros: ilustrar
Parámetro -add [-sourceip <ipaddr> | -add sin otros parámetros, la configuración básica de SNMP se genera por defecto
81
Machine Translated by Google
-trapip <ipaddr> [-port <trapport>]] La información se puede ver con la pantalla y las propiedades se
configuración de snmp.
-ayuda
8.6 nshastart
Explicación del
parámetro: Indica
parámetro [nombre de nodo] parámetros opcionales. Si se inicia con un nombre de nodo, significa iniciar el clúster
en este nodo. De lo contrario, todos los clústeres de nodos se inician sin ningún
-mostrar [código] parámetro o el parámetro de código mostrará el resultado de la ejecución del comando,
-ayuda
8.7 nshastop
82
Machine Translated by Google
Explicación de parámetros:
ilustrar
parámetro [nombre de nodo] Parámetro opcional, si se detiene con el nombre del nodo, se refiere al
Detenga el clúster en el nodo; de lo contrario, todos los nodos del clúster se detendrán
-mostrar [código] Mostrar la ejecución del comando sin argumentos ni argumentos de código
8.8 nshastat
Este comando se usa para obtener el estado relevante del clúster, incluido el estado del servicio, el estado del recurso, el estado del nodo y el estado del negocio.
-nodo <nodo>
-ayuda
Explicación de parámetros:
ÿÿ ilustrar
-mostrar {código | tipohb} El parámetro de código muestra el significado del código de estado obtenido,
8.9 nshaget
Este comando se utiliza para obtener información del clúster, incluida la versión, el tipo de clúster, el número de serie y la información de autorización de prueba.
83
Machine Translated by Google
-producto [<sn>]
-licencia-días
-sn
-ayuda
Explicación de parámetros:
parámetro ilustrar
-versión Obtenga la versión del clúster, como v3,v4,v5...
-version-detail -product Obtener la información específica de la versión del clúster
8.10 nshahide
-mostrar [código|clave]
-ayuda
clave valor
singleNIC mismo 1 sistema de clúster puede usar una sola NIC. predeterminado 0
host 1 nombre de host del sistema de clúster puede ser el mismo. defecto
0
comprobación de trampa snmp 1 trampa de envío activa SNMP trap2sink (trap IP)
mensaje, inactivo no enviar. predeterminado 0
84
Machine Translated by Google
sincronización. predeterminado 0
Explicación de parámetros:
ÿÿ ilustrar
-add <clave> <valor> -delete Para habilitar la función, la clave y el valor se refieren a los valores anteriores
-ayuda Mostrar el valor de retorno de la ejecución del comando o qué valores clave existen
85
Machine Translated by Google
Los productos de clúster NewStart admiten la notificación de eventos anormales que ocurren durante el funcionamiento del clúster mediante la configuración de alarmas snmp
para facilitar una respuesta rápida por parte de los administradores. Al mismo tiempo, el receptor de alarmas puede enviar una solicitud de consulta de información del clúster al
9.1 Oid de alarma de clúster y descripción (si necesita una biblioteca mib, comuníquese con nuestra empresa)
Tipo de alerta
1.3.6.1.4.1.36895. resourceMonitorTimeoutT
Advertencia Supervisión de recursos agotada
1.900.1.0.2 rap
1.3.6.1.4.1.36895. ResourceNotGoingOffline Newstart Cluster no puede
Error
1.900.1.0.3 Trampa desconectar los recursos
1.3.6.1.4.1.36895.
Servicio de informaciónOfflineTrap El servicio se detuvo con éxito
1.900.2.0.2
1.3.6.1.4.1.36895.
Error serviceFaultedTrap falla en el servicio
1.900.2.0.4
recurso persistente
86
Machine Translated by Google
error.
1.3.6.1.4.1.36895.
Error serviceOPTimeoutTrap tiempo de espera de operación de servicio de pares
1.900.2.0.12
Ejecutar Newstart
completo de latido)
Corazón 1.3.6.1.4.1.36895.
Latido del corazón de la informaciónRecuperación del latido del corazón de la trampa en línea
Salto 1.900.4.0.1
de 1.3.6.1.4.1.36895.
Advertencia latido del corazónFuera de líneaApagar el latido del corazón desactivado
alarma 1.900.4.0.2
Actualmente, el clúster solo admite la consulta de "clúster", "nodo" y "servicio", y prevalecerán los detalles en
la siguiente lista.
87
Machine Translated by Google
88
Machine Translated by Google
apéndice
1.1 El script de control empresarial debe contener 4 parámetros: inicio (start), parada (stop), detención forzada (parada forzada) y estado (detección de estado en ejecución).
En principio, el archivo de script se puede almacenar en cualquier directorio del sistema operativo, pero no se recomienda colocarlo en la matriz de discos; además, el archivo de
script debe estar en formato unix (como modificar el comando: dos2unix script name) y debe tener permisos de lectura y ejecución (como modificar el comando: chmod a+rx scriptname).
1.3 Mecanismo de secuencia de comandos de operación del clúster (actualmente, el clúster solo admite usuarios raíz para ejecutar secuencias de comandos de gestión y control
empresarial) *) El último paso de la puesta en marcha del servicio de inicio de secuencias de comandos de gestión y control empresarial es iniciar el negocio (es decir, ejecutar
"secuencia de comandos"). + parámetro de inicio"), y el valor de retorno de la operación de inicio No se realiza la detección; todos los recursos del servicio se detectan después de 2
segundos, y si todos devuelven 0, el clúster considera que el servicio se ejecuta normalmente y el inicio se realiza correctamente. *) La administración de servicios y la detección de secuencias de
comandos de control están bajo la configuración predeterminada del servicio (el servicio se puede administrar). Después de iniciar el clúster, las máquinas activas y en espera realizarán
periódicamente la detección de servicios (es decir, ejecutarán "secuencia de comandos + estado parámetro"). Si el valor devuelto es 0, significa que el servicio se está ejecutando normalmente, y
si se devuelve un valor distinto de cero, se considera que el servicio está detenido. *) Cuando la secuencia de comandos de control comercial detiene el servicio, se ejecutará "secuencia
de comandos + parámetro de detención" y no se detectará el valor de retorno, y el servidor se detectará después de 2 segundos.
Si todos los recursos del servicio devuelven un valor distinto de 0, el clúster considera que el servicio se ha detenido y la detención se realiza correctamente.
En circunstancias normales, hay secuencias de comandos de operación correspondientes para el inicio y la detención de la propia empresa. Para el inicio/detención de la secuencia de
comandos del clúster, si el usuario root inicia y detiene la empresa, se llama directamente a la secuencia de comandos empresarial; si es iniciado y detenido por el usuario ordinario, el formato
La detención forzada de los scripts de clúster generalmente es para encontrar procesos comerciales y eliminarlos por la fuerza. Entonces,
89
Machine Translated by Google
1. Usando el método de verificación del nombre del proceso, siempre que exista el nombre del proceso, el negocio se considera normal; el requisito para el
nombre del proceso debe ser único, por ejemplo, las palabras java y tomcat no son adecuadas para dichos scripts.
-F hace una lista de formato completo. Esta opción se puede combinar con muchas otras
El usuario root no debe escribir -u, aunque no tiene nada de malo pero no es convencional.
-en: Seleccione solo aquellas líneas que contengan coincidencias que formen palabras completas. La prueba es que la
subcadena coincidente debe estar al principio de la línea o precedida por un carácter constituyente que no sea una palabra.
Del mismo modo, debe estar al final de la línea o seguido de un carácter constituyente que no sea una palabra.
Los caracteres que constituyen la palabra son letras, dígitos y el guión bajo.
4. No utilice más ">/dev/null 2>&1", lo que hará que el registro del clúster no registre errores de secuencia de comandos; sin embargo, se puede utilizar ">/dev/
null".
6. El script stop prohíbe el uso de kill -9 para detener el proceso, puede usar kill. 7. No llame a exit (salir directamente) en la función de secuencia de
comandos, pero use return para volver; exit solo se llama en la secuencia de comandos principal. Para obtener más información, consulte la secuencia
Los ejemplos
Script de Oracle: ps -efww | grep tnslsnr | grep -v grep >/dev/null 2>&1 Este script solo
2) secuencia de
comandos de Sybase: ps -fwu $ SYBASE_USER | grep –w servidor de datos | grep -vq grep
Si no está escrito así, este problema puede aparecer en forma de otros síntomas: detener el recurso del disco compartido falla, forzar la
90
Machine Translated by Google
umount: /ivasdata/sybase: el dispositivo está ocupado umount informa que sybse todavía está accediendo al
la detención del recurso, udb_sybase_for_udb_mount_0 NO está detenido La razón es que Filesystem envió
3) Escritura de scripts
zxin: ps -efww |grep -v grep|grep -qw zxmoni debe cambiarse
a: ps -fwu zxin10 | grep -w zxmoni | grep -vq grep Puede
haber varios procesos zxmoni ejecutándose en un servidor, pero
pertenece a un usuario diferente, por lo que no se puede escribir como -efww.
Como tomcat, weblogic, etc., este tipo de script requiere una máquina virtual Java. Si el resultado de salida de la consulta grep es muy
COMANDO USUARIO PID TIPO FD TAMAÑO DEL DISPOSITIVO NOMBRE DEL NODO
La operación de secuencias de comandos complejas a menudo requiere conectar IP y acceder a la matriz magnética, y configurar el host y las propiedades del punto de montaje
de la matriz magnética. La operación es problemática. Los pasos rápidos para depurar los pasos son los siguientes:
1. Una vez completada la configuración, inicie el clúster, espere a que se inicie el servicio y extraiga la información relevante de /var/log/ha-log
91
Machine Translated by Google
grm[14591]: 2013/06/28_16:53:21
depuración: start_resource:/usr/lib/newstartha/resource.d/LastingRes -t netcard -d
bond0 -o start -i 192.168.1.192 -i 192.168.1.193 - i 192.168.1.247 grm[14591]:
2013/06/28_16:53:23 depuración: start_resource:/etc/ha.d/resource.d/IPaddr
192.168.11.13/24/bond0 inicio
2. Detenga el clúster, pegue la IP de inicio y el punto de montaje en las letras rojas en negrita de arriba, y luego comience a depurar el script como usuario
3. Comience a depurar la secuencia de comandos (tome la depuración de secuencias de comandos de Oracle como ejemplo)
echo $? Dado que Oracle tarda un tiempo en iniciarse, suspenda durante 30 segundos Después de verificar el estado, asegúrese de que
status; echo $? Asegúrese de que $? devuelve un valor distinto de 0 después de una parada exitosa (generalmente igual a 1), devuelve
3) ¿Si pasa la depuración manual, pero falla el inicio del clúster? Esto generalmente está
relacionado con las variables de entorno del usuario definidas. Consulte el archivo de configuración correspondiente en el script:
punto decimal + espacio + archivo de configuración, como: . /etc/profile . /home/oracle/.bash_profile (Redhat y otras distribuciones) . /
4. Después de completar la depuración, detenga los servicios iniciados manualmente, los puntos de montaje y las direcciones IP, inicie el clúster y luego
cambie los servicios 5. ¿Qué sucede si el clúster inicia el servicio correctamente, pero no puede cambiar a la máquina en espera? Modifique la
configuración y configure el servicio para que se inicie en la máquina en espera. ¿Tiene éxito? 1) Éxito, lo que indica que hay un problema en la parte de
estado del script 2) Fallo, cluster-stat muestra str(A), lo que indica que hay un problema con el entorno de la máquina en espera (o inconsistente con el
host: por ejemplo, la identificación de usuario de Oracle es diferente en los dos nodos);
El negocio general tiene sus propios scripts de inicio y parada. Para el inicio/detención de los scripts de clúster, si el negocio comienza y se detiene con el
usuario raíz, se llama directamente al script comercial; si el negocio se inicia y se detiene con usuarios normales, el formato es de la siguiente manera: su -
La detención forzada de los scripts de clúster generalmente es para encontrar procesos comerciales y eliminarlos
por la fuerza. Entonces, lo siguiente se enfoca en cómo escribir la parte de estado del script.
92
Machine Translated by Google
1. Usando el método de verificación del nombre del proceso, siempre que exista el nombre del proceso, el negocio se considera normal; el requisito para el
nombre del proceso debe ser único, por ejemplo, las palabras java y tomcat no son adecuadas para dichos scripts.
-F hace una lista de formato completo. Esta opción se puede combinar con muchas otras
El usuario root no debe escribir -u, aunque no tiene nada de malo pero no es convencional.
-en: Seleccione solo aquellas líneas que contengan coincidencias que formen palabras completas. La prueba es que la
subcadena coincidente debe estar al principio de la línea o precedida por un carácter constituyente que no sea una palabra.
Del mismo modo, debe estar al final de la línea o seguido de un carácter constituyente que no sea una palabra.
Los caracteres que constituyen la palabra son letras, dígitos y el guión bajo.
4. No utilice más ">/dev/null 2>&1", lo que hará que el registro del clúster no registre errores de secuencia de comandos; sin embargo, se puede utilizar ">/dev/
null".
6. El script stop prohíbe el uso de kill -9 para detener el proceso, puede usar kill. 7. No llame a exit (salir directamente) en la función de secuencia de
comandos, pero use return para volver; exit solo se llama en la secuencia de comandos principal. Para obtener más información, consulte la secuencia
Los ejemplos
Script de Oracle: ps -efww | grep tnslsnr | grep -v grep >/dev/null 2>&1 Este script solo
2) secuencia de
comandos de Sybase: ps -fwu $ SYBASE_USER | grep –w servidor de datos | grep -vq grep
Si no está escrito así, este problema puede aparecer en forma de otros síntomas: detener el recurso del disco compartido falla, forzar la
93
Machine Translated by Google
umount: /ivasdata/sybase: el dispositivo está ocupado umount informa que sybse todavía está accediendo al dispositivo
en - efww.
Como tomcat, weblogic, etc., este tipo de secuencia de comandos necesita una máquina virtual Java para ejecutarse, si usa grep para consultar
Ejemplo: consulta los procesos que pertenecen al usuario de Oracle y escuchan en el puerto 1521
COMANDO USUARIO PID TIPO FD TAMAÑO DEL DISPOSITIVO NOMBRE DEL NODO
94
Machine Translated by Google
Use los navegadores principales (IE, firefox, chrome , etc.) para visitar el sitio web oficial de ZTE New Fulcrum (http://www.gd-linux.com), Haga clic en "Ayuda"----"Registro en línea" para saltar al sistema de
Inicio de sesión del usuario: ingrese la dirección de acceso en el navegador----salte a la interfaz de inicio de sesión del usuario----ingrese la información de la cuenta para iniciar sesión
Registro de usuario: ingrese la dirección de acceso en el navegador----salte a la interfaz de inicio de sesión de usuario----haga clic en "registro xxx"----salte a la página de registro de usuario----ingrese la
información relevante para completar el nuevo registro de usuario (tenga en cuenta que el correo electrónico debe estar disponible)
95
Machine Translated by Google
Recuperación de contraseña de usuario: ingrese la dirección de acceso en el navegador ---- salte a la interfaz de inicio de sesión de usuario ---- haga clic en "recuperación de contraseña xxx" --- salte
3.1 Inicio de sesión --- Ingrese el número de serie (SN) --- verifique automáticamente la disponibilidad del número de serie y muestre el "nombre del producto", "información de la versión", etc.
96
Machine Translated by Google
3.2 Luego complete la información del solicitante-----haga clic en el botón "Registrarse" en la parte inferior, después de un registro exitoso, habrá un aviso, informe el método de
97
Machine Translated by Google
El archivo de licencia descargado se renombra a newstartha.lic y luego se carga en modo binario al directorio /etc/ha.d/lic del servidor
Inicio de sesión del usuario----haga clic en la "lista de números de serie" a la izquierda----la página de la derecha mostrará el número de serie registrado y admitirá la consulta del número de serie,
98
Machine Translated by Google
La animación suspendida del sistema es un escenario de falla especial y sigue siendo un problema importante en la industria. Cuando ocurre una posible
Desde la perspectiva del clúster, se puede juzgar por los siguientes desempeños en el sitio: el nodo
defectuoso no se puede conectar a través de ssh y telnet, no puede responder a otras solicitudes de aplicaciones, la consola no
responde y el sistema puede continuar enviando y recibir paquetes de latidos de máquina dual (esto puede hacer un juicio simple del
sistema de nodo normal en la máquina dual, el registro ha-log del nodo no imprime la información anormal del nodo muerto de la otra parte).
Acción recomendada:
reinicie el servidor muerto falso para que el servidor en espera se haga cargo del servicio (se puede considerar un reinicio completo), no se recomienda la operación manual
Durante la operación del clúster de dos máquinas, se puede encontrar un fenómeno de falla: el servicio es inestable. Preste
atención cuando ocurra esta situación, porque el estado del servicio significa que está fuera del control del clúster, es decir, el clúster no
controla todos los recursos del servicio, incluida la IP comercial, la matriz de discos, la aplicación, etc. , que es una actuación de alto
riesgo. Al ingresar al cli para consultar el estado del clúster, el servicio imprimirá algo similar a lo siguiente: Estado del servicio:
Operaciones
recomendadas: 1. Comprobar la causa de la inestabilidad del servicio, que se puede localizar a través del registro del clúster, es
necesario comprimir y empaquetar los registros ha-lo de los dos nodos y enviarlos al fabricante para su análisis. Soporte
técnico público. correo electrónico: ha@gd-linux.com. 2. Después de localizar y resolver la falla, ejecute clear-fault para
99
Machine Translated by Google
ÿ Falla fuera de línea del enlace del cerebro dividido/del latido del clúster
El cerebro dividido se refiere al hecho de que los nodos del clúster han perdido el contacto entre sí, pero el software del clúster
Las manifestaciones típicas de la falla del cerebro dividido son las siguientes:
2. Cada nodo se ejecuta normalmente, pero otros nodos están inactivos o son desconocidos;
3. El enlace de latido muestra '--', y el servicio en espera generalmente muestra la pantalla de estado de parado: str (B).
Acción sugerida:
El punto principal de la falla del cerebro dividido es resolver el problema fuera de línea del enlace del latido del corazón, que se puede verificar mediante los siguientes métodos.
1. Primero asegúrese de hacer ping <IP de la tarjeta de red de enlace de latido del nodo opuesto>
La NIC del enlace de latido y el enlace de servicio deben pertenecer a diferentes VLAN o estar configurados como direcciones IP en diferentes segmentos de red.
sitio. Se puede hacer ping al enlace de latido, pero cli->cluster-stat se muestra fuera de línea porque usan
Diferentes protocolos, Ping usa el protocolo ICMP y el enlace de latido del clúster usa el protocolo de multidifusión UDP.
Ejecute iptables -L para ver las reglas del firewall. Cierre el firewall o abra el puerto udp: 694;
3. Prueba a conectar las tarjetas de red heartbeat de los dos servidores con un cable de red directo para formar una red privada, a ver si se puede solucionar (más
Solo se puede solucionar instalando la versión 3.0 o superior, porque se implementa el protocolo IGMP (comúnmente conocido como "Protocolo de multidifusión de capa 3").
propuesta").
5. Otro método de análisis es ver la configuración de la tarjeta de red y el análisis de captura de paquetes:
#ifconfig X1
PD: Reemplace X1 con el nombre real de la tarjeta de red, como eth1, bond0, trunk1, etc. Si hay varias tarjetas de red, sí
P.ej:
100
Machine Translated by Google
ÿÿÿÿÿ
[root@e222 ~]# tcpdump -ni eth0 port 694|grep "226.0.12.17" escuchando en eth0, tipo de enlace
EN10MB (Ethernet), tamaño de captura 96 bytes 15:51:19.685283 IP 192.168.1.222. 48628 > 226.0.12.17.ha-cluster:
UDP, longitud 190 15:51:19.731718 IP 192.168.1.223.49469 > 226.0.12.17.ha-cluster: UDP, longitud 191
La descripción anterior captura los paquetes de latidos de 192.168.1.222 y 192.168.1.223 (normal), porque hay varios
clústeres en la LAN. Al capturar paquetes, grep "226.0.12.17" solo muestra los paquetes de latidos de este clúster,
mientras que la multidifusión la dirección es 226.0.12.17 Puede usar el comando cli->cluster-show para ver la
adquisición, como: cli:~>cluster-show Configuración del clúster:
watchdog_fork: off
watchdog_load: 0 nodo: e222
192.168.1.222 nodo: e223 192.168.1.223
archivo de registro: /var/log/ha-log
Si el latido eth1 falla y el paquete de latido enviado desde eth1 no se captura, significa que el paquete de datos de la
otra parte eth1 no ha llegado al nodo, verifique la fluidez de la red; de lo contrario, si el latido eth1 falla pero el paquete
de latido enviado desde eth1 ha sido capturado (muy raro), vea si reiniciar el clúster puede resolverlo.
Al iniciar el clúster (cluster-start) en la cli de la herramienta de administración de la línea de comandos del clúster, es posible que encuentre un error de inicio.
101
Machine Translated by Google
Acción recomendada:
este error a menudo se informa cuando el clúster no puede obtener algunos recursos en el archivo de configuración. Esta excepción generalmente debe ubicarse
en combinación con el registro /var/log/ha-log. El personal en el sitio puede filtrar la información de error para localizarlo rápidamente Por supuesto, si es necesario
Operación
recomendada: este tipo de error se suele informar cuando el archivo de licencia (/etc/ha.d/lic/newstartha.lic) no existe o no es válido.
La solución es regenerar el archivo de clave y enviarlo a ha@gd -linux.com para solicitar una nueva licencia Para el método de
operación específico, consulte el tercer punto del Apéndice C - Preguntas y respuestas más frecuentes.
Acción
recomendada: este aviso se ve a menudo cuando el proceso tsever de dos nodos de una máquina dual no puede establecer una
comunicación normal, lo que generalmente se debe a las siguientes dos razones: ÿ El firewall del sistema operativo se ve afectado,
puede intentar apagar el cortafuegos ÿ El proceso tsever no se inicia (ps –ef | grep tsever), debe eliminar manualmente el tsever
102
Machine Translated by Google
Centro de soporte técnico de servicio público de Linux de la provincia de Guangdong (Guangdong Zhongxing New Fulcrum Technology Co.,
Ltd.) sinceramente, gracias por utilizar los productos de clúster de nuestra empresa. Su elección es nuestra fuerza motriz y su apoyo es la piedra
angular de nuestro éxito. Al usar nuestros productos, si encuentra algún problema o tiene alguna sugerencia, contáctenos, estaremos muy
agradecidos.
Antes de ponerse en contacto con el soporte técnico, asegúrese de que su computadora cumpla con los requisitos del sistema enumerados
en la documentación del producto, proporcione la siguiente información: ÿ Descripción del problema: 1) Los archivos generados por el comando
hareport y la salida de cli->show-status o cluster-stat2 ) Describa cuándo ocurrió el problema por primera vez y qué se hizo en ese momento 3)
Cambios recientes en la configuración del software y cambios en la red ÿ Memoria disponible, espacio en disco ÿ Estructura de la red ÿ
2. Información de contacto
Guangdong Zhongxing New Pivot Technology Co., Ltd. Sitio web: http://www.gd-linux.com Dirección: Sala
601, Edificio E, No. 1021, Gaopu Road, Gaotang Software Park Base, distrito de Tianhe, Guangzhou
103