—toma en cuenta los patrones de comunicacion entre los procesos durante la
planificacion. —debe garantizar que todos los miembros del grupo se ejecuten al mismo tiempo. —se emplea una matriz conceptual donde: Las filas son espacios de tiempo. Las columnas son las tablas de procesos de los procesadores. —cada procesador debe utilizar un algoritmo de planificacion round robin: Todos los procesadores ejecutan el proceso en el espacio “0” durante un cierto periodo fijo. Todos los procesadores ejecutan el proceso en el espacio “1” durante un cierto periodo fijo, etc. —se deben mantener sincronizados los intervalos de tiempo. —todos los miembros de un grupo se deben colocar en el mismo n° de espacio de tiempo pero en procesadores distintos.
TOLERANCIA A FALLAS A NIVEL PROCESO Y ALMACENAMIENTO
Tolerancias a fallos en informática se determina a la capacidad de un sistema de almacenamiento de acceder a información o al recurso aún en caso de producirse algún fallo. Esta falla puede deberse a daños físicos (mal funcionamiento) en uno o más componentes de hardware lo que produce la pérdida de información almacenada. La tolerancia a fallos requiere para su implementación que el sistema de almacenamiento guarde la misma información en más de un componente de hardware o en una máquina o dispositivo externos a modo de respaldo. De esta forma, si se produce alguna falla con una consecuente pérdida de datos, el sistema debe ser capaz de acceder a toda la información recuperando los datos faltantes desde algún respaldo disponible.
Para entender de manera adecuada el manejo de la tolerancia a fallas en un
sistema distribuido, primero se debe examinar a fondo lo que en realidad significa. Ser tolerante a fallos, está fuertemente relacionado con lo que se llama sistemas fiables. Fiabilidad es un término que comprende varios requerimientos útiles, tales como: Disponibilidad Confiabilidad Seguridad y Mantenimiento.
La disponibilidad se puede definir como la propiedad de que un sistema este listo
para ser utilizado de inmediato, que el sistema este operando correctamente en cualquier momento dado y se encuentre disponible para realizar sus funciones. En otros términos, es que, muy probablemente funcionará en un instante dado. Confiabilidad se refiere a la propiedad de que un sistema sea capaz de funcionar de manera continua sin fallar. En otros términos, es un sistema que muy probablemente continuará funcionando sin interrupción durante un lapso de tiempo relativamente largo. Por contraste con la disponibilidad, la confiabilidad se define en función de un intervalo de tiempo en lugar de un instante en el tiempo.
Tolerancia a fallos a nivel de procesos.
A diferencia de los sistemas de almacenamiento, un proceso no puede ser espejeado ni duplicado, entonces requiere un enfoque distinto. Principalmente buscamos la transparencia, de tal suerte que un fallo en un proceso sea invisible para el usuario. Para lograrlo es indispensable que haya buena comunicación y coordinación entre procesos.
La latencia de tolerancia a fallas (FTL - Fault Tolerance Latency) es el tiempo
requerido para completar todos los pasos secuenciales que se necesitan para recuperar un error. Esta definición puede volverse sumamente importante en sistemas de tiempo real, donde la latencia de cualquier política de manejo de errores (tales como detección, enmascaramiento y recuperación de errores, por ejemplo) no debe ser superior a la latencia requerida por la aplicación (ARL - Application Required Latency), que es un tiempo que depende del proceso.