P R E S E N T A N MARCO ANTONIO VAZQUEZ JUAREZ OCTAVIO ROMANO AYOMETZI ANTONIO DE JESUS VAZQUEZ FLORES
TEMA TOLERANCIA A FALLOS C A T E D R A T I C O MARTIN ROJAS INTRODUCCIÓN
En un sistema distribuido, una falla parcial puede acontecer cuando falla
un componente. Esta falla puede afectar la operación de algunos componentes, al tiempo que otros más no se ven afectados en absoluto. Un objetivo importante en el diseño de sistemas distribuidos es construirlos de manera que puedan recuperarse automáticamente de fallas parciales sin que se afecte seriamente el desempeño total 4.1.1 CONCEPTOS BASICOS
La tolerancia a fallas en los sistemas distribuidos es que debe ser tolerantes a
las fallas, y está debe de estar fuertemente relacionado con lo que se llama sistemas fiables. Fiabilidad es un término que comprende varios requerimientos útiles para los sistemas distribuidos incluidos los siguientes; 1. Disponibilidad 2. Confiabilidad 3. Seguridad 4. Mantenimiento Disponibilidad Se define como la propiedad de que un sistema está listo para ser utilizado de inmediato. En general, se refiere a la probabilidad de que el sistema esté operando correctamente en cualquier momento dado y se encuentre disponible para realizar sus funciones a nombre de sus usuarios. Confiabilidad Se refiere a la propiedad de que un sistema sea capaz de funcionar de manera continua sin fallar. Un sistema altamente confiable es uno que muy probablemente continuará funcionando sin interrupción durante un lapso de tiempo relativamente largo. Seguridad Se refiere a la situación en que no acontece nada catastrófico cuando un sistema deja de funcionar correctamente durante un tiempo. Por ejemplo, se requiere que muchos sistemas de control de proceso, como los utilizados para controlar plantas de energía nuclear o enviar personas al espacio exterior, proporcionen un alto grado de seguridad. Si tales sistemas de control fallan temporalmente durante sólo un breve momento, los efectos podrían ser desastrosos. Mantenimiento Se refiere a cuán fácil puede ser reparado un sistema que falló. Un sistema altamente mantenible también puede ser altamente disponible, en especial si las fallas pueden ser detectadas y reparadas en forma automática. A menudo, también se requiere que los sistemas fiables proporcionen un alto grado de seguridad, en especial cuando se trata de temas tales como la integridad. Una falla Es cuando sistema no puede cumplir sus promesas y se clasifican generalmente como transitorias, intermitentes, o permanentes. Fallas transitorias Pasan una vez y luego desaparecen. Falla intermitente Sucede, luego desaparece por sí sola, después reaparece, y así sucesivamente. Falla permanente Es una que continúa existiendo hasta que el componente defectuoso es reemplazado