Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema1 Atf
Tema1 Atf
GARANTÍA DE
FUNCIONAMIENTO
Contenidos
Definición de la garantía de funcionamiento
Necesidad de los sistemas con alta garantía de
funcionamiento
Causas de la disminución de la garantía de
funcionamiento
Medios para obtener cierta garantía de funcionamiento
Medios para la validación de la garantía de
funcionamiento
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
1
Definición de garantía de
funcionamiento
Un sistema tolerante a fallos es aquel que posee la
capacidad interna para preservar la ejecución correcta
y continuada de las tareas a pesar de la ocurrencia de
fallos hardware o software
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
2
Necesidad de los sistemas con alta
garantía de funcionamiento
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
3
Necesidad de los sistemas con alta
garantía de funcionamiento
Evolución del número de entradas en la lista TOP 500 que se clasifican
como Clusters o NOWs
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
4
Causas de la disminución de la
garantía de funcionamiento
La vida de un sistema informático supone un cambio
continuo entre dos estados:
• Estado de funcionamiento correcto
• Estado en el que el sistema esta averiado
AVERÍA
SERVICIO SERVICIO NO
ESPECIFICADO ESPECIFICADO
RESTAURACIÓN
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Causas de la disminución de la
garantía de funcionamiento
Una avería ocurre cuando el servicio entregado por el
sistema no es el especificado. El usuario aprecia que el
sistema no funciona bien. Las averías se deben a errores
Un error es un estado interno incorrecto del sistema. Es
consecuencia de un fallo y puede dar lugar a una avería
Un fallo es un defecto o imperfección física en el hw o sw
del sistema
La relación entre ellos se resume:
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
5
Fallos
Fallos permantentes
PERSISTENCIA
Temporales
Fallos operacionales
Fallos de diseño y especificación
MOMENTO
Fallos de implementación e instalación
ORIGEN Procedimientos de mantenimiento
FALLOS Internos
FRONTERAS
externos
Fallos humanos
CAUSA
Fallos físicos
Fallos intencionados
NATURALEZA
Fallos accidentales o fortuitos
determinados
VALOR
Indeterminados
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Errores
Un error es un estado del sistema que puede provocar
una avería, dependiendo:
• De la composición interna del sistema
• Redundancia intencionada
• Redundancia no intencionada
• De la actividad del sistema
• Errores que se manifiestan al activarse alguna parte del
programa
• Errores dependientes de la carga
• Del concepto de avería que tenga el usuario
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
6
Averías
AVERÍAS DE VALOR
DOMINIO
AVERÍAS DE TIEMPO
AVERÍAS COHERENTES
PERCEPCIÓN POR
AVERÍAS LOS USUARIOS AVERÍAS INCOHERENTES
AVERÍAS BENIGNAS
CONSECUENCIAS EN …
EL ENTORNO
AVERÍAS CATASTRÓFICAS
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
TI TL
TIEMPO DE TIEMPO DE
INACTIVIDAD LATENCIA
tf te td ta TIEMPO
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
7
Medios para obtener cierta garantía
de funcionamiento
Barreras para los impedimentos de la garantía de funcionamiento:
FALLOS
ORIGEN FALLOS
Diseño y Fallos E A
especificación software R V
R E
Implementación O R
e instalación CONSECUENCIAS R Í
E A
Causas Fallos S S
físicas hardware
externas
Causas
físicas
internas
Interacción
y operación
BARRERA I BARRERA II BARRERA III
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Prevención de fallos
Se consigue mediante:
• La elección de componentes de alta fiabilidad
• El diseño e implementación extremadamente
cuidadoso
• La protección contra los agentes externos
provocadores de fallos
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
8
Tolerancia a fallos
El objetivo es que el sistema funcione a pesar de los
fallos
Un sistema tolerante a fallos es aquel que posee la
capacidad interna para preservar la ejecución correcta
y continuada de sus programas y funciones de E/S en
presencia de cierto conjunto de fallos operacionales
En la actualidad se deben tolerar también fallos de
diseño.
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Tolerancia a fallos
La tolerancia a fallos se logra mediante:
• El tratamiento de los fallos (prevenir la activación del error).
Barrera II:
• Utilizar la redundancia para suministrar la información
necesaria para evitar los efectos de los fallos
• Para los fallos de diseño: diversificación de diseños
• El procesamiento del error (eliminación del error antes de
que se produzca la avería). Barrera III:
• Detección
• Diagnóstico
• Aislamiento
• Reconfiguración
• Recuperación del error
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
9
Medios para la validación de la
garantía de funcionamiento
Son los medios para obtener una confianza justificada
en que el sistema posee la capacidad de proporcionar
el servicio especificado
Eliminación de fallos
• Consiste en reducir la presencia (número, seriedad) y el
alcance de los fallos
• Se lleva a cabo mediante:
• Verificación
• Diagnosis
• corrección
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
10
Árbol de la garantía de
funcionamiento
FALLOS
IMPEDIMENTOS ERRORES
AVERÍAS
DISPONIBILIDAD
FIABILIDAD
ATRIBUTOS
SEGURIDAD-INOCUIDAD
SEGURIDAD-CONFIDENCIALIDAD
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
Bibliografía
B. W. Johnson. Design and Analysis of Fault Tolerant Digital
Systems. Addison-Wesley, 1989. Capítulos 1, 2
D. K. Pradhan. Fault-Tolerant Computer System Design.
Prentice-Hall, 1996. Capítulo 1
D. P. Siewiorek. y R. Swarz. Reliable Computer Systems:
Design and Evaluation. Digital Press, 1992. Capítulos 1, 2.
Patricia González Gómez. Dpt. Electrónica y Sistemas. Universidad de A Coruña. E-mail: pglez@udc.es.
11