Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
1.CONCEPTOS BÁSICOS.
NIVELES DE ABSTRACCIÓN EN UN STF.
2
• Resistencia de datos y resistencia de procesos, las acciones
siempre se completan, incluso en caso de presencia de averías,
y los datos sobre los que las acciones o procesos operan deben
estar accesibles incluso si hay fallos.
CONFIABILIDAD
ATRIBUTOS DE LA CONFIABILIDAD
3
PREVENCIÓN Y TOLERANCIA
4
MODELO DE SISTEMA
5
SISTEMAS DISTRIBUIDOS. PUNTO DE VISTA FÍSICO.
• No comparten memoria.
6
COMPORTAMIENTO SINCRONO VS ASINCRONO.
• Los errores son causados por fallos (faults). Los fallos son las
disfunciones de los subsistemas. Es la parte del sistema que
causa un error y por tanto una disfunción del mismo.
7
• La presencia de una disfunción se suele deducir detectando
algún error en el estado del sistema.
EJEMPLO:
Fallo: Un bit de memoria se pone al otro estado.
Error: La variable X se afecta por este problema.
Disfunción: El sistema da malos resultados pues la variable X
tiene un valor fuera de rango.
TIPOS DE FALLO
8
TOLERANCIA A FALLOS
9
2. FASES EN LA TOLERANCIA A
FALLOS
1. Detección de errores
2. Confinamiento del daño
3. Recuperación de errores
4. Tratamiento del fallo y reanudación del servicio
10
• Los chequeos de tiempo utilizan temporizadores de vigilancia
(watchdog) para detectar comportamientos temporales fuera de
lo especificado. Se usan tanto en HW como en SW.
EJEMPLO: comprobaciones de tiempo para detectar
problemas en acceso a memoria o al bus.
11
FASE DE CONFINAMIENTO DEL DAÑO
12
FASE DE TRATAMIENTO DE FALLOS Y
REANUDACIÓN DEL SERVICIO
13
3. TOLERANCIA A FALLOS HARDWARE
• A pesar de realizarse tests en todas las fases de su fabricación,
el hardware sigue teniendo fallos.
TÉCNICAS TÍPICAS
Entrada M V
salida
14
• La RMT es más adecuada para fallos transitorios ya que no se
elimina la réplica fallida.
REDUNDANCIA DINÁMICA
15
CODIFICACIÓN
CIRCUITOS AUTOCHEQUEANTES
16