Está en la página 1de 25

Tolerancia a Fallas en Sistemas de Tiempo Real

Tesis de Licenciatura
Departamento de Computacin Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires

Pablo J. Rogina Director: Dr. G. Wainer

Febrero 2000

Objetivos

Presentar el estado del arte en el desarrollo de tcnicas y mtodos de tolerancia a fallas aplicables a sistemas de tiempo real. Comprobar en forma prctica, los alcances de tcnicas sobre tolerancia a fallas usando replicacin. Probar a RT-Minix como base confiable para desarrollos reales, mediante extensiones y aplicaciones.
Tolerancia a Fallas en Sistemas de Tiempo Real
2

Contenido

Conceptos sobre Sistemas de Tiempo Real Conceptos sobre Tolerancia a Fallas Estado del Arte de la Tolerancia a Fallas en Sistemas de Tiempo Real Replicacin de Sensores en un Modelo Real Conclusiones y Trabajo Futuro

Tolerancia a Fallas en Sistemas de Tiempo Real

Sistemas de Tiempo Real


Definiciones Aquellos sistemas que no slo tienen que producir resultados correctos, sino que tienen que realizarlos en un momento determinado. Consecuencias catastrficas si no se cumplen los restricciones temporales impuestas.

Tolerancia a Fallas en Sistemas de Tiempo Real

Sistemas de Tiempo Real (cont.)


Clasificacin Duros (Hard)
Restricciones

de tiempo estrictas Consecuencias catastrficas si se pierden metas Ejemplo: control de un reactor nuclear

Blandos (Soft)
Restricciones

de tiempo menos rigurosas El clculo pierde valor si se pierden metas Ejemplo: reservas de pasajes en lnea
Tolerancia a Fallas en Sistemas de Tiempo Real
5

Sistemas de Tiempo Real (cont.)


Esquema General
Monitoreo Termmetro Ph-metro Sensores

Control Tanque de Agua Entorno

Actuadores Actuacin Calentador Inyector

Tolerancia a Fallas en Sistemas de Tiempo Real

Sistemas de Tiempo Real (cont.)


Acciones bsicas
Monitoreo Control Actuacin

Componentes clsicos
Sensores

Entorno
Actuadores

Tolerancia a Fallas en Sistemas de Tiempo Real

Tolerancia a Fallas

Un sistema falla cuando deja de proveer el servicio que debe prestar. Un sistema es tolerante a fallas si continua proveyendo los servicios especificados an en presencia de fallas de hardware o errores de software.

Tolerancia a Fallas en Sistemas de Tiempo Real

Tolerancia a Fallas (cont.)


Definiciones Falla
Defecto

dentro de un componente de hardware o software de una falla

Error
Manifestacin

Avera
No

realizacin de alguna accin esperada


Tolerancia a Fallas en Sistemas de Tiempo Real
9

Tolerancia a Fallas (cont.)


Clases de Fallas Permanentes
Falla

total de un componente

Transitorias
Mal

funcionamiento temporario

Intermitentes
Mal

funcionamiento temporario que se repite con frecuencia

Tolerancia a Fallas en Sistemas de Tiempo Real

10

Tolerancia a Fallas (cont.)


Ocurrencias Las fallas transitorias son rdenes de magnitud ms comunes que las fallas permanentes
Ejemplo:

La nave Voyager sufri 42 fallas transitorias (SEU - single event upset) y ninguna falla permanente en la intensa radiacin alrededor de Jpiter.

Elasticidad: habilidad para tolerar una segunda falla tras recuperar de una primera

Tolerancia a Fallas en Sistemas de Tiempo Real

11

Tolerancia a Fallas (cont.)


Redundancia de Informacin
replicacin

de datos, cdigos de correcin de errores.

de Recursos
se

agrega equipo adicional para tolerar la prdida o mal funcionamiento de ciertos componentes

de Tiempo
se

realiza una accin, y de ser necesario, se vuelve a realizar


Tolerancia a Fallas en Sistemas de Tiempo Real
12

Estado del Arte


Revisin de Avances en: Tcnicas de Especificacin y Diseo Algoritmos de Planificacin Uso de Sensores y Actuadores

Tolerancia a Fallas en Sistemas de Tiempo Real

13

Estado del Arte (cont.)


Especificacin y Diseo Lgica Temporal Evaluacin de la Latencia de Tolerancia a Fallas Especificacin y Verificacin Formal para Sistemas Digitales de Control de Vuelo

Tolerancia a Fallas en Sistemas de Tiempo Real

14

Estado del Arte (cont.)


Algoritmos de Planificacin Garanta de Tolerancia a Fallas mediante Planificacin Tasa Monotnica Tolerante a Fallas (FT-RMS) Integracin de Planificacin y Tolerancia a Fallas Planificacin y Tolerancia a fallas
el

ejemplo de Marte

Tolerancia a Fallas en Sistemas de Tiempo Real

15

Estado del Arte (cont.)


Uso de Sensores y Actuadores Tolerancia a Fallas en HANNIBAL Tolerando Fallas de Sensores Continuamente Valuados Tolerancia a Fallas en un Entorno Multisensor Algoritmos de Sensado Robusto y Distribuido

Tolerancia a Fallas en Sistemas de Tiempo Real

16

Estado del Arte (cont.)


Algoritmos de Sensado Robusto Acuerdo Aproximado Convergencia Rpida Regin Optima Brooks-Iyengar Hbrido

Tolerancia a Fallas en Sistemas de Tiempo Real

17

Experiencias con un Modelo Real


Trabajos realizados Extensin de RT-MINIX con nuevos servicios (driver de joystick, colas unidas) Aplicacin de RT-MINIX como soporte para desarrollar sistemas de tiempo real Implementacin y prueba de algoritmos de integracin de sensores replicados

Tolerancia a Fallas en Sistemas de Tiempo Real

18

Experiencias con un Modelo Real


(cont.)

RT-MINIX Driver de joystick


Capacidad

de conectar sensores analgicos y

digitales

Colas Unificadas
Procesos

MM y FS se unieron con procesos de

usuario

Nueva Distribucin basada en Minix 2.0.0


Integracin

de los servicios existentes y nuevos en ltima versin del SO. Paquete instalable.
Tolerancia a Fallas en Sistemas de Tiempo Real
19

Experiencias con un Modelo Real


(cont.)

Replicacin de sensores

Tolerancia a Fallas en Sistemas de Tiempo Real

20

Experiencias con un Modelo Real


(cont.)

Algoritmos de sensado robusto Implementacin


Programas

de Usuario Servicio del SO

Pruebas Esttica y Dinmica


Datos

codificados en los programas Datos variables a travs de sensores replicados

Comparacin de Algoritmos

140,00 120,00 100,00 80,00 60,00 40,00 20,00 0,00 A K

Amplitud Rango Diferencia Valores

Tolerancia a Fallas en Sistemas de Tiempo Real

21

Conclusiones
Extensin del concepto de sistema de tiempo real: aquel que debe proveer el servicio esperado en el momento preciso, an ante la presencia de fallas

Tolerancia a Fallas en Sistemas de Tiempo Real

22

Conclusiones (cont.)

El rea de incumbencia de la tolerancia a fallas ya abarca a los sistemas de tiempo real. Paquete distribuible de RT-MINIX, adecuado como SOTR para futuros proyectos de tiempo real. Comprobacin de la validez y exactitud de algoritmos de sensado robusto, mediante valores estticos y dinmicos.

Tolerancia a Fallas en Sistemas de Tiempo Real

23

Conclusiones (cont.)

Se cuenta con herramientas para que el ciclo completo de desarrollo e implementacin de un sistema de tiempo real incluya capacidades de tolerancia a fallas:
Lenguajes

de especificacin y diseo Algoritmos de planificacin Profusin de sensores y actuadores Algoritmos de sensado robusto

Tolerancia a Fallas en Sistemas de Tiempo Real

24

Trabajo Futuro

Incorporar en RT-MINIX nuevos servicios de tiempo real: planificacin tolerante a fallas, herencia de prioridades, interface grfica. Probar RT-MINIX con sistemas de tiempo real que impongan una alta carga de trabajo: prototipo lnea embotelladora. Proponer y estudiar nuevos algoritmos de sensado robusto: multidimensionales.

Tolerancia a Fallas en Sistemas de Tiempo Real

25

También podría gustarte