Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tesis de Licenciatura
Departamento de Computacin Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Febrero 2000
Objetivos
Presentar el estado del arte en el desarrollo de tcnicas y mtodos de tolerancia a fallas aplicables a sistemas de tiempo real. Comprobar en forma prctica, los alcances de tcnicas sobre tolerancia a fallas usando replicacin. Probar a RT-Minix como base confiable para desarrollos reales, mediante extensiones y aplicaciones.
Tolerancia a Fallas en Sistemas de Tiempo Real
2
Contenido
Conceptos sobre Sistemas de Tiempo Real Conceptos sobre Tolerancia a Fallas Estado del Arte de la Tolerancia a Fallas en Sistemas de Tiempo Real Replicacin de Sensores en un Modelo Real Conclusiones y Trabajo Futuro
de tiempo estrictas Consecuencias catastrficas si se pierden metas Ejemplo: control de un reactor nuclear
Blandos (Soft)
Restricciones
de tiempo menos rigurosas El clculo pierde valor si se pierden metas Ejemplo: reservas de pasajes en lnea
Tolerancia a Fallas en Sistemas de Tiempo Real
5
Componentes clsicos
Sensores
Entorno
Actuadores
Tolerancia a Fallas
Un sistema falla cuando deja de proveer el servicio que debe prestar. Un sistema es tolerante a fallas si continua proveyendo los servicios especificados an en presencia de fallas de hardware o errores de software.
Error
Manifestacin
Avera
No
total de un componente
Transitorias
Mal
funcionamiento temporario
Intermitentes
Mal
10
La nave Voyager sufri 42 fallas transitorias (SEU - single event upset) y ninguna falla permanente en la intensa radiacin alrededor de Jpiter.
Elasticidad: habilidad para tolerar una segunda falla tras recuperar de una primera
11
de Recursos
se
agrega equipo adicional para tolerar la prdida o mal funcionamiento de ciertos componentes
de Tiempo
se
13
14
ejemplo de Marte
15
16
17
18
digitales
Colas Unificadas
Procesos
usuario
de los servicios existentes y nuevos en ltima versin del SO. Paquete instalable.
Tolerancia a Fallas en Sistemas de Tiempo Real
19
Replicacin de sensores
20
Comparacin de Algoritmos
21
Conclusiones
Extensin del concepto de sistema de tiempo real: aquel que debe proveer el servicio esperado en el momento preciso, an ante la presencia de fallas
22
Conclusiones (cont.)
El rea de incumbencia de la tolerancia a fallas ya abarca a los sistemas de tiempo real. Paquete distribuible de RT-MINIX, adecuado como SOTR para futuros proyectos de tiempo real. Comprobacin de la validez y exactitud de algoritmos de sensado robusto, mediante valores estticos y dinmicos.
23
Conclusiones (cont.)
Se cuenta con herramientas para que el ciclo completo de desarrollo e implementacin de un sistema de tiempo real incluya capacidades de tolerancia a fallas:
Lenguajes
de especificacin y diseo Algoritmos de planificacin Profusin de sensores y actuadores Algoritmos de sensado robusto
24
Trabajo Futuro
Incorporar en RT-MINIX nuevos servicios de tiempo real: planificacin tolerante a fallas, herencia de prioridades, interface grfica. Probar RT-MINIX con sistemas de tiempo real que impongan una alta carga de trabajo: prototipo lnea embotelladora. Proponer y estudiar nuevos algoritmos de sensado robusto: multidimensionales.
25