Lea Dfo PDF

UNIVERSIDAD TECNOLÓGICA DE
PEREIRA
PROGRAMA DE TECNOLOGÍA ELÉCTRICA
Laboratorio de Investigación y Desarrollo en Electrónica
y Robótica – LÍDER
DISEÑO DE FILTROS ÓPTIMOS
Presentado por:
Gloria Mercedes Valencia T., Luis Enrique Avendaño

⃝
c Luis Enrique Avendaño, Gloria M. Valencia T., 2018
Índice general
1. Elementos de cálculo matricial 1

1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Cálculo matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3. Álgebra de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1. Suma de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.2. Multiplicación de matrices . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.3. Propiedades básicas de las matrices . . . . . . . . . . . . . . . . . . . . 5
1.3.4. El caso especial de las matrices 2 × 2 . . . . . . . . . . . . . . . . . . . 9
1.3.5. Lema de inversión de matrices . . . . . . . . . . . . . . . . . . . . . . 13
1.3.6. Valores propios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.7. Diagonalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.8. Teorema espectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.9. El producto de Hadamard . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.10. Propiedades básicas del producto de Hadamard . . . . . . . . . . . . . 18
1.3.11. El producto de Kronecker . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3.12. El operador vec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Nota sobre la función vec y Matlab. . . . . . . . . . . . . . . . 27
1.3.13. Suma de Kronecker . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.3.14. Funciones de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.4. Número de condición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.5. Cálculo vectorial y matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.5.1. Derivada parcial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.6. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2. Elementos de sistemas dinámicos 45

2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2. Sistemas lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.3. Sistemas no lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.4. Discretización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.5. Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.5.1. Sistemas de tiempo continuo . . . . . . . . . . . . . . . . . . . . . . . 54
2.5.2. Sistemas de tiempo discreto . . . . . . . . . . . . . . . . . . . . . . . . 58
iii
iv Índice general
2.6. Controlabilidad y Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 60

2.6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.6.2. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.6.3. Estabilidad y detectabilidad . . . . . . . . . . . . . . . . . . . . . . . . 67
2.7. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3. Estimación por mı́nimos cuadrados 73

3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.2. Estimación de una constante . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.3. Estimación por mı́nimos cuadrados ponderados . . . . . . . . . . . . . . . . . 76
3.4. Estimación recursiva por mı́nimos cuadrados . . . . . . . . . . . . . . . . . . 79
3.5. Formas alternas del estimador . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.6. El filtro de Wiener . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.6.1. Optimización del filtro paramétrico . . . . . . . . . . . . . . . . . . . 94
3.6.2. Optimización del filtro general . . . . . . . . . . . . . . . . . . . . . . 96
3.6.3. Optimización del filtro no causal . . . . . . . . . . . . . . . . . . . . . 98
3.6.4. Optimización del filtro causal . . . . . . . . . . . . . . . . . . . . . . . 99
3.6.5. Comparación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.7. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4. Filtro de Kalman discreto 105

4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.2. Sistemas discretos en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.2.1. Procesos con ruido ponderado . . . . . . . . . . . . . . . . . . . . . . . 110
4.3. Sistemas con datos muestreados . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.4. Deducción del filtro de Kalman discreto . . . . . . . . . . . . . . . . . . . . . 117
El filtro de Kalman discreto . . . . . . . . . . . . . . . . . . . . . . . . 123
4.5. Propiedades del filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.5.1. Ecuaciones del filtro de Kalman de un paso . . . . . . . . . . . . . . . 129
4.5.2. Propagación alterna de la covarianza . . . . . . . . . . . . . . . . . . . 134
Sistemas con estados múltiples . . . . . . . . . . . . . . . . . . . . . . 134
Sistemas escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.6. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5. Formas alternas del filtro de Kalman 149

5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.2. Filtrado de raı́z cuadrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Número de condición . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5.2.1. Ecuación de actualización en el tiempo de la raı́z cuadrada . . . . . . 155
5.2.2. Algoritmos para transformaciones ortogonales . . . . . . . . . . . . . . 156
El algoritmo de Householder . . . . . . . . . . . . . . . . . . . . . . . 157
El algoritmo de Gram–Schmidt modificado . . . . . . . . . . . . . . . 162
Algoritmo de actualización de la medida de raı́z cuadrada de Potter . 169
5.3. Filtro de información . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
5.4. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
Índice general v
6. Generalización del filtro de Kalman 183

6.1. Simulación de ruido correlacionado . . . . . . . . . . . . . . . . . . . . . . . . 183
6.2. Correlación del ruido del proceso y de la medida . . . . . . . . . . . . . . . . 185
6.3. Ruido coloreado de proceso y medición . . . . . . . . . . . . . . . . . . . . . . 192
6.3.1. Ruido coloreado del proceso . . . . . . . . . . . . . . . . . . . . . . . . 192
6.3.2. Ruido coloreado de medición: aumento de estado . . . . . . . . . . . . 194
6.3.3. Ruido coloreado de la medida: diferenciación de la medición . . . . . . 195
6.4. Filtrado de estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . 201
6.4.1. Un enfoque Hamiltoniano para filtrado de estado estacionario . . . . . 209
6.5. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
7. El filtro de Kalman continuo 221

7.1. Ruido blanco en tiempo discreto y en tiempo continuo . . . . . . . . . . . . . 222
7.1.1. Ruido del proceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
7.1.2. Ruido de medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
7.1.3. Simulación discretizada de sistemas de tiempo continuo ruidosos . . . 225
7.1.4. Deducción del filtro de Kalman en tiempo continuo . . . . . . . . . . . 226
7.2. Soluciones alternativas para la ecuación de Riccati . . . . . . . . . . . . . . . 234
7.2.1. El enfoque de la matriz de transición . . . . . . . . . . . . . . . . . . . 234
7.2.2. El filtro de raı́z cuadrada . . . . . . . . . . . . . . . . . . . . . . . . . 239
7.3. Filtro de Kalman en tiempo continuo de estado estacionario . . . . . . . . . . 241
7.3.1. La ecuación algebraica de Riccati . . . . . . . . . . . . . . . . . . . . . 242
7.3.2. El filtro de Wiener es un filtro de Kalman . . . . . . . . . . . . . . . . 246
7.4. Dualidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
7.5. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
8. El filtro de Kalman no lineal 255

8.1. El filtro de Kalman linealizado . . . . . . . . . . . . . . . . . . . . . . . . . . 256
8.2. Filtro de Kalman extendido . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
8.2.1. Filtro de Kalman extendido de tiempo discreto . . . . . . . . . . . . . 263
8.2.2. Filtro de Kalman extendido hı́brido . . . . . . . . . . . . . . . . . . . 266
8.3. El filtro de Kalman unscented . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
8.3.1. Media y covarianza de trasformaciones no lineales . . . . . . . . . . . 269
La media de una transformación no lineal . . . . . . . . . . . . . . . . 270
La covarianza de una transformación no lineal . . . . . . . . . . . . . 274
8.3.2. Transformaciones unscented . . . . . . . . . . . . . . . . . . . . . . . . 278
Aproximación de la media . . . . . . . . . . . . . . . . . . . . . . . . . 280
Aproximación de la covarianza . . . . . . . . . . . . . . . . . . . . . . 283
La transformación unscented . . . . . . . . . . . . . . . . . . . . . . . 286
8.4. Filtrado de Kalman unscented . . . . . . . . . . . . . . . . . . . . . . . . . . . 288
8.5. Otras transformaciones unscented . . . . . . . . . . . . . . . . . . . . . . . . . 293
8.5.1. Transformaciones unscented generalizadas . . . . . . . . . . . . . . . . 294
8.5.2. La transformación unscented sı́mplex . . . . . . . . . . . . . . . . . . . 295
8.5.3. La transformación unscented esférica . . . . . . . . . . . . . . . . . . . 297
vi Índice general
A. Funciones matriciales 303

A.1. Derivada de la traza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
Primer Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
Segundo Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
Orden Superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
Otras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
B. Transformada delta 307

B.1. Forma delta del estimador de estado óptimo . . . . . . . . . . . . . . . . . . . 309
B.1.1. El filtro de Kalman con operador delta . . . . . . . . . . . . . . . . . . 310
Lista de figuras
1.1. Realimentación serie–serie. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2. Circuito realimentado serie–paralelo. . . . . . . . . . . . . . . . . . . . . . 12
2.1. Circuito RLC para análisis de controlabilidad. . . . . . . . . . . . . . . . 63
3.1. Problema del tanque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

3.2. Representación del filtro de Wiener. . . . . . . . . . . . . . . . . . . . . . 94
4.1. Problema predador–presa. . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

4.2. Lı́nea temporal que muestra la relación entre los estimados de estado sua-
vizado, a posteriori, a priori y predictivo. En esta figura, se supone que se
han recibido las medidas, en pasos de tiempo hasta k = 5, inclusive. Una
estimación del estado en k < 5 se denomina una estimación suavizada. Una
estimación del estado en k = 5 se denomina una estimación a posteriori. Una
estimación del estado en k = 6 se llama la estimación a priori. Una estimación
del estado en k > 6 se llama predicción. . . . . . . . . . . . . . . . . . . . . . 120
4.3. Lı́nea de tiempo que muestra los valores estimados de los estados y la
covarianza del error de estimación a priori y a posteriori, respectiva-
mente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.4. El ciclo del filtro de Kalman. . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.5. Los primeros cinco pasos de las varianzas en la estimación del error a
priori y a posteriori del Ejemplo 4.5. . . . . . . . . . . . . . . . . . . . . . 132
4.6. Los primeros sesenta pasos de las varianzas del error de estimación a
priori y a posteriori del Ejemplo 4.5. . . . . . . . . . . . . . . . . . . . . . 133
4.7. El error de medición y el error de estimación de la posición en el Ejemplo 4.5. 133
4.8. Covarianza del error de estimación y ganancia de Kalman en función
del tiempo. Ambas convergen a valores de estado estacionario. . . . . . 140
4.9. Divergencia del filtro de Kalman debido al mal modelado de un proceso. 142
4.10. Mejora del filtrado de Kalman debido a ruido ficticio en el proceso. . . 143
4.11. Ganancia de Kalman para varios valores del ruido del proceso. . . . . . 143
vii
viii Lista de figuras
6.1. Simulación del filtro de Kalman usando ruido del proceso y de la medida
correlacionados. S = correlación entre el ruido del proceso y el ruido
de la medida. SF ilter = valor de S usado en el filtro de Kalman. . . . . 191
6.2. Simulación del filtro de Kalman usando ruido del proceso y de la medida
coloreados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
8.1. Resultados de la simulación del filtro de Kalman extendido continuo

para el motor sı́ncrono de imán permanente bifásico. . . . . . . . . . . . 262
8.2. Media linealizada y media no lineal de 300 puntos generados de forma
aleatoria, con r̃ uniformemente distribuido entre ±0.01 y θ̃ uniforme-
mente distribuido entre ±0.35 rad. . . . . . . . . . . . . . . . . . . . . . . 272
8.3. Media linealizada y media no lineal de 300 puntos generados de forma
aleatoria, con r̃ uniformemente distribuido entre ±0.01 y θ̃ uniforme-
mente distribuido entre ±0.35 rad. . . . . . . . . . . . . . . . . . . . . . . 278
Índice de tablas
4.1. Relaciones entre las estimaciones y las covarianzas de las secciones

3.4 y 4.4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.1. Valores experimentales de la varianza del error de estimación (50 pasos de

tiempo) para el Ejemplo 6.1 cuando hay una covarianza cruzada S entre el
ruido del proceso y el ruido de la medida. El filtro estándar asume S = 0 y el
filtro correlacionado utiliza el valor correcto de S. . . . . . . . . . . . . . . . 192
6.2. Cuando se incrementa el contenido de color del ruido de medición (es decir,
cuando ψ se incrementa), los filtros para ruido coloreado mejoran su desem-
peño en comparación con el filtro estándar de Kalman. . . . . . . . . . . . . . 199
8.1. Resultados del ejemplo que muestran una desviación estándar de los errores
de estimación de estado determinados a partir de los resultados de simulación
y determinados a partir de la matriz P del EKF. Estos resultados son para la
simulación del motor de imán permanente de dos fases. Esta tabla muestra que
la matriz P es un buen indicador de la magnitud de los errores de estimación
de estado del EKF. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
8.2. Ejemplo [] estimación de errores para el filtro de Kalman extendido,
el filtro de Kalman unscented estándar con 2n puntos sigma y el filtro
de Kalman unscented esférico con (n + 1) puntos sigma. Generalmen-
te el UKF estándar se desempeña mejor. El desempeño y el esfuerzo
computacional del UKF esférico se encuentran entre los de el EKF y
el UKF estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
ix
Lista de algoritmos
3.1. Estimación recursiva por mı́nimos cuadrados . . . . . . . . . . . . . . . . . . 82

3.2. Estimación recursiva por mı́nimos cuadrados. . . . . . . . . . . . . . . . . . . 85
4.1. Filtro de Kalman discreto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
5.1. Algoritmo de Cholesky para raı́z cuadrada de matrices. . . . . . . . . . . . . 152

5.2. Algoritmo de Householder. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
5.3. Algoritmo de Gram–Schmidt modificado. . . . . . . . . . . . . . . . . . . . . 165
5.4. Actualización de la medida de raı́z cuadrada de Potter. . . . . . . . . . . . . . 172
5.5. Filtro de información. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
6.1. Simulación de ruido correlacionado . . . . . . . . . . . . . . . . . . . . . . . . 185

6.2. Filtro de Kalman general de tiempo discreto. . . . . . . . . . . . . . . . . . . 190
6.3. El filtro de Kalman discreto con ruido de medida coloreado. . . . . . . . . . . 197
6.4. El enfoque Hamiltoniano para filtrado de Kalman de estado estacionario. . . 214
7.1. El filtro de Kalman en tiempo continuo. . . . . . . . . . . . . . . . . . . . . . 230

7.2. El filtro de Kalman de raı́z cuadrada en tiempo continuo. . . . . . . . . . . . 240
8.1. El filtro de Kalman linealizado de tiempo continuo. . . . . . . . . . . . . . . . 258

8.2. El filtro de Kalman extendido en tiempo continuo. . . . . . . . . . . . . . . . 261
8.3. El filtro de Kalman extendido de tiempo discreto. . . . . . . . . . . . . . . . . 265
8.4. El filtro de Kalman extendido hı́brido. . . . . . . . . . . . . . . . . . . . . . . 268
8.5. Filtro de Kalman unscented. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
8.6. Puntos sigma sı́mplex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
8.7. Puntos sigma esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
xi
xii
Capı́tulo 1
Elementos de cálculo matricial
1.1. Introducción
E n este capı́tulo se revisan algunos aspectos básicos del álgebra lineal. La teorı́a de estima-
ción óptima de estados depende fuertemente de la teorı́a de matrices, incluyendo cálculo
matricial; de manera que la primera parte está dedicada a una revisión de este tópico. La
estimación óptima de estados se aplica tanto a sistemas lineales como a no lineales, aunque
es más directa para los lineales. Por lo tanto, se dará una breve revisión de estos sistemas.
Las últimas secciones se dedicarán a revisar los conceptos de estabilidad, controlabilidad y
observabilidad de los sistemas lineales. Estos conceptos son necesarios para comprender el
material de estimación óptima de estados que se estudiará más adelante.
1.2. Cálculo matricial

En esta sección, se revisará el concepto de matrices, álgebra matricial y cálculo matricial. Es-
to es necesario con el objeto de entender el resto del libro ya que los algoritmos de estimación
óptima de estados se formulan con matrices.
Un escalar es una cantidad simple. Por ejemplo el número 5 es un escalar, el número
2 + j3 es un escalar, ası́ como el número π o el número e.
Un vector consiste en escalares que se arreglan en filas o en columnas. Por ejemplo, el
vector
[1 5 − 3 0]
es un vector de 4 elementos. Este vector se denomina 1 × 4 porque tiene una fila y cuatro
columnas, también se denomina vector fila. El vector
[ ]⊤
x = cos ωk sen ωk − sen ωk cos ωk 0 1
1
2 Capı́tulo 1. Elementos de cálculo matricial
es un vector de 6 elementos, donde el superı́ndice ⊤ indica la transpuesta. Este vector se

denomina vector 6 × 1 porque tiene seis filas y una columna.
Una matriz consiste de escalares que se arreglan en un rectángulo. Por ejemplo, la matriz
 
cos ωn T sen ωn T 0 0
− sen ωn T cosωn T 0 1
0 0 1 1
es una matriz 3 × 4 puesto que tiene 3 filas y cuatro columnas. El número de filas y columnas
se define como la dimensión de la matriz. Se define el rango de una matriz como el número
de filas o columnas linealmente independientes [Kreyszig, 2011]. El rango de la matriz A se
indica como ρ(A). El rango de una matriz siempre es menor o igual que el número de filas
o columnas, según el caso que se contemple. Por ejemplo, la matriz
[ ]
2 3 1 −2
A=
4 6 2 −4
es uno (Matlab: rank(A)) debido a que tiene solamente una fila linealmente independiente;
las dos filas son múltiples entre sı́. Por otra parte, la matriz
 
1 2 5
A =  3 4 −1
−1 3 5
tiene rango 3 puesto que todas sus filas y columnas son linealmente independientes. Esto es,
existen escalares α1 , α2 y α3 tales que
[ ] [ ] [ ] [ ]
α1 1 2 5 + α2 3 4 −1 + α3 −1 3 5 = 0 0 0
de modo que las tres filas son linealmente independientes. Lo mismo para las columnas. Esto
es, hay escalares α1 , α2 y α3 diferentes de cero tales que
       
1 2 5 0
α1  3  + α2 4 + α3 −1 = 0
−1 3 5 0
de modo que las tres columnas son linealmente independientes. Una matriz cuyos elementos
son todos cero tiene un rango de cero. Una matriz n × m cuyo rango es igual al min(n, m)
es de rango completo. La nulidad de una matriz A n × m es igual a [m − ρ(A)].
La transpuesta de una matriz o vector se puede obtener por el cambio de todas las filas
a columnas, y todas las columnas a filas o de columna a fila en el caso de un vector. Por
1.3. Álgebra de matrices 3
ejemplo, si A es una matriz r × p

 
a11 · · · a1p
 .. 
A =  ... ..
. . 
ar1 ··· arp
entonces A⊤ es la matriz p × r
 
a11 · · · ar1
 .. 
A⊤ =  ... ..
. . 
a1p · · · arp
Si una matriz es simétrica entonces A = A⊤ .

Para una matriz en Cn×n , la transpuesta hermitiana (o hermı́tica) es la conjugada com-
pleja de la transpuesta, y se indica con un superı́ndice H, como en AH . Por ejemplo, si
 
2 3 − j4 j
A = 1 − j2 2 1 + j3
j3 5 − j2 5
entonces AH es la matriz
 
2 1 + j2 −j3
AH = 3 + j4 2 5 + j2
−j 1 − j3 5
Una matriz hermı́tica es aquella para la cual A = AH . Esto es equivalente a la condición
aij = aji , (1.1)
donde aji denota la conjugada compleja. Como resultado de esta definición, los elementos
de la diagonal aii de una matriz hermı́tica son números reales (ya que aii = aii ), mientras
que otros elementos pueden ser complejos.
Como un ejemplo de matrices hermı́ticas 2 × 2 se tienen las matrices de Pauli [Nakahara,
2003]:
[ ] [ ] [ ]
0 1 0 −i 1 0
σ1 = σ2 = σ3 =
1 0 i 0 0 −1
1.3. Álgebra de matrices

En esta sección se hará un breve repaso de las operaciones algebraicas que se pueden realizar
con matrices, se hace una revisión de algunas de las propiedades de las matrices que se
consideran importantes para los estudios posteriores.
1.3.1. Suma de matrices

La suma y la resta entre matrices se define por la adición y sustracción de elemento por
elemento de cada matriz, solo si la dimensión de las matrices es igual. Por ejemplo,
     
a11 · · · a1p b11 · · · b1p a11 ± b11 · · · a1p ± b1p
 ..  ±  .. ..  =  
A ± B =  ... ..
. .   .
..
. .  
..
.
..
.
..
.  (1.2)
ar1 ··· arp br1 ··· brp ar1 ± br1 ··· arp ± brp
1.3.2. Multiplicación de matrices

Dadas dos matrices A y B, tales que el número de columnas de la matriz A es igual al
número de filas de la matriz B; es decir:
A := (aij )m×n y B := (bij )n×p
la multiplicación de A por B, que se denota AB, es una nueva matriz C:
C = AB := (cij )m×p
es decir:
   
a11 ··· a1n b11 ··· b1p
 .. .. ..   .. .. .. 
C = Am×n Bn×p = . . .  × . . . 
am1 ··· amn m×n
bn1 ··· bnp n×p
 
a11 b11 + · · · + a1n bn1 ··· a11 b1p + · · · + a1n bnp
 .. .. .. 
= . . . 
am1 b11 + · · · + amn bn1 ··· am1 b1p + · · · + amn bnp m×p
o en forma más compacta [Simon, 2006],[Kreyszig, 2011]:

∑ n ∑n 
a1j bj1 · · · a1j bjp
 j=1 
 j=1 
 . . . 
C= .. .. ..  (1.3)
 n 
∑ ∑n 
amj bj1 · · · amj bjp
j=1 j=1 m×p
El producto matricial AB solo está definido si el número de columnas de A es igual al

número de filas de B. Se debe notar que la multiplicación de matrices no es conmutativa.
En general AB ̸= BA.
Como un caso particular del producto de matrices, se tiene el producto entre vectores
el cual puede conducir a un escalar o a una matriz, según como se aplique dicho producto.
Sea el vector xn×1 . Se puede calcular el producto (x⊤ x)1×1 , y el producto (xx⊤ )n×n como
sigue:

x1
[ ] 
 x2 
x⊤ x = x1 x2 · · · xn  .  = x21 + x22 + · · · + x2n (1.4)
 .. 
xn
   
x1 x21 x1 x2 ··· x1 xn
 x2  [ 
]  x2 x1 x22 ··· x2 xn 
  
xx⊤ =  .  x1 x2 ··· xn =  . .. .. ..  (1.5)
 ..   .. . . . 
xn xn x1 xn x2 ··· x2n
Supóngase que se tiene una matriz H(p×n) y una matriz P(n×n) . Entonces H⊤ es una
matriz n × p, y se puede calcular el producto matricial HPH⊤
(p×p) [Poznyak, 2008].
   
h11 · · · h1n p11 · · · p1n h11 ··· hp1
⊤  .. .. ..   .. . .  
..   ... .. .. 
HPH =  . . .  . .. . . 
hp1 · · · hpn pn1 · · · pnn h1n ··· hpn
∑ ∑ 
h1j pjk h1k · · · h1j pjk hpk
j,k j,k 
 .. .. .. 
= . . .  (1.6)
∑ ∑ 
hpj pjk h1k · · · hpj pjk hpk
j,k j,k
Esta matriz de sumas se puede escribir como la siguiente suma de matrices:

   
h11 p11 h11 · · · h11 p11 hp1 h1n pnn h1n · · · h1n pnn hpn
 .. ..   .. .. 
HPH⊤ =  .
..
. .  + ··· +  .
..
. . 
hp1 p11 h11 ··· hp1 p11 hp1 hpn pnn h1n ··· hpn pnn hpn
= h1 p11 h⊤
1 + ··· + hn pnn h⊤
n
∑
= hj pjk h⊤
k (1.7)
j,k
donde se ha utilizado la notación de que hk es la columna de orden k de H.
1.3.3. Propiedades básicas de las matrices

A continuación se muestran algunas de las propiedades de las matrices, para que se cumplan,
en algunas situaciones se requiere que posean rango completo [Kreyszig, 2011], [Pedersen and
Petersen, 2012].
1. No conmutativa para el producto:
En general:
AB ̸= BA (1.8)
2. Asociativa:
A(BC) = (AB)C (1.9)
3. Distributiva sobre la suma:
A(B + C) = AB + AC, (A + B)C = AC + BC (1.10)
4. Multiplicación por un escalar:
α(AB) = (αA)B y (AB)α = A(Bα) α es un escalar. (1.11)
5. Inversa:
(AB)−1 = B−1 A−1 (1.12)
En general
(ABC · · · P)−1 = P−1 · · · C−1 B−1 A−1 (1.13)
6. Transpuesta:
(A + B)⊤ = A⊤ + B⊤ (1.14)
(AB)⊤ = B⊤ A⊤ (1.15)
(A⊤ )−1 = (A−1 )⊤ (1.16)
En general
(ABC · · · P)⊤ = P⊤ · · · C⊤ B⊤ A⊤ (1.17)
7. Conjugada Hermı́tica:
Si A y B tienen elementos complejos, entonces
(A + B)H = AH + BH (1.18)
(AB)H = BH AH (1.19)
(AH )−1 = (A−1 )H (1.20)
donde H denota la conjugada hermı́tica de una matriz (conjugada compleja y trans-

puesta). En general
(ABC · · · P)H = PH · · · CH BH AH (1.21)
8. Traza:
∑ ∑
tr(A) = aii = λi ; donde λi = eig(A) (1.22)
i i
La traza de un producto es independiente del orden de los factores:
tr(AB) = tr(BA) (1.23)
tr(ABC) = tr(BCA) = tr(CAB) (1.24)
Para una suma:
tr(A + B) = tr(A) + tr(B) (1.25)
9. Determinante:
Sea A una matriz n × n. Usando la notación Aij para representar la matriz formada
borrando la i-ésima fila y la j -ésima columna de A. Entonces, el determinante de A
se define como
∑
n
|A| = (−1)i+j aij |Aij | (1.26)
j=1
para cualquier valor de i ∈ [1, n]. Esta se denomina expansión de Laplace de A a

lo largo de su i -ésima fila. Se puede observar que el determinante de la matriz A
n × n, se define en términos de los determinantes de las matrices (n − 1) × (n − 1).
Similarmente, los determinantes de las matrices (n−1)×(n−1) se definen en términos
de las matrices (n − 2) × (n − 2). Esto continúa hasta el determinante de las matrices
2 × 2 los cuales se definen en términos de los determinantes de las matrices 1 × 1, los
cuales son escalares. El determinante de la matriz A también se puede definir como
una expansión de Laplace a lo largo de su j -ésima columna, es decir,

∑
n
|A| = (−1)i+j aij |Aij | (1.27)
i=1
para cualquier valor de j ∈ [1, n]. Ambos desarrollos conducen a un mismo resultado.
A partir de la definición se puede observar para los casos (2 × 2) y (3 × 3):
[ ]
a a12
det(A) = det 11 = a11 a22 − a12 a21 (1.28)
a21 a22
 
a11 a12 a13
det(A) = det a21 a22 a23  =
a31 a32 a33
[ ] [ ] [ ]
a a23 a a23 a a22
= a11 det 22 − a12 det 21 + a13 det 21 =
a32 a33 a31 a33 a31 a32
= a11 (a22 a33 − a23 a32 ) − a12 (a21 a33 − a23 a31 ) + a13 (a21 a32 − a22 a31 )
(1.29)
Propiedades:
det(A) = Πi λi , donde λi = eig(A), (1.30)

det(cA) = c det(A),n
si A ∈ R n×n
, (1.31)
⊤
det(A ) = det(A), (1.32)
det(AB) = det(A)det(B), (1.33)
−1
det(A ) = 1/det(A), (1.34)
det(An ) = det(A)n . (1.35)
10. Potencia de matrices.
Las matrices cuadradas se pueden multiplicar por sı́ mismas en forma repetida del
mismo modo que los números ordinarios, puesto que ellas tienen siempre el mismo
número de filas y columnas. Esta multiplicación repetida se puede describir como la
“potencia de la matriz”, un caso especial del producto de matrices. Las matrices “rec-
tangulares” no tienen el mismo número de filas y columnas por lo que no se pueden
elevar a una potencia. Una matriz An×n elevada a un entero positivo p se define como
· · · A}
Ap = |AA{z
p veces
y las siguientes identidades se mantienen, donde κ es un escalar:

(i) Potencia cero:
A0 = I
I es la matriz identidad.
(ii) Multiplicación por un escalar:
(αA)p = αp Ap
Norma euclidiana
La norma dos de un vector columna de números reales, también llamada la norma euclidiana,
se define como sigue:
√ √
||x||2 = x⊤ x = x21 + · · · + x2n (1.36)
De la Ecuación (1.5), se observa que

   2 
x1 x1 x1 x2 ··· x1 xn
 x2  [ 
]  2 x1
x x22 ··· x2 xn 
  
xx⊤ =  .  x1 x2 · · · xn =  . .. .. .. 
 ..   .. . . . 
xn xn x1 xn x2 ··· x2n
Tomando la traza de esta matriz se obtiene:

( )
Tr xx⊤ = x21 + x22 + · · · + x2n
= ||x||22 (1.37)
Esto significa que la norma euclidiana al cuadrado equivale a la traza del producto del vector
por su transpuesta, es decir:
( )
x⊤ x = Tr xx⊤ (1.38)
1.3.4. El caso especial de las matrices 2 × 2
Dado que las matrices cuadradas 2 × 2 son de uso muy frecuente en la práctica, es de interés
analizar este caso ya que posee algunas propiedades de interés, las cuales permiten simplificar
los cálculos. Considérese la matriz
[ ]
a11 a12
A= (1.39)
a21 a22
1. Determinante y traza.
det(A) = a11 a22 − a12 a21 , (1.40)

tr(A) = a11 + a22 . (1.41)
2. Valores propios
[ ] [ ] [ ]
λ 0 a a12 λ − a11 −a12
|[λI − A]| = 0 = − 11 =
0 λ a21 a22 −a21 λ − a22
(λ − a11 )(λ − a22 ) − a12 a21 = λ2 − (a11 + a22 )λ + a11 a22 − a12 a21
Entonces
λ2 − λ · tr(A) + det(A) = 0, (1.42)
1 [ √ ] 1[ √ ]
λ1 = tr(A) + tr(A)2 − 4det(A) , λ2 = tr(A) − tr(A)2 − 4det(A) , (1.43)
2 2
λ1 + λ2 = tr(A), λ1 λ2 = det(A). (1.44)
3. Autovectores
[ ]
a12
v1 ∝ (1.45)
λ1 − a11
[ ]
a12
v2 ∝ (1.46)
λ2 − a11
4. Inversa
[ ]
−1 1 a22 −a12
A = (1.47)
det(A) −a21 a11
Ejemplo 1.1
Realimentación serie–serie con un elemento activo (NFC) [Avendaño, 2007].
El circuito de la Fig. 1.1(a), constituye una red lineal con realimentación a tra-
vés de un circuito activo. Se puede definir la red conformada por Ra , Rb y el
amplificador Ao1, como una fuente de tensión controlada por tensión, es decir,
( )
Rb .
vβ = 1 + vm = µvm (1.48)
Ra
La red equivalente se muestra en la Fig. 1.1(b), donde se indica la relación definida
en la ecuación (1.48). Las resistencias de entrada y salida de Ao1 y Ao2 están
dadas por Ria , Roa , Rib y Rob , respectivamente.
(a) Realimentación de corriente. (b) Circuito equivalente del sistema realimentado.
Figura 1.1.: Realimentación serie–serie.

Nótese que
vε = Ria i1
y además, puesto que la impedancia de entrada de Ao2 es muy elevada,
Rc ||Rib ≈ Rc ,
entonces,
v m ≈ R c iL
También,
Ria ≫ Rob
Escribiendo el modelo en forma de matriz se obtiene:
[ ] [ ][ ]
vi − µvm Ria + Rob 0 i1
=
Ao vε 0 Roa + RL + Rc ||Rib iL
o, sustituyendo y reagrupando términos

[ ] [ ][ ] [ ][ ]
vi Ria µRc i1 z βz i1
≈ = i (1.49)
0 −Ao Ria Roa + RL + Rc iL µz zo iL
La matriz de impedancias Z ∈ R2×2 , está dada por la Ecuación (1.49), es decir,

[ ]
zi βz
Z=
µz zo
Entonces:
det(Z) = zi zo − βz µz
Tr(Z) = zi + zo ≈ Ria
[ √ ]
1[ √ ] R
ia Rc
λ1 = zi + zo + (zi − zo ) + 4βz µz ≈
2 1 + 1 − µAo
2 2 Ria
[ √ ]
1[ √ ] R
ia R c
λ2 = zi + zo − (zi − zo )2 + 4βz µz ≈ 1 − 1 − µAo
2 2 Ria
Ejemplo 1.2
Realimentación Serie–Paralelo [Avendaño, 2007].
El modelo de realimentación serie–paralelo se muestra esquemáticamente en la
Figura 1.2.
Figura 1.2.: Circuito realimentado serie–paralelo.
El amplificador básico y la red de realimentación tienen la misma corriente de

entrada y la misma tensión de salida. Se utilizan los parámetros h para representar
los circuitos con realimentación serie–paralelo.
Por lo tanto, de la Figura 1.2.
[ ] [ ][ ] [ ][ ]
vs zs + h11a + h11f h12a + h12f is zi β is
= = (1.50)
0 h21a + h21f yL + h22a + h22f vo µ yo vo
Es decir,
[ ] [ ]
vs i
=H s
0 vo
donde
[ ]
zi β
H= (1.51)
µ yo
Invirtiendo la expresión (1.50) se llega a:

[ ] [ ][ ] [ yo ]
is 1 yo −β vs |H|
= = vs
|H| −µ zi
µ
vo 0 − |H|
donde
[ ( )]
µ
|H| = yo zi − βµ = yo zi 1+β −
yo zi
o
|H| = yo zi (1 + βAva )
con
µ
Ava = − .
yo z i
De esta expresión se pueden calcular los parámetros de transferencia, v.gr.:
Ganancia de tensión,
vo µ −µ Ava
Av = =− =− =
vs |H| yo zi (1 + βAva ) 1 + βAva
En este problema, puesto que el modelo de la matriz tiene dimensiones hı́bridas,
es posible calcular algunas funciones de la misma, tales como el determinante y
la matriz inversa; sin embargo, la traza no está definida ya que se tendrı́a la suma
de [Ω] + [S] (ver Ecuación (1.51)), lo cual no es posible. Esto se debe tener en
cuenta en los sistemas fı́sicos, pues ocurre con alguna frecuencia.
1.3.5. Lema de inversión de matrices

En matemáticas, particularmente en álgebra lineal, la matriz identidad de Woodbury plan-
teada para buscar matrices n × n está dada por la siguiente fórmula [Householder, 1975]:
(A − BD−1 C)−1 = A−1 + A−1 B(D − CA−1 B)−1 CA−1 (1.52)

En ella A y BD−1 C son matrices de dimensión n×n, mientras que D es una matriz cuadrada
que puede tener una dimensión r × r diferente, en consecuencia B tendrá dimensión n × r y
C dimensión r × n. Los nombres alternativos para esta fórmula son el lema de inversión de
matrices, la fórmula de Sherman-Morrison-Woodbury [Sherman and Morrison, 1950] o sólo
la fórmula de Woodbury [Woodbury, 1950]. Sin embargo, la identidad apareció en varios
artı́culos antes del informe de Woodbury.
Demostración:
Se construye una matriz aumentada A, B, C y D y su correspondiente inversa:
[ ]−1 [ ]
A B E F
= (1.53)
C D G H
Entonces se construyen los productos

[ ][ ] [ ] [ ]
A B E F AE + BG AF + BH I 0
= = (1.54)
C D G H CE + DG CF + DH 0 I
[ ][ ] [ ] [ ]
E F A B EA + FC EB + FD I 0
= = (1.55)
G H C D GA + HC GB + HD 0 I
Las submatrices en (1.54) y (1.55) se abren para formar ocho ecuaciones matriciales:
AE + BG = I (1.56)
AF + BH = 0 (1.57)
CE + DG = 0 (1.58)
CF + DH = I (1.59)
EA + FC = I (1.60)
EB + FD = 0 (1.61)
GA + HC = 0 (1.62)
GB + HD = I (1.63)
De (1.56) y (1.58)
AE = I − BG
DG = −CE
G = −D−1 CE
AE = I + BD−1 CE
AE − BD−1 CE = I
(A − BD−1 C)E = I
E = (A − BD−1 C)−1 (1.64)
De (1.61) y (1.64)
EB + FD = 0
FD = −EB
F = −(A − BD−1 C)−1 BD−1 (1.65)
De (1.58) y (1.64)
DG = −CE
G = −D−1 C(A − BD−1 C)−1 (1.66)
De (1.59) y (1.65)
DH = I − CF = I + C(A − BD−1 C)−1 BD−1

H = D−1 + D−1 C(A − BD−1 C)−1 BD−1 (1.67)
De (1.63) y (1.62)
HD = I − GB
GA = −HC
G = −HCA−1
HD = I + HCA−1 B
H(D − CA−1 B) = I
H = (D − CA−1 B)−1 (1.68)
De (1.62) y (1.68)
G = −(D − CA−1 B)−1 CA−1 (1.69)
De (1.57) y (1.68)
AF = −BH
AF = −B(D − CA−1 B)−1
F = −A−1 B(D − CA−1 B)−1 (1.70)
De (1.60) y (1.70)
EA = I − FC
EA = I + A−1 B(D − CA−1 B)−1 C
E = A−1 + A−1 B(D − CA−1 B)−1 CA−1 (1.71)
La prueba se completa mediante la combinación de, v.gr., (1.64) y (1.71), con la condición
que existan todas las inversas involucradas. En forma general se tiene:
(A ∓ BD−1 C)−1 = A−1 ± A−1 B(D ∓ CA−1 B)−1 CA−1 (1.72)
1.3.6. Valores propios
La matriz cuadrada A tiene autovalores λ y autovectores q si
Aq = λq (1.73)
Por lo tanto
(A − λI)q = 0 (1.74)
Para el análisis de valores propios se procede como sigue para satisfacer esta ecuación o bien
q = 0, lo cual es interesante, o la matriz A − λI debe reducir q al vector nulo (un único
punto). Para que esto suceda A − λI debe ser singular. Por lo tanto,
det(A − λI) = 0 (1.75)
Por lo tanto, el análisis de valores propios procede ası́ (i ) se resuelve la ecuación anterior
para encontrar los autovalores λi y entonces (ii) se sustituyen en la Ecuación (1.73) para
encontrar los autovectores. Por ejemplo, si
[ ]
4 −5
A= (1.76)
2 −3
entonces
det(A − λI) = (4 − λ)(−3 − λ) − (−5)(2) = 0 (1.77)
lo cual se puede reordenar como
λ2 − λ − 2 = 0
(1.78)
(λ + 1)(λ − 2) = 0
Por lo tanto los autovalores son λ = −1 y λ = 2 . Sustituyendo de nuevo en la Ecuación (1.73)

da un autovector q1 el cual es cualquier múltiplo de [1 1]⊤ . Similarmente, el autovector q2
es cualquier múltiplo de [5 2]⊤ .
Ahora se nota que el determinante de la matriz es también igual a el producto de sus
autovalores
∏
det(A) = λi (1.79)
i
Puesto que la traza de una matriz es la suma de sus elementos diagonales

∑
Tr(A) = aii (1.80)
i
entonces también es también igual a la suma de los autovalores

∑
Tr(A) = λi (1.81)
i
El análisis de autovalores se aplica solamente a matrices cuadradas.
1.3.7. Diagonalización
Si se colocan los autovectores en las columnas de una matriz
[ ]
Q = q1 q2 · · · qd (1.82)
entonces, debido a que, Aqk = λk qk , se tiene

[ ]
AQ = λ1 q1 λ2 q2 · · · λd qd (1.83)
Si se colocan los autovalores en la matriz Λ entonces la anterior matriz también puede

escribirse como QΛ. Por lo tanto,
AQ = QΛ (1.84)
Premultiplicando ambos lados por Q−1 se obtiene
Q−1 AQ = Λ (1.85)
esto muestra que cualquier matriz cuadrada se puede convertir en una forma diagonal (siem-
pre que tenga valores propios distintos; ver [Strang, 2006]). A veces no habrá valores propios
d distintos y en ocasiones ellos serán complejos.
1.3.8. Teorema espectral

Para cualquier matriz real simétrica todos los autovalores serán reales y habrá d valores
propios distintos y vectores propios. Los autovectores serán ortogonales (si la matriz es no
simétrica los autovectores no serán ortogonales). Ellos pueden normalizarse y colocarse en
la matriz Q. Puesto que Q es ahora ortogonal se tiene Q−1 = Q⊤ . De este modo
Q⊤ AQ = Λ (1.86)
Premultiplicando por Q y post-multiplicando por Q⊤ se tiene
A = QΛQ⊤ (1.87)
lo cual se conoce como el teorema espectral. Éste dice que cualquier matriz real simétrica
puede representarse como la anterior donde las columnas de Q contienen los autovectores y
Λ es una matriz diagonal que contiene los autovalores, Λi . Equivalentemente
  
λ1 q1
[ 
] λ   
2  q2 
A = q1 q2 · · · qd  .   .  (1.88)
 ..   .. 
λd qd
Ésta también puede escribirse como una sumatoria
∑
d
A= λk qk q⊤
k (1.89)
k=1
1.3.9. El producto de Hadamard

Se define como el producto de dos matrices elemento por elemento. Sean dos matrices, A,
B, de la misma dimensión, m × p. El producto de Hadamard (Matlab: A. ∗ B) está definido
por [Pedersen and Petersen, 2012]
 
a11 b11 a12 b12 · · · a1p b1p
 a22 b22 · · · a2p b2p 
.  a21 b21 
A ◦ B= .. .. .. ..  (1.90)
 . . . . 
am1 bm1 am2 bm2 · · · amp bmp
Para matrices de diferentes dimensiones, m × n y p × q, donde (m ̸= p) ∨ (n ̸= q) el producto

de Hadamard no está definido.
1.3.10. Propiedades básicas del producto de Hadamard

Algunas propiedades correspondientes al producto de Hadamard se describen a continuación
1. Conmutativo
A ◦ B = B ◦ A, (1.91)
2. Lineal
(αA) ◦ B = A ◦ (αB), α una constante (1.92)
3. Asociativo
A ◦ (B ◦ C) = (A ◦ B) ◦ C, (1.93)
4. Distributivo
A ◦ (B + C) = A ◦ B + A ◦ C. (1.94)
5. Rango.
Sean A y B dos matrices cuadradas de tamaño n. Entonces
ρ(A ◦ B) ≤ ρ(A)ρ(B). (1.95)
6. Matrices diagonales.
Supóngase que A, B son matrices m × n y D y E son matrices diagonales de ta-

maño m y n, respectivamente. Entonces,
D(A ◦ B)E = (DAE) ◦ B = (DA) ◦ (BE) = (AE) ◦ (DB) = A ◦ (DBE) (1.96)
Ejemplo 1.3
Verificar las relaciones de los productos mixtos de Hadamard de la Ecuación (1.96),
para los valores de A, B, D, E como se especifican a continuación:
[ ] [ ] [ ] [ ]
1 0 0
1 2 −1 −2 4 1 −2 0
A= , B= , D= , E = 0 −1 0 .
−1 3 −2 1 −3 −1 0 1
0 0 4
Aplicando las relaciones dadas en las ecuaciones (1.96), se obtiene:


D(A ◦ B)E 



(DAE) ◦ B 
 [ ]
4 16 8
(DA) ◦ (BE) =

 −1 9 8
(AE) ◦ (DB) 



A ◦ (DBE)
1.3.11. El producto de Kronecker
Dadas dos matrices, A(m×n) y B(p×q) , el producto de Kronecker, producto directo o pro-
ducto tensorial se define como la matriz A ⊗ B(mp×nq) (Matlab: kron(A, B)) [Pedersen and
Petersen, 2012].
 
a11 B a12 B ··· a1n B
 a21 B a22 B ··· a2n B 
 
A⊗B= . .. .. ..  (1.97)
 .. . . . 
am1 B am2 B · · · amn B
donde aij es el ij-ésimo elemento de A. A continuación se hace un resumen de algunas

propiedades del producto de Kronecker.
1. Conmutatividad.
A ⊗ B ̸= B ⊗ A, en general. (1.98)
2. Asociatividad.
(A ⊗ B) ⊗ C = A ⊗ (B ⊗ C). (1.99)
Ası́, la expresión A ⊗ B ⊗ C no presenta ambigüedad.

3. Dadas las matrices C(n×q) y D(l×s) , entonces
(A ⊗ B)(C ⊗ D) = AC ⊗ BD. (1.100)
4. Transpuesta
(A ⊗ B)⊤ = A⊤ ⊗ B⊤ . (1.101)
5. Distributividad
A ⊗ (B + C) = A ⊗ B + A ⊗ C. (1.102)
6. Rango
ρ(A ⊗ B) = ρ(A)ρ(B). (1.103)
7. Escala
(αA ⊗ βB) = αβ(A ⊗ B). (1.104)
8. Traza
Tr(A ⊗ B) = Tr(A)Tr(B) = Tr(ΛA ⊗ ΛB ). (1.105)
9. Inversa.
Si A y B son de rango completo, entonces
(A ⊗ B)−1 = A−1 ⊗ B−1 . (1.106)
10. Determinante
Si A(m×m) y B(k×k) , entonces
det(A ⊗ B) = (det A)k (det B)m . (1.107)
11. Interacción con la matriz identidad
A ⊗ B = (AIk ) ⊗ (Im B) = (A ⊗ Im )(Ik ⊗ B). (1.108)
12. Ortogonalidad.
Si A y B son ortogonales entonces el producto A ⊗ B también es ortogonal. Es-

to se puede ver con la ayuda de las propiedades anteriores:
(A ⊗ B)⊤ (A ⊗ B) = (A⊤ ⊗ B⊤ )(A ⊗ B) = (A⊤ A) ⊗ (B⊤ B) = Im ⊗ Ik = Imk . (1.109)
Esta propiedad también es válida para matrices unitarias.
Nótese que el producto de Kronecker está definido independientemente del orden de las ma-
trices involucradas, por lo que es un concepto más general que la multiplicación de matrices.
A continuación se hará la demostración de algunas de las propiedades relacionadas anterior-
mente. Dichas demostraciones tienen el carácter de teoremas y en esa forma se plantean.
Teorema 1.1
Sea A ∈ Rm×n y B ∈ Rp×q , entonces
(A ⊗ B)−1 = A−1 ⊗ B−1 .
Demostración: De la Ecuación (1.100):
(A ⊗ B)(C ⊗ D) = AC ⊗ BD.
Sustituyendo, se obtiene sucesivamente:
(A ⊗ B)(A ⊗ B)−1 = (A ⊗ B)(A−1 ⊗ B−1 )
= AA−1 ⊗ BB−1
= Im ⊗ In = Imn
El siguiente teorema hace referencia a la relación entre el producto de Kronecker de dos

matrices y las matrices unitarias asociadas.
Teorema 1.2
Sea A ∈ Rm×n y B ∈ Rp×q , entonces
A ⊗ B = (A ⊗ Ip )(In ⊗ B) = (Im ⊗ B)(A ⊗ Iq ). (1.110)
Demostración: De acuerdo a la definición del producto de Kronecker y a la
multiplicación de matrices, se tiene
 
a11 B a12 B · · · a1n B
 a21 B a22 B · · · a2n B 
A ⊗ B =  ... .. ..  =
. 
..
. .
  
a11 Ip a12 Ip · · · a1n Ip B 0 · · · 0
 a21 Ip a22 Ip · · · a2n Ip  0 B · · · 0 
= ... .. ..  . . . .
.  .. .. . . .. 
..
. .
am1 Ip am2 Ip · · · amn Ip 0 0 · · · B
= (A ⊗ Ip )(In ⊗ B),
 
a11 B a12 B · · · a1n B
 a21 B a22 B · · · a2n B 
A ⊗ B =
 ... .. ..  =
. 
..
. .
  
B 0 · · · 0 a11 Iq a12 Iq · · · a1n Iq
0 B · · · 0  a21 Iq a22 Iq · · · a2n Iq 
=
 ... ... .  . .. .. 
. ..  .. . 
.. ..
. .
0 0 · · · B am1 Iq am2 Iq · · · amn Iq
A ⊗ B = (Im ⊗ B)(A ⊗ Iq ).
Corolario 1.1
Sea A ∈ Rm×m y B ∈ Rn×n , entonces
A ⊗ B = (A ⊗ In )(Im ⊗ B) = (Im ⊗ B)(A ⊗ In ). (1.111)
Esto significa que Im ⊗ B y A ⊗ In son conmutativos para matrices cuadradas
tales como A y B.
A partir del Teorema 1.2, se puede demostrar el siguiente teorema de productos mixtos.
Teorema 1.3
Sea A ∈ Rm×n , B ∈ Rq×r , C ∈ Rn×p y D ∈ Rr×s , entonces
(A ⊗ B)(C ⊗ D) = (AC) ⊗ (BD). (1.112)
Demostración: De acuerdo al Teorema 1.2, se tiene
(A ⊗ B)(C ⊗ D)
= (A ⊗ Iq )(In ⊗ B)(C ⊗ Ir )(Ip ⊗ D)
= (A ⊗ Iq )[(In ⊗ B)(C ⊗ Ir )](Ip ⊗ D)
= (A ⊗ Iq )(C ⊗ B)(Ip ⊗ D)
= (A ⊗ Iq )[(C ⊗ Iq )(Ip ⊗ B)](Ip ⊗ D)
= [(A ⊗ Iq )(C ⊗ Iq )] [(Ip ⊗ B)(Ip ⊗ D)]
= [(AC ⊗ Iq )] [(Ip ⊗ BD)]
= (AC) ⊗ (BD).
Ejemplo 1.4
Sean las matrices
[ ] [ ] [ ] [ ]
1 2
1 2 3 2 3 1 0 1 0
A= , B= , C = −1 1 , D=
4 5 6 1 2 1 1 −1 2
−2 1
donde m = 2, n = 3, k = 2, l = 2, q = 2, s = 4. Verificar las relaciones de la
Ecuación (1.108).
Solución:
La relación directa está dada por
 
1 0 1 0 2 0 2 0 3 0 3 0
1 1 −1 2 2 2 −2 4 3 3 −3 6 
A⊗D=
4 0 4 0 5 0 5 0 6 0 6 0
4 4 −4 8 5 5 −5 10 6 6 −6 12
La matriz I2 es la matriz identidad (2 × 2) e I3 , la matriz identidad (3 × 3),

entonces
 
[ ] [ ] 1 0 2 0 3 0
1 2 3 1 0 1 0 0 1 0 2 0 3 
A⊗I2 = 
4 0 5 0 6 0
AI3 = , I2 D = ,
4 5 6 1 1 −1 2
0 4 0 5 0 6
 
1 0 1 0 0 0 0 0 0 0 0 0
 1 1 −1 2 0 0 0 0 0 0 0 0 
 
 0 0 0 0 1 0 1 0 0 0 0 0 
I3 ⊗ D =  
 0 0 0 0 1 1 −1 2 0 0 0 0 
 0 0 0 0 0 0 0 0 1 0 1 0 
0 0 0 0 0 0 0 0 1 1 −1 2
Obsérvese que la matriz A ⊗ I2 es diagonal por bloques mientras que la ma-

triz I3 ⊗ D es dispersa. El resultado de las otras dos operaciones se muestra a
continuación, comprobándose la igualdad con la primera operación realizada:
 
1 0 1 0 2 0 2 0 3 0 3 0
1 1 −1 2 2 2 −2 4 3 3 −3 6 
(AI3 ) ⊗ (I2 D) = 
4 0 4 0 5 0 5 0 6 0 6 0
4 4 −4 8 5 5 −5 10 6 6 −6 12
= (A ⊗ I2 )(I3 ⊗ D)
1.3.12. El operador vec

El operador vec crea un vector columna a partir de una matriz Am×n , apilando los vectores
.
columna de A = [A.1 A.2 · · · A.n ] uno debajo del otro (donde A.k = A(:, k), según la
notación de Matlab) [Pedersen and Petersen, 2012]; v.gr.: sea la matriz 2 × 2
 
[ ] a11
a11 a12 a21 
A= =⇒ vec(A) =  
a12 
a21 a22
a22
A continuación se hace un resumen de algunas propiedades de la función vec.
1. Producto
vec(AXB) = (B⊤ ⊗ A)vec(X) (1.113)
2. Traza
Tr(A⊤ B) = vec(A)⊤ vec(B) (1.114)
3. Suma
vec(A + B) = vec(A) + vec(B) (1.115)

4. Escala
vec(αA) = α vec(A) (1.116)
5. Producto matriz–vector
a⊤ XBX⊤ c = vec(X)⊤ (B⊤ ⊗ ca⊤ )vec(X) (1.117)
A continuación se demostrará la relación que existe entre matrices y el operador vec denomi-
nada vectorización, la cual permite la transformación de un producto matricial en un vector.
Este resultado será utilizados más adelante en el cálculo de las ecuaciones de Sylvester y
Lyapunov.
Teorema 1.4
Sean las matrices A ∈ Rm×n , B ∈ Rp×q y X ∈ Rn×p . Demostrar que se cumple
la relación (Ecuación (1.113)):
vec(AXB) = (B⊤ ⊗ A)vec(X)

Demostración:
Se pueden reescribir las matrices B y X usando vectores columna como
B = [b.1 b.2 · · · b.q ]p×q y X = [x.1 x.2 · · · x.p ]n×p
donde el vector (.k ), corresponde a la k–ésima columna de la matriz. Por lo tanto,
el producto (AXB), se puede escribir como
 
x.1
∑p
x.2 
(AXB).k = A x.i bik = [b1k A b2k A · · · bpk A]  
 ...  =
i=1
x.p
= ([b1k b2k · · · bpk ] ⊗ A) vec(X).
Entonces,
( )
(AXB).k = b⊤
.k ⊗ A vec(X)
Apilando todos los vectores, se obtiene:

   ⊤ 
(AXB).1 b.1 ⊗ A
(AXB).2   ⊤
b.2 ⊗ A

vec(AXB) =   ..  =  .  vec(X),
.   .. 
(AXB).q b⊤
.q ⊗ A
es decir,
vec(AXB)mq×1 = (B⊤ ⊗A)vec(X)

Corolario 1.2
vec(AB) = (Ip ⊗ A)vec(B) = (B⊤ ⊗ Im )vec(A).
Ejemplo 1.5
Verificar la relación (1.113) a partir de las siguientes matrices:
[ ] [ ] [ ]
1 2
1 2 3 2 3 4 1
A= , B= , X= 1 1 .
4 3 1 1 3 2 1
2×3 2×4 −1 1 3×2
Solución:
 
1
2
 
[ ] 12
1 12 2 4 6
vec(AXB) = vec =
2

2 6 4 2  
4
4
2
   
2 4 6 1 2 3   1
−2 6 2 −1 3 1 1 2
3 3 6 9 1  12
 6 9    
 
−3 9 3 −3 9 3 −1  6
(B⊤ ⊗ A)vec(X) = 
4  2  2
= 
 8 12 2 4 6    

−4 12 4 −2 6 2 1   4 
1 2 3 1 2 3  1  4
−1 3 1 −1 3 1 2
Con lo cual queda demostrada la relación pedida.
Ejemplo 1.6
A continuación se definen algunas cantidades vectoriales y matriciales. Verificar
la Ecuación (1.117).
[ ] [ ] [ ] [ ]
1 −2 1 −2
2 3
a= 2 , c= 1 , B= , X = −1 3
1 −4
3 5 2 −1
[ ][ ] [ ] [−2]
1 −2
2 3 1 −1 2
a⊤ XBX⊤ c = [1 2 3] −1 3 1 = 99
1 −4 −2 3 −1
2 −1 5
vec(X)⊤ (B⊤ ⊗ ca⊤ )vec(X) =

  
−4 −8 −12 −2 −4 −6 1
2 4 6 1 2 3 −1
  
 10 20 30 5 10 15  2 
= [1 −1 2 −2 3 −1]
−6 −12 −18 8 16 24   = 99
−2
3 6 9 −4 −8 −12 3 
15 30 45 −20 −40 −60 −1
Nota sobre la función vec y Matlab. Matlab no tiene la función vec, pero posee
una función llamada reshape, la cual puede usarse para este propósito. Especı́ficamente, si
A ∈ Rm×n , entonces se puede obtener el vector a con el siguiente enunciado de Matlab:
a = reshape(A, m*n, 1);
Existe una forma más corta para realizar la misma tarea, esto es,
a = A(:);
la cual es similar a la expresión anterior. Para reconstruir la forma de matriz, es decir, de
a → A, se puede usar de nuevo la función reshape:
A = reshape(a, p, q); donde pq = mn, es decir, mn|p y mn|q (Resto = 0).
Ejemplo 1.7
Sea A ∈ R3×2 , dada por:
 
1
[ ] 3
1 2  
1
A = 3 −1 ⇒ [m, n] = size(A) = [3, 2]; a = reshape(A, m ∗ n, 1) =  
2
1 4 −1
4
Se puede reconstruir, v.gr., la matriz A1 ∈ R2×3 :

[ ]
1 1 −1
A1 = reshape(a, n, m) ⇒ A1 = .
3 2 4
1.3.13. Suma de Kronecker

Dada una matriz A ∈ Rm×m y una matriz B ∈ Rn×n , la suma de Kronecker denotada por
A ⊕ B se define como la expresión
A ⊕ B = A ⊗ In + Im ⊗ B. (1.118)
Para el caso de N matrices, Ai , i = 1, · · · , N (no necesariamente de la misma dimensión),

la suma de Kronecker o suma directa está dada como la matriz diagonal por bloques:
 
A1
 A2 
 
A1 ⊕ A2 ⊕ · · · ⊕ AN =  . . (1.119)
 .. 
AN
La matriz en la Ecuación (1.119), se puede expresar en notación compacta como
⊕
N
Ai = A1 ⊕ A2 ⊕ · · · ⊕ AN . (1.120)
i=0
Propiedades de la suma de Kronecker de matrices:

1. Suma mixta
(A ⊕ B)(C ⊕ D) = (AC) ⊕ (BD) (1.121)
2. Rango
( )
⊕
N ∑
N
ρ Ai = ρ(Ai ). (1.122)
i=0 i=0
3. Determinante
Si cada Ai es una matriz cuadrada, entonces
( N )
⊕ ∏N
det Ai = det(Ai ). (1.123)
i=0 i=0
4. Ortogonalidad
Si A1 y A2 son ortogonales, entonces A1 ⊕ A2 es ortogonal.
5. Exponencial
exp(A ⊕ B) = exp(A ⊗ In ) exp (Im ⊗ B) (aun si A y B no conmutan). (1.124)
6. Exponencial de suma y producto

exp(A ⊕ B) = exp A ⊗ exp B. (1.125)
En expresiones que contienen tanto productos como sumas de Kronecker, la operación de

producto de Kronecker tiene precedencia.
Ejemplo 1.8
Verificar las ecuaciones (1.124) y (1.125) dadas las matrices
[ ] [ ]
2 1 −1
1 2
A= B = 1 −1 0
3 −1
1 2 1
Se puede observar que los miembros de la derecha de las ecuaciones (1.124) y

(1.125), constituyen también una igualdad, por lo tanto, los resultados deben ser
idénticos. Se realizan tres operaciones para las expresiones mencionadas teniendo
en cuenta que la suma de Kronecker no está definida directamente en Matlab.
Notando que las ecuaciones (1.118) y (1.124) tienen como factores la matriz iden-
tidad, entonces se define para cada caso, la matriz correspondiente, es decir,
[ ] [ ]
1 0 0
1 0
I2 = eye(2) = I3 = eye(3) = 0 1 0 ,
0 1
0 0 1
se aplica dicha ecuación:
sumK=kron(A,I3)+ kron(I2,B);
expo_1=expm(sumK);
con el resultado,
 
52.3148 −1.8745 −40.7088 28.4898 −1.0208 −22.1694
19.4172 4.7092 −10.6458 10.5743 2.5645 −5.7976 
 
62.0005 28.1885 0.9602 33.7645 15.3510 0.5229 
expo_1 =  
42.7348 −1.5312 −33.2541 23.8250 −0.8537 −18.5394
15.8614 3.8468 −8.6963 8.8429 2.1446 −4.8483 
50.6467 23.0265 0.7844 28.2360 12.8375 0.4373
Por otro lado, operando sobre el miembro de la derecha de la Ecuación (1.124)

se obtiene:
expo_2 = expm(kron(A,I3))*expm(kron(I2,B));
o sea,
 
52.3148 −1.8745 −40.7088 28.4898 −1.0208 −22.1694
19.4172 4.7092 −10.6458 10.5743 2.5645 −5.7976 
 
62.0005 28.1885 0.9602 33.7645 15.3510 0.5229 
expo_2 = 
42.7348 −1.5312 −33.2541 23.8250 −0.8537 −18.5394
15.8614 3.8468 −8.6963 8.8429 2.1446 −4.8483 
50.6467 23.0265 0.7844 28.2360 12.8375 0.4373
La tercera expresión está dada por (1.125).

expo_3=kron(expm(A),expm(B));
con el resultado
 
52.3148 −1.8745 −40.7088 28.4898 −1.0208 −22.1694
19.4172 4.7092 −10.6458 10.5743 2.5645 −5.7976 
 
62.0005 28.1885 0.9602 33.7645 15.3510 0.5229 
expo_3 = 
42.7348 −1.5312 −33.2541 23.8250 −0.8537 −18.5394
15.8614 3.8468 −8.6963 8.8429 2.1446 −4.8483 
50.6467 23.0265 0.7844 28.2360 12.8375 0.4373
Los tres resultados son idénticos como era de esperarse. Recuérdese que en Matlab
la exponencial de una matriz se define como expm(A).
1.3.14. Funciones de Lyapunov

Sea la ecuación de estados definida en la forma estándar como
ẋ(t) = Ax(t) + Bu(t) (1.126)
donde A ∈ Rm×m , es la matriz de transición, x es el vector de estados y u es el vector

de control. Por otra parte, una función de Lyapunov V : Rm 7→ R es una función de tipo
energı́a que se puede utilizar para determinar la estabilidad de un sistema. En términos
generales, si se puede encontrar una función no negativa que disminuya siempre a lo largo
de la trayectoria del sistema, se puede concluir que el mı́nimo de la función es un punto
de equilibrio estable (a nivel local). Para describir de manera más formal, se empieza con
algunas definiciones. Se dice que una función continua V es definida positiva si V (x) > 0
para todo x ̸= 0 y V (0) = 0. Se dice que una función V es semidefinida positiva si V (x) > 0
para todo x pero V (x) puede ser cero en puntos diferentes de x = 0. Similarmente, una
función es definida negativa si V (x) < 0 para todo x ̸= 0 y V (0) = 0.
Teorema 1.5
Teorema de estabilidad de Lyapunov.
Sea V una función no negativa sobre Rm y sea V̇ la derivada en el tiempo de V
a lo largo de las trayectorias de la dinámica del sistema (1.126):
dV dV dx dV
V̇ = = = ẋ (1.127)
dt dx dt dx
Sea Br = Br (0) una bola de radio r alrededor del origen. Si ∃ r > 0 tal que V sea
definida positiva y V̇ sea semidefinida negativa para todo x ∈ Br , entonces x = 0
es localmente estable en el sentido de Lyapunov. Si V es definida positiva y V̇ es
definida negativa en Br , entonces x = 0 es localmente asintóticamente estable.
Si V satisface una de las condiciones anteriores, se dice que V es una función (local) de
Lyapunov para el sistema. Siempre es posible encontrar una función de Lyapunov para un
sistema lineal de la forma descrita por (1.126), sin perturbación externa, esto es, con u = 0.
En este caso, se puede escoger una función candidata de Lyapunov de la forma cuadrática:
V = x⊤ Px (1.128)
donde P es una matriz simétrica definida positiva. Entonces, se tiene
V̇ = ẋ⊤ Px + x⊤ Pẋ
= (Ax)⊤ Px + x⊤ P(Ax)
= x⊤ A⊤ Px + x⊤ PAx
= x⊤ (A⊤ P + PA)x
= −x⊤ Qx (1.129)
El sistema matricial de ecuaciones (1.129), tiene la forma general de un sistema del tipo
AX + XB = C. Este sistema general debe ser adecuado para el sistema particular de Lya-
punov, haciendo B = A⊤ y C = −Q. Si la matriz Q es definida positiva, entonces el sistema
es asintóticamente estable.
A continuación, se abordará la solución del sistema matricial planteado por la aplicación
del método de Lyapunov, dado por
A⊤ P + PA = −Q. (1.130)
Sea la ecuación matricial
AX + XB = C, (1.131)
conocida como ecuación de Sylvester, donde X ∈ Rm×n , C ∈ Rm×n , A ∈ Rm×m y B ∈

Rn×n . Se ha desarrollado la solución partiendo de la conformación del producto de Kronecker
y luego una transformación vectorial.
Aplicando el Teorema 1.4 y su Corolario a los términos de la Ecuación (1.131), se obtiene:
vec(AX) = (In ⊗ A)vec(X), (1.132)

⊤
vec(XB) = vec(Im XB) = (B ⊗ Im )vec(X). (1.133)
De acuerdo a lo anterior, se puede vectorizar la ecuación(1.131) obteniéndose:
(In ⊗ A)vec(X) + (B⊤ ⊗ Im )vec(X) = vec(C),

(In ⊗ A + B⊤ ⊗ Im )vec(X) = vec(C).
Despejando vec(X):
vec(X) = (In ⊗ A + B⊤ ⊗ Im )−1 vec(C); ⇒ vec(X) → X ∈ Rm×n . (1.134)
La solución existe si (In ⊗ A + B⊤ ⊗ Im ) es no singular. La ecuación de Sylvester se puede

presentar en la forma de triple producto matricial. Esta forma generalizada de la ecuación
de Sylvester se muestra a continuación con su correspondiente solución:
AXD + EXB = C (1.135)

⊤ ⊤ −1
vec(X) = (D ⊗ A + B ⊗ E) vec(C); ⇒ vec(X) → X ∈ R m×n
. (1.136)
como en el caso anterior, la solución existe si (D⊤ ⊗ A + B⊤ ⊗ E) es no singular.

Hay otra forma de representación de la ecuación de Sylvester conocida como ecuación
de Lyapunov la cual es una forma particular de la misma. Ésta se muestra a continuación,
también con la solución correspondiente:
AX + XA = C (1.137)
⊤ −1
vec(X) = (I ⊗ A + A ⊗ I) vec(C); ⇒ vec(X) → X ∈ R m×n
. (1.138)
En el siguiente script realizado en Matlab se muestra un ejemplo de la solución de la

ecuación de Sylvester y sus variantes planteadas en el procedimiento anterior. En él se
presentan los tres casos descritos.
Ejemplo 1.9
Cálculo de AX + XB = C y sus variantes.
% % Cálculo de la ecuación AX + XB = C, utilizando el producto de Kronecker.
A=[1 3;2 4];
B=[2 0 1;-1 4 7;2 6 5];
C=[1 4 2;5 -2 1]; C1=[1 4;5 -2];
D=[2 1 3;0 4 6;1 0 -2];
E=[5 1;-3 2];
I2=eye(2);
I3=eye(3);
% Sylvester
1.4. Número de condición 33
% AX + XB = C
x1=(kron(I3,A)+kron(B’,I2))\C(:);
X1=vec2mat(x1,2)’;
% Generalized Sylvester
% AXD + EXB = C
x2=(kron(D’,A)+kron(B’,E))\C(:);
% Lyapunov
% AX + XA = C1
x3=(kron(I2,A)+kron(A’,I2))\C1(:);
Resultados:
 
−1.6766
 1.4203 [ ]
 
−0.1206 −1.6766 −0.1206 0.8241
x1 =   =⇒ X1 =
−0.1139 1.4203 −0.1139 −0.1413
 0.8241
−0.1413
 
−0.3531
 0.3959 [ ]
 
−0.0460 −0.3531 −0.0460 0.1516
x2 =   =⇒ X2 =
−0.0283 0.3959 −0.0283 0.0288
 0.1516
0.0288
 
4.50 [ ]
−1.10 4.50 −2.35
x3 = 
−2.35
=⇒ X3 =
−1.10 0.75
0.75
1.4. Número de condición

En esta sección se estudia el problema de la llamada sensibilidad de un sistema lineal al
proceso computacional referido como número de condición, en el cual se plantea lo bien
o mal condicionado que esté dicho sistema. Este problema ha sido estudiado por muchos
investigadores tales como Turing, Von Neumann y Goldstine.
Sea A ∈ Rn×n , una matriz invertible con coeficientes reales y b ∈ Rn . Se desea resolver
el sistema Ax = b, y se quiere estudiar como se afecta la solución si se perturban los datos
ingresados (entrada) A y b. Será conveniente conocer de antemano cuán distante es la
solución del sistema perturbado x̂ de la solución del sistema x. O sea, saber de antemano
cual es la sensibilidad de la solución a las perturbaciones en los datos de entrada. Para tales
fines existe una cantidad que da una medida de esa sensibilidad. Dicha cantidad se denomina
número de condición [Householder, 1975]. El número de condición se define por
κ(A) = ||A|| · ||A−1 || (1.139)
donde ||A|| corresponde a la norma euclidiana, es decir,
||Ax||
||A|| = sup = sup ||Ax|| (1.140)
x∈Rn ||x|| ||x||=1
Se hará el análisis por partes, primero suponiendo que existe un error de redondeo en b y
que A es exacta, luego recı́procamente, para finalmente hacer el caso conjunto.
Sea la ecuación lineal dada por
Ax = b (1.141)
1. b está perturbado pero A no tiene error
A(x + ∆x) = b + ∆b
Ax + A∆x = b + ∆b
A∆x = ∆b
∆x = A−1 ∆b
||∆x|| = ||A−1 · ∆b|| ≤ ||A−1 || · ||∆b||
Pero por otra parte, Ax = b, entonces
||A|| · ||x|| ≥ ||b||

||x|| ≥ ||A||−1 · ||b||
y
1 1
≤ ||A|| ·
||x|| ||b||
Por lo cual el error relativo será

||∆x|| ||∆b|| ||∆b||
≤ ||A|| · ||A−1 || · = κ(A)
||x|| ||b|| ||b||
Donde κ(A) = ||A|| · ||A−1 ||, es el número de condición, como se habı́a definido antes.
1.4. Número de condición 35
O sea
||∆x|| ||∆b||
≤ κ(A) (1.142)
||x|| ||b||
2. Se perturba A pero b no tiene error
(A + ∆A)(x + ∆x) = b
∆A · (x + ∆x) + A · ∆x = 0
∆A · x + (A + ∆A)∆x = 0
∆x = −(A + ∆A)−1 · ∆A · x (1.143)
El término entre paréntesis se puede escribir
(A + ∆A) = A(I + A−1 ∆A)
Entonces
(A + ∆A)−1 = (I + A−1 ∆A)−1 A−1
Por lo que la norma será:
||A−1 ||
||(A + ∆A)−1 || ≤ (1.144)
1 − ||A−1 || · ||∆A||
Para la Ecuación (1.143) se tiene la norma:
||∆x|| ≤ ||(A + ∆A)−1 ∆A|| · ||x|| (1.145)
Es decir,
||∆x||
≤ ||(A + ∆A)−1 ∆A||
||x||
≤ ||(A + ∆A)−1 || · ||∆A|| (1.146)
Reemplazando (1.144) en (1.146) se obtiene
||∆x|| ||A−1 || · ||∆A||

≤
||x|| 1 − ||A−1 || · ||∆A||
Premultiplicando arriba y abajo por la norma de A, ||A||, se tiene:
||∆x|| ||A|| · ||A−1 || · ||∆A||

≤
||x|| ||A|| − ||∆A||
o sea,
||∆A||
κ(A) ·
||∆x|| ||A||
= (1.147)
||x|| ||∆A||
1 − κ(A) ·
||A||
3. Error en todas las mediciones
(A + ∆A)(x + ∆x) = b + ∆b
(A + ∆A)∆x = ∆b − ∆A · x
Si ||A−1 ∆A|| < 1, entonces A + ∆A es invertible y se cumple la Ecuación (1.144),

por lo tanto
∆x = (A + ∆A)−1 (∆b − ∆A · x)
||∆x|| ≤ ||(A + ∆A)−1 || · ||(∆b − ∆A · x)||

≤ ||(A + ∆A)−1 || · (||∆b|| + ||∆A · x||)
≤ ||(A + ∆A)−1 || · (||∆b|| + ||∆A|| · ||x||)
( )
||∆x|| ||∆b||
≤ ||(A + ∆A)−1 || · + ||∆A||
||x|| ||x||
Pero ||b|| ≤ ||A|| · ||x)||, entonces
( )
||∆x|| ||∆b||
≤ ||(A + ∆A)−1 || · + ||∆A||
||x|| ||A−1 || · ||b||
Reemplazando la (1.144) en la expresión anterior, se obtiene

( )
||∆x|| ||A−1 || ||∆b||
≤ · + ||∆A||
||x|| 1 − ||A−1 || · ||∆A|| ||A−1 || · ||b||
( )
||∆x|| ||A−1 || · ||A|| ||∆b|| ||∆A||
≤ · +
||x|| 1 − ||A−1 || · ||∆A|| ||b|| ||A||
Por lo tanto,
( )
||∆x|| κ(A) ||∆b|| ||∆A||
≤ · + (1.148)
||x|| ||∆A|| ||b|| ||A||
1 − κ(A) ·
||A||
Ejemplo 1.10
Sea el siguiente sistema de la forma Ax = b, donde
     
10 7 8 7 32 0.1
7 5 6 5 23 −0.1
A=
6 10 9 
b =   , con ∆b = 
0.1
, .
8 33
7 5 9 10 31 −0.1
1.5. Cálculo vectorial y matricial 37
La solución exacta del sistema es

    
25 −41 10 −6 32 1
 −41 68 −17 10  23  1
x = A−1 b = 
−3 33 1
= ,
10 −17 5
−6 10 −3 2 31 1
mientras que la del sistema alterado A(x + ∆x) = b + ∆b es

      
25 −41 10 −6 32.1 9.2 8.2
−41 68 −17 10  22.9 −12.6 −13.6
x + ∆x =  ⇒ ∆x = 
−3 33.1  4.5  3.5 
=
10 −17 5
−6 10 −3 2 30.9 −1.1 −2.1
De los anteriores resultados se tiene las siguientes relaciones:
||∆x||
||∆x|| = 16.3970; ||x|| = 2.0000; =⇒ = 8.1985
||x||
||∆b||
||∆b|| = 0.2000; ||b|| = 60.0250; =⇒ = 0.0033
||b||
κ(A) = 2984.1
1.5. Cálculo vectorial y matricial

En el primer curso de cálculo, se aprenden las matemáticas de las derivadas e integrales
y cómo aplicar estos conceptos a escalares. También se pueden aplicar las herramientas
de cálculo a vectores y matrices. Algunos aspectos del cálculo de matrices son idénticos al
cálculo escalar, pero algunos conceptos de cálculo con escalares tienen que ampliarse a fin
de obtener fórmulas de cálculo matricial. Como la intuición llevarı́a a creer, la derivada de
una matriz es simplemente igual a la matriz de las derivadas temporales de los elementos
individuales de la matriz. También, la integral de una matriz es igual a la matriz de las
integrales de los elementos individuales de la matriz. En esta sección se aplicarán algunos
conceptos básicos y otros nuevos al cálculo de estructuras vectoriales y matriciales. En otras
palabras, suponiendo que A ∈ Rm×n , se tiene derivada total contra el tiempo de la matriz:
 
ȧ11 (t) · · · ȧ1n (t)
 .. 
Ȧ(t) =  ... ..
. .  (1.149)
ȧm1 (t) · · · ȧmn (t)
De la misma manera se puede realizar el proceso inverso, es decir, la integral en el tiempo:

∫ ∫ 
∫ a11 (t)dt · · · a1n (t)dt
 .. .. .. 
A(t)dt =  . . ∫ .  (1.150)
∫
am1 (t)dt · · · amn (t)dt
Supóngase que la matriz A tiene elementos que son funciones del tiempo. Se sabe que
AA−1 = I; esto es, AA−1 es una matriz constante y por lo tanto tiene derivada en el
tiempo igual a cero, entonces la derivada en el tiempo de AA−1 se puede calcular como
d d
(AA−1 ) = ȦA−1 + A (A−1 ) (1.151)
dt dt
d(A−1 )
Puesto que esto es cero, puede resolverse para dt como
d
(A−1 ) = −A−1 ȦA−1 (1.152)
dt
Nótese que para el caso especial de una función escalar A(t), esto se reduce a la ecuación
familiar
( )
d 1 ∂(1/A(t)) dA(t)
=
dt A(t) ∂A(t) dt
Ȧ(t)
=− (1.153)
A2 (t)
1.5.1. Derivada parcial

Supóngase que x ∈ Rn es un vector y f (x) es una función escalar de los elementos de x,
entonces
[ ]
∂f (x) ∂f (x) ∂f (x)
= ···
∂x ∂x1 ∂xn
A pesar de que x es un vector columna, ∂f∂x (x)

es un vector fila. Lo contrario también es
cierto, es decir, si x es un vector fila, entonces ∂f∂x
(x)
es un vector columna. Ahora supóngase
que A ∈ Rm×n es una matriz y f (A) es un escalar. Entonces, la derivada parcial de un
escalar con respecto a una matriz puede ser calculada de la siguiente manera:
 
∂f (A) ∂f (A)
···
∂f (A)   ∂a11 ∂a1n 
= 
∂A  ∂f (A) ∂f (A) 
···
∂am1 ∂amn
1.5. Cálculo vectorial y matricial 39
Con estas definiciones se puede calcular la derivada parcial del producto escalar de dos
vectores. Sean x e y vectores columna {x, y ∈ Rn }. Entonces
x⊤ y = x1 y1 + · · · + xn yn (1.154)
y las derivadas correspondientes serán:

[ ]
∂(x⊤ y) ∂(x⊤ y) ∂(x⊤ y) [ ]
= ··· = y1 · · · yn = y⊤ (1.155)
∂x ∂x1 ∂xn
[ ]
∂(x⊤ y) ⊤
∂(x y) ∂(x⊤ y) [ ]
= ··· = x1 · · · xn = x⊤ (1.156)
∂y ∂y1 ∂yn
Ahora se calculará la derivada parcial de una función cuadrática con respecto a un vector.
Primero escribe la ecuación cuadrática de la siguiente manera:
    
a11 · · · a1n x1 x1
⊤
[ ] . . .  .  [∑ ∑ ] . 
x Ax = x1 · · · xn  .. .. ..  ..  = i xi ai1 · · · i xi ain  . 
.
an1 · · · ann xn xn
∑
= xi xj aij (1.157)
i,j
Ahora se toma la derivada parcial de la ecuación cuadrática como sigue:

[ ]
∂(x⊤ Ax) ∂(x⊤ Ax) ∂(x⊤ Ax)
= ···
∂x ∂x1 ∂xn
[∑ ∑ ∑ ∑ ]
= j xj a1j + i xi ai1 · · · j xj anj + i xi ain
[∑ ∑ ] [∑ ∑ ]
= j xj a1j · · · j xj anj + i xi ai1 · · · i xi ain
= x⊤ A⊤ + x⊤ A (1.158)
Si A es simétrica, como a menudo se encuentra en las expresiones cuadráticas, entonces

A = A⊤ y la expresión anterior se simplifica a
∂(x⊤ Ax)
= 2x⊤ A (1.159)
∂x
A continuación se define la derivada parcial de un vector con respecto a otro vector.

Supóngase que
   
f1 (x) x1
 ..   .. 
f (x) =  .  y x =  . .
fm (x) xn
Entonces
 
∂f1 (x) ∂f1 (x)
···
 ∂x1 ∂xn 
∂f (x)  
=

..
.
..
.
..
.

 (1.160)
∂x  ∂f (x)
m ∂f (x) 
m
···
∂x1 ∂xn
Bien sea que f (x) o x sea transpuesta, entonces la derivada parcial también es transpuesta.
( )⊤
∂f ⊤ (x) ∂f (x)
=
∂(x) ∂(x)
( )⊤
∂f (x) ∂f (x) (1.161)
=
∂(x)⊤ ∂(x)
∂f ⊤ (x) ∂f (x)
=
∂(x)⊤ ∂(x)
Con estas relaciones, se pueden derivar las siguientes igualdades. Supóngase que A ∈ Rm×n
y x ∈ Rn×1 . Entonces
∂(Ax)
=A
∂x (1.162)
∂(x⊤ A⊤ )
= A⊤
∂x
Ahora supóngase que A ∈ Rm×n , B ∈ Rn×n y se desea calcular la derivada parcial

Tr(ABA⊤ ) con respecto a A. Primero se calcula ABA⊤ como sigue:
   
a11 · · · a1n b11 · · · b1n a11 · · · am1
⊤  .. . .  
..   ... .. ..   .. .. .. 
ABA =  . .. . .  . . . 
am1 · · · amn bn1 · · · bnn a1n ··· amn
∑ ∑ 
a1k bkj a1j · · · a1k bkj amj
 j,k j,k 
 .. .. .. 
= . . .  (1.163)
∑ ∑ 
amk bkj a1j · · · amk bkj amj
j,k j,k
De esto se puede observar que la traza de (ABA⊤ ) está dada como

∑
Tr(ABA⊤ ) = aik bkj aij (1.164)
i,j,k
1.6. Resumen 41
Su derivada parcial con respecto a A se puede calcular como

 
∂Tr(ABA⊤ ) ∂Tr(ABA⊤ )
 ··· 
∂Tr(ABA⊤ )  
∂a11 ∂a1n
 . 
= .. 
∂A  
 ∂Tr(ABA⊤ ) ∂Tr(ABA ) ⊤ 
···
∂am1 ∂amn
∑ ∑ ∑ ∑ 
j a1j b1j + k a1k bk1 ··· j a1j bnj + k a1k bkn
 .. 
= . 
∑ ∑ ∑ ∑
j amj b1j + k amk bkj ··· j amj bnj + k amk bkn
∑ ∑  ∑ ∑ 
j a1j b1j ··· j a1j bnj k a1k bk1 ··· k a1k bkn
 ..   .. 
= . + . 
∑ ∑ ∑ ∑
j amj b1j ··· j amj bnj k amk bk1 ··· k amk bkn
Por lo tanto
∂Tr(ABA⊤ )
= AB⊤ + AB (1.165)
∂A
Si B es simétrica entonces
∂Tr(ABA⊤ )
= 2AB si se cumple que B = B⊤ (1.166)
∂A
1.6. Resumen
En este capı́tulo se ha hecho una revisión de aspectos básicos de álgebra lineal incluyendo
una introducción a productos de Hadamard y de Kronecker, los cuales no son muy corrientes
en los cursos introductorios. La razón es que se presentan algunas procesos en la práctica que
requieren esas aplicaciones, tales como en la solución de la ecuación de Sylvester o Lyapunov
que tiene ocurrencia en sistemas de control. Esto conduce a un conjunto de resultados que se
han expuesto en el texto en forma de teoremas con el objeto de darles formalidad y también
como ejercicio para el lector. También se ha hecho un estudio del concepto de número de
condición. Esto es de utilidad en el proceso de análisis de estabilidad numérica de algunos
sistemas dinámicos. En la segunda parte se abordó el problema del cálculo de matrices,
procedimiento que conduce a la obtención de resultados directos para diversas aplicaciones
de matrices y vectores. Se ha procurado realizar los procedimientos por el método de paso
a paso con el fin de que el lector pueda seguir fácilmente las demostraciones. Finalmente, se
hace una pequeña introducción a los sistemas lineales y no lineales y a la discretización de
los procesos dinámicos.
Bibliografı́a
Avendaño, L. E. (2007). Sistemas Electrónicos Analógicos: Un enfoque matricial. UTP, AA

97, Pereira, Risaralda, Col., 2a edition.
Householder, A., S. (1975). The Theory of Matrices in Numerical Analysis. Reimpresión del
libro publicado originalmente en 1964. 180 Varick Street NY 10014, NY, USA.
Kreyszig, E. (2011). Advanced Engineering Mathematics. Laurie Rosatone, 111 River Street,
Hoboken, NJ 07030-5774, USA., 10a edition.
Nakahara, M. (2003). Geometry, Topology and Physics. Graduate Student Series in Physics.
270 Madison Avenue NY 10016, NY, USA., 2a edition.
Pedersen, M. S. and Petersen, K. B. (2012). The matrix cookbook. Technical report, Oticon
Foundation. url: http://matrixcookbook.com.
Poznyak, Alexander, S. (2008). Advanced Mathematical Tools for Automatic Control Engi-
neers, volume Vol. 1: Deterministic Techniques. Elsevier, Linacre House, Jordan Hill,
Oxford OX2 8DP, UK, 1a edition.
Sherman, J. and Morrison, W., J. (1950). Adjustment of an inverse matrix corresponding
to a change in one element of a given matrix. Annals of Mathematical Statistics.,
21(1): 124–127. Institute of Mathematical Statistics. USA.
Simon, D. (2006). Optimal State Estimation: Kalman, H-infinity, and Nonlinear Approaches.
John Wiley & Sons, Inc., New Jersey, USA.
Strang, G. (2006). Linear Algebra and its Applications. Thomson Corporation, Belmont,
CA, USA, 4a edition.
Woodbury, M., A. (1950). Inverting modified matrices. Memorandum Report 42, Princeton
University, Statistical Research Group, Princeton, NJ, USA.
43
Capı́tulo 2
Elementos de sistemas
dinámicos
2.1. Introducción
E n este capı́tulo se revisan algunos aspectos esenciales de la teorı́a de sis-

temas lineales. La teorı́a de estimación óptima de estados depende fuer-
temente de la teorı́a de matrices, incluyendo cálculo matricial; de manera que
la primera parte está dedicada a una revisión de este tópico. La estimación
óptima de estados se aplica tanto a sistemas lineales como a no lineales, aun-
que es más directa para los lineales. Por lo tanto, se dará una breve revisión
de estos sistemas. Las últimas secciones se dedicarán a revisar los conceptos
de estabilidad, controlabilidad y observabilidad de los sistemas lineales. Estos
conceptos son necesarios para comprender el material de estimación óptima de
estados que se estudiará más adelante.
2.2. Sistemas lineales

Muchos procesos en la práctica se pueden describir por sistemas de espacio de
estado. Esto incluye procesos en ingenierı́a, economı́a, fı́sica, quı́mica, biologı́a
y en general cualquier área del conocimiento. Si se puede encontrar un modelo
matemático para un proceso, entonces se pueden usar las herramientas de
matemáticas para controlar el proceso y obtener información del mismo. Esta
es la razón por la cual los sistemas en variables de estado son tan útiles en
la práctica de ingenierı́a. Si se conoce el estado de un sistema en el tiempo
45
46 Capı́tulo 2. Elementos de sistemas dinámicos
presente y se conocen los datos de entrada presentes y futuros, entonces se

pueden deducir las salidas futuras del sistema. Los modelos en espacio de estado
en general se pueden dividir en lineales y no lineales. Aunque la mayorı́a de los
procesos reales son no lineales, las herramientas matemáticas disponibles para
estimación y control son mucho más accesibles y comprensibles para sistemas
lineales. Por esta razón, los sistemas no lineales a veces se aproximan como
lineales. De esa manera, se pueden aplicar las herramientas desarrolladas para
sistemas lineales con el fin de obtener algoritmos para estimación y control.
Un sistema lineal en tiempo continuo, determinı́stico, se puede describir por
las ecuaciones
ẋ = Ax + Bu
(2.1)
y = Cx
donde x es el vector de estado, u es el vector de control y y es el vector de

salida. La matriz A se denomina matriz del sistema, la matriz B, matriz de
entrada y la matriz C la matriz de salida. Si A, B y C son constantes, se
desea determinar la solución a las ecuaciones (2.1) para un estado inicial x(t0 )
y entrada u(t), t ≥ 0 dados.
Una forma de encontrar la solución a la primera expresión, es suponer que
x(t) en (2.1) involucra la exponencial matricial eAt . Multiplicando entonces,
ambos lados de la primera expresión de (2.1) por la matriz e−Aτ , donde τ es
la variable de integración, se obtiene:
e−Aτ ẋ(τ ) − e−Aτ Ax(τ ) = e−Aτ Bu(τ )

d ( −Aτ )
e x(τ ) = e−Aτ Bu(τ ).
dτ
La integración de esta última ecuación entre t0 y t da
∫ t
t
e −Aτ
x(τ ) t0 = e−Aτ Bu(τ )dτ,
t0
o lo que es lo mismo,
∫ t
−At −At0
e x(t) − e x(t0 ) = e−Aτ Bu(τ )dτ.
t0
2.3. Sistemas no lineales 47
o sea,
∫ t
−At −At0
e x(t) = e x(t0 ) + e−Aτ Bu(τ )dτ.
t0
Premultiplicando por eAt ambos miembros de la ecuación, se llega a la solución

∫ t
A(t−t0 )
x(t) = e x(t0 ) + eA(t−τ ) Bu(τ )dτ (2.2)
t0
donde t0 es el tiempo inicial del sistema y a menudo se toma como 0. La

Ecuación (2.2) es la solución general de la ecuación de estado definida en (2.1).
Suele referirse como fórmula de variación de parámetros. La sustitución de
la expresión (2.2) en la ecuación de salida de (2.1) expresa y(t) en la forma
siguiente, la cual hace evidente la superposición de la respuesta a entrada nula
y la respuesta a condiciones iniciales nulas:
∫ t
A(t−t0 )
y(t) = Ce x(t0 ) + C eA(t−τ ) Bu(τ )dτ (2.3)
t0
Nótese que en el caso de entrada nula, x(t) está dado como
x(t) = eA(t−t0 ) x(t0 ), (2.4)
por esta razón, eAt se denomina matriz de transición de estado del sistema.
Es la matriz que describe como cambia el estado de su condición inicial en la
ausencia de entradas externas. (Matlab: expm(A) ̸= exp(A), exp(A) calcula la
exponencial de una matriz, elemento por elemento).
2.3. Sistemas no lineales

Un sistema lineal en la realidad no existe. Los sistemas reales siempre tienen
algunas no linealidades. Aun un simple resistor finalmente es no lineal si se
aplica una tensión suficientemente grande a través de él. La misma ley de
Ohm que establece una relación lineal en una red eléctrica, sólo es valida en
un cierto rango de operación. Pero aunque los sistemas lineales no existen en
el mundo real, la teorı́a de los sistemas lineales es una valiosa herramienta que
puede emplearse para estudiar los sistemas no lineales.
La forma general de un sistema no lineal continuo se puede escribir como
ẋ = f (x, u, v)
(2.5)
y = h(x, w)
donde f (·) y h(·) son funciones vectoriales arbitrarias [Khalil, 1996]. Se utiliza
v para indicar el ruido del proceso y w para indicar el ruido de la medición. Si
f (·) y h(·) son funciones explı́citas del tiempo, entonces el sistema es variante en
el tiempo. De otra forma, el sistema es invariante en el tiempo. Si f (x, u, v) =
Ax + Bu + v y h(x, w) = Hx + w, entonces el sistema es lineal. De otra
forma es no lineal. Con el fin de aplicar herramientas a partir de la teorı́a
de los sistemas lineales a los sistemas no lineales, se necesita linealizar estos
sistemas. En otras palabras, se necesita encontrar un sistema lineal que sea
aproximadamente igual al sistema no lineal. Para ver como se hace esto, se
empieza con una función no lineal f (x) de un escalar x. Se expande f (x) en
una serie Taylor alrededor de un punto de operación nominal (también llamado
punto de linealización) x = x̄. Definiendo x̃ = x − x̄:

∂f 1 ∂ 2 f 2 1 ∂ 3 f 3
f (x) = f (x̄) + x̃ + x̃ + x̃ + · · · (2.6)
∂x x̄ 2! ∂x2 x̄ 3! ∂x3 x̄
Ahora supóngase que x es un vector 2 × 1. Esto implica que x es una función

no lineal de dos variables independientes x1 y x2 . La expansión en serie de
Taylor de f (x) conduce a

∂f (x) ∂f (x)
f (x) = f (x̄) + x̃1 + x̃2 +
∂x1 x̄ ∂x2 x̄
( )
1 ∂ 2 f (x) 2 ∂ 2 f (x) 2 ∂ 2 f (x)
+ x̃ + x̃ + 2 x̃1 x̃2 +
2! ∂x21 x̄ 1 ∂x22 x̄ 2 ∂x1 x2 x̄
( )
1 ∂ 3 f (x) 3 ∂ 3 f (x) 3 ∂ 3 f (x) 2 ∂ 3 f (x)
+ x̃ + x̃ + 3 x̃ x̃2 + 3 x̃1 x̃2 + · · ·
2
3! ∂x31 x̄ 1 ∂x32 x̄ 2 ∂x21 x2 x̄ 1 ∂x1 x22 x̄
Extendiendo esto al caso más general en el cual x es un vector n × 1, se ve que

cualquier función vectorial continua f (x) puede ser expandida en una serie de
2.3. Sistemas no lineales 49
Taylor como
( ) ( )2

∂ ∂ 1 ∂ ∂
f (x) = f (x̄) + x̃1 + · · · + x̃n f (x) + x̃1 + · · · + x̃n f (x)
∂x1 ∂xn x̄ 2! ∂x1 ∂xn
( )3 x̄

1 ∂ ∂
+ x̃1 + · · · + x̃n f (x) + · · · (2.7)
3! ∂x1 ∂xn
x̄
Ahora se define el operador Dx̃k f (x) como

( n )k

∑ ∂
Dx̃ f (x) ,
k
x̃i f (x) (2.8)
i=1
∂xi
x̄
Usando esta definición se escribe la expansión de la serie de Taylor de f (x)

como
1 2 1
f (x) = f (x̄) + Dx̃ f (x) + Dx̃ f (x) + Dx̃3 f (x) + · · · (2.9)
2! 3!
Si la función no lineal f (x) es suficientemente suave, entonces las derivadas de
orden superior de f (x) deben ser algo pequeñas. También, si f (x) se expande
alrededor de un punto tal que x se acerque a x̃, entonces x es pequeña y las
potencias de orden superior en la Ecuación (2.9) serán pequeñas. Finalmente,
las derivadas de mayor orden en la expansión en serie de Taylor de la Ecua-
ción (2.9) se dividen entre factoriales incrementalmente mayores, los cuales
disminuyen aún más la magnitud de los términos de mayor orden en la citada
ecuación. Esto justifica la aproximación
f (x) ≈ f (x̄) + Dx̃ f

∂f
≈ f (x̄) + x̃
∂x x̄
≈ f (x̄) + Ax̃ (2.10)

∂f
donde A = , es la matriz definida por la anterior ecuación.
∂x x̄
Retornando al sistema de ecuaciones no lineal planteado en (2.5) y tomando
la expresión f (x, u, v), se ve que ésta se puede expandir alrededor del punto de
operación nominal (x̄, ū, v̄), obteniéndose una aproximación lineal como sigue;
ẋ = f (x, u, v)

∂f ∂f ∂f
≈ f (x̄, ū, v̄) + (x − x̄) + (u − ū) + (v − v̄)
∂x 0 ∂u 0 ∂v 0
= x̄˙ + Ax̃ + Bũ + Lṽ (2.11)
donde el subı́ndice 0 significa que la función es evaluada en el punto nominal

(x̄, ū, v̄). A, B y L están definidas en la ecuación anterior. Sustrayendo x̄˙ en
ambos lados de la Ecuación (2.11) da
x̃˙ = Ax̃ + Bũ + Lṽ (2.12)
Puesto que v es ruido, se escoge v̄ = 0 de modo que ṽ = v y se obtiene
x̃˙ = Ax̃ + Bũ + Lv (2.13)
Se tiene una ecuación lineal para x̃˙ en términos de x̃, ũ y v. Una ecuación lineal
para las desviaciones de los estados y control de sus valores nominales. Siempre
que las desviaciones permanezcan pequeñas, la linealización será exacta y la
ecuación lineal describirá con precisión las desviaciones de x de sus valores no-
minales x̄. En una forma similar se puede expandir la ecuación de medición no
lineal dada por la Ecuación (2.5) alrededor de un punto de operación nominal
x = x̄ y w = w̄ = 0. Esto resulta en la ecuación de medición linealizada

∂h ∂h
ỹ = x̃ + w̃
∂x 0 ∂w 0
= Cx̃ + Dw (2.14)
donde C y D están definidas por la anterior ecuación. Las ecuaciones (2.13) y

(2.14) comprenden un sistema lineal que describe las desviaciones del estado
y de la salida desde sus valores nominales. Donde las cantidades con virgulilla
en las ecuaciones (2.13) y (2.14) están definidas como
x̃ = x − x̄; ũ = u − ū; ỹ = y − ȳ
2.4. Discretización 51
2.4. Discretización
La mayorı́a de los sistemas en el mundo real se describen con la dinámica

de tiempo continuo del tipo mostrado en la Ecuación (2.1). Sin embargo, los
algoritmos de estimación de estados y control son casi siempre implementados
con electrónica digital. Esto requiere una transformación de una dinámica en
tiempo continuo a una dinámica en tiempo discreto. Acá se discutirá cómo un
sistema lineal en tiempo continuo se transforma en un sistema lineal en tiempo
discreto. Recordando la Ecuación (2.2) y haciendo t = tk y haciendo el tiempo
inicial t0 = tk−1 , se tiene
∫ tk
A(tk −tk−1 )
x(tk ) = e x(tk−1 ) + eA(tk −τ ) dτ Bu(tk−1 )
tk−1 (2.15)
y(tk ) = Cx(tk ).
Definiendo T = tk − tk−1 y α = τ − tk−1 y sustituyendo en la Ecuación (2.15)

se obtiene:
∫ T
AT
x(tk ) = e x(tk−1 ) + eA(T−α) dαBu(tk−1 )
0
∫ T
AT
= e x(tk−1 ) + eAT
e−Aα dαBu(tk−1 ).
0
Entonces,
xk = Fk−1 xk−1 + Gk−1 uk−1 (2.16)
donde
Fk−1 = eAT (2.17a)

∫ T
Gk−1 = e AT
e−Aα dαB. (2.17b)
0
Esta es una aproximación lineal discreta en el tiempo a la dinámica continua en
el tiempo dada por la Ecuación (2.1). El cálculo de la integral de la exponencial
de la matriz se puede realizar si A es invertible:

∫ T ∫ T∑
∞
−Aτ (−Aτ )k
e dτ = dτ
0 0 k=0
k!
∫ T [ ]
A2 τ 2 A3 τ 3
= I − Aτ + − + · · · dτ
0 2! 3!
[ ]T
Aτ 2 A2 τ 3 A3 τ 4
= Iτ − + − + ···
2! 3! 4!
[ ]0
AT2 A2 T3 A3 T4
= IT − + − + ···
2! 3! 4!
∫ T [ ]
−Aτ (AT)2 (AT)3 (AT)4
e dτ = AT − + − + · · · A−1
2! 3! 4!
0
[ ( 2
)]
(AT) (AT)3 (AT)4
= I − I − AT + − + − · · · A−1
2! 3! 4!
Entonces,
∫ T
( )
e−Aτ dτ = I − e−AT A−1 (2.18)
0
Si la matriz A tiene inversa, la conversión de las matrices A y B de sistemas

en tiempo continuo a las matrices F y G de sistemas en tiempo discreto se
puede resumir como sigue:
F = eAT
( ) (2.19)
G = F I − e−AT A−1 B.
Donde T es el tamaño del paso de discretización.

Ejemplo 2.1 (Sistema de primer orden)
Considérese el sistema [Åström and Wittenmark, 1997]
ẋ = ax + bu
con a ̸= 0.
2.4. Discretización 53
Aplicando las ecuaciones (2.19) se obtiene
F = eaT
( )b b ( aT )
G = eaT 1 − e−aT = e −1
a a
El sistema de muestreo se convierte ası́ en
b ( aT )
xk = eaT xk−1 + e − 1 uk−1
a
Ejemplo 2.2 (Integrador doble)

El integrador doble se describe por [Åström and Wittenmark, 1997]
[ ] [ ]
0 1 0
ẋ = x+ u
0 0 1
y = [1 0] x
Por lo tanto
[ ] [ ] [ ][ ]
1 0 0 1 1 0 1 0 1 2
F = eAT = + T+ T + ··· =
0 1 0 0 2! 0 0 0 0
[ ] [ ] [ ]
1 0 0 T 1 T
= + =
0 1 0 0 0 1
Para el cálculo de G, no se puede aplicar en este caso la Ecuación (2.19) puesto

que A−1 no existe; por lo tanto, se aplica directamente la Ecuación (2.17b), o sea
[ ]∫ T[ ] [ ] [ ][ ] [ ]
2 T
1 T 1 −α 0 1 T α − α2 0
G= dα =
0 1 0 1 1 0 1 0 α 0 1
[ ] [0 ] [ ] [ ] [ ] [ ]
1 T T − 12 T2 0 1 T − 12 T2 1 2
T
= = = 2
0 1 0 T 1 0 1 T T
[ ] [1 ]
1 T T2
xk = xk−1 + 2 uk−1
0 1 T
y = [1 0] xk−1
2.5. Estabilidad
En esta sección, se revisará el concepto de estabilidad para sistemas lineales
invariantes en el tiempo. En la primera parte se analizan los sistemas en tiem-
po continuo y luego los sistemas en tiempo discreto. Se establecerán resultados
importantes sin demostración. Para más detalle y resultados adicionales se re-
fiere al lector interesado a algunas referencias estándar sobre sistemas lineales,
v.gr.: [Åström and Murray, 2008], [Chen, 1984], [Jamshidi et al., 1992], [Kailath
et al., 2000].
2.5.1. Sistemas de tiempo continuo

Considérese el sistema de tiempo continuo lineal y de entrada cero
ẋ = Ax
(2.20)
y = Cx
A partir de estas ecuaciones se pueden definir los conceptos de estabilidad

marginal y estabilidad asintótica como sigue.
Definición 2.1
Un sistema lineal de tiempo continuo invariante en el tiempo es marginalmente
estable si el estado x(t) es acotado para todo t y para todos los estados iniciales
acotados x(0).
La estabilidad marginal es también llamada estabilidad de Lyapunov.

Definición 2.2
Un sistema lineal de tiempo continuo invariante en el tiempo es asintóticamente
estable si, para todos los estados iniciales acotados x(0).
lı́m x(t) = 0 (2.21)
t→∞
Las dos definiciones anteriores muestran que un sistema es marginalmente

estable si éste es asintóticamente estable. Esto es, estabilidad asintótica es
un subconjunto de la estabilidad marginal. Estabilidad marginal y estabilidad
asintótica son clases de estabilidad interna. Esto es, porque se ocupan sólo del
estado del sistema (es decir, la condición interna del sistema) y no consideran la
salida del sistema. Categorı́as más especı́ficas de estabilidad interna (es decir,
2.5. Estabilidad 55
estabilidad uniforme y estabilidad exponencial) están dadas en algunos libros

sobre sistemas lineales [Chen, 1984], [Simon, 2006], [Lewis, 1992].
Puesto que la solución de la Ecuación (2.20) está dada como
x(t) = eAt x(0) (2.22)
se puede establecer el siguiente teorema.

Teorema 2.1
Un sistema lineal de tiempo continuo, invariante en el tiempo es marginalmente
estable si y solo si
lı́m eAt ≤ M < ∞ (2.23)

t→∞
para alguna matriz constante M. Esto es solo una forma de decir que la matriz
exponencial no aumenta ilimitadamente.
La relación “menor que o igual que” en el anterior teorema plantea algunas

preguntas, puesto que las cantidades en ambos lados de este sı́mbolo matemá-
tico son matrices. ¿Qué significa que una matriz ser menor que otra matriz?
Esto puede ser interpretado de varias formas. Por ejemplo, decir que A < B
se interpreta normalmente como que (B − A) es definida positiva. En el ante-
rior teorema se puede usar cualquier definición razonable para la desigualdad
de la matriz y el teorema continúa siendo válido. Un teorema similar puede
establecerse combinando la Definición 2.2 con la Ecuación (2.22).
Se puede establecer el siguiente teorema.
Teorema 2.2
Un sistema lineal de tiempo continuo, invariante en el tiempo es asintóticamente
lı́m eAt = 0 (2.24)

t→∞
Recordando que eAt = QeÂt Q−1 , donde Q es una matriz constante que contie-
ne los autovectores de A y Â es la forma de Jordan de A. El exponencial eÂt
por lo tanto contiene términos como e(λi t) , te(λi t) , t2 e(λi t) , etc, donde λi , es un
autovalor de A. La acotación de eAt es por lo tanto referida a los autovalores
de A como se establece por los siguientes teoremas.
Teorema 2.3
Un sistema lineal de tiempo continuo, invariante en el tiempo es marginalmente
estable si y solo si una de las siguientes condiciones se mantiene.
1. Todos los autovalores de A tienen parte real negativa.
2. Todos los autovalores de A tienen parte real negativa o cero, y esos con
parte real igual a cero tienen una multiplicidad geométrica igual a su multi-
plicidad algebraica. Esto es, los bloques de Jordan que están asociados con
los autovalores que tienen parte real igual a cero son de primer orden.
Teorema 2.4
Un sistema lineal de tiempo continuo, invariante en el tiempo es asintóticamente
estable si y solo si todos los autovalores de A tienen parte real negativa.
Ejemplo 2.3
Considere el sistema
[ ]
0 1 0
ẋ = 0 0 0 x
0 0 −1
Ya que la matriz A es triangular superior, se sabe que sus autovalores están sobre
la diagonal; esto es, los autovalores de A son iguales a 0, 0, y −1. Se ve que el
sistema es asintóticamente inestable puesto que algunos de sus autovalores son no
negativos. También nótese que la matriz A ya está en la forma de Jordan y se
ve que el bloque de Jordan correspondiente al autovalor 0 es de segundo orden.
Por lo tanto, el sistema también es marginalmente inestable. La solución de este
sistema es
x(t) = exp(At)x(0)
[ ]
1 t 0
= 0 1 0 x(0)
0 0 e−t
El elemento de la primera fila y segunda columna de exp(At) crece sin lı́mite

cuando t se incrementa, de manera que hay algunos estados iniciales x(0) que
resultarán en x(t) no acotado. Sin embargo, hay algunos estados iniciales x(0)
2.5. Estabilidad 57
que resultarán en x(t) acotado. Por ejemplo, si x(0) = [1 0 1]⊤ , entonces

x(t) = exp(At)x(0)
[ ][ ] [ ]
1 t 0 1 1
= 0 1 0 0 = 0
0 0 e−t 1 e−t
y x(t) será acotado para todo t. Sin embargo, esto nada dice acerca de la estabi-
lidad del sistema; sólo dice que existe algún x(0) que resulta en un x(t) acotado.
Si se escoge x(0) = [0 1 0]⊤ , entonces
x(t) = exp(At)x(0)
[ ][ ] [ ]
1 t 0 0 t
= 0 1 0 1 = 1
0 0 e−t 0 0
y x(t) crecerá sin lı́mite. Esto prueba que el sistema es asintóticamente inestable
y marginalmente inestable.
Ejemplo 2.4
Considérese el sistema
[ ]
0 0 0
ẋ = 0 0 0 x
0 0 −1
Los autovalores de A son iguales a 0, 0, y −1. Se ve que el sistema es asintótica-
mente inestable puesto que algunos de sus autovalores son no negativos. Además
para ver si el sistema es marginalmente estable, se necesita calcular la multipli-
cidad geométrica del autovalor 0. (Esto puede hacerse notando que A ya está en
la forma de Jordan, pero se irá a través del ejercicio por motivo de ilustración).
resolviendo la ecuación
[ ]
0
(λI − A)v = 0
0
(donde λ = 0) para vectores no cero v, se ve que hay dos soluciones linealmente

independiente dadas como
[ ] [ ]
1 0
v= 0 , 1
0 0
Esto muestra que la multiplicidad geométrica del autovalor 0 es igual a 2, lo cual

significa que el sistema es marginalmente estable. La solución del sistema es
x(t) = exp(At)x(0)
[ ]
1 0 0
= 0 1 0 x(0)
0 0 e−t
Independientemente de x(0), se ve que x(t) siempre será limitado, lo cual significa

que el sistema es marginalmente estable. Nótese que x(t) puede aproximarse a 0
cuando t crece, dependiendo del valor de x(0). Por ejemplo, si x(0) = [0 0 −1]⊤ ,
entonces
[ ][ ] [ ]
1 0 0 0 0
x(t) = 0 1 0 0 = 0
0 0 e−t −1 −e−t
y x(t) se aproxima a 0 cuando t crece. Sin embargo, esto no dice nada acerca de la
estabilidad asintótica del sistema; esto solamente dice que existe algún x(0) que
resulta en el estado x(t) que se aproxima asintóticamente a 0. Si por el contrario
se opta por escoger x(0) = [0 1 0]⊤ , entonces
[ ][ ] [ ]
1 0 0 0 0
x(t) = 0 1 0 1 = 1
0 0 e−t 0 0
y x(t) no se aproxima a 0. Esto prueba que el sistema es asintóticamente inestable.
2.5.2. Sistemas de tiempo discreto

Considere la entrada cero, lineal, y el sistema de tiempo discreto invariante
en el tiempo
xk+1 = Fxk
(2.25)
yy = Hxk
Las definiciones de estabilidad marginal (también llamada estabilidad de Lya-

punov) y estabilidad asintótica son análogas a las definiciones para sistemas
de tiempo continuo que fueron dadas en la Subsección 2.5.1.
Definición 2.3
Un sistema lineal de tiempo discreto invariante en el tiempo es marginalmente
2.5. Estabilidad 59
estable si el estado xk es acotado para todo k y para todos los estados iniciales
acotados x0 .
Definición 2.4
Un sistema lineal de tiempo discreto invariante en el tiempo es asintóticamente
estable si,
lı́m xk = 0 (2.26)
k→∞
para todos los estados iniciales acotados x0 .
Estabilidad marginal y estabilidad asintótica son clases de estabilidad interna.

esto es porque tratan sólo del estado del sistema (es decir, la condición interna
del sistema) y no considera la salida del sistema. Categorı́as más especı́ficas de
estabilidad interna (es decir, estabilidad uniforme y estabilidad exponencial)
están dadas en algunos libros sobre sistemas lineales. La solución de la Ecuación
(2.25) está dada por
xk = Fk x0 (2.27)
A partir de la expresión (2.27) se pueden establecer los siguientes teoremas:

Teorema 2.5
Un sistema lineal de tiempo discreto, invariante en el tiempo es marginalmente
lı́m Fk ≤ M < ∞ (2.28)

k→∞
para alguna matriz constante M. Esto es sólo una forma de decir que las potencias
de F no aumenta sin lı́mite.
Teorema 2.6
Un sistema lineal de tiempo discreto, invariante en el tiempo es asintóticamente
lı́m Fk = 0 (2.29)
k→∞
Recordando que Fk = QF̂k Q−1 , donde Q es una matriz constante que contiene
los autovectores de F y F̂ es la forma de Jordan de F. La matriz F̂k por lo tanto
contiene términos como λki , kλki , k 2 λki , etc, donde λi , es un autovalor de F. La
acotación de Fk es por lo tanto referida a los autovalores de F como se establece

por los siguientes teoremas.
Teorema 2.7
Un sistema lineal de tiempo discreto, invariante en el tiempo es marginalmente
estable si y solo si una de las siguientes condiciones se mantiene.
1. Todos los autovalores de F tienen magnitud menor que uno.
2. Todos los autovalores de F tienen magnitud menor que uno o igual a uno, y
esos con magnitud igual a uno tienen una multiplicidad geométrica igual a su
multiplicidad algebraica. Esto es, los bloques de Jordan que están asociados
con los autovalores que tienen magnitud igual a uno son de primer orden.
Teorema 2.8
Un sistema lineal de tiempo discreto, invariante en el tiempo es asintóticamente
estable si y solo si todos los autovalores de F tienen magnitud menor que uno.
2.6. Controlabilidad y Observabilidad

Los conceptos de controlabilidad y observabilidad son fundamentales para la
teorı́a de control moderno. Estos conceptos definen que tan bien se puede con-
trolar un sistema (es decir, conducir el estado a un valor deseado) y que tan
bien se puede observar un sistema (es decir, determinar las condiciones inicia-
les después de medir las entradas). Tales conceptos son también importantes
para algunos de los resultados teóricos relacionados a la estimación del estado
óptimo que se encontrarán más adelante.
Los conceptos de controlabilidad y observabilidad fueron introducidos por
R. E. Kalman en una conferencia en 1959 y publicados en 1960 [Kalman, 1960],
[Kalman, 1959].
2.6.1. Controlabilidad
Las siguientes definiciones y teoremas dan descripción clara de la controlabili-
dad para sistemas lineales tanto en tiempo continuo como en discreto.
Definición 2.5
Un sistema de tiempo continuo es controlable si para cualquier estado inicial x(0)
2.6. Controlabilidad y Observabilidad 61
y cualquier tiempo final t > 0 existe una ley de control que transfiera el estado a
cualquier valor deseado en el tiempo t.
Definición 2.6
Un sistema de tiempo discreto es controlable si para cualquier estado inicial x0 y
algún tiempo final k existe una ley de control que transfiera el estado a cualquier
valor deseado en el tiempo k.
Nótese que la definición de controlabilidad en el caso de tiempo continuo

es más exigente que la definición en el caso de tiempo discreto. En el caso de
tiempo continuo, se requiere la existencia de una ley de control para cualquier
tiempo final. En el caso de tiempo discreto, se requiere la existencia de una
ley de control para algún tiempo final. En ambos casos, la controlabilidad es
independiente de la ecuación de salida.
Hay varios pruebas para la controlabilidad. Los siguientes teoremas equiva-
lentes pueden usarse para probar la controlabilidad de sistemas lineales conti-
nuos invariantes en el tiempo.
Teorema 2.9
Un sistema lineal continuo e invariante en el tiempo de n estados ẋ = Ax + Bu
tiene la matriz de controlabilidad C definida por
[ ]
C = B AB · · · An−1 B (2.30)
El sistema es controlable si y solo si ρ(C ) = n.
Teorema 2.10
Un sistema lineal de n estados, continuo e invariante en el tiempo ẋ = Ax + Bu
es controlable si y solo si la matriz grammiana de controlabilidad definida por
∫ t
⊤
G = eAτ BB⊤ eA τ dτ (2.31)
0
es definida positiva para algún t ∈ (0, ∞).
Teorema 2.11
Un sistema lineal de n estados, continuo e invariante en el tiempo ẋ = Ax + Bu
es controlable si y solo si la ecuación diferencial de Lyapunov
Ẇ = WA⊤ + AW + WW⊤ (2.32)

W(0) = 0
tiene una solución definida positiva W(t) para algún t ∈ (0, ∞). Ésta también es
llamada ecuación de Sylvester.
Similar al caso de tiempo continuo, los siguientes teoremas equivalentes pueden

usarse para probar la controlabilidad de sistemas lineales discretos invariantes
en el tiempo.
Teorema 2.12
Un sistema lineal de n estados, discreto e invariante en el tiempo xk = Fxk−1 +
Guk−1 tiene la matriz de controlabilidad C definida por
[ ]
C = G FG · · · Fn−1 G (2.33)
El sistema es controlable si y solo si ρ(C ) = n
Teorema 2.13
Guk−1 es controlable si y solo si la matriz grammiana controlabilidad definida
por
∑
k
G = Fk−1 GG⊤ (A⊤ )k−i (2.34)
i=0
es definida positiva para algún k ∈ (0, ∞).
Teorema 2.14
Guk−1 es controlable si y solo si la ecuación de diferencias de Lyapunov
Wi+1 = FWi F⊤ + GG⊤ (2.35)

W0 = 0
tiene una solución definida positiva Wk para algún k ∈ (0, ∞). Ésta es también
llamada la ecuación de Stein.
Nótese que los Teoremas 2.9 y 2.12 dan pruebas idénticas de controlabilidad
tanto para sistemas de tiempo continuo como de tiempo discreto. En general,
estas son las pruebas más simples de controlabilidad. Las pruebas de contro-
labilidad para sistemas lineales variantes en el tiempo pueden obtenerse gene-
ralizando los teoremas anteriores. La controlabilidad para sistemas no lineales
es mucho más difı́cil de formalizar.
Ejemplo 2.5
El circuito RLC de la Figura 2.1 tiene la descripción en variables de estados dada
por (ver por ejemplo [Chan et al., 1972])
[ ] [ −2 1 ] [ ] [ 1 ]
v̇C RC C
vC RC
= −1 + 1 u
ı̇L L 0 ıL L
donde vC es la tensión a través del capacitor, ıL es la corriente a través del inductor

y u es la tensión de excitación.
Se usará el Teorema 2.9 para determinar las condiciones bajo las cuales este
sistema es controlable. La matriz de controlabilidad se calcula como
C = [B AB]
+ R
u L R
-
Figura 2.1.: Circuito RLC para análisis de controlabilidad.
Sustituyendo en la ecuación anterior se obtiene:

[ 1 2 ]
LC − (RC)2
1
RC
C =
1 −1
L RLC
De aquı́ se puede calcular el determinante de C como

1 1
|C | = − (2.36)
(RC)2 L L2 C
√
El determinante de
√ C es 0 solamente si R = L/C. Ası́, el sistema es controlable
a menos que R = L/C. Puede ser muy difı́cil obtener este resultado a partir de
los Teoremas 2.10 y 2.11.
2.6.2. Observabilidad
Las siguientes definiciones y teoremas dan descripción clara de la observabili-
dad para sistemas lineales tanto en tiempo continuo como en discreto.
Definición 2.7
Un sistema de tiempo continuo es observable si para cualquier estado inicial x(0) y
cualquier tiempo final t > 0 el estado inicial x(0) se puede determinar únicamente
con el conocimiento de la entrada u(τ ) y la salida y(τ ) para todo τ ∈ [0, t].
Definición 2.8
Un sistema de tiempo discreto es observable si para cualquier estado inicial x0 y
algún tiempo final k el estado inicial x0 se puede determinar únicamente con el
conocimiento de la entrada ui y la salida yi para todo i ∈ [0, k].
Nótese que la observabilidad en el caso de tiempo continuo es más exigente

que la definición en tiempo discreto. En el caso de tiempo continuo, el esta-
do inicial se debe poder determinar en cualquier tiempo final. En el caso de
tiempo discreto, el estado inicial se debe poder determinar algún tiempo final.
Si el sistema es observable entonces se puede determinar el estado inicial, y
si se puede determinar el estado inicial entonces todos los estados entre los
tiempos inicial y final pueden determinarse. Hay varias pruebas para la ob-
servabilidad. Los siguientes teoremas equivalentes puede usarse para probar la
observabilidad de sistemas lineales continuos invariantes en el tiempo.
Teorema 2.15
El sistema lineal de n estados, continuo e invariante en el tiempo
ẋ = Ax + Bu
(2.37)
y = Cx
tiene la matriz de observabilidad O definida por
 
C
 CA 
O=  ... 
 (2.38)
CAn−1
el sistema es observable si y solo si ρ(O) = n.

Teorema 2.16
ẋ = Ax + Bu
(2.39)
y = Cx
es observable si y solo si la observabilidad grammiana definida por
∫ t
⊤
eA τ C⊤ CeAτ dτ (2.40)
0
es definida positiva para algún t ∈ (0, ∞).

Teorema 2.17
ẋ = Ax + Bu
(2.41)
y = Cx
es observable si y solo si la ecuación diferencial de Lyapunov
−Ẇ = WA + A⊤ W + C⊤ C (2.42)
W(t) = 0
tiene una solución definida positiva W(τ ) para algún τ ∈ (0, t). Esta es también
llamada la ecuación de Sylvester.
Similar al caso de tiempo continuo, los siguientes teoremas pueden usarse para
probar la observabilidad de un sistema lineal discreto invariante en el tiempo.
Teorema 2.18
El sistema lineal de n estados, discreto e invariante en el tiempo
xk = Fxk−1 + Guk−1
(2.43)
yk = Hxk
tiene la matriz de observabilidad O defina por
 
H
 HF 
O=  ... 
 (2.44)
HFn−1
El sistema es observable si y solo si ρ(O) = n.

Teorema 2.19
Un sistema lineal de n estados, discreto e invariante en el tiempo
(2.45)
yk = Hxk
es observable si y solo si la observabilidad grammiana definida por
∑
k
(F⊤ )i H⊤ HFi (2.46)
i=0
es definida positiva para algún k ∈ (0, ∞).
Teorema 2.20
El sistema lineal de n estados, discreto e invariante en el tiempo
(2.47)
yk = Hxk
es observable si y solo si la ecuación diferencial de Lyapunov
−Wi = F⊤ Wi+1 F + H⊤ H (2.48)

Wk = 0
tiene una solución definida positiva W0 para algún k ∈ (0, ∞). Esta es también
llamada la ecuación de Stein.
Nótese que los Teoremas 2.15 y 2.18 dan pruebas idénticas de observabilidad
tanto para sistemas de tiempo continuo como de tiempo discreto. En general,
estas son las pruebas más simples de observabilidad. Las pruebas de observa-
bilidad para sistemas lineales variantes en el tiempo pueden obtenerse genera-
lizando los anteriores teoremas. La observabilidad para sistemas no lineales es
mucho más difı́cil de formalizar.
Ejemplo 2.6
El circuito RLC de la Figura 2.1 está definido en variables de estados como
[ ] [ −2 1 ] [ ] [ 1 ]
v̇C RC C
vC RC
= −1 + 1 u
ı̇L 0 ıL
L
[ ] L
vC
y = [−1 0]
ıL
donde vC es la tensión a través del capacitor, ıL es la corriente a través del

inductor y u es la tensión aplicada. Se usará el Teorema 2.15 para determinar las
condiciones bajo las cuales este sistema es observable. La matriz de observabilidad
se calcula como
[ ] [ ]
C −1 0
O= = 2
RC − C
CA 1
El determinante de la matriz de observabilidad se calcula como

1
|O| =
C
El determinante de O es diferente de cero, por lo tanto el sistema es observable.
Por otro lado, supóngase que R = L = C = 1, entonces la ecuación de salida será
[ ]
v
y = [−1 1] C
ıL
Luego la matriz de observabilidad se calcula como

[ ]
−1 1
O=
1 −1
|O| = 0
Por lo tanto el sistema es no observable. Serı́a muy difı́cil obtener este resultado
a partir de los Teoremas 2.16 y 2.17.
2.6.3. Estabilidad y detectabilidad

Los conceptos de estabilidad y detectabilidad están cercanamente relacionados
a la controlabilidad y observabilidad, respectivamente. Estos conceptos tam-
bién están relacionados a los modos de un sistema. Los modos de un sistema
son todos los estados desacoplados, después que el sistema se ha transformado
en una forma de Jordan. Un sistema puede transformarse en una forma de
Jordan como sigue. Considérese el sistema
ẋ = Ax + Bu
(2.49)
y = Cx + Du
Primero se encuentran los autovalores de la matriz A del sistema. Supóngase

que los autovectores se indican como v1 , · · · , vn . Se crea una matriz Mn×n
agregando los autovectores como sigue

[ ]
M = v1 · · · vn (2.50)
Se define un nuevo sistema como

x̄˙ = M−1 AMx̄ + M−1 Bu
= Āx̄ + B̄u
(2.51)
y = CMx̄ + Du
= C̄x̄ + Du
El nuevo sistema se denomina la representación en forma de Jordan del sistema

original. Nótese que la matriz M siempre será invertible porque los autovectores
de la matriz siempre pueden ser elegidos para ser linealmente independientes.
Los dos sistemas de las ecuaciones (2.49) y (2.51) son sistemas algebraicamente
equivalentes. Esto es porque tienen la misma entrada y la misma salida (y por lo
tanto, tienen la misma función de transferencia) pero tienen estados diferentes.
Ejemplo 2.7
ẋ = Ax + Bu
[ ] [ ]
1 1 2 1
= 0 1 3 x+ 1 u
0 0 −2 0
y = Cx + Du
= [1 0 0] x
Este sistema tiene la misma función de transferencia que
x̄˙ = Āx̄ + B̄u

[ ] [ ]
1 1 0 1
= 0 1 0 x+ 1 u
0 0 −2 0
y = C̄x̄ + Du
= [1 0 1] x̄
La matriz de autovectores de A es
M = [v1 v2 v3 ]
[ ]
1 0 1
= 0 1 3
0 0 −3
Se pueden observar las equivalencias:
Ā = M−1 AM
B̄ = M−1 B
C̄ = CM
El sistema de la forma de Jordan tiene dos modos desacoplados.
El primer modo es
[ ] [ ]
1 1 1
x̄˙ = x̄ + u
0 1 1 1
y1 = [1 0] x̄1
El segundo modo es
x̄˙ 2 = −2x̄2 + 0u
(2.52)
y2 = x̄2
Definición 2.9
Si un sistema es controlable o estable, entonces también es estabilizable. Si un
sistema es no controlable o inestable, entonces es estabilizable si sus modos no
controlables son estables.
En el ejemplo anterior, el primer modo es inestable (ambos autovalores en +1)

pero es controlable. El segundo modo es estable (autovalor en −2) pero no
controlable. Por lo tanto, el sistema es estabilizable.
Definición 2.10
Si un sistema es observable o estable, entonces también es detectable. Si un sistema
es no observable o inestable, entonces es detectable si sus modos no observables
son estables.
En el ejemplo de más arriba, es primer modo es inestable pero observable. El

segundo modo es estable y observable. Por lo tanto, el sistema es detectable.
2.7. Resumen
En este capı́tulo se ha hecho una revisión de aspectos básicos de álgebra lineal
incluyendo una introducción a productos de Hadamard y de Kronecker, los
cuales no son muy corrientes en los cursos introductorios. La razón es que se
presentan algunas procesos en la práctica que requieren esas aplicaciones, tales
como en la solución de la ecuación de Sylvester o Lyapunov que tiene ocurrencia
en sistemas de control. Esto conduce a un conjunto de resultados que se han
expuesto en el texto en forma de teoremas con el objeto de darles formalidad
y también como ejercicio para el lector. También se ha hecho un estudio del
concepto de número de condición. Esto es de utilidad en el proceso de análisis
de estabilidad numérica de algunos sistemas dinámicos. En la segunda parte
se abordó el problema del cálculo de matrices, procedimiento que conduce a
la obtención de resultados directos para diversas aplicaciones de matrices y
vectores. Se ha procurado realizar los procedimientos por el método de paso
a paso con el fin de que el lector pueda seguir fácilmente las demostraciones.
Finalmente, se hace una pequeña introducción a los sistemas lineales y no
lineales y a la discretización de los procesos dinámicos.
Bibliografı́a
Chan, S.-P., Chan, S.-Y., and Chan, S.-G. (1972). Analysis of Linear Networks and Systems.
A Matrix-Oriented Approach with Computer Applications. Addison-Wesley Series in
ELectrical Engineering. Addison-Wesley Publishing Company, Reading, MA.
Chen, C.-T. (1984). Linear System Theory and Design. Saunders College Pu., Harcourt
Brace Jovanovich, Inc., Orlando, FL 32887, USA, 2a edition.
Jamshidi, M., Tarokh, M., and Shafai, B. (1992). Computer-Aided Analysis and Design
of Linear Control Systems. Prentice-Hall International, Inc., A Simon and Schuster
Company Englewood Cliffs, N J 07632, USA, 1a edition.
Kailath, T., Sayed, A., and Hassibi, B. (2000). Linear Estimation. Prentice-Hall, Upper
Saddle River, New Jersey, USA.
Kalman, R. E. (1959). On the general theory of control systems. IRE Transactions on
Automatic Control, 4(3): 110–122.
Kalman, R. E. (1960). Contributions to the theory of optimal control. Boletı́n de la Sociedad
Matemática Mexicana, 5: 102–119.
Khalil, H. (1996). Nonlinear Systems. Simon and Schuster, Viacom Company Upper Saddle
River, N. J. 07458, USA, segunda edition.
Lewis, F. L. (1992). Applied Optimal Control & Estimation: Digital Design & Implemen-
tation. Digital Signal Processing. Prentices-Hall, Inc., Simon & Schuster Company
Englewoods Cliffs, NJ 07632, USA.
Åström, K. J. and Murray, R. (2008). Feedback systems: an introduction for scientists and
engineers. Princeton University Press, 41 William Street, Princeton, New Jersey 08540,
USA.
Åström, K. J. and Wittenmark, B. (1997). Computer-Controlled Systems: Theory and De-
sign. Prentice Hall Information and System Sciences, 3a edition.
71
Capı́tulo 3
Estimación por mı́nimos

cuadrados
3.1. Introducción
E n este capı́tulo se discutirá la estimación por mı́nimos cuadrados, la cual es

la base para los métodos de diseño óptimo de filtros. En la primera parte se
discute la estimación de un vector constante sobre la base de varias mediciones
lineales pero ruidosas de ese vector. Luego se extienden los resultados al caso
en el cual algunas medidas son más ruidosas que otras; esto es, se tiene mayor
confianza en algunas medidas que en otras. Cuando los datos se incrementan
en el tiempo se hace difı́cil hacer cálculos de los valores estimados; esto conduce
al concepto de recursión en el proceso, sobre la base de medidas ruidosas. La
estimación recursiva es un método de estimación en el cual no se incrementa
el esfuerzo computacional del algoritmo, independientemente de cuantas medi-
ciones se dispone. A mediados del siglo pasado, apareció el filtro de Wiener, el
cual es un método de estimar señales variantes en el tiempo contaminadas por
ruido, con base en las mediciones del ruido. Hasta 1960, el filtro de Wiener era
el estado del arte en la estimación de señales [Kailath, 1981]. Este paradigma
fue roto con la publicación del trabajo de R. Kalman en los comienzos de los
años 60 [Kalman, 1960], a partir del cual miles de proyectos se han elaborado
con mucho éxito.
73
74 Capı́tulo 3. Estimación por mı́nimos cuadrados
3.2. Estimación de una constante
En esta sección, se estudiará como estimar una constante sobre la base de

varias medidas ruidosas de dicha constante. Por ejemplo, supóngase que se
tiene un resistor pero no se conoce su resistencia. Se toman varias medidas
de su resistencia usando un multı́metro, pero las medidas son ruidosas porque
se tiene un multı́metro de baja calidad. Se desea estimar la resistencia sobre
la base de las medidas ruidosas. En este caso, se desea estimar una constante
escalar pero, en general, se desea estimar un vector constante [Gelb, 2001].
Para tomar el problema en términos matemáticos, supóngase que x es un
vector constante desconocido de n elementos y y es un vector de k elementos
de medidas ruidosas. Entonces surge la pregunta ¿Cómo se puede encontrar
el mejor estimado x̂ de x? Para tratar de resolver este problema se procede
como se describe a continuación.
Asúmase que cada elemento del vector y de medidas es una combinación
lineal de los elementos de x, con la suma de algunas medidas ruidosas w:
y1 = h11 x1 + · · · + h1n xn + w1
.. ..
. .
yk = hk1 x1 + · · · + hkn xn + wk
Este conjunto de ecuaciones se puede colocar en forma matricial como
y = Hx + w (3.1)
Se define ϵy como la diferencia entre las medidas ruidosas y el vector Hx̂:
ϵy = y − Hx̂ (3.2)
El vector ϵy es llamado la medida residual. El valor más probable del vector x

es el vector x̂ que hace mı́nima la suma de los cuadrados entre los valores
observados y y el vector Hx̂. De esta manera se tratará de calcular el vector x̂
que minimice la función de costo J, donde J está dada como
J = ϵ2y1 + · · · + ϵ2yk
= ϵ⊤
y ϵy (3.3)
3.2. Estimación de una constante 75
La variable J se refiere en la literatura como función de costo, función objetivo

o función de retorno y, como se puede apreciar, es una función escalar. Se puede
sustituir ϵy en la anterior ecuación para reescribir J como
J = (y − Hx̂)⊤ (y − Hx̂) = y⊤ y − y⊤ Hx̂ − x̂⊤ H⊤ y + x̂⊤ H⊤ Hx̂
Con el fin de minimizar J con respecto a x̂, se calcula la derivada parcial y el

resultado se iguala a cero.
∂J
= −y⊤ H − y⊤ H + 2x̂⊤ H⊤ H = −2y⊤ H + 2x̂⊤ H⊤ H = 0 (3.4)
∂x̂
Resolviendo esta ecuación para x̂ resulta en
y⊤ H = x̂⊤ H⊤ H
H⊤ y = H⊤ Hx̂
Es decir,
x̂ = (H⊤ H)−1 H⊤ y (3.5)
donde (H⊤ H)−1 H⊤ , es la seudoinversa de H, la cual ocurre si k ≥ n y H es de

rango completo [Strang, 2006]. Esto significa que el número de medidas k es
mayor que el número de variables n que se trata de estimar y las medidas son
linealmente independientes. Para demostrar que se trata de un mı́nimo de J,
se debe probar que la segunda derivada de J es semidefinida positiva, es decir,
∂ 2J
= 2H⊤ H (3.6)
∂x̂2
Si H es una matriz de orden k × n, entonces se verifica que tanto HH⊤ como
H⊤ H son matrices semidefinidas positivas. Ahora bien,
Si ρ(H) = k entonces HH⊤ es definida positiva.
Si ρ(H) = n entonces H⊤ H es definida positiva.
Este último caso corresponde a la Ecuación (3.6) lo cual completa la demos-
tración.
Ejemplo 3.1
La idea es tratar de estimar la resistencia x de un resistor no marcado con base a
k medidas ruidosas de un multı́metro. En este caso x es un escalar de modo que
las k medidas ruidosas estarán dadas como
y 1 = x + w1
.. ..
. .
y k = x + wk
Estas k ecuaciones se pueden combinar en una simple expresión vectorial como
   
y1 1
 ..  =  ...  x + w
.
yk 1
La Ecuación (3.5) muestra que el estimado óptimo de la resistencia x está dado

como
x̂ = (h⊤ h)−1 h⊤ y
  −1  
1 y1
x̂ = [1 · · · 1]  ..  [1 · · · 1]  ...  = k −1 [y1 + · · · +yk ]
.
1 yk
1∑
k
x̂ = yi (3.7)
k
i=1
En este simple ejemplo, se puede observar que la estimación por mı́nimos cua-
drados concuerda con nuestra intuición de simplemente calcular el promedio
de las medidas.
3.3. Estimación por mı́nimos cuadrados

ponderados
En la sección anterior, se asumió que se tenı́a igual nivel de confianza en todas
las medidas. Ahora se va a suponer que se tiene mayor confianza en algunas
medidas con respecto a otras. En este caso, se requiere generalizar los resul-
tados de la sección anterior con el fin de obtener la estimación por mı́nimos
cuadrados ponderados. La situación se presenta, v.gr., cuando se tienen dife-
3.3. Estimación por mı́nimos cuadrados ponderados 77
rentes dispositivos de medición y alguno o algunos son de mejor calidad que

los demás; sin embargo, no se pueden descartar las medidas tomadas con los
dispositivos de menor calidad puesto que ya están, por ejemplo, en una base
de datos y se puede tomar información de ellas. En la práctica se hace ma-
yor énfasis en las medidas más confiables que en las tomadas con aparatos o
en condiciones de baja fiabilidad. En esta sección se muestra que en efecto se
puede aprovechar esa información de “baja” calidad y ponderar su valor no
importa su nivel de confianza.
Para poner el problema en términos matemáticos, supóngase que x es un
vector constante desconocido de n elementos y y es un vector de medidas
ruidosas de k elementos. Se supone que y es una combinación lineal de los
elementos de x con la adición de algún ruido de medición cuya varianza puede
ser diferente para cada elemento de y [Gelb, 2001]:
      
y1 h11 · · · h1n x1 w1
 ..   ..   ..   .. 
.= .  .  +  . 
yk hk1 · · · hkn xn wk
E {wi2 } = σi2 i = 1, . . . , k
Se supone que el ruido en cada medida tiene media cero y es independiente.

La matriz de covarianza de la medida está dada por
 
σ12 0
 .. 
R = E {ww⊤ } =  . 
2
0 σk
Ahora se debe minimizar la siguiente cantidad con respecto a x̂:
ϵ2y1 ϵ2yk
J= + · · · + (3.8)
σ12 σk2
Nótese que en lugar de minimizar la suma de los cuadrados de ϵy como se hizo

en la Ecuación (3.3), se minimiza la suma de los cuadrados ponderados. Si, por
ejemplo, y1 es una medida relativamente ruidosa, entonces no hay necesidad
de ser muy cuidadoso en la minimización de la diferencia entre y1 y el primer
elemento de Hx̂ pues no se tiene la suficiente confianza en el valor de y1 . La
función de costo se puede escribir como
J = ϵ⊤ −1 ⊤ −1
y R ϵy = (y − Hx̂) R (y − Hx̂)
= y⊤ R−1 y − y⊤ R−1 Hx̂ − x̂⊤ H⊤ R−1 y + x̂⊤ H⊤ R−1 Hx̂
Ahora, se toma la derivada parcial de J respecto de x̂ y se hace igual a cero,

con el fin de calcular el mejor valor estimado de dicha variable:
∂J
= −2y⊤ R−1 H + 2x̂⊤ H⊤ R−1 H = 0
∂x̂
y⊤ R−1 H = x̂⊤ H⊤ R−1 H,
es decir,
H⊤ R−1 Hx̂ = H⊤ R−1 y
Finalmente,
x̂ = (H⊤ R−1 H)−1 H⊤ R−1 y (3.9)
Resultado que se conoce como Teorema de Gauss–Markov [Crassidis and Jun-

kins, 2012]. Nótese que este método requiere que la matriz de ruido de la medi-
da, R, sea definida positiva, es decir, cada medida yi debe estar contaminada
por algún ruido para que este método funcione.
Ejemplo 3.2
Se regresa al problema original de tratar de estimar la resistencia x de un resistor
no marcado sobre la base de k medidas ruidosas generadas por un multı́metro.
En este caso x es un escalar de modo que las k medidas ruidosas están dadas por
yi = x + wi
E {σi }
2
= σi2 i = 1, · · · , k
     
y1 1 w1
 ...  =  ...  x +  ... 
yk 1 wk
R = diag(σ12 · · · σk2 )
3.4. Estimación recursiva por mı́nimos cuadrados 79
x̂ = (H⊤ R−1 H)−1 H⊤ R−1 y

  −1  −1  −1  
σ12 0 1 σ12 0 y1
       .. 
  ..  [1 · · · 1] 
= [1 · · · 1]  .. . ..
. .  .
0 σk2 1 0 2
σk yk
(∑ )−1 ( )
1 y1 yk
= 2 2 + ··· + 2
σi σ1 σk
3.4. Estimación recursiva por mı́nimos

cuadrados
En esta sección, se mostrará cómo calcular recursivamente el valor estimado de
un vector constante por mı́nimos cuadrados ponderados [Grewal and Andrews,
2008]. Esto es, supóngase que se tiene x̂ después de (k − 1) medidas y luego
se obtiene una nueva medida yk . ¿Cómo se puede actualizar un estimado sin
reelaborar completamente la Ecuación (3.9)?
yk = H k x + w k
(3.10)
x̂k = x̂k−1 + Kk (yk − Hk x̂k−1 )
Para esto, se calcula x̂ sobre la base del valor estimado anterior x̂k−1 y la
nueva medida yk . Kk es una matriz a ser determinada, llamada la matriz
de ganancia del estimador. La cantidad (yk − Hk x̂k−1 ), se denomina término
corrector. Nótese que si el término corrector es cero o si la matriz de ganancia
es cero, entonces el valor estimado no cambia del paso (k − 1) al paso k. Antes
de calcular el valor óptimo de la matriz de ganancia Kk , se debe analizar el
promedio del error de estimación del estimador recursivo lineal.
El promedio del error estimado se puede calcular como
E {ϵx,k } = E {x − x̂k }
= E {x − x̂k−1 − Kk (yk − Hk x̂k−1 )}
= E {ϵx,k−1 − Kk (Hk x + wk − Hk x̂k−1 )}
= E {ϵx,k−1 − Kk Hk (x − x̂k−1 ) − Kk wk }
= (I − Kk Hk )E {ϵx,k−1 } − Kk E {wk } (3.11)
Ası́, si E {wk } = 0 y E {ϵx,k−1 } = 0, entonces E {ϵx,k } = 0. En otras palabras, si

la medida ruidosa wk tiene promedio cero para todo k y el estimado inicial de x
se escoge igual al valor esperado de x, es decir, x̂0 = E {x}, entonces el valor
esperado de x̂k será igual a x para todo k. Debido a esto, el estimador de la
Ecuación (3.10) se denomina estimador imparcial. Nótese que esta propiedad
se mantiene independientemente del valor de la matriz de ganancia Kk . Esta
es una propiedad deseable de un estimador porque dice que en promedio, el
estimado x̂ será igual al verdadero valor x. Nótese además que, en concordancia
con la Ecuación (3.11), el error del estimador está dado por
ϵx,k = (I − Kk Hk )ϵx,k−1 − Kk wk . (3.12)
Ahora se determinará el valor óptimo de Kk . Puesto que el estimador es im-

parcial, independientemente del valor de Kk utilizado, se debe escoger algún
otro criterio de optimalidad para determinarlo. El criterio de optimalidad ele-
gido para minimizar, corresponde a la suma de las varianzas de lo errores de
estimación en el instante k, es decir,
Jk = E {(x1 − x̂1 )2 } + · · · + E {(xn − x̂n )2 }

= E {ϵ2x1 ,k + · · · + ϵ2xn ,k }
= E {ϵ⊤
x,k ϵx,k }
Ahora, aplicando la Ecuación (1.38) se obtiene:
Jk = E {ϵ⊤ ⊤ ⊤
x,k ϵx,k } = E {Tr(ϵx,k ϵx,k )} = Tr(E {ϵx,k ϵx,k })
= Tr(Pk ) (3.13)
donde, como se observa, Pk es la covarianza del error de estimación.

Se puede usar un proceso similar al seguido en la Ecuación (3.11), con el fin
de obtener una fórmula recursiva para el cálculo de Pk . Entonces, partiendo
de la expresión (3.12) del error de estimación:
Pk = E {ϵx,k ϵ⊤
x,k }
= E {[(I − Kk Hk )ϵx,k−1 − Kk wk ][(I − Kk Hk )ϵx,k−1 − Kk wk ]⊤ }

= (I − Kk Hk )E {ϵx,k−1 ϵ⊤ ⊤ ⊤
x,k−1 }(I − Kk Hk ) − Kk E {wk ϵx,k−1 }(I − Kk Hk )
⊤
− (I − Kk Hk )E {ϵx,k−1 wk⊤ }K⊤ ⊤ ⊤

k + Kk E {wk wk }Kk . (3.14)
3.4. Estimación recursiva por mı́nimos cuadrados 81
Ahora, nótese que ϵx,k−1 , el error estimado en el instante (k − 1), es indepen-

diente de wk (el ruido estimado en el instante k). Por lo tanto,
E {ϵx,k−1 wk⊤ } = E {wk ϵ⊤ ⊤

x,k−1 } = E {wk }E {ϵx,k−1 } = 0, (3.15)
puesto que ambos valores esperados son cero. Por lo tanto, la Ecuación (3.14)
se reduce a
Pk = (I − Kk Hk )Pk−1 (I − Kk Hk )⊤ + Kk Rk K⊤
k (3.16)
donde Rk es la covarianza de wk . Esta es la fórmula recursiva para la covarianza

del error de estimación por mı́nimos cuadrados. Esto es consistente con la
intuición en el sentido de que cuando el ruido de la medida aumenta (es decir,
Rk aumenta), la incertidumbre del valor estimado también aumenta (es decir,
Pk aumenta). Nótese que la matriz Pk debe ser definida positiva puesto que
es una matriz de covarianza y la forma de la Ecuación (3.16) garantiza que
Pk sea definida positiva, asumiendo que Pk−1 y Rk son definidas positivas.
Ahora se necesita encontrar el valor de Kk que haga la función de costo en la
Ecuación (3.13) tan pequeña como sea posible. El promedio del error estimado
es cero para cualquier valor de Kk . Por lo tanto, si se escoge Kk de modo que
la función de costo (es decir, la traza de Pk ) sea pequeña, entonces el error
de la estimación no solo tendrá promedio cero, también será consistentemente
tan cerca a cero como sea posible.
Con el fin de encontrar el mejor valor de Pk primero se necesita recordar
⊤)
de la Ecuación (1.25) que ∂Tr(ABA
∂A
= 2AB si B es simétrica. Además, de
∂Tr(XA) ⊤
la Ecuación (A.2), ∂X
= A . Con esto en mente, se pueden usar las
ecuaciones (3.13) y (3.16) y la regla de cadena para obtener
∂Jk ∂Tr(Pk )
= = 2(I − Kk Hk )Pk−1 (−H⊤
k ) + 2Kk Rk (3.17)
∂Kk ∂Kk
Ahora bien, para encontrar el valor de Kk que minimice Jk , se hace la derivada
igual a cero y entonces se resuelve para Kk como sigue:
Kk Rk = (I − Kk Hk )Pk−1 H⊤
k
Kk Rk = Pk−1 H⊤ ⊤
k − Kk Hk Pk−1 Hk
Factorizando y luego despejando Kk :
Kk (Rk + Hk Pk−1 H⊤ ⊤
k ) = Pk−1 Hk
Kk = Pk−1 H⊤ ⊤
k (Hk Pk−1 Hk + Rk )
−1
(3.18)
Las ecuaciones (3.10), (3.16), y (3.18) forman la estimación recursiva por mı́-
nimos cuadrados, la cual se resume en el Algoritmo 3.1.
Algoritmo 3.1 Estimación recursiva por mı́nimos cuadrados

Inicialización:
x̂0 = E {x}
P0 = E {(x − x̂0 )(x − x̂0 )⊤ }
◃ Si no hay conocimiento disponible de x antes de que las medidas sean to-
madas, entonces P0 = ∞I. Si hay conocimiento absoluto de x antes de que las
medidas sean tomadas, entonces P0 = 0.
Cómputo:
1. Obtención del vector de medición yk .
for k = 1 to N do
yk = Hk xk + wk ◃ wk ∼ N ID(0, Rk )
end for
2. Actualización del valor estimado de x y la covarianza del error de estimación P.
for k = 1 to N do
( )−1
Kk = Pk−1 H⊤ ⊤
k Hk Pk−1 Hk + Rk
x̂k = x̂k−1 + Kk (yk − Hk x̂k−1 )
k
end for
3.5. Formas alternas del estimador

Algunas veces es útil escribir las ecuaciones para Pk y Kk en otras formas de
representación. Aunque esas formas alternas son matemáticamente idénticas,
pueden ser beneficiosas desde el punto de vista computacional. También pueden
conducir a nuevos resultados, los cuales se discutirán en los próximos capı́tulos.
3.5. Formas alternas del estimador 83
Primero, se encontrará una forma alterna para la expresión de la covarianza

del error de estimación. Sustituyendo Kk de la Ecuación (3.18) en la Ecuación
(3.16) se obtiene
−1 ⊤ −1
Pk = (I − Pk−1 H⊤ ⊤ ⊤
k Sk Hk )Pk−1 (I − Pk−1 Hk Sk Hk ) + Kk Rk Kk (3.19)
donde se ha introducido la variable auxiliar Sk = Hk Pk−1 H⊤ k + Rk . Ahora, se

sustituye en la ecuación anterior el valor obtenido para Kk y se expanden los
términos entre paréntesis, con lo cual se obtiene:
Pk = Pk−1 − 2Pk−1 H⊤ −1 ⊤ −1 ⊤ −1
k Sk Hk Pk−1 + Pk−1 Hk Sk · Hk Pk−1 Hk · Sk Hk Pk−1
+ Pk−1 H⊤ −1 −1
k Sk · Rk · Sk Hk Pk−1 .
Combinando los dos últimos términos de esta ecuación, y teniendo en cuenta

que Sk = Hk Pk−1 H⊤
k + Rk , se llega a
−1 ⊤ −1 −1
Pk = Pk−1 − 2Pk−1 H⊤ ⊤
k Sk Hk Pk−1 + Pk−1 Hk Sk (Hk Pk−1 Hk + Rk )Sk Hk Pk−1
= Pk−1 − 2Pk−1 H⊤ −1 ⊤ −1
k Sk Hk Pk−1 + Pk−1 Hk Sk Hk Pk−1
−1
= Pk−1 − Pk−1 H⊤
k Sk Hk Pk−1 (3.20)
Ahora, nótese de la Ecuación (3.18) que Kk aparece implı́citamente en la ecua-

ción anterior. Por lo tanto, se puede reescribir ésta en términos de Kk como
Pk = Pk−1 − Kk Hk Pk−1
= (I − Kk Hk )Pk−1 (3.21)
Comparada con la Ecuación (3.16), esta es una ecuación más simple para la
determinación de Pk ; sin embargo, esta expresión puede causar problemas de
cálculo numérico (v.gr.: de tipo escalamiento), por no ser definida positiva, aun
cuando Pk−1 y Rk sı́ lo sean.
Otra forma alterna consiste en la aplicación del lema de inversión de matrices
(Ecuación (1.72)), para reescribir la ecuación de la medida actualizada de Pk .
Comenzando con la Ecuación (3.20) se obtiene:
Pk = Pk−1 − Pk−1 H⊤ ⊤ −1
k (Hk Pk−1 Hk + Rk ) Hk Pk−1 (3.22)
Haciendo en la Ecuación (1.72), A = P−1 ⊤

k−1 , B = Hk , C = Hk y D = Rk e
igualando término a término con la Ecuación (3.22) se obtiene:
Pk = Pk−1 − Pk−1 H⊤ ⊤ −1
k (Hk Pk−1 Hk + Rk ) Hk Pk−1
= A−1 − A−1 B(CA−1 B + D)−1 CA−1
= (A + BD−1 C)−1 ≡ (P−1 ⊤ −1 −1
k−1 + Hk Rk Hk ) , (3.23)
es decir,
( )−1
Pk = P−1 ⊤ −1
k−1 + Hk Rk Hk (3.24)
Esta ecuación es más complicada para el cálculo de Pk puesto que requiere tres
inversiones de matrices, pero puede ser más ventajosa en algunos casos, como
se verá más adelante. Se puede utilizar la Ecuación (3.24) con el fin de obtener
una ecuación equivalente para la ganancia del estimador Kk . Reescribiendo la
Ecuación (3.18):
Kk = Pk−1 H⊤ ⊤
−1
(3.25)
Premultiplicando el miembro de la derecha por Pk P−1

k , que es equivalente a
multiplicar por la matriz identidad, da
Kk = Pk P−1 ⊤ ⊤
k Pk−1 Hk (Hk Pk−1 Hk + Rk )
−1
(3.26)
Sustituyendo P−1
k a partir de la Ecuación (3.24):
Kk = Pk (P−1 ⊤ −1 ⊤ ⊤
k−1 + Hk Rk Hk )Pk−1 Hk (Hk Pk−1 Hk + Rk )
−1
(3.27)
Nótese el factor Pk−1 H⊤

k que está a la derecha del primer término entre parén-
tesis. Se puede introducir este factor dentro del primer término entre paréntesis
para obtener
Kk = Pk (H⊤ ⊤ −1 ⊤ ⊤
k + Hk Rk Hk Pk−1 Hk )(Hk Pk−1 Hk + Rk )
−1
(3.31)
Ahora se extrae H⊤
k del paréntesis, con lo cual se tiene:
Kk = Pk H⊤ −1 ⊤ ⊤
k (I + Rk Hk Pk−1 Hk )(Hk Pk−1 Hk + Rk )
−1
(3.32)
Algoritmo 3.2 Estimación recursiva por mı́nimos cuadrados.

Ecuaciones de medida.
yk = Hk x + wk
x = constante
(3.28)
E {wk } = 0
E {wk wi⊤ } = Rk δk−i
Estimado inicial del vector constante x, junto con su incertidumbre.
x̂0 = E {x}
(3.29)
P0 = E {(x − x̂0 )(x − x̂0 )⊤ }
Para k ∈ {1, 2, · · · , ∞}, las ecuaciones de estimación por mı́nimos cuadrados
son:
Kk = Pk−1 H⊤ ⊤
−1
= Pk H ⊤ −1
k Rk
x̂k = x̂k−1 + Kk (yk − Hk x̂k−1 )
(3.30)
k
= (P−1 ⊤ −1
k−1 + Hk Rk Hk )
−1
= (I − Kk Hk )Pk−1
Extrayendo como factor común el término R−1

k , se llega a
Kk = Pk H⊤ −1 ⊤ ⊤
k Rk (Rk + Hk Pk−1 Hk )(Hk Pk−1 Hk + Rk )
−1
Con lo cual se obtiene finalmente:
Kk = Pk H⊤ −1
k Rk (3.33)
El procedimiento recursivo por mı́nimos cuadrados se da en el Algoritmo 3.2.

Ejemplo 3.3
Se volverá al problema original de tratar de estimar la resistencia x de un resis-
tor no marcado sobre la base de k medidas ruidosas generadas por un multı́metro.
Sin embargo, no se desea esperar hasta tener todas las medidas para tener un
estimado. Se desea modificar recursivamente el estimado de x cada vez que se

obtenga una nueva medida. En un tiempo de muestreo k la medida es
yk = Hk x + wk
Hk = 1 (3.34)
Rk = E {wk2 }
Para este problema, la matriz de medida Hk es un escalar y la covarianza del
ruido de la medida Rk también es un escalar. Se supone que cada medida tiene la
misma covarianza, ası́ la covarianza del ruido de la medida Rk no es una función
de k y puede escribirse como R. Inicialmente, antes de tomar cualquier medida,
se tiene alguna idea del valor de la resistencia x y esto constituye el estimado
inicial. También se tiene alguna incertidumbre acerca del estimado inicial y esto
conforma la covarianza inicial:
x̂0 = E {x}
P0 = E {(x − x̂0 )(x − x̂0 )⊤ } (3.35)
P0 = E {(x − x̂0 )2 }
Si no se tiene idea en absoluto del valor de la resistencia, entonces P0 → ∞. Si
se está 100 % seguro acerca del valor de la resistencia antes de tomar cualquier
medida, entonces P0 = 0. El conjunto de ecuaciones (3.30) dice como obtener la
ganancia del estimador, el estimado de x y la covarianza de la estimación, después
de la primera medición (k = 1):
Kk = Pk−1 Hk⊤ (Hk Pk−1 Hk⊤ + Rk )−1

K1 = P0 (P0 + R)−1
x̂k = x̂k−1 + Kk (yk − Hk x̂k−1 )
P0
x̂1 = x̂0 + (y1 − x̂0 )
P0 + R
Pk = (I − Kk Hk )Pk−1 (I − Kk Hk )⊤ + Kk Rk Kk⊤
P0 R2 P02 R P0 R
P1 = + =
(P0 + R)2 (P0 + R)2 P0 + R
Repitiendo estos cálculos para encontrar esas cantidades después de la segunda
medida (k = 2) da
P1 P0
K2 = =
P1 + R 2P0 + R
P1 P0 + R P0
x̂2 = x̂1 + (y2 − x̂1 ) = x̂1 + y2 (3.36)
P1 + R 2P0 + R 2P0 + R
P1 R P0 R
P2 = =
P1 + R 2P0 + R
Por inducción, se pueden encontrar expresiones generales para Kk , x̂k y Pk

como sigue:
P0
Kk = (3.37)
kP0 + R
x̂k = x̂k−1 + Kk (yk − x̂k−1 ) = (1 − Kk )x̂k−1 + Kk yk

(k − 1)P0 + R P0
= x̂k−1 + yk
kP0 + R kP0 + R (3.38)
P0 R
Pk =
kP0 + R
Nótese que si x se conoce perfectamente a priori (es decir, antes de tomar
cualquier medida) entonces P0 = 0 y las ecuaciones anteriores muestran que Kk =
0 y x̂k = x̂0 . Esto es, el estimado óptimo de x es independiente de cualquier
medida que se haya obtenido. Por otra parte, si x es totalmente desconocida a
priori, entonces P0 → ∞ y las ecuaciones anteriores muestran que
(k − 1)P0 + R P0 k−1 1
x̂k = lı́m x̂k−1 + yk = x̂k−1 + yk
P0 →∞ kP0 + R kP0 + R k k
1
= [(k − 1)x̂k−1 + yk ] (3.39)
k
En otras palabras, el valor estimado óptimo de x es igual al promedio de las
medidas yk , lo cual se puede escribir como
     
1 ∑ k
1 ∑
k−1
1 1 ∑
k−1
ȳk = yj =  yj + yk  = (k − 1)  yj  + yk 
k k k k−1
j=1 j=1 j=1
1
= [(k − 1)ȳk−1 + yk ] (3.40)
k
Ejemplo 3.4
Supóngase que se desea ajustar una lı́nea recta a un conjunto de datos puntua-
les. El problema de ajuste datos lineales se puede escribir como
yk = x1 + x2 tk + wk
(3.41)
E {wk2 } = Rk
donde tk es la variable independiente (quizá el tiempo), yk es el dato ruidoso. Se

desea encontrar la relación lineal entre yk y tk . En otras palabras se desea estimar
las constantes x1 y x2 . La matriz de medidas se puede escribir como

Hk = [1 tk ]
de modo que la Ecuación (3.41) estará dada por
yk = Hk x + wk (3.42)
El estimador recursivo se inicializa ası́:
x̂0 = E {x}
[ ] [ ]
x̂1,0 E {x1 }
=
x̂2,0 E {x2 }
P0 = E {(x − x̂0 )(x − x̂0 )⊤ }
[ ]
E {(x1 − x̂1,0 )2 } E {(x1 − x̂1,0 )(x2 − x̂2,0 )}
=
E {(x1 − x̂1,0 )(x2 − x̂2,0 )} E {(x2 − x̂2,0 )2 }
El estimador recursivo del vector x de dos elementos se obtiene entonces de la

Ecuación (3.30) como sigue:
Para k = 1, 2, . . .,
Kk = Pk−1 H⊤ ⊤
−1
x̂k = x̂k−1 + Kk (yk − Hk x̂k−1 )

k (3.43)
Ejemplo 3.5
Supóngase que un tanque contiene una concentración x1 del quı́mico 1 y una
concentración x2 del quı́mico 2. Se tiene una instrumentación que puede detectar
la concentración combinada (x1 +x2 ) de los dos quı́micos, pero la instrumentación
no puede distinguir ninguno de los quı́micos por separado.
Se elimina del tanque el quı́mico 2 a través de un proceso de lixiviación de
modo que su concentración decrece en un 1 % por cada medida. La ecuación de
medición está dada por
yk = x1 + 0.99k−1 x2 + wk
[ ]
= 1 0.99k−1 x + wk (3.44)
donde wk es el ruido de la medida, el cual es una variable aleatoria de media cero

y varianza R = 0.01. Supóngase que x1 = 10 y x2 = 5.
Además, supóngase que los estimados iniciales son x̂1 = 8 y x̂2 = 7, con una
varianza del error de estimación P0 = I.
3.6. El filtro de Wiener 89
11
10
9
Estimados
8 x1
7 x2
6
5
4
0 10 20 30 40 50 60
1
P(1,1)
0.8 P(2,2)
Varianza
0.6
0.4
0.2
0
0 10 20 30 40 50 60
Paso de tiempo
Figura 3.1.: Problema del tanque.
Se puede implementar el algoritmo recursivo de mı́nimos cuadrados dado en

las ecuaciones (3.30) para estimar las dos concentraciones. La Figura 3.1 muestra
los estimados de x1 y x2 de la forma como son obtenidos con las mediciones,
junto con las varianzas de los errores de estimación. Se puede observar que luego
de un conjunto de medidas los estimados se van acercando a los valores 10 y 5.
Las varianzas de los errores de estimación tienden asintóticamente a cero, lo cual
significa que se ha incrementado el nivel de confianza de los estimados cuando se
incrementa el número de medidas.
3.6. El filtro de Wiener

En esta sección, se dará una breve reseña del filtro de Wiener. El filtrado de
Wiener es importante desde una perspectiva histórica y todavı́a tiene múltiples
aplicaciones en el procesamiento de la señal y en la teorı́a de las comunicacio-
nes, aunque no se utiliza actualmente en estimación de estados. El filtrado de
Wiener aborda el problema de diseño de un filtro lineal invariante en el tiempo,
para la extracción del ruido en una señal. Aborda el problema desde la pers-
pectiva de dominio de la frecuencia. Antes de plantear el método desarrollado
por Wiener se requiere entender un poco el concepto de ruido blanco y rui-
do coloreado. A continuación se dará una breve exposición de estos conceptos

básicos para la comprensión del filtro de Wiener.
Sea X(t) una variable aleatoria (VA) que representa una señal de ruido, si la
VA X(t1 ) es independiente de la VA X(t2 ) para todo t1 ̸= t2 entonces X(t) se
denomina ruido blanco. De otro modo, X(t) se denomina ruido coloreado. El
contenido de blancura o color de un proceso estocástico se puede caracterizar
por su espectro de potencia. Se define el espectro de potencia Sx (ω)) en sentido
amplio de un proceso estocástico estacionario X(t) como la transformada de
Fourier de la autocorrelación. La autocorrelación es la transformada inversa de
Fourier del espectro de potencia.
∫ ∞
SX (ω) = RX (τ )e−jωτ dt
−∞
∫ ∞ (3.45)
1
RX (ω) = SX (τ )e dω
jωτ
2π −∞
Este es el teorema de Einstein-Wiener-Khinchin (demostrado por Wiener, e

independientemente por Khinchin, en la década de 1930, pero –sólo reciente-
mente reconocido– planteado por Einstein en 1914) [Oppenheim and Verghese,
2010]. El espectro de potencia se refiere a veces como el espectro de densidad
de potencia, la densidad espectral de potencia o la densidad de potencia. La
potencia de un proceso estocástico estacionario en sentido amplio se define
como
∫ ∞
1
PX (ω) = SX (ω)dω (3.46)
2π −∞
El espectro cruzado de potencia de dos procesos estocásticos estacionarios en

sentido amplio X(t) e Y (t) es la transformada de Fourier de la correlación
cruzada:
∫ ∞
SXY (ω) = RXY (τ )e−jωτ dt
−∞
∫ ∞
1
RXY (ω) = SXY (τ )ejωτ dω (3.47)
2π −∞
Definiciones similares son válidas para procesos aleatorios de tiempo discreto.

El espectro de potencia de un proceso aleatorio de tiempo discreto se define
como
∑
∞
SXY (ω) = RX (k)e−jωk ω ∈ [−π, π]
−∞
∫ ∞
1
RXY (ω) = SX (ω)ejkω dω (3.48)
2π −∞
Un proceso estocástico de tiempo discreto X(t) se denomina ruido blanco si
RX (ω) =σ 2 δk (3.49)
donde δk es la función delta de Kronecker. La definición de ruido blanco de

tiempo discreto muestra que no tiene ninguna correlación con sı́ mismo, excepto
en el instante actual. Si X(k) es un proceso de ruido blanco de tiempo discreto,
entonces la VA X(n) no está correlacionada con la VA X(m) a menos que
n = m. Esto muestra que la potencia de un proceso de ruido blanco de tiempo
discreto es igual en todas las frecuencias:
SX (ω) = RX (0) para todo ω ∈ [−π, π] (3.50)
Para un proceso aleatorio de tiempo continuo, el ruido blanco se define de

manera similar. El ruido blanco tiene la misma potencia en todas las frecuencias
SX (ω) = RX (0) para todo ω (3.51)
Sustituyendo esta expresión para SX (ω) en la Ecuación (3.45), se ve que para

el ruido blanco de tiempo continuo
RX (τ ) = RX (0)δ(τ ) (3.52)
donde δ(τ ) es la función de impulso de tiempo continuo. Es decir, δ(τ ) es la

función delta de Dirac.
Ejemplo 3.6
Supóngase que un proceso estocástico estacionario de media cero tiene la función
de autocorrelación
RX (τ ) = σ 2 e−β|τ | (3.53)
donde β es un número real positivo. El espectro de potencia se calcula de la
Ecuación (3.45) como

∫ ∞
SX (ω) = σ 2 e−β|τ | e−jωτ dt
−∞
∫0 ∫ ∞
= 2 (β−jω)τ
σ e dτ + σ 2 e−(β+jω)τ dτ
−∞ 0
σ2 σ2
= +
β − jω β + jω
2σ 2 β
= 2 (3.54)
β + ω2
La varianza del proceso estocástico se calcula como
∫ ∞
1 2σ 2 β
E {X } =
2
dω
2π −∞ β 2 + ω 2
[ ]∞
σ2β 1 −1 ω
= tan
π β β −∞
=σ 2
=RX (0) (3.55)
Ahora bien, para plantear el filtro de Wiener, se requiere responder la si-

guiente pregunta: ¿Cómo cambia el espectro de potencia de un proceso esto-
cástico x(t) cuando pasa a través de un sistema lineal invariante en el tiempo
(LTI) con respuesta al impulso g(t)? La salida y(t) del sistema está dada por
la convolución de la respuesta de impulso con la entrada:
y(t) = g(t) ∗ x(t) (3.56)
Puesto que el sistema es invariante en el tiempo, un cambio de tiempo en la

entrada resulta en un cambio igual de tiempo en la salida:
y(t + α) = g(t) ∗ x(t + α) (3.57)
multiplicando las dos ecuaciones anteriores y escribiendo las convoluciones co-

mo integrales da
∫ ∫
y(t)y(t + α) = g(τ )x(t − τ )dτ g(γ)x(t + α − γ)dγ (3.58)
Tomando el valor esperado en ambos lados de la ecuación anterior da la auto-

correlación de y(t) como función de la autocorrelación de x(t):
∫ ∫
E {y(t)y(t + α)} = g(τ )g(γ)E {x(t − τ )x(t + α − γ)}dτ dγ (3.59)
lo cual se escribirá en notación abreviada como

∫ ∫
Ry (α) = g(τ )g(γ)Rx (α + τ − γ)dτ dγ (3.60)
Tomando la transformada de Fourier de la anterior ecuación:

∫ ∫ ∫ ∫
−jωα
Ry (α)e dα = g(τ )g(γ)Rx (α + τ − γ)e−jωα dτ dγdα (3.61)
Se define una nueva variable de integración β = α + τ − γ y se reemplaza α en

la ecuación anterior para obtener:
∫ ∫ ∫
Sy (ω) = g(τ )g(γ)Rx (β)e−jωβ e−jωγ e−jωτ dτ dγdβ
= G(−ω)G(ω)Sx (ω) (3.62)
En otras palabras, el espectro de potencia de la salida y(t) es función de la

transformada de Fourier de la respuesta al impulso del sistema, G(ω) y al
espectro de potencia de entrada x(t).
Ahora se puede plantear el problema de la siguiente manera: Diseñar un
filtro estable LTI para extraer una señal de ruido. Las cantidades de interés en
este problema están dadas como
x(t) = señal libre de ruido

v(t) = ruido aditivo
g(t) = filtro de respuesta al impulso (para ser diseñado)
x̂(t) = salida del filtro [estimado de x(t)]
e(t) = x(t) − x̂(t) (error de estimación) (3.63)
Estas cantidades están representadas en la Figura 3.2, de la cual se ve que

Figura 3.2.: Representación del filtro de Wiener.
x̂(t) = g(t) ∗ [x(t) + v(t)]

X̂(ω) = G(ω)[X(ω) + V (ω)]
E(ω) = X(ω) − X̂(ω)
= X(ω) − G(ω)[X(ω) + V (ω)]
= [1 − G(ω)]X(ω) − G(ω)V (ω) (3.64)
Se ve que la señal de error e(t) es la superposición del sistema [1 − G(ω)]

actuando sobre la señal x(t), y el sistema G(ω) actuando sobre la señal v(t).
Por lo tanto, de la Ecuación (3.62), se obtiene
Se (w) = [1 − G(w)][1 − G(−ω)]Sx (ω) − G(ω)G(−ω)Sv (ω) (3.65)
La varianza del error de estimación se obtiene de la Ecuación (3.45) como

∫
1
E {e (t)} =
2
Se (ω)dω (3.66)
2π
Para encontrar el filtro óptimo G(ω) se necesita minimizar E {e2 (t)}, lo cual
significa que se necesita conocer Sx (ω) y Sv (ω), las propiedades estadı́sticas de
la señal x(t) y el ruido v(t).
3.6.1. Optimización del filtro paramétrico

Con el fin de simplificar el problema de la determinación del filtro óptimo
G(ω), se puede asumir que el filtro óptimo es un filtro pasa bajo de primer
orden, –estable y causal– con un ancho de banda 1/T a ser determinado por
optimización paramétrica. (Un sistema causal es aquel cuya salida depende sólo
de las entradas presentes y futuras. Los sistemas del mundo real son siempre
causales, pero un filtro que se utiliza para postprocesado puede ser no causal.)
1
G(ω) = (3.67)
1 + T jω
Esto puede ser una suposición no válida, pero reduce el problema a un problema
de optimización paramétrica. Con el fin de simplificar aún más el problema,
supóngase que Sx (ω) y Sv (ω) están dados de la siguiente manera:
2σ 2 β
Sx (ω) =
ω2 + β 2 (3.68)
Sv (ω) = A
En otras palabras, el ruido v(t) es blanco. De la Ecuación (3.65) se obtiene

( )( )( ) ( )( )
T jω −T jω 2σ 2 β 1 1
Sx (ω) = − A
1 + T jω 1 − T jω ω2 + β 2 1 + T jω 1 − T jω
(3.69)
Ahora se puede sustituir Se (ω) en la Ecuación (3.66) y derivar con respecto a

T para obtener
√
A
Topt = √ √ (3.70)
σ 2β − β A
Ejemplo 3.7
Si A = σ = β = 1 entonces la constante tiempo óptimo del filtro se calcula como
1
T =√ ≈ 2.4142
2−1
y el filtro óptimo está dado como
1 1/T
G(ω) = =
1 + T jω 1/T + jω
1 −t/T
g(t) = e t≥0
T
Convirtiendo este filtro al dominio del tiempo resulta en

1
x̂˙ = (−x̂ + y)
T
3.6.2. Optimización del filtro general
Ahora se toma un enfoque más general para encontrar el filtro óptimo. El valor
esperado del error de estimación puede calcularse como
e(t) = x(t) − x̂(t)

e2 (t) = x2 (t) − 2x(t)x̂(t) + x̂2 (t)
∫
= x (t) − 2x(t) g(u)[x(t − u) + v(t − u)]du+
2
∫ ∫
+ g(u)g(γ)[x(t − u) + v(t − u)][x(t − v) + v(t − v)]dudγ
(3.71)
Aplicando el concepto del valor esperado a la Ecuación (3.71) se obtiene:

∫
E {e (t)} = E {x (t)} − 2 g(u)Rx (u)du+
2 2
∫ ∫
+ g(u)g(γ)[Rx (u − v) + Rv (u − v)]dudγ (3.72)
Ahora se puede usar un enfoque del cálculo variacional [Weinstock, 1974] para
encontrar el filtro g(t) que minimize E {e2 (t)}. Se reemplaza g(t) en la anterior
ecuación con g(t) + ϵη(t), donde ϵ es algún número pequeño, y η(t) es una per-
turbación arbitraria en g(t). Aplicando los conceptos del cálculo de variaciones
los cuales establecen que se puede minimizar E {e2 (t)} haciendo

∂E {e2 (t)}
=0 (3.73)
∂ϵ ϵ=0
y ası́ resolver para hallar el valor de g(t) óptimo. De la Ecuación (3.72), se

puede escribir
∫
Re (0) = Rx (0) − 2 [g(u) + ϵη(u)]Rx (u)du +
∫ ∫
[g(u) + ϵη(u)][g(γ) + ϵη(γ)][Rx (u − γ) + Rv (u − γ)]dudγ (3.74)
Tomando la derivada parcial con respecto a ϵ se obtiene

∫ ∫ ∫
∂Re (0)
= −2 η(u)Rx (u)du + [η(u)g(γ) + η(γ)g(u) + 2ϵη(u)η(γ)]×
∂ϵ
× [Rx (u − v) + Rv (u − γ)]dudγ
∫
∂Re (0)
= −2 η(τ )Rx (τ )dτ +
∂ϵ ϵ=0
∫ ∫
η(τ )g(γ)[Rx (τ − γ) + Rv (τ − γ)]dτ dγ+
∫ ∫
η(τ )g(u)[Rx (u − τ ) + Rv (u − τ )]dτ du (3.75)
Para un proceso estocástico estacionario en sentido amplio x(t) se cumple que

Rx (τ − u) = Rx (u − τ ) [es decir, Rx (τ ) es par] [Papoulis, 1991]. En este caso,
la anterior ecuación puede escribirse como
∫
0 = −2 η(τ )Rx (τ )dτ +
∫ ∫
2 η(τ )g(u)[Rx (u − τ ) + Rv (u − τ )]dτ du (3.76)
Esto da la condición necesaria para la optimalidad del filtro g(t) como sigue:
∫ [ ∫ ]
η(τ ) −Rx (τ ) + g(u)[Rx (u − τ ) + Rv (u − τ )]du dτ = 0 (3.77)
Se requiere resolver esta ecuación para g(t) y ası́ encontrar el filtro óptimo.
3.6.3. Optimización del filtro no causal

Si no se hace alguna restricción sobre la causalidad del filtro, entonces g(t)
puede ser no cero para t < 0, lo cual quiere decir que la perturbación η(t)
puede también ser no cero para t < 0. Esto significa que la cantidad dentro de
los corchetes en la Ecuación (3.77) debe ser cero. Lo que resulta en
∫
Rx (τ ) = g(u)[Rx (u − τ ) + Rv (u − τ )]du = g(τ ) ∗ [Rx (τ ) + Rv (τ )]
Sx (ω) = G(ω)[Sx (ω) + Sv (ω)]

Sx (ω)
G(ω) = (3.78)
Sx (ω) + Sv (ω)
La función de transferencia del filtro óptimo es la relación del espectro de

potencia de la señal x(t) con respecto a la suma de los espectros de potencia
de x(t) y el ruido v(t).
Ejemplo 3.8
Considérese el sistema del Ejemplo 3.7 con A = β = σ = 1. El espectro de
potencia de la señal y del ruido están dados como
2
Sx (ω) =
ω2 +1
Sv (ω) = 1
De la Ecuación (3.78) se obtiene el filtro no causal óptimo como
( √ )
2 1 2 3
G(ω) = 2 =√
ω +3 3 ω2 + 3
1 √
g(t) = √ e− 3|t| ≈ 0.58e−0.58|t| , t ∈ (−∞, ∞)
3
Además, para obtener una representación en el dominio del tiempo del filtro, se
realiza una expansión en fracciones parciales de G(ω) a fin de encontrar la parte
causal y la parte anti-causal del filtro:
1 1
G(ω) = √ √ +√ √
3(jω + 3) 3(−jω + 3)
| {z } | {z }
filtro causal filtro anti-causal
De esto se ve que
1 1
X̂(ω) = √ √ Y (s) − √ √ Y (s)
3(jω + 3) 3(jω − 3)
= X̂c (ω) + X̂a (ω)
X̂c (ω) y X̂a (ω) (definidos por la anterior ecuación) son la parte causal y anti-
causal de X̂(ω), respectivamente. En el dominio del tiempo, esto puede escribirse
como
x̂(t) = x̂c (t) + x̂a (t)
√ √
x̂˙ c (t) = − 3x̂c + y/ 3
√ √
x̂˙ a (t) = 3x̂a − y/ 3
La ecuación x̂˙ c (t) corre hacia adelante en el tiempo y es por lo tanto causal y
estable. La ecuación x̂˙ a (t) corre hacia atrás en el tiempo y es por lo tanto anti-
causal y estable. (Si ésta corriera hacia adelante en el tiempo, serı́a inestable).
3.6.4. Optimización del filtro causal

Si se requiere un filtro causal para estimación de señal, entonces g(t) = 0 para
t < 0, y la perturbación η(t) debe ser igual a 0 para t < 0. En este caso, la
Ecuación (3.77) da
∫
Rx (τ ) − g(u)[Rx (u − τ ) + Rv (u − τ )]du = 0, t≥0 (3.79)
La aplicación inicial de esta ecuación fue en el campo de la astrofı́sica en 1894

[Sen and Wilson, 1990]. Se pensaba que era imposible tener soluciones explı́ci-
tas para esta ecuación, pero N. Wiener y E. Hopf se hicieron inmediatamente
famosos cuando la resolvieron en 1931. Su solución fue tan impresionante que
se conoce como la ecuación de Wiener–Hopf.
Para resolver la Ecuación (3.79), se postula alguna función a(t) que es arbi-
traria para t < 0, pero es igual a 0 para t ≥ 0. Entonces se obtiene

∫
Rx (τ ) − g(u)[Rx (u − τ ) + Rv (u − τ )]du = a(τ )
Sx (ω) − G(ω)[Sx (ω) + Sv (ω)] = A(ω) (3.80)
Para facilitar la notación, se hace la siguiente definición
Sxv (ω) = Sx (ω) + Sv (ω) (3.81)
Entonces la Ecuación (3.80) queda como

−
Sx (ω) − G(ω)Sxv
+
(ω) + Sxv (ω) = A(ω) (3.82)
+
donde Sxv es la parte de Sxv que tiene todos sus polos y ceros en el semiplano
izquierdo (SPI) (y por lo tanto corresponde a una función de tiempo causal) y
−
Sxv es la parte de Sxv que tiene todos sus polos y ceros en el semiplano derecho
(SPD) (y por lo tanto corresponde a una función de tiempo anti-causal). La
Ecuación (3.82) puede escribirse como
Sx (ω) A(ω)
+
G(ω)Sxv (ω) = −
− − (3.83)
Sxv (ω) Sxv (ω)
El término del lado izquierdo corresponde a una función de tiempo causal

[asumiendo que g(t) es estable]. El último término al lado derecho corresponde
a función de tiempo anti-causal. Por lo tanto,
+ Sx (ω)
G(ω)Sxv (ω) = parte causal de −
Sxv (ω)
[ ] (3.84)
1 Sx (ω)
G(ω) = + (ω)
parte causal de − (ω)
Sxv Sxv
Esto da la función de transferencia del filtro causal óptimo.
Ejemplo 3.9
Considérese el sistema discutido en el Ejemplo 3.8, con A = β = σ = 1.
Para este caso se tiene:

2
Sx (ω) =
ω2 +1
Sv (ω) = 1
ω2 + 3
Sxv (ω) =
ω2 + 1
Dividiendo esto en sus factores causal y anti-causal da
( √ )( √ )
jω + 3 −jω + 3
Sxv (ω) =
jω + 1 −jω + 1
| {z }| {z }
+ −
Sxv (ω) Sxv (ω)
Sx (ω) 2(−jω + 1)
− = √
Sxv (ω) 2
(ω + 1)(−jω + 3)
2
= √
(−jω + 3)(jω + 1)
√ √
3−1 3−1
= + √
jω + 1 −jω + 3
| {z } | {z }
parte causal parte anti-causal
La Ecuación (3.84) da
( ) (√ ) ( √ )
jω + 1 3−1 3−1
G(ω) = √ = √
jω + 3 jω + 1 jω + 3
√ √
g(t) = ( 3 − 1)e− 3t , t≥0
Esto da la función de transferencia y la respuesta al impulso del filtro óptimo

cuando se requiere la causalidad.
3.6.5. Comparación
Comparando los tres ejemplos de diseño de filtro óptimo presentados en esta
sección (Ejemplos 3.7, 3.8 y 3.9), se puede demostrar que los valores esperados
de los errores cuadráticos medios de la filtro son las siguientes [Brown and
Hwang, 2012]:
Método de optimización de parámetros: E {e2 (t)} = 0.914
Filtro causal de Wiener: E {e2 (t)} = 0.732

Filtro no causal de Wiener E {e2 (t)} = 0.577
Como era de esperarse, el error de estimación disminuye cuando se tienen
menos restricciones en el filtro. Sin embargo, la eliminación de restricciones
hace que el problema de diseño de filtros sea más difı́cil. El filtro de Wiener no
es muy manejable para procesos de estimación de estado debido a la dificultad
en la extensión a problemas MIMO con descripciones de variables de estado,
y la dificultad en la aplicación a señales con propiedades estadı́sticas variables
en el tiempo.
3.7. Resumen
En este capı́tulo se discutió la estimación por mı́nimos cuadrados en un par de
contextos diferentes. Primero se derivó un método para estimar vector cons-
tante sobre la base de varias mediciones ruidosas de ese vector. De hecho, las
mediciones no tienen que ser medidas directas del vector constante, pero pue-
den ser mediciones de alguna combinación lineal de los elementos de ese vector
constante. Además, el ruido asociado con cada medición no tiene que ser el
mismo. En la técnica de estimación por mı́nimos cuadrados que se deriva, se
asume que el ruido de medición es blanco de media cero (no correlacionado de
un paso de tiempo al siguiente) y que se conoce su varianza. A continuación,
se extiende el estimador de mı́nimos cuadrados a una formulación recursiva,
en la que el esfuerzo de cálculo sigue siendo el mismo en cada paso de tiempo,
independientemente del número total de mediciones que sean procesadas. La
estimación por mı́nimos cuadrados de un vector constante forma parte de la
fundamentación del desarrollo del filtro de Kalman, que se va a derivar más
adelante.
Finalmente, se da un breve resumen de los conceptos correspondientes a los
filtros de Wiener, que si bien plantearon paradigmas difı́ciles de superar, hoy
dı́a no se aplican ampliamente debido a dificultades en el desarrollo de los
procedimientos, ya que para su aplicación se requieren señales estacionarias
y eventualmente monovariables. Para los casos donde hay señales estadı́sticas
variables en el tiempo o de variables múltiples, el mejor estimador es el filtro
de Kalman.
Bibliografı́a
Brown, R. G. and Hwang, P. Y. C. (2012). Introduction to random signals and applied

Kalman filtering: with MATLAB exercises. 111 River Street, Hoboken, NJ 07030-5774.
USA, 4a edition.
Crassidis, J. L. and Junkins, J. L. (2012). Optimal Estimation of Dynamic Systems. 6000
Broken Sound Parkway NW, Suite 300 Boca Raton, FL 33487-2742, USA., 2a edition.
Gelb, A. (2001). Applied Optimal Estimation. The MIT Press, Cambridge, MA, USA, 16a
impresión.
Grewal, M. S. and Andrews, A. P. (2008). Kalman Filtering: Theory and Practice Using
MATLAB. John Wiley & Sons, Inc., Hoboken, New Jersey, EE UU., 3a edition.
Kailath, T. (1981). Lectures on Wiener and Kalman Filtering. Springer–Verlag, New York,
USA.
Kalman, R. E. (1960). A new approach to linear filtering and prediction problems. Tran-
sactions of the ASME–Journal of Basic Engineering, 82(Series D): 35–45.
Oppenheim, A. V. and Verghese, G. C. (2010). Signals systems, and inference. Class Notes
6.011, Massachusetts Institute of Technology, Cambridge, MA, USA.
Papoulis, A. (1991). Probability, Random Variables, and Stochastic Processes. McGraw–Hill,
Inc.
Sen, K. K. and Wilson, S. J. (1990). Radiative transfer in curved media. World Scientific
Publishing Co. Pte. Ltd., 687 Hartwell Street, Teaneck, NJ 07666. USA.
Weinstock, R. (1974). Calculus of Variations. With Applications to Physics and Engineering.
180 Varick Street, New York, N. Y. 10014. USA, 2a edition.
103
Capı́tulo 4
Filtro de Kalman discreto
4.1. Introducción
E n este capı́tulo, se comienza con la descripción matemática de un sistema

dinámico y luego se derivan las ecuaciones que rigen la propagación de la
media y la covarianza de estado. Este material es fundamental para el algoritmo
de estimación de estado (el filtro de Kalman) que se va a obtener en la segunda
parte del capı́tulo. La primera sección cubre los sistemas de tiempo discreto. A
continuación se estudian los sistemas de datos muestreados, los cuales son los
tipos más comunes de sistemas que se encuentran en el mundo real. En este
tipo de sistemas, la dinámica se describe por ecuaciones diferenciales de tiempo
continuo, pero las señales de medición y de control son de tiempo discreto (por
ejemplo, el control basado en un computador digital y las mediciones obtenidas
en tiempo discreto).
4.2. Sistemas discretos en el tiempo

Supóngase que se tiene el siguiente sistema lineal discreto en el tiempo:
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1 (4.1)
donde uk es una entrada conocida y vk es ruido blanco gaussiano con promedio

cero y covarianza Qk . ¿Cómo cambia con el tiempo la media del estado xk ? Si
105
106 Capı́tulo 4. Filtro de Kalman discreto
se toma el valor medio en ambos lados de la Ecuación (4.1) se obtiene
x̄k = E {xk } = Fk−1 x̄k−1 + Gk−1 uk−1 (4.2)
¿Cómo cambia con el tiempo la covarianza de xk ? Se pueden usar las ecuaciones

(4.1) y (4.2) para obtener
(xk − x̄k )(xk − x̄k )⊤ =

= (Fk−1 xk−1 + Gk−1 uk−1 + vk−1 − x̄k )(Fk−1 xk−1 + Gk−1 uk−1 + vk−1 − x̄k )⊤
= (Fk−1 (xk−1 − x̄k−1 ) + vk−1 )(Fk−1 (xk−1 − x̄k−1 ) + vk−1 )⊤
= Fk−1 (xk−1 − x̄k−1 )(xk−1 − x̄k−1 )⊤ F⊤ ⊤
k−1 + vk−1 vk−1 +
⊤
+Fk−1 (xk−1 − x̄k−1 )vk−1 + vk−1 (xk−1 − x̄k−1 )⊤ F⊤ k−1 (4.3)
Por lo tanto, se obtiene la covarianza de xk como el valor esperado de la anterior

expresión. Ya que (xk−1 − x̄k−1 ) no está correlacionada con vk−1 , se obtiene
Pk = E {(xk − x̄k )(xk − x̄k )⊤ }

= Fk−1 E {(xk−1 − x̄k−1 )(xk−1 − x̄k−1 )⊤ }F⊤ ⊤
k−1 + E {vk−1 vk−1 }
= Fk−1 Pk−1 F⊤
k−1 + Qk−1 . (4.4)
Esta es llamada la ecuación de Lyapunov de tiempo discreto o ecuación de

Stein. Se verá más adelante que las ecuaciones (4.2) y (4.4) son fundamentales
en la deducción del filtro de Kalman. Es interesante considerar las condiciones
bajo las cuales la ecuación de Lyapunov de tiempo discreto tiene una solución
de estado estacionario. Esto es, supóngase que Fk = F es una constante y
Qk = Q también es una constante. Entonces se tiene el siguiente teorema cuya
prueba se encuentra en [Kailath et al., 2000].
Teorema 4.1
Considérese la ecuación P = FPF⊤ + Q donde F y Q son matrices reales. Los
autovalores de la matriz F se denotan por λi (F).
1. Existe una solución única para P si y solo si λi (F)λj (F) ̸= 1 para todo i, j.
Esta solución única es simétrica.
2. Nótese que la anterior condición incluye el caso de F estable, porque si F es

estable entonces todos sus autovalores son menores que uno en magnitud,
de modo que λi (F)λj (F) ̸= 1 para todo i, j. Por lo tanto, se ve que si F
es estable entonces la ecuación de Lyapunov de tiempo discreto tiene una
4.2. Sistemas discretos en el tiempo 107
solución P que es única y simétrica. En este caso, la solución puede ser

escrita como
∞
∑
P= Fi Q(F⊤ )i (4.5)
i=0
3. Si F es estable y Q > 0 o Q ≥ 0, entonces la solución única P es simétrica

y definida positiva o semidefinida positiva.
4. Si F es estable, Q ≥ 0 y (F, Q1/2 ) es controlable, entonces P es única,

simétrica y definida positiva, Nótese que Q1/2 , se considera aquı́ como una
( )⊤
matriz tal que (Q1/2 ) Q1/2 = Q.
Ahora se solucionará el sistema lineal de la Ecuación (4.1)
∑
k−1
xk = Fk,0 x0 + (Fk,i+1 vi + Fk,i+1 Gi ui ) (4.6)
i=0
La matriz Fk,i es la matriz de transición de estado del sistema y se define como


 Fk−1 Fk−2 · · · Fi
 k>i
Fk,i = I k=i (4.7)


0 k<i
Nótese de la Ecuación (4.6) que xk es una combinación lineal de x0 , {vi } y

{ui }. Si se conoce la secuencia de entrada {ui }, entonces es una constante y
se puede considerar como una secuencia de variables aleatorias gaussianas con
covarianza cero.
Si x0 y {vi } son desconocidas pero son variables aleatorias gaussianas, enton-
ces xk , de la Ecuación (4.6) es una combinación lineal de variables aleatorias
gaussianas. Por lo tanto, xk es en sı́ misma una variable aleatoria gaussiana.
Sin embargo, se puede calcular la media y la covarianza de xk en las ecuaciones
(4.2) y (4.4). Por lo tanto,
xk ∼ N (x̄k , Pk ). (4.8)
Esto caracteriza a xk en un sentido estadı́stico puesto que una variable aleatoria

gaussiana está completamente caracterizada por su media y su covarianza.
Ejemplo 4.1
[1 ]
2 0
xk+1 = x + vk
0 12
vk ∼ (0, Q)
[ ]
1 1
Q=
0 1
Usar la Ecuación (4.5) para encontrar la covarianza de estado estacionario del

vector de estado.
Solución:
La covarianza está dada por
∞
∑ ∞ [1
∑ ][ ]i [ ]i
i ⊤ i 1 1 12 0
2 0
P= F Q(F ) = =
0 12 0 1 0 1
2
i=0 i=0
[ ] [1 1] [ 1 1
] [1 1
]
1 1
1 + ···
= + 4 4 + 16 16 64 64
1 +
0 1 0 14 0 16 0 64
[ ] ( )0 [ ] ( )1 [ ] ( )2 [ ] ( )3
1 1 1 1 1 1 1 1 1 1 1 1
= + + + + ···
0 1 4 0 1 4 0 1 4 0 1 4
[ ] ∞ ( )i
1 1 ∑ 1
=
0 1 4
i=0
La sumatoria infinita del miembro de la derecha corresponde a una serie geo-

métrica con razón r = 1/4,
( )i
1 − ri 1 − 14 4
Si = lı́m = lı́m =
i→∞ 1 − r i→∞ 1 − 1 3
4
Por lo tanto, la covarianza en estado estacionario será:
4 4

3 3
P= 
4
0 3
4.2. Sistemas discretos en el tiempo 109
Ejemplo 4.2
Un sistema lineal describe la población de un predador x1 y la de su presa x2 los
cuales pueden ser expresados como
x1,k+1 = x1,k − 0.8x1,k + 0.4x2,k + v1,k

(4.9)
x2,k+1 = x2,k − 0.4x1,k + uk + v2,k
En la primera ecuación, se puede ver que la población del predador se reduce a
causa de su superpoblación, pero la población de la presa hace que la población
del predador se incremente. En la segunda ecuación, se ve que la población de
la presa decrece debido a la población del predador y se incrementa debido a
un suministro externo de alimento uk . Las poblaciones también están sujetas a
perturbaciones aleatorias (con sus respectivas varianzas 1 y 2) debido a factores
ambientales. Este sistema se puede escribir en forma de variables de estado como
[ ] [ ]
0.2 0.4 0
xk+1 = xk + u + vk
−0.4 1 1 k (4.10)
vk ∼ (0, Q) Q = diag(1, 2)
20
Población media
x
1
x
2
10
0
0 5 10 15 20 25
Varianza de la población
15 P(1,1)
P(1,2)
10 P(2,2)
0
0 5 10 15 20 25
Pasos de tiempo
Figura 4.1.: Problema predador–presa.

Las ecuaciones (4.2) y (4.4) describen como cambian con el tiempo, la media
y la covarianza de la población. La Figura 4.1 muestra los valores promedios y
los elementos de la matriz de covarianza (p12 = p21 por simetrı́a de la matriz de

covarianza), para los primeros pasos de tiempo cuando uk = 1 y las condiciones
iniciales se establecen como x̄ = [5 20]⊤ y P0 = diag(10, 10). Se ve que la media
y la covarianza finalmente alcanzan valores de estado estacionario dados por
[ ] [ ]
2.5 2.88 3.08
x̄ = P=
5 3.08 7.96
Nótese que, puesto que F para este ejemplo es estable y Q es definida positi-
va, entonces el Teorema 4.1 garantiza que P tiene una solución única de estado
estacionario definida positiva.
4.2.1. Procesos con ruido ponderado
En la Ecuación (4.1), se mostró el ruido del proceso entrando directamente a

la dinámica del sistema. Esta es la convención que se usa acá. Sin embargo,
muchas veces el ruido del proceso se multiplica primero por una matriz antes
de entrar en la dinámica del sistema. Es decir, se multiplica por un factor de
escala o función de peso, esto es,
xk = Fk−1 xk−1 + Gk−1 uk−1 + Lk−1 v̌k−1 , v̌k ∼ (0, Q̌k ) (4.11)
¿Cómo se puede poner esto en la forma convencional de la Ecuación (4.1)?

Nótese que el término de la derecha de la Ecuación (4.11) tiene una covarianza
dada por
{ } { } ⊤
E (Lk−1 v̌k−1 )(Lk−1 v̌k−1 )⊤ = Lk−1 E v̌k−1 v̌k−1
⊤
Lk−1
= Lk−1 Q̌k−1 L⊤
k−1 (4.12)
Por lo tanto, la Ecuación (4.11) es equivalente a la expresión
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1 , vk ∼ (0, Lk Q̌k L⊤

k) (4.13)
El mismo tipo de transformación se puede hacer con las ecuaciones de medida

ruidosa. Esto es, la ecuación de la medida
yk = Hk xk + Mk w̌k , w̌k ∼ (0, Řk ) (4.14)

4.3. Sistemas con datos muestreados 111
es equivalente a la ecuación de medición
yk = Hk xk + wk , wk ∼ (0, Mk Řk M⊤
k) (4.15)
4.3. Sistemas con datos muestreados

Ahora se estudiarán los sistemas con datos muestreados, los cuales son los más
frecuentemente encontrados en la práctica. Un sistema con datos muestreados
es aquel cuya dinámica se describe por una ecuación diferencial de tiempo
continuo, pero la entrada solo cambia a instantes discretos de tiempo, debido a
que está generada, v.gr., por un computador digital. Por otro lado, solo interesa
estimar los estados en instantes discretos de tiempo. Se debe obtener la media
y la covarianza de los estados solamente en instantes discretos de tiempo. La
dinámica en tiempo continuo se describe como
ẋ = Ax + Bu + v (4.16)
Se sabe que la solución para x(t) en algún tiempo arbitrario tk , está dada por
∫ tk
A(tk −tk−1 )
x(tk ) = e x(tk−1 ) + eA(tk −τ ) [B(τ )u(τ ) + v(τ )]dτ (4.17)
tk−1
Se supone que u(t) = uk para t ∈ [tk , tk+1 ]; esto es, el control u(t) es constante
a tramos.
Definiendo
T = tk − tk−1
xk = x(tk ) (4.18)
uk = u(tk )
∫ tk ∫ tk
A(tk −τ )
xk = e AT
xk−1 + e B(τ )dτ uk−1 + eA(tk −τ ) v(τ )dτ (4.19)
tk−1 tk−1
Ahora, si se define Fk y Gk como
Fk = eAT
∫ tk+1
(4.20)
Gk = eA(tk+1 −τ ) B(τ )dτ
tk
entonces la Ecuación (4.19) queda

∫ tk
xk = Fk−1 xk−1 + Gk−1 uk−1 + eA(tk −τ ) v(τ )dτ (4.21)
tk−1
La exponencial eA(tk −τ ) es la matriz de transición de estado del sistema desde el

tiempo τ al tiempo tk . Tomando la media de la ecuación anterior y recordando
que la media de v(t) es cero, se obtiene
x̄k = E {xk } = Fk−1 x̄k−1 + Gk−1 uk−1 (4.22)
Se puede usar la ecuación anterior para obtener la covarianza de estado como
Pk = E {(xk − x̄k )(xk − x̄k )⊤ } =

{( ∫ )
tk
=E Fk−1 xk−1 + Gk−1 uk−1 + eA(tk −τ ) v(τ )dτ − x̄k ×
tk−1
( ∫ )⊤
tk 
Fk−1 xk−1 + Gk−1 uk−1 + eA(tk −τ ) v(τ )dτ − x̄k
tk−1 
( )(∫ )⊤
 ∫ tk tk 
= Fk−1 Pk−1 F⊤
k−1 + E eA(tk −τ ) v(τ )dτ eA(tk −τ )
v(τ )dτ
 tk−1 tk−1 
∫ ∫ tk
⊤
{ } ⊤
= Fk−1 Pk−1 Fk−1 + eA(tk −τ ) E v(τ )v⊤ (α) eA (tk −τ ) dτ dα (4.23)
tk−1
Ahora, si se asume que v(t) es ruido blanco de tiempo continuo con una cova-
rianza Qc (t), se ve que
{ }
E v(τ )v⊤ (α) = Qc (τ )δ(τ − α) (4.24)
Esto significa que se puede usar la propiedad de filtrado de la función impulso

para escribir la Ecuación (4.23) como
∫ tk
⊤ ⊤
Pk = Fk−1 Pk−1 Fk−1 + eA(tk −τ ) Qc (τ )eA (tk −τ ) dτ
tk−1
= Fk−1 Pk−1 F⊤
k−1 + Qk−1 (4.25)
donde Qk−1 está definida por

∫ tk
⊤
Qk−1 , eA(tk −τ ) Qc (τ )eA (tk −τ ) dτ (4.26)
tk−1
En general, es difı́cil calcular Qk−1 , pero para valores pequeños de (tk − tk−1 )
se puede obtener
eA(tk −τ ) ≈ I para τ ∈ [tk−1 , tk ]

(4.27)
Qk−1 ≈ Qc (tk )T
Ejemplo 4.3
Supóngase que se tiene un sistema dinámico de tiempo continuo de primer orden
dado por la ecuación
ẋ = ax + v
(4.28)
E {v(t)v(t + τ )} = qc δ(τ )
Para describir la mayorı́a de los procesos fı́sicos simples se puede emplear ecuacio-
nes de primer orden. Por ejemplo, esta ecuación describe el comportamiento de la
corriente a través de un circuito serie RL que está excitado por una tensión aleato-
ria v(t), donde a = −R/L. Supóngase que se está interesado en obtener la media
y la covarianza del estado x(t) cada T unidades de tiempo; esto es, tk − tk−1 = T.
Para este simple ejemplo escalar, se puede calcular explı́citamente Qk−1 en la
∫ tk
Qk−1 = ea(tk −τ ) qc ea(tk −τ ) dτ
tk−1
∫ tk
=e 2atk
qc e−2aτ dτ
tk−1
[ −2atk−1 ]
2atk e − e−2atk
=e qc
2a
qc [ 2a(tk −tk−1 ) ]
= e −1
2a
qc [ 2aT ]
Qk−1 = e −1 (4.29)
2a
Para valores pequeños de T, se puede expandir la ecuación anterior en una serie
de Taylor alrededor de T = 0, para obtener

qc [ 2aT ]
Qk−1 = e −1
2a [( ) ]
qc (2aT)2
= 1 + 2aT + + ··· − 1
2a 2!
qc
Qk−1 ≈ [1 + 2aT − 1]
2a
= qc T
Esto coincide con la Ecuación (4.27), la cual establece que si T es pequeño en-
tonces Qk−1 ≈ qc T. El valor medio del estado muestreado se calcula de la Ecua-
ción (4.22) (nótese que la entrada de control en la Ecuación (4.28) es cero) como
x̄k = Fk−1 x̄k−1 + Gk−1 uk−1
= ea(tk −tk−1 ) x̄k−1 + 0
= eaT x̄k−1
= ekaT x̄0
Se puede observar que si a > 0, es decir, el sistema es inestable, entonces la media
x̄k se incrementará ilimitadamente (a menos que x̄0 = 0). Sin embargo, si a < 0,
es decir, el sistema es estable, entonces la media x̄k caerá a cero independien-
temente del valor de x̄0 . La covarianza del estado muestreado se calcula de la
⊤
Pk = Fk−1 Pk−1 Fk−1 + Qk−1
≈ (1 + 2aT)Pk−1 + qc T
Pk − Pk−1 = (2aPk−1 + qc )T
De la ecuación anterior, se puede ver que Pk alcanza el estado estacionario (es

qc
decir, Pk − Pk−1 = 0) cuando Pk−1 = − , suponiendo que a < 0. Por otro
2a
parte, si a ≥ 0 entonces Pk − Pk−1 siempre será mayor que 0, lo cual significa que
lı́m Pk −→ ∞.
k→∞
Ejemplo 4.4
Dos mezclas quı́micas se vierten en un tanque. Una tiene concentración c1 y se
vierte a una razón de F1 y la otra tiene concentración c2 y se vierte a una razón
de F2 . El tanque tiene un volumen V y su salida está a una concentración c y
razón F . Esto es tı́pico de muchos sistemas de control de procesos [Kwakernaak
and Sivan, 1972]. La ecuación linealizada para este sistema se puede escribir como
[ ] [ ]
− 2V
F0
0 1 1
ẋ = 0 x + c1 −c0 c2 −c0 u + v (4.30)
0 − FV00 V0 V0
donde F0 , V0 y c0 son los puntos de linealización de F , V y c. El estado x consta

de las desviaciones de los valores en estado estacionario de V y c; y la entrada de
ruido v consta de las desviaciones de los valores en estado estacionario de la F1
y F2 . Supóngase que F0 = 2V0 , c1 − c0 = V0 y c2 − c0 = 2V0 . Supóngase también
que la entrada de ruido v tiene una matriz de covarianza identidad.
1. Usar la Ecuación (4.26) para calcular Qk−1 .
2. Usar la Ecuación (4.27) para aproximar Qk−1 .
3. Evaluar la respuesta obtenida en la parte (1.) con una diferencia pequeña

(tk − tk−1 ) para verificar que coincida con la respuesta de la parte (2.).
4. Utilizar la Ecuación (4.25) para calcular la covarianza del estado estaciona-

rio del estado en función de T.
Solución:
Insertando los valores dados en la Ecuación (4.30) se obtiene

[ ] [ ]
−1 0 1 1
ẋ = x+ u+v
0 −2 1 2
De aquı́ se calcula Qc como sigue

[ ][ ][ ] [ ]
⊤ ⊤ 1 1 1 0 1 1 2 3
Qc = BE {vv }B = =
1 2 0 1 1 2 3 5
1. El cálculo de Qk−1 se efectúa de la siguiente manera:
∫ tk
⊤ (t −τ )
Qk−1 = eA(tk −τ ) Qc eA k
dτ
tk−1
∫ tk
⊤τ ⊤t
=e Atk
· e−Aτ Qc e−A dτ · eA k
(4.31)
tk−1
Para el cálculo de eAt lo más conveniente es aplicar el método de la transformada

de Laplace [Åström and Wittenmark, 1997]. Entonces

([ ] [ ])−1 ([ ])−1
s 0 −1 0 s+1 0
(sI − A)−1 = − =
0 s 0 −2 0 s+2
[ 1 ]
0
= s+1 1
0 s+2
Por lo tanto, la matriz exponencial estará dada por

[ −t ]
−1 −1 e 0
e = L {(sI − A) } =
At
0 e−2t
Sustituyendo este resultado, con los ajustes correspondientes, en la Ecuación

(4.31) se obtiene:
∫ tk
⊤ (t −τ )
Qk−1 = eA(tk −τ ) Qc eA k
dτ
tk−1
[ ] ∫ tk [ τ ][ ][ ] [ −t ]
e−tk 0 e 0 2 3 eτ 0 e k 0
= −2t dτ ·
0 e k tk−1 0 e 2τ 3 5 0 e 2τ
0 e−2tk
[ −t ] ∫ tk [ 2τ ] [ ]
e k 0 2e 3e3τ e−tk 0
= −2t dτ ·
0 e k tk−1 3e 3τ 5e 4τ 0 e−2tk
[ −t ] [ 2τ ]t [ −t ]
e k 0 e e3τ k e k 0
=
0 e−2tk e3τ 45 e4τ t 0 e−2tk
[ ]
k−1
1 − e−2(tk −tk−1 ) 1 − e−3(tk −tk−1 )

=
1 − e−3(tk −tk−1 ) 54 (1 − e−4(tk −tk−1 ) )
Finalmente se llega a
[ ]
1 − e−2T 1 − e−3T
Qk−1 = (4.32)
1 − e−3T 4 (1 − e
5 −4T )
donde T = tk − tk−1 es el tamaño del paso de discretización.
2. Para el segundo caso basta sustituir en la Ecuación (4.27), o sea

[ ]
2T 3T
Qk−1 ≈ Qc T =
3T 5T
3. Para este caso se puede aplicar la Ecuación (4.32) haciendo el desarrollo de

4.4. Deducción del filtro de Kalman discreto 117
potencias de las exponenciales:

[ 2
]
(2T)3 2 3
1 − (1 − 2T + (2T)
2! 2 + 3! 3 + · · · ) 1 − (1 − 3T + (3T) (3T)
2! 2 + 3! 3 + · · · )
Qk−1 =
1 − (1 − 3T + (3T) (3T)
2! + 3! + · · · )
(4T) (4T)
4 (1 − (1 − 4T + 2! + 3! + · · · ))
5
Para valores pequeños de T las potencias de orden superior de T se pueden des-

preciar, lo cual da un valor aproximado para Qk−1 , igual al de la parte (2.).
4. En estado estacionario la Ecuación (4.25) se puede escribir como:
P = Fk−1 PF⊤
k−1 + Qk−1 (4.33)
Efectuando la multiplicación e igualando los elementos individuales de las matrices
en el lado derecho e izquierdo de esta ecuación da
P11 = e−2T P11 + 2T
P12 = e−3T P12 + 3T
P22 = e−4T P22 + 5T
Resolviendo estas ecuaciones se llega a
2T
P11 =
1 − e−2T
3T
P12 =
1 − e−3T
5T
P22 =
1 − e−4T
4.4. Deducción del filtro de Kalman discreto

Como se verá más adelante el filtro de Kalman funciona mediante la propaga-
ción en el tiempo de la media y la covarianza de los estados. El enfoque para
derivar el filtro de Kalman incluirá los siguientes pasos:
Se inicia con una descripción matemática de un sistema dinámico cuyos

estados se quieren estimar.
Se implementan las ecuaciones que describen la forma como se propagan
en el tiempo la media y la covarianza de los estados.
Se toma el sistema dinámico que describe la propagación en el tiempo
de la media y la covarianza y se implementan estas ecuaciones en un

computador.
Cada vez que se tiene una medida, se actualiza la media y la covarianza
de los estados. (Esto es similar a lo que se hizo al comienzo del capı́tulo,
donde se realizaron mediciones recursivas para actualizar la estimación
de una constante).
Supóngase que se tiene un sistema lineal discreto en el tiempo dado por
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1

(4.34)
yk = H k xk + w k
El proceso y la medida tienen ruidos {vk } y {wk } los cuales son blancos,
con media cero, no correlacionados y además, tienen matrices de covarianza
conocidas Qk y Rk , respectivamente:
vk ∼ (0, Qk )
wk ∼ (0, Rk )
E {vk vj⊤ } = Qk δk−j (4.35)
E {wk wj⊤ } = Rk δk−j
E {vk wj⊤ } = E {wk vj⊤ } = 0
Donde δk−j es la función delta de Kronecker. La meta es estimar el estado xk

con base al conocimiento de la dinámica del sistema y la disponibilidad de las
mediciones ruidosas {yk }. La cantidad de información disponible para estimar
el estado varı́a de acuerdo al problema particular que se trate de resolver. Si se
tienen todas las medidas disponibles incluyendo el instante k, para uso en el
estimado de xk , entonces se puede formar un estimado a posteriori, el cual se
denota como x̂+ k . El superı́ndice “+” significa que el estimado es a posteriori.
Un modo de formar el estimado del estado a a posteriori es calcular el valor
esperado de xk condicionado a todas las medidas tomadas incluyendo la del
instante k, es decir,
k = E {xk |y1 , y2 , . . . , yk } = estimado a posteriori

x̂+ (4.36)
Si se tienen todas las medidas anteriores pero sin incluir el instante k disponi-
ble, para uso en la obtención del estimado de xk , entonces se puede conformar
un estimado a priori, el cual se denota como x̂−k . El superı́ndice “−” significa

que el estimado es a priori. Un modo de formar el estimado del estado a priori
es calcular el valor esperado de xk condicionado a todas las medidas tomadas
antes pero no incluyendo la del instante k, es decir,
x̂−
k = E {xk |y1 , y2 , . . . , yk−1 } = estimado a priori (4.37)
Es importante notar que x̂− +

k y x̂k son ambos estimados de la misma cantidad,
son estimados de xk . Sin embargo, x̂− k es el estimado de xk antes que la medida
yk es tenida en cuenta y x̂+ k , es el estimado de xk después que la medida yk es
tenida en cuenta. Naturalmente, se espera que x̂+ k sea un mejor estimado que
−
x̂k , debido a que se utiliza mayor información para calcular x̂+ k:
x̂−
k = estimado de xk antes que se procese la medida en el instante k,
+ (4.38)
x̂k = estimado de xk después que se procese la medida en el instante k.
Si se tienen medidas disponibles después del instante k para usar en el esti-

mado de xk , entonces se puede formar un estimado suavizado. Una manera
de formar el estimado de estado suavizado, es calcular el valor esperado de xk
condicionado a que todas las medidas estén disponibles:
x̂k|k+n = E {xk |y1 , y2 , . . . , yk , . . . , yk+n } = estimado suavizado (4.39)
donde n es algún entero positivo cuyo valor depende del problema especı́fico
que se desea resolver. Si se quiere encontrar la mejor predicción de xk con
más de un paso de tiempo por delante de las medidas disponibles, entonces
se puede formar una estimación predictiva. Una manera de formar el estado
estimado predictivo es calcular el valor esperado de xk , condicionado a todas
las mediciones que estén disponibles, es decir,
x̂k|k−m = E {xk |y1 , y2 , . . . , yk , . . . , yk−m } = estimado predictivo (4.40)
donde m es algún entero positivo cuyo valor depende del problema especı́fico
que se desea resolver. La relación entre los estimados de los estados suavizado,
a posteriori, a priori y predictivo se muestra en la Figura 4.2.
En la notación que sigue, se utiliza x̂+0 para denotar el estimado inicial de
x0 antes de que sea disponible cualquier medida. La primera medida se toma
en el instante k = 1. Puesto que no se tiene ninguna medida disponible para
Estimado suavizado
Estimado a posteriori
Estimado a priori
Predicción
1 2 3 4 5 6 7 8 9 tiempo
Figura 4.2.: Lı́nea temporal que muestra la relación entre los estimados de estado
suavizado, a posteriori, a priori y predictivo. En esta figura, se supo-
ne que se han recibido las medidas, en pasos de tiempo hasta k = 5,
inclusive. Una estimación del estado en k < 5 se denomina una estima-
ción suavizada. Una estimación del estado en k = 5 se denomina una
estimación a posteriori. Una estimación del estado en k = 6 se llama
la estimación a priori. Una estimación del estado en k > 6 se llama
predicción.
estimar x0 , es razonable tomar x̂+

0 como el valor esperado del estado inicial x0 :
0 = E {x0 }
x̂+ (4.41)
Se utiliza el término Pk para denotar la covarianza del error de estimación.

P− − +
k denota la covarianza del error de estimación de x̂k y Pk la covarianza del
+
error de estimación de x̂k :
P− − − ⊤
k = E {(xk − x̂k )(xk − x̂k ) },
+ ⊤
(4.42)
k = E {(xk − x̂k )(xk − x̂k ) }.
P+ +
Estas relaciones se explican en la Figura 4.3. La figura muestra que una vez
hecha la medida en el instante (k − 1) se obtiene un estimado de xk−1 (defini-
do como x̂+ k−1 ) y la covarianza del error de estimación (definida como Pk−1 ).
+
Cuando llega el instante k, antes que se procesen las medidas en ese instante,
se calcula un estimado de xk (denotado como x̂− k ) y la covarianza del error de
estimación (denotada como P− k ). Entonces se procesa la medida en el instante
k para refinar el estimado de xk . El valor estimado resultante de xk se deno-
ta como x̂+ +
k y su covarianza como Pk . Se comienza el proceso de estimación
con x̂+ +
0 , el mejor estimado del estado inicial x0 . Dado x̂0 , ¿cómo se podrá
− −
calcular x̂1 ? Para ello se establece x̂1 = E {x1 }. Pero nótese que x̂+
0 = E {x0 },
Figura 4.3.: Lı́nea de tiempo que muestra los valores estimados de los estados
y la covarianza del error de estimación a priori y a posteriori,
respectivamente.
y recuérdese de la Ecuación (4.22), cómo se propaga en el tiempo la media de

x: x̄k = Fk−1 x̄k−1 + Gk−1 uk−1 . Por lo tanto, se obtiene
x̂− +
1 = F0 x̂0 + G0 u0 (4.43)
Esta es una ecuación especı́fica que muestra como obtener x̂− +

1 desde x̂0 . Sin
embargo, el razonamiento puede extenderse para obtener la siguiente ecuación
más general:
x̂− +
k = Fk−1 x̂k−1 + Gk−1 uk−1 (4.44)
Esta es llamada ecuación de actualización temporal para x̂. Desde el instante

(k − 1)+ hasta el instante k − , la estimación de estado se propaga de la misma
manera que se propaga la media del estado. Esto tiene sentido intuitivamente.
No se tiene ninguna medida adicional disponible para ayudar a actualizar la
estimación de estado entre el instante (k − 1)+ y el instante k − , ası́ que se debe
actualizar la estimación de estado con base al conocimiento de la dinámica del
sistema.
Lo siguiente que se necesita es calcular la ecuación de actualización tempo-
ral de P, la covarianza del error de estimación de estado. Se comienza con P+ 0,
la cual es la covarianza del error de estimación inicial de x0 . Si se conoce perfec-
tamente el estado inicial, entonces P+ 0 = 0. Si no se tiene idea en absoluto del
valor de x0 , entonces P0 → ∞I. En general, P+
+
0 representa la incertidumbre
en el estimado inicial de x0 :
⊤
0 = E {(x0 − x̄0 )(x0 − x̄0 ) }
P+
+ ⊤
(4.45)
= E {(x0 − x̂+
0 )(x0 − x̂0 ) }
−
Dado el valor inicial de la covarianza, P+
0 , ¿cómo calcular el siguiente valor, P1 ?
De la Ecuación (4.4) se puede recordar la forma como se propaga la covarianza
del estado de un sistema lineal discreto en el tiempo: Pk = Fk−1 Pk−1 F⊤ k−1 +
Qk−1 . De aquı́, se obtiene:
P− + ⊤
1 = F0 P0 F0 + Q0 (4.46)
Esta es una ecuación especı́fica, que muestra cómo obtener P− +

1 desde P0 . Este
razonamiento se puede extender para obtener una ecuación más general, es
decir,
P− + ⊤
k = Fk−1 Pk−1 Fk−1 + Qk−1 (4.47)
Esta es llamada la ecuación de actualización temporal para P.

Se han derivado las ecuaciones de actualización temporal para x̂ y P. Ahora
se requiere derivar las ecuaciones de actualización de medidas para x̂ y P. La
cuestión es, dado x̂− + −
k , ¿cómo calcular x̂k ? La cantidad x̂k es un estimado de
+
xk y la cantidad x̂k también es un estimado de xk . La única diferencia entre
x̂− + +
k y x̂k es que x̂k tiene en cuenta la medida yk . Recuérdese del desarrollo
de estimación recursiva por mı́nimos cuadrados de la Sección 3.4, que la dis-
ponibilidad de la medida yk cambia el estimado de un vector constante x, de
acuerdo al conjunto de ecuaciones (3.30), que aquı́ se repiten por comodidad:
Kk = Pk−1 H⊤ ⊤
−1
= Pk H⊤ −1
k Rk
x̂k = x̂k−1 + Kk (yk − Hk x̂k−1 )
(4.48)
k
= (P−1 ⊤ −1
k−1 + Hk Rk Hk )
−1
= (I − Kk Hk )Pk−1
donde x̂k−1 y Pk−1 son el valor estimado y la covarianza del error de estimación
antes que la medida yk sea procesada y x̂k y Pk son el valor estimado y la
covarianza del error de estimación después que la medida yk ha sido procesada.
En esta sección, x̂− −
k y Pk son el valor estimado y la covarianza del error de
estimación antes que la medida yk sea procesada y x̂+ +

k y Pk son el valor
estimado y la covarianza del error de estimación después que la medida yk ha
sido procesada. Estas relaciones se pueden ver en la Tabla 4.1. Ahora se puede
Tabla 4.1.: Relaciones entre las estimaciones y las covarianzas de las secciones
3.4 y 4.4.
Estimación por mı́nimos cuadrados Filtro de Kalman
x̂k−1 = estimación antes de procesar yk ⇒ x̂−
k = estimado a prior i
Pk−1 = covarianza antes de procesar yk ⇒ P−k = covarianza a priori
x̂k = estimación después de procesar yk ⇒ +
x̂k = estimado a posterior i
Pk = covarianza después de procesar yk ⇒ P+k = covarianza a posteriori
generalizar, a partir de las fórmulas para el cálculo de la estimación de una

constante de la Sección 3.4, las ecuaciones de actualización de la medición,
requeridas en esta sección. En las ecuaciones (4.48), se reemplaza x̂k−1 con x̂−
k
y Pk−1 con P− + +
k , x̂k con x̂k y Pk con Pk . Esto resulta en
Kk = P− ⊤ − ⊤
k Hk (Hk Pk Hk + Rk )
−1
= P+ ⊤ −1
k Hk Rk
− −
k = x̂k + Kk (yk − Hk x̂k )
x̂+
− ⊤ ⊤ (4.49)
k = (I − Kk Hk )Pk (I − Kk Hk ) + Kk Rk Kk
P+
= [(P−
k)
−1
+ H⊤ −1
k Rk Hk ]
−1
= (I − Kk Hk )P−
k
Estas son las ecuaciones de actualización de la medida para xk y Pk . La matriz

Kk en las ecuaciones anteriores se denomina ganancia del filtro de Kalman.
El filtro de Kalman discreto
Aquı́ se resume el filtro de Kalman de tiempo discreto combinando las ecua-

ciones anteriores en un algoritmo.
La dinámica del sistema está dada por las siguientes ecuaciones:
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1

(4.50)
yk = H k xk + w k
Mientras que las perturbaciones están relacionadas por:
E {vk vj⊤ } = Qk δk−j

E {wk wj⊤ } = Rk δk−j (4.51)
E {vk wj⊤ } = 0
Algoritmo 4.1 Filtro de Kalman discreto.

Inicialización:
0 = E {x0 }
x̂+
+ ⊤
(4.52)
0 = E {(x0 − x̂0 )(x0 − x̂0 ) }
P+ +
Para k ∈ {1, 2, · · · , ∞}, las ecuaciones de predicción del filtro de Kalman son:
x̂− +
k = Fk−1 x̂k−1 + Gk−1 uk−1 = estado estimado a priori
(4.53)
P− + ⊤
k = Fk−1 Pk−1 Fk−1 + Qk−1
Las ecuaciones de actualización son:

Kk = P− ⊤ − ⊤
−1
⊤ −1
= P+k Hk Rk
− −
k = x̂k + Kk (yk − Hk x̂k ) = estado estimado a posteriori
x̂+
− ⊤ ⊤
(4.54)
P+
= [(P−k)
−1
+ H⊤ −1
k Rk Hk ]
−1
= (I − Kk Hk )P−k
Observaciones:
La primera expresión para P+k anterior, se denomina la versión estabiliza-
da de Joseph de la ecuación de corrección de la medida de la covarianza.
Fue formulada en los años sesenta. Se puede demostrar que es más estable
y robusta que la tercera. Esta primera expresión garantiza que P+ k será
siempre simétrica definida positiva si P−k es simétrica definida positiva.
+
La tercera expresión para Pk es computacionalmente más simple que
la primera, pero su forma no garantiza la simetrı́a o que sea definida

positiva.
La segunda forma para P+ k es rara vez implementada tal como está escri-
ta, pero será útil en la deducción del denominado filtro de información.
Si se utiliza la segunda expresión para Kk , entonces se debe usar la
segunda expresión para P+ k . Esto se debe a que la segunda expresión
para Kk depende de P+ k , de modo que se necesita usar una expresión
+
para Pk que no dependa de Kk .
Nótese que si xk es constante, entonces Fk = I, Qk = 0 y uk = 0. En este
caso, el filtro de Kalman de la Ecuación (4.49) se reduce al algoritmo re-
cursivo de mı́nimos cuadrados para la estimación de un vector constante
como en la Ecuación (3.30).
Un aspecto práctico importante del filtro de Kalman. Del Algoritmo 4.1,
se puede notar que el cálculo de P− +
k , Kk y Pk no dependen de las medi-
ciones que se tengan de yk , sino que dependen únicamente de los pará-
metros del sistema Fk , Hk , Qk y Rk . Eso significa que se puede calcular
la ganancia de Kalman Kk fuera de lı́nea antes de que el sistema en-
tre en operación y guardar los datos resultantes en la memoria. Luego,
cuando llega el momento de operar el sistema en tiempo real, sólo las
ecuaciones x̂k necesitan ser implementadas. Se puede ahorrar esfuerzo
computacional de calcular Kk durante el funcionamiento en tiempo real
precalculando la ganancia.
Si el filtro de Kalman se implementa en un sistema embebido con estrictos
requisitos de cálculo, esto puede hacer la diferencia entre si se puede o
no implementar el sistema en tiempo real. Por otra parte, el desempeño
del filtro puede ser investigado y evaluado antes de que se ejecute en
tiempo real. Esto se debe a que Pk indica la precisión de la estimación
del filtro, y puede ser calculada fuera de lı́nea, ya que no depende de las
mediciones. Por el contrario, como verá más adelante, la ganancia del
filtro y la covarianza para sistemas no lineales no pueden, en general, ser
calculadas fuera de lı́nea, ya que dependen de las mediciones.
Desde este punto de vista las ecuaciones que se utilizan para derivar el filtro de
Kalman se pueden dividir en dos grupos: las que actualizan el tiempo o ecua-
ciones de predicción y las que actualizan los datos observados o ecuaciones de
actualización. Las del primer grupo son responsables de la proyección del esta-
do en el instante k tomando como referencia el estado en el instante k − 1 y de
Figura 4.4.: El ciclo del filtro de Kalman.
la actualización intermedia de la matriz de covarianza del estado. El segundo

grupo de ecuaciones son responsables de la retroalimentación, es decir, incor-
poran nueva información dentro de la estimación anterior con lo cual se llega
a una estimación mejorada del estado. Las ecuaciones que actualizan el tiem-
po pueden también ser pensadas como ecuaciones de pronóstico (predicción),
mientras que las ecuaciones que incorporan nueva información pueden conside-
rarse como ecuaciones de corrección. Efectivamente, el algoritmo de estimación
final puede definirse como un algoritmo de pronóstico–corrección para resol-
ver numerosos problemas. Ası́, el filtro de Kalman funciona por medio de un
mecanismo de proyección y corrección al pronosticar el nuevo estado y su in-
certidumbre y corregir la proyección con la nueva medida. Este ciclo se muestra
en la Figura 4.4. El primer paso consiste en generar un pronóstico del estado
hacia adelante en el tiempo tomando en cuenta toda la información disponible
en ese momento y en un segundo paso, se genera un pronóstico mejorado del
estado, de tal manera que el error es minimizado estadı́sticamente.
4.5. Propiedades del filtro de Kalman

En esta sección se resumen algunas de las propiedades interesantes e importan-
tes del filtro de Kalman. Supóngase que se tiene el sistema lineal de la Ecuación
4.5. Propiedades del filtro de Kalman 127
(4.50) y se desea encontrar un filtro causal que resulta de un estimado x̂k . El

error entre el estado verdadero y el estado estimado se denota por x̃k ,
x̃k = xk − x̂k (4.55)
Debido a que el estado está determinado parcialmente por el proceso estocás-

tico {wk }, entonces xk es una variable aleatoria. Además, el valor estimado
del estado está determinado por la secuencia de medición {yk }, la cual a su
vez está determinada por el proceso estocástico vk , entonces x̂k es una variable
aleatoria. Por lo tanto, x̃k también es una variable aleatoria.
Supóngase que se desea encontrar el estimador que minimiza (en cada etapa
de tiempo) una media ponderada de norma dos del valor esperado del error de
estimación x̃k :
min E {x̃⊤
k Sk x̃k } (4.56)
donde Sk es una matriz de ponderación definida positiva, establecida por el di-

señador. Si Sk es una matriz diagonal con elementos sk (1), . . . , sk (n), entonces
la suma ponderada es igual a sk (1)E {x̃2k (1)} + · · · + sk (n)E {x̃2k (n)}.
Si {vk } y {wk } son ruidos blancos, gaussianos, de media cero, no co-
rrelacionados, entonces el filtro de Kalman es la solución al problema
anterior.
Si {vk } y {wk } son ruidos blancos, de media cero y no correlacionados,
entonces el filtro de Kalman es la mejor solución lineal para el anterior
problema. Es decir, el filtro de Kalman es el mejor filtro que es una
combinación lineal de las medidas. Puede haber un filtro no lineal que
dé una mejor solución, pero el filtro de Kalman es el mejor filtro lineal.
A menudo se afirma en los libros y documentos que el filtro de Kalman
no es óptimo a menos que el ruido sea gaussiano. Sin embargo, según
como se ve de la deducción dada en este capı́tulo, eso no es verdad. Estas
declaraciones surgen de las interpretaciones erróneas de las deducciones
del filtro de Kalman. Incluso si el ruido no es gaussiano, el filtro de
Kalman continúa siendo un filtro lineal óptimo.
Si {vk } y {wk } son correlacionados o coloreados, entonces se puede mo-
dificar el filtro de Kalman para resolver el problema anterior. Esto se
mostrará en el Capı́tulo 6.
Para sistemas no lineales, varias formulaciones de filtros de Kalman no li-
neales se aproximan a la solución del problema anterior. Esto se discutirá

en el Capı́tulo 8.
Del Algoritmo 4.1, tomando la ecuación de corrección de la medida, es decir,
− −
k = x̂k + Kk (yk − Hk x̂k ),
x̂+ (4.57)
se pueden hacer algunas observaciones:

La cantidad (yk − Hk x̂− k ) se denomina innovación. Esta es la parte de
la medida que contiene información nueva acerca del estado. De hecho,
el filtro de Kalman en realidad se puede derivar como un filtro que blan-
quea la medición y, por lo tanto, extrae la máxima cantidad posible de
información de la medida. Esto fue propuesto inicialmente en [Kailath,
1968].
Cuando se utiliza un filtro de Kalman para estimación de estados, las in-
novaciones pueden medirse y su media y su covarianza se pueden aproxi-
mar usando métodos estadı́sticos. Si la media y la covarianza de las in-
novaciones no son como se esperaban, significa que algo anda mal con el
filtro. Quizá el modelo asumido del sistema es incorrecto, o las estadı́sti-
cas asumidas del ruido son incorrectas. Esto puede utilizarse en tiempo
real para verificar el desempeño del filtro de Kalman y sus parámetros,
incluso para ajustar los parámetros del filtro de Kalman con el fin de
mejorar su funcionamiento.
El filtro de Kalman estima variables de estado de un proceso con realimen-
tación. Calcula el estado del proceso en algún instante y entonces obtiene
información (se realimenta) de la medida. Por tanto, las ecuaciones del filtro
se pueden clasificar en dos tipos: actualización del tiempo y actualización de
las medidas. Las primeras son responsables de proyectar hacia el futuro los
estimadores del estado actual y de la covarianza del error, para obtener los
estimadores a priori del siguiente estado. Las ecuaciones de actualización de
las medidas son responsables de la realimentación, incorporando una nueva
medida a los estimadores a priori para obtener unos estimadores a posteriori
mejorados. Las ecuaciones de actualización del tiempo pueden ser interpre-
tadas como ecuaciones de predicción, mientras que las de actualización de la
medida pueden pensarse como ecuaciones de corrección.
Se puede demostrar que las innovaciones son de media cero y blanca con
covarianza (Hk P− ⊤
k Hk + Rk ) [Gibbs, 2011]. De hecho, el filtro de Kalman en
realidad se puede derivar como un filtro que blanquea la medición y por lo

tanto extrae la máxima cantidad posible de información de ella.
4.5.1. Ecuaciones del filtro de Kalman de un paso

En esta subsección, se verá cómo las ecuaciones del filtro de Kalman a priori y
a posteriori se combinan en una sola. Esto puede simplificar la implementación
computacional de las ecuaciones. Empezando con la expresión de estimación de
estado a priori de las ecuaciones (4.53), con el ı́ndice de tiempo incrementado
en uno:
x̂− +
k+1 = Fk x̂k + Gk uk (4.58)
Ahora, tomando la expresión a posteriori para x̂+

k de las ecuaciones (4.54) y
sustituyendo en la ecuación anterior se obtiene
x̂− − −
k+1 = Fk [x̂k + Kk (yk − Hk x̂k )] + Gk uk
(4.59)
= Fk (I − Kk Hk )x̂−
k + Fk Kk yk + Gk uk
Esto muestra que el estimado de estado a priori se puede calcular directamente

de su valor en la etapa de tiempo previo, sin calcular el estimado de estado
a posteriori entre ellos. Un procedimiento similar puede seguirse para obtener
una expresión de un solo paso para la covarianza a priori. Se comienza con
la expresión de la covarianza a priori de la Ecuación (4.53), con el ı́ndice de
tiempo incrementado en uno:
P− + ⊤
k+1 = Fk Pk Fk + Qk (4.60)
Ahora se toma la expresión para P+

k de la Ecuación (4.54) y se sustituye en la
anterior ecuación para obtener
P− − − ⊤
k+1 = Fk (Pk − Kk Hk Pk )Fk + Qk
= Fk P− ⊤ − ⊤
k Fk − Fk Kk Hk Pk Fk + Qk
= Fk P− ⊤ − ⊤ − ⊤ −1 − ⊤
k Fk − Fk Pk Hk (Hk Pk Hk + Rk ) Hk Pk Fk + Qk (4.61)
Esta ecuación, llamada ecuación discreta de Riccati, muestra como P− k+1 se

− +
puede calcular sobre la base de Pk sin un cálculo intermedio de Pk . Se pueden
realizar manipulaciones similares para obtener expresiones de un solo paso para
la estimación a posteriori de los estados y la covarianza. Esto resulta en
k = (I − Kk Hk )(Fk−1 x̂k−1 + Gk−1 uk−1 ) + Kk yk

x̂+ +
⊤
(4.62)
k = (I − Kk Hk )(Fk−1 Pk−1 Fk−1 + Qk−1 )
P+ +
Se pueden plantear muchas maneras diferentes de combinar las dos expresiones

de Kk y las tres expresiones de P+k en las ecuaciones (4.54). Esto resultarı́a en
un número de diferentes expresiones para las actualizaciones de un solo paso
de la covarianza a priori y a posteriori.
Ejemplo 4.5
Supóngase que se tiene un sistema newtoniano, sin ruido, con posición r, velo-
cidad v y aceleración constante a. El sistema puede describirse como:
[ ] [ ][ ]
ṙ 0 1 0 r
v̇ = 0 0 1 v
ȧ 0 0 0 a
ẋ = Ax
La versión discretizada de este sistema (con tiempo de muestreo T) puede es-

cribirse como
xk+1 = Fxk
donde F está dada por
A2 T2
F = eAT = I + AT + + ···
2!
es decir,
[ ] [ ] [ ]  
1 0 0 0 1 0 0 0 1 T2 1 2
1 T 2T
F= 0 1 0 + 0 0 1 T+ 0 0 0 = 0 1 T .
0 0 1 0 0 0 0 0 0 2 0 0 1
El filtro de Kalman para este sistema es
x̂− +
k = Fx̂k−1
P− + ⊤
k = FPk−1 F + Qk−1 con Qk−1 = 0
⊤
= FP+
k−1 F
Como se puede ver, la covarianza del error de estimación aumenta entre el

tiempo (k − 1)+ (esto es, el tiempo (k − 1) después que se procesa la medida) y el

tiempo k − (es decir, el tiempo k antes que se procese la medida). Puesto que no
se obtiene alguna medida entre el tiempo (k − 1)+ y el tiempo k − , tiene sentido el
hecho de que la incertidumbre de la estimación se incremente. Ahora, supóngase
que se mide la posición con una varianza de σ 2 .
yk = Hk xk + wk = [1 0 0] xk + wk
wk ∼ (0, Rk )
Rk = σ 2
La ganancia de Kalman puede obtenerse de la Ecuación (4.54) como
Kk = P− ⊤ − ⊤
−1
Si se escribe la matrix P− k ∈ R
3×3 , en términos de sus elementos, dado que es
simétrica, y se sustituye para Hk y Rk en la ecuación anterior, se obtiene
 − − [ ]  − − [ ] 
−1
p11,k p−
12,k p13,k 1 p11,k p−
12,k p13,k 1
Kk = p− − − 
21,k p22,k p23,k 0 [1 0 0]p− − − 
21,k p22,k p23,k 0 + σ2
p− − −
31,k p32,k p33,k
0 p− − −
31,k p32,k p33,k
0
 −   − 
p11,k ( )−1 ( )−1 p11,k
Kk = p−
21,k
 p− + σ 2
11,k ≡ p−
11,k + σ
2 p−
12,k

− −
p31,k p13,k
La covarianza a posteriori puede obtenerse de la Ecuación (4.54) como

− −
k = Pk − Kk Hk Pk
P+
Procediendo de igual manera que para el caso de la ganancia de Kalman Kk y,
teniendo en cuenta la simetrı́a de P−
k , se obtiene para la expresión anterior:
   − 
p−
11,k p11,k 0 0
− 1  p−  − − 1 p−  −
k = Pk − −
P+ 2 12,k [1 0 0] Pk = Pk − − 2 12,k 0 0 Pk
p11,k + σ p11,k + σ
p−
13,k p−
13,k 0 0
 − − −   − 2 − 
p11,k p12,k p13,k (p11,k ) − −
p11,k p12,k p− 11,k p13,k
1
= p− − − 
12,k p22,k p23,k − − 2
p− −
11,k p12,k (p−12,k )
2 p− − 
12,k p13,k
p + σ
p− − −
13,k p23,k p33,k
11,k p− − − −
11,k p13,k p12,k p13,k (p−
13,k )
2
Se usará esta expresión para mostrar que del tiempo k − al tiempo k + la traza
de la covarianza del error de estimación decrece.
3500
P−2
Estimación de la varinza del error de posición

3000
P−
− 3
P1
2500
P−4
2000
P−5
1500
1000
P+ P+ P5
+
3 4
500
P+2
P+ +
P1
0 0
0 1 2 3 4 5
Pasos de tiempo
Figura 4.5.: Los primeros cinco pasos de las varianzas en la estimación del
error a priori y a posteriori del Ejemplo 4.5.
Puesto que la matriz de covarianza es simétrica, entonces, de la Ecuación (??)
se puede ver que la traza de P+k , está dada como
( ) ( ) ( )
(p−
11,k )
2 (p−
12,k )
2 (p−
13,k )
2
Tr(P+
k) = p− − + p− − + p− −
11,k
p−
11,k + σ
2 22,k
p−
11,k + σ
2 33,k
p−
11,k + σ
2
(p− 2 − 2 −
11,k ) + (p12,k ) + (p13,k )
2
= Tr(P−
k) − (4.63)
p−
11,k + σ
2
Cuando se toma una nueva medida, se espera que el estimado del estado mejore.
Es decir, se espera que la covarianza disminuya, y la ecuación anterior muestra
que ésta en realidad ha decrecido. Esto es, la traza de P+ k es menor que la tra-
−
za de Pk . Este sistema fue simulado con cinco unidades de tiempo entre pasos
de discretización (T = 5), y una desviación estándar posición–medida de 30 uni-
dades. La Figura 4.5 muestra la varianza de la estimación de la posición (p− 11,k
y p+
11,k ) para los primeros cinco pasos de tiempo del filtro Kalman. Se puede ob-
servar que la varianza (incertidumbre) se incrementa desde el estado de tiempo
uno al siguiente, pero luego decrece en cada paso de tiempo cuando la medida es
procesada.
3500
Estimación de la varinza del error de posición

3000
2500
2000
1500
1000
500
0
0 10 20 30 40 50 60
Pasos de tiempo
Figura 4.6.: Los primeros sesenta pasos de las varianzas del error de estima-
ción a priori y a posteriori del Ejemplo 4.5.
Error de medición
Error de estimation
10 20 30 40 50 60
Pasos de tiempo
Figura 4.7.: El error de medición y el error de estimación de la posición en

el Ejemplo 4.5.
La Figura 4.6, muestra la varianza de la estimación de la posición (p− +
11,k y p11,k )
para los primeros 60 pasos de tiempo del filtro Kalman. Ésta muestra que la
varianza aumenta entre pasos de tiempo, y luego decrece en cada paso de tiempo.
También se puede observar de esta figura que la varianza converge al valor de
estado estacionario.
La Figura 4.7, muestra el error posición de la medida (con una desviación
estándar de 30) y el error de estimación de la posición a posteriori. El error de la
estimación comienza con una desviación estándar cercana a 30, pero al final de la
simulación la desviación estándar está cerca de 11.
4.5.2. Propagación alterna de la covarianza

En esta subsección, se desarrolla una ecuación alterna para la propagación
de la covarianza del error de estimación P. Esta ecuación alterna, basada en
[Grewal and Andrews, 2008] puede usarse para encontrar una expresión de
forma cerrada para un filtro escalar de Kalman. También puede usarse para
encontrar una solución rápida para la covarianza del error de estimación en
estado estacionario.
Sistemas con estados múltiples
Recordando de las ecuaciones (4.53) y (4.54), las expresiones de actualización

para la covarianza del error de estimación:
P− + ⊤
k = Fk−1 Pk−1 Fk−1 + Qk−1 (4.64)
P+
k = P−
k − P− ⊤ − ⊤
k Hk (Hk Pk Hk
−1
+ Rk ) H k P−
k
Si la matriz P−
k ∈ R
n×n
se factoriza como
P− −1
k = Ak Bk (4.65)
donde Ak y Bk son matrices Rn×n a ser determinadas, entonces P−

k+1 satisface
P− −1
k+1 = Ak+1 Bk+1 (4.66)
en la que A y B se propagan de la siguiente manera:

[ ] [ ][ ] [ ⊤ −1 ][ ]
Ak+1 Qk I F−⊤ k 0 Hk Rk Hk I Ak
= (4.67)
Bk+1 I 0 0 Fk I 0 Bk
Realizando los productos indicados se llega a

[ ] [ −⊤ ] [ ]
Ak+1 Fk + Qk F−⊤ ⊤ −1
k Hk Rk Hk Qk Fk Ak
= (4.68)
Bk+1 F−⊤ ⊤ −1
k Hk Rk Hk F−⊤
k Bk
La demostración de la relación (4.66) puede obtenerse a partir de la Ecuación

(4.68) observando que:
B−1 −⊤ ⊤ −1 −⊤
k+1 = [Fk Hk Rk Hk Ak + Fk Bk ]
−1
= [F−⊤ ⊤ −1 −1
k (Hk Rk Hk Ak Bk + I)Bk ]
−1
= B−1 ⊤ −1 −1 −1 ⊤
k [Hk Rk Hk Ak Bk + I] Fk (4.69)
De la Ecuación (4.68) se ve que
Ak+1 B−1 −⊤ ⊤ −1 −⊤
k+1 = [(Fk + Qk Fk Hk Rk Hk )Ak + Qk Fk Bk ]×
× B−1 ⊤ −1 −1 −1 ⊤
k [Hk Rk Hk Ak Bk + I] Fk
Ak+1 B−1 −⊤ ⊤ −1 −1 −⊤
k+1 = [(Fk + Qk Fk Hk Rk Hk )Ak Bk + Qk Fk ]
× [H⊤ −1 −1 −1 ⊤
k Rk Hk Ak Bk + I] Fk (4.70)
Sustituyendo Ak B−1 −
k por Pk en la ecuación anterior da
Ak+1 B−1 −⊤ ⊤ −1 − −⊤ ⊤ −1 − −1 ⊤
k+1 = [(Fk + Qk Fk Hk Rk Hk )Pk + Qk Fk ][Hk Rk Hk Pk + I] Fk
= [Fk P− −⊤ ⊤ −1 − −⊤ ⊤ −1 − −1 ⊤
k + Qk Fk Hk Rk Hk Pk + Qk Fk ][Hk Rk Hk Pk + I] Fk
= [Fk P− −⊤ ⊤ −1 − ⊤ −1 − −1 ⊤
k + Qk Fk (Hk Rk Hk Pk + I)][Hk Rk Hk Pk + I] Fk
= F k P− ⊤ −1 − −1 ⊤
k [Hk Rk Hk Pk + I] Fk + Qk (4.71)
Aplicando el lema de inversión de matrices para el término entre corchetes con

A = I, B = H⊤ −
k , C = Hk Pk y D = Rk , se obtiene:
Ak+1 B−1 − ⊤ − ⊤ −1 − ⊤
k+1 = Fk Pk [I − Hk (Hk Pk Hk + Rk ) Hk Pk ]Fk + Qk
= Fk [P− − ⊤ − ⊤ −1 − ⊤
k − Pk Hk (Hk Pk Hk + Rk ) Hk Pk ]Fk + Qk
⊤
= Fk P+
k Fk + Qk
= P−
k+1 (4.72)
Por lo tanto, queda demostrado que Ak+1 B−1 −

k+1 = Pk+1 .
Se puede utilizar la Ecuación (4.68) para obtener una solución rápida de la
covarianza de estado estacionario en sistemas multidimensionales (aunque no
es una solución de forma cerrada). Supóngase que F, Q, H y R son matrices
constantes. De la Ecuación (4.68) se obtiene
[ ] [ ][ ] [ ]
Ak+1 F + QF−⊤ H⊤ R−1 H QF−⊤ Ak Ak
= −⊤ ⊤ −1 −⊤ =Ψ (4.73)
Bk+1 F H R H F Bk Bk
Donde, como se puede observar

[ ]
F + QF−⊤ H⊤ R−1 H QF−⊤
Ψ= (4.74)
F−⊤ H⊤ R−1 H F−⊤
Teniendo en cuenta el hecho de que A1 = P− 1 y B1 = I, satisface la factoriza-

ción original de la Ecuación (4.65), se obtiene sucesivamente:
[ ] [ −] [ ] [ ] [ −] [ ] [ ] [ −]
A2 P1 A3 A2 2 P1 A4 A3 3 P1
=Ψ ; =Ψ =Ψ ; =Ψ =Ψ
B2 I B3 B2 I B4 B3 I
(4.75)
De aquı́ se tiene por inducción para el instante k:

[ ] [ −]
Ak k−1 P1
=Ψ (4.76)
Bk I
Ahora se puede elevar Ψ sucesivamente a potencias de dos un total de p veces

p
para obtener Ψ2 , Ψ4 , Ψ8 , etc, hasta que Ψ2 converja a un valor de estado
estacionario:
[ ] [ −]
A∞ 2 p P1
≈Ψ para p grande (4.77)
B∞ I
La covarianza de estado estacionario es P− −1

∞ = A∞ B∞ . También se puede
encontrar la ganancia Kalman de estado estacionario simplemente iterando
las ecuaciones de filtro de la Ecuación (4.54), pero el método en esta sección
puede ser un modo mucho más rápido para encontrar la ganancia en estado
estacionario. Una vez encontrada P−∞ , como se muestra más arriba, se calcula
K∞ = P − ⊤ − ⊤ −1
∞ H (HP∞ H + R) , la ganancia del filtro de Kalman en estado
estacionario.
Sistemas escalares
Se puede usar la Ecuación (4.68) para obtener una solución en forma cerrada
del filtro escalar de Kalman para sistemas invariantes en el tiempo. Supóngase
que F, Q, H y R son escalares constantes. Entonces de la Ecuación (4.68) se
obtiene
[ ] [ 2
][ ] [ ]
Ak+1 F + HF RQ Q
F
Ak Ak
= H 2 1
=Ψ (4.78)
Bk+1 FR F
Bk Bk
donde Ψ está definido como en la Ecuación (4.73). Ahora se encuentran los

datos propios de Ψ. Supóngase que los valores propios de Ψ son λ1 y λ2 y
que al conformar los vectores propios de Ψ (v. gr.: aplicando el método de
Gram–Schmidt), se crea la matriz M ∈ R2×2 . Entonces
[ ]
λ1 0
Ψ=M M−1 (4.79)
0 λ2
Nótese la secuencia
[ ] [ ] [ 2 ]
λ1 0 −1 λ1 0 −1 λ1 0
2
Ψ =M M ×M M =M M−1
0 λ2 0 λ2 0 λ22
[ 2 ] [ ] [ 3 ]
λ1 0 −1 λ1 0 −1 λ1 0
3
Ψ =M M ×M M =M M−1
0 λ22 0 λ2 0 λ32
[ ]
λk1 0
k
Ψ =M M−1 (4.80)
0 λk2
Entonces la Ecuación (4.76) se puede escribir como

[ ] [ −] [ k−1 ] [ −]
Ak k−1 P1 λ1 0 −1 P1
=Ψ =M M (4.81)
Bk I 0 λ2k−1 I
Realizando los cálculos correspondientes para encontrar λ1 y λ2 y M, se ob-

tiene:
µ1
λ1 =
2F R
µ2
λ2 =
2F R
µ1 = H 2 Q + R(F 2 + 1) + ϱ
µ2 = H 2 Q + R(F 2 + 1) − ϱ
ν1 = H 2 Q + R(F 2 − 1) + ϱ
ν2 = H 2 Q + R(F 2 − 1) − ϱ
√ √ (4.82)
ϱ = H 2 Q + R(F + 1)2 H 2 Q + R(F − 1)2
[ ν1 ν2 ]
M = 2H 2 2H 2
1 1
[ ]
−1 1 2RH 2 −ν1
M =
ν1 (R − 1) + 2ϱ −2RH 2 Rν1
2 − 2 −
1 (2RH P1 − ν2 ) − ν2 µ2 (2H P1 − ν1 )
ν1 µk−1 k−1
Pk− = 2 − 2 −
1 (2RH P1 − ν2 ) − 2H µ2 (2H P1 − ν1 )
2H 2 µk−1 2 k−1
Esta es una ecuación en forma cerrada del filtro de Kalman variante en el

tiempo para un sistema escalar invariante en el tiempo. Ésta puede utilizarse
fácilmente para obtener el valor de estado estacionario de Pk− . Nótese que
µ2 < µ1 . Cuando k se incrementa, µk2 se hace más pequeño con respecto a µk1 .
Por lo tanto,
2 − 2 −
1 (2RH P1 − ν2 ) − ν2 µ2 (2H P1 − ν1 )
ν1 µk−1 k−1
lı́m Pk− = lı́m
k→∞ k→∞ 2H 2 µk−1 (2RH 2 P − − ν2 ) − 2H 2 µk−1 (2H 2 P − − ν1 )
1 1 2 1
2 −
ν1 µ1 (2RH P1 − ν2 )
k−1
= lı́m
k→∞ 2H 2 µk−1 (2RH 2 P − − ν2 )
1 1
ν1
= (4.83)
2H 2
Esto da la covarianza de estado estacionario para un sistema escalar.
Ejemplo 4.6
Propagación de una covarianza escalar. Considérese el siguiente sistema escalar:
xk+1 = xk + vk
y k = x k + wk
vk ∼ (0, 1), wk ∼ (0, 1)
Este es un ejemplo muy simple pero que puede surgir en muchas aplicaciones;
v.gr.: puede representar algún parámetro xk con variación lenta que se mide direc-
tamente. El término de ruido del proceso vk se tiene en cuenta en las variaciones
de xk y, la medida del término de ruido wk , se considera para errores en la medida.
En este sistema, se tiene F = H = Q = R = 1.
Sustituyendo estos valores en la Ecuación (4.82) da
√
µ1 = 3 + 5
√
µ2 = 3 − 5
√
ν1 = 1 + 5
√
ν2 = 1 − 5
− −
1 (2P1 − ν2 ) − ν2 µ2 (2P1 − ν1 )
ν1 µk−1 k−1
Pk− = − −
1 (2P1 − ν2 ) − 2µ2 (2P1 − ν1 )
2µk−1 k−1
Tomando el lı́mite cuando k → ∞ da el valor de estado estacionario de Pk− :

√
− ν1 1+ 5
P∞ = =
2 2
= 1.6180 ≈ 1.62
Ahora se puede usar la Ecuación (4.54) para encontrar el valor de estado estacio-
nario de Kk :
Kk = Pk− Hk⊤ (Hk Pk− Hk⊤ + Rk )−1

Pk−
= −
Pk + 1
ν1
K∞ = ν1
2( 2 + 1)
ν1
=
ν1 + 2
√
1+ 5
= √
3+ 5
= 0.6180 ≈ 0.62
2
Ganancia de Kalman
Covarianza del error de estimación
1.8
1.6
1.4
1.2
0.8
0.6
0 1 2 3 4 5 6 7 8 9 10
tiempo
Figura 4.8.: Covarianza del error de estimación y ganancia de Kalman en

función del tiempo. Ambas convergen a valores de estado esta-
cionario.
La Figura 4.8, muestra la covarianza del estimado a priori y la ganancia Kalman

en función del tiempo, también ilustra su convergencia a los valores de estado
estacionario. De la ecuación para la covarianza del error de estimación a posteriori,
−
se sabe que P+ k = (I − Kk Hk )Pk . En consecuencia, para este ejemplo se ve que
+
el valor de la covarianza Pk en estado estacionario está dada por
( √ ) √ √
1+ 5 1+ 5 1+ 5
P∞ = 1 −
+
√ = √
3+ 5 2 3+ 5
La teorı́a presentada en este capı́tulo hace del filtro de Kalman una escogencia
atractiva para la estimación de estados. Pero cuando un filtro de Kalman se
implementa en un sistema real éste puede no funcionar, aun cuando la teorı́a
sea correcta. Dos de las primeras causas para la falla del filtrado de Kalman
son: la aritmética de precisión finita y los errores de modelado. Esta metodo-
logı́a supone que la aritmética del filtro de Kalman tiene precisión infinita. En
microprocesadores digitales la aritmética tiene precisión finita, solamente una

cierta cantidad de bits se usa para representar los números en las ecuaciones
del filtro de Kalman. Esto puede causar divergencia o aun inestabilidad en la
implementación del filtro de Kalman.
En la teorı́a presentada, también se supone que el modelo del sistema se co-
noce exactamente. Esto es, se supone que las matrices F, Q, H y R se conocen
exactamente y además, se asume que las secuencias ruidosas {wk } y {vk } son
ruidos blancos puros, de media cero y absolutamente no correlacionados. Si
alguna de estas hipótesis no se cumple, ya que siempre están en las implemen-
taciones reales, entonces los supuestos del filtro de Kalman son violados y la
teorı́a no funciona. Con el fin de mejorar el rendimiento del filtro de cara a
estas realidades, el diseñador puede utilizar varias estrategias:
Aumentar la precisión aritmética.
Usar alguna forma de filtrado de raı́z cuadrada.
Simetrizar P en cada etapa de tiempo: P = (P + P⊤ )/2.
Inicializar P apropiadamente para evitar cambios grandes en el mismo.
Usar un filtro con memoria de desvanecimiento.
Usar ruido de procesos ficticios (especialmente para estimación de cons-
tantes).
Ejemplo 4.7
A continuación se va a ilustrar el uso de ruido de un proceso ficticio. Supóngase que
se está tratando de estimar un estado que se asume constante, pero en realidad es
una rampa. En otras palabras, se tiene un error de modelado. El modelo asumido
(pero incorrecto), sobre el cual se basa el filtro de Kalman, se da de la siguiente
manera:
xk+1 = xk + vk
yk = xk + wk
(4.84)
vk ∼ (0, 0)
wk ∼ (0, 1)
El ruido del proceso se asume cero, lo que significa que se está modelando xk
como una constante. De la Ecuación (4.54) se obtienen las ecuaciones del filtro de
Kalman para este sistema como
Pk− = Fk−1 Pk−1

+ ⊤
Fk−1 +
+ Qk−1 = Pk−1
Pk−
Kk = Pk− Hk⊤ (Hk Pk− Hk⊤ + Rk )−1 =
Pk− + 1
(4.85)
x̂− + +
k = Fk−1 x̂k−1 = x̂k−1
− − − −
k = x̂k + Kk (yk − Hk x̂k ) = x̂k + Kk (yk − x̂k )
x̂+
Pk+ = (I − Kk Hk )Pk− (I − Kk Hk )⊤ + Kk Rk Kk⊤ = (1 − Kk )2 Pk− + Kk2
Supóngase que el sistema verdadero, aunque desconocido para el diseñador del
filtro de Kalman, es el modelo de dos estados siguiente:
[ ]
1 1
xk+1 = x
0 1 k
yk = [1 0] xk + wk
wk ∼ (0, 1)
El primer estado es una rampa, el cual se asumió incorrectamente en el modelo
del sistema como una constante.
Q=0
600
Estado verdadero
Estado estimado
500
400
300
200
100
0
0 10 20 30 40 50
Tiempo
Figura 4.9.: Divergencia del filtro de Kalman debido al mal modelado de un

proceso.
La Figura 4.9 muestra el estado verdadero x1 k y el estado estimado x̂1 k . Se puede
ver que el valor estimado diverge del estado verdadero y el error de estimación
crece ilimitadamente.
Sin embargo, si se añade ruido al proceso ficticio para el filtro de Kalman, el

filtro hará más hincapié en las medidas, lo que mejorará el desempeño del filtro.
600
Estado verdadero
x estimado (Q = 1)
500 x estimado (Q = 0.1)
x estimado (Q = 0.01)
x estimado (Q = 0)
400
300
200
100
0
0 10 20 30 40 50
Tiempo
Figura 4.10.: Mejora del filtrado de Kalman debido a ruido ficticio en el

proceso.
La Figura 4.10 muestra el estado verdadero y el estado estimado cuando se
utilizan diferentes valores de Q en el filtro de Kalman.
0.7
0.6
Q = 1
Q = 0.1
0.5
Q = 0.01
Q = 0
0.4
0.3
0.2
0.1
0
0 10 20 30 40 50
Tiempo
Figura 4.11.: Ganancia de Kalman para varios valores del ruido del proceso.
A medida que el ruido del proceso ficticio se hace más grande, el error de estima-
ción se hace más pequeño. Por supuesto, esto es al precio de empeorar el desem-
peño en el caso de que el modelo del sistema asumido sea realmente correcto.
El diseñador tiene que añadir una cantidad apropiada de ruido del proceso fic-
ticio para compensar el desempeño bajo condiciones nominales de mal modelado.
La Figura 4.11 muestra la evolución temporal de la ganancia de Kalman Kk
en este ejemplo, para varios valores de Q. Como era de esperar, la ganancia Kk
converge a un valor de estado estacionario más grande cuando Q es más grande,
haciendo que el filtro sea más sensible a las mediciones [ver la expresión x̂+k en
la Ecuación (4.85)]. Esto compensa los errores de modelado. También téngase en
cuenta en la Figura 4.11, que la ganancia de Kalman en estado estacionario es de
aproximadamente 0.62 cuando Q = 1.
Este ejemplo ilustra el principio general de que el ruido del modelo es bueno,
pero sólo hasta cierto punto. Si un modelo de sistema tiene mucho ruido, enton-
ces es difı́cil estimar sus estados. Pero si un modelo de sistema tiene muy poco
ruido, entonces el estimador de estados puede ser demasiado susceptible a errores
de modelado. En el diseño de un modelo para un filtro de Kalman, se necesita
balancear la confianza en el modelo (bajo nivel de ruido resulta en un seguimiento
cercano del modelo, es decir, bajo ancho de banda) con una autoduda saludable
(alto ruido resulta en mayor capacidad de respuesta del filtro, es decir, alto ancho
de banda).
Un examen a las ecuaciones del filtro muestra por qué la adición de ruido al
proceso ficticio compensa los errores de modelado. Recordando las ecuaciones
del filtro de Kalman, (4.53) y (4.54), algunas de las cuales se repiten aquı́:
Pk− = Fk−1 Pk−1

+ ⊤
Fk−1 + Qk−1
Kk = Pk− Hk⊤ (Hk Pk− Hk⊤ + Rk )−1 (4.86)
− −
x̂+
Si Qk es pequeña, entonces la covarianza no puede aumentar en gran medida

entre los tiempos de muestreo. En el ejemplo anterior, Fk = 1, por lo que
Pk− = Pk−1
+
cuando Qk = 0. Pero la covarianza se reducirá de Pk− hasta Pk+
cada vez que una medición se obtiene debido a la ecuación de actualización
de la medida de la covarianza. Eventualmente Pk− convergirá a cero. Esto se
puede ver examinado la Ecuación (4.61), la cual muestra la ecuación de un
solo paso para Pk− :
−
Pk+1 = Fk Pk− Fk⊤ − Fk Kk Hk Pk− Fk⊤ + Qk (4.87)
4.6. Resumen 145
Si Qk = 0, entonces la ecuación tiene una solución de estado estacionario

cero. Un valor de cero para Pk− resultará en Kk = 0, como se ve a partir
de las ecuaciones (4.86). Un valor de cero para Kk significa que la ecuación
de actualización de medición (4.86) para x̂ no tomará en cuenta la medida, es
decir, la medida yk se ignora completamente en el cálculo de xk . Esto es, debido
a que la medición del ruido de covarianza Rk (asumiendo que es mayor que
cero), será infinitamente veces más grande que el ruido del proceso, Qk = 0.
El filtro se torna lento en el sentido de que no va a responder a las mediciones.
Por otro lado, si Qk es más grande, entonces la covarianza aumentará siempre
entre muestras temporales; esto es, Pk− siempre será mayor que Pk−1 +
. Cuando
−
Pk converge, lo hará a un valor mayor. Esto hará que Kk converja a un valor
mayor. Un Kk más grande significa que la actualización de la medida de x̂ en
la Ecuación (4.86), incluirá un mayor énfasis en la medición; es decir, el filtro
prestará más atención a las medidas.
4.6. Resumen
En este capı́tulo, se ha presentado la esencia del filtro Kalman en tiempo dis-
creto. Durante las últimas décadas, este algoritmo de estimación ha encontrado
aplicaciones en prácticamente todas las áreas de la ingenierı́a.
Se ha mostrado que las ecuaciones del filtro de Kalman se pueden escribir de
varias maneras diferentes, cada una de las cuales puede parecer muy diferente
a las otras, aunque todas ellas son matemáticamente equivalentes. Se ha visto
que el filtro de Kalman es óptimo incluso cuando el ruido no es gaussiano. El
filtro de Kalman es el estimador óptimo cuando el ruido es gaussiano, y es el
estimador lineal óptimo cuando el ruido no es gaussiano.
También se ha observado que el filtro de Kalman puede no funcionar adecua-
damente si las suposiciones subyacentes no se mantienen. Para esta situación
se mencionaron brevemente algunas formas de compensar los supuestos viola-
dos. En los capı́tulos siguientes se expandirán y generalizarán los resultados
presentados en éste.
Bibliografı́a
Gibbs, B. P. (2011). Advanced Kalman filtering, least-squares and modeling. John Wiley &
Sons, Inc., Hoboken, New Jersey, EE UU.
Grewal, M. S. and Andrews, A. P. (2008). Kalman Filtering: Theory and Practice Using
MATLAB. John Wiley & Sons, Inc., Hoboken, New Jersey, EE UU., 3a edition.
Kailath, T. (1968). An innovations approach to least-squares estimation: Part 1. linear
filtering in additive white noise. IEEE Trans. Autom. Control, AC-13(6): 646–655.
Kailath, T., Sayed, A., and Hassibi, B. (2000). Linear Estimation. Upper Saddle River, New
Jersey, USA.
Kwakernaak, H. and Sivan, R. (1972). Linear Optimal Control Systems. John Wiley & Sons,
Inc., New York, USA.
147
Capı́tulo 5
Formas alternas del filtro de

Kalman
5.1. Introducción
E n este capı́tulo se analizarán algunos modos alternos de presentar las ecua-

ciones del filtro de Kalman. Hay un número de maneras matemáticamente
equivalentes de escribir las ecuaciones del filtro de Kalman. Esto puede ser
confuso. Usted puede leer dos artı́culos o libros que presentan diferentes ecua-
ciones del filtro de Kalman, y las ecuaciones pueden parecer completamente
diferentes. Usted no puede saber si una de las ecuaciones tiene un error tipo-
gráfico, o si son matemáticamente equivalentes. Ası́ que intenta demostrar la
equivalencia de los dos conjuntos de ecuaciones sólo para llegar a un callejón
sin salida matemático, porque no siempre es fácil demostrar la equivalencia de
dos conjuntos de ecuaciones. En este capı́tulo se derivan algunas formulaciones
del filtro de Kalman las cuales son diferentes (pero matemáticamente equiva-
lentes) a las ecuaciones derivadas en el Capı́tulo 4. En este capı́tulo también
se ilustran sus ventajas y desventajas.
5.2. Filtrado de raı́z cuadrada

En los primeros dı́as del filtrado de Kalman surgieron problemas debido a
dificultades numéricas, sobre todo en su implementación. La solución de la
ecuación de Riccati Pk podrá teóricamente ser siempre una matriz semidefini-
da positiva, pero problemas numéricos en implementaciones computacionales
149
150 Capı́tulo 5. Formas alternas del filtro de Kalman
algunas veces conducen a matrices Pk que pueden ser indefinidas o no simétri-

cas. Esto fue a menudo debido a las longitudes de palabra muy cortas en los
computadores de la década de 1960 [Schmidt, 1981]. Pueden surgir problemas
numéricos en casos en los cuales algunos elementos del vector de estado x son
estimados a mucha más precisión que otros elementos del vector x. Esto po-
drı́a ser debido a las discrepancias en las unidades de los elementos del vector
de estado. Por ejemplo, un estado puede estar en unidades de km y puede
estimarse dentro de 0.01 km, mientras que un segundo estado puede estar en
unidades de cm/s y puede estimarse dentro de 10 cm/s. La covarianza para el
primer estado estarı́a en el orden de 10−4 mientras que la covarianza para el
segundo estado serı́a del orden de 102 . Esto dio lugar a una gran cantidad de
investigación durante los años 60 que fue relacionada con la implementación
numérica.
El filtrado de raı́z cuadrada es una manera de aumentar matemáticamente la
precisión del filtro de Kalman cuando la precisión de hardware no está disponi-
ble. Quizá el primer algoritmo de la raı́z cuadrada fue desarrollado por James
Potter para el programa espacial Apolo de la NASA [Battin, 1964]. Aunque el
algoritmo de Potter se limitaba a ruido del proceso cero y medidas escalares,
su éxito condujo a una gran cantidad de investigaciones adicionales de la raı́z
cuadrada en los años siguientes. El algoritmo de Potter se amplió a la ma-
nipulación de procesos ruidosos en [Andrews, 1968], [Dyer and McReynolds,
1969] y se generalizó en dos modos diferentes para manipular medidas vecto-
riales en [Bellantoni and Dodge, 1967] y [Andrews, 1968]. Paul Kaminski da
una buena revisión de la evolución de filtrado de raı́z cuadrada en la primera
década del filtro de Kalman [Kaminski et al., 1971a]. En [Martin and Kailath,
1975] se presentan varios procedimientos de raı́z cuadrada, con los algoritmos
de estimación recursiva de sistemas dinámicos lineales.
Número de condición
Recordando la definición de valores singulares de una matriz. Una matriz P
n × n tiene n valores singulares σ dados como
σ 2 (P) = λ(P⊤ P)
= λ(PP⊤ ) (5.1)
La matriz P⊤ P es definida positiva simétrica y los autovalores de una matriz

simétrica son siempre reales y no negativos, ası́ los valores singulares de tal
5.2. Filtrado de raı́z cuadrada 151
matriz son siempre reales y no negativos. La matriz P es no singular (invertible)

si y solo si todos sus valores singulares son positivos. El número de condición
de una matriz está definido como
σmax (P)
κ(P) = ≥1 (5.2)
σmin (P)
Algunos autores usan definiciones alternas para número de condición, por ejem-
plo, pueden definir el número de condición de una matriz como el cuadrado de
la anterior definición. Cuando κ(P) → ∞, la matriz P se dice ser pobremente
condicionada o mal condicionada, y P se aproxima a una matriz singular. En
la implementación de un filtro de Kalman, la matriz
{ de covarianza} del error
⊤
P será siempre definida positiva porque P = E (x − x̂)(x − x̂) . Se usa la
notación estándar
P>0 (5.3)
para indicar que P es definida positiva. Esto implica que P es invertible, lo cual
a su vez es equivalente a decir que todos los autovalores de P son mayores que
cero. Pero supóngase en el filtro de Kalman que algunos de los elementos de x
son estimados a mucha más precisión que otros elementos de x. Por ejemplo,
supóngase que
[ 6 ]
10 0
(5.4)
0 10−6
Esto significa que el estimado de x1 tiene una desviación estándar de 103 y el

estimado de x2 tiene una desviación estándar de 10−3 . Esto puede ser debido
a unidades en x1 y x2 drásticamente diferentes, o esto podrá ser simplemente
que x1 es mucho más observable que x2 . Los valores singulares de una matriz
singular son las magnitudes de los elementos de la diagonal, los cuales son 106
y 10−6 . En otras palabras,
κ(P) = 1012 (5.5)
Este es un número de condición demasiado grande, lo cual significa que la

matriz P podrı́a parecer como una matriz singular al computador digital. Por
ejemplo, si se tiene un computador con procesador de punto fijo con diez dı́gitos
decimales de precisión, entonces el término 10−12 se representará como cero en

la máquina. Matemáticamente, P es no singular, pero computacionalmente P
es singular.
Algoritmo 5.1 Algoritmo de Cholesky para raı́z cuadrada de matrices.

Cómputo:
for i = 1 to n do
√ ∑
γii = pii − i−1 2
j=1 γij
for j = 1 to n do
γji = 0 j<i
1 ( ∑ )
γji = pji − i−1 γ γ
k=1 jk ik j>i
γii
end for
end for
El filtro de raı́z cuadrada se basa en la idea de encontrar una matriz Γ tal

que P = ΓΓ⊤ . La matriz Γ se denomina la raı́z cuadrada de P. Si P es defi-
nida positiva simétrica entonces siempre tendrá una raı́z cuadrada [Golub and
Van Loan, 1996; Moon and Stirling, 2000]. La raı́z cuadrada de una matriz
puede no ser única; esto es, puede haber más de una solución para Γ en la
ecuación P = ΓΓ⊤ . También nótese que ΓΓ⊤ será siempre semidefinida posi-
tiva simétrica no importa cual sea el valor de la matriz Γ. Considerando que
algunas dificultades numéricas podrı́an ocasionar que P en las ecuaciones del
filtro de Kalman se convierta en no simétrica o indefinida, estas dificultades
numéricas nunca podrán ocasionar que P = ΓΓ⊤ se convierta en no simétrica
o indefinida. Los algoritmos para raı́z cuadrada de matrices fueron dados por
Cholesky [Faddeev and Faddeeva, 1963]. El Algoritmo 5.1 calcula la matriz Γ
tal que P = ΓΓ⊤ para una matriz Pn×n .
Esta es llamada la factorización de Cholesky y resulta en una matriz Γ tal
que P = ΓΓ⊤ . La matriz Γ es referida en la literatura como el triángulo de
Cholesky debido a que ésta es una matriz triangular inferior. Sin embargo, el
algoritmo solamente trabaja si P es definida positiva simétrica. Si P no es
definida positiva simétrica, entonces ésta puede o no tener una raı́z cuadrada.
En el siguiente ejemplo se ilustra la aplicación de la factorización Cholesky.
Ejemplo 5.1
Supóngase que se tiene una matriz P dada como
[ ]
1 2 3
P= 2 8 2
3 2 14
El algoritmo de factorización de Cholesky dice que, para i = 1,
√
γ11 = p11 = 1
1
γ21 = (p21 ) = 2
γ11
1
γ31 = (p31 ) = 3
γ11
Para i = 2, el algoritmo dice que
γ12 = 0
√ √
∑1 √
γ22 = p22 − 2 =
γ2j p22 − γ21
2 = 8−4=2
j=1
( )
1 ∑1
1 1
γ32 = p32 − γ3k γ2k = (p32 − γ31 γ21 ) = (2 − 3 × 2) = −2
γ22 γ22 2
k=1
Para i = 3, el algoritmo dice que

γ13 = 0
γ23 = 0
√ √
∑2 √
γ33 = p33 − 2 =
γ3j p33 − (γ31
2 + γ2 ) =
32 14 − (9 + 4) = 1
j=1
Ası́ se obtiene
[ ]
1 0 0
Γ= 2 2 0
3 −2 1
Se puede verificar que P = ΓΓ⊤ .
Después de definir Γ como la raı́z cuadrada de P en el filtro de Kalman, se

propaga Γ en lugar de P. Esto requiere más esfuerzo computacional pero se
multiplica la precisión del filtro y ayuda a evitar problemas numéricos. Los
valores singulares σ de P están dados como
σ 2 (P) = λ(P⊤ P) = λ(ΓΓ⊤ ΓΓ⊤ ) (5.6)
Los valores singulares de Γ están dados como
σ 2 (Γ) = λ(ΓΓ⊤ ) (5.7)
Recordando que para una matriz general A se tiene λ(A2 ). Por lo tanto, se ve
desde la anterior ecuación que
σ 2 (P) = [σ 2 (Γ)]2
σmax (P) σ 2 (Γ)
= max2
(5.8)
σmin (P) σmin (Γ)
2
κ(P) = κ (Γ)
Esto es, el número de condición de P es el cuadrado del número de condición

de Γ. Por ejemplo, considérese la matriz dada anteriormente en esta sección:
[ 6 ]
10 0
P=
0 10−6 (5.9)
κ(P) = 1012
La raı́z cuadrada de esta matriz y su número de condición son

[ 3 ]
10 0
Γ=
0 10−3 (5.10)
6
κ(Γ) = 10
El número de condición de P es 1012 , pero el número de condición de la raı́z

cuadrada de P es solamente 106 . El filtro de raı́z cuadrada utiliza esta idea
para proporcionar el doble de la precisión del filtro estándar de Kalman. En
vez de propagar P, se propaga la raı́z cuadrada de P.
5.2.1. Ecuación de actualización en el tiempo de la raı́z

cuadrada
Supóngase que se tiene un sistema LTI discreto de n-estados, dado como
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1

{ } (5.11)
E vk vk⊤ = Qk
La matriz de covarianza del error a priori del filtro de Kalman es P− k y su

−
raı́z cuadrada es Γk . La matriz de covarianza del error a posteriori es P+k y su
raı́z cuadrada es Γ+
k . Supóngase que se puede encontrar una matriz ortogonal
θ2n×2n tal que
[ − ⊤] [ + ⊤ ⊤ ] [ + ]
(Γk ) (Γk−1 ) Fk−1 [ ] (Γk−1 )⊤ F⊤k−1
=θ ⊤/2
= θ1 θ2 ⊤/2
(5.12)
0 Qk−1 Qk−1
Puesto que θ es ortogonal se ve que

[ ⊤] [ ⊤ ⊤
] [ ]
⊤
θ 1 [ ] θ1 θ 1 θ 1 θ2 I 0
θ θ = ⊤ θ1 θ2 = ⊤ = (5.13)
θ2 θ2 θ1 θ2⊤ θ2 0 I
donde θ1 y θ2 son ambas matrices n × n. Se ve de lo anterior que
θ1⊤ θ2 = θ2⊤ θ1 = 0
(5.14)
θ1⊤ θ1 = θ2⊤ θ2 = I
Ahora nótese que se puede utilizar la ecuación (5.12) para escribir

[ ] [ ]⊤[ ]
[ − ] (Γ− )⊤ ⊤/2 ⊤/2
Γk 0 k
= θ1 (Γ+ ⊤ ⊤ + ⊤ ⊤
k−1 ) F k−1 + θ Q
2 k−1 θ 1 (Γk−1 ) F k−1 + θ Q
2 k−1
0
Se puede usar esta ecuación, junto con la ecuación (5.14), para escribir
⊤/2
Γ− − ⊤ ⊤ ⊤ ⊤ ⊤
+ + 1/2
k (Γk ) = Fk−1 Γk−1 θ1 θ1 (Γk−1 ) Fk−1 + Qk−1 θ2 θ2 Qk−1
⊤ ⊤ 1/2 ⊤/2
= Fk−1 Γ+ +
k−1 (Γk−1 ) Fk−1 + Qk−1 Qk−1 (5.15)
Si Γ+ +
k−1 es la raı́z cuadrada de Pk−1 , esto implica que
P− + ⊤
k = Fk−1 Pk−1 Fk−1 + Qk−1 (5.16)
la cual es exactamente la ecuación de actualización en el tiempo para Pk que

se requiere en el filtro de Kalman, como se muestra en la ecuación (4.54). Por
lo tanto, si se puede encontrar una matriz ortogonal θ2n×2n tal que
[ + ⊤ ⊤ ] [ ]
(Γk−1 ) Fk−1 matriz n×n
θ ⊤/2
= (5.17)
Q 0
k−1
entonces la matriz n × n en la mitad superior de la estructura matricial del

lado derecho será igual a (Γ− ⊤ + ⊤
k ) . Esto supone que (Γk−1 ) está disponible de
la ecuación de actualización de medida de la raı́z cuadrada, como se verá más
adelante. La ecuación de actualización del tiempo de la raı́z cuadrada anterior
es matemáticamente equivalente a la ecuación de actualización en el tiempo
del filtro de Kalman original para P, pero la ecuación de actualización se usa
para actualizar Γ en lugar de P.
Como se observó anteriormente, la raı́z cuadrada de P− k no es única, de
manera que diferentes algoritmos para la solución de la ecuación (5.17) darán
lugar a diferentes matrices θ y (Γ− ⊤
k ) . Se pueden usar varios métodos de algebra
lineal para encontrar la matriz ortogonal θn×n y la matriz de la raı́z cuadrada
resultante Γ−k.
5.2.2. Algoritmos para transformaciones ortogonales

Varios algoritmos numéricos están disponibles para llevar a cabo las transfor-
maciones ortogonales que se requieren para resolver las matrices θ y la matriz
raı́z cuadrada resultante Γ− k de la Ecuación (5.17). Algunos algoritmos que
pueden ser utilizados son el método de Householder, el método de Givens, el
método de Gram–Schmidt y el método de Gram–Schmidt modificado. En esta
sección se presentará (sin derivación) el algoritmo de Householder y el algorit-
mo de Gram–Schmidt modificado. Deducciones y presentaciones de los otros
algoritmos se pueden encontrar en muchos textos sobre álgebra lineal numéri-
ca, como [Horn and Johnson, 1985], [Golub and Van Loan, 1996], [Moon and
Stirling, 2000]. Una comparación de Gram–Schmidt, Gram–Schmidt modifi-
cado y las transformaciones de Householder se puede encontrar en [Jordan,
1968], donde se establece que el procedimiento de Gram–Schmidt modificado
es mejor (desde un punto de vista numérico) que el método de Householder,

ofreciendo un desempeño de muy alta calidad.
El algoritmo de Householder
El algoritmo que se presenta aquı́ lo desarrolló Alston Householder [Househol-

der, 1975], se aplicó a la estimación de mı́nimos cuadrados por Gene Golub
[Golub and Van Loan, 1996] y se configuró para filtrado de Kalman por Paul
Kaminski [Kaminski et al., 1971b].
1. Supóngase que se tiene una matriz 2n × n A(1) y se desea encontrar una
matriz W n × n tal que
[ ]
(1) W
θA = (5.18)
0
donde θ es una matriz ortogonal 2n × 2n y 0 es una matriz n × n con-

formada por ceros. Obsérvese que el enunciado de este problema está en
la misma forma que la Ecuación (5.17). También téngase en cuenta que
no necesariamente se requiere hallar θ; el objetivo es encontrar W.
2. Para k = 1, . . . , n realizar lo siguiente:
a) Calcular el escalar ςk como

v
( )uu∑2n ( )2
(k) t (k)
ςk = sgn Akk Aik (5.19)
i=k
(k)
donde Aik es el elemento de la i−ésima fila y la k−ésima columna
de A(k) . La función sgn(x) se define como
{
+1 x≥0
sgn =
−1 x<0
b) Calcular el escalar βk como

1
βk = ( ) (5.20)
(k)
ςk ςk + Akk
c) Para i = 1, . . . , 2n realizar lo siguiente:



 0 i<k

(k) (k)
ui = ςk + Akk i=k (5.21)


A (k)
i>k
ik
Esto da un vector columna u(k) con 2n-elementos.

d ) Para i = 1, . . . , n realizar lo siguiente:


 0 i<k
(k)
yi = 1 i=k (5.22)

 (k)
βk u(k)⊤ Ai i>k
(k)
donde Ai es la i-ésima columna de A(k) . Esto da un vector colum-
na y(k) con n-elementos,
e) Calcular la matriz A(k+1) 2n × n como
A(k+1) = A(k) − u(k) y(k)⊤ (5.23)
3. Después de que los anteriores pasos han sido ejecutados, A(n+1) tiene la
forma
[ ]
(n+1) W
A = (5.24)
0
donde W es la matriz n × n que se está tratando de resolver. Si ςk = 0

en cualquier etapa el algoritmo, significa que A(1) tiene rango deficiente
y el algoritmo fallará. Nótese que el procedimiento anterior no calcula la
matriz θ.
4. La matriz θ se puede encontrar como
θ (k) = I − βk u(k) u(k)⊤ i = 1, . . . , n

(5.25)
θ=θ (n) (n−1)
θ ···θ (1)
El procedimiento está resumido en el Algoritmo 5.2.

Algoritmo 5.2 Algoritmo de Householder.

for k = 1 to n do
( ) √∑ ( )2
(k) 2n (k)
ςk = sgn Akk i=k A ik
1
βk = ( )
(k)
ςk ςk + Akk
for i = 1 to 2n do
if i < k then
(k)
ui = 0
else if i = k then
(k) (k)
ui = ςk + Akk
else if i > k then
(k) (k)
ui = Aik
end if
end for
for i = 1 to n do
if i < k then
(k)
yi = 0
else if i = k then
(k)
yi = 1
else if i > k then
(k) (k)
yi = βk u(k)⊤ Ai
end if
end for
[ ]
W
A (k+1)
=A (k)
−u y (k) (k)⊤
→A (n+1)
=
0
for i = 1 to n do
∏1I −(i)βk u u
θ (k) = (k) (k)⊤
θ = nθ
end for
end for
Ejemplo 5.2
Usar el método de Householder para encontrar una
 matriz
 ortogonal θ tal que
[ ] 1 1
W 2 2
donde W es una matriz 2 × 2 y A =  = A(1)
1
θA =
0 0
2 2
Solución:
Aplicando el Algoritmo 5.2 se obtiene:
v
( )u
u∑4 ( ) √
(1) t (1) 2
ς1 = sgn A11 Ai1 = 12 + 2 2 + 0 2 + 2 2 = 3
i=1
1 1 1
β1 = ( )= =
ς1 ς1 +
(1)
A11 3(3 + 1) 12
(1) (1)
u1 = ς1 + A11 = 3 + 1 = 4
(1) (1)
u2 = A21 = 2
(1) (1)
u3 = A31 = 0
(1) (1)
u4 = A41 = 2
[ ]⊤
⊤
u(1) = u(1)
1
(1)
u2
(1)
u3
(1)
u4 = [4 2 0 2]
(1)
y1 = 1
 
1
(1) (1) 1 2 1
y2 = β1 u(1)⊤ A2 = [4 2 0 2]   = (4 + 4 + 0 + 4) = 1
12 1 12
2
⊤
y = [1 1]
       
1 1 4 1 1 4 4
2 2 2 2 2 2 2
A(2) = A(1) − u(1) y(1)⊤ = − −
1 0
[1 1] = 
0 0 1 0 0
2 2 2 2 2 2 2
 
−3 −3
0 0
A(2) =
0 1
0 0
v
u 4 ( ) √( ) ( ) ( )
u∑ (2) 2 (2) 2 (2) 2 (2) 2
ς2 = sgn(0) t Ai2 = A22 + A32 + A42
i=2
√
= 0+1+0=1
1 1
β2 = ( )= =1
(2)
ς2 ς2 + A22 1(1 + 0)
(2)
u1 = 0
(2)
u2 = ς2 + 0 = 1
(2) (2)
u3 = ς2 + A32 = 1 + 0 = 1
(2) (2)
u4 = A42 = 0
 
0
(2) 1 ⊤
u =   = [0 1 1 0]
1
0
(2)
y1 = 0
(2)
y1 = 0
⊤
y(2) = [0 1]
       
−3 −3 0 −3 −3 0 0
0 0  1 0 0  0 1
A(3) = A(2) − u(2) y(2)⊤ = − −
1  1
[0 1] = 
0 0 1  0 1
0 0 0 0 0 0 0
 
−3 −3
 0 −1
A(3) = 
0 0
0 0
[ ]
−3 −3
W= (5.26)
0 −1
( )( )
θ = I − β2 u(2) u(2)⊤ I − β1 u(1) u(1)⊤
        
1 0 0 0 0 1 0 0 0 4
0 1 0 0 1 0 1 0 0 1 2 
=  −1 −
0 0 1 0 1
[0 1 1 0]
0 120
[4 2 0 2]
0 0 1
0 0 0 1 0 0 0 0 1 2
  1   1 
1 0 0 0 −3 − 23 0 − 32 −3 − 23 0 − 32
0 0 −1 0  − 3
2 2
0 − 13   0
= 0 −1 0  
θ=  
3
0 −1 0 0 0 0 1 0   23 − 23 0 1 
3
0 0 0 1 −2 3 − 13 0 32 − 23 − 13 0 2
3
El algoritmo de Gram–Schmidt modificado
El algoritmo de Gram–Schmidt modificado para ortonormalización que se pre-

senta aquı́, se discute en la mayorı́a de los libros de sistemas lineales [Kailath,
1980], [Chen, 1984]. Para filtrado de Kalman se puede encontrar en [Kaminski
et al., 1971b].
1. Supóngase que se tiene la matriz A(1) de 2n × n y se desea encontrar una
matriz W tal que
[ ]
(1) W
θA = (5.27)
0
donde θ es una matriz ortogonal 2n × 2n y 0 es una matriz n × n confor-

mada por ceros. Nótese que este problema se plantea de la misma forma
como en la Ecuación (5.17).
2. Para k = 1, . . . , n desarrollar lo siguiente:
a) Calcular el escalar ςk como
√
(k)⊤ (k)
ςk = Ak Ak (5.28)
(k)
donde Ak es la k-ésima columna de A(k) .
b) Calcular la k–ésima fila de W como


 0 j = 1, . . . , k − 1


ςk j=k
Wkj = (5.29)


 1 A(k)⊤ A(k)
j j = k + 1, . . . , n
ςk k
c) Calcular la k–ésima fila de θ como

1 (k)⊤
θk = A (5.30)
ςk k
d ) Si k < n, calcular las últimas (n − k) columnas de A(k+1) como
(k+1) (k) 1 (k)

Aj = Aj − Wkj Ak j = k + 1, . . . , n (5.31)
ςk
Al igual que con el algoritmo de Householder, si ςk = 0 en cualquier etapa,

significa que A(1) es de rango deficiente y el algoritmo falla. Después que
se completa el algoritmo, se tienen las primeras n filas de θ. Ésta es una
matriz n × 2n. Para calcular las últimas n filas de θ, se puede utilizar un
algoritmo regular de Gram–Schmidt de la siguiente manera [Golub and
Van Loan, 1996], [Moon and Stirling, 2000], [Horn and Johnson, 1985]:
a) Expandir la matriz θ que se inició anteriormente, añadiendo una
matriz identidad 2n × 2n en la parte inferior de la misma. Esto
asegura que las filas de θ abarcan todo el espacio vectorial 2n–
dimensional:
[ ]
θ
θ := (5.32)
I 3n×2n
b) Ahora se efectúa un procedimiento estándar de ortonormalización

Gram–Schmidt en las últimas 2n filas de θ (con respecto a las n
primeras filas de θ ya obtenidas).
Para k = n + 1, . . . , 3n, calcular la k-ésima fila de θ como
∑
k−1
( )
θk := θk − θk θi⊤ θi
i=1
θk
θk := (5.33)
||θ||2
Si θk es cero, significa que es una combinación lineal de las filas ante-

riores de θ. En ese caso, la división en la ecuación anterior será una
división entre cero, de modo que θk debe descartarse. Este descarte ocu-
rrirá exactamente n veces, de modo que este procedimiento calculará las
n filas adicionales de θ y se terminará obteniendo una matriz ortogonal
θ2n×2n .
Un resumen del procedimiento de Gram–Schmidt modificado para orto-
normalización se muestra en el Algoritmo 5.3.
Ejemplo 5.3
Utilizar el método de Gram–Schmidt modificado para resolver el Ejemplo 5.2.
Solución:
Siguiendo el Algoritmo 5.3 se tiene
v  
u
√ u 1
u  2 √
=u
(1)⊤ (1)
ς1 = A1 A1 t[1 2 0 2] 0 = 1 + 4 + 0 + 4 = 3
2
 
1
1 (1)⊤ (1) 1 2
W11 = 3; W12 = A1 A1 = [1 2 0 2]   = 3
3 3 0
2
W1 = [W11 W12 ] = [3 3]
1 (1)⊤ 1 [ ]
θ1 = A 1 = [1 2 0 2] = 13 2
3 0 2
3
ς 3
Algoritmo 5.3 Algoritmo de Gram–Schmidt modificado.

(1 ) Realizar procedimiento
for k = 1 to n do
(a) Calcular
√ el escalar ςk
(k)⊤ (k)
ςk = Ak Ak
(b) Calcular la k–ésima fila de W
if j ≤ k − 1 then
Wkj = 0
else if j = k then
Wkj = ςk
else if k + 1 ≤ j ≤ n then
(k)⊤ (k)
Wkj = ς1k Ak Ak
end if
(c) Calcular la k–ésima fila de θ
1 (k)⊤
θk = ςk
Ak
(d ) Calcular las últimas (n − k) columnas de A(k+1)
if k < n then
for j = k + 1 to n do
(k+1) (k) (k)
Aj = Aj − 1
ςk
Wkj Ak
end for
end if
end for
(2 ) Expandir la matriz θ
[ ]
θ
θ :=
I 3n×2n
(3 ) Recalcular la k-ésima fila de θ
for k = n + 1 to 3n do
∑ ( ⊤
)
θk := θk − k−1 i=1 θk θi θi
θk
θk :=
||θ||2
end for
     
1 1 0
(2) (1) 1 (1) 2 1 2 0
A2 = A2 − W12 A1 = − ·3· = 
ς1 1 3 0 1
2 2 0
v  
u
√ u 0
u 0 √
ς2 =
(2)⊤
A2
(2)
A2 u
= t[0 0 1 0]   = 0 + 0 + 1 + 0 = 1
1
0
Para k = 2
W21 = 0; W22 = 1; W2 = [W21 W22 ] = [0 1]
1 (2)⊤ 1
θ2 = A = [0 0 1 0] = [0 0 1 0]
ς2 2 1
θ3 = [1 0 0 0]
θ4 = [0 1 0 0]
θ5 = [0 0 1 0]
θ6 = [0 0 0 1]
( ) ( )
θ3 = θ3 − θ3 θ1⊤ θ1 − θ3 θ2⊤ θ2
  1 
3
  2  [ 1 ]
= [1 0 0 0] − 
 [1 0 0 0]  3 
 0  3
2
3 0 2
3 −0
2
3
1 [1 2 ]
= [1 0 0 0] − 3 3 0 23
[ 3]
θ3 = 89 − 29 0 − 92
θ3 [ √ ]
θ3 = = 2 3 2 − 3√ 1
0 − 1
√
||θ3 ||2 2 3 2
[ √ √ √ ]
θ3 = 2 3 2 − 62 0 − 62
( ) ( ) ( )
θ4 = θ4 − θ4 θ1⊤ θ1 − θ4 θ2⊤ θ2 − θ4 θ3⊤ θ3
1  
3 0
2 [1 ] 0
= [0 1 0 0]−[0 1 0 0] 3 
 · 2
0 3 −[0
2 1 0 0] ·[0 0 1 0]
0 3 3 1
2 0
3
 √ 
2 2
 3√2  [ √ √ √ ]
 
− [0 1 0 0] − 6  · −2 2
0 2
− 62
 0√  3 6
− 62
[ ] [ ] [ ]
= [0 1 0 0] − 29 49 0 49 + 92 − 18 1
0 − 18
1
= 0 1
2 0 − 12
θ4
θ4 =
||θ4 ||2
√ √ √
1 1 1 1 2
||θ4 ||2 = 0+ +0+ = =√ =
4 4 2 2 2
[ √ √ ]
θ4 = 0 22 0 − 22
 1 2 2 
3 3 0 3
 √ 0 1√ 0 0√ 
θ = 2 2 
 −√ 62 0 − √62 
3
0 2
2
0 − 22
Ejemplo 5.4
Supóngase que en el tiempo (k − 1) el filtro de Kalman tiene la matriz del sis-
tema, la covarianza del ruido del proceso y la raı́z cuadrada de la covarianza de
estimación a posteriori dadas por
[ ] [ ] [ ]
1 1 0 0 + 1 0
Fk−1 = ; Qk−1 = ; Γk−1 =
0 1 0 2 0 1
1/2 ⊤/2
Puede verificarse que la raı́z cuadrada de Qk−1 (tal que Qk−1 Qk−1 = Qk−1 ) está
dada por
[ ]
1/2 0 0
Qk−1 =
−1 −1
La Ecuación (5.17) se puede resolver, v.gr., aplicando el algoritmo de Gram–

Schmidt modificado, es decir,
[ + ⊤ ⊤ ] [ ]
(Γk−1 ) Fk−1 (Γ−k)
⊤
θ ⊤/2
=
Qk−1 0
√ √   √ √ 
5 5 0 0 1 0 20 5
1  1 −1 2 2  1 1  1  0 −5
√   0 −1 = √  0
10 −2 −2 1
√ √1 10 0 
0 0 − 5 5 0 −1 0 0
La submatriz 2 × 2 superior, al lado derecho de la anterior ecuación, es igual a

(Γ− ⊤
k ) . Ası́, ésta indica que la raı́z cuadrada de la covarianza de la estimación a
priori en el tiempo k está dada por
[√ ]
1 20 0
Γ− = √ √
k
10 5 −5
De esto se puede inferir que la covarianza de estimación a priori en el tiempo k
está dada como
[ ]
− − − ⊤ 2 1
Pk = Γk (Γk ) =
1 3
En efecto, una implementación directa de la ecuación de actualización en el tiempo

para la covarianza de estimación del error da
[ ]
2 1
P− = F P+
F ⊤
k−1 k−1 k−1 + Q k−1 =
k 1 3
lo cual confirma el resultado de la raı́z cuadrada. Sin embargo, la actualización

en el tiempo de la raı́z cuadrada tiene básicamente el doble de la precisión de la
ecuación de tiempo de actualización estándar.
Algoritmo de actualización de la medida de raı́z cuadrada de Potter
La ecuación de actualización de la medida de raı́z cuadrada discutido aquı́ se

basa en el algoritmo de J. Potter, el cual fue desarrollado para el programa es-
pacial Apolo de la NASA [Battin, 1964], [Kaminski et al., 1971a] y modificado
por A. Andrews para manejar medidas vectoriales [Andrews, 1968]. Recordan-
do de la Ecuación (4.54) que la expresión para la actualización de la medida
de la covarianza estimada, dada como
−
k = (I − Kk Hk )Pk
P+ (5.34)
se puede procesar la medición de una en una utilizando el llamado filtro de

Kalman secuencial [Brown and Hwang, 1996]. Esto es, primero se inicializa
−
P+0k = Pk . Entonces, para i = 1, . . . , r (donde r es el número de mediciones),
se calcula
⊤
P+
i−1,k Hik
Kik = ⊤
Hik P+
i−1,k Hik + Rik (5.35)
ik = (I − Kik Hik )Pi−1,k
P+ +
donde Hik es la i-ésima fila de Hk y Rik es la varianza de la i-ésima medición;

se asume, que Rk es diagonal. Supóngase que se tiene la raı́z cuadrada de P+
i−1,k
tal que P+
i−1,k = Γ +
Γ+⊤
i−1,k i−1,k . Entonces K ik puede escribirse como
⊤
Γ+ +⊤
i−1,k Γi−1,k Hik
Kik = ⊤
(5.36)
Hik Γ+ +⊤
i−1,k Γi−1,k Hik + Rik
y P+
ik puede escribirse como
( )
+ +⊤ ⊤
Γ Γ H
i−1,k i−1,k ik H ik
P+
ik = I− ⊤
Γ+ +⊤
i−1,k Γi−1,k
Hik Γ+ Γ +⊤
H
i−1,k i−1,k ik + R ik
( )
+ +⊤ ⊤ +
Γ Γ H
i−1,k i−1,k ik H ik Γ i−1,k
= Γ+ i−1,k − ⊤
Γ+⊤
i−1,k
Hik Γ+ Γ+⊤
H
i−1,k i−1,k ik + R ik
⊤
ik = Γi,k Γi,k = Γi−1,k (I − αϕϕ )Γi−1,k
P+ + +⊤ + +⊤
(5.37)
donde ϕ y α están definidos como
⊤ 1
ϕ = Γ+⊤
i−1,k Hik α = (5.38)
ϕ⊤ ϕ + Rik
Se puede demostrar (ver Ejemplo 5.5 a continuación) que
I − αϕϕ⊤ = (I − αγϕϕ⊤ )2 (5.39)
donde γ está dado (ver Ejemplo 5.5 a continuación) como,

1
γ= √ (5.40)
1± αRik
Ya sea el signo más o el menos se puede usar para el cálculo de γ. Sustituyendo
la Ecuación (5.39) en la Ecuación (5.37) se obtiene
⊤
ik = Γi−1,k (I − αγϕϕ )
Γ+ +
(5.41)
Esto da como resultado un algoritmo de actualización de la medida de raı́z

cuadrada. Aunque el filtro de raı́z cuadrada mejora las caracterı́sticas del filtro
de Kalman, también aumenta los requerimientos computacionales.
Ejemplo 5.5
Verificar la Ecuación (5.39).
Solución:
Desarrollando el cuadrado del miembro del lado derecho se obtiene
I − αϕϕ⊤ = (I − αγϕϕ⊤ )2
I − αϕϕ⊤ = I − 2αγϕϕ⊤ + (αγϕϕ⊤ )2
0 = (αγϕϕ⊤ )2 − 2αγϕϕ⊤ + αϕϕ⊤ (5.42)
Tomando la transpuesta de la Ecuación (5.42)
0 = (αϕ⊤ ϕ)2 γ 2 − 2αϕ⊤ ϕγ + αϕ⊤ ϕ

= (αϕ⊤ ϕ)(αϕ⊤ ϕγ 2 − 2γ + 1) (5.43)
Puesto que ϕ es definida positiva, entonces la Ecuación (5.46) será válida para el
caso
0 = αϕ⊤ ϕγ 2 − 2γ + 1 (5.44)
De la Ecuación (5.38)
αϕ⊤ ϕ + αRik = 1
αϕ⊤ ϕ = 1 − αRik (5.45)
Sustituyendo (5.45) en (5.44) se obtiene
0 = (1 − αRik )γ 2 − 2γ + 1; es decir,
αRik γ 2 = 1 − 2γ + γ 2 = (1 − γ)2
√
± αRik γ = 1 − γ
√
γ ± αRik γ = 1
1
γ= √ (5.46)
1 ± αRik
El cual es el factor de ajuste de modo que se cumpla la Ecuación (5.39).
Algoritmo 5.4 Actualización de la medida de raı́z cuadrada de Potter.

Inicialización
1. raı́z cuadrada de la covarianza a priori Γ−
k y el estimado del estado a
priori x̂−k :
−
x̂+
0k = x̂k
− (5.47)
Γ+0k = Γk
2. Realizar
for i = 1 to r do
(a) Definir:
(i) Hik ← i-ésima fila de Hk ,
(ii ) yik ← i-ésimo elemento de yk ,
(iii ) Rik ← varianza de la i -ésima medición (Rk diagonal).
(b) Calcular:
⊤
ϕi = Γ+⊤
i−1,k Hik
1
αi = ⊤
ϕi ϕi + Rik
1
γ= √ (5.48)
1 ± αi Rik
⊤
i−1,k (I − αi γi ϕi ϕi )
Γik = Γ+
+
Kik = αi Γ+ ik ϕi
x̂ik = x̂i−1,k + Kik (yik − Hik x̂+
+ +
i−1,k )
end for
3. raı́z cuadrada de la covarianza a posteriori y el estimado del estado a
posteriori
Γ+ +
k = Γrk
(5.49)
x̂+ +
k = x̂rk
Ejemplo 5.6
Supóngase que se tiene un sistema LTI con
[ ] [ ]
1 0 1 0
P− = F =
k 0 1 0 1
[ ]
0 0
H = [1 0] Q=
0 0
Si se tuviera un computador de precisión infinita, la ganancia de Kalman exacta

y la covarianza a posteriori en el tiempo k estarı́an dadas por
[ 1 ]
Kk = P− k H ⊤
(HP − ⊤
k H + R) −1
= 1+R
0
[ R ]
− 1+R 0
P+k = (I − Kk H)Pk =
0 1
La covarianza a posteriori y la ganancia de Kalman en el siguiente paso de tiempo
(k + 1) estarı́an dadas por
[ R ]
− + ⊤ 1+R 0
Pk+1 = FPk F + Q =
0 1
[ 1 ] (5.50)
Kk+1 = P− ⊤ − ⊤
k+1 H (HPk+1 H + R)
−1
= 2+R
0
Ahora considérese la implementación en un computador digital de precisión finita.
Supóngase que la covarianza de medición R ≪ 1. La covarianza R es un√número
pequeño tal que debido al redondeo en el computador, 1+R u 1, pero 1+ R > 1.
Los valores de redondeo de la ganancia Kalman y la covarianza a posteriori en el
tiempo k estarán dadas por
[ 1 ] [ ]
1
Kk = 1+R =
0 0
[ ]
− 0 0
Pk = (I − Kk H)Pk =
+
0 1
Nótese que P+k se ha convertido en singular debido a las limitaciones numéricas

del computador. Los valores de redondeo de la covarianza a priori y la ganancia
de Kalman en el siguiente paso de tiempo (k + 1) estarán dados por
[ ]
0 0
P− = FP + ⊤
F + Q =
k+1 k 0 1
[ ] (5.51)
− ⊤ − ⊤ −1 0
Kk+1 = Pk+1 H (HPk+1 H + R) =
0
Las limitaciones numéricas del computador han dado como resultado una ganancia
de Kalman cero, mientras que la ganancia de Kalman de precisión infinita, como se

⊤
indica en la Ecuación (5.50), es de aproximadamente [1/2 0] . Ahora supóngase
que se implementa la ecuación de actualización de la medida usando el algoritmo
de Potter. Se comienza con
[ ]
− 1 0
Γk = (5.52)
0 1
sólo se tiene que iterar la Ecuación (5.48) una vez, ya que sólo se tiene una
medición. Los valores alrededor de los parámetros dados en la Ecuación (5.48)
son
[ ]
− ⊤ ⊤ 1
ϕ = (Γk ) H =
0
1 1
α= ⊤ = ≈1
ϕ ϕ+R 1+R
1 1
γ= √ = √
1 + αR 1+ R
[ √ ]
√R
− ⊤ 0
k = Γk (I − αγϕϕ ) =
Γ+ 1+ R
0 1
Nótese que Γ+ +⊤
k Γk es no singular. Los valores alrededor de la raı́z cuadrada de la
covarianza a priori, los parámetros de la Ecuación (5.48) y la ganancia de Kalman
en el siguiente paso de tiempo (k + 1) estarán dados por
Γ− +
k+1 = Γk
[ √ ]
√R
ϕ = (Γ− ⊤ ⊤
k+1 ) H =
1+ R
0
√ √
1 1+R+2 R 1+2 R (5.53)
α= ⊤ = √ ≈ √
ϕ ϕ+R R2 + 2R + 2R R 2R(1 + R)
√ [ ] [ 1√
]
R √
− 1+2 R
Kk+1 = αΓk+1 ϕ ≈ √ 1+R+2 R ≈ 2(1+ R)
2R(1 + R) 0 0
Nótese que la ganancia de Kalman redondeada es casi idéntica a la ganancia de

Kalman exacta dada por la Ecuación (5.50). Esto demuestra el beneficio que se
puede obtener mediante el uso del filtro de raı́z cuadrada.
5.3. Filtro de información 175
5.3. Filtro de información
En esta sección, se discute el filtro de información. Esta es una implementación

del filtro de Kalman que propaga la inversa de P en lugar de la propagación
de P; esto es, el filtro de información propaga la matriz de información del
sistema. Recordando que
{ }
P = E (x − x̂)(x − x̂)⊤ (5.54)
Esto es, P representa la incertidumbre en el estimado del estado. Si P es

“grande” entonces se tiene mucha incertidumbre en el estimado del estado. En
el lı́mite cuando P → 0 se tiene perfecto conocimiento de x y cuando P → ∞
se tiene cero conocimiento de x. La matriz de información se define como
I = P−1 (5.55)
Esto es, I representa la certeza en el estimado del estado. Si I es “grande”

entonces se tiene mucha confianza en el estimado del estado. En el lı́mite
cuando I → 0 se tiene cero conocimiento de I y cuando I → ∞ se tiene
perfecto conocimiento de x.
Recordando de la Ecuación (4.54) que la expresión de actualización de la
medida para P puede escribirse como
−1
(P+
k) = (P−
k)
−1
+ H⊤ −
k Rk Hk (5.56)
sustituyendo la definición de I en esta ecuación da

− ⊤ −
k = Ik + Hk Rk Hk
I+ (5.57)
Esto da la ecuación de actualización de la medición para la matriz de informa-

ción. Recordando de la Ecuación (4.53) que la expresión de actualización en el
tiempo para P:
P− + ⊤
k = Fk−1 Pk−1 Fk−1 + Qk−1 (5.58)
Esto implica que

[ ]−1
I− + −1 ⊤
k = Fk−1 (Ik−1 ) Fk−1 + Qk−1 (5.59)
Ahora se puede usar el lema de inversión de matrices, el cual se vuelve a

replantear aquı́:
−1 −1
(A + BD−1 C) = A−1 − A−1 B(D + CA−1 B) CA−1 (5.60)
Si se hacen las identificaciones A = Qk−1 , B = Fk−1 , C = F⊤ k−1 y D = Ik−1 ,

+
entonces se puede aplicar el lema de inversión de matrices a la Ecuación (5.59)

para obtener
I− −1 −1 ⊤ −1 −1 ⊤ −1
k = Qk−1 − Qk−1 Fk−1 (Ik−1 + Fk−1 Qk−1 Fk−1 ) Fk−1 Qk−1
+
(5.61)
Esto da la ecuación de actualización del tiempo para la matriz de información.

El filtro de información puede resumirse en el Algoritmo 5.5.
Algoritmo 5.5 Filtro de información.

1. Dinámica del sistema:
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1
yk = Hk xk + wk
vk ∼ (0, Qk )
wk ∼ (0, Rk )
E {vk wj⊤ } = 0
2. Inicialización del filtro de Kalman:
x̂+
0 =[ E {x0 }
{ + ⊤
}]−1
I0 = E (x0 − x̂+
+
0 )(x0 − x̂0 )
3. Cálculo del filtro de información:
for k = 1 to n do
I− −1 −1 ⊤ −1 −1 ⊤ −1
k = Qk−1 − Qk−1 Fk−1 (Ik−1 + Fk−1 Qk−1 Fk−1 ) Fk−1 Qk−1
+
− ⊤ −1
Ik = Ik + Hk Rk Hk
+
−1 ⊤ −1
Kk = (I+ k ) Hk Rk (5.62)
− +
x̂k = Fk−1 x̂k−1 + Gk−1 uk−1
− −
x̂+
end for
Las ecuaciones del filtro de Kalman estándar requieren la inversión de una

5.3. Filtro de información 177
matriz r × r, donde r es el número de mediciones. Las ecuaciones del filtro

de información requiere al menos un par de inversiones de matrices n × n,
donde n es el número de estados. Por lo tanto, si r ≫ n (es decir, se tiene
significativamente más mediciones que estados) puede ser computacionalmente
más eficiente usar el filtro de información. Se podrı́a argumentar que, dado que
la ganancia de Kalman se da como
⊤ −1
Kk = P +
k Hk R k (5.63)
se tiene que realizar e invertir de todos modos una matriz r × r sobre Rk , si

se usa el filtro de Kalman estándar o el filtro de información. Pero si Rk es
constante, entonces se podrı́a invertir ésta como parte del proceso de inicia-
lización. Ası́, la ecuación de ganancia de Kalman, después de todo, puede no
requerir esta inversión de una matriz r × r. La misma idea se aplica también a
la inversión de Qk−1 . Si la incertidumbre inicial es infinita, no se puede escoger
0 → ∞, pero se puede escoger numéricamente I0 = 0. Esto
+
numéricamente P+
hace el filtro de información matemáticamente más preciso para el caso de cer-
teza inicial cero. Sin embargo, si la incertidumbre inicial es cero (es decir, se
tiene perfecto conocimiento de x0 ), se puede escoger numéricamente P+ 0 = 0,
pero no se puede escoger numéricamente I+ 0 → ∞. Esto hace el filtro de Kal-
man estándar, matemáticamente más preciso para el caso de incertidumbre
inicial cero.
Ejemplo 5.7
Una masa radiactiva tiene una vida media de τ s. A cada paso de tiempo k el
número de partı́culas emitidas x es la mitad de las emitidas en el paso de tiempo
anterior, pero hay algún error vk (media cero con varianza Qk ) en el número
de partı́culas emitidas debido a la radiación de fondo. En cada paso de tiempo
el número de partı́culas emitidas se cuenta con dos instrumentos separados e
independientes. Ambos instrumentos tienen un error aleatorio en cada paso de
tiempo que es de media cero con una varianza unidad. La incertidumbre inicial
en el número de partı́culas radiactivas es una variable aleatoria con media cero y
varianza unidad.
1. Las ecuaciones de tiempo discreto que modelan este sistema tienen una
variable de estado unidimensional y una de medición de dos dimensiones.
Utilizar el filtro de información para calcular las matrices de información a
priori y a posteriori en k = 1 y k = 2. Supóngase que Q0 = 1 y Q1 = 5/4.
2. Otra forma de resolver este problema es darse cuenta que las dos medi-
ciones pueden promediarse formando una única medida con una variación
más pequeña que las dos medidas independientes. ¿Cuál es la varianza de
la medida promedio en cada paso de tiempo? Usar las ecuaciones del filtro
estándar de Kalman para calcular las matrices de covarianza a priori y a
posteriori en k = 1 y k = 2 y comprobar que son las inversas de las matrices
de información que se calcularon en la parte 1.
Solución:
El modelo del sistema está dado como

1
xk = xk−1 + vk−1
[2 ]
1
yk = x + wk
1 k
donde vk ∼ (0, Qk ) y wk ∼ (0, I).

1. Las expresiones de la matriz de información están dadas en las ecuaciones
(5.62), de las cuales se obtiene
I− −1 −1 2 −1 −1 −1
k = Qk−1 − Qk−1 F (Ik−1 + F Qk−1 ) Qk−1
2 +
1 F2 1
= − ·
Qk−1 Q2k−1 I+
k−1 +
F2
Qk−1
1 F2 1
I−
1 = − 2 · + F2
Q 0 Q 0 I0 +
Q0
1 1 4
=1− · =
4 1 + 14 5
− ⊤ −1 − ⊤ −1
I+
k = Ik + Hk Rk Hk = Ik + Hk I Hk
[ ][ ]
− 1 0 1
I+
k = Ik + [1 1] 0 1 1
4 14
I+
1 = +2=
5 5
1 F 2 1
I−
2 = − 2 · + F2
Q 1 Q 1 I1 +
Q 1
4 1 42 1 4 4 1 56
= − · 2· = − · =
5 4 5 14
5 + 14 · 4
5
5 25 14
5 + 1
5
75
−
I+
2 = I2 + 2
56 206
I+
2 = +2=
75 75
5.4. Resumen 179
2. Supóngase que se tienen dos mediciones independientes del escalar x, cada una
con varianza R. Entonces la varianza de la medición promedio se calcula como
{[ ]2 } {[ ]2 }
1 1 1
E (y1 + y2 ) − x =E (y1 − x) + (y2 − x)
2 2 2
{[ }
w1 w2 ]2
=E +
2 2
R R R
= + =
4 4 2
En este problema cada medición tiene una varianza unidad, por lo que la varianza
de la medición promedio es 1/2. Se pueden utilizar las ecuaciones (4.53) y (4.54)
para obtener
Pk− = F 2 Pk−1
+
+ Qk−1
P1− = F 2 P0+ + Q0
1 5
= +1=
4 4
P1+ = [(P1− )−1 + H ⊤ R−1 H]−1
( )−1
4 5
= +2 =
5 14
1 5 5 75
P2− = · + =
4 14 4 56
− −1 −1
P2+ = [(P2 ) + 2]
( )−1
56 75
= +2 =
75 206
Nótese que los cantidades Pi− y Pi+ obtenidas aquı́, son las inversas de las canti-
dades I−1 e I1 obtenidas en la parte 1.
+
5.4. Resumen
En este capı́tulo se han estudiado algunos modelos alternos del filtro de Kal-
man. Uno de estos modelos es el filtro de información.
El filtro de información es equivalente al filtro Kalman, pero se propaga a
la inversa de la covarianza. Esto puede ser computacionalmente beneficioso en
los casos en los que el número de mediciones es mucho mayor que el número de
estados. El filtrado de raı́z cuadrada aumenta de manera efectiva la precisión
del filtro de Kalman.
Aunque estos enfoques requieren esfuerzo computacional adicional, pueden
ayudar a prevenir la divergencia y la inestabilidad. Hay una excelente y com-
pleta visión del filtrado de raı́z cuadrada en [Bierman, 1977].
Existe un número de diferentes opciones en la aplicación de un filtro de
Kalman. En este capı́tulo se han tratado dos modelos
Filtrado de covarianza o filtrado de información
de filtrado estándar, filtrado de raı́z cuadrada.
Cualquiera de estas opciones se pueden hacer de forma independiente de las
demás. Por ejemplo, se pude optar por combinar el filtrado de filtrado informa-
ción con el filtrado de raı́z cuadrada [Kaminski et al., 1971a]. Una comparación
numérica de diversas formulaciones de filtro de Kalman (incluyendo el filtro
estándar, el filtro de covarianza raı́z cuadrada, el filtro de la información de
la raı́z cuadrada, y el algoritmo de Chandrasekhar) se da en [Verhaegen and
Van Dooren, 1986]. Comparaciones numéricas y computacionales de distin-
tos enfoques de filtrado de Kalman se dan en [Bierman, 1973], [Bierman and
Thornton, 1977]. Filtrado raı́z cuadrada de tiempo continuo se discute en [Morf
et al., 1978].
Bibliografı́a
Andrews, A. (1968). A square root formulation of the Kalman covariance equations. AIAA
Journal, 6(6): 1165–1166.
Battin, R. (1964). Astronautical Guidance. Electronic sciences series. McGraw-Hill, New
York.
Bellantoni, J. and Dodge, K. (1967). A square root formulation of the Kalman-Schmidt
filter. AIAA Journal, 5(7): 1309–1314.
Bierman, G. (1973). A comparison of discrete linear filtering algorithms. IEEE Transactions
on Aerospace and Electronic Systems, AES-9(1): 28–37.
Bierman, G. and Thornton, C. (1977). Numerical comparison of Kalman filter algorithms:
Orbit determination case study. Automatica, 13(1): 23–35.
Bierman, G. J. (1977). Factorization Methods for Discrete Sequential Estimation, volume
128 of Monographs and Textbooks. Academic Press,Inc, 111 Fifth Avenue, New York.
New York 10003, NY, USA.
Brown, R. and Hwang, P. (1996). Introduction to Random Signals and Applied Kalman
Filtering. New York, USA.
Chen, C.-T. (1984). Linear System Theory and Design. Saunders College Pu., Harcourt
Brace Jovanovich, Inc., Orlando, FL 32887, USA, 2a edition.
Dyer, P. and McReynolds, S. (1969). Extension of square–root filtering to include process
noise. Journal of Optimization Theory and Applications, 3(6): 444–458.
Faddeev, D. and Faddeeva, V. (1963). Computational Methods of Linear Algebra. W. H.
Freeman and Company, San Francisco, USA.
Golub, G. and Van Loan, C. (1996). Matrix Computations. The Johns Hopkins University
Press, 2715 North Charles Street, Baltimore, Maryland 21218-4319, USA, 3a edition.
Horn, R. and Johnson, C. (1985). Matrix Analysis. Cambridge University Press, New York,
USA.
Householder, A., S. (1975). The Theory of Matrices in Numerical Analysis. Reimpresión del
libro publicado originalmente en 1964. 180 Varick Street NY 10014, NY, USA.
Jordan, T. L. (1968). Experiments on error growth associated with some linear least squares
procedures. Mathematics of Computation, AMS, (22):579–588.
Kailath, T. (1980). Linear Systems. Prentice–Hall, Inc., Englewoods Cliffs, N. J., 07632,
181
182 BIBLIOGRAFı́A
USA.
Kaminski, P., Bryson, A., and Schmidt, S. (1971a). Discrete square root filtering: A survey
of current techniques. IEEE Transactions on Automatic Control, AC-16(6): 727–736.
Kaminski, P., Bryson, A., and Schmidt, S. (1971b). Discrete square root filtering: A survey
of current techniques. IEEE Transactions on Automatic Control, AC-16:727–736.
Martin, M. and Kailath, T. (1975). Square-root algorithms for least-squares estimation.
IEEE Transactions on automatic control, AC–20(4): 487–497.
Moon, T. and Stirling, W. (2000). Mathematical Methods and Algorithms for Signal Proces-
sing. Prentice-Hall, Upper Saddle River, New Jersey, USA.
Morf, M., Levy, R., and Kailath, T. (1978). Square-root algorithms for the continuous time
linear least-square estimation problem. IEEE Transactions on Automatic Control, AC-
23(5): 907–911.
Schmidt, S. (1981). The Kalman filter: Its recognition and development for aerospace appli-
cations. Journal of Guidance and Control, 4(1): 4–7.
Verhaegen, M. and Van Dooren, P. (1986). Numerical aspects of different Kalman filter
implementations. IEEE Transactions on Automatic Control, AC-31(l0): 907–917.
Capı́tulo 6
Generalización del filtro de

Kalman
E n los últimos capı́tulos se dedujo el filtro de Kalman en tiempo discre-

to y luego se presentaron formulaciones alternas pero matemáticamente
equivalentes. En este capı́tulo se discutirán algunas generalizaciones del filtro
de Kalman que lo harán más flexible y efectivo para una más amplia clase
de problemas. Por ejemplo, en la deducción del filtro de Kalman dada en el
Capı́tulo 4 se asumió que el ruido del proceso y el ruido de las mediciones no
estaban correlacionados. Más adelante, en este capı́tulo, se mostrará que si el
ruido del proceso y de la medición son correlacionados, las ecuaciones del filtro
de Kalman sufren modificaciones. La deducción del Capı́tulo 4 también supone
que el ruido del proceso y de la medida son ruidos blancos. En este capı́tulo se
modificará el filtro de Kalman para tratar el ruido coloreado del proceso y de
la medición.
6.1. Simulación de ruido correlacionado

En la investigación y experimentación de filtrado óptimo, a menudo se tiene que
simular el ruido blanco correlacionado. Es decir, se tienen que crear vectores
aleatorios cuyos elementos están correlacionados entre sı́ de acuerdo con alguna
matriz de covarianza predefinida. En esta sección, se va a presentar una forma
de lograr esto.
Supóngase que se desea generar un vector aleatorio v de n elementos el cual
183
184 Capı́tulo 6. Generalización del filtro de Kalman
tiene media y la covarianza Q:

 
σ12 . . . σ1n
 .. 
Q =  ... .  (6.1)
σ1n . . . σn2
Puesto que Q es una matriz de covarianza, se sabe que todos sus valores
propios son reales y no negativos. Por tanto, sus valores propios se pueden
denotar como µ2k
λ(Q) = µ2k k = 1, . . . , n (6.2)
Suponiendo que los autovectores de Q encontrados son d1 , . . . , dn , se reúnen

de modo que se obtenga una matriz D ∈ Rn×n . Puesto que Q es simétrica,
se pueden seleccionar siempre los autovectores tales que D sea ortogonal, esto
es, D−1 = D⊤ . Por lo tanto, se puede obtener la descomposición en forma de
Jordan de Q como
Q = DQ̂D⊤ (6.3)
donde Q̂ es la matriz diagonal de los autovalores de Q. Esto es
Q̂ = diag(µ21 , . . . , µ2n ) (6.4)
Ahora se define el vector aleatorio v como v = D−1 w, de modo que w = Dv,

Por lo tanto,
E {ww⊤ } = E {D⊤ vv⊤ D}

= D⊤ E {vv⊤ }D
= D⊤ QD
= Q̂
= diag(µ21 , . . . , µ2n ) (6.5)
Esto muestra como se puede generar un vector aleatorio v de n elementos con

una matriz de covarianza Q. En el Algoritmo 6.1 se muestra el procedimiento.
6.2. Correlación del ruido del proceso y de la medida 185
Algoritmo 6.1 Simulación de ruido correlacionado
1. Encontrar los autovalores de Q y denotarlos como µ21 , . . . , µ2n

2. Encontrar los autovectores de Q y denotarlos como d1 , . . . , dn , tal que
[ ]
D = d1 · · · dn
D−1 = D⊤
3. Calcular la variable aleatoria vi
for i = 1 to n do
vi = µi ri ◃ ri ∼ (0, 1)
end for
4. Calcular w:
w = Dv
6.2. Correlación del ruido del proceso y de la

medida
La deducción del filtro de Kalman en el Capı́tulo 4 supone que el ruido del
proceso y de la medida no son correlacionados. En esta sección, se va a de-
mostrar cómo el ruido correlacionado del proceso y de la medición cambia las
ecuaciones de filtro de Kalman. Supóngase que se tiene un sistema dado por
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1

yk = Hk xk + wk
vk ∼ (0, Qk )
wk ∼ (0, Rk ) (6.6)
E {vk−1 wj⊤ } = Sk δk−j
Se ve que el ruido del proceso en la ecuación del sistema está correlacionado

con el ruido de las mediciones, con la covarianza cruzada dada por Sk δk−j .
En la deducción del filtro de Kalman en el Capı́tulo 4, se asume que Sk es
cero, pero en esta sección no se tendrá en cuenta esta suposición. Para tener
más claridad conceptual supóngase, por ejemplo, que el sistema es un avión
en vuelo con el viento golpeándolo. Se utiliza un anemómetro para medir la
velocidad del viento como una entrada al filtro de Kalman. Ası́, las ráfagas
aleatorias de viento afectan tanto al proceso (es decir, la dinámica del avión)
como a la medida (es decir, la velocidad del viento detectada). Se ve que hay
una correlación entre el ruido del proceso y el ruido de las mediciones. De
la ecuación anterior, se observa que el ruido del proceso en el tiempo k está
correlacionado con el ruido de la medición en el tiempo (k + 1); esto es, vk
está correlacionado con wk+1 . Esto es porque vk afecta al estado en el tiempo
(k + 1), ası́ como wk+1 afecta las mediciones en el tiempo (k + 1).
Con el fin encontrar las ecuaciones del filtro de Kalman teniendo en cuenta
el ruido correlacionado del sistema, se definen los errores de estimación de la
siguiente manera:
ϵ− −
k = xk − x̂k
(6.7)
k = xk − x̂k
ϵ+ +
Como en el desarrollo original del filtro de Kalman del Capı́tulo 4, todavı́a se

asume que las ecuaciones de actualización para la estimación de estado se dan
como sigue
x̂− +
k = Fk−1 x̂k−1 + Gk−1 uk−1
− − (6.8)
x̂+
La matriz de ganancia Kk no es la misma como la desarrollada en el Capı́tulo 4,

pero la forma de las ecuaciones de actualización de medidas es aún la misma.
La Ecuación (6.7) puede expandirse usando las ecuaciones anteriores como
ϵ− −
k = xk − x̂k
= (Fk−1 xk−1 + Gk−1 uk−1 + vk−1 ) − (Fk−1 x̂+
k−1 + Gk−1 uk−1 )
+
= Fk−1 ϵk−1 + vk−1
(6.9)
ϵk = xk − [x̂−
+ −
k + Kk (yk − Hk x̂k )]
= ϵ−
k − Kk (Hk xk + wk − Hk x̂k )
−
= ϵ− −
k − Kk (Hk ϵk + wk )
La covarianza del error estimado a priori y a posteriori puede escribirse como

{ − − ⊤}
P−k = E ϵk (ϵk )
⊤
= Fk−1 P+
k−1 Fk−1 + Qk−1 (6.10)
{ + + ⊤}
k = E ϵk (ϵk )
P+
{[ ][ − ]⊤ }
− − −
= E ϵk − Kk (Hk ϵk + wk ) ϵk − Kk (Hk ϵk + wk )
{( )( − ⊤ )}
= E ϵ− −
k − Kk H k ϵ k − Kk w k (ϵk ) − (ϵ− ⊤ ⊤ ⊤ ⊤ ⊤
k ) Hk Kk − wk Kk
= P− − ⊤ ⊤ − ⊤ ⊤ − − ⊤ ⊤
k − Pk Hk Kk − E {ϵk wk }Kk − Kk Hk Pk + Kk Hk Pk Hk Kk +
+ Kk Hk E {ϵ− ⊤ ⊤ − ⊤ − ⊤ ⊤ ⊤
k wk }Kk − Kk E {wk (ϵk ) } + Kk E {wk (ϵk ) }Hk Kk +
+ Kk E {wk wk⊤ }K⊤
k (6.11)
Con el fin de simplificar P+ k en la Ecuación (6.11), se requiere encontrar una

− ⊤
expresión para E {ϵk wk }. Ésta se puede calcular como
{ } { }
E ϵ− ⊤
k wk = E (xk − x̂− ⊤
k )wk
{ }
= E xk wk⊤ − x̂−
k wk
⊤
{ } { }
= E (Fk−1 xk−1 + Gk−1 uk−1 + vk−1 )wk⊤ − E x̂− k wk
⊤
{ } { } { } { }
= Fk−1 E xk−1 wk⊤ + Gk−1 E uk−1 wk⊤ + E vk−1 wk⊤ − E x̂− ⊤
k wk
= 0 + 0 + Sk − 0 (6.12)
En la anterior ecuación, el primer término es 0 porque xk−1 es independien-

te de wk y wk es de media cero. El segundo término es 0 porque uk−1 es
independiente de wk . El último término es 0 porque el estado estimado a prio-
ri en el tiempo k es independiente de wk . De la misma forma se obtiene
{ }
E wk (ϵ−k)
⊤
= S⊤
k
Sustituyendo estas expresiones para E{ϵ− ⊤ − ⊤

k wk } y E{wk (ϵk ) } en la Ecua-
ción (6.10) se obtiene

− − ⊤ − ⊤ ⊤ − ⊤ ⊤
k = Pk − Kk Hk Pk − Kk Sk − Pk Hk Kk + Kk Hk Pk Hk Kk +
P+
+ Kk S ⊤ ⊤ ⊤ ⊤ ⊤ ⊤
k Hk Kk − Sk Kk + Kk Hk Sk Kk + Kk Rk Kk
= (I − Kk Hk )P− − ⊤ ⊤
k − (I − Kk Hk )Pk Hk Kk +
+ Kk (Hk Sk + S⊤ ⊤ ⊤ ⊤ ⊤
k Hk + Rk )Kk − Sk Kk − Kk Sk
= (I − Kk Hk )P− ⊤ ⊤ ⊤ ⊤
k (I − Kk Hk ) + Kk (Hk Sk + Sk Hk + Rk )Kk
− Sk K⊤ ⊤
k − Kk Sk (6.13)
Ahora se necesita encontrar la matriz de ganancia Kk que minimize Tr(P+

k ).
Recordando de la Ecuación (1.25) que
∂Tr(ABA⊤ )
= 2AB si B es simétrica
∂A
Y además del Apéndice A, las expresiones (A.2) y (A.4) que se reescriben a
continuación
∂ ∂
Tr(XA) = A⊤ ; Tr(AX⊤ ) = A
∂X ∂X
A partir de estos datos se obtiene la siguiente expresión para la derivada
∂Tr(P+
k)
= −2(I − Kk Hk )P− ⊤ ⊤ ⊤
k Hk + 2Kk (Hk Sk + Sk Hk + Rk ) − 2Sk
∂Kk
[ ]
= 2 Kk (Hk P− ⊤ ⊤ ⊤ − ⊤
k Hk + Hk Sk + Sk Hk + Rk ) − Pk Hk − Sk (6.14)
Haciendo la ecuación anterior igual a cero y despejando la ganancia Kk , se

obtiene
Kk = (P− ⊤ − ⊤ ⊤ ⊤
k Hk + Sk )(Hk Pk Hk + Hk Sk + Sk Hk + Rk )
−1
(6.15)
Esta es la matriz de ganancia de Kalman óptima para el sistema con ruido del
proceso y de la medida correlacionados. La covarianza del error de estimación
se obtiene de la Ecuación (6.13) haciendo Šk = Hk P− ⊤ ⊤ ⊤
k Hk +Hk Sk +Sk Hk +Rk
como
− ⊤ ⊤ ⊤ ⊤
k = (I − Kk Hk )Pk (I − Kk Hk ) + Kk (Hk Sk + Sk Hk + Rk )Kk −
P+
− Sk K⊤ ⊤
k − Kk Sk =
= P− ⊤ − − ⊤ ⊤ ⊤ ⊤
k + Kk Šk Kk − Kk Hk Pk − Pk Hk Kk − Sk Kk − Kk Sk
= P− − ⊤ −1 ⊤ − ⊤ − ⊤ ⊤
k + (Pk Hk + Sk )Šk Šk Kk − Kk (Hk Pk + Sk ) − (Pk Hk + Sk )Kk
= P− − ⊤ ⊤ − ⊤ − ⊤ ⊤
k + (Pk Hk + Sk )Kk − Kk (Hk Pk + Sk ) − (Pk Hk + Sk )Kk
= P− − ⊤
k − Kk (Hk Pk + Sk ) (6.16)
Esta es la ecuación de actualización de medidas para la covarianza del error

de estimación del filtro de Kalman con ruido del proceso y de las mediciones
correlacionados. Las ecuaciones de actualización de la medida para la estima-
ción de estados son las mismas del filtro de Kalman estándar y se dan en el
conjunto de ecuaciones (6.8). Las ecuaciones de actualización en el tiempo para
la estimación de estado y la covarianza del error de estimación también son las
mismas como antes. El filtro de Kalman para el sistema con ruido correlacio-
nado del procesos y de las mediciones se puede resumir en el Algoritmo 6.2.
La segunda forma para P+ k y la segunda forma para Kk se pueden desarrollar
siguiendo un procedimiento similar tal como el mostrado en la Sección 3.5. Nó-
tese que esta es una generalización del filtro de Kalman la cual se presentó en
las ecuaciones (4.54), en particular la última. Si Sk = 0, entonces la expresión
anterior se reduce a la última ecuación de (4.54).
Ejemplo 6.1
Considérese el siguiente sistema escalar
xk = 0.8xk−1 + vk−1
yk = xk + wk
E {vk vj⊤ } = 1δk−j
E {wk wj⊤ } = 0.1δk−j
E {vk−1 wj⊤ } = Sδk−j
Analizar la respuesta teniendo en cuenta la correlación entre el ruido del proceso

y el ruido en la medida.
Solución:
Se puede utilizar el método discutido en la Sección 6.1 para simular el ruido
correlacionado. Las ecuaciones del filtro de Kalman dadas anteriormente se pueden
Algoritmo 6.2 Filtro de Kalman general de tiempo discreto.
1. Las ecuaciones del sistema y de la medición están dadas por
xk = Fk−1 xk−1 + Gk−1 uk−1 + vk−1

yk = Hk xk + wk
vk ∼ (0, Qk )
wk ∼ (0, Rk ) (6.17)
E {vk−1 wj⊤ } = Sk δk−j
2. El filtro de Kalman se inicializa como
0 = E {x0 }
x̂+
{ + ⊤
} (6.18)
P0 = E (x0 − x̂+
+
0 )(x0 − x̂0 )
3. Para cada paso de tiempo k = 1, 2, · · · , las ecuaciones del filtro de Kal-

man están dadas como
P− + ⊤
k = Fk−1 Pk−1 Fk−1 + Qk−1
Kk = (P− ⊤ − ⊤ ⊤ ⊤
k Hk + Sk )(Hk Pk Hk + Hk Sk + Sk Hk + Rk )
−1
⊤ − −1 ⊤ − −1 −1
= P+k (Hk + (Pk ) Sk )(Rk − Sk (Pk ) Sk )
x̂− +
k = Fk−1 x̂k−1 + Gk−1 uk−1
− −
x̂+
− ⊤ ⊤ ⊤ (6.19)
k = (I − Kk Hk )Pk (I − Kk Hk ) − Sk Kk − Kk Sk +
P+
+ Kk (Hk Sk + S⊤ ⊤ ⊤
k Hk + Rk )Kk
[ − −1
= (Pk ) + (H⊤ − −1 ⊤ − −1
k + (Pk ) Sk )(Rk − Sk (Pk ) Sk )
−1
×
]−1
× (Hk + S⊤ − −1
k (Pk ) )
= P− − ⊤
k − Kk (Hk Pk + Sk )
ejecutar a continuación para obtener una estimación del estado. En la Figura 6.2
se muestra la respuesta a diferentes niveles de correlación, con correlación cero y
con valores de ±0.25.
S = 0, S =0 S = 0, SFiltro = 0
Filtro
0.0915
0.0914
0.0913
0.0912
0.0911
0.091
0.0909
10 20 30 40 50 0 10 20 30 40 50
Tiempo Tiempo
(a) Ganancia de Kalman y covarianza del error de estimación sin correlación.

S = 0.25, SFiltro = 0.25 S = 0.25, SFiltro = 0.25
0.0242
0.024
0.0238
0.0236
0.0234
10 20 30 40 50 0 10 20 30 40 50
Tiempo Tiempo
(b) Ganancia de Kalman y covarianza del error de estimación con correlación (positiva).
S = −0.25, SFiltro = −0.25 S = −0.25, SFiltro = −0.25
0.0655
0.065
0.0645
0.064
0.0635
0.063
0.0625
10 20 30 40 50 0 10 20 30 40 50
Tiempo Tiempo
(c) Ganancia de Kalman y covarianza del error de estimación con correlación (negativa).
Figura 6.1.: Simulación del filtro de Kalman usando ruido del proceso y de
la medida correlacionados. S = correlación entre el ruido del
proceso y el ruido de la medida. SF ilter = valor de S usado en
el filtro de Kalman.
La Tabla 6.1 muestra (para varios valores de S) la varianza del error de estimación
para el filtro de Kalman estándar (cuando se asume S = 0) y para el filtro de Kal-
man con ruido correlacionado (cuando se utiliza el valor correcto de S). Cuando
S = 0, las varianzas de error de estimación son las mismas para los dos filtros,
como se esperaba. Sin embargo, cuando S ̸= 0, el filtro que utiliza el valor correcto
de S se desempeña notablemente mejor que el filtro que asume incorrectamente
que S = 0.
Correlación Filtro estándar Filtro correlacionado Varianza del error

S S = 0 asumido S correcto de medida
0.0 0.075732 0.075732 0.072582
0.25 0.030243 0.018754 0.060165
−0.25 0.117345 0.052264 0.091225
Tabla 6.1.: Valores experimentales de la varianza del error de estimación (50

pasos de tiempo) para el Ejemplo 6.1 cuando hay una covarianza
cruzada S entre el ruido del proceso y el ruido de la medida. El
filtro estándar asume S = 0 y el filtro correlacionado utiliza el
valor correcto de S.
6.3. Ruido coloreado de proceso y medición

Para la deducción del filtro de Kalman en el Capı́tulo 4 se asumió que tanto
el ruido del proceso como el ruido de la medición son blancos. En esta sección,
se mostrará cómo tratar el ruido coloreado del proceso, y se presentarán dos
métodos para tratar el ruido coloreado de medición.
6.3.1. Ruido coloreado del proceso

Si el ruido del proceso es coloreado, es relativamente fácil modificar las ecua-
ciones del sistema y obtener un sistema equivalente pero de orden superior con
ruido blanco del proceso [Bucy and Joseph, 1968]. Entonces se pueden aplicar
las ecuaciones estándar del filtro de Kalman. Por ejemplo, supóngase que se
tiene un sistema LTV dado como
xk = Fxk−1 + vk−1 (6.20)
donde la covarianza de vk es igual a Qk . Además supóngase que el ruido del

proceso es la salida de un sistema dinámico:
vk = ψvk−1 + ζk−1 (6.21)

6.3. Ruido coloreado de proceso y medición 193
donde ζk−1 es ruido blanco de media cero, no correlacionado con vk−1 . En este
caso, se puede ver que la covarianza entre vk y vk−1 es igual a
{ ⊤
} { ⊤ ⊤
}
E vk vk−1 = E ψvk−1 vk−1 + ζk−1 vk−1
= ψQk−1 + 0 (6.22)
El cero surge porque vk−1 es independiente de ζk−1 y ζk−1 tiene media cero.
Se ve que vk es el ruido coloreado del proceso (ya que se correlaciona con sı́
mismo en otros pasos de tiempo). Entonces se pueden combinar las ecuaciones
(6.20) y (6.21) para obtener
[ ] [ ][ ] [ ]
xk F I xk−1 0
= +
vk 0 ψ vk−1 ζk−1
x̌k = F̌x̌k−1 + v̌k−1 (6.23)
Este es un sistema aumentado con un nuevo estado x̌, una nueva matriz del
sistema F̌ y un nuevo vector de ruido del proceso v̌ cuya covarianza está dada
por
[ ]
{ } 0 { 0 }
E v̌k v̌k⊤ = 0 E ζk ζ ⊤
k
= Q̌k (6.24)
Ahora el filtro de Kalman estándar se puede ejecutar en este sistema

{ aumen-
}
tado que tiene ruido de proceso blanco, siempre que se conozca E ζk ζk⊤ . El
esfuerzo computacional se incrementa porque la dimensión vector de estado se
ha duplicado, pero conceptualmente este es un enfoque sencillo para tratar el
ruido coloreado del proceso.
6.3.2. Ruido coloreado de medición: aumento de estado
Ahora supóngase que se tiene ruido coloreado de la medida. El sistema y las

ecuaciones de medición están dadas como
xk = Fk−1 xk−1 + vk−1
yk = Hk xk + wk
wk = ψk−1 wk−1 + ζk−1
vk ∼ N (0, Qk )
(6.25)
ζk ∼ N (0, Qζk )
{ }
E vk vj⊤ = Qk δk−j
{ }
E ζk ζj⊤ = Qζk δk−j
{ }
E vk ζj⊤ = 0
El ruido de medición es en sı́ mismo la salida de un sistema lineal. La covarianza

del ruido de medición está dada como
{ ⊤
} { ⊤
}
E wk wk−1 = E (ψk−1 wk−1 + ζk−1 )wk−1
{ ⊤
}
= ψk−1 E wk−1 wk−1 (6.26)
Hay varios enfoques para resolver el problema de ruido de medición coloreado.

Este problema fue resuelto por R. Bucy para sistemas en tiempo continuo
en [Bucy and Joseph, 1968]. Aquı́ se resuelve el problema en tiempo discreto
mediante el aumento de estado. Éste fue originalmente propuesto en [Bryson
and Johanson, 1965] en el contexto de sistemas de tiempo continuo. Se aumenta
el modelo original como sigue:
[ ] [ ][ ] [ ]
xk Fk−1 0 xk−1 vk−1
= +
wk 0 ψk−1 wk−1 ζk−1
[ ] (6.27)
[ ] xk
yk = Hk I +0
wk
Lo cual puede escribirse como
x̌k = F̌k−1 x̌k−1 + v̌k−1

(6.28)
y̌k = Ȟk x̌k + w̌k
El sistema es equivalente al sistema original pero tiene un estado modificado x̌,

una matriz de transición de estado F̌, un ruido del proceso v̌, una matriz de
medición Ȟ y un ruido de medición w̌. La covarianza del ruido del proceso y
la covarianza del ruido de medición se calculan como
{[ ] } [ ]
{ ⊤
} vk [ ⊤ ⊤ ] Qk 0
E v̌k v̌k = E vk ζk =
ζk 0 Qζk (6.29)
{ ⊤
}
E w̌k w̌k = 0
Como se puede observar, no hay ruido de medición, lo cual es equivalente a

decir que el ruido de medición es blanco con media cero y covarianza cero.
Teóricamente, es bueno tener ruido de medición cero en el filtro de Kalman.
En efecto, el artı́culo original de Kalman [Kalman, 1960] fue escrito sin ninguna
restricción sobre la singularidad de la covarianza del ruido de medición. Pero
en la práctica, una covarianza singular del ruido de medición frecuentemente
resulta en problemas numéricos [Maybeck, 1979], [Stengel, 1994a]. Por tal razón
en la próxima subsección se presenta otro enfoque para tratar el ruido coloreado
de la medición.
6.3.3. Ruido coloreado de la medida: diferenciación de

la medición
En esta subsección se presentará un método para tratar con ruido coloreado

de la medida que no se basa en aumentar el vector de estado. Este enfoque
se debe a [Bryson and Henrikson, 1968]. Como en la subsección anterior, el
sistema está dado por
xk = Fk−1 xk−1 + vk−1

yk = Hk xk + wk
wk = ψk−1 wk−1 + ζk−1
vk ∼ N (0, Qk )
(6.30)
ζk ∼ N (0, Qζk )
{ ⊤
}
E vk vj = Qk δk−j
{ }
{ }
E vk ζj⊤ = 0
Ahora se escribe la señal yk en función de una señal auxiliar y̌k como sigue
yk = y̌k−1 + ψk−1 yk−1 (6.31)
De donde,
y̌k−1 = yk − ψk−1 yk−1 (6.32)
Sustituyendo yk y yk−1 en la Ecuación (6.32), se obtiene:
y̌k−1 = (Hk xk + wk ) − ψk−1 (Hk−1 xk−1 + wk−1 )

= Hk (Fk−1 xk−1 + wk−1 ) + wk − ψk−1 (Hk−1 xk−1 + wk−1 )
= (Hk Fk−1 − ψk−1 Hk−1 )xk−1 + Hk vk−1 + wk − ψk−1 wk−1
= (Hk Fk−1 − ψk−1 Hk−1 )xk−1 + (Hk vk−1 + ζk−1 )
= Ȟk−1 xk−1 + w̌k−1 (6.33)
donde
Ȟk−1 = Hk Fk−1 − ψk−1 Hk−1 (6.34)

w̌k−1 = Hk wk−1 + ζk−1 (6.35)
Se ve que se tiene una nueva ecuación de medición para la medida y̌k−1 , la cual
tiene una matriz de medición Ȟk−1 y un ruido de medida w̌k−1 . Por lo tanto,
el sistema equivalente nuevo puede escribirse como
xk = Fk−1 xk−1 + vk−1

(6.36)
y̌k = Ȟk xk + w̌k
La covarianza del nuevo ruido de medición w̌ y la covarianza cruzada entre el

ruido del proceso v y el nuevo ruido de medición w̌, puede obtenerse como
{ } { }
E w̌k w̌k⊤ = E (Hk+1 vk + ζk )(wk⊤ H⊤ ⊤
k+1 + ζk )
= Hk+1 Qk H⊤
k+1 + Qζk
{ } { } (6.37)
E vk w̌k⊤ = E vk (vk⊤ H⊤ ⊤
k+1 + ζk )
= Qk H⊤
k+1
Donde se ha usado el hecho que vk y ζk son independientes y con media cero.

Algoritmo 6.3 El filtro de Kalman discreto con ruido de medida coloreado.

1. Ecuaciones del sistema y de la medida:
xk = Fk−1 xk−1 + vk−1

yk = H k xk + w k
wk = ψk−1 wk−1 + ζk−1
vk ∼ N (0, Qk )
(6.38)
ζk ∼ N (0, Qζk )
{ ⊤
}
E vk vj = Qk δk−j
{ }
{ }
E vk ζj⊤ = 0
2. Ecuaciones para el cálculo de y̌k y Ȟk :
y̌k−1 = yk − ψk−1 yk−1

(6.39)
Ȟk−1 = Hk Fk−1 − ψk−1 Hk−1
3. En cada paso de tiempo, se ejecutan las ecuaciones siguientes para actua-

lizar el estimado del estado.
− −
k = x̂k + Kk (y̌k − Ȟk x̂k )
x̂+
x̂− −
k+1 = Fk x̂k + Ck (y̌k − Ȟk x̂k )
+
Kk = P− ⊤ − ⊤
k Ȟk (Ȟk Pk Ȟk + Rk )
−1
Sk = Qk H⊤
k+1 (6.40)
Ck = Sk (Ȟk P− ⊤
k Ȟk + Rk )
−1
− ⊤ ⊤
k = (I − Kk Ȟk )Pk (I − Kk Ȟk ) + Kk Rk Kk
P+
P− + ⊤ ⊤ ⊤ ⊤ ⊤
k+1 = Fk Pk Fk + Qk − Ck Sk − Fk Kk Sk − Sk Kk Fk
◃ Un enfoque similar para el filtro en tiempo continuo con ruido de medida

coloreado está dado en [Stear and Stubberud, 1968].
Ahora se definirán los estimados del estado a priori y a posteriori para el

sistema de la Ecuación (6.36) de una forma un poco diferente a lo que se tiene
hasta este momento. El estimado del estado x̂−

k en el tiempo k está definido
como el valor esperado del estado xk condicionado a las mediciones hasta el
tiempo k inclusive,
x̂−
k = E {xk |y1 , · · · , yk } (6.41)
El estimado del estado x̂+

k en el tiempo k está definido como el valor esperado
del estado xk condicionado a las mediciones hasta el tiempo (k + 1) inclusive.
Se asume que éste está dado por una combinación lineal estándar predictor-
corrector:
k = E {xk |y1 , · · · , yk+1 }

x̂+
(6.42)
= x̂− −
k + Kk (y̌k − Ȟk x̂k )
Nótese que estas definiciones de x̂− +

k y x̂k son un poco diferentes a las defini-
ciones usadas en otras partes de este texto. Normalmente, x̂− k está basado en
las mediciones hasta el tiempo (k − 1) inclusive y x̂k se basa en las mediciones
+
hasta el tiempo k inclusive. En esta sección, ambos estimados se basan en una

medida adicional. Como en el desarrollo anterior, se escoge la ganancia Kk para
minimizar la traza de la covarianza del error estimado. En forma de ecuación
esto se escribe como
{ + ⊤
}
Kk = argmin Tr E (xk − x̂+ k )(x k − x̂k ) (6.43)
No se darán los detalles aquı́, pero en [Bryson and Henrikson, 1968], se mues-
tra que esta minimización conduce a las ecuaciones del estimador dadas en el
Algoritmo 6.3.
Ejemplo 6.2
Considérese el siguiente sistema lineal con ruido de medida coloreado:
[ ] [ ]
0.70 −0.15 0.15
xk = xk−1 + v
0.03 0.79 0.21 k−1
[ ]
1 0
yk = x + wk
0 1 k
wk = ψwk−1 + ζk−1
{ }
E vk vj⊤ = 1δk−j
{ } [ ]
⊤ 0.05 0
E ζk ζj = δ
0 0.05 k−j
{ }
E vk ζj⊤ = 0
El escalar ψ indica la correlación del ruido de medida. Si ψ = 0 entonces el ruido

de medida es blanco. Cuando ψ se incrementa, el color del ruido de medida se
incrementa (es decir, éste contiene más componentes de baja frecuencia y menos
componentes de frecuencia alta). Se simuló el filtro de Kalman para este sistema en
tres formas: (a) Se simuló el filtro de Kalman estándar haciendo caso omiso de la
naturaleza del color del ruido de medición. (b) Se aumentó el vector de estado como
se describió en la Subsección 6.3.2, el cual tiene en cuenta la naturaleza del color del
ruido de la medición y entonces se simuló el filtro de Kalman. (c) Se implementó el
enfoque de diferenciación de la medida [Bryson and Henrikson, 1968]), el cual de
nuevo tomó en cuenta la naturaleza coloreada del ruido de la medición y entonces
simuló el filtro. La Tabla 6.2 muestra los valores experimentales de la traza de la
covarianza del error de estimación para los tres filtros. Se ve que si ψ = 0 entonces
los tres filtros en esencia se desempeñan idénticamente.
Color ψ Filtro estándar Filtro aumentado Bryson y Henrikson

0.0 0.24478 0.24478 0.24478
0.2 0.25984 0.25839 0.25839
0.5 0.30780 0.29444 0.29444
0.7 0.38298 0.33785 0.33785
0.9 0.63092 0.40679 0.40679
0.95 0.84217 0.42675 0.42675
0.99 1.41940 0.44239 0.44239
Tabla 6.2.: Cuando se incrementa el contenido de color del ruido de medición (es
decir, cuando ψ se incrementa), los filtros para ruido coloreado mejoran
su desempeño en comparación con el filtro estándar de Kalman.
Sin embargo, cuando ψ se incrementa (es decir, el color del ruido de medición au-
menta) se ve que los filtros que toman esto en cuenta proporcionan cada vez un
mejor rendimiento en comparación con el filtro estándar de Kalman. En la Fi-
gura 6.2, se puede observar la respuesta en el tiempo de los filtros de Kalman
estándar, aumentado y Bryson y Henrikson, para el caso de ψ = 0.95. Nótese que
hay mayor dispersión en el caso del filtro de Kalman estándar comparado con
los otros casos. Este ejemplo muestra la mejora que es posible en el desempeño
aplicando los filtros para ruido coloreado de la medida.
Se omite la correlación − x1 Se omite la correlación − x2

2
−1
−2
Error de medición Error de medición
Error de estimación Error de estimación
−3
100 200 300 400 500 0 100 200 300 400 500
Tiempo Tiempo
(a) Filtro estándar de Kalman (ψ = 0.95).

Estado aumentado − x1 Estado aumentado − x2
2
−1
−2
−3
100 200 300 400 500 0 100 200 300 400 500
Tiempo Tiempo
(b) Filtro de Kalman aumentado (ψ = 0.95).

Bryson y Henrikson − x 1 Bryson y Henrikson − x 2
2
−1
−2
−3
100 200 300 400 500 0 100 200 300 400 500
Tiempo Tiempo
(c) Filtro de Kalman método de Bryson y Henrikson (ψ = 0.95).
Figura 6.2.: Simulación del filtro de Kalman usando ruido del proceso y de
la medida coloreados.
6.4. Filtrado de estado estacionario 201
6.4. Filtrado de estado estacionario
Muchas implementaciones del filtro de Kalman se codifican en sistemas inte-

grados (en lugar de computadores de escritorio) en los cuales la memoria y el
esfuerzo computacional siguen siendo de consideración primordial. Si el siste-
ma subyacente es variante en el tiempo y las covarianzas del ruido del proceso
y de la medida igualmente son invariantes en el tiempo, entonces se puede re-
emplazar el filtro de Kalman variable en el tiempo del Capı́tulo 4 con un filtro
de Kalman de estado estacionario. El filtro de estado estacionario frecuente-
mente funciona casi tan bien como el filtro variable en el tiempo. El uso de un
filtro de estado estacionario tiene la ventaja de que no se tiene que calcular
la covarianza del error de estimación o la ganancia de Kalman en tiempo real.
Nótese que un filtro de Kalman de estado estacionario sigue siendo un sistema
dinámico. El término filtrado de Kalman de “estado estacionario” significa que
el filtro de Kalman es invariante en el tiempo; esto es, la ganancia de Kalman
está en estado estacionario.
Como un ejemplo, se tomará el sistema escalar discutido en la Subsección
4.5.1:
xk+1 = xk + vk
yk = xk + wk
(6.44)
vk ∼ (0, 1)
wk ∼ (0, 1)
Se puede observar del ejemplo mencionado que la ganancia de Kalman converge

a un valor de estado estacionario después de unos pocos pasos de tiempo:
√
1+ 5
lı́m Kk = K∞ = √ (6.45)
k→∞ 3+ 5
Ası́ que en lugar de realizar la ecuación de actualización de la medida para
Pk , la ecuación de actualización de tiempo para Pk y el cálculo de la ganancia
de Kalman para Kk en cada paso de tiempo, simplemente se puede usar la
constante K∞ como la ganancia de Kalman en cada paso de tiempo. Para un
sistema con muchos estados, esto puede ahorrar mucho esfuerzo computacional,
especialmente considerando el hecho que esto permite evitar inversiones de
matrices en tiempo real. El filtro de Kalman de estado estacionario para este
ejemplo está dado como
x̂− +
k = Fx̂k−1
− −
k = x̂k + K∞ (yk − Hx̂k ) = Fx̂k−1 + K∞ (yk − HFx̂k−1 )
x̂+ + +
= (I − K∞ H)Fx̂+k−1 + K∞ yk (6.46)
El filtro de Kalman de estado estacionario no es óptimo porque no se está

usando la ganancia de Kalman óptima en cada paso de tiempo (aunque éste se
acerque al óptimo en el lı́mite cuando k → ∞). En cambio se está usando la
ganancia de Kalman de estado estacionario. Sin embargo, para muchos proble-
mas de interés práctico, el desempeño del filtro en estado estacionario es casi
indistinguible del filtro variable en el tiempo. Para cualquier problema parti-
cular, la diferencia entre los filtros de tiempo variable y estado estacionario
necesita ser evaluada por simulación o por resultados experimentales [Simon,
2006], [Anderson and Moore, 1979].
Una forma de determinar la ganancia de Kalman de estado estacionario es
mediante simulación numérica. Simplemente se puede escribir un programa de
computadora para propagar la ganancia Kalman en función del tiempo, y luego
observar el valor hacia el cual la ganancia está convergiendo.
Otra forma para determinar la ganancia de Kalman de estado estacionario
es manipulando las ecuaciones del filtro de Kalman de la Ecuación (6.19).
Recordando la ecuación de actualización en el tiempo de la covarianza para un
sistema invariante en el tiempo:
P− + ⊤
k+1 = FPk F + Q (6.47)
Sustituyendo en esta ecuación la expresión para P+

k de la Ecuación (6.19):
P− − ⊤ − ⊤ ⊤ ⊤
k+1 = FPk F − FKk HPk F − FKk S F + Q (6.48)
Ahora se sustituye en esta ecuación la expresión para Kk de la Ecuación (6.19)

para obtener
P− − ⊤ − ⊤ − ⊤ ⊤ ⊤ −1 − ⊤
k+1 = FPk F − F(Pk H + S)(HPk H + HS + S H + R) HPk F −
− F(P− ⊤ − ⊤ ⊤ ⊤ −1 ⊤ ⊤
k H + S)(HPk H + HS + S H + R) S F + Q
= FP− ⊤ − ⊤ − ⊤ ⊤ ⊤ −1
k F − F(Pk H + S)(HPk H + HS + S H + R) ×
× (HP− ⊤ ⊤
k + S )F + Q (6.49)
Si P− − −
k converge a un valor de estado estacionario, entonces Pk = Pk+1 para k
grande. Se indicará este valor de estado estacionario como P∞ , lo cual significa
que se puede escribir
P∞ = FP∞ F⊤ − F(P∞ H⊤ + S)(HP∞ H⊤ + HS + S⊤ H⊤ + R)−1 ×

× (HP∞ + S⊤ )F⊤ + Q (6.50)
Esta es llamada una ecuación de Riccati algebraica (ARE), o más especı́fica-

mente una ARE discreta (DARE).Una vez que se tiene P∞ , se puede sustituir
ésta para P−
k en la fórmula de la ganancia de Kalman de la Ecuación (6.19)
para obtener la ganancia de Kalman de estado estacionario:
K∞ = (P∞ H⊤ + S)(HP∞ H⊤ + HS + S⊤ H⊤ + R)−1 (6.51)
Hay sistemas para los cuales la ecuación de Riccati (y aquı́ la ganancia de Kal-
man) no converge al valor de estado estacionario. Además, ésta puede convergir
a diferentes valores de estado estacionario dependiendo de la condición inicial
P0 . Finalmente, aun cuando ésta converge a un valor de estado estacionario,
puede resultar en un filtro de Kalman inestable. Estos temas constituyen un
rico campo de estudio que se ha reportado extensamente en muchos libros y
documentos [Anderson and Moore, 1979; Goodwin and Sin, 1984; Chui and
Chen, 1987; Kailath, 1981; McGarty, 1974]. Se resumirán a continuación los
resultados más importantes de convergencia de la ecuación de Riccati, pero
primero se necesita definir qué significa para un sistema ser controlable sobre
el cı́rculo unitario.
Definición 6.1
El par matricial (F, G) es controlable sobre el cı́rculo unitario si existe alguna
matriz K tal que (F − GK) no posee ningún autovalor con magnitud 1.
Se ilustrará esta definición con algunos ejemplos sencillos.

Ejemplo 6.3
Considérese el sistema escalar
xk+1 = xk (6.52)
En este ejemplo, F = 1 y G = 0. La dinámica del sistema es independiente de

cualquier señal de control y el sistema tiene un autovalor con magnitud 1. El
sistema no es controlable sobre el cı́rculo porque su autovalor tiene una magnitud
de 1 independientemente de la entrada de control de realimentación.
Ejemplo 6.4
xk+1 = 2xk (6.53)
En este ejemplo, F = 2 y G = 0. Como en el ejemplo previo, la dinámica del sis-

tema es independiente de cualquier señal de control. Sin embargo, el autovalor del
sistema tiene una magnitud de 2. El sistema es controlable sobre el circulo unita-
rio porque existe una ganancia de control de realimentación K tal que (F − GK)
no tiene ningún autovalor con magnitud 1. En efecto, independientemente de la
ganancia de control de realimentación, los autovalores del sistema nunca tendrán
magnitud 1.
Ejemplo 6.5
[ ] [ ]
F1 0 0
xk+1 = x + u (6.54)
0 1 k 1 k
Cuando se implementa el control de realimentación uk = −Kxk , donde K =

[K1 K2 ], el sistema de lazo cerrado se convierte en
[ ]
F1 0
xk+1 = x (6.55)
−K1 1 − K2 k
El sistema de lazo cerrado tiene autovalores en F1 y (1−K2 ). Se ve que si F1 = ±1

entonces no hay ganancia de control de realimentación K que dé lugar a que todos
los autovalores de lazo cerrado tengan magnitud no unitaria, y el sistema es por lo
tanto no controlable sobre el circulo unitario. Sin embargo, si F1 ̸= ±1, entonces
se puede encontrar una ganancia de control K que dé lugar a que autovalores de
lazo cerrado tengan magnitud no unitaria y el sistema es, por lo tanto, controlable
sobre el circulo unitario.
Ahora se resumen los resultados más importantes de convergencia de la ecua-

ción de Riccati de [Kailath et al., 2000; Poubelle et al., 1986; Bitmead et al.,
1985], donde se dan pruebas. Recordando que la DARE está dada como
P∞ = FP∞ F⊤ − F(P∞ H⊤ + S)(HP∞ H⊤ + HS + S⊤ H⊤ + R)−1 ×

× (HP∞ + S⊤ )F⊤ + Q (6.56)
Se asume que Q ≥ 0 y R > 0. Se define G como cualquier matriz tal que

GG⊤ = Q − SR−1 S⊤ . La ganancia de Kalman correspondiente de estado
estacionario K∞ está dada como
K∞ = (P∞ H⊤ + S)(HP∞ H⊤ + HS + S⊤ H⊤ + R)−1 (6.57)
El filtro de Kalman de estado estacionario está dado como
k = (I − K∞ H)Fx̂k−1 + K∞ yk
x̂+ +
(6.58)
Se dice que la solución de la DARE para P∞ se está estabilizando si resulta

en un filtro de estado estacionario. Esto es, P∞ se define como una solución
estabilizante DARE si todos los autovalores de (I − K∞ H)F son menores que
uno en magnitud [Arnold III and Laub, 1984]. Se enuncian sin demostración
los siguientes teoremas [Crassidis and Junkins, 2012], [Simon, 2006], [Stengel,
1994b].
Teorema 6.1
La DARE tiene una solución semidefinida positiva única P∞ si y solo si se
cumplen las siguientes condiciones
1. (F, H) es detectable.
2. (F − SR−1 H, G) es estabilizable.
Más aún, el correspondiente filtro de Kalman de estado estacionario es estable.

Esto es, los autovalores de (I − K∞ H)F tienen magnitud menor que 1.
El Teorema 6.1 no excluye la existencia de soluciones DARE que sean definidas

negativas o indefinidas. Si tales soluciones existen, entonces podrı́an resultar
en un filtro de Kalman inestable. Si se debilita la condición de estabilidad en

el Teorema 6.1, se obtiene el siguiente
Teorema 6.2
La DARE tiene una solución semidefinida positiva única P∞ si y solo si se
cumplen las siguientes condiciones
2. (F − SR−1 H, G) es controlable en el cı́rculo unitario.
Además, exactamente una de las soluciones DARE semidefinidas positivas resultan

en un filtro de Kalman de estado estacionario estable.
Puesto que la controlabilidad en el cı́rculo unitario es un subconjunto de la

estabilizabilidad, se ve que el Teorema 6.2 es un subconjunto del Teorema 6.1.
El Teorema 6.2 establece condiciones para la existencia de una solución DARE
estabilizante semidefinida positiva. Sin embargo, puede haber soluciones DARE
adicionales (semidefinidas positivas o de otra manera) que resultan en filtros de
Kalman inestables. Si un filtro de Kalman variable en el tiempo se ejecuta en
esta situación, entonces las ecuaciones del filtro de Kalman pueden convergir ya
sea a un filtro estable o a uno inestable, dependiendo de la condición inicial P+
0
[Simon, 2006], [Anderson and Moore, 1979]. Si se refuerza la condición de
controlabilidad del Teorema 6.2, se obtiene el siguiente
Teorema 6.3
La DARE tiene al menos una solución definida positiva P∞ si y solo si se cumplen
las siguientes condiciones
2. (F − SR−1 H, G) es controlable sobre y en el interior del cı́rculo unitario.
Más aún, exactamente una de las soluciones DARE definidas positivas resultan
en un filtro de Kalman de estado estacionario estable.
Si se deja la condición de controlabilidad en los dos teoremas anteriores, se

obtiene el siguiente
Teorema 6.4
La DARE tiene al menos una solución semidefinida positiva P∞ si y solo si (F, H)
es detectable. Además, al menos una de tales soluciones resulta en un filtro de
Kalman de estado estacionario marginalmente estable.
Nótese que el filtro resultante es solamente estable marginalmente, por lo que

puede tener autovalores sobre el cı́rculo unitario. También nótese que este
teorema posee una condición suficiente (pero no necesaria). Esto es, puede
haber un filtro de Kalman de estado estacionario estable aún si las condiciones
del anterior teorema no se cumplen. Más aún, si las condiciones del teorema se
mantienen, pueden haber soluciones DARE que resultan en filtros de Kalman
inestables.
Ejemplo 6.6
Considérese de nuevo el sistema escalar de la Ecuación (6.44). Se puede observar
que F = 1, H = 1, Q = 1, R = 1 y S = 0. Nótese que (F, H) es observable y
(F, G) es controlable para todo G tal que GG⊤ = Q (recuérdese que S = 0 para
este ejemplo). Se sabe del Teorema 6.1 que la DARE tiene una única solución
semidefinida positiva. Se sabe del Teorema 6.3 que la solución DARE no solo es
semidefinida positiva, sino que también es definida positiva. También se sabe de
estos dos teoremas que el correspondiente filtro de Kalman de estado estacionario
es estable. La DARE para este sistema está dada por
P = F P F ⊤ − F P H ⊤ (HP H ⊤ + R)−1 HP F ⊤ + Q
= P − P (P + 1)−1 P + 1
De aquı́ se obtiene
(P + 1)−1 P = 1, es decir, P 2 + P − 1 = 0
Resolviendo la ecuación cuadrática anterior se obtiene
√
1± 5
P =
2
Ası́, la DARE tiene dos soluciones, una negativa y la otra positiva. Si se utiliza la
solución negativa en el filtro de Kalman de estado estacionario se obtiene
√
⊤ ⊤ −1 1− 5
K = P H (HP H + R) = √
3− 5
2
k = (I − KH)F x̂k−1 + Kyk =
x̂+ +
√ x̂+k−1 + Kyk ≈ 2.62x̂k−1 + Kyk
+
3− 5
Se observa que el filtro resultante es inestable. Sin embargo, si se utiliza la solución

positiva DARE en el filtro de Kalman de estado estacionario se obtiene
K = P H ⊤ (HP H ⊤ + R)−1
√
1+ 5
= √
3+ 5
2
k = (I − KH)F x̂k−1 + Kyk =
x̂+ +
√ x̂+ + Kyk
3 + 5 k−1
≈ 0.382x̂+
k−1 + 0.618yk
El filtro de Kalman resultante es estable.
Ejemplo 6.7
Considérese un sistema escalar con F = 1, H = 1, Q = 0, R = 1 y S = 0.
Nótese que (F, H) es detectable. Sin embargo, (F, G) no es controlable en el cı́rculo
unitario para todo G tal que GG⊤ = Q. Se sabe del Teorema 6.2 que la DARE
no tiene una solución semidefinida positiva que resulte en un filtro de Kalman
estable. Sin embargo, se sabe del Teorema 6.4 que la DARE tiene una solución
semidefinida positiva que resulta en un filtro de Kalman marginalmente estable.
La DARE para este sistema está dada por
= P − P (P + 1)−1 P
Ésta tiene dos soluciones para P , ambas 0 (es decir, semidefinida positiva). Si se
usa esta solución en el filtro de Kalman en estado estacionario se obtiene
K=0
x̂+ +
k = x̂k−1
Se puede observar que el filtro de Kalman resultante es marginalmente estable (el

valor propio es 1).
Ejemplo 6.8
Considérese un sistema escalar con F = 2, H = 1, Q = 0, R = 1 y S = 0. Nótese
que (F, H) es detectable. También (F, G) es controlable sobre y en el interior del
circulo unitario para todo G tal que GG⊤ = Q. Se sabe del Teorema 6.2 que la
DARE tiene exactamente una solución semidefinida positiva que resulta en un
filtro de Kalman estable.
Sin embargo, se sabe del Teorema 6.4 que la DARE tiene una solución semi-
definida positiva que resulta en un filtro de Kalman marginalmente estable que
es estable. También se sabe del Teorema 6.3 que esta solución DARE es definida
positiva. La DARE para este sistema está dada por
= 4P − 4P (P + 1)−1 P
es decir,
4P 2
3P − =0
P +1
P 2 − 3P = 0
o sea,
P =0 y P =3
Como se puede observar hay dos soluciones para P , una de las cuales es 0 (es
decir, semidefinida positiva) y la otra es 3 (es decir, definida positiva). Si se toma
P = 0, en el filtro de Kalman de estado estacionario, se obtiene
K=0
x̂+ +
k = 2x̂k−1
Se ve que el filtro de Kalman resultante es inestable (el autovalor es 2). Si se usa

P = 3 en el filtro de Kalman de estado estacionario, se obtiene
3
K=
4
1 + 3
x̂+
k = 2 x̂k−1 + 4 yk
Se ve que el filtro de Kalman resultante es estable (el valor propio es 1/2). En

este ejemplo, se tienen múltiples soluciones semidefinidas positivas para la DARE,
pero solamente una resulta en un filtro de Kalman estable.
6.4.1. Un enfoque Hamiltoniano para filtrado de

estado estacionario
En esta subsección, se presenta un procedimiento alternativo para la obtención
del filtro de Kalman de estado estacionario. Se asumirá que la correlación S
entre el ruido del proceso y el ruido de la medición es cero, de modo que
se puede simplificar la notación. Entonces la expresión a priori de Riccati, a
partir de la Ecuación (6.49), puede escribirse como
Pk+1 = FPk F⊤ − FPk H⊤ (HPk H⊤ + R)−1 HPk F⊤ + Q (6.59)
donde se ha removido el superı́ndice menos (−) para facilitar la notación. Se

puede usar el lema de inversión de matrices de la Ecuación (1.52) para escribir
(HPk H⊤ + R)−1 = R−1 − R−1 H(H⊤ R−1 H + P−1 −1 ⊤ −1

k ) H R (6.60)
Sustituyendo esta expresión en el Ecuación (6.59) se obtiene
Pk+1 = FPk F⊤ − FPk H⊤ R−1 HPk F⊤ +

+ FPk H⊤ R−1 H(H⊤ R−1 H + P−1 −1 ⊤ −1 ⊤
k ) H R HPk F + Q (6.61)
Factorizando F y F⊤ del principio y del final de los tres primeros términos del
lado derecho conduce a
[
Pk+1 = F Pk − Pk H⊤ R−1 HPk +
] ⊤
+ Pk H⊤ R−1 H(H⊤ R−1 H + P−1 )−1 ⊤ −1
H R HP k F +Q
{ [ k
]}
= F Pk − Pk H R H Pk − (H R H + Pk ) H R HPk F⊤ + Q
⊤ −1 ⊤ −1 −1 −1 ⊤ −1
{
= F Pk − Pk H⊤ R−1 H(H⊤ R−1 H + P−1 k )
−1
×
[ ⊤ −1 ]} ⊤
× (H R H + P−1 ⊤ −1
k )Pk − H R HPk F +Q
{ ⊤ −1 ⊤ −1 −1 −1
} ⊤
= F Pk − Pk H R H(H R H + Pk ) F +Q
[ ⊤ −1 ] ⊤ −1
= FPk (H R H + Pk ) − H R H (H R H + P−1
−1 ⊤ −1 −1 ⊤
k ) F +Q
= F(H⊤ R−1 H + P−1 −1 ⊤
k ) F +Q
= FPk (H⊤ R−1 HPk + I)−1 F⊤ + QF−⊤ F⊤
[ ]
= FPk + QF−⊤ (H⊤ R−1 HPk + I) (H⊤ R−1 HPk + I)−1 F⊤
[ ]
= (F + QF−⊤ H⊤ R−1 H)Pk + QF−⊤ (H⊤ R−1 HPk + I)−1 F⊤ (6.62)
Ahora supóngase que Pk puede ser factorizado como
Pk = Υk Z−1
k (6.63)
donde Υk y Zk tienen la misma dimensión de Pk . Haciendo esta sustitución

en la Ecuación (6.62) da
[ ]
Pk+1 = (F + QF−⊤ H⊤ R−1 H)Υk + QF−⊤ Zk Z−1 ⊤ −1 −1
k (H R HΥk Zk + I) F
−1 ⊤
[ ]
= (F + QF−⊤ H⊤ R−1 H)Υk + QF−⊤ Zk (H⊤ R−1 HΥk + Zk )−1 F⊤
[ ]
= (F + QF−⊤ H⊤ R−1 H)Υk + QF−⊤ Zk (F−⊤ H⊤ R−1 HΥk + F−⊤ Zk )−1
= Υk+1 Z−1
k+1 (6.64)
Esto muestra que
Υk+1 = (F + QF−⊤ H⊤ R−1 H)Υk + QF−⊤ Zk

(6.65)
Zk+1 = F−⊤ H⊤ R−1 HΥk + F−⊤ Zk
Estas ecuaciones para Υk+1 y Zk+1 se pueden escribir como una ecuación única:
[ ] [ −⊤ ][ ]
Zk+1 F F−⊤ H⊤ R−1 H Zk
=
Υk+1 QF−⊤ F + QF−⊤ H⊤ R−1 H Υk
[ ]
Z
=H k (6.66)
Υk
Si la matriz de covarianza P es una matriz n × n, entonces H será una matriz

2n × 2n. La matriz H del lado derecho en la ecuación anterior se denomina
matriz Hamiltoniana y tiene algunas propiedades interesantes. Esta es una
matriz simpléctica, esto es, satisface la ecuación
[ ]
−1 ⊤ −1 0 I
S H S=H donde S = (6.67)
−I 0
Las matrices simplécticas tienen las siguientes propiedades:

Ninguno de los autovalores de una matriz simpléctica es igual a 0.
Si λ es un autovalor de la matriz simpléctica, entonces 1/λ también lo es.
El determinante de una matriz simpléctica es igual a ±1.
Si una matriz simpléctica no tiene ningún autovalor con magnitud igual a uno,
entonces la mitad de estos autovalores estarán fuera del cı́rculo unitario, y
la otra mitad estarán en el interior del cı́rculo unitario. Se define Λ como la
matriz diagonal que contiene todos los autovalores de H que están fuera del
cı́rculo unitario (asumiendo que ninguno de los valores propios están sobre el
cı́rculo unitario). Entonces la forma de Jordan de H puede escribirse como

[ −1 ]
Λ 0
H=Ψ Ψ−1
0 Λ
= ΨDΨ−1 (6.68)
donde D es la matriz diagonal de autovalores y está definida por la anterior

ecuación. La matriz Ψ puede dividirse en cuatro bloques n × n como
[ ]
Ψ11 Ψ12
Ψ= (6.69)
Ψ21 Ψ22
[ ]
Ψ11
Nótese que la matriz de contiene los vectores propios de H que
Ψ21 2n×n
corresponden a los valores propios estables de H (es decir, [ los valores propios
]
Ψ12
que están dentro del cı́rculo unitario). La matriz de contiene los
Ψ22 2n×n
vectores propios de H que corresponden a los valores propios inestables de H
(es decir, los valores propios que están fuera del cı́rculo unitario). La Ecuación
(6.66) puede escribirse como
[ ] [ ]
Zk+1 −1 Zk
= ΨDΨ
Υk+1 Υk
[ ] [ ]
Zk+1 Zk
Ψ−1 = DΨ−1 (6.70)
Υk+1 Υk
[ ] [ ] [ ]
Ahora se definen las matrices Y1k n×n , Y2k n×n y la matriz Yk 2n×n , como
sigue:
[ ] [ ]
Y1k −1 Zk
=Ψ
Y2k Υk
[ −1 ][ ]
(Ψ )11 (Ψ−1 )12 Zk
=
(Ψ−1 )21 (Ψ−1 )22 Υk
= Yk (6.71)
Nótese en la anterior ecuación que (Ψ−1 )11 no es la inversa de la parte superior

izquierda n × n de la partición de Ψ; la matriz (Ψ−1 )11 es más bien la parte
superior izquierda n × n de la partición de Ψ−1 (similar enunciado se mantiene

para las otras particiones). Con estas definiciones puede escribirse la Ecuación
(6.70) como
Yk+1 = DYk
[ ] [ −1 ][ ]
Y1,k+1 Λ 0 Y1k
= (6.72)
Y2,k+1 0 Λ Y2k
A partir de esta ecuación se ve que
Y2,k+1 = ΛY2k
(6.73)
Y2k = Λk Y2,0
Similarmente se ve que
Y1k = Λ−k Y1,0 (6.74)
Nótese que la Ecuación (6.71) puede escribirse como

[ ] [ ][ ]
Zk Ψ11 Ψ12 Y1k
=
Υk Ψ21 Ψ22 Y2k
[ ][ ]
Ψ11 Ψ12 Λ−k Y1,0
= (6.75)
Ψ21 Ψ22 Λk Y2,0
Cuando k se incrementa, la matriz Λ−k se aproxima a cero (porque ésta es una

matriz diagonal cuyos elementos son todos menores que uno en magnitud). Por
lo tanto, para k grande se obtiene
[ ] [ ][ ]
Zk Ψ11 Ψ12 0
=
Υk Ψ21 Ψ22 Λk Y2,0
(6.76)
Zk = Ψ12 Y2k
Υk = Ψ22 Y2k
Resolviendo para Υk para valores grandes de k da
Υk = Ψ22 Ψ−1
12 Zk (6.80)
Algoritmo 6.4 El enfoque Hamiltoniano para filtrado de Kalman de estado

estacionario.
1. Formar la matriz Hamiltoniana
[ −⊤ ]
F F−⊤ H⊤ R−1 H
H= (6.77)
QF−⊤ F + QF−⊤ H⊤ R−1 H
◃ Para un problema de filtrado de Kalman de n-estados, la matriz Hamil-

toniana será una matriz 2n × 2n.
2. Calcular los valores propios de H.
◃ Si alguno de éstos está sobre el cı́rculo unitario, entonces no se puede
ir más lejos con este procedimiento: la ecuación de Riccati no tiene una
solución de estado estacionario.
3. Reunir los n autovectores que corresponden a los n valores propios que
están por fuera del cı́rculo unitario. Poner esos n autovectores en una matriz
particionada como:
[ ]
Ψ12
(6.78)
Ψ22
◃ La primera columna de esta matriz es el primer autovector, la segunda

columna es el segundo autovector, etc. Ψ12 y Ψ22 son ambas matrices n × n.
4. Calcular la solución de estado estacionario de la ecuación de Riccati como
P− −1
∞ = Ψ22 Ψ12 (6.79)
◃ Nótese que Ψ12 debe ser invertible para que este método funcione.
Pero también, de la Ecuación (6.63) se sabe que
Υ k = P k Zk (6.81)
Combinando las dos ecuaciones anteriores se muestra que
lı́m Pk = Ψ22 Ψ−1

12 (6.82)
k→∞
Esto da una forma para determinar la solución de estado estacionario de la

ecuación de Riccati. Sin embargo, este análisis supone que Λ es una matriz
diagonal con todos los elementos por fuera del cı́rculo unitario. En otras pa-
labras, si la matriz Hamiltoniana tiene algún valor propio con magnitud igual
a uno, entonces este análisis fracasa. En el Algoritmo 6.4 se indica el procedi-
miento para calcular la solución de estado estacionario, de la ecuación Riccati
de tiempo discreto.
El enfoque Hamiltoniano para filtrado de estado estacionario es debido a
[Vaughan, 1970], quien también desarrolló soluciones DARE de tiempo variable
usando matrices Hamiltonianas.
Ejemplo 6.9
Demostrar que la matriz H de la Ecuación (6.66) es simpléctica.
Solución:
La expresión está dada por

[ −⊤ ]
F F−⊤ H⊤ R−1 H
H=
QF−⊤ F + QF−⊤ H⊤ R−1 H
Además
[ ] [ ]
0 I −1 0 −I
S= S =
−I 0 I 0
La transpuesta de la matriz H está dada por

[ ]
F−1 F−1 Q
H⊤ = (6.83)
H⊤ R−1 HF−1 F⊤ + H⊤ R−1 HF−1 Q
Entonces, de la Ecuación (6.67) se obtiene, postmultiplicando ambos miembros

por la matriz hamiltoniana H
[ ]
−1 ⊤ I 0
S H SH = (6.84)
0 I
Realizando el primer triple producto matricial:

[ ][ ][ ]
0 −I F−1 F−1 Q 0 I
=
I 0 H⊤ R−1 HF−1 F⊤ + H⊤ R−1 HF−1 Q −I 0
[ ⊤ ]
F + H⊤ R−1 HF−1 Q −H⊤ R−1 HF−1
=
F−1 Q F−1
Ahora se multiplica el resultado anterior por la matriz H:

[ ] [ ⊤ ][ ]
h11 h12 F +H⊤ R−1 HF−1 Q −H⊤ R−1 HF−1 F−⊤ F−⊤ H⊤ R−1 H
=
h21 h22 F−1 Q F−1 QF−⊤ F + QF−⊤ H⊤ R−1 H
Donde
h11 = (F⊤ + H⊤ R−1 HF−1 Q)F−⊤ − H⊤ R−1 HF−1 QF−⊤ = I
h12 = (F⊤ + H⊤ R−1 HF−1 Q)F−⊤ H⊤ R−1 H−
− H⊤ R−1 HF−1 (F + QF−⊤ H⊤ R−1 H = 0
h21 = −F−1 QF−⊤ + F−1 QF−⊤ = 0
h22 = −F−1 QF−⊤ H⊤ R−1 H + F−1 (F + QF−⊤ H⊤ R−1 H) = I
Entonces,
[ ] [ ]
h11 h12 I 0
=
h21 h22 0 I
Con lo cual queda demostrada la propiedad.
Ejemplo 6.10
Considérese el sistema escalar de la Ecuación (6.44):
xk+1 = xk + vk vk ∼ N (0, 1)
yk = xk + wk wk ∼ N (0, 1)
Se ve que F = H = Q = R = 1. Sustituyendo esos valores en la expresión para la
matriz Hamiltoniana da
[ −⊤ ] [ ]
F F −⊤ H ⊤ R−1 H 1 1
H= =
QF −⊤ F + QF −⊤ H ⊤ R−1 H 1 2
Los valores propios de H son 0.38 y 2.62. Ninguno de los valores propios tiene
magnitud uno por lo que se está en condiciones de continuar con el procedimiento.
El autovector de H que corresponde al valor propio fuera del cı́rculo unitario es
⊤
[0.5257 0.8507] . Se forma la correspondiente matriz de autovectores como
[ ] [ ]
Ψ12 0.5257
=
Ψ22 0.8507
Nótese que Ψ12 es invertible por lo que se podrá continuar con el problema. La
solución de la ecuación de Riccati de estado estacionario es
6.5. Resumen 217
0.8507
P = Ψ22 Ψ−1
12 = = 1.62
0.5257
La ganancia de Kalman de estado estacionario por lo tanto se calcula de la Ecua-
ción (6.19) como
(1.62)(1)
K = P H ⊤ (HP H ⊤ + R)−1 = = 0.62
(1)(1.62)(1) + 1
la cual coincide con la Ecuación (6.45).
6.5. Resumen
En este capı́tulo, se discutió una variedad de generalizaciones del filtro de Kal-
man que hacen que el filtro sea aplicable ampliamente a un número mayor
de problemas. Ruidos del proceso y de la medida correlacionados y coloreados
fueron estudiados desde los primeros dı́as del invento del filtro de Kalman. En
este capı́tulo se ha demostrado que las modificaciones del filtro teniendo en
cuenta la correlación y color puede mejorar el rendimiento de la estimación.
Sin embargo, si estos métodos son dignos de la complejidad adicional y esfuer-
zo computacional depende del problema. Una de las extensiones más prácticas
del filtro Kalman lo constituye el filtro de Kalman de estado estacionario. El
filtro de Kalman de estado estacionario a menudo se desempeña casi de la mis-
ma forma como el filtro variable en el tiempo teóricamente más riguroso. Sin
embargo, el filtro de estado estacionario requiere sólo una fracción del costo
computacional. Para el análisis del filtro de estado estacionario se aplica el
modelo Hamiltoniano el cual permite determinar la solución en estado esta-
cionario de la ecuación de Riccati. Este método tiene algunas limitaciones, es
decir, si la matriz Hamiltoniana tiene valores propios con magnitud igual a
uno, entonces el análisis falla.
Bibliografı́a
Anderson, B. and Moore, J. (1979). Optimal Control. Information and System Sciences
Series. Prentice–Hall, Inc., Englewood Cliffs, New Jersey 07632, USA.
Arnold III, W. F. and Laub, A. J. (1984). Generalized eigenproblem algorithms and software
for algebraic Riccati equations. Proceedings of the IEEE, 72(12): 1746–1754.
Bitmead, R., Gevers, M., Petersen, I., and Kaye, R. (1985). Monotonicity and stabiliza-
bility properties of solutions of the Riccati difference equation: Propositions, lemmas,
theorems, fallacious conjectures and counterexamples. Systems and Control Letters,
5(5): 309–315.
Bryson, A. and Henrikson, L. (1968). Estimation using sampled data containing sequentially
correlated noise. Journal of Spacecraft and Rockets, 5(6): 662–665.
Bryson, A. and Johanson, D. (1965). Linear filtering for time-varying systems using mea-
surements containing colored noise. IEEE Transactions on Automatic Control, AC-
10(1): 4–10.
Bucy, R. and Joseph, P. (1968). Filtering for Stochastic Processes with Applications to
Guidance. Number 23 in Interscience tracts in pure and applied mathematics. John
Wiley & Sons, New York, NY, USA.
Chui, C. and Chen, G. (1987). Kalman Filtering with Real-Time Applications. Springer-
Verlag, New York, USA.
Goodwin, G. and Sin, K. (1984). Adaptive Filtering, Prediction and Control. Prentice Hall,
Englewood Cliffs, New Jersey, USA.
USA.
Maybeck, P. (1979). Stochastic Models, Estimation, and Control, volume Volume 1. Acade-
mic Press, New York.
219
220 BIBLIOGRAFı́A
McGarty, T. (1974). Stochastic Systems and State Estimation. John Wiley & Sons, New
York, USA.
Poubelle, M., Petersen, I., Gevers, M., and Bitmead, R. (1986). A miscellany of results
on an equation of Count J. F. Riccati. IEEE Transactions on Automatic Control,
AC-31(7): 651–654.
Stear, E. and Stubberud, A. (1968). Optimal filtering for Gauss–Markov noise. International
Journal of Control, 8(2): 123–130.
Stengel, R. (1994a). Optimal Control and Estimation. Dover Publications, Inc., New York.
Stengel, R. (1994b). Optimal Control and Estimation. New York, USA.
Vaughan, D. (1970). A nonrecursive algebraic solution for the discrete Riccati equation.
IEEE Transactions on Automatic Control, 15(5): 597 – 599.
Capı́tulo 7
El filtro de Kalman continuo
A finales de los años 50 los investigadores J. Follin, A.G. Carlton, J. Hanson

y R. Busy del Laboratorio de Fı́sica Aplicada Johns Hopkins desarrollaron
el filtro de Kalman en tiempo continuo en un trabajo no publicado [Simon,
2006]. R. Kalman independientemente desarrolló el filtro en tiempo discreto
en 1960. En abril de 1960 Kalman y R. Bucy con base en el trabajo de los
otros investigadores y colaboraron en la publicación del filtro de Kalman de
tiempo continuo en [Kalman and Bucy, 1961]. Este filtro se denomina a veces
como el filtro de Kalman–Bucy.
La gran mayorı́a de aplicaciones de filtro de Kalman se implementan en las
computadoras digitales, por lo que puede parecer superfluo discutir el filtra-
do de Kalman para mediciones en tiempo continuo. Sin embargo, todavı́a hay
oportunidades para implementar filtros de Kalman en tiempo continuo (es de-
cir, en circuitos analógicos) [Hughes, 1988]. Además, la derivación del filtro de
tiempo continuo es instructiva desde un punto de vista pedagógico. Por último,
en el estado estacionario, estimadores de tiempo continuo se pueden analizar
usando los conceptos de dominio de frecuencia convencionales, que proporcio-
nan una ventaja sobre los estimadores de tiempo discreto [Balakrishnan, 1987],
[Stengel, 1994]. A la luz de estos factores, en este capı́tulo se presenta el filtro
de Kalman en tiempo continuo.
La derivación del filtro de tiempo continuo comienza con el filtro de tiempo
discreto desarrollado previamente en el Capı́tulo 4 y entonces se lleva al lı́mite
cuando el paso de tiempo se reduce a cero. La Sección 7.1 muestra la relación
entre el ruido blanco de tiempo continuo y el ruido blanco de tiempo discreto,
221
222 Capı́tulo 7. El filtro de Kalman continuo
que es la base para la derivación del filtro de Kalman en tiempo continuo. La

Sección 7.2 muestra algunos métodos para resolver la ecuación de Riccati en
tiempo continuo, que es un componente clave del filtro de Kalman de tiempo
continuo.
7.1. Ruido blanco en tiempo discreto y en

tiempo continuo
En esta sección se mostrará la relación que existe entre el ruido blanco en
tiempo discreto y en tiempo continuo.
7.1.1. Ruido del proceso

Considérese el siguiente sistema en tiempo discreto con una matriz de transi-
ción de estado identidad y un tiempo de muestreo T.
xk = xk−1 + vk−1
vk ∼ (0, Q) (7.1)
x0 = 0
donde {vk } es un proceso de ruido blanco en tiempo discreto. Se verá que

efecto tiene el ruido blanco sobre la covarianza del estado. Se puede resolver
este sistema en tiempo discreto para el estado como sigue:
xk = v0 + v1 + · · · + vk−1 (7.2)
La covarianza del estado es por lo tanto dada como

{ } { }
E xk x⊤k = E (v0 + v1 + · · · + vk−1 )(v0 + v1 + · · · + vk−1 )⊤
{ } { } { }
= E v0 v0⊤ + E v1 v1⊤ + · · · + E vk−1 vk−1 ⊤
(7.3)
= kQ
El valor del parámetro de tiempo continuo t es igual al número de pasos de

tiempo discreto, k veces el tiempo de muestreo T. Esto es, t = kT. Por lo tanto
se ve que
{ } { }
E x(t)x⊤ (t) = E xk x⊤ k
(7.4)
= kQ
7.1. Ruido blanco en tiempo discreto y en tiempo continuo 223
La covarianza del estado se incrementa linealmente con el tiempo para un

tiempo de muestreo T dado. Ahora se considera el sistema en tiempo continuo
con una matriz de transición de estado identidad:
ẋ(t) = v(t) (7.5)
donde v(t) es el ruido blanco en tiempo continuo. Se propone (en retrospectiva)

la siguiente definición para el ruido blanco en tiempo continuo:
{ } Q
E v(t)v⊤ (τ ) = δ(t − τ ) (7.6)
T
donde Q y T son los mismos que se encuentran en el sistema de tiempo discreto
de la Ecuación (7.1); δ(t−τ ) es el delta de Dirac. Ahora se calcula la covarianza
de x(t) en la Ecuación (7.5):
{∫ t ∫ t }
{ ⊤
} ⊤
E x(t)x (t) = E v(α)dα v (β)dβ
0 0
∫ t∫ t (7.7)
{ ⊤
}
= E v(α)v (β) dα dβ
0 0
sustituyendo la Ecuación (7.6) en la anterior ecuación da

∫ t∫ t
{ ⊤
} Q
E x(t)x (t) = δ(α − β)dα dβ
0 T
∫ t
0
Q (7.8)
= dβ
0 T
Qt
=
T
donde se ha usado la propiedad de desplazamiento de la función impulso de
tiempo continuo. Recordando que t = kT, se puede escribir la ecuación anterior
como
{ }
E x(t)x⊤ (t) = kQ (7.9)
Comparando ésta con la Ecuación (7.4), se ve que la covarianza del estado de

los sistemas en tiempo continuo incrementa con el tiempo exactamente en la
misma forma como la covarianza del estado de los sistemas en tiempo discreto.
En otras palabras, el ruido blanco en tiempo discreto con covarianza Q en un

sistema con un periodo de muestreo T, es equivalente al ruido blanco en tiempo
continuo con covarianza Qc δ(t), donde Qc = Q/T. El ruido blanco en tiempo
continuo con media cero se indica como
v(t) ∼ (0, Qc ) (7.10)
lo cual es equivalente a decir que

{ }
E v(t)v⊤ (τ ) = Qc δ(t − τ ) (7.11)
El ruido blanco en tiempo continuo es contrario al sentido común porque v(t)

está correlacionado de forma infinita con v(τ ) en t = τ , pero este tiene correla-
ción cero con sı́ mismo cuando t ̸= τ . No obstante puede ser aproximadamente
descriptivo en los procesos reales. Además, el ruido blanco en tiempo continuo
está matemáticamente bien definido y es un mecanismo útil que se usará en
este capı́tulo. Discusión adicional sobre la relación entre el tiempo discreto y
el ruido blanco de tiempo continuo se puede encontrar en [Kailath, 1981].
7.1.2. Ruido de medición
Supóngase que se tiene una medida en tiempo discreto de una constante x cada
T segundos. Los tiempos de medida son tk = kT (k = 1, 2, . . .):
xk = xk−1
yk = xk + wk (7.12)
wk ∼ (0, R)
De las ecuaciones del filtro Kalman en la Sección 4.4, se encuentra que la

covarianza del error de estimación a posteriori está dada por
+ Pk+ R
Pk+1 = (7.13)
Pk+ + R
De esto se puede demostrar que

P0 R
Pk+ =
kP0 + R
R
lı́m Pk+ = (7.14)
P0 →∞ k
RT
=
tk
La covarianza del error en el tiempo tk es independiente del tiempo de mues-
treo T si
Rc
R= (7.15)
T
donde Rc es alguna constante. Esto implica que
lı́m R = Rc δ(t) (7.16)

T→0
donde δ(t) es la función impulso en tiempo continuo. Esto establece la equi-

valencia entre el ruido blanco de medición en tiempo discreto y en tiempo
continuo. Los efectos del ruido blanco de medición en tiempo discreto y en
tiempo continuo son los mismos si
wk ∼ (0, R)
(7.17)
w(t) ∼ (0, Rc )
La Ecuación (7.15) especifica la relación entre R y Rc y la segunda ecuación

anterior es una forma abreviada de decir
E {w(t)wτ (τ )} = Rc δ(t − τ ) (7.18)
7.1.3. Simulación discretizada de sistemas de tiempo

continuo ruidosos
Los resultados de las secciones anteriores se pueden combinar con los resultados
de la Sección 2.4 para obtener una simulación discretizada de un sistema de
tiempo continuo ruidoso, con el propósito de implementar un estimador de
estado de tiempo discreto. Supóngase que se tiene un sistema dado por
ẋ = Ax + Bu + v
y = Cx + w
(7.19)
v ∼ (0, Qc )
w ∼ (0, Rc )
Tanto v(t) y w(t) son ruidos en tiempo continuo y u(t) es una entrada co-
nocida. Este sistema es equivalente aproximadamente al siguiente sistema en
tiempo discreto
∫ T
AT
xk = e xk−1 + e AT
e−Aτ dτ Buk−1 + vk−1
[0 ]
AT
= e xk−1 + e AT
I − e−AT A−1 Buk−1 + vk−1
(7.20)
yk = Cxk + wk
vk ∼ (0, Qc T)
wk ∼ (0, Rc /T)
donde T es el tamaño del paso de discretización. La segunda expresión para

xk es válida si A−1 existe. Si se utilizan estas ecuaciones discretizadas para
simular un sistema en tiempo continuo, entonces se puede simular un estimador
de estado en tiempo continuo usando las mediciones resultantes con uno de los
métodos de integración discutidos en la Sección 2.4.
7.1.4. Deducción del filtro de Kalman en tiempo

continuo
Ahora se utilizarán los resultados de la sección anterior para deducir el filtro

de Kalman en tiempo continuo. Supóngase que se tiene un sistema de tiempo
continuo dado como
ẋ = Ax + Bu + v
y = Cx + w
(7.21)
v ∼ (0, Qc )
w ∼ (0, Rc )
Cuando se escribe v ∼ (0, Qc ) significa exactamente lo que está escrito en la

Ecuación (7.11). Cuando se escribe w ∼ (0, Rc ) significa exactamente lo que
está escrito en la Ecuación (7.18). Ahora supóngase que se discretiza el sistema
con un tiempo de muestreo T (ver Sección 2.4). Se obtiene
xk = Fxk−1 + Guk−1 + vk−1

(7.22)
yk = Hxk + wk
Las matrices en este sistema de tiempo discreto se calculan como sigue:
F = eAT ≈ (I + AT) para T pequeño

( )
G = eAT − I A−1 B ≈ BT para T pequeño
H=C (7.23)
vk ∼ (0, Q), Q = Qc T
wk ∼ (0, R), R = Rc /T
La ganancia del filtro de Kalman de tiempo discreto para este sistema se dedujo
en la Sección 4.4 como
Kk = P−1 ⊤ − ⊤
k H (HPk H + R)
−1
(7.24)
De esto se puede deducir

( )−1
−1 ⊤ − ⊤ Rc
Kk = Pk C CPk C +
T
Kk
= P−1 ⊤ − ⊤
k C (CPk C T + Rc )
−1 (7.25)
T
Kk
lı́m = P−1 ⊤ −1
k C Rc
T→0 T
Las covarianzas del error de estimación fueron deducidas en la Sección 4.4

como
−
k = (I − Kk H)Pk
P+
(7.26)
P− + ⊤
k+1 = FPk F + Q
Para valores pequeños de T, de acuerdo con la Ecuación (7.23), esto se puede

escribir como
P− + ⊤
k+1 = (I + AT)Pk (I + AT) + Qc T
+ ⊤ + ⊤ 2
= P+ +
k + (APk + Pk A + Qc )T + APk A T
Sustituyendo convenientemente P+ k y teniendo en cuenta que H = C, se ob-

tiene:
[ ]
P−k+1 = (I − K k C)P−
k + AP + ⊤ 2
k A T + A(I − K k C)P −
k + (I − K k C)P − ⊤
k A + Qc T
Sustrayendo P−
k de ambos lados y dividiendo entre T da
P− −
k+1 − Pk −Kk CP− ⊤ − − ⊤ AKk CP−
= k
+ AP+
k A T + APk + P k A + Qc − k
T
T T T
Kk CP−kA
⊤
− T
T
donde no se han simplificado los dos últimos términos de la derecha para efectos
de tomar el lı́mite.
Tomando el lı́mite cuando T → 0 y usando la Ecuación (7.25) da
P− −
k+1 − Pk
Ṗ = lı́m = −PC⊤ R−1 ⊤
c CP + AP + PA + Qc
(7.27)
T→0 T
Esta expresión se denomina ecuación diferencial de Riccati en P y puede usarse
para calcular la covarianza del error de estimación del filtro de Kalman de
tiempo continuo. Esto requiere n2 integraciones porque P es una matriz n × n.
Pero P es simétrica, ası́ en la práctica sólo se necesita integrar n(n + 1)/2
ecuaciones con el fin de resolver P. En la Sección 4.4 se dedujeron las ecuaciones
del filtro de Kalman para x̂ como
x̂− +
k = Fx̂k−1 + Guk−1
− − (7.28)
k = x̂k + Kk (yk − Hx̂k )
x̂+
Si se asume que T es pequeño se puede usar la Ecuación (7.23) para escribir la

ecuación de actualización de la medida como
k = Fx̂k−1 + Guk−1 + Kk (yk − HFx̂k−1 − HGuk−1 )

x̂+ + +
[ ]
≈ (I + AT)x̂+k−1 + BTuk−1 + Kk yk − C(I + AT)x̂k−1 − CBTuk−1 (7.29)
+
Ahora se sustituye para Kk de la Ecuación (7.25) para obtener
x̂+ + +
k = x̂k−1 + ATx̂k−1 + BTuk−1 +
[ ]
PC⊤ R−1c T yk − Cx̂k−1 − CATx̂k−1 − CBTuk−1
+ +
(7.30)
Substrayendo x̂+
k−1 en ambos lados, dividiendo por T, y tomando el lı́mite
cuando T → 0, da
˙x̂ = lı́m x̂k − x̂k−1

+ +
T→0 T
= Ax̂ + Bu + PC⊤ R−1
c (y − Cx̂) (7.31)
Esto puede escribirse como
x̂˙ = Ax̂ + Bu + K(y − Cx̂)

(7.32)
K = PC⊤ R−1
c
Esta expresión corresponde a la ecuación diferencial que puede ser usada para
integrar el estado estimado en el filtro de Kalman de tiempo continuo. El
filtro de Kalman en tiempo continuo puede resumirse como se muestra en el
Algoritmo 7.1.
Ejemplo 7.1
En este ejemplo se usará el filtro de Kalman de tiempo continuo para estimar una
constante, dadas las medidas de ruido en tiempo continuo:
ẋ = 0
y =x+w
w ∼ (0, R)
Se ve que A = 0, Q = 0, y C = 1. La Ecuación (7.34) da la ecuación diferencial

para la covarianza como:
Ṗ = −PC⊤ R−1 CP + AP + PA⊤ + Q

Algoritmo 7.1 El filtro de Kalman en tiempo continuo.

1. Ecuaciones del sistema dinámico y de medición en tiempo continuo:
ẋ = Ax + Bu + v
y = Cx + w
(7.33)
v ∼ (0, Qc )
w ∼ (0, Rc )
2. Ecuaciones del filtro de Kalman en tiempo continuo:
x̂(0) = E {x(0)}
{ }
P(0) = E (x(0) − x̂(0))(x(0) − x̂(0))⊤
K = PC⊤ R−1 c (7.34)
˙x̂ = Ax̂ + Bu + K(y − Cx̂)
Ṗ = −PC⊤ R−1 ⊤
c CP + AP + PA + Qc
Entonces
Ṗ = −P 2 /R
con la condición inicial P (0) = P0 . De esto se puede obtener
dP −dτ
=
P2 R
∫ P (t) ∫ t
1 1
2
dP = − dτ
P (0) P 0 R
( ) t
− P −1 − P0−1 = −
( R )
−1 −1 t
P = P0 +
R
( )
−1 t −1
P = P0 +
R
P0
=
1 + P0 t/R
lı́m P = 0
t→∞
La Ecuación (7.34) da la ganancia de Kalman como
K = P C ⊤ R−1
P0 /R
=
1 + P0 t/R
lı́m K = 0
t→∞
La Ecuación (7.34) da la ecuación de actualización de estado como
x̂˙ = Ax̂ + Bu + K(y − Cx̂) (7.35)

de la cual se puede obtener
x̂˙ = K(y − x̂)

lı́m x̂˙ = 0
t→∞
Esto muestra que cuando el tiempo tiende a infinito, x̂ alcanza un valor de esta-
do estacionario. Esto es intuitivo porque cuando se tiene un número infinito de
mediciones de una constante, el estimado de esa constante llega a ser perfecto y
medidas adicionales no pueden mejorar el estimado. Además, la ganancia de Kal-
man tiende a cero cuando el tiempo tiende a infinito, lo que a su vez dice que se
tienen que ignorar mediciones adicionales (ya que el estimado llega a ser perfecto).
Finalmente, la covarianza P tiende a cero cuando el tiempo tiende a infinito, lo
cual dice que la incertidumbre en el estimado tiende a cero, significando que el
estimado es perfecto.
Ejemplo 7.2
En este ejemplo se tienen las medidas de la velocidad de un objeto que se mueve en
una dimensión. El objeto está sujeto a aceleraciones aleatorias. Se desea estimar la
velocidad x a partir de medidas ruidosas de la misma. Las ecuaciones del sistema
y de la medida están dadas como
ẋ = v
y =x+w
v ∼ (0, Q)
w ∼ (0, R)
Solución:
Se ve que A = 0 y C = 1. A partir de la actualización de la covarianza de la

Ecuación (7.34) se obtiene
Ṗ = −P C ⊤ R−1 CP + AP + P A⊤ + Q
= −P 2 /R + Q
con la condición inicial P (0) = P0 . De esto se puede obtener
( )
dP = Q − P 2 /R dτ
∫ t ∫ P (t)
dP
dτ = (7.36)
P (0) Q − P /R
2
0
∫ t ∫ P (t)
dP
dτ = √ √ √ √
0 P (0) ( Q + P/ R)( Q − P/ R)
∫ t [∫ ∫ P (t) ]
P (t)
1 dP dP
dτ = √ √ √ + √ √
0 2 Q P (0) Q + P/ R P (0) Q − P/ R
√ (√ √ )P (t)
R Q + P/ R
t = √ ln √ √
2 Q Q − P/ R P (0)
√ √ √
R ( QR + P )( QR − P0 )
t = √ ln √ √
2 Q ( QR − P )( QR + P0 )
√ √ √
( QR + P )( QR − P0 )
e 2 Q/Rt
= √ √
( QR − P )( QR + P0 )
Resolviendo esto para P da
[ √ √ √ ]
√ P0 − QR + ( QR + P0 )e2 Q/Rt
P = QR √ √ √
QR − P0 + ( QR + P0 )e2 Q/Rt
√
lı́m P = QR
t→∞
Otro método. Partiendo de la Ecuación (7.36) se obtiene

√ ( )P
R P
t= tanh −1
√
Q QR P0
√ [ ( ) ( )]
R −1 P −1 P0
t= tanh √ − tanh √
Q QR QR
Por lo tanto,
( ) ( ) √
−1 P −1 P Q
tanh √ = tanh √ 0 + t
QR QR R
Resolviendo para P
[ ( ) √ ]
√ −1 P Q
P = QR tanh tanh √ 0 + t
QR R
Recordando que lı́m tanh(a + b) = 1, entonces

b→∞
√
lı́m P = QR
t→∞
La ganancia de Kalman se obtiene de la Ecuación (7.34) como

P
K = P C ⊤ R−1 =
√ R
lı́m K = Q/R
t→∞
La expresión de la actualización del estado estimado se obtiene a partir de la

x̂˙ = Ax̂ + Bu + K(y − C x̂)

= K(y − x̂)
A partir de estas expresiones se ve que si el ruido del proceso se incrementa (es
decir, Q crece) entonces K aumenta. Esto es intuitivamente aceptable, porque a
partir de la ecuación x̂˙ se ve que K define la velocidad a la cual cambia x̂ con base
a las mediciones. Si Q es grande entonces habrá menos confianza en el modelo
del sistema y, relativamente más nivel de confianza en las mediciones, ası́ que se
cambia x̂ de forma más intensa para ser coherente con las mediciones.
Similarmente, se ve que si se tiene ruido en la medida grande (es decir, R es
grande) entonces K decrece. Esto es de nuevo adecuado. Un ruido grande en la
medida significa que se tiene menos nivel de confianza en la medición, de modo
que se debe cambiar x̂ de manera menos intensa para ser consistentes con las
mediciones.
Finalmente, se observa que P se incrementa de la misma manera como Q y R
lo hacen. Un incremento en el ruido bien sea en el modelo del sistema o en las
mediciones degradará el nivel de confianza en la estimación de los estados.
7.2. Soluciones alternativas para la ecuación

de Riccati
La ecuación diferencial de Riccati de la Ecuación (7.34) puede ser compu-
tacionalmente costosa de integrar, especialmente para sistemas con constantes
de tiempo pequeñas. También, la integración directa de la ecuación de Riccati
puede resultar en una matriz P que pierde su caracterı́stica de definida positiva
debido a problemas numéricos [Simon, 2006], [Crassidis and Junkins, 2012]. En
esta sección se mirarán algunas soluciones alternas para la ecuación diferencial
de Riccati. El primer método, llamado el enfoque de la matriz de transición, se
plantea para reducir el esfuerzo computacional. El segundo método, llamado
filtrado de raı́z cuadrada, se plantea para reducir las dificultades numéricas.
7.2.1. El enfoque de la matriz de transición
Asúmase que P = ΛY−1 , donde Λ y Y son matrices n × n a ser determinadas.

En lo siguiente se determinará qué igualdades deben ser satisfechas por Λ y
Y con el fin de que esta factorización sea válida. Si la factorización es válida
entonces
d
Ṗ = Λ̇Y−1 + Λ (Y−1 )
dt
= Λ̇Y−1 − ΛY−1 ẎY−1 (7.37)
donde se ha usado la Ecuación (1.152) para la derivada en el tiempo de Y−1 .

Se postmultiplican ambos lados de la ecuación anterior por Y para obtener
ṖY = Λ̇ − ΛY−1 Ẏ (7.38)
Recordando de la Ecuación (7.34) que la ecuación diferencial para P está dada

por
Ṗ = AP + PA⊤ − PC⊤ R−1 CP + Q (7.39)
Se sustituye ΛY−1 por P en esta ecuación para obtener
Ṗ = AΛY−1 + ΛY−1 A⊤ − ΛY−1 C⊤ R−1 CΛY−1 + Q (7.40)

7.2. Soluciones alternativas para la ecuación de Riccati 235
Post-multiplicando ambos lados de esta ecuación por Y se obtiene
ṖY = AΛ + ΛY−1 A⊤ Y − ΛY−1 C⊤ R−1 CΛ + QY (7.41)
Comparando los miembros de la derecha de las ecuaciones (7.38) y (7.41) se

obtiene
Λ̇ − ΛY−1 Ẏ = AΛ + ΛY−1 A⊤ Y − ΛY−1 C⊤ R−1 CΛ + QY

Λ̇ = AΛ + QY + ΛY−1 (Ẏ + A⊤ Y − C⊤ R−1 CΛ) (7.42)
Esta ecuación proviene de la factorización original de P, y si esta ecuación

se reduce a 0 = 0, entonces se puede concluir que la factorización original
es válida. Ası́, si Λ̇ = AΛ + QY y Ẏ = C⊤ R−1 CΛ − A⊤ Y, entonces la
factorización asumida será válida. Estas ecuaciones diferenciales para Y y Λ
se pueden combinar como
[ ] [ ][ ] [ ]
Λ̇ A Q Λ Λ
= ⊤ −1 ⊤ =J (7.43)
Ẏ C R C −A Y Y
donde J se define como

[ ]
A Q
J= (7.44)
C⊤ R−1 C −A⊤
Las condiciones iniciales para Λ y Y se escogen de modo que sean consistentes

con las condiciones iniciales de P como sigue:
Λ(0) = P(0)
(7.45)
Y(0) = I
Ahora se supone que A, Q, C y R son constantes (esto es, se tiene un sistema

LTI con procesos constantes y covarianzas de ruido de medición). En este caso
J es constante y la Ecuación (7.43) puede resolverse como
[ ] [ ]
Λ(t + T) JT Λ(t)
=e ϕ (7.46)
Y(t + T) Y(t)
Esta puede escribirse como

[ ] [ ][ ]
Λ(t + T) ϕ11 (T) ϕ12 (T) Λ(t)
= (7.47)
Y(t + T) ϕ21 (T) ϕ22 (T) Y(t)
donde las matrices ϕij están definidas como las cuatro submatrices n × n en
eJT . De la factorización original se supone que se tiene Λ = PY, por lo tanto
esta ecuación se puede escribir como
[ ] [ ][ ]
Λ(t + T) ϕ11 (T) ϕ12 (T) P(t)Y(t)
= (7.48)
Y(t + T) ϕ21 (T) ϕ22 (T) Y(t)
Esta puede escribirse como dos ecuaciones separadas:
Λ(t + T) = ϕ11 (T)P(t)Y(t) + ϕ12 (T)Y(t)

(7.49)
Y(t + T) = ϕ21 (T)P(t)Y(t) + ϕ22 (T)Y(t)
Puesto Λ(t + T) = P(t + T)Y(t + T), la primera ecuación se puede escribir como
P(t + T)Y(t + T) = ϕ11 (T)P(t)Y(t) + ϕ12 (T)Y(t) (7.50)
Sustituyendo Y(t + T) de la Ecuación (7.49) en la Ecuación (7.50) y simplifi-

cando da
P(t + T) [ϕ21 (T)P(t)Y(t) + ϕ22 (T)Y(t)] = ϕ11 (T)P(t)Y(t) + ϕ12 (T)Y(t)

P(t + T) [ϕ21 (T)P(t) + ϕ22 (T)] = ϕ11 (T)P(t) + ϕ12 (T) (7.51)
Esta ecuación es finalmente resuelta para P(t + T) como
P(t + T) = [ϕ11 (T)P(t) + ϕ12 (T)] [ϕ21 (T)P(t) + ϕ22 (T)]−1 (7.52)
Esta puede ser una forma rápida para resolver P en lugar de integrar la ecua-
ción de Riccati. Se debe tener en cuenta que con este método no hay que
preocuparse por el tamaño del paso de integración. Este método puede usarse
para propagar desde P(t) hasta P(t + T) en una sola ecuación, para cualquier
valor de t y de T.
Ejemplo 7.3
Supóngase que se desea estimar la tasa desplazamiento ξ de un giroscopio (se
asume que es constante) dadas las medidas del ángulo de giro θ. El modelo del
sistema y la medida se pueden describir como [Balakrishnan, 1987].
θ̇ = ξ
y =θ+w
[ ] [ ][ ]
θ̇ 0 1 θ
= (7.53)
ξ˙ 0 0 ξ
[ ]
θ
y = [1 0] +w
ξ
w ∼ (0, R)
Solución:
El uso directo de la ecuación diferencial de Riccati a partir de la Ecuación (7.34)

da
Ṗ = AP + PA⊤ − PC⊤ R−1 CP + Q
[ ] [ ]
Ṗ11 Ṗ12 2P12 − P11
2 /R P22 P11 /R
=
Ṗ12 Ṗ22 P22 − P11 P12 /R −P12 2 /R
Se puede resolver para P mediante la realización de tres integraciones numé-

ricas (recordando que P es simétrica). Sin embargo, podrá ser difı́cil encontrar
una solución de forma cerrada para P(t) a partir de estas ecuaciones diferenciales
acopladas. Un enfoque de la matriz de transición para este problema podrı́a pro-
cesarse como sigue, asumiendo que P(0) es diagonal. Se supone que P se factoriza
como P = ΛY−1 , donde Λ y Y son matrices 2 × 2. Las condiciones iniciales de
Λ y Y se pueden escoger como
[ ]
P11 (0) 0
Λ(0) = P(0) =
0 P22 (0)
Y(0) = I
La ecuación diferencial para Λ(t) y Y(t) está dada por
[ ] [ ]
Λ̇ Λ
=J
Ẏ Y
donde la matriz J se calcula como

[ ]
A Q
J=
C⊤ R−1 C −A⊤
 
0 1 0 0
 0 0 0 0
=
1/R 0 0 0
0 0 −1 0
La matriz de transición para la ecuación diferencial de Λ y Y se calcula como
 
1 t 0 0
 0 1 0 0
e(Jt) = 
t/R t2 /2R 1 0
−t2 /2R −t3 /6R −t 1
[ ]
ϕ11 (t) ϕ12 (t)
=
ϕ21 (t) ϕ22 (t)
donde los términos ϕij (t) son particiones 2 × 2 de la matriz. La solución de la

ecuación de Riccati se obtiene a partir de la Ecuación (7.52) como
P(t) = [ϕ11 (t)P(0) + ϕ12 (t)] [ϕ21 (t)P(0) + ϕ22 (t)]−1

[ ] [ ]
P11 (0) tP22 (0) 1 12R2 − 2t3 P22 (0) −6Rt2 P22 (0)
=
0 P22 (0) ∆ 12R2 t + 6t2 P11 (0) 12R2 + 12P11 (0)
donde ∆ está dado como

∆ = 12R2 + P11 (0)P22 (0)t4 + 12P11 (0)tR + 4P22 (0)t3 R
Llevando a cabo la multiplicación y algo de álgebra se obtiene la solución de la
ecuación de Riccati como
[ ]
P11 (t) P12 (t)
P(t) =
P12 (t) P22 (t)
1 [ ]
P11 (t) = 4R P11 (0)P22 (0)t3 + 3P11 (0)R + 3t2 P22 (0)R
∆
1
P12 (t) = 6RP22 (0)t [P11 (0)t + 2R]
∆
1
P22 (t) = 12RP22 (0) [P11 (0)t + R]
∆
Con el enfoque de la matriz de transición se ha obtenido una solución de forma
cerrada para P t), algo que no era posible con un enfoque directo para la ecuación
de Riccati. En el caso inicial que la incertidumbre inicial sea infinita, además se
puede simplificar P (t) como
lı́m ∆ = P11 (0)P22 (0)t4

P (0)→∞
[ ]
4R/t 6R/t2
lı́m P (t) =
P (0)→∞ 6R/t2 12R/t3
[ ] [ ]
0 0
lı́m lı́m P (t) =
t→∞ P (0)→∞ 0 0
Esto es, la incertidumbre tiende a cero cuando el tiempo tiende a infinito. Es-
to ocurre por que el ruido del proceso es cero (es decir, se está estimando una
constante). Puesto que K = PC⊤ R−1 , se ve que la ganancia de Kalman también
tiende a cero cuando el tiempo tiende a infinito. Esto simplemente significa que
eventualmente se han tomado tantas medidas que el conocimiento es completo.
Medidas adicionales no pueden dar ninguna información nueva, por lo tanto se
ignoran las nuevas medidas.
7.2.2. El filtro de raı́z cuadrada

Los primeros dı́as del filtro de Kalman en la década de 1960 vieron una gran
cantidad de aplicaciones exitosas. Pero también hubo algunos problemas en
la implementación, muchos debido a dificultades numéricas. En teorı́a la so-
lución de la ecuación diferencial de Riccati P(t) siempre debe ser una matriz
semidefinida positiva simétrica (ya que es una matriz de covarianza). Pero los
problemas numéricos en implementaciones computacionales a veces conduje-
ron P(t) a matrices indefinidas o no simétricas. Esto fue a menudo debido a
las cortas longitudes de palabra en los computadores de la década de 1960
[Schmidt, 1981]. Esto llevó a una gran cantidad de investigación en esa década
relacionada con implementaciones numéricas. Ahora que las computadoras se
han convertido en mucho más capaces, no hay problemas numéricos con tanta
frecuencia. Sin embargo, los problemas numéricos todavı́a surgen en implemen-
taciones de algoritmos de longitud de palabra finita, especialmente en sistemas
embebidos. El filtro de raı́z cuadrada se desarrolló con el fin de aumentar efec-
tivamente la precisión numérica del filtro Kalman y ası́ mitigar las dificultades
numéricas en las implementaciones.
El filtro de raı́z cuadrada se basa en la idea de encontrar una matriz Γ de
tal manera que P = ΓΓ⊤ . La matriz Γ se llama entonces la raı́z cuadrada de
P. Obsérvese que la raı́z cuadrada de una matriz puede no ser única; es decir,
puede haber más de una solución de Γ en la ecuación P = ΓΓ⊤ . Las secciones

6.3 y 6.4 contienen una discusión de filtrado de raı́z cuadrada para el filtro de
Kalman en tiempo discreto. Después de definir Γ como la raı́z cuadrada de P,
se integra Γ en lugar de P en la solución del filtro de Kalman. Esto requiere
más esfuerzo computacional pero se duplica la precisión del filtro y ayuda a
evitar problemas numéricos. A partir de la ecuación diferencial de Riccati de
la Ecuación (8.37), y la definición de Γ, se obtiene
Ṗ = AP + PA⊤ − PC⊤ R−1 CP + Q

Γ̇Γ⊤ + ΓΓ̇⊤ = AΓΓ⊤ + ΓΓ⊤ A⊤ − ΓΓ⊤ C⊤ R−1 CΓΓ⊤ + Q (7.54)
Ahora, premultiplicando ambos lados por Γ−1 y postmultiplicando por Γ−⊤ se

obtiene
Γ−1 ṖΓ−⊤ = Γ−1 Γ̇ + Γ̇⊤ Γ−⊤

= Γ−1 AΓ + Γ⊤ A⊤ Γ−⊤ − Γ⊤ C⊤ R−1 CΓ + Γ−1 QΓ−⊤ (7.55)
Algoritmo 7.2 El filtro de Kalman de raı́z cuadrada en tiempo continuo.
1. El paso de inicialización consiste en calcular la parte triangular superior

Γ(0) tal que Γ(0)Γ⊤ (0) = P(0) .
2. En cada paso de tiempo calcular Ṗ desde la ecuación diferencial de Ric-

cati, y entonces calcular MS como la porción superior de Γ−1 ṖΓ−⊤ .
3. Usar Γ̇ = ΓMS para integrar Γ para el próximo paso de tiempo.
4. Se utiliza la ecuación K = PC⊤ R−1 = ΓΓ⊤ C⊤ R−1 para calcular la

ganancia de Kalman.
Puesto que P es definida positiva simétrica, siempre se puede encontrar una

matriz triangular superior Γ tal que P = ΓΓ⊤ [Golub and Van Loan, 1996],
[Moon and Stirling, 2000]. Se puede demostrar que si Γ es triangular superior,
entonces Γ̇ y Γ−1 también son triangulares superiores. También, el producto
de matrices triangulares superiores es otra matriz triangular superior. Por lo
tanto, el producto Γ−1 Γ̇ es triangular superior. Similarmente, puesto que Γ̇⊤
y Γ−⊤ son triangulares inferiores, el producto Γ̇⊤ Γ−⊤ es triangular inferior
7.3. Filtro de Kalman en tiempo continuo de estado estacionario 241
[Strang, 2006], [Faddeev and Faddeeva, 1963]. Esto es,
Γ−1 Γ̇ = MS
(7.56)
Γ̇⊤ Γ−⊤ = MI
donde MS y MI significan matrices triangular superior y triangular inferior,

respectivamente. De esto se puede obtener
Γ̇ = ΓMS (7.57)
Ahora se pueden usar las ecuaciones (7.55) y (7.56) para encontrar
Γ−1 ṖΓ−⊤ = Γ−1 Γ̇ + Γ̇⊤ Γ−1

= MS + MI (7.58)
Por lo tanto se ve que MS es la porción triangular superior de Γ−1 ṖΓ−⊤ . Esto

da el algoritmo de raı́z cuadrada como se muestra en el Algoritmo 7.2.
Este es computacionalmente más costoso que una integración directa de la
ecuación diferencial de Riccati, pero también es más estable numéricamente.
7.3. Filtro de Kalman en tiempo continuo de

estado estacionario
En algunas situaciones, el filtro de Kalman converge a un filtro LTI. Si este es

el caso, entonces a menudo se puede conseguir un buen desempeño de filtrado
usando una ganancia constante de Kalman K en el filtro. Entonces no hay que
preocuparse acerca de la integración de la ecuación diferencial de Riccati para
resolver P y tampoco preocuparse por la actualización de K en tiempo real.
Esto puede proporcionar un gran ahorro en la complejidad del filtro y en el
costo de esfuerzo computacional sólo con un sacrificio insignificante (bajo) de
rendimiento. En esta subsección, se discuten las condiciones bajo las cuales el
filtro de tiempo continuo converge a un filtro LTI, y la relación del filtro de
estado estacionario en relación con el filtrado Wiener y el control óptimo.
7.3.1. La ecuación algebraica de Riccati

Recordando de la ecuación (7.34) que la ecuación diferencial de Riccati está
dada como
Ṗ = −PC⊤ R−1 CP + AP + PA⊤ + Q (7.59)
Si A, C, Q y R son constantes (es decir, las ecuaciones del sistema y de la

medida forman un sistema LTI con covarianza de ruido constante) entonces P
puede alcanzar un valor de estado estacionario y eventualmente Ṗ puede llegar
a cero. Esto implica que
−PC⊤ R−1 CP + AP + PA⊤ + Q = 0 (7.60)
Esta es llamada una ecuación algebraica de Riccati (ARE). Para ser más es-
pecı́fico, esta se denomina ARE continua (CARE).
La solución de la ARE puede no siempre existir, e incluso si existe puede no
resultar en un filtro de Kalman estable. Se resumirá el resultado más impor-
tante de convergencia de la ecuación de Riccati a continuación, pero primero
se necesita definir qué significa para un sistema ser controlable sobre el eje
imaginario.
Definición 7.1
El par de matrices (A, B) es controlable sobre el eje imaginario si existe alguna
matriz K tal que (A − BK) no tiene autovalores sobre el eje imaginario.
Esto es similar al concepto de controlabilidad sobre el cı́rculo unitario para

sistemas de tiempo discreto. Ahora se resume el resultado más importante de
convergencia de la ecuación de Riccati a partir de [Kailath et al., 2000], donde
se da la demostración. Recordando que la ARE está dada como
−PC⊤ R−1 CP + AP + PA⊤ + Q = 0 (7.61)
Se supone que Q ≥ 0 y R > 0. Se define G como una matriz cualquiera tal que
GG⊤ = Q. La ganancia de Kalman de estado estacionario correspondiente K
se da como
K = PC⊤ R−1 (7.62)

El filtro de Kalman de estado estacionario se da como
x̂˙ = (A − KC)x̂ + Ky (7.63)
Se dice que la solución P de la CARE es estabilizable si resulta en un filtro

de estado estacionario estable. Esto es, P se define como una solución CARE
estabilizable si todos los autovalores de (A − KC) tienen parte real negativa.
Teorema 7.1
La CARE tiene una solución P semidefinida positiva única si y solo si las siguien-
tes dos condiciones se cumplen.
1. (A, C) es detectable
2. (A, G) es estabilizable.
Más aún, el filtro de Kalman de estado estacionario correspondiente es estable.

Esto es, los autovalores de (A − KC) tienen partes reales negativas.
Este teorema es análogo al Teorema 6.1 para filtros de Kalman de tiempo dis-
creto. El teorema anterior no excluye la existencia de soluciones CARE que son
definidas negativas o indefinida. Si existen tales soluciones, entonces resultarı́a
en un filtro de Kalman inestable. Si se debilita la condición de estabilizabilidad
en el teorema anterior, se obtiene el siguiente
Teorema 7.2
La CARE tiene al menos una solución P semidefinida positiva si y solo si las
siguientes dos condiciones se cumplen.
2. (A, G) es controlable sobre el eje imaginario.
Más aún, exactamente una de las soluciones ARE semidefinida positiva resulta en
un filtro de Kalman de estado estacionario estable.
Este teorema es análogo al Teorema 6.2 para filtros de Kalman de tiempo

discreto. Este teorema establece las condiciones para la existencia de exacta-
mente una solución CARE estabilizable definida positiva. Sin embargo, puede
haber soluciones adicionales CARE (definidas positiva o de otra manera) que
resultan e un filtro de Kalman inestable. Si un filtro de Kalman variable en el
tiempo es ejecutado en esta situación, entonces las ecuaciones del filtro de Kal-
man pueden convergir ya sea a un filtro estable o uno inestable, dependiendo
de la condición inicial P(0). Si se refuerza la condición de controlabilidad del

Teorema 7.2, se obtiene el siguiente
Teorema 7.3
La CARE tiene al menos una solución P definida positiva si y solo si las siguientes
dos condiciones se cumplen.
2. (A, G) es controlable en el semiplano cerrado izquierdo.
Además, exactamente una de las soluciones CARE definida positiva resulta en un

filtro de Kalman de estado estacionario estable.
Este teorema es análogo al Teorema 6.3 para el filtro de Kalman de tiempo dis-
creto. Si se deja la condición de controlabilidad en los dos teoremas anteriores,
se obtiene el siguiente.
Teorema 7.4
La CARE tiene al menos una solución semidefinida positiva P si (A, C) es de-
tectable. Además, al menos una de tales soluciones resulta en un filtro de Kalman
de estado estacionario marginalmente estable.
Este teorema es análogo al Teorema 6.4 para filtros de Kalman de tiempo dis-
creto. Nótese que el filtro resultante es solamente estable marginalmente, por lo
tanto, puede tener autovalores sobre el eje imaginario. También nótese que este
teorema posee una condición suficiente (pero no necesaria). Esto es, puede ha-
ber un filtro de Kalman de estado estacionario estable aún sı́ las condiciones del
teorema anterior no se mantienen. Además, aún sı́ las condiciones del teorema
se mantienen, puede haber soluciones CARE que resultan en filtros de Kalman
inestables. Resultados adicionales relacionados al filtro de tiempo continuo de
estado estacionario se pueden encontrar en muchos lugares, incluyendo [Aoki,
1967], [Bucy and Joseph, 1968], [Kwakernaak and Sivan, 1972]. Muchos de los
filtros de Kalman prácticos se aplican a sistemas que no reúnen las condiciones
de los teoremas anteriores, pero los filtros aún en esa condiciones funcionan
bien en la práctica.
Ejemplo 7.4
Se considera el siguiente sistema de dos estados ([Bucy and Joseph, 1968]):
[ ]
a1 0
ẋ = x+v (7.64)
0 a2
[ ]
1 0
y= x+w
0 1
[ ]
q11 q12
Q= (7.65)
q12 q22
[ ]
r1 0
R=
0 r2
En el resto de este ejemplo, se usa el sı́mbolo G para nombrar cualquier matriz
tal que GG⊤ = Q.
La ecuación diferencial de Riccati para el filtro de Kalman está dada como
Ṗ = −PC⊤ R−1 CP + AP + PA⊤ + Q (7.66)
Ésta puede ser escrita como las siguientes tres ecuaciones diferenciales acopladas.
ṗ11 = 2a1 p11 − p211 /r1 − p212 + q11

ṗ12 = (a1 + a2 )p12 − p11 p12 /r1 − p12 p22 /r2 + q12 (7.67)
ṗ22 = 2a2 p22 − p212 /r1 − p222 /r2 + q22
Estas derivadas se hacen iguales a cero para obtener la solución de la ecuación de
Riccati de estado estacionario. Si a1 ̸= a2 y q12 ̸= 0, entonces (A, C) es detectable
y (A, G) es estabilizable. Los resultados del Teorema 7.1, por lo tanto, se aplican a
esta situación. Se puede demostrar [Bucy and Joseph, 1968], que la única solución
ARE semidefinida positiva en este caso es
[ ( )1/2 ]
p212
p11 = r1 a1 + γ1 −
r1 r2
[ ( )1/2 ]
p212
p22 = r2 a2 + γ2 −
r1 r2
[ ]−1/2 (7.68)
p12 = q12 γ1 + γ2 + 2(γ1 γ2 − q12 /r1 r2 )
2 1/2
q11
γ1 = + a21
r1
q22
γ2 = + a22
r2
esto resulta en un filtro de Kalman de estado estacionario estable.
Si a1 = a2 < 0 y q12 ̸= 0, entonces (A, C) es detectable y (A, G) es estabilizable.
Los resultados del Teorema 7.1, por lo tanto, también se aplican a esta situación. Se
puede demostrar [Bucy and Joseph, 1968], que la única solución ARE semidefinida
positiva en este caso es

p11 = q11 /γ3
p22 = q22 /γ3
p12 = q12 /γ3 (7.69)
γ3 = −a1 + (a21 + q11 /r1 + q22 /r2 )1/2

Esto resulta en un filtro de Kalman de estado estacionario estable.
Si a1 = a2 > 0 y q12 ̸= 0, entonces (A, C) es detectable y (A, G) es con-
trolable sobre el eje imaginario, pero (A, G) es no estabilizable. Los resultados
del Teorema 7.1 no se aplican a esta situación, pero sı́ los del Teorema 7.2. Se
puede demostrar que las ecuaciones (7.68) y (7.69) son soluciones ARE semidefi-
nidas positivas en este caso. Si se integra la Ecuación (7.67) se puede llegar a la
Ecuación (7.68) o a la Ecuación (7.68) como la solución de estado estacionario,
dependiendo de la condición inicial P(0). Sin embargo, solamente una de las solu-
ciones resultará en un filtro de Kalman estable. Más especı́ficamente, considérese
el caso a1 = a2 = 1, q11 = q12 = q22 = 0 y r1 = r2 = 1. Para estos valores, se
puede simular las ecuaciones diferenciales de Riccati de la Ecuación (7.67) para
encontrar la solución de Riccati en estado estacionario, la ganancia de Kalman de
estado estacionario y el estimador de estado estacionario, como sigue
[ ] [ ]
2 0 0 0
P= o
0 2 0 0
K = PC⊤ R−1
[ ] [ ]
2 0 0 0 (7.70)
= o
0 2 0 0
x̂˙ = (A − KC)x̂ + Ky
= (−x̂ + Ky) o (x̂ + Ky)
La solución ARE depende de la condición inicial P(0). La primera solución ARE

resulta en una solución ARE semidefinida positiva que da un filtro de Kalman
estable. La segunda solución ARE resulta en una solución ARE semidefinida po-
sitiva que da un filtro de Kalman inestable. Esto concuerda con el Teorema 7.2.
7.3.2. El filtro de Wiener es un filtro de Kalman

Considérese el filtro de Kalman en tiempo continuo de estado estacionario
x̂˙ = Ax + K(y − Cx̂) (7.71)

Tomando la transformada de Laplace a ambos lados de esta ecuación y reor-

denando, se obtiene
(sI − A + KC)x̂(s) = Ky(s)

x̂(s) = (sI − A + KC)−1 Ky(s) (7.72)
La función de transferencia de y(t) a x̂(t) es idéntica a la función de trans-

ferencia del filtro de Wiener [Bucy and Joseph, 1968], [Shanahan, 1982]. En
otras palabras, el filtro de Wiener es un caso especial del filtro de Kalman. La
equivalencia entre el filtrado de Kalman y el de Wiener en tiempo discreto se
discute en [Mendel, 1995].
Ejemplo 7.5
Considérese el sistema escalar dado por
ẋ = −x + v
(7.73)
y = x+w
donde v y w son ruidos blancos del proceso y de la medida de media cero y no
correlacionados, con varianzas respectivas de Q = 2 y R = 1. El filtro de Kalman
de estado estacionario para este sistema se puede obtener resolviendo la Ecuación
(7.34) con Ṗ = 0, de la cual se obtiene
√ √
x̂˙ = − 3x̂ + ( 3 − 1)y (7.74)
Tomando la transformada de Laplace de este estimador da
√ √
(s + 3)X̂(s) = ( 3 − 1)Y (s) (7.75)
En otras palabras, el filtro de Kalman es equivalente a pasar la medición y(t) a
través de la función de transferencia G(s), lo cual está dado como
√
3−1
G(s) = √ (7.76)
s+ 3
La respuesta al impulso del filtro de Kalman es obtenida tomando la inversa de
la transformada de la Laplace, lo cual da
√ √
g(t) = ( 3 − 1)e− 3t , t≥0 (7.77)
Ahora se va a obtener el espectro de potencia del estado tomando la trasformada
de Laplace de la Ecuación (7.73). Esto da

sX(s) = −X(S) + W (s)
1 (7.78)
X(s) = W (s)
s+1
Se ve que el estado x(t) se puede obtener pasando el ruido blanco w(t) (el cual tiene
un espectro de potencia Sv (ω) = Q = 2) a través de la función de transferencia
L(s) = 1/(s + 1). A partir de la Ecuación (3.62) se ve como calcular el espectro
de potencia de la salida de un sistema lineal. Esto da el espectro de potencia de
x(t) como
Sx (ω) = L(−ω) · L(ω) · Sv (ω)
( ) ( )
1 1
= · ·2
−jω + 1 jω + 1
2
= 2 (7.79)
ω +1
El filtro de Wiener causal para una señal con este espectro de potencia, conta-
minado por ruido de medición blanco con un espectro de potencia unitario, se
obtuvo en el Ejemplo 3.9. Se encontró que el filtro de Wiener era idéntico al filtro
de Kalman de estado estacionario de la Ecuación (7.77). Este ejemplo sirve pa-
ra ilustrar la equivalencia del filtrado Wiener y el filtrado de Kalman de estado
estacionario.
7.4. Dualidad
Es interesante observar la dualidad entre la estimación óptima y un control
óptimo. El problema de estimación óptima comienza con las ecuaciones del
sistema y la medición
ẋ = Ax + v
v ∼ N(0, Q)
(7.80)
y = Cx + w
w ∼ N(0, R)
recordando que Q y R son matrices simétricas. El problema de estimación

óptima trata de encontrar el estimado del estado x̂ que minimice la función de
7.4. Dualidad 249
costo
∫ tf { }
Je = E (x − x̂)⊤ (x − x̂) dt (7.81)
0
El estimador óptimo (el filtro de Kalman) está dado como

{ }
Pe = E (x(0) − x̂(0))(x(0) − x̂(0))⊤
Ṗe = APe + Pe A⊤ − Pe C⊤ R−1 CPe + Q
(7.82)
Ke = Pe C⊤ R−1
x̂˙ = Ax̂ + Ke (y − Cx̂)
La ecuación diferencial de Riccati para el estimador óptimo se integra hacia

adelante en el tiempo desde su condición inicial Pe (0). El problema de control
óptimo comienza con el sistema
ẋ = Ax + Cu (7.83)
donde u es la variable de control. El problema de control óptimo en tiempo

finito intenta encontrar la ley de control u que minimice la función de costo
∫ tf
⊤
( ⊤ )
Jc = x ϕx|tf + x Qx + u⊤ Ru dt (7.84)
0
ϕ, Q y R (que se supone son matrices definidas positivas simétricas) propor-

cionan la ponderación especificada por el usuario para el ı́ndice de desempeño.
El controlador óptimo se da como
Pc (tf ) = ϕ(tf )
Ṗc = −A⊤ Pc − Pc A + Pc CR−1 C⊤ Pc − Q
(7.85)
Kc = R−1 C⊤ Pc
u = Kc x
La ecuación diferencial de Riccati para el problema de control óptimo se integra

hacia atrás en el tiempo a partir de la condición final P(tf ). Téngase en cuenta
las relaciones entre la solución de estimación óptima de la Ecuación (7.82) y la
solución de control óptimo de la Ecuación (7.85). Las ecuaciones diferenciales
de Riccati tienen la misma forma, excepto que son negativos entre sı́ y A y C
se sustituyen por sus transpuestas. La ganancia estimador Ke , y la ganancia
del controlador Kc tienen formas muy similares. Las matrices de covarianza Q
y R en el problema de estimación tienen duales en las matrices de ponderación
de la función de costo del problema de control óptimo.
La relación dual entre los problemas de estimación y de control se observó en
los primeros trabajos sobre el filtro de Kalman [Kalman, 1960], [Kalman and
Bucy, 1961]. Desde entonces, se ha utilizado muchas veces para extrapolar los
resultados conocidos de un problema con el fin de obtener nuevos resultados
para el problema dual.
7.5. Resumen
En este capı́tulo, se ha deducido el filtro de Kalman de tiempo continuo me-
diante la aplicación de un argumento limitador del filtro de Kalman de tiempo
discreto. Sin embargo, ası́ como hay varias maneras para obtener el filtro de
Kalman tiempo discreto, también hay varias maneras para obtener el filtro de
Kalman de tiempo continuo. La derivación original realizada por Kalman y
Bucy [Kalman and Bucy, 1961] implicaba la solución de la ecuación integral
de Wiener-Hopf.
Se ha visto que tanto la ecuación diferencial como la ecuación algebraica de
Riccati son la clave para la solución del filtro de Kalman de tiempo continuo.
La versión escalar de lo que hoy se conoce como la ecuación de Riccati se
estudió inicialmente por matemáticos como James Bernoulli y John Bernoulli
en los años 1600 y Jacopo Riccati, Daniel Bernoulli, Leonard Euler, Jean-
Lerond d’Alembert y Adrien Legendre en el siglo XVIII. La ecuación fue por
primera vez llamada “la ecuación de Riccati” por d’Alembert en 1763 [Watson,
1944].
El filtro de Kalman en tiempo continuo se aplica a los sistemas con ruido
blanco de tiempo continuo tanto en la ecuación del proceso como en la de
medición. El ruido blanco de tiempo continuo es no intuitivo ya que tiene una
correlación infinita consigo mismo en el instante actual, pero una correlación
cero consigo mismo cuando se separan por tiempos arbitrariamente pequeños
pero distintos de cero. Sin embargo, el ruido blanco de tiempo continuo es un
caso lı́mite de ruido blanco de tiempo discreto, que es intuitivamente acepta-
ble. Por lo tanto, el ruido blanco de tiempo continuo puede ser aceptado como
una aproximación a la realidad. Esto corresponde a muchas otras aproxima-
7.5. Resumen 251
ciones a la realidad que se aceptan a su valor nominal (por ejemplo, el modelo

matemático de un sistema es una aproximación a la realidad).
El filtro de Kalman de tiempo continuo se aplica independientemente de la
naturaleza estadı́stica del ruido, siempre es de media cero. Es decir, el filtro de
Kalman es óptimo incluso cuando el ruido no sea gaussiano. El filtro de Kalman
de estado estacionario proporciona un desempeño de estimación casi óptimo en
una pequeña fracción del esfuerzo computacional del filtro de Kalman variable
en el tiempo. El filtro de Kalman en estado estacionario es idéntico al filtro de
Wiener de la Sección , y tiene una relación dual interesante para un control
óptimo lineal cuadrático.
Bibliografı́a
Aoki, M. (1967). Optimization of Stochastic Systems. Topics in Discrete-Time Systems.

Number 32 in Mathematics in Science and Engineering. Academic Press, 111 Fifth
Avenue, New York, NY, 10003.
Balakrishnan, A. (1987). Kalman Filtering Theory. New York, USA.
Bucy, R. and Joseph, P. (1968). Filtering for Stochastic Processes with Applications to
Guidance. Number 23 in Interscience tracts in pure and applied mathematics. John
Wiley & Sons, New York, NY, USA.
Faddeev, D. and Faddeeva, V. (1963). Computational Methods of Linear Algebra. W. H.
Freeman and Company, San Francisco, USA.
Golub, G. and Van Loan, C. (1996). Matrix Computations. The Johns Hopkins University
Press, 2715 North Charles Street, Baltimore, Maryland 21218-4319, USA, 3a edition.
Hughes, R. (1988). Analog Automatic Control Loops in Radar and EW. Dedham, Massa-
chusetts, USA.
USA.
Kalman, R. and Bucy, R. (1961). New results in linear filtering and prediction theory. ASME
Journal of Basic Engineering, 83: 95–108.
Kwakernaak, H. and Sivan, R. (1972). Linear Optimal Control Systems. John Wiley & Sons,
Inc., New York, USA.
Mendel, J. (1995). Lessons in Estimation Theory for Signal Processing, Communications,
and Control. Prentice Hall P T R Prentice-Hall, Inc., A Pearson Education Company
Upper Saddle River, NJ 07458, USA., 2a edition.
Moon, T. and Stirling, W. (2000). Mathematical Methods and Algorithms for Signal Proces-
sing. Prentice-Hall, Upper Saddle River, New Jersey, USA.
253
254 BIBLIOGRAFı́A
Schmidt, S. (1981). The Kalman filter: Its recognition and development for aerospace appli-
cations. Journal of Guidance and Control, 4(1): 4–7.
Shanahan, W. (1982). Circuit models for prediction, Wiener filtering, Levinson and Kalman
filters for ARMA time series. In IEEE International Conference on Acoustics, Speech,
and Signal Processing ICASSP’82, volume 7, pages 266 – 269.
Stengel, R. (1994). Optimal Control and Estimation. New York, USA.
Watson, G. (1944). A Treatise on the Theory of Bessel functions. Cambridge University
Press, Cambridge, United Kingdom, 2a edition.
Capı́tulo 8
El filtro de Kalman no lineal
E n la discusión realizada hasta el momento se han considerado filtros lineales

para sistemas lineales. Desafortunadamente, no existen sistemas lineales.
Todos los sistemas son no lineales en última instancia. Incluso la simple re-
lación I = V /R de la Ley de Ohm, es sólo una aproximación en un rango
limitado. Si la tensión a través de un resistor supera un cierto umbral, enton-
ces la aproximación lineal se rompe. Realmente no existen sistemas lineales.
Sin embargo, muchos sistemas tienen una respuesta lo suficientemente cerca-
na a la lineal de modo que los enfoques de estimación lineal dan resultados
satisfactorios. Pero “lo suficientemente cercana” sólo puede ser realizada hasta
ahora. Eventualmente, se opera a través de un sistema que no se comporta
de forma lineal, incluso en un pequeño intervalo de operación, y los enfoques
lineales para la estimación ya no dan buenos resultados. En este caso, se deben
explorar los estimadores no lineales.
El filtrado no lineal puede ser un tema difı́cil y complejo. Ciertamente, no
es tan maduro, coherente, o bien entendido como el filtrado lineal. Todavı́a
hay una gran cantidad de espacio para avances y mejoras en las técnicas de
estimación no lineal. Sin embargo, algunos métodos de estimación no lineal se
han convertido (o se están convirtiendo) en comunes. Estas técnicas no lineales
incluyen el filtro de Kalman extendido (EKF), el filtro unscented y el filtro de
partı́culas. En este capı́tulo se discutirán algunas extensiones no lineales del
filtro de Kalman.
El filtro de Kalman que se ha estudiado en los capı́tulos anteriores se aplica
directamente a sistemas lineales. Sin embargo, un sistema no lineal puede ser
255
256 Capı́tulo 8. El filtro de Kalman no lineal
linealizado y entonces se pueden aplicar técnicas de estimación lineales. Este

capı́tulo trata de los tipos de enfoques no lineales para el filtrado de Kalman.
8.1. El filtro de Kalman linealizado

En esta sección, se mostrará como linealizar un sistema no lineal y luego se
usará la teorı́a de filtrado de Kalman para estimar las desviaciones del estado
a partir de un valor de estado nominal. Esto dará entonces un estimado del
estado del sistema no lineal. Se deducirá el filtro de Kalman linealizado desde el
punto de vista de tiempo continuo, aunque la deducción análoga para sistemas
de tiempo discreto o sistemas hı́bridos es sencilla.
Considérese el siguiente modelo general de un sistema no lineal:
ẋ = f (x, u, v, t)
y = h(x, w, t)
(8.1)
v ∼ (0, Q)
w ∼ (0, R)
La ecuación del sistema f (·) y la ecuación de medida h(·) son funciones no

lineales. Se usará la serie de Taylor para expandir esas ecuaciones alrededor
de un control nominal u0 , un estado nominal x0 , una salida nominal y0 y de
valores de ruido nominal v0 y w0 . Estos valores nominales (los cuales son fun-
ciones de tiempo) se basan en suposiciones a priori de lo que la trayectoria
del sistema podrı́a parecer. Por ejemplo, si las ecuaciones del sistema repre-
sentan la dinámica de un avión, entonces el control nominal, el estado y la
salida podrán ser la trayectoria de vuelo planeada. La trayectoria de vuelo real
diferirá de esta trayectoria nominal debido al mal modelado, perturbaciones
y otros efectos imprevistos. Pero la trayectoria real debe estar cerca a la tra-
yectoria nominal, en cuyo caso la linealización de la serie de Taylor debe estar
cerca de la trayectoria nominal. La linealización de la serie de Taylor de la
Ecuación (8.1) da

∂f ∂f ∂f
ẋ ≈ f (x0 , u0 , v0 , t) + (x − x0 ) + (u − u0 ) + (v − v0 )
∂x 0 ∂u 0 ∂v 0
= f (x0 , u0 , v0 , t) + A∆x + B∆u + L∆v (8.2)
8.1. El filtro de Kalman linealizado 257

∂h ∂h
y ≈ h(x0 , w0 , t) + (x − x0 ) + (w − w0 )
∂x 0 ∂w 0
= h(x0 , w0 , t) + C∆x + M∆w (8.3)
Las definiciones de las matrices en derivadas parciales A, B, C, L y M son

evidentes a partir de las ecuaciones anteriores. El subı́ndice 0 en las derivadas
parciales significa que están evaluadas en los valores nominales de control,
estado, salida y ruido. Las definiciones de las desviaciones ∆x, ∆u, ∆v y ∆w
también se explican de las ecuaciones anteriores. Supóngase que los valores de
ruido nominal vo (t) y wo (t) son iguales a 0 para todo tiempo. (Si no son iguales
a 0 entonces se deben escribir como la suma de una parte determinista conocida
y otra parte con media cero, redefinir las cantidades de ruido y reescribir la
Ecuación (8.1) tal que los valores de ruido nominal sean iguales a 0). Ya que
vo (t) y wo (t) son ambos iguales a 0, se ve que ∆v(t) = v(t) y ∆w(t) = w(t).
Más aún, se supone que el control u(t) es perfectamente conocido. En general,
esta es una suposición razonable. Después de todo, la entrada de control u(t)
está determinada por el sistema de control, por lo que no deberı́a haber ninguna
incertidumbre en su valor. Esto significa que uo (t) = u(t) y ∆u(t) = 0. Sin
embargo, en realidad, puede haber incertidumbres en las salidas del sistema de
control porque ellas están conectadas a los actuadores que tienen sesgos y ruido.
Si este es el caso, entonces se puede expresar el control como uo (t) + ∆u(t),
donde uo (t) es conocido y ∆u(t) es una variable aleatoria con media cero, se
reescriben las ecuaciones del sistema con una señal de control perfectamente
conocida y se incluye ∆u(t) como parte del del ruido del proceso. Ahora se
define la trayectoria del sistema nominal como
ẋ0 = f (x0 , u0 , v0 , t)
(8.4)
y0 = h(x0 , w0 , t)
Se define la desviación de la derivada exacta del estado de la derivada del estado

nominal y la desviación de la medida exacta de la medida nominal como
∆ẋ = ẋ − ẋ0
(8.5)
∆y = y − y0
Algoritmo 8.1 El filtro de Kalman linealizado de tiempo continuo.
1. Las ecuaciones del sistema están dadas como

ẋ = f (x, u, v, t) v ∼ (0, Q)
(8.6)
y = h(x, w, t) w ∼ (0, R)
La trayectoria nominal se conoce de antemano:
ẋ0 = f (x0 , u0 , 0, t)
(8.7)
y0 = h(x0 , 0, t)
2. El filtro de Kalman se inicializa como
0 = E {x0 }
x̂+
{ } (8.8)
+ ⊤
P+0 = E (x 0 − x̂+
0 )(x0 − x̂ 0 )
3. Calcular las siguientes matrices de derivadas parciales evaluadas en los valores

de la trayectoria nominal:

∂f ∂f
A= L=
∂x 0 ∂v 0
(8.9)
∂h ∂h
C= M=
∂x 0 ∂w 0
4. Calcular las siguientes matrices:
Q̃ = LQL⊤ R̃ = MRM⊤ (8.10)
5. Definir ∆y como la diferencia entre la medida real y la medida nominal y0 :
∆y = y − y0 (8.11)
6. Ejecutar las siguientes ecuaciones del filtro de Kalman:
∆x̂(0) = 0
{ }
P(0) = E [∆x(0) − ∆x̂(0)] [∆x(0) − ∆x̂(0)]⊤
∆x̂˙ = A∆x̂ + K(∆y − C∆x̂) (8.12)
K = PC⊤ R̃−1
Ṗ = AP + PA⊤ + Q̃ − PC⊤ R̃−1 CP
7. Estimar el estado como sigue
x̂ = x0 + ∆x̂ (8.13)
8.2. Filtro de Kalman extendido 259
Con estas definiciones las ecuaciones (8.2) y (8.3) se convierten en
∆ẋ = A∆x + Lv
= A∆x + ṽ (8.14)
ṽ ∼ (0, Q̃), Q̃ = LQL⊤
∆y = C∆x + Mw
= C∆x + w̃ (8.15)
⊤
w̃ ∼ (0, R̃), R̃ = MRM
Las ecuaciones anteriores corresponden a un sistema lineal con estados ∆x y
medidas ∆y, de manera que se puede utilizar el filtro de Kalman para estimar
∆x. La entrada al filtro consiste en ∆y, la cual es la diferencia entre el estado
real y y el estado nominal y0 . La salida del filtro de Kalman es ∆x, la cual es
un estimado de la diferencia entre el estado real x y el estado nominal x0 . Las
ecuaciones modificadas para el filtro de Kalman linealizado son
∆x̂(0) = 0
{ }
P(0) = E [∆x(0) − ∆x̂(0)] [∆x(0) − ∆x̂(0)]⊤
∆x̂˙ = A∆x̂ + K(∆y − C∆x̂) (8.16)
⊤ −1
K = PC R̃
Ṗ = AP + PA⊤ + Q̃ − PC⊤ R̃−1 CP
x̂ = x0 + ∆x̂
Para el filtro de Kalman, P es igual a la covarianza del error de estimación.

En el filtro de Kalman linealizado esto ya no es ası́ debido a los errores que
se arrastran en la ecuación de linealización (8.2). Sin embargo, si los errores
de linealización son pequeños entonces P será aproximadamente igual a la
covarianza del error de estimación. El filtro de Kalman linealizado se resume
en el Algoritmo 8.1.
8.2. Filtro de Kalman extendido

En la sección anterior se obtuvo un filtro de Kalman linealizado para estimar
los estados de un sistema no lineal. El desarrollo se basó en la linealización
del sistema no lineal alrededor de una trayectoria nominal. Surge entonces la

siguiente pregunta: ¿cómo se conoce la trayectoria de estado nominal? En al-
gunos casos puede no ser fácil encontrar la trayectoria nominal. Sin embargo,
puesto que el filtro de Kalman estima el estado del sistema, se puede usar el
estimado del filtro de Kalman como la trayectoria de estado nominal. Esta es
una especie de método de arranque. Se linealiza el sistema no lineal alrede-
dor del estimado del filtro de Kalman y el estimado del filtro de Kalman se
basa en el sistema linealizado. Esta es la idea del filtro de Kalman extendido
(EKF), fue originalmente propuesta por Stanley Schmidt para la aplicación del
filtro de Kalman a los problemas no lineales de navegación de naves espaciales
[Bellantoni and Dodge, 1967]. El procedimiento para el cálculo del filtro de
Kalman extendido se resume en el Algoritmo 8.2.
Ejemplo 8.1
En este ejemplo, se utiliza el EKF de tiempo continuo para estimar el estado de
un motor sı́ncrono bifásico de imanes permanentes. Las ecuaciones del sistema
están dadas como:
−R ωλ ua + q1
i̇a = ia + sen θ +
L L L
−R ωλ ub + q2
i̇b = ib − cos θ +
L L L (8.21)
−3λ 3λ fω
ω̇ = ia sen θ + ib cos θ − + q3
2J 2J J
θ̇ = ω
donde ia e ib son las corrientes en los dos devanados, θ y ω son la posición angular
y la velocidad del rotor, R y L son la resistencia y la inductancia del devanado,
λ es la constante de flujo y f es el coeficiente de fricción viscosa. Las entradas de
control ua y ub consisten de las tensiones aplicadas a través de los dos devanados
y J es el momento de inercia del eje del motor y la carga. El estado se define como
⊤ ⊤
x = [x1 x2 x3 x4 ] = [ia ib ω θ] (8.22)
Los términos qi son el ruido del proceso debido a incertidumbre en las entradas
de control (q1 y q2 ) y el torque de la carga (q3 ).
Los datos de placa del motor están dados por: resistencia del devanado, R =
1.9 Ω, inductancia del devanado L = 0.003 H, constante del motor, λ = 0.1,
momento de inercia, J = 0.00018 N·m, coeficiente de fricción, f = 0.001 N·s·m−2 ,
I0 = 0.3708 A. Se tomó un paso de integración de dt = 0.0005 s.
Algoritmo 8.2 El filtro de Kalman extendido en tiempo continuo.
1. Las ecuaciones del sistema están dadas como

ẋ = f (x, u, v, t) v ∼ (0, Q)
(8.17)
y = h(x, w, t) w ∼ (0, R)
2. Calcular las siguientes matrices de derivadas parciales evaluadas en los valores

de la trayectoria nominal:

∂f ∂f
A= L=
∂x x̂ ∂v x̂
(8.18)
∂h ∂h
C= M =
∂x x̂ ∂w x̂
3. Calcular las siguientes matrices:
Q̃ = LQL⊤
(8.19)
R̃ = MRM⊤
4. Ejecutar las siguientes ecuaciones del filtro de Kalman:
x̂(0) = E {x(0)}
{ }
P(0) = E [x(0) − x̂(0)] [x(0) − x̂(0)]⊤
x̂˙ = f (x̂, u, v0 , t) + K[y − h(x̂, w0 , t)] (8.20)
K = PC⊤ R̃−1
Ṗ = AP + PA⊤ + Q̃ − PC⊤ R̃−1 CP
donde los valores de ruido nominal están dados como v0 = 0 y w0 = 0
La matriz A de derivadas parciales se obtiene como

 
R λs4 x3 λc4
 −L 0
L L 
 
 
 R λc4 x3 λs4 
 0 − − 
∂f  
A= = L L L  (8.23)
∂x   3 λs

 4 3 λc4 f 3 λ(x1 c4 + x2 s4 ) 

− − − 
 2 J 2 J J 2 J 
 
0 0 1 0
donde se ha usado la notación s4 = sen x4 y c4 = cos x4 . Supóngase que se pueden

medir las corrientes de los devanados, v.gr., con elementos sensores resistivos,
entonces las ecuaciones de medición son
y(1) = ia + w(1)
(8.24)
y(2) = ib + w(2)
donde w(1) y w(2) son procesos independientes de ruido blanco con media cero
y desviaciones estándar asumidas de 100 mA. Las entradas de control nominal se
establecen en
ua (t) = sen(2πt)
(8.25)
ub (t) = cos(2πt)
0.4
0.2
Corriente B [A]
0
−0.2
−0.4
0.5 1 1.5 0 0.5 1 1.5
7
6 Verdadero
Estimado
5
Posición (Rad)
4
3
2
1
0
0.5 1 1.5 0 0.5 1 1.5
Tiempo [s] Tiempo [s]
Figura 8.1.: Resultados de la simulación del filtro de Kalman exten-

dido continuo para el motor sı́ncrono de imán permanente
bifásico.
Las entradas de control reales son iguales a los valores nominales más q1 y q2
(términos de ruido eléctrico), los cuales son procesos independientes de ruido
blanco con media cero y desviación estándar de 10 mA. El ruido debido a las per-
turbaciones del torque de carga (q3 ) tiene una desviación estándar de 0.5 rad/s2 .
Las medidas se obtienen en forma continua.
Aunque las medidas solamente consisten de las corrientes de devanado y el

sistema es no lineal, se puede usar un EKF de tiempo continuo (implementado
con circuitos analógicos o lógica digital muy rápida) para estimar la posición del
motor y la velocidad. Los resultados de medición se muestran en la Figura 8.1.
Los cuatro estados se estiman bastante bien. En particular, el estimado de la
posición del rotor es tan bueno que las trazas de la posición verdadera del rotor
y la estimada no se distinguen en la Figura 8.1.
Simulación Matriz P
Corriente en el devanado A 0.054 A 0.0936 A
Corriente en el devanado B 0.052 A 0.0936 A
Velocidad 0.26 rad/s 0.4422 rad/s
Posición 0.013 rad 0.0252 rad
Tabla 8.1.: Resultados del ejemplo que muestran una desviación estándar de los
errores de estimación de estado determinados a partir de los resultados
de simulación y determinados a partir de la matriz P del EKF. Estos
resultados son para la simulación del motor de imán permanente de
dos fases. Esta tabla muestra que la matriz P es un buen indicador de
la magnitud de los errores de estimación de estado del EKF.
La matriz P cuantifica la incertidumbre en los estimados de estados. Si las no li-
nealidades en el sistema y las medidas no son demasiado severas, entonces la
matriz P deberá dar una idea de cuan precisa es la estimación. En este ejemplo,
las desviaciones estándar de los errores de estimación de estado se obtuvieron de
la simulación y luego se compararon con los elementos de la diagonal de la matriz
P de estado estacionario que se obtuvo del filtro de Kalman. La Tabla 8.1 muestra
una comparación de los errores de estimación que se determinaron por simulación
y los errores de estimación teóricos basados en la matriz P. Se ve que la matriz
P da una buena indicación de la magnitud de los errores de estimación.
8.2.1. Filtro de Kalman extendido de tiempo discreto

En esta subsección, se desarrollará el EKF de tiempo discreto, en el cual se
considera tanto la dinámica como las mediciones en tiempo discreto. Esta si-
tuación es encontrada frecuentemente en la práctica. Aun si la dinámica del
sistema tenido en cuenta es de tiempo continuo, el EKF normalmente necesita
ser implementado en un computador digital. Esto significa que podrı́a no haber
suficiente potencia computacional para integrar la dinámica del sistema como
se requiere en un EKF de tiempo continuo. Ası́, las dinámicas están frecuen-

temente discretizadas y entonces un EFK de tiempo discreto puede usarse. Se
supone que el modelo del sistema es
xk = fk−1 (xk−1 , uk−1 , vk−1 )

yk = hk (xk , wk )
(8.26)
wk ∼ (0, Qk )
vk ∼ (0, Rk )
Se realiza la expansión de la ecuación de estado en serie de Taylor alrededor

de xk−1 = x̂+k−1 y vk−1 = 0 obteniéndose:

∂fk−1 ∂fk−1
+
xk = fk−1 (x̂k−1 , uk−1 , 0) + (xk−1 − x̂k−1 ) +
+
vk−1
∂x x̂+ ∂v x̂+
k−1 k−1
= fk−1 (x̂+ + Fk−1 (xk−1 −

k−1 , uk−1 , 0) x̂+
k−1 )+ Lk−1 vk−1
[ ]
= Fk−1 xk−1 + fk−1 (x̂k−1 , uk−1 , 0) − Fk−1 x̂+
+
k−1 + Lk−1 vk−1
= Fk−1 xk−1 + ũk−1 + ṽk−1 (8.27)
Fk−1 y Lk−1 son definidos por la anterior ecuación. La señal conocida ũk y la
señal de ruido ṽk se definen como:
k , uk , 0) − Fk x̂k
ũk = fk (x̂+ +
(8.28)
ṽk ∼ (0, Lk Qk L⊤
k)
Linealizando la ecuación de medición alrededor de xk = x̂−

k y wk = 0:

− ∂hk − ∂hk
yk = hk (x̂k , 0) + (xk − x̂k ) + wk (8.29)
∂x x̂− ∂w x̂−
k k
De aquı́,
yk = hk (x̂− −
k , 0) + Hk (xk − x̂k ) + Mk wk
[ ]
= Hk xk + hk (x̂− −
k , 0) − Hk x̂k + Mk wk
= Hk xk + zk + w̃k (8.30)
Las expresiones Hk y Mk están definidas en la Ecuación (8.29).

Algoritmo 8.3 El filtro de Kalman extendido de tiempo discreto.
1. Las ecuaciones del sistema y de la medición se dan como sigue:
xk = fk−1 (xk−1 , uk−1 , vk−1 ) vk ∼ (0, Qk )

(8.31)
yk = hk (xk , wk ) wk ∼ (0, Rk )
2. Inicializar el filtro como sigue:
0 = E {x0 }
x̂+
{ } (8.32)
+ ⊤
P+0 = E (x 0 − x̂+
0 )(x0 − x̂0 )
3. Para k = 1, 2, . . ., realizar lo siguiente

Calcular las matrices de derivadas parciales:

∂fk−1
Fk−1 =
∂x x̂+
k−1 (8.33)
∂fk−1
Lk−1 =
∂v x̂+
k−1
Realizar la actualización de la estimación de estados y la covarianza del

error de estimación como sigue:
P− + ⊤ ⊤
k = Fk−1 Pk−1 Fk−1 + Lk−1 Qk−1 Lk−1
(8.34)
x̂− +
k = fk−1 (x̂k−1 , uk−1 , 0)
Calcular las siguientes matrices de derivadas parciales:

∂hk
Hk =
∂x x̂−
k (8.35)
∂hk
Mk =
∂w x̂−
k
Realizar la actualización de la medida de la estimación de estados y la

covarianza del error de estimación como sigue:
Kk = P− ⊤ − ⊤
k Hk (Hk Pk Hk + Mk Rk Mk )
⊤ −1
−
[ −
]
k = x̂k + Kk yk − hk (x̂k , 0)
x̂+ (8.36)
P+
k = (I − Kk Hk )P−
k
Nótese que otras expresiones equivalentes pueden usarse para Kk y P+

k , como
se deduce de la Ecuación (4.54).
La señal conocida zk y la señal de ruido w̃k se definen como
zk = hk (x̂− −
k , 0) − Hk x̂k
(8.37)
w̃k ∼ (0, Mk Rk M⊤
k)
Se tiene un sistema en espacio de estado lineal en la Ecuación (8.27) y una

medición lineal en la Ecuación (8.29). Esto significa que se pueden usar las
ecuaciones del filtro de Kalman estándar para estimar el estado. Esto resulta en
las siguientes ecuaciones para el filtro de Kalman extendido de tiempo discreto.
P− + ⊤ ⊤
k = Fk−1 Pk−1 Fk−1 + Lk−1 Qk−1 Lk−1
Kk = P− ⊤ − ⊤
⊤ −1
x̂−
k= fk−1 (x̂+
k−1 , uk−1 , 0)
zk= hk (x̂k , 0) − Hk x̂−
−
k (8.38)
x̂+= x̂k + Kk (yk − Hk x̂−
−
k − zk )
k
[ ]
= x̂k + Kk yk − hk (x̂−
−
k , 0)
−
k = (I − Kk Hk )Pk
P+
El EKF de tiempo discreto puede resumirse en el Algoritmo 8.3.
8.2.2. Filtro de Kalman extendido hı́brido

Muchos sistemas reales de ingenierı́a están gobernados por dinámicas de tiempo
continuo mientras que las medidas se obtienen en instantes discretos de tiempo.
En esta subsección, se desarrollará el EKF hı́brido, en el cual se consideran
sistemas con dinámica en tiempo continuo y medidas en tiempo discreto. Esta
es la situación más común encontrada en la práctica.
Supóngase que se tiene un sistema en tiempo continuo con medidas en tiempo
discreto como sigue:
ẋ = f (x, u, v, t)
yk = hk (xk , wk )
(8.39)
v(t) ∼ (0, Q)
wk ∼ (0, Rk )
El ruido del proceso v(t) es ruido blanco en tiempo continuo con covarianza Q
y el ruido de medición wk es ruido blanco en tiempo discreto con covarian-

za Rk . Entre las mediciones se propaga la estimación del estado de acuerdo a
la dinámica no lineal conocida, y se propaga la covarianza como se dedujo en
el EKF de tiempo continuo de la Subsección 8.2 utilizando la Ecuación (8.20).
Recuérdese que la expresión Ṗ de la Ecuación (8.20) está dada como
Ṗ = AP + PA⊤ + LQL⊤ − PC⊤ (MRM⊤ )−1 CP. (8.40)
En el EKF hı́brido, no se incluye el término R en la ecuación Ṗ porque se

está integrando P entre tiempos de muestreo, durante los cuales no se efectúa
ninguna medida. Otra manera de ver esto es que entre tiempos de medición
se tienen medidas con covarianza infinita (R → ∞), de modo que el último
término del lado derecho de la ecuación Ṗ tienda a cero. Esto da lo siguiente
para las ecuaciones de actualización de tiempo del EKF hı́brido:
x̂˙ = f (x̂, u, v0 , t)
(8.41)
Ṗ = AP + PA⊤ + LQL⊤
donde A y L están dados en la Ecuación (8.18). Las anteriores ecuaciones

− −
propagan x̂ desde x̂+ +
k−1 hasta x̂k y P desde Pk−1 hasta Pk . Nótese que en la
anterior ecuación v0 es el ruido nominal del proceso; esto es, v0 (t) = 0.
En cada tiempo de medición, se actualiza el estimado del estado y de la cova-
rianza como se dedujo en el filtro de Kalman de tiempo discreto (Capı́tulo 4):
Kk = P− ⊤ − ⊤
⊤ −1
−
[ −
]
k = x̂k + Kk yk − hk (x̂k , v0 )
x̂+ (8.42)
P+
k = (I − Kk Hk )P−
k (I
⊤
− Kk H k ) + Kk Mk Rk M⊤ ⊤
k Kk
donde w0 es el ruido nominal de medición; esto es, w0 = 0. Hk es la deri-

vada parcial de hk (xk , wk ) con respecto a xk y Mk es la derivada parcial de
hk (xk , wk ) con respecto a wk ; Hk y Mk se evalúan en x̂− k.
Nótese que Pk y Kk no pueden calcularse fuera de lı́nea porque dependen de
Hk y Mk , las cuales dependen de x̂− k , la cual a su vez depende de las medidas
ruidosas. Sin embargo, se han reportado algunos esfuerzos para la obtención
de aproximaciones de estado estacionario del EKF en [Athans and Safonov,
1978].
El EKF hı́brido se encuentra resumido en el Algoritmo 8.4.
Algoritmo 8.4 El filtro de Kalman extendido hı́brido.
1. El sistema de ecuaciones con dinámica en tiempo continuo y mediciones en

tiempo discreto están dadas como sigue:
ẋ = f (x, u, v, t)
yk = hk (xk , wk )
(8.43)
v(t) ∼ (0, Q)
wk ∼ (0, Rk )
2. Inicializar el filtro como sigue:
0 = E {x0 }
x̂+
{ } (8.44)
+ ⊤
P+0 = E (x 0 − x̂+
0 )(x0 − x̂0 )
3. Para k = 1, 2, . . ., realizar lo siguiente

Integrar el estimado del estado y de su covarianza desde el tiempo (k−1)+
hasta el tiempo k − como sigue:
x̂˙ = f (x̂, u, 0, t)
(8.45)
Ṗ = AP + PA⊤ + LQL⊤
donde A y L están dadas en la Ecuación (8.18). Este proceso de integra-

ción se inicia con x̂ = x̂+ +
k−1 y P = Pk−1 . Al final de esta integración se
tiene x̂ = x̂−
k y P = Pk
−
En el tiempo k, incorporar la medida yk en el estimado del estado y de

la covarianza como sigue:
Kk = P− ⊤ − ⊤
⊤ −1
−
[ −
]
k = x̂k + Kk yk − hk (x̂k , 0)
x̂+ (8.46)
P+
k = (I − Kk Hk )P−
k (I
⊤
− Kk Hk ) + Kk Mk Rk M⊤ ⊤
k Kk
Hk y Mk son las derivadas parciales de hk (xk , wk ) con respecto a xk y wk

y ambas evaluadas en x̂−
k . Nótese que se pueden usar otras expresiones
equivalentes para Kk y P+k , como se deduce de la Ecuación (4.54).
8.3. El filtro de Kalman unscented 269
8.3. El filtro de Kalman unscented

Como se señaló anteriormente, el filtro de Kalman extendido (EKF) es el algo-
ritmo de estimación de estado que más se aplica para sistemas no lineales. Sin
embargo, el EKF puede ser difı́cil de ajustar y, a menudo da estimaciones poco
fiables si las no linealidades del sistema son severas. Esto es porque el EKF
se basa en la linealización para propagar la media y la covarianza de estado.
Esta sección trata sobre el filtro de Kalman unscented (UKF), una extensión
del filtro de Kalman, que reduce los errores de linealización del EKF. El uso
del UKF puede proporcionar una mejora significativa sobre el EKF.
Con relación a la expresión unscented , en una entrevista [IEEE, 2012], su
creador Jeffrey Uhlmann, explicó que se le ocurrió el nombre después de obser-
var un desodorante sin perfume situado sobre el escritorio de un compañero de
trabajo; por lo tanto es inútil buscar una traducción, sólo es eso: un nombre.
8.3.1. Media y covarianza de trasformaciones no

lineales
En esta subsección, se mostrará como las aproximaciones de linealización pue-
den resultar en errores en la trasformación de medias y covarianzas cuando
una variable aleatoria es operada por una función no lineal. Esta subsección
no tiene realmente nada que ver directamente con estimación de estados, el
filtrado de Kalman o el UKF. Sin embargo, se proporcionan algunas bases que
permitirán desarrollar el UKF más adelante. También se darán los conceptos
básicos para entender el tipo de problemas que pueden surgir en el EKF.
Considérese la transformación no lineal
y1 = r cos θ
(8.47)
y2 = r sen θ
Esta es un transformación estándar de coordenadas polares a rectangulares.

Por ejemplo, se puede tener un sensor que mida la magnitud r y el ángulo θ
para luego convertir el dato medido a las coordenadas rectangulares y1 y y2 .
La transformación de coordenadas puede escribirse más generalmente como
y = h(x) (8.48)
donde y es la salida de los elementos de h(x). El vector x de dos elementos se

define como
[ ]
r
x= (8.49)
θ
Supóngase que x1 (la cual es la magnitud r) es una variable aleatoria con una
media de 1 y una desviación estándar de σr . Supóngase que x2 (el cual es el
ángulo θ) es una variable aleatoria con una media de π/2 y una desviación
estándar de σθ . En otras palabras, las medias de las componentes de x están
dadas como r̄ = 1 y θ̄ = π/2. Además, se asumirá que r y θ son independientes
y que sus funciones de densidad de probabilidad son simétricas alrededor de
sus medias (por ejemplo, gaussiana o uniforme).
La media de una transformación no lineal
Una consideración inicial del anterior problema, junto con la Ecuación (8.47),
podrı́a conducir a creer que y1 tiene una media de 0 y y2 tiene una media de 1.
Además, un enfoque de linealización podrı́a conducir a la misma conclusión. Si
se desarrolla una linealización de primer orden a la Ecuación (8.48) y se toma
el valor esperado de ambos lados, se puede obtener
{ }
∂h
ȳ = E {h(x)} ≈ E h(x̄) + (x − x̄)
∂x x̄

∂h
= h(x̄) + E (x − x̄) = h(x̄)
∂x x̄
[ ]
0
= (8.50)
1
La intuición, junto con un análisis de linealización de primer orden, conducen

a la misma conclusión. Sin embargo, se seguirá este problema con más rigor
para comprobar el análisis previo. Se puede escribir r y θ como
r = r̄ + r̃
(8.51)
θ = θ̄ + θ̃
donde r̃ y θ̃ son simplemente las desviaciones de r y θ de sus medias.

Se puede realizar un análisis de la media de y1 como sigue:

{ }
ȳ1 = E {r cos θ} = E (r̄ + r̃) cos(θ̄ + θ̃)
{ }
= E (r̄ + r̃)(cos θ̄ cos θ̃ − sen θ̄ sen θ̃) (8.52)
Llevando a cabo la multiplicación, recordando que r̃ y θ̃ son independientes

con funciones de densidad probabilidad (pdf ) simétricas y tomando el valor
esperado, resulta en
ȳ1 = 0 (8.53)
La intuición y la aproximación de primer orden de ȳ1 han sido confirmadas por

este análisis. Repitiendo el proceso para ȳ2 :
ȳ2 = E {r sen θ}
{ }
= E (r̄ + r̃) sen(θ̄ + θ̃)
{ }
= E (r̄ + r̃)(sen θ̄ cos θ̃ + cos θ̄ sen θ̃) (8.54)
Llevando a cabo la multiplicación, recordando que r̃ y θ̃ son independientes

con pdf s simétricas y tomando el valor esperado, resulta en
{ }
ȳ2 = E cos θ̃ (8.55)
No se puede ir más lejos a menos que se asuma alguna distribución para θ̃, ası́
que se asume que θ̃ está uniformemente distribuida entre ±θm . En este caso,
se puede calcular
{ }
ȳ2 = E cos θ̃
sen θm
= (8.56)
θm
Se esperaba obtener 1 por respuesta en confirmación de la Ecuación (8.50), pero
en su lugar se tiene un número que es menor que 1. [Nótese que (sen θm )/θm < 1
para todo θm > 0, y lı́mθm →∞ (sen θm )/θm = 1 ]. El análisis revela un problema
con respecto a la visión inicial y a la linealización de primer orden que se
1.01
Media
1 linealizada
0.99
0.98
Media no
2
0.97
y
lineal
0.96
0.95
0.94
0.93
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
y1
Figura 8.2.: Media linealizada y media no lineal de 300 puntos generados de

forma aleatoria, con r̃ uniformemente distribuido entre ±0.01 y θ̃
uniformemente distribuido entre ±0.35 rad.
realizó antes. La media de y2 será en efecto menor que 1. Esto se puede ver
observando un gráfico de 300 valores de r y t generados aleatoriamente, donde r̃
está uniformemente distribuida entre ±0.01 y θ̃ está uniformemente distribuida
entre ±0.35 rad. La pequeña varianza de r̃ y la gran varianza de θ̃ resulta en
una distribución en forma de arco de puntos como se ve en la Figura 8.2. Esta
distribución en forma de arco resulta en ȳ2 < 1 . Este no es un ejemplo de
filtrado de Kalman. Pero ya que el EKF usa la linealización de primer orden
para actualizar la media del estado, este ejemplo muestra el tipo de error que
puede arrastrarse en el EKF cuando es aplicado a un sistema no lineal.
Para un análisis más general de la media de una transformación no lineal,
recordando de la Ecuación (2.9) que y = h(x) puede ser ampliado en una serie
de Taylor alrededor de x̄ como sigue
1 2 1
y = h(x) = h(x̄) + Dx̃ h + Dx̃ h + Dx̃3 h + · · · (8.57)
2! 3!
donde x̃ = x − x̄. La media de y por la tanto se puede expandir como

{ }
1 2 1 3
ȳ = E h(x̄) + Dx̃ h + Dx̃ h + Dx̃ h + · · ·
2! 3!
{ }
1 2 1 3
= h(x̄) + E Dx̃ h + Dx̃ h + Dx̃ h + · · · (8.58)
2! 3!
Usando Dx̃ h de la Ecuación (2.8) se puede ver que

{ n }
∑ ∂
E {Dx̃ h} = E x̃i h(x)
i=1
∂xi x=x̄
∑
n
∂
= E {x̃i } h(x)
i=1
∂xi x=x̄
=0 (8.59)
porque E {x̃i } = 0. Igualmente, se puede ver que

{( n )3 }
{ 3 } ∑
∂
E Dx̃ h = E x̃i h(x)
∂xi
i=1 x=x̄
=0 (8.60)
Esto es porque la suma en la ecuación anterior se compone sólo de momentos

de tercer orden [E {x̃31 } , E {x̃21 x̃2 } , etc.]. Estos valores esperados siempre serán
cero [Simon, 2006]. Igualmente todos los términos impares en la Ecuación (8.58)
serán cero, lo cual conduce a la simplificación
1 { 2 } 1 { 4 }
ȳ = h(x̄) + E Dx̃ h + E Dx̃ h + · · · (8.61)
2! 4!
Esto muestra por qué el cálculo de la media en la Ecuación (8.50) fue incorrecto;
ese cálculo sólo se corrige hasta el primer orden. Si se aproxima ȳ para la
transformación polar a rectangular usando términos hasta el segundo orden de
la Ecuación (8.61), se obtiene

1 { 2 }
ȳ ≈ h(x̄) + E D h
2! {( x̃ }
∑n )2
1 ∂
= h(x̄) + E x̃i h(x)
2 ∂x i
i=1
( x=x̄
)
1 ∂ 2
h(x) ∂ 2
h(x) ∂ 2
h(x)
= h(x̄) + E (x̃i )
2 + 2E (x̃1 x̃2 ) + E (x̃2 )
2
2 ∂x21 x=x̄ ∂x1 x2 x=x̄ ∂x22 x=x̄
([ ] [ ] [ ] )
1 0 0 2 −r cos θ
= h(x̄) + + + σθ
2 0 0 −r sen θ x=x̄
[ ] [ ]
0 1 0
= + σθ2 (8.62)
1 2 −1
por lo tanto se obtiene
ȳ1 ≈ 0 (8.63)
σθ2 E (θ̃)2
ȳ2 ≈ 1 − =1− (8.64)
2 2
Nótese que se encontró el valor exacto de ȳ2 en la Ecuación (8.55) siendo igual
a E (cos θ̃). La expresión aproximada que se encuentra en la Ecuación (8.64)
corresponde a los dos primeros términos no nulos del desarrollo en serie de
Taylor de E (cos θ̃).
La covarianza de una transformación no lineal
Ahora se dirigirá la atención a la covarianza de una variable aleatoria que

experimenta una transformación no lineal. La covarianza de y está dada por
{ }
Py = E (y − ȳ)(y − ȳ)⊤ (8.65)
Se puede usar las ecuaciones (8.57) y (8.61) para escribir (y − ȳ) como
[ ] [ ]
1 2 1 1
y − ȳ = h(x̄) + Dx̃ h + Dx̃ h + · · · − h(x̄) + E (Dx̃ h) + E (Dx̃ h) + · · ·
2 4
2! 2! 4!
[ ] [ ]
1 2 1 1
= Dx̃ h + Dx̃ h + · · · − E (Dx̃ h) + E (Dx̃ h) + · · ·
2 4
(8.66)
2! 2! 4!
Se sustituye esta expresión en la Ecuación (8.65) y se usa el mismo razona-

miento como en la sección previa para ver que todos los términos de potencias
impares en el valor esperado se evalúan como cero (asumiendo que x̃ tiene
media cero con una pdf simétrica). Esto resulta en
{ }
{ ⊤
} Dx̃ h(Dx̃3 h)⊤ Dx̃2 h (Dx̃2 h)⊤ Dx̃3 h(Dx̃ h)⊤
Py = E Dx̃ h(Dx̃ h) + E + +
3! 2! 2! 3!
( 2 ) ( 2 )⊤
Dx̃ h Dx̃ h
+E E + ··· (8.67)
2! 2!
El primer término del lado derecho de la anterior ecuación puede escribirse

como
( 
 )( n )⊤ 
{ } ∑ n
∂h ∑ ∂h
E Dx̃ h(Dx̃ h)⊤ = E x̃i x̃j

i=1
∂xi x=x̄ j=1
∂xj x=x̄ 
{ }
∑ ∂h ∂h⊤
=E x̃i x̃j
∂x i
∂x j

i,j x=x̄ x=x̄
∑
= Hi E (x̃i x̃j )H⊤ j
i,j
∑
= Hi Pij H⊤
j (8.68)
i,j
donde el vector de derivadas parciales Hi y el valor esperado Pij están definidos

por la anterior ecuación. Recordando de la Ecuación (1.7) que una ecuación de
esta forma se puede escribir como

{ ⊤
} ∂h ∂h⊤
E Dx̄ h(Dx̄ h) = P
∂x x=x̄ ∂x x=x̄
= HPH⊤ (8.69)
donde la matriz de derivadas parciales H y la matriz de covarianza P están

definidas por la ecuación anterior. Hi en la Ecuación (8.68) es la i-ésima co-
{ ⊤ }(8.68) es el elemento de la i-ésima fila y la
lumna de H y Pij en la Ecuación
j -ésima columna de P = E x̃x̃ . Se puede usar esto en la Ecuación (8.67)
para escribir la covarianza de una transformación no lineal y = h(x) como
sigue:
{ }
⊤ Dx̃ h(Dx̃3 h)⊤ Dx̃2 h (Dx̃2 h)⊤ Dx̃3 h(Dx̃ h)⊤
Py = HPH + E + + +
3! 2! 2! 3!
( 2 ) ( 2 )⊤
Dx̃ h Dx̃ h
+E E + ··· (8.70)
2! 2!
Esta es la expansión completa de la serie de Taylor para la covarianza de una

transformación no lineal.
En el EKF, se usa solamente el primer término de esta expansión para
aproximar la covarianza del error estimado. Por ejemplo, cuando la medición
y = h(x) + w entonces se ve desde la ecuación [] que la covarianza de y es
aproximada como Py = HPx H⊤ + R, donde H es la derivada parcial de h con
respecto a x, y R es la covarianza de w. Igualmente, si el estado se propaga
como xk+1 = f (xk ) + vk entonces la covarianza de x es actualizada aproxima-
damente como P− +
k = FPk−1 + Q, donde F es la derivada parcial de f (x) con
respecto a x y Q es la covarianza de vk . Sin embargo, esas aproximaciones de la
covarianza pueden resultar en errores significativos si las funciones subyacentes
h(x) y f (x) son altamente no lineales.
Por ejemplo, si se considera la transformación no lineal introducida en el co-
mienzo de esta sección. Una aproximación lineal de la covarianza podrá indicar
que Py = HPx H⊤ , donde H y Px están dadas como

∂h
H=
∂x
[ x=x̄ ]
cos θ −r sen θ
=
sen θ r cos θ x=x̄
[ ]
0 −1
=
1 0
{[ ][ ]⊤ }
r − r̄ r − r̄
Px = E
θ − θ̄ θ − θ̄
[ 2 ]
σr 0
= (8.71)
0 σθ2
Esto da Py como sigue
Py ≈ HPx H⊤
[ ][ ][ ] [ 2 ]
0 −1 σr2 0 0 1 σθ 0
= = (8.72)
1 0 0 σθ2 −1 0 0 σr2
Esta es una aproximación de Py . Sin embargo, un análisis más riguroso de Py

puede realizarse usando las ecuaciones (8.47), (8.53) y (8.56):
{ }
Py = E (y − ȳ)(y − ȳ)⊤
  ⊤ 

 r cos θ r cos θ 

=E  sen θm   sen θ m 
 r sen θ − θ
 r sen θ −
θ


m m
{[ 2 ]}
r cos2 θ rϕ cos θ
=E (8.73)
rϕ cos θ ϕ2
( )
sen θm
donde ϕ = r sen θ − . De nuevo usando la suposición que r y θ son
θm
independientes, r es uniformemente distribuida con una media de 1 y una
desviación estándar de σr , y θ = π/2 + θ̃, con θ̃ uniformemente distribuida
entre ±θm . Por lo tanto se puede calcular
{ }
E r2 = 1 + σr2
{ }
{ } 1 − E cos 2 θ̃
E cos2 θ =
2
{ } sen 2θ
m
E cos 2θ̃ =
2θm
{ } sen θ
m
E {sen θ} = E cos θ̃ = (8.74)
θm
Se pueden usar estas expresiones en la Ecuación (8.73) para calcular
 ( ) 
1
(1 + σ 2
) 1 − sen 2θm
0
2 r 2θm

Py =  ( )  (8.75)
2
0 1
2
(1 + σr
2
) 1 − sen 2θm
2θm
+ sen θm
θ2
m
1.01
1
Covarianza
0.99 linealizada
0.98
y2
0.97
0.96
0.95 Covarianza
no lineal
0.94
0.93
−0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4
y
1
Figura 8.3.: Media linealizada y media no lineal de 300 puntos generados de

forma aleatoria, con r̃ uniformemente distribuido entre ±0.01 y θ̃
uniformemente distribuido entre ±0.35 rad.
Esta matriz define una elipse bidimensional, donde Py (1, 1) especı́fica el cua-
drado de la longitud del eje y1 , y Py (2, 2) especı́fica el cuadrado de la longitud
del eje y2 . La Figura 8.3 muestra la covarianza linealizada definida por la
Ecuación (8.72), y la covarianza exacta definida por la Ecuación (8.75). La
covarianza linealizada se centra en la media linealizada y la covarianza exacta
se centra en torno a la media exacta. Se puede observar que la covarianza li-
nealizada no es muy buena aproximación a la covarianza exacta, al menos no
en la dirección de y2 .
Este no es un ejemplo de un filtrado Kalman. pero puesto que el EKF usa
linealización de primer orden para actualizar la covarianza del estado, este
ejemplo muestra la forma del error que puede arrastrarse en el EKF cuando
este es aplicado a un sistema no lineal.
8.3.2. Transformaciones unscented

El problema con los sistemas no lineales es que estos son difı́ciles de trans-
formar a una función de densidad de probabilidad a través de una función
no lineal general. En la anterior sección, se pudo obtener transformaciones no

lineales de la media y la covarianza, pero solamente por medio de una trans-
formación bidimensional simple. El filtro de Kalman extendido trabaja sobre
el principio de que una transformación linealizada de medias y covarianzas es
aproximadamente igual a la transformación no lineal verdadera, pero se vio en
la anterior sección que la aproximación podrı́a ser no satisfactoria.
Una transformación unscented está basada sobre dos principios fundamen-
tales. Primero, es fácil de realizar una transformación no lineal sobre un punto
único (más que una pdf completa). Segundo, no es demasiado difı́cil de encon-
trar un conjunto de puntos individuales en el espacio de estado cuya muestra
de pdf se aproxime a la verdadera pdf de un vector de estado.
Tomando esas dos ideas juntas, supóngase que se conoce la media x̄ y la
covarianza P de un vector x. Entonces se encuentra un conjunto de vectores
determinı́stico llamado puntos sigma cuyo conjunto de media y covarianza es
igual a x̄ y P. Luego se aplica la conocida función no lineal y = h(x) a cada
vector determinı́stico para obtener los vectores transformados. El conjunto
media y covarianza de los vectores transformados dará un buen estimado de
la verdadera media y covarianza de y. Esta es la clave para la transformación
unscented.
Como un ejemplo, supóngase que x es un vector n × 1 que es transformado
por una función no lineal y = h(x). Se escogen 2n puntos sigma x(i) como
sigue:
x(i) = x̄ + x̃(i) i = 1, ..., 2n

(√ )⊤
(i)
x̃ = nP i = 1, ..., n (8.76)
i
(√ )⊤
x̃(n+i) = − nP i = 1, ..., n
i
√ (√ )⊤(√ )
donde nP es la raı́z cuadrada de la matriz nP tal que nP nP = nP,
(√ ) √
y nP es la i-ésima raı́z de nP. En las próximas dos subsecciones, se
i
verá como la media del conjunto de los puntos sigma anteriores puede usarse
para aproximar la media y la covarianza de un vector no lineal transformado.
Aproximación de la media
Supóngase que se tiene un vector x con una media conocida x̃ y una covarian-
za P, una función no lineal y = h(x), y se desea aproximar la media de y.
Se propone transformar cada punto sigma individual de la Ecuación (8.76)
usando la función no lineal h(·), y entonces se toma la suma ponderada de los
puntos sigma transformados para aproximar la media de y. Los puntos sigma
transformados son calculados como sigue:
( )
y (i) = h x(i) i = 1, ..., 2n (8.77)
La media real de y se denota como ȳ. La media aproximada de y se denota

como ȳu y se calcula como sigue
∑
2n
ȳu = W (i) y (i) (8.78)
i=1
Los coeficientes ponderados W (i) están definidos como sigue:

1
W (i) = i = 1, ..., 2n (8.79)
2n
La Ecuación (8.78) puede por lo tanto ser escrita como
1 ∑ (i)
2n
ȳu = y (8.80)
2n i=1
Ahora se va a calcular el valor de ȳu para ver lo bien que coincide con la media
real de y. Para hacer esto primero se usa la Ecuación (2.9) para expandir cada
y(i) en la Ecuación (8.80) en una serie de Taylor alrededor de x̄. Esto resulta
en
2n ( )
1 ∑ 1 2
ȳu = h(x̄) + Dx̃(i) h + Dx̃(i) h + · · ·
2n i=1 2!
2n ( )
1 ∑ 1 2
= h(x̄) + Dx̃(i) h + Dx̃(i) h + · · · (8.81)
2n i=1 2!
Nótese ahora que para cualquier entero k ≥ 0 se tiene

[( n ]
∑2n ∑2n ∑ (j) ∂ )2k+1

Dx̃2k+1 h = x̃ h(x)
(j) i
∂x i
j=1 j=1 i=1 x=x̄
[ n ]
( )
∑ ∑ (j) 2k+1 ∂ 2k+1
2n

= x̃i h(x)
∂x 2k+1
j=1 i=1 i x=x̄
[ 2n ]
∑ ∑ ( (j) )2k+1 ∂ 2k+1
n

= x̃i 2k+1
h(x)
i=1 j=1
∂x i x=x̄
=0 (8.82)
ya que desde la Ecuación (8.76) x̃(j) = −x̃(n+j) j = 1, . . . , n. Por lo tanto,

todos los términos impares en la Ecuación (8.81) se evalúan en cero y se tiene
( )
1 ∑
2n
1 2 1 4
ȳu = h(x̄) + D (i) h + Dx̃(i) h + · · ·
2n i=1 2! x̃ 4!
2n ( )
1 ∑ 1 2 1 ∑ 1 4
2n
1 6
= h(x̄) + D (i) h + D (i) h + Dx̃(i) h + · · ·
2n i=1 2! x̃ 2n i=1 4! x̃ 6!
(8.83)
Ahora se observa en el segundo término sobre el lado derecho de la anterior

ecuación:
( n )2
1 ∑ 1 2
2n
1 ∑ 1 ∑ (k) ∂
2n

Dx̃(i) h = x̃i h(x)
2n i=1 2! 2n k=1 2! i=1 ∂xi
x=x̄

1 ∑2n ∑ n
∂ 2
h(x)
(k) (k)
= x̃i x̃j
4n k=1 i,j=1 ∂xi ∂xj x=x̄

1 ∑ ∑ (k) (k) ∂ 2
n 2n
= x̃i x̃j h(x)
4n i,j=1 k=1 ∂xi ∂xj x=x̄

1 ∑ ∑ (k) (k) ∂ 2
n n
= x̃i x̃j h(x)
2n i,j=1 k=1 ∂xi ∂xj x=x̄
donde de nuevo se ha usado a partir de la Ecuación (8.76) el hecho que x̃(k) =

(k) (k)
−x̃(k+n) (k = 1, . . . , n). Se sustituye para x̃i y x̃j desde la Ecuación (8.76)
en la anterior ecuación para obtener

1 ∑ ∑ (k) (k) ∂ 2 h(x) 1 ∑ ∑ (√ ) (√ ) ∂ 2 h(x)
n n n n
x̃ x̃ = nP nP
2n i,j=1 k=1 i j ∂xi ∂xj x=x̄ 2n i,j=1 k=1 ki

kj ∂xi ∂xj x=x̄

1 ∑ ∂ 2 h(x)
n
= nPij
2n i,j=1 ∂xi ∂xj x=x̄

1 ∑ ∂ 2 h(x)
n
= Pij (8.84)
2n i,j=1 ∂xi ∂xj x=x̄
La Ecuación (8.83) por lo tanto puede escribirse como

2n ( )
1∑ ∂ 2 h 1 ∑ 1 4
n
1 6
ȳu = h(x̄) + Pij + D (i) h + Dx̃(i) h + · · ·
2 i,j=1 ∂xi ∂xj x=x̄ 2n i=1 4! x̃ 6!
(8.85)
Ahora recordando que la media real de y está dada por la Ecuación (8.61)
como
1 { 2 } 1 { 4 }
ȳ = h(x̄) + E Dx̃ h + E Dx̃ h + · · · (8.86)
2! 4!
Observando en el segundo término sobre el lado derecho de la anterior ecuación.

Esta puede ser escrita como sigue:
{( n )2 }
{ } ∑
1 1 ∂
E Dx̃ h = E
2
x̃i h(x)
2! 2! ∂xi
i=1
{ n }
x=x̄
1 ∑ 2
∂ h
= E x̃i x̃j
2! i,j=1
∂xi ∂xj x=x̄

1 ∑ ∂ 2 h
n
= E {x̃i x̃j }
2! i,j=1 ∂xi ∂xj x=x̄

1 ∑ ∂ 2 h
n
= Pij (8.87)
2! i,j=1 ∂xi ∂xj x=x̄
Por lo tanto se ve que ȳ puede escribirse desde la Ecuación (8.86) como

1∑ ∂ 2 h 1 { } 1 { }
n
ȳ = h(x̄) + Pij + E Dx̃4 h + E Dx̃6 h + · · · (8.88)
2 i,j=1 ∂xi ∂xj x=x̄ 4! 6!
Comparando ésta con la Ecuación (8.85) se ve que ȳu (la media aproximada
de y) coincide con la media real de y correctamente hasta el tercer orden,
mientras que la linealización solamente coincide con la media real de y hasta
el primer orden. Si se calcula ȳu usando las ecuaciones (8.76),(8.77) y (8.80),
entonces el valor de ȳu coincidirá con la media real de y hasta el tercer or-
den. La mayor dificultad con este algoritmo es la raı́z cuadrada de la matriz
que es requerida en la Ecuación (8.76). Pero la transformación unscented tiene
la ventaja computacional que la linealización de la matriz H no necesita ser
calculada. Por supuesto, la mayor ventaja de la transformación unscented (re-
lativo a la linealización) es el aumento de la precisión de la transformación de
la media.
Aproximación de la covarianza
Ahora supóngase que se desea aproximar la covarianza de la transformación

no lineal del vector x. Esto es, se tiene un vector x con n elementos con media
conocida x̄ y covarianza P y se tiene una función no lineal conocida y = h(x).
Se desea estimar la covarianza de y. Se indica el estimado como Pu y se propone
usar la siguiente ecuación:
∑
2n
Pu = W (i) (y(i) − yu )(y(i) − yu )⊤
i=1
1 ∑ (i)
2n
= (y − yu )(y(i) − yu )⊤ (8.89)
2n i=1
donde los vectores y(i) son los puntos sigma transformados que fueron calcula-
dos en la Ecuación (8.77), y los coeficientes de ponderación W (i) son los mismos
que las dados en la Ecuación (8.79). Expandiendo esta aproximación usando
las ecuaciones (2.9) y (8.83) da lo siguiente:
1 ∑[ ][ ]⊤
2n
Pu = h(x(i) − yu ) h(x(i) − yu )
2n i=1
∑2n [
1 1
= h(x̄) + Dx̃(i) h + Dx̃2 (i) h + Dx̃3 (i) h+ · · ·
i=1
2! 3!
2n ( )]
1 ∑ 1 2 1 4
− h(x̄) − D (j) h + Dx̃(j) h + · · · [· · · ]⊤ (8.90)
2n j=1 2! x̃ 4!
Efectuado la multiplicando se obtiene:

{
1 ∑
2n
1 2
Pu = (Dx̃(i) h)(Dx̃(i) h)⊤ +Υ1 +Υ⊤ 1 + (Dx̃(i) h)(Dx̃2 (i) h)⊤ −Υ2 −Υ⊤ 2
2n i=1 4!
( )( )⊤  ( )⊤ 
1 ∑ ∑ 1 ∑
+ 2 Dx̃2 (i) h Dx̃2 (i) h −  Dx̃2 (i) h Dx̃2 (i) h 
4n j j
4n j
 ( 
)⊤ ⊤ [
∑ ( )⊤ ]
1 1
−  Dx̃2 (i) h Dx̃2 (i) h  + Dx̃(i) h Dx̃3 (i) h
4n j
3!
[ ( )⊤ ]⊤ }
1 3
+ Dx̃(i) h D (i) h + ··· (8.91)
3! x̃
donde
[ ]
1
Υ1 = (Dx̃(i) h) (Dx̃(i) h) = Υ⊤
2 ⊤
1 = 0
2
 ( )⊤ 
1 ∑ 1 2
Υ2 = Dx̃(i) h Dx̃(i) h  = Υ⊤2 = 0
2n j 2
Algunos de los términos en la ecuación anterior son cero como ya se señaló

porque x̃(i) = −x̃(i+n) para i = 1, . . . , n. Ası́ la aproximación de la covarianza
puede escribirse como
1 ∑
2n
Pu = (Dx̃(i) h)(Dx̃(i) h)⊤ + TOS (8.92)
2n i=1
donde TOS significa términos de orden superior (es decir, términos a la cuarta
potencia y superior). Expandiendo esta ecuación para Pu dejando de lado los
términos de orden superior da
n ( )( )⊤
1 ∑∑
2n
(i) ∂h(x̄) (i) ∂h(x̄)
Pu = x̃ x̃k (8.93)
2n i=1 j,k=1 j ∂xj ∂xk
(i) (i+n) (i) (i+n)

Ahora recordando que x̃j = −x̃j y x̃k = −x̃k para i = 1, . . . , n. Por
lo tanto, la aproximación de la covarianza será
n ( )( )⊤
1∑∑
n
(i) ∂h(x̄) (i) ∂h(x̄)
Pu = x̃ x̃k
n i=1 j,k=1 j ∂xj ∂xk
∑n ( )⊤
∂h(x̄) ∂h(x̄)
= Pjk
j,k=1
∂xj ∂xk
= HPH⊤ (8.94)
donde la última igualdad proviene de la Ecuación (8.69). Comparando esta

ecuación para Pu con la covarianza real de y desde la Ecuación (8.70), se ve
que la Ecuación (8.89) se aproxima a la covarianza real de y hasta el ter-
cer orden (es decir, solamente los términos a la cuarta y mayor potencia son
incorrectos). Este es el mismo orden de aproximación como el método de linea-
lización. Sin embargo, se espera intuitivamente que la magnitud del error de la
aproximación unscented en la Ecuación (8.89) sea más pequeña que la apro-
ximación lineal HPH⊤ , porque la aproximación unscented al menos contiene
términos indicados correctamente hasta la cuarta potencia y mayor, mientras
que la aproximación lineal no contiene ningún término de otro tipo que HPH⊤ .
La transformación unscented puede resumirse como sigue
La transformación unscented
1. Se comienza con un elemento n del vector x con una media x̄ y una

covarianza P conocida. Dada una transformación no lineal conocida y =
h(x), se desea estimar la media y la covarianza de y, denotada com ȳu
y Pu .
2. Se forman vectores x(i) con 2n puntos sigma como sigue:
x(i) = x̄ + x̃(i) i = 1, ..., 2n

(√ )⊤
x̃(i) = nP i = 1, ..., n (8.95)
i
(√ )⊤
x̃(n+i) = − nP i = 1, ..., n
i
√ (√ )⊤(√ )
donde nP es la raı́z cuadrada de la matriz nP tal que nP nP =
(√ ) √
nP, y nP es la i-ésima raı́z de nP.
i
3. Transformar los puntos sigma como sigue:
y(i) = h(x(i) ) i = 1, ..., 2n (8.96)
4. Aproximar la media y la covarianza de y como sigue
1 ∑ (i)
2n
ȳu = y
2n i=1
1 ∑ (i)
2n
Pu = (y − yu )(y(i) − yu )⊤ (8.97)
2n i=1
Ejemplo 8.2
Para ilustrar la transformación unscented, considérese la transformación no lineal
mostrada en la Ecuación (8.47). Ya que esas son dos variables independientes
(r y θ), se tiene n = 2. La covarianza de P está dada como P = diag(σr2 , σθ2 ).
La Ecuación (8.79) muestra que W (i)=1/4 para i = 1, 2, 3, 4. La Ecuación (8.76)
muestra que los puntos sigma están determinados como
(√ )⊤
x(1) = x̄ + nP
[ √ ]1
= 1 + σ r 2
π/2
(√ )⊤
x(2) = x̄ + nP
[ 2
]
1 √
=
π/2 + σθ 2
(√ )⊤ (8.98)
x(3) = x̄ − nP
[ √ ]1
= 1 − σr 2
π/2
(√ )⊤
x(4) = x̄ − nP
[ 2
]
1 √
=
π/2 − σθ 2
Calculando los puntos sigma transformados no linealmente y(i) = h(x(i) ) da

[ ] [ ]
(1) (1)
(1) x1 cos x 2 0 √
y = (1) (1) = 1 + σ
x1 sen x2 r 2
[ ] [ √ ]
(2) (2)
(2) x1 cos x2 cos(π/2 + σθ √2)
y = (2) (2) = sen(π/2 + σ
x1 sen x2 θ 2)
[ ] [ ] (8.99)
(3) (3)
(3) x1 cos x2 0 √
y = (3) (3) = 1 − σ
x1 sen x2 r 2
[ ] [ √ ]
(4) (4)
(4) x1 cos x2 cos(π/2 − σθ √2)
y = (4) (4) = sen(π/2 − σ
x1 sen x2 θ 2)
Ahora se puede calcular la aproximación unscented de la media y la covarianza

de y = h(x) como
∑
4
ȳu = W(i) y(i)
i=1
(8.100)
∑4 ( )( )⊤
Pu = W (i)
y(i) − yu y(i) − yu
i=1
Los resultados de esas transformaciones se muestran en la figura[]. Esta muestra

la precisión mejorada de la estimación de la media y covarianza cuando se utilizan
las transformaciones unscented en vez de aproximaciones lineales. La media real y
la media de la aproximación unscented están tan cerca que se representan encima
una de la otra. La media real y la media aproximada unscented son iguales, con
cuatro dı́gitos significativos, a (0, 0.9797).
8.4. Filtrado de Kalman unscented

La transformación unscented desarrollada en la sección anterior puede gene-
ralizarse para obtener el filtro de Kalman unscented. Después de todo, con el
algoritmo del filtro de Kalman se intenta propagar la media y la covarianza del
sistema usando una actualización del tiempo y una actualización de la medida.
Si el sistema es lineal, entonces la media y la covarianza se pueden actualizar
con exactitud con el filtro de Kalman (Capı́tulo 4). Si el sistema es no lineal,
entonces la media y la covarianza se pueden actualizar aproximadamente con
el filtro de Kalman extendido (Sección 8.2). Sin embargo, el EKF se basa en
la linealización y, en la sección anterior se mostró que las transformaciones
unscented son más precisas para propagar las medias y las covarianzas que la
linealización. Por lo tanto, simplemente se reemplazarán las ecuaciones EKF
con transformaciones unscented para obtener el algoritmo UKF. El algoritmo
UKF puede resumirse como sigue
El algoritmo anterior asume que las ecuaciones del proceso y la medición
son lineales con respecto a el ruido, como se muestra en la Ecuación (8.101).
En general, las ecuaciones del proceso y la medición pueden tener ruido que
entra en las ecuaciones de proceso y medición no linealmente. Esto es,
xk+1 = f (xk , uk , vk , tk )
(8.112)
yk = h(xk , wk , tk )
8.4. Filtrado de Kalman unscented 289
Algoritmo 8.5 Filtro de Kalman unscented.

Inicialización:
1. Se tiene un sistema no lineal de tiempo discreto con n-estados dado por:
xk+1 = f (xk , uk , tk ) + vk
yk = h(xk , tk ) + wk
(8.101)
vk ∼ (0, Qk )
wk ∼ (0, Rk )
2. El UKF se inicializa como sigue
0 = E {x0 }
x̂+
{ + ⊤
} (8.102)
P0 = E (x0 − x̂+
+
0 )(x0 − x̂0 )
3. Las siguientes ecuaciones de actualización en el tiempo (8.103) se usan

para propagar el estimado del estado y la covarianza de un instante de
medición al siguiente
Para propagar desde un paso de tiempo (k − 1) hasta k, primero
(i)
se escogen los puntos sigma xk−1 como se especificó en la Ecuación
(8.76), con los cambios apropiados ya que la actual mejor estimación
de la media y covarianza de xk corresponde a x̂+ +
k−1 y Pk−1 :
(i)
x̂k−1 = x̂+
k−1 + x̃
(i)
i = 1, . . . , 2n
(√ )⊤
(i) +
x̃ = nPk−1 i = 1, . . . , n
i
(8.103)
(√ )⊤
x̃(n+i) = − nP+
k−1 i = 1, . . . , n
i
Usar la ecuación del sistema f (·) no lineal conocido para transfor-

(i)
mar los puntos sigma en vectores x̃k , como se muestra en la Ecua-
ción (8.77), con cambios apropiados desde nuestra transformación
no lineal es f en lugar de h(·)(·)(·):
Continuación:
(i)
Combinar los x̂k vectores para obtener el estado estimado a priori en
el tiempo k. Esto está basado en la Ecuación (8.80):
1 ∑ (i)
2n
x̂−
k = x̂ (8.104)
2n i=1 k
Estimar el error de la covarianza a priori como se muestra en la ecuación.

Sin embargo se sumará Qk−1 al final de la ecuación para tener en cuenta
el ruido del proceso :
1 ∑ ( (i) )( )⊤
2n
P− x̂k − x̂− −
(i)
k = k x̂k − x̂k + Qk−1 (8.105)
2n i=1
4. Luego de que las ecuaciones de de actualización de tiempo se realizan, se

implementan las ecuaciones de actualización de la medición.
(i)
Escoger puntos sigma xk como se especificó en la Ecuación (8.76),
con los cambios apropiados ya que la actual mejor estimación de la
media y covarianza de xk corresponde a x̂− −
k y Pk :
x̂k = x̂−
(i) (i)
k + x̃ i = 1, . . . , 2n
(√ )⊤
(i) −
x̃ = nPk i = 1, . . . , n
i
(8.106)
(√ )⊤
x̃(n+i) = − nP−
k i = 1, . . . , n
i
Si se desea, este paso puede omitirse. Esto es, en vez de generar nue-
vos puntos sigma se pueden reutilizar los puntos sigma que fueron
obtenidos a partir de la actualización de tiempo. Esto ahorrará es-
fuerzo computacional si se está dispuesto a sacrificar el rendimiento.
Usar la ecuación no lineal de medición h(·) para transformar los
(i)
puntos sigma en ỹk vectores (medida prevista), como se muestra
en la Ecuación (8.76):
(i) (i)
ŷk = h(x̂k , tk ) (8.107)
8.4. Filtrado de Kalman unscented 291
Continuación:
(i)
Combinar los ŷk vectores para obtener la medida prevista en el tiempo
k. Esto está basado en la Ecuación (8.80):
1 ∑ (i)
2n
ŷk = ŷ (8.108)
2n i=1 k
Estimar la covarianza de la medida prevista como se muestra en la Ecua-

ción (8.80). Sin embargo, hay que añadir Rk al final de la ecuación para
tener en cuenta el ruido de la medición:
1 ∑ ( (i) )( )⊤
2n
(i)
Py = ŷk − ŷk ŷk − ŷk + Rk (8.109)
2n i=1
Estimar la covarianza cruzada entre x̂−

k y ŷk basado en la Ecuación (8.80):
1 ∑ ( (i) )( )⊤
2n
x̂k − x̂−
(i)
Pxy = k ŷ k − ŷk (8.110)
2n i=1
La actualización de la medición del estado estimado puede realizarse

usando las ecuaciones normales del filtro de Kalman como se muestra en
la ecuación [???]:
Kk = Pxy P−1
y
−
k = x̂k + Kk (yk − ŷk )
x̂+ (8.111)
P+
k = P−
k − Kk P y K⊤
k
En este caso, el algoritmo UKF presentado anteriormente no es riguroso ya que

trata del ruido como aditivo, como se ve en las ecuaciones (8.105) y (8.109).
Para manejar esta situación, se puede aumentar el ruido en el vector de estado
como en []:
 
xk
=  vk 
(a)
xk (8.113)
wk
(a)
Entonces se puede utilizar el UKF para estimar el estado aumentado xk . El
UKF se inicializa como
 
E {x0 }
x̂0 =  0 
(a)
0
 { }  (8.114)
E (x0 − x̂0 )(x0 − x̂0 )⊤ 0 0
P0 =  Q0 0 
(a)+
0
0 0 R0
A continuación se utilizará el algoritmo UKF presentado anteriormente, ex-

cepto que se esté estimando la media aumentada y covarianza, por lo que se
eliminará Qk−1 y Rk de las ecuaciones y (8.105) y (8.109).
Ejemplo 8.3
Supóngase que se está tratando de estimar la altitud x1 , la velocidad x2 y el
coeficiente balı́stico constante x3 de un cuerpo a medida que cae hacia la tierra. Un
dispositivo de medición de magnitud está localizado a una altitud a y la magnitud
horizontal entre el dispositivo de medición y el cuerpo es M . Las ecuaciones para
este sistema son
ẋ1 = x2 + v1
x22 x3
ẋ2 = ρ0 e(−x1 /k) − g + v2
2 (8.115)
ẋ3 = w3
√
y(tk ) = M 2 + (x1 (tk ) − a)2 + wk
Como es usual, wi , es el ruido que afecta la i -ésima ecuación del proceso y w es el
ruido de la medición. ρ0 es la densidad del aire al nivel del mar, k es una constante
que define la relación entre la densidad del aire y la altitud, y g es la aceleración
debido a la gravedad. Se utilizará el sistema de ecuaciones de tiempo continuo
para simular el sistema, y se supone que se obtiene un magnitud de medidas cada
8.5. Otras transformaciones unscented 293
0.5 s. Las constantes que se usarán están dadas como
ρ0 = 2 lb − s/f t4
g = 32.2 f t/s2
k = 20.000 f t
{ 2}
E wk = 10.000 f t2 (8.116)
{ }
E vi2 (t) = 0 i = 1, 2, 3
M = 100.000 f t
a = 100.000 f t
Las condiciones iniciales del sistema y el estimador están dadas como
⊤
x0 = [300.000 −20.000 0.001]
x̂+
0 = x0
[ ] (8.117)
1.000.000 0 0
+
P0 = 0 4.000.000 0
0 0 10
Para simular el sistema se utilizó la integración rectangular con un tamaño de

paso de 1 ms, el filtro de kalman extendido, y el filtro de Kalman unscented
para 30 s. La Fig.[] muestra la altitud y la velocidad del cuerpo cayendo. Para
los primeros segundos, la velocidad es constante. Pero luego la densidad del aire
aumenta y la fricción frena la caı́da del objeto. Hacia el final de la simulación,
el objeto ha alcanzado una velocidad terminal constante cuando la aceleración
debido a la gravedad es cancelada por arrastre.
La Fig.[] muestra las magnitudes tı́picas de estimación de errores del EKF
y UKF para este sistema. Se nota que los estimados tanto de altitud como de
velocidad alcanzan el pico alrededor de los 10 s, en cuyo punto la altitud del
dispositivo de medición y el cuerpo cayendo son aproximadamente la misma,
por lo que la medición da menos información sobre la altitud y la velocidad del
cuerpo. Se observa de la Fig.[] que el UKF da consistentemente estimaciones
que son uno o dos órdenes de magnitud mejor que el EKF.
8.5. Otras transformaciones unscented

Las transformaciones unscented discutidas en la sección anterior no son las
únicas que existen. En esta sección, se discutirán algunas otras posibles trans-
formaciones. Esas otras transformaciones pueden usarse si se tiene alguna in-

formación acerca de las estadı́sticas del ruido, o si se está interesado en ahorro
computacional.
8.5.1. Transformaciones unscented generalizadas
Se ha visto que una media precisa y una covarianza aproximada para una
transformación no lineal y = h(x) se puede obtener escogiendo 2n puntos
sigma (donde n es la dimensión de x) como se da en la ecuación ,la media y
la covarianza aproximadas como se da en las ecuaciones y . Sin embargo, se
puede demostrar que el mismo orden de precisión de la estimación de la media
y la covarianza se puede conseguir mediante la elección (2n + 1) puntos sigma
x(i) como sigue
x(0) = x̄
x(i) = x̄ + x̃(i) i = 1, . . . , 2n
(√ )⊤
(8.118)
x̃(i) = (n + κ)P i = 1, . . . , n
i
(√ )⊤
x̃(n+i) = − (n + κ)P i = 1, . . . , n
i
Los coeficientes de ponderación (2n + 1) están dados como

κ
W (0) =
n+κ
1 (8.119)
W (i) = i = 1, . . . , 2n
2(n + κ)
Las aproximaciones de la media y la covarianza unscented están calculadas

como
y (i) = h(x(i) )
∑
2n
ȳu = W (i) y (i)
i=0 (8.120)
∑2n
( )( )⊤
Pu = W (i) y (i) − yu y (i) − yu
i=0
Se puede observar que si κ = 0 entonces esas definiciones se reducen a las

cantidades dadas en la sección []. Cualquier valor de κ puede utilizarse [siempre
que (n + κ) ̸= 0] y entonces dará una precisión de la estimación de la media y
la covarianza con el mismo grado de exactitud como el obtenido en la sección
[]. Sin embargo, κ puede ser utilizada para reducir los errores de orden superior
de aproximación de la media y la covarianza. Por ejemplo, si x es Gaussiano
entonces κ = 3 − n minimizará algunos de los errores en los términos de cuarto
orden en las aproximaciones de la media y la covarianza.[]
8.5.2. La transformación unscented sı́mplex

Si el esfuerzo computacional es la consideración principal, entonces se puede
elegir un número mı́nimo de puntos sigma para dar el orden de precisión de la
estimación derivada en la sección anterior. Se puede demostrar [] que si x tiene
n elementos entonces el número de puntos sigma mı́nimo que da el orden de
precisión de la estimación de la sección anterior es igual a (n + 1). Esos puntos
sigma son llamados puntos sigma sı́mplex. El siguiente algoritmo resulta en
(n + 2) puntos sigma, pero el número se puede reducir a (n + 1) eligiendo uno
de los pesos cero. El algoritmo de puntos sigma sı́mplex puede resumirse como
sigue.
Algoritmo 8.6 Puntos sigma sı́mplex

Inicialización:
1. Escoger el peso W (0) ∈ [0, 1). La escogencia de W (0) afecta sólo a los
momentos de cuarto y de orden superior del conjunto de puntos sigma[].
2. Escoger el resto de puntos sigma como sigue:

{
(i)
2−n (1 − W (0) ) i = 1, 2
W = (8.121)
2i−2 W (1) i = 3, . . . , n + 1
3. Inicializar los siguientes vectores de un elemento:

(1)
σ0 = 0
−1
σ1 = √
(1)
2W (1) (8.122)
1
σ2 = √
(1)
2W (1)
4. Expandir de forma recursiva los vectores σ realizando los siguientes pasos

para j = 2, . . . , n:
[ ]

 σ
(j−1)


0 i=0

 0

 [ ]


 σi(j−1)
(j) i = 1, . . . , j
σi = √ −1 (8.123)

 2W (j+1)

 [ ]



 0j−1

 j i=j+1
 √2W (j+1)
donde 0j es el vector columna que contiene j ceros.
5. Después de que la recursividad está completa se tienen los vectores n-

(n)
elementos σi (i = 0, . . . , n + 1). Modificar la transformación unscented
de la Ecuación (8.76) y obtener los puntos sigma para la transformación
unscented como sigue:
√ (n)
x(i) = x̄ + Pσi (i = 0, . . . , n + 1) (8.124)
En realidad se tiene (n + 2) puntos sigma en lugar de los (n + 1) puntos

sigma como se afirmó, pero si se escoge W (0)=0 entonces el punto sigma
x(0) puede ser ignorado en la transformación unscented subsiguiente. El
algoritmo del filtro de Kalman unscented en la sección[] se modifica luego
en la forma obvia basada en este conjunto mı́nimo de puntos sigma.
El problema con el UKF sı́mplex es que la relación de W (n) a W (1) es igual

a 2n−2 , donde n es la dimensión del vector de estado x. Como la dimensión del
estado se incrementa, la relación se incrementa y rápidamente puede causar
problemas numéricos. La única razón para utilizar UKF sı́mplex es el ahorro
computacional y, el ahorro computacional es un tema sólo para los problemas
de alta dimensión (en general). Esto hace el UKF sı́mplex de uso limitado y
conduce a la transformación unscented esférica que se estudiará en la siguiente
sección.
8.5.3. La transformación unscented esférica

La transformación unscented discutida en la sección [] es numéricamente esta-
ble. Sin embargo, esta requiere 2n puntos sigma y puede ser también compu-
tacionalmente costosa para algunas aplicaciones. La transformación unscented
sı́mplex discutida en la sección [] es la transformación computacional unscented
más barata pero pierde la estabilidad numérica para problemas con moderada-
mente un gran número de dimensiones. La transformación unscented esférica
fue desarrollada con el objetivo de reordenar los puntos sigma del algoritmo
sı́mplex además para obtener mejor estabilidad numérica []. Los puntos sigma
esféricos son escogidos con el siguiente algoritmo.
Algoritmo 8.7 Puntos sigma esféricos

Inicialización:
1. Escoger el peso W (0) ∈ [0, 1). La escogencia de W (0) afecta sólo a los
momentos de cuarto y de orden superior del conjunto de puntos sigma[].
2. Escoger el resto de puntos sigma como sigue:
1 − W (0)
Wi = i = 1, . . . , n + 1 (8.125)
n−1
Note que (en contraste a la transformación unscented sı́mplex) todos los
pesos son idénticos excepto para W (0) .
3. Inicializar los siguientes vectores de un elemento:

(1)
σ0 = 0
−1
σ1 = √
(1)
2W (1) (8.126)
1
σ2 = √
(1)
2W (1)
4. Expandir de forma recursiva los vectores σ realizando los siguientes pasos

para j = 2, . . . , n:
 [ (j−1) ]

 σ
 0
 i=0

 0

  

 (j−1)

 σ i
(j) √ −1  i = 1, . . . , j
σi = (8.127)


j(j+1)W (1)

  



 0 j−1

 √ j 

 j(j+1)W (1)
i=j+1
donde 0j es el vector columna que contiene j ceros.
5. Después de que la recursividad está completa se tienen los vectores n-

(n)
elementos σi (i = 0, . . . , n + 1). Como con los puntos sigma sı́mplex, en
realidad se tiene arriba (n + 2) puntos sigma, pero si se escoge W (0) =
0 entonces el punto sigma x(0) se puede ignorar en la transformación
unscented subsiguiente. Se modifica la transformación unscented de la
Ecuación (8.76) y se obtiene los puntos sigma para la transformación
unscented como sigue:
√ (n)
x(i) = x̄ + Pσi (i = 0, . . . , n + 1) (8.128)
El algoritmo del filtro de Kalman unscented en la sección[] se modifica

luego en la forma obvia basada en este conjunto de puntos sigma.
(n)
La relación del elemento más grande de σi al elemento más pequeño es
/
n 1
√ √ =n (8.129)
n(n + 1)W (1) n(n + 1)W (1)
ası́ los problemas numéricos no podrán ser tema para la transformación uns-
cented esférica.
Example : Considérese el sistema de un cuerpo cayendo como el descrito en el
ejemplo[]. Las condiciones iniciales del sistema y el estimador están dadas como
[ ]⊤
x0 = 300.000 −20.000 1/1000
[ ]⊤
0 = 303.000 −20.200 1/1010
x̂+
  (8.130)
30.000 0 0
P+0 =
 0 2.000 0 
0 0 1/10.000
Se corren 100 simulaciones Monte Carlo, cada una con un tiempo de simulación
de 60 s. El promedio de errores de estimación RMS del EKF, el estándar UKF
(seis puntos sigma), el UKF sı́mplex (cuatro puntos sigma puesto que se escogió
W (0) = 0), y el UKF espiral (cuatro puntos sigma puesto que se escogió W (0) = 0)
están dados en la tabla[]. El UKF sı́mplex funciona mejor para estimación de
altitud, con el UKF estándar no muy lejos. El UKF estándar se desempeña mejor
para la estimación de velocidad, y el UKF espiral se desempeña mejor para la
estimación del coeficiente balı́stico. El EKF es en general el de peor desempeño
de los cuatro estimadores de estado.
Tabla 8.2.: Ejemplo [] estimación de errores para el filtro de Kalman extendi-

do, el filtro de Kalman unscented estándar con 2n puntos sigma y
el filtro de Kalman unscented esférico con (n + 1) puntos sigma.
Generalmente el UKF estándar se desempeña mejor. El desempeño
y el esfuerzo computacional del UKF esférico se encuentran entre
los de el EKF y el UKF estándar
Filtro Altitud Velocidad Coeficiente balı́stico recı́proco
EKF 615 173 11.6
UKF 460 112 7.5
UKF Simplex 449 266 80.8
UKF esférico 578 142 0.4
Bibliografı́a
Athans, M. and Safonov, M., G. (1978). Robustness and computational aspects of nonlinear
stochastic estimators and regulators. IEEE Transactions on Automatic Control, AC-
23(4): 717–725.
Bellantoni, J. F. and Dodge, K. W. (1967). A square root formulation of the Kalman–
Schmidt filter. AIAA Journal, 5(7): 1309–1314.
IEEE (2012). First-hand: The unscented transform. Global History Network. URL:
http://www.ieeeghn.org/wiki/index.php/First-Hand:The_Unscented_Transform.
301
Apéndice A
Funciones matriciales
A.1. Derivada de la traza

Asúmase que F(X) es una función diferenciable de cada uno de los elementos
de X. Entonces se tiene que [?]
∂Tr(F(X))
= f ⊤ (X)
∂X
donde f (·) es la derivada escalar de F(·).
Primer Orden
∂
Tr(X) = I (A.1)
∂X
∂
Tr(XA) = A⊤ (A.2)
∂X
∂
Tr(X⊤ A) = A (A.3)
∂X
∂
Tr(AX⊤ ) = A (A.4)
∂X
∂
Tr(AXB) = A⊤ B⊤ (A.5)
∂X
303
304 Capı́tulo A. Funciones matriciales
∂
Tr(AX⊤ B) = BA (A.6)
∂X
∂
Tr(A ⊗ X) = Tr(A)I (A.7)
∂X
Segundo Orden
∂
Tr(X2 ) = 2X⊤ (A.8)
∂X
∂
Tr(X2 B) = (XB + BX)⊤ (A.9)
∂X
∂ ∂
Tr(X⊤ X) = Tr(XX⊤ ) = 2X (A.10)
∂X ∂X
∂
Tr(X BX) = BX + B⊤ X
⊤
(A.11)
∂X
∂
Tr(BXX⊤ ) = BX + B⊤ X (A.12)
∂X
∂
Tr(XX⊤ B) = BX + B⊤ X (A.13)
∂X
∂
Tr(XBX⊤ ) = XB⊤ + XB (A.14)
∂X
∂
Tr(BX⊤ X) = XB⊤ + XB (A.15)
∂X
∂
Tr(X⊤ XB) = XB⊤ + XB (A.16)
∂X
∂
Tr(AXBX) = A⊤ X⊤ B⊤ + B⊤ X⊤ A⊤ (A.17)
∂X
∂
Tr(B⊤ X⊤ CXB) = C⊤ XBB⊤ + CXBB⊤ (A.18)
∂X
∂
Tr(X⊤ BXC) = BXC + B⊤ XC⊤ (A.19)
∂X
∂ [ ]
Tr (AXB + C)(AXB + C)⊤ = 2A⊤ (AXB + C)B⊤ (A.20)
∂X
∂ ∂
Tr(X ⊗ X) = Tr(X)Tr(X) = 2Tr(X)I (A.21)
∂X ∂X
A.1. Derivada de la traza 305
Orden Superior
∂
Tr(Xk ) = k(Xk−1 )⊤ (A.22)
∂X
∂ ∑
k−1
Tr(AXk ) = (Xr AXk−r−1 )⊤ (A.23)
∂X r=0
∂ [ ⊤ ⊤ ]
Tr B X CXX⊤ CXB = CXX⊤ CXBB⊤ + C⊤ XBB⊤ X⊤ C⊤ X
∂X
+ CXBB⊤ X⊤ CX + C⊤ XX⊤ C⊤ XBB⊤
(A.24)
Otras
∂
Tr(AX−1 B) = −(X−1 BAX−1 )⊤ = −X−⊤ A⊤ B⊤ X−⊤ (A.25)
∂X
Supóngase que B y C son simétricas, entonces
∂ [ ]
Tr (X⊤ CX)−1 A = −(CX(X⊤ CX)−1 )(A + A⊤ )(X⊤ CX)−1
∂X
(A.26)
∂ [ ]
Tr (X⊤ CX)−1 X⊤ BX = −2CX(X⊤ CX)−1 X⊤ BX(X⊤ CX)−1
∂X
−1
+ 2BX(X⊤ CX) (A.27)
∂ [ ]
Tr (A + X⊤ CX)−1 X⊤ BX = −2CX(A + X⊤ CX)−1 X⊤ BX(A + X⊤ CX)−1
∂X
−1
+ 2BX(A + X⊤ CX) (A.28)
Apéndice B
Transformada delta
U na forma para describir sistemas en tiempo discreto es utilizando el ope-

rador de desplazamiento temporal q, definido por:
∆t
qxk = xk+1 (B.1)
Usando este operador, un sistema discreto lineal en espacio de estados puede

ser descrito como
qxk = Aq xk + Bq uk (B.2)
yk = C q xk (B.3)
El operador de desplazamiento temporal q definido previamente es ampliamen-

te usado para describir sistemas en tiempo discreto [Åström and Wittenmark,
1997]. No obstante, una desventaja de este operador es que no funciona su
homólogo en tiempo continuo d/dt. De forma intuitiva, se sospecha que po-
drı́a haber una mejor correspondencia entre tiempo continuo y discreto, si el
operador de desplazamiento temporal fuera reemplazado por un operador de
diferencia, el cual hace una mejor aproximación de la derivada. Con esta idea
en mente, se define el operador delta a través de la diferencia directa:
∆t q−1
δ= (B.4)
T
307
308 Capı́tulo B. Transformada delta
Ası́, la forma equivalente de la ecuación (B.1) es

xk+1 − xk
δxk = (B.5)
T
La relación entre δ y q es una función lineal simple y, por lo tanto, δ ofrece la
misma flexibilidad para modelar sistemas discretos, de la forma como q lo hace.
La elección del operador es función de la aplicación particular. Generalmente q,
lleva a expresiones más simples y enfatiza la naturaleza secuencial de las señales
muestreadas [Middleton and Goodwin, 1986, 1990]. Por otra parte, dado que
δ es una diferencia, lleva a modelos muy similares a aquellos modelados con el
operador d/dt, por lo que los resultados obtenidos en tiempo continuo, también
se pueden utilizar en aplicaciones de tiempo discreto.
Las ecuaciones en espacio de estado se pueden expresar en forma δ como
sigue:
δxk = Aδ xk + Bδ uk , (B.6)
yk = Cδ xk . (B.7)
En general la señal se encuentra planteada en forma discreta; para transfor-

marla a la forma delta se aplica la relación
q = 1 + Tδ. (B.8)
De esta forma, pueden ser establecidas las siguientes equivalencias:

Aq − I Bq
Aδ = , Bδ = , Cδ = Cq (B.9)
T T
donde Aq , Bq y Cq son las matrices en el modelo de desplazamiento temporal
dadas en (B.2) y (B.3) e I es la matriz identidad.
Aunque la forma dada en (B.9) es correcta, no es el mejor método para
evaluar el modelo delta, dado que se generan problemas asociados con el proceso
de conversión del desplazamiento temporal [Middleton and Goodwin, 1990].
Una mejor estrategia consiste en la evaluación directa de la transformada delta,
a partir de las ecuaciones en espacio de estado en tiempo continuo:
Aδ = ΛA, Bδ = ΛB, Cδ = C (B.10)

B.1. Forma delta del estimador de estado óptimo 309
donde
∫ T
1 AT A2 T2
Λ= eAτ dτ = I + + + ··· (B.11)
T 0 2! 3!
Este resultado se genera directamente a partir de la consideración de una
expansión en series de potencia de Aδ = (eAT − I)/T. Para determinar Λ
se aplican métodos tradicionales, tales como autovalores, teorema de Cayley–
Hamilton, etc. A partir de (B.10) y (B.11), se ve que hay una relación cercana
entre los modelos en el dominio delta y los modelos en el dominio del tiempo
continuo, dado que Λ → I cuando ∆t → 0.
B.1. Forma delta del estimador de estado

óptimo
La forma del estimador de estado presentada antes es la forma normalizada

con la notación del operador de desplazamiento. Sin embargo, esta forma no
es consistente con los resultados correspondientes en tiempo continuo. Usando
el operador delta, la descripción de un sistema discreto será:
δxk = Aδ xk + vδ,k (B.12)

yk = Cδ xk + wδ,k (B.13)
donde
vq
vδ = , wδ = vq (B.14)
T
De aquı́ se obtiene para las covarianzas
Qq
cov{vδ } = , Qq (B.15)
T2
cov{wδ } = Rq , Rq (B.16)
Sq
cov{vδ , wδ } = , S′ δ ; Sδ = TS′ δ (B.17)
T
Para muestreo rápido Qq , Rq son tı́picamente de orden T y 1/T, respectiva-
mente. Ası́, Qδ , Rδ son ambos del orden 1/T. Por lo tanto, para mantener
310 Capı́tulo B. Transformada delta
independencia de muestreo, es conveniente definir las densidades espectrales

Ωδ , Γδ dividiendo Qδ , Rδ por la frecuencia de muestreo fs = 1/∆t:
Qδ Qq
Ωδ , = TQδ = (B.18)
fs T
Rδ
Γδ , = TRδ = TRq (B.19)
fs
Estas relaciones pueden ser utilizadas para desarrollar las formas con operador
delta de los algoritmos del filtro de Kalman desde sus formas con funciones de
desplazamiento.
B.1.1. El filtro de Kalman con operador delta

El filtro de Kalman recursivo se genera tı́picamente en su forma de desplaza-
miento hacia atrás y puede ser representado con las siguientes ecuaciones: Las
ecuaciones de actualización son:
Kk = P− ⊤ − ⊤
−1
⊤ −1
= P+k Hk Rk
− −
k = x̂k + Kk (yk − Hk x̂k ) = estado estimado a posteriori
x̂+
− ⊤ ⊤
(B.20)
P+
= [(P−k)
−1
+ H⊤ −1
k Rk Hk ]
−1
= (I − Kk Hk )P−k
Las ecuaciones anteriores se pueden separar en dos grupos: las primeras dos,
predicen el estimado del estado y la matriz de covarianza del error desde los
valores anteriores y pueden, como tales, ser denominadas como ecuaciones de
predicción. Estas predicciones se usan para formar la ganancia de Kalman, la
cual es usada en las últimas lı́neas junto con la última muestra de salida en la
forma de una señal de innovación, para corregir las predicciones y producir un
estimado a posteriori de xk y Pk . Éstas pueden entonces, denominarse como
las ecuaciones de corrección.
Tomando la relación entre el operador delta y el operador de desplazamiento
en las descripciones de espacio de estado mostradas en (B.12) a (B.17), y
entonces sustituyéndolas en las ecuaciones (B.20), el filtro de Kalman con el
operador delta se puede construir en su forma de predicción corrección de la
B.1. Forma delta del estimador de estado óptimo 311
siguiente manera:
x̂−
k = (T δFk + I)x̂− δ
k−1 + T Gk uk−1 (B.21)
δ −
Pk = (T δFk + I)x̂− δ ⊤ 2δ
k−1 (T Fk + I) + T Qk (B.22)
δ −δ ⊤ δ − ⊤
δ
Kk = Pk Hk [ Hk δPk δHk + δRk ]−1 (B.23)
x̂+
k = x̂− δ δ −
k + Kk [yk − Hk x̂k ] (B.24)
+ −
δ
Pk = (I − δKk δHk ) δPk (B.25)
donde δX corresponde a la variable en términos del operador δ. Estas ecuaciones

proporcionan una forma incremental y de fácil implementación para el filtro
de Kalman con el operador delta o estimador de estado óptimo.
Bibliografı́a
Middleton, R. H. and Goodwin, G. C. (1986). Improved finite word length characteristics

in digital control using delta operators. IEEE AC-31, 32(11): 1015–1021.
Middleton, R. H. and Goodwin, G. C. (1990). Digital Control and Estimation: A unified
Approach. Prentice-Hall International, Inc., 1a edition.
313

Lea Dfo PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Lea Dfo PDF

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD TECNOLÓGICA DE

DISEÑO DE FILTROS ÓPTIMOS

Gloria Mercedes Valencia T., Luis Enrique Avendaño

1. Elementos de cálculo matricial 1

2. Elementos de sistemas dinámicos 45

2.6. Controlabilidad y Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 60

3. Estimación por mı́nimos cuadrados 73

4. Filtro de Kalman discreto 105

5. Formas alternas del ﬁltro de Kalman 149

6. Generalización del ﬁltro de Kalman 183

7. El ﬁltro de Kalman continuo 221

8. El ﬁltro de Kalman no lineal 255

A. Funciones matriciales 303

B. Transformada delta 307

1.1. Realimentación serie–serie. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.1. Circuito RLC para análisis de controlabilidad. . . . . . . . . . . . . . . . 63

3.1. Problema del tanque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4.1. Problema predador–presa. . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

8.1. Resultados de la simulación del ﬁltro de Kalman extendido continuo

4.1. Relaciones entre las estimaciones y las covarianzas de las secciones

6.1. Valores experimentales de la varianza del error de estimación (50 pasos de

3.1. Estimación recursiva por mı́nimos cuadrados . . . . . . . . . . . . . . . . . . 82

4.1. Filtro de Kalman discreto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.1. Algoritmo de Cholesky para raı́z cuadrada de matrices. . . . . . . . . . . . . 152

6.1. Simulación de ruido correlacionado . . . . . . . . . . . . . . . . . . . . . . . . 185

7.1. El ﬁltro de Kalman en tiempo continuo. . . . . . . . . . . . . . . . . . . . . . 230

8.1. El ﬁltro de Kalman linealizado de tiempo continuo. . . . . . . . . . . . . . . . 258

Elementos de cálculo matricial

1.2. Cálculo matricial

es un vector de 6 elementos, donde el superı́ndice ⊤ indica la transpuesta. Este vector se

ejemplo, si A es una matriz r × p

Si una matriz es simétrica entonces A = A⊤ .

Una matriz hermı́tica es aquella para la cual A = AH . Esto es equivalente a la condición

aij = aji , (1.1)

1.3. Álgebra de matrices

1.3.1. Suma de matrices

1.3.2. Multiplicación de matrices

A := (aij )m×n y B := (bij )n×p

la multiplicación de A por B, que se denota AB, es una nueva matriz C:

o en forma más compacta [Simon, 2006],[Kreyszig, 2011]:

El producto matricial AB solo está deﬁnido si el número de columnas de A es igual al

Esta matriz de sumas se puede escribir como la siguiente suma de matrices:

donde se ha utilizado la notación de que hk es la columna de orden k de H.

1.3.3. Propiedades básicas de las matrices

A(BC) = (AB)C (1.9)

3. Distributiva sobre la suma:

A(B + C) = AB + AC, (A + B)C = AC + BC (1.10)

4. Multiplicación por un escalar:

α(AB) = (αA)B y (AB)α = A(Bα) α es un escalar. (1.11)

(AB)−1 = B−1 A−1 (1.12)

(ABC · · · P)−1 = P−1 · · · C−1 B−1 A−1 (1.13)

(A⊤ )−1 = (A−1 )⊤ (1.16)

(ABC · · · P)⊤ = P⊤ · · · C⊤ B⊤ A⊤ (1.17)

Si A y B tienen elementos complejos, entonces

(AH )−1 = (A−1 )H (1.20)

donde H denota la conjugada hermı́tica de una matriz (conjugada compleja y trans-

(ABC · · · P)H = PH · · · CH BH AH (1.21)

La traza de un producto es independiente del orden de los factores:

tr(AB) = tr(BA) (1.23)

tr(ABC) = tr(BCA) = tr(CAB) (1.24)

Para una suma:

tr(A + B) = tr(A) + tr(B) (1.25)

para cualquier valor de i ∈ [1, n]. Esta se denomina expansión de Laplace de A a