Clase 04

IDENTIFICACION DE SISTEMAS
CLASE 4
Selección de la estructura y validación del

modelo
CLASE 4: Selección de la estructura y validación del modelo.............................................. 2

DE LA SELECCIÓN DE LA ESTRUCTURA DEL MODELO....................................... 2
Consideraciones a priori. ................................................................................................ 6
Análisis preliminar de los datos...................................................................................... 7
Comparación de la estructura de los modelos identificados........................................... 9
Validación del modelo.................................................................................................. 12
Comandos relevantes en Matlab................................................................................... 13
DE LA VALIDACIÓN DEL MODELO.......................................................................... 14
Validación en base a la aplicación del modelo............................................................. 15
Coherencia con el comportamiento de entrada-salida.................................................. 15
Reducción del modelo .................................................................................................. 17
Intervalos de fiabilidad de los parámetros.................................................................... 18
Simulación del modelo ................................................................................................. 19
Análisis de residuos...................................................................................................... 20
FUENTES......................................................................................................................... 23
1
CLASE 4: Selección de la estructura y validación del
modelo
La elección de una estructura apropiada (por ejemplo: ARX, ARMAX, etc.) es

un paso crucial en el camino de la identificación de sistemas dinámicos. Y
dicha elección debe estar basada tanto en el entendimiento del proceso de
identificación, como en un acabado conocimiento del sistema a identificar.
Con anterioridad hemos descripto una serie de estructuras típicas para ser
usadas en identificación, y lo que nos proponemos ahora es complementar
dichas listas con una discusión detallada acerca de cómo arribar a un modelo,
guiados tanto por el conocimiento del sistema como por el juego (set) de datos
recolectados.
Una vez que la estructura ha sido escogida, el próximo paso consiste en

seleccionar un modelo particular de dicha estructura, para luego, finalmente,
determinar un conjunto específico de parámetros para dicha estructura.
Concluido el proceso, el modelo hallado puede llegar a ser el mejor
disponible, sin embargo, más importante aún es saber a ciencia cierta si dicho
modelo es “suficientemente bueno” para nuestros propósitos.
El proceso de evaluación de un modelo para determinar si es apropiado, es

conocido como validación del modelo.
La selección del conjunto de modelos particulares en una situación dada será

el tema de la primera sección del presente capitulo. La ultima seccion estara
didrigida a la cuestión de la validación del modelo. Estos dos temas se tratan
en un capítulo en cuando exponen muchas relaciones entre si.
DE LA SELECCIÓN DE LA ESTRUCTURA DEL MODELO
En realidad, la selección de un conjunto de modelos a identificar trata de la

especificación de tres fenómenos diferentes:
2
• Selección de la estructura del modelo
Esto se refiere a la selección de la estructura que está presente en las

funciones de transferencia del modelo de la planta y del modelo del
ruido
[G(q,θ), H(q,θ)]
y sus relaciones; conduciendo a caracterizaciones como ARX, OE,

ARMAX, FIR, etcétera, tema tratado en clases anteriores.
• Selección de la complejidad del modelo.
Esto se refiere a la selección del órden de las dos funciones de

transferencia (de la planta y del ruido). Consideraciones en términos de
este problema están relacionadas con un ordenamiento de los conjuntos
de modelos:
M1 ⊂ M 2 ⊂ "
donde se parte de modelos mas pequeños a conjuntos de modelos más

grandes (de orden mas alto), y tienen que estar a disposición criterios
que asistan en la decisión de cual es el conjunto de modelos (de que
orden) mas apropiado. Como se ha mencionado, la complejidad de los
modelos es representada por los números enteros na, nb, nk, nd, nf.
• Parametrizacion del modelo.
Esto se refiere a la selección de la manera en la que estan representados

los modelos, del conjunto seleccionado, por un vector de parámetros.
Este vector de parametros es el realmente usado en los criterios para la

identificación, y en el que están basados los algoritmos de
identificación. En este curso nos hemos limitado exclusivamente a una
parametrizacion de G(q,θ) y H(q,θ) en términos de fracciones de
polinomios.
3
El objetivo último del usuario de los métodos de identificación, será el de
encontrar un buen modelo a un precio bajo. Estas nociones de calidad y precio
pueden proporcionar los criterios bajo los cuales se hace la selección
apropiada de un conjunto de modelos.
¿Cuándo un modelo es bueno?
A pesar del hecho de que la aceptación de un modelo dado dependera en

ultima instancia de su uso, puede darse una expresión general acerca de la
calidad del modelo declarando que se apunta a un modelo con “bias” pequeño
y con baja varianza. Ahora, esta expresión en sí misma refleja exigencias
contrarias.
El deseo de conseguir un “bias” pequeño motiva el uso de estructuras de

modelos grandes, flexibles (modelos de orden alto), tal que el error por “sub-
modelamiento” sea pequeño.
El deseo de una varianza pequeña, por otra parte, motiva el uso de sólo un
número limitado de parámetros desconocidos. Esta última afirmación proviene
de la propiedad de la varianza de parámetros estimados que generalmente
aumentará con el número de parámetros. Para comprender mejor esto,
piensese en lo siguiente: Se podría decir que la cantidad total de información
que está presente en una secuencia de datos es fija; cuando esta información
tiene que ser dividida sobre un juego de parámetros estimados más grande, la
información por parámetro se reduce, conduciendo a una varianza en los
parámetros mas grande.
¿Cuándo un modelo es caro?
La consideración del precio de un modelo puede distinguir dos fenómenos

diferentes.
1. El precio asociado con la identificación del modelo.
Aparentemente, estructuras de modelos que son “lineales en los

parámetros”, como el FIR y el ARX, entregan modelos estimados
4
mucho más rápido y con bastante menos esfuerzo computacional que
estructuras de modelos que requieren métodos de optimización no
lineales que identifican los parámetros en forma iterativa. La ocurrencia
de mínimos locales en la función de costo también desempeña un papel
importante a este respecto.
2. El precio asociado con la aplicación del modelo.
En dependencia del uso para el cual el modelo es identificado, pueden

haber restricciones claras en la complejidad del modelo que puede ser
manejada por la aplicación bajo estudio.
Por ejemplo, los modelos que se obtienen para ser usados en el diseño
de controladores en tiempo real para procesos con gran ancho de banda,
estan limitados en el orden del modelo por la velocidad computacional y
la capacidad del hardware y el software del controlador de tiempo real.
En el compromiso entre calidad y precio, dos aspectos, entre los más

importantes, son:
• La cuestión de la complejidad computacional de los métodos de

optimización no lineales, y la ventaja de usar esquemas de regresión
lineales.
• La capacidad de modelar la funcion de transferencia de entrada/salida

G(q,θ) independientemente del modelado de la contribución del ruido
por H(q,θ).
Ljung (1987) distingue cuatro fuentes diferentes de información, o tipos de

consideraciones, con referencia al problema de la selección de la estructura del
modelo.
• Consideraciones a priori.
• Análisis preliminar de los datos
• Comparación de diferentes estructuras de modelos
5
• Validación del modelo
Estas consideraciones seran tratadas en las siguientes subsecciones.
Consideraciones a priori.
Basados en el conocimiento de la física del proceso a modelar, podría

obtenerse información clara acerca del orden (mínimo) del modelo, necesario
para modelar el sistema con cierta precision. Cuando, bajo bases físicas, se
puede decir algo sobre el carácter de la perturbación del ruido en los datos, se
pueden también encontrar argumentos para elegir una estructura del modelo
en particular.
Por ejemplo, cuando hay razón para creer que la perturbación del ruido en los
datos medidos realmente entra en el proceso en una posición tal que contiene
la dinámica de proceso en su “color”, tenemos un buen argumento para elegir
una estructura de modelo ARMAX.
Adicionalmente, antes de ser tratado cualquier juego de datos en un algoritmo

de identificación se puede prefijar la relación entre el número de puntos de
datos (N) disponible y el número de parámetros a ser estimados (Nθ). Es obvio
que al estimar 50 parámetros sobre la base de 50 puntos de datos, la función
de costo (o de criterio) tomará un valor muy pequeño, pero los parámetros
estimados será muy poco fiables. En esta situación, no se ha conseguido
ninguna reducción de los datos. Generalmente debe cumplirse que N >> Nθ.
Una regla básica más específica que es usada a menudo es
N >10Nθ (8.1)
Pero esta relación debe ser usada con el cuidado, ya que la varianza resultante
depende, por supuesto, de la relación señal/ruido en la secuencia de los datos
medidos.
6
Análisis preliminar de los datos
La información acerca del orden del modelo también puede obtenerse del
análisis preliminar de los datos, la identificación no paramétrica y los métodos
de realización aproximada sobre la base de respuestas transientes (sobre estos
metodos ver el capítulo 4 en [Van den Hof and Bomois, 2004]).
El examen de las respuestas en frecuencia identificadas con los metodos no-

paramétricos puede proporcionar la información sobre el número de picos de
resonancia, y los desplazamientos de fase, lo que puede ser una buena base
para una estimación inicial del orden del modelo. Lo mismo es posible obtener
con los métodos de realización aproximada, los que, principalmente por una
evaluación del rango de una matriz Hankel, basada en una descomposicion en
valores singulares (SVD), proporcionan la información sobre el órden
apropiado del modelo.
Un método más específico de estimar orden del modelo (en particular de la

funcion de transferencia de la planta, G) es por la evaluación del rango de la
matriz Toeplitz1, cuyos elementos son funciones de la covariancia de la
muestra, que aparece en la estimación de parámetros de la regresión lineal en
el metodo de los minimos cuadrados.
Esta aproximacion se basa en el mecanismo siguiente.
Suponga que el sistema de generación de datos satisface:
b0 + b1q −1 + " + bnb q − nb

y (t ) = −1 − na
u ( t ) = ϕnT ( t )θ 0 (8.2)
1 + a1q + " + ana q
Con n = na = nb. Entonces, el vector de regresion ϕ n ( t ) es
ϕn ( t ) = [−y(t − 1) − y(t − 2) · · · −y(t − n) u(t) u(t − 1) · · · u(t − n)]T

1
Se dice que una matriz tiene estructura Toeplitz cuando sus elementos en cualquiera de sus diagonales son
iguales. En general, para determinar una matriz Toeplitz basta con conocer una fila y una columna. Notese
que una matriz Toeplitz puede ser simetrica o tambien triangular.
7
(8.3)
Se define
R( n ) := Eϕn ( t )ϕnT ( t )
Entonces,
1 N
R( n ) = ∑ ϕn ( t )ϕnT ( t )
ˆ
N t =1
es una matriz de estructura Toeplitz que es no singular a condición de que la

señal de entrada sea suficientemente persistente. Sin embargo, considerando
R(n+1) se sigue directamente de (8.2) que esta última matriz será singular
cuando se añade un elemento a ϕ n ( t ) que sea linealmente dependiente con los
otros elementos.
Asi, en términos generales, podemos formular una prueba sobre el orden,

evaluando el rango de R(i) incrementado los valores de í, y una vez que la
matriz se haga singular (o casi) (digamos para i = j) esto indica que el orden
del sistema debe ser (j −1).
En la práctica la matriz Toeplitz estarará formada de elementos de las

funciones de covariancia de la muestra, es decir.
1 N
R( n ) = ∑ ϕn ( t )ϕnT ( t )
ˆ (8.4)
N t =1
La prueba del rango se realiza por diferentes características, como p.ej.
σ min Rˆ( n )
det Rˆ( n ) or
σ max Rˆ( n )
8
donde σmin y σmax denotan, respectivamente, el valor singular mínimo y el
máximo de la matriz correspondiente.
Debe enfatizarse que esta prueba del orden del modelo se basa principalmente
en la disponibilidad de datos libres del ruido, que por supuesto es una
situacion bastante poco práctica.
Cuando hay presente ruido en los datos una caida exacta del rango es dificil
que ocurra, pero cuando la contribución del ruido es pequeña puede esperarse
que la prueba sea todavía válida y la matriz Toeplitz se hace “casi” singular en
caso de una sobrestimación del orden del modelo. En la situación de datos
perturbados por el ruido, la prueba del orden del modelo se convierte en una
prueba que tiene una conexión cercana con la estructura ARX. Las
estimaciones del orden del modelo que son obtenidas de esta manera pueden
ser, por lo tanto, completamente diferentes de las estimaciones del orden que
son obtenidas con otras estructuras de modelos.
Comparación de la estructura de los modelos identificados
Otra posibilidad es la de determinar la estructura y los órdenes del modelo

después de la identificación de uno o varios modelos de conjuntos de modelos
diferentes. Para una estructura dada la aproximacion más directa para
determinar el orden de los polinomios respectivos consiste en evaluar el valor
de la función de criterio
(
VN θˆN , Z N ) (8.5)
para los diferentes vectores de parámetros θˆN que han sido estimados para
selecciones diferentes de los ordenes de los modelos. Esto se muestra en la
figura 8.1 (izquierda) para una estructura ARX, donde en el eje-X los
diferentes conjuntos de modelos ARX son dibujados indicados por su número
de parámetros. Para un número dado de parámetros (na+nb+1), son posibles
varios conjuntos de modelos diferentes, dependiendo de los valores de na y
9
nb. Para los diferentes conjuntos de modelos se presenta el valor mínimo de la
función de pérdida V θˆ , Z N . N ( N )
El razonamiento aquí es que se puede esperar una disminucion considerable
( )
del valor de V θˆ , Z N hasta alcanzar el conjunto de modelos “correcto”. La
N N
eleccion de un conjunto de modelos que es demasiado grande (órdenes de los

polinomios demasiado altos), solo generara una reducción moderada de
( )
V θˆ , Z N . Por lo tanto, se busca “el codo” en la curva característica.
N N
Debe hacerse notar que en este tipo de curvas el valor de VN θˆN , Z N siempre ( )
disminuirá con el incremento del número de parámetros, debido simplemente
al hecho de que con un modelo más grande necesariamente se encuentra un
mínimo inferior de la función de criterio. Cuando se eligen unos ordenes del
modelo que son demasiado grandes (con relacion al sistema verdadero), la
libertad adicional en el modelo será usada para “sintonizar” el modelo a la
realización específica de la perturbación del ruido. Este mecanismo es llamado
overfit.
Ya que la curva de VN θˆN , Z N ( ) puede incorporar este mecanismo de overfit,

puede usarse un procedimiento alterno, basado en una separación de los datos
en dos conjuntos diferentes: una parte de los datos usada para la identificación
de θˆN , y otra parte de los datos para el cálculo de la función de criterio. Esto
significa:
Z N = Z ( )Z (
1 2)
θˆN(1) = arg min VN θ , Z (1)

θ ∈Θ
( )
( 2)
( )
1 N
VN θˆN( ) , Z ( ) = ( 2) ∑ ε 2 t ,θˆN( )
1 2
N t =1
1
( )
10
Cuando en este caso el orden del modelo en θˆN( ) ha sido elegido demasiado
1
N
1
( N
2
)
alto, causará un aumento en V θˆ( ) , Z ( ) . El ajuste hecho a la realización del
ruido específica que estaba presente en la primera parte de los datos, conducirá
ahora a un aumento de la función de criterio cuando se evalua sobre la
segunda parte de los datos. Este mecanismo, denominado validación cruzada,
se muestra en la figura 8.1 (b) donde puede observarse un leve aumento del
valor de la función para Nθ > 5.
Figura 8.1: Prueba del orden del modelo para una estructura ARX; el sistema
tiene una estructura de ARX con na = 2, nb = 3. Grafica izquierda: función de
criterio evaluada con los datos de estimación; grafica derecha: función de
criterio evaluada con los datos de validación para modelos basados en los
datos de estimación.
El principio usado en esta prueba, es que, a fin de tener en cuenta el riesgo de

overfiting, cuando se determina el conjunto más conveniente de modelos
realmente debería añadirse una “pena” a la función de criterio por aumentar la
complejidad (ordenes más altos) de los conjuntos de modelos. Formalmente
( ) (
hablando, deseariamos evaluar E ⎡VN θˆN , Z N ⎤ más que VN θˆN , Z N . El
⎣ ⎦ )
análisis de este problema ha conducido a varios de los denominados criterios
de información que se siguen para la selección del orden del modelo, siendo
los más importantes el Criterio de Información de Akaike (AIC) y el Criterio
del Error de Predicción Final de Akaike (FPE).
11
El Criterio de Información de Akaike (AIC).
Este criterio establece que debería elegirse el conjunto de modelos que logra el
valor mínimo de la expresión:
1
2
( (
log VN θˆN , Z N )) + NNθ
(8.6)
Con Nθ el número de parámetros en el conjunto de modelos.
Este criterio está basado en consideraciones de máxima-probabilidad y la

asunción de una perturbación del ruido con pdf Gausiana.
El Criterio del Error de Predicción Final de Akaike (FPE).
Este criterio propone elegir el conjunto de modelos que consigue el valor

mínimo de la expresión:
1 + Nθ N
1 − Nθ N
(
VN θˆN , Z N ) (8.7)
que es una estimación de la varianza del error de predicción que es obtenido

cuando el modelo identificado es aplicado a otro conjunto de datos distinto del
usado para la identificación.
Validación del modelo
El último método para verificar si la estructura y los órdenes del modelo han
sido elegidos apropiadamente, es validando el modelo identificado. Si al final
se piensa que el modelo identificado es aceptable, entonces, aparentemente,
fue hecha una selección apropiada del conjunto de modelos. Esta es una clara
aproximacion “a posteriori”. Si el modelo identificado no es aceptable,
12
entonces debe realizarse una selección diferente de la estructura y/o las
órdenes de los modelos. Esta aproximacion tiene el sabor de un “método por
tanteo”. Ya que no existe ningún algoritmo universalmente aplicable para la
selección del conjunto de modelos, este efecto es –hasta cierto grado–
inevitable.
Otros métodos para la validación del modelo se discuten en la siguiente

sección.
Comandos relevantes en Matlab
Elección de la estructura óptima
La elección de la estructura del modelo es una de las decisiones más

importantes y difíciles que debe tomar el diseñador. Si no se tiene ningún
conocimiento del sistema que facilite dicha elección, puede recurrirse a varias
funciones del Toolbox de Identificación que permiten calcular las funciones
de pérdidas de muchas estructuras, y escoger de entre ellas aquélla cuyo
resultado sea óptimo. Estas funciones se muestran en la siguiente tabla:
Tabla A.4. Funciones para la selección de la estructura óptima de un modelo.

Selección de la estructura del modelo
Cálculo de las funciones de pérdidas de un conjunto de
arxstruc
estructuras ARX.
ivstruc Cálculo de las funciones de pérdidas de un conjunto de
estructuras OE.
selstruc Selección de la estructura con menor función de pérdidas.
struc Generación de un conjunto de estructuras.
Ejemplo A.6
Para el ejemplo del secador de mano, obtenga la estructura que mejor ajusta el
comportamiento del sistema a un modelo ARX.
load dryer2
%tamaño de los vectores de datos u2 e y2 (deben ser iguales)
13
tam=length(u2);
%selección de primera mitad para identificar

datos_ident=[y2(1:tam/2) u2(1:tam/2)];
% y segunda mitad para validar

datos_val=[y2(tam/2+1: tam) u2(tam/2+1: tam)];
La función struc devuelve una matriz con todas las estructuras resultantes de
combinar los órdenes na, nb y nk pasados como parámetros de entrada.
nn=struc([1:10],[1:10],[1:10]);
La función arxstruc, a la cual se le pasan la matriz de datos de identificación,

la de datos de validación y la de estructuras generada anteriormente, devuelve
las funciones de pérdidas de todas las estructuras.
v=arxstruc(datos_ident,datos_val,nn);
Por último, la función selstruc selecciona de todas las estructuras aquélla que
presenta una menor función de pérdidas.
nn=selstruc(v)
cuyo resultado es nn = [10 5 2]. Por tanto, la estructura ARX óptima para los
datos del secador de mano es aquélla que tiene diez coeficientes para A(q-1), 5
para B(q-1) y dos retardos entre la entrada y la salida.
DE LA VALIDACIÓN DEL MODELO
En todo proceso de identificación es conveniente probar varios tipos y

diferentes estructuras dentro de cada tipo hasta dar con el modelo que mejor se
ajuste a los datos obtenidos experimentalmente de la planta real. En definitiva,
14
se trata de determinar cuándo un determinado modelo es lo suficientemente
exacto para la aplicación requerida, proceso que se conoce habitualmente
como validación del modelo.
En general, la mayoría de los métodos de validación tratan de determinar si la

respuesta del modelo se ajusta con suficiente exactitud a los datos de entrada-
salida obtenidos mediante experimentación. Algunos criterios típicos para
seleccionar unos modelos respecto a otros son:
• Validación en base a la aplicación del modelo

• Coherencia con el comportamiento de entrada-salida
• Reducción del modelo
• Intervalos de fiabilidad de los parámetros
• Simulacion del modelo
• Análisis de los residuos
A continuación se detallan estos criterios.
Validación en base a la aplicación del modelo
Puesto que en la práctica es imposible determinar si un modelo responde

exactamente al comportamiento del sistema real, suele ser suficiente
comprobar que el modelo es capaz de resolver el problema para el cual ha sido
hallado (simulación, predicción, diseño de un controlador, etc.). Así, por
ejemplo, si el controlador que ha sido ajustado por medio del modelo da buen
resultado sobre el sistema real, se puede asegurar que el modelo era ‘válido’
para esta aplicación.
Coherencia con el comportamiento de entrada-salida
Para determinar si el comportamiento de entrada-salida está suficientemente

caracterizado, puede ser necesario recurrir a diferentes métodos de
identificación y comparar los resultados obtenidos. Por ejemplo, comparando
los diagramas de Bode de los modelos obtenidos mediante identificación
paramétrica de diferentes estructuras, por el método de variables
15
instrumentales y por análisis espectral, se puede determinar si la dinámica del
sistema ha quedado suficientemente caracterizada.
Ejemplo 5
Compare la respuesta en frecuencia obtenida mediante identificación no

paramétrica directa del sistema de la figura con la obtenida indirectamente a
través del modelo paramétrico OE con ordenes de los polinomios [2 3 2].
de los ejemplos anteriores
numd = [0.5 – 0.3]; %numerador de la función de transferencia en z

dend = [1 0.2 0.16 0.24]; %denominador de la función de transferencia en z
%Generación de una entrada binaria pseudoaleatoria con 1000 muestras

u = idinput(1000,'PRBS',[0 0.25],[0 50]);
%Generación del ruido aleatorio, también con 1000 muestras

e = randn(1000,1);
y = y_sin+e; %Adición del ruido a la salida.
datos = [y u]; %Construcción de la matriz con los datos de entrada-salida
% Obtencion del modelo OE

th_oe = oe(datos,[2 3 2]);
g=spa(datos); % Identificación no paramétrica en el dominio de la frecuencia
g1=th2ff(th_oe); % Obtención de la respuesta en frecuencia a partir del
16
modelo OE
ffplot([g g1]); % Representación gráfica de ambas
Figura 9. Comparación de la respuesta en frecuencia obtenida mediante dos

métodos de identificación distintos.
Reducción del modelo
Un procedimiento para determinar si un modelo proporciona una descripción

simple y apropiada de un sistema consiste en aplicarle algún método de
reducción de modelos. Si una reducción en el orden del modelo no produce
alteraciones apreciables en el comportamiento de entrada-salida del mismo,
entonces el modelo original era innecesariamente complejo.
17
Ejemplo 6
Con los datos del problema 5, realice la estimación por el método de mínimos
cuadrados de un modelo OE con un parámetro más en los polinomios B y F
que los que tiene el sistema real, y realice una representación de los ceros y
polos del modelo obtenido.
th_grande = oe(datos,[3 4 2]); % Estimación de los parámetros del modelo
zp=th2zp(th_grande); % Obtención de ceros y polos del modelo resultante
zpplot(zp); % Representación del diagrama de ceros y polos
Figura 10. Diagrama de ceros y polos obtenido
La presencia de un cero y un polo que prácticamente se cancelan informa

sobre la posibilidad de reducir en uno el orden de los polinomios B y F.
Intervalos de fiabilidad de los parámetros
Otro método para determinar si el modelo bajo estudio contiene demasiados

parámetros consiste en comparar los parámetros estimados con su desviación
estándar. Si el intervalo de confianza de un parámetro es muy grande, se debe
considerar la posibilidad de eliminar dicho parámetro.
18
Ejemplo 7
Analice las desviaciones estándar del modelo obtenido en ejemplo anterior, y

compruebe que a partir de ellas también se deduce la posibilidad de reducir el
orden del modelo.
present(th_grande)
Puede comprobarse que el último parámetro de cada polinomio tiene una

desviación superior al propio parámetro, lo que informa sobre la posibilidad
de eliminar dicho parámetro.
Simulación del modelo
Un procedimiento muy habitual que puede ser considerado como otra técnica
de validación de modelos consiste en simular el modelo con un conjunto de
entradas distintas a las utilizadas para identificación, y comparar la respuesta
del modelo con la obtenida del sistema real.
Ejemplo 8
Valide mediante simulación el modelo OE de orden [2 3 2]. Para ello, aplique

la misma entrada al sistema real y al modelo, y compare las respuestas
obtenidas. Se propone como ejercicio ensayar diferentes estructuras y órdenes,
y contrastar los resultados.
u_valid = idinput(500,'PRBS',[0 0.2],[0 100]);
y_valid = dlsim(numd,dend,u_valid);
datos_valid=[y_valid u_valid];
compare(datos_valid,th_oe);
19
Análisis de residuos
Se conocen como residuos de un sistema a los errores de predicción obtenidos

según la expresión:
ε ( t ) = ε ( t ,θ ) = y ( t ) − ye ( t ,θ ) (ec.37)
siendo θ el vector de parámetros del modelo, y(t) la respuesta real del sistema
e ye ( t ,θ ) la respuesta estimada por el modelo para la misma entrada.
Idealmente, estos residuos deben ser independientes de la entrada. Si no

sucede así, significa que hay componentes en ε ( t ) que proceden de la entrada
u(t), lo cual a su vez significa que el modelo no es capaz de describir
completamente la dinámica del sistema.
Para realizar el estudio anterior, suele comprobarse la correlación entre el

error de predicción y la entrada al sistema, según la expresión:
1 N
Rε u (τ ) = ∑ ε ( t + τ ) u ( t ) (ec.38)
N t =1
El modelo será tanto más exacto cuanto más se acerquen a cero los términos
de la correlación anterior. Puede demostrarse que si ε ( t ) y u(t) son realmente
independientes, la expresión anterior (para valores grandes de N) es una
distribución normal, con media cero y varianza
1 N
Pr = ∑ Rε ( k ) Ru ( k ) (ec.39)
N k =1
donde Rε y Ru son las covarianzas de ε ( t ) y u(t) respectivamente.
20
Generalmente, Rε u (τ ) se representa en un diagrama junto con las líneas
±3 Pr . Si Rε u (τ ) sobrepasa dichas líneas para algún valor de τ , significa que
ε ( t + τ ) y u(t) probablemente no son independientes para ese valor de τ .
A la hora de examinar la función de correlación, es importante tener en cuenta

los siguientes aspectos:
• Si existe correlación para valores negativos de τ , esto indica que existe

realimentación de la salida hacia la entrada, no que el modelo sea
deficiente.
• Si la estimación de un modelo y su expresión de correlación entre

residuos y entrada Rε u (τ ) se han determinado utilizando los mismos
datos de entrada, entonces Rε u (τ ) = 0 para τ = nk, … , nk + nb – 1.
• Si Rε u (τ ) es considerablemente distinto de cero para un valor τ 0 , esto

indica que el término u ( t − τ 0 ) debería ser incluido en el modelo. Éste
es un buen método para ajustar el orden más apropiado de la estructura
del modelo.
Obviamente, el análisis de los residuos será un método de validación más

eficaz si el conjunto de datos utilizados para realizar la correlación es distinto
que el usado para la identificación del modelo.
Ejemplo 9
Realice una representación de los residuos y la correlación cruzada entre la

entrada y los residuos para determinar la validez del modelo OE de orden [2 3
2] obtenido anteriormente:
resid(datos_valid,th_oe);
21
Puesto que la correlación no se sale del margen de validez, se deduce que la
dinámica del sistema queda suficientemente caracterizada con el modelo
escogido.
Figura 11. Análisis de residuos para el modelo OE de orden [2 3 2].
Sin embargo, si se estima un modelo de orden inferior (por ejemplo, con un

parámetro menos en el polinomio F), el análisis de residuos sería el mostrado
en la figura 12.
th_red=oe(datos,[2 2 2]);
resid(datos_valid,th_red);
El pico que aparece en τ = 3 informa de la necesidad de introducir un

parámetro más al modelo, concretamente con retardo q −3 , que es el que se ha
eliminado respecto al sistema real.
22
Figura 12. Análisis de residuos para el modelo OE de orden [2 2 2].
FUENTES
• Van den Hof Paul M.J., Bombois Xavier, System Identification for
Control. Lecture Notes DISC Course. Delft Center for Systems and
Control. Delft University of Technology. March, 2004
• Escobet Teresa, Morcego Bernardo, Identificación de sistemas. Notas
de clase. Departament d'Enginyeria de Sistemes, Automàtica i
Informàtica Industrial. Escola Universitària Politècnica de Manresa.
2003
• Kunusch Cristian, Identificación de Sistemas de Dinamicos. Catedra de
Control y Servomecanismos. Universidad Nacional de La Plata,
Facultad de Ingenieria, Dpto. de Electrotecnia. 2003
23
• López Guillén, Mª Elena, Identificación de Sistemas. Aplicación al
modelado de un motor de continua. Universidad de Alcalá de Henares,
Departamento de Electrónica. Enero, 2002
24

Clase 04

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 04

Cargado por

Copyright:

Formatos disponibles

IDENTIFICACION DE SISTEMAS

Selección de la estructura y validación del

CLASE 4: Selección de la estructura y validación del modelo.............................................. 2

La elección de una estructura apropiada (por ejemplo: ARX, ARMAX, etc.) es

Una vez que la estructura ha sido escogida, el próximo paso consiste en

El proceso de evaluación de un modelo para determinar si es apropiado, es

La selección del conjunto de modelos particulares en una situación dada será

DE LA SELECCIÓN DE LA ESTRUCTURA DEL MODELO

En realidad, la selección de un conjunto de modelos a identificar trata de la

Esto se refiere a la selección de la estructura que está presente en las

y sus relaciones; conduciendo a caracterizaciones como ARX, OE,

• Selección de la complejidad del modelo.

Esto se refiere a la selección del órden de las dos funciones de

donde se parte de modelos mas pequeños a conjuntos de modelos más

• Parametrizacion del modelo.

Esto se refiere a la selección de la manera en la que estan representados

Este vector de parametros es el realmente usado en los criterios para la

¿Cuándo un modelo es bueno?

A pesar del hecho de que la aceptación de un modelo dado dependera en

El deseo de conseguir un “bias” pequeño motiva el uso de estructuras de

¿Cuándo un modelo es caro?

La consideración del precio de un modelo puede distinguir dos fenómenos

1. El precio asociado con la identificación del modelo.

Aparentemente, estructuras de modelos que son “lineales en los

2. El precio asociado con la aplicación del modelo.

En dependencia del uso para el cual el modelo es identificado, pueden

En el compromiso entre calidad y precio, dos aspectos, entre los más

• La cuestión de la complejidad computacional de los métodos de

• La capacidad de modelar la funcion de transferencia de entrada/salida

Ljung (1987) distingue cuatro fuentes diferentes de información, o tipos de

• Análisis preliminar de los datos

• Comparación de diferentes estructuras de modelos

Estas consideraciones seran tratadas en las siguientes subsecciones.

Basados en el conocimiento de la física del proceso a modelar, podría

Adicionalmente, antes de ser tratado cualquier juego de datos en un algoritmo

El examen de las respuestas en frecuencia identificadas con los metodos no-

Un método más específico de estimar orden del modelo (en particular de la

Esta aproximacion se basa en el mecanismo siguiente.

Suponga que el sistema de generación de datos satisface:

b0 + b1q −1 + " + bnb q − nb

Con n = na = nb. Entonces, el vector de regresion ϕ n ( t ) es

ϕn ( t ) = [−y(t − 1) − y(t − 2) · · · −y(t − n) u(t) u(t − 1) · · · u(t − n)]T

es una matriz de estructura Toeplitz que es no singular a condición de que la

Asi, en términos generales, podemos formular una prueba sobre el orden,

En la práctica la matriz Toeplitz estarará formada de elementos de las

La prueba del rango se realiza por diferentes características, como p.ej.

Comparación de la estructura de los modelos identificados

Otra posibilidad es la de determinar la estructura y los órdenes del modelo

eleccion de un conjunto de modelos que es demasiado grande (órdenes de los

Ya que la curva de VN θˆN , Z N ( ) puede incorporar este mecanismo de overfit,

θˆN(1) = arg min VN θ , Z (1)

El principio usado en esta prueba, es que, a fin de tener en cuenta el riesgo de

Con Nθ el número de parámetros en el conjunto de modelos.

Este criterio está basado en consideraciones de máxima-probabilidad y la

El Criterio del Error de Predicción Final de Akaike (FPE).

Este criterio propone elegir el conjunto de modelos que consigue el valor

que es una estimación de la varianza del error de predicción que es obtenido

Validación del modelo

Otros métodos para la validación del modelo se discuten en la siguiente

Comandos relevantes en Matlab

Elección de la estructura óptima

La elección de la estructura del modelo es una de las decisiones más

Tabla A.4. Funciones para la selección de la estructura óptima de un modelo.