Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CLASE 4
1
CLASE 4: Selección de la estructura y validación del
modelo
2
• Selección de la estructura del modelo
[G(q,θ), H(q,θ)]
M1 ⊂ M 2 ⊂ "
3
El objetivo último del usuario de los métodos de identificación, será el de
encontrar un buen modelo a un precio bajo. Estas nociones de calidad y precio
pueden proporcionar los criterios bajo los cuales se hace la selección
apropiada de un conjunto de modelos.
El deseo de una varianza pequeña, por otra parte, motiva el uso de sólo un
número limitado de parámetros desconocidos. Esta última afirmación proviene
de la propiedad de la varianza de parámetros estimados que generalmente
aumentará con el número de parámetros. Para comprender mejor esto,
piensese en lo siguiente: Se podría decir que la cantidad total de información
que está presente en una secuencia de datos es fija; cuando esta información
tiene que ser dividida sobre un juego de parámetros estimados más grande, la
información por parámetro se reduce, conduciendo a una varianza en los
parámetros mas grande.
4
mucho más rápido y con bastante menos esfuerzo computacional que
estructuras de modelos que requieren métodos de optimización no
lineales que identifican los parámetros en forma iterativa. La ocurrencia
de mínimos locales en la función de costo también desempeña un papel
importante a este respecto.
Por ejemplo, los modelos que se obtienen para ser usados en el diseño
de controladores en tiempo real para procesos con gran ancho de banda,
estan limitados en el orden del modelo por la velocidad computacional y
la capacidad del hardware y el software del controlador de tiempo real.
• Consideraciones a priori.
5
• Validación del modelo
Consideraciones a priori.
Por ejemplo, cuando hay razón para creer que la perturbación del ruido en los
datos medidos realmente entra en el proceso en una posición tal que contiene
la dinámica de proceso en su “color”, tenemos un buen argumento para elegir
una estructura de modelo ARMAX.
N >10Nθ (8.1)
Pero esta relación debe ser usada con el cuidado, ya que la varianza resultante
depende, por supuesto, de la relación señal/ruido en la secuencia de los datos
medidos.
6
Análisis preliminar de los datos
La información acerca del orden del modelo también puede obtenerse del
análisis preliminar de los datos, la identificación no paramétrica y los métodos
de realización aproximada sobre la base de respuestas transientes (sobre estos
metodos ver el capítulo 4 en [Van den Hof and Bomois, 2004]).
7
(8.3)
Se define
R( n ) := Eϕn ( t )ϕnT ( t )
Entonces,
1 N
R( n ) = ∑ ϕn ( t )ϕnT ( t )
ˆ
N t =1
1 N
R( n ) = ∑ ϕn ( t )ϕnT ( t )
ˆ (8.4)
N t =1
σ min Rˆ( n )
det Rˆ( n ) or
σ max Rˆ( n )
8
donde σmin y σmax denotan, respectivamente, el valor singular mínimo y el
máximo de la matriz correspondiente.
Debe enfatizarse que esta prueba del orden del modelo se basa principalmente
en la disponibilidad de datos libres del ruido, que por supuesto es una
situacion bastante poco práctica.
Cuando hay presente ruido en los datos una caida exacta del rango es dificil
que ocurra, pero cuando la contribución del ruido es pequeña puede esperarse
que la prueba sea todavía válida y la matriz Toeplitz se hace “casi” singular en
caso de una sobrestimación del orden del modelo. En la situación de datos
perturbados por el ruido, la prueba del orden del modelo se convierte en una
prueba que tiene una conexión cercana con la estructura ARX. Las
estimaciones del orden del modelo que son obtenidas de esta manera pueden
ser, por lo tanto, completamente diferentes de las estimaciones del orden que
son obtenidas con otras estructuras de modelos.
(
VN θˆN , Z N ) (8.5)
para los diferentes vectores de parámetros θˆN que han sido estimados para
selecciones diferentes de los ordenes de los modelos. Esto se muestra en la
figura 8.1 (izquierda) para una estructura ARX, donde en el eje-X los
diferentes conjuntos de modelos ARX son dibujados indicados por su número
de parámetros. Para un número dado de parámetros (na+nb+1), son posibles
varios conjuntos de modelos diferentes, dependiendo de los valores de na y
9
nb. Para los diferentes conjuntos de modelos se presenta el valor mínimo de la
función de pérdida V θˆ , Z N . N ( N )
El razonamiento aquí es que se puede esperar una disminucion considerable
( )
del valor de V θˆ , Z N hasta alcanzar el conjunto de modelos “correcto”. La
N N
Debe hacerse notar que en este tipo de curvas el valor de VN θˆN , Z N siempre ( )
disminuirá con el incremento del número de parámetros, debido simplemente
al hecho de que con un modelo más grande necesariamente se encuentra un
mínimo inferior de la función de criterio. Cuando se eligen unos ordenes del
modelo que son demasiado grandes (con relacion al sistema verdadero), la
libertad adicional en el modelo será usada para “sintonizar” el modelo a la
realización específica de la perturbación del ruido. Este mecanismo es llamado
overfit.
Z N = Z ( )Z (
1 2)
( )
1 N
VN θˆN( ) , Z ( ) = ( 2) ∑ ε 2 t ,θˆN( )
1 2
N t =1
1
( )
10
Cuando en este caso el orden del modelo en θˆN( ) ha sido elegido demasiado
1
N
1
( N
2
)
alto, causará un aumento en V θˆ( ) , Z ( ) . El ajuste hecho a la realización del
ruido específica que estaba presente en la primera parte de los datos, conducirá
ahora a un aumento de la función de criterio cuando se evalua sobre la
segunda parte de los datos. Este mecanismo, denominado validación cruzada,
se muestra en la figura 8.1 (b) donde puede observarse un leve aumento del
valor de la función para Nθ > 5.
Figura 8.1: Prueba del orden del modelo para una estructura ARX; el sistema
tiene una estructura de ARX con na = 2, nb = 3. Grafica izquierda: función de
criterio evaluada con los datos de estimación; grafica derecha: función de
criterio evaluada con los datos de validación para modelos basados en los
datos de estimación.
11
El Criterio de Información de Akaike (AIC).
Este criterio establece que debería elegirse el conjunto de modelos que logra el
valor mínimo de la expresión:
1
2
( (
log VN θˆN , Z N )) + NNθ
(8.6)
1 + Nθ N
1 − Nθ N
(
VN θˆN , Z N ) (8.7)
El último método para verificar si la estructura y los órdenes del modelo han
sido elegidos apropiadamente, es validando el modelo identificado. Si al final
se piensa que el modelo identificado es aceptable, entonces, aparentemente,
fue hecha una selección apropiada del conjunto de modelos. Esta es una clara
aproximacion “a posteriori”. Si el modelo identificado no es aceptable,
12
entonces debe realizarse una selección diferente de la estructura y/o las
órdenes de los modelos. Esta aproximacion tiene el sabor de un “método por
tanteo”. Ya que no existe ningún algoritmo universalmente aplicable para la
selección del conjunto de modelos, este efecto es –hasta cierto grado–
inevitable.
Ejemplo A.6
Para el ejemplo del secador de mano, obtenga la estructura que mejor ajusta el
comportamiento del sistema a un modelo ARX.
load dryer2
13
tam=length(u2);
La función struc devuelve una matriz con todas las estructuras resultantes de
combinar los órdenes na, nb y nk pasados como parámetros de entrada.
nn=struc([1:10],[1:10],[1:10]);
v=arxstruc(datos_ident,datos_val,nn);
Por último, la función selstruc selecciona de todas las estructuras aquélla que
presenta una menor función de pérdidas.
nn=selstruc(v)
cuyo resultado es nn = [10 5 2]. Por tanto, la estructura ARX óptima para los
datos del secador de mano es aquélla que tiene diez coeficientes para A(q-1), 5
para B(q-1) y dos retardos entre la entrada y la salida.
14
se trata de determinar cuándo un determinado modelo es lo suficientemente
exacto para la aplicación requerida, proceso que se conoce habitualmente
como validación del modelo.
15
instrumentales y por análisis espectral, se puede determinar si la dinámica del
sistema ha quedado suficientemente caracterizada.
Ejemplo 5
16
modelo OE
17
Ejemplo 6
Con los datos del problema 5, realice la estimación por el método de mínimos
cuadrados de un modelo OE con un parámetro más en los polinomios B y F
que los que tiene el sistema real, y realice una representación de los ceros y
polos del modelo obtenido.
18
Ejemplo 7
present(th_grande)
Un procedimiento muy habitual que puede ser considerado como otra técnica
de validación de modelos consiste en simular el modelo con un conjunto de
entradas distintas a las utilizadas para identificación, y comparar la respuesta
del modelo con la obtenida del sistema real.
Ejemplo 8
y_valid = dlsim(numd,dend,u_valid);
datos_valid=[y_valid u_valid];
compare(datos_valid,th_oe);
19
Análisis de residuos
ε ( t ) = ε ( t ,θ ) = y ( t ) − ye ( t ,θ ) (ec.37)
siendo θ el vector de parámetros del modelo, y(t) la respuesta real del sistema
e ye ( t ,θ ) la respuesta estimada por el modelo para la misma entrada.
1 N
Rε u (τ ) = ∑ ε ( t + τ ) u ( t ) (ec.38)
N t =1
El modelo será tanto más exacto cuanto más se acerquen a cero los términos
de la correlación anterior. Puede demostrarse que si ε ( t ) y u(t) son realmente
independientes, la expresión anterior (para valores grandes de N) es una
distribución normal, con media cero y varianza
1 N
Pr = ∑ Rε ( k ) Ru ( k ) (ec.39)
N k =1
20
Generalmente, Rε u (τ ) se representa en un diagrama junto con las líneas
±3 Pr . Si Rε u (τ ) sobrepasa dichas líneas para algún valor de τ , significa que
ε ( t + τ ) y u(t) probablemente no son independientes para ese valor de τ .
Ejemplo 9
resid(datos_valid,th_oe);
21
Puesto que la correlación no se sale del margen de validez, se deduce que la
dinámica del sistema queda suficientemente caracterizada con el modelo
escogido.
th_red=oe(datos,[2 2 2]);
resid(datos_valid,th_red);
22
Figura 12. Análisis de residuos para el modelo OE de orden [2 2 2].
FUENTES
• Van den Hof Paul M.J., Bombois Xavier, System Identification for
Control. Lecture Notes DISC Course. Delft Center for Systems and
Control. Delft University of Technology. March, 2004
• Escobet Teresa, Morcego Bernardo, Identificación de sistemas. Notas
de clase. Departament d'Enginyeria de Sistemes, Automàtica i
Informàtica Industrial. Escola Universitària Politècnica de Manresa.
2003
• Kunusch Cristian, Identificación de Sistemas de Dinamicos. Catedra de
Control y Servomecanismos. Universidad Nacional de La Plata,
Facultad de Ingenieria, Dpto. de Electrotecnia. 2003
23
• López Guillén, Mª Elena, Identificación de Sistemas. Aplicación al
modelado de un motor de continua. Universidad de Alcalá de Henares,
Departamento de Electrónica. Enero, 2002
24