Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
El trabajo trata acerca de la aplicación de dos metodologías basadas en conceptos
probabilísticos al análisis de señales perturbadas con ruido de características desconocidas.
En ambos casos, el objetivo es definir parámetros que permitan detectar cambios en la
forma, periodicidad o amplitud de las señales que permitan una comparación con patrones
dados, para clasificar las señales obtenidas en grupos como funcionamiento “normal” o no de
un proceso, reconocimiento de patrones. Se trata de obtener alguna ventaja sobre los métodos
tradicionales (análisis de Fourier, por ejemplo), o una alternativa que permita aprovechar
información oculta en las señales registradas.
Uno de los enfoques se basa en el estudio de las distribuciones de amplitud de las señales.
Más allá del rango de valores de esta distribución, que depende fuertemente de las
condiciones de cada experimento, la “forma” de esta distribución habla a su vez de la “forma”
de las ondas que constituyen la señal, aspecto descuidado por las técnicas habituales de
análisis espectral. Se buscan entonces cambios en la forma de esta distribución.
El otro enfoque se basa en el concepto de “distancia entrópica”, que da una medida
probabilística de la diferencia entre las dos señales. Para esto, primero se ajusta cada señal
(centrada) a un modelo autoregresivo (AR), y luego se comparan estos modelos mediante un
coeficiente de verosimilitud. Este método, originalmente orientado a la detección de pequeños
terremotos en señales sísmicas, diferenciándolos del ruido, permite comparar una señal
obtenida con otra previamente dada, o seguir la evolución de un proceso para controlar su
apartamiento del comportamiento esperado.
Los resultados se aplicaron sobre señales de emisión acústica (SEA) producidas en
laboratorio: la evolución del desgaste de una pieza a lo largo de un proceso prolongado, con el
objetivo de detectar un umbral de tolerancia del desgaste admisible.
2
- CONICET-Actualmente en la Universidad Nacional de Rio Cuarto, Argentina.
1
- Actualmente en la Universidad de San Andrés Argentina.
3
- Actualmente en la Universidad Favaloro y Universidad Nacional de San Martín, Argentina. E-mail:
ceda@favaloro.edu.ar
- Este trabajo fue parcialmente subvencionado por la International Atomic Energy Agency, Research Contract
5987/RB
Este método se basa en los resultados obtenidos por Kannatey-Asibn y Dornfeld [4] e intenta
reconocer diferencias entre señales a través del estudio de la distribución de amplitudes.
Básicamente la distribución de amplitudes se obtiene haciendo un gráfico de las frecuencia
con que se dan las diferentes ordenadas de la señal. Se traza un conjunto de paralelas al eje x y
se cuenta el número de cruces de tales líneas. Una zona de baja pendiente de la señal
incrementará el valor de la frecuencia relativa en el intervalo correspondiente a sus ordenadas.
De este modo el “aspecto” de la curva (por ejemplo la curvatura de los extremos) se verá
reflejada en el aspecto de la distribución (Fig. 1).
En este punto aparecen dos puntos a considerar. Uno es el rango de valores de la
distribución y otro es la forma de la misma. La caracterización de texturas a través del estudio
de perfiles de superficies (problema análogo si pensamos la altura del perfil en función del
espacio como la señal en función del tiempo) ha mostrado que es en la forma de la
distribución donde aparecen los aspectos reveladores de cambios en la “forma” de las curvas.
Son los momentos de orden 3 y 4 los que están relacionados con la forma de una
distribución. Se define la asimetría (skew) como el momento normalizado de orden 3 o sea
∞
1
∫ [x − E ( x)]
3
S= f ( x )dx,
3
σ −∞
∞
1
∫ [x − E ( x )]
4
K= f ( x )dx ,
4
σ −∞
y mide la “agudeza” del trazo de la señal. Los valores se comparan con el valor de la curtosis
de la distribución de Gauss, que es 3. Un valor mayor implica, generalmente, una distribución
con un pico más agudo, o sea que la mayoría de los valores están concentrados en un rango
pequeño. Un valor menor habla de una distribución más chata.
Cuando no se conocen las distribuciones de las variables pero se dispone de datos discretos
pueden usarse estimadores. En general un estimador del momento centrado de orden r es
1 N
Mr = ∑ ( x k − x )r ,
N k =1
1 N
donde N es el número de datos y x = ∑ x k . Estimadores de la asimetría y la curtosis son
N k =1
respectivamente:
M3 M4
S= y K= .
3
M22 M 22
1
f ( x) = x a −1 (1 − x ) b−1 ,
β ( a , b)
1
donde β ( a, b) = ∫ y a −1 (1 − y ) b−1 dy .
0
a
m = E ( x) = (1)
a+b
ab
σ 2 = Var ( x ) = (2)
(a + b + 1)(a + b )2
1
2( b − a ) a + b + 1 2
Sβ =
a + b + 2 ab
Kβ =
[
3 ( a + b + 1) 2 (a − b )2 + ab (a + b + 2 )
,
]
(a + b + 2 )(a + b + 3) ab
x − x min
y= .
x max − x min
Despejando de las ecuaciones (1) y (2) y reemplazando m y σ por los estimadores antedichos
calculados en base a la variable y, se obtiene
aˆ =
(
M 1 M 1 − M 12 − M 2 )
M2
bˆ =
(
(1 − M 1 ) M 1 − M 12 − M 2
.
)
M2
De este modo, representando cada conjunto de datos por un punto en el dominio ( aˆ , bˆ) , se
podrían detectar cambios en la forma de la distribución de amplitudes correspondientes a
cambios en el aspecto de la señal debidos, a su vez, al desgaste o falla en la herramienta
actuante.
2. Distancia entrópica
2.1. Introducción
Esta sección da cuenta de los elementos para el análisis basado en el concepto de distancia
entrópica [3].
El método se basa en comparar la señal obtenida con otra preexistente, que se utiliza como
referencia. Para esto, la señales se ajustan a un modelo AR de orden p a determinar:
p
∑ a i x t −i = ε t , a 0 = 1,
i =0
C11 ... C1 p
D= . ... . ; d = (C 01 ,..., C 0 p ) t .
C p1 ... C pp
Suponemos que el modelo es asintóticamente estacionario, es decir, todas las raíces µ i del
polinomio a ( z ) = 1 + a1z + ... + ak z k satisfacen µi > 1 . Una vez identificados los parámetros
(esto es, los coeficientes ai ,1 ≤ i ≤ p, y σ t ), es posible escribir la función de probabilidad de la
muestra.
Se desea comparar una muestra de referencia {xR}, de longitud NR, con otra de “test” {xT},
de longitud NT . Ajustando ambas a un modelo del mismo orden p, es posible calcular también
la probabilidad conjunta.
Bajo la hipótesis H0 = “ambas muestras responden al mismo modelo”, se tendrán
parámetros σ p y a p y resulta la máxima probabilidad Lo,
L0 =
1
N ´ R N ´T
{
Exp − 1 ( N ´ R + N ´T .
2
}
(σˆ p 2π )
Bajo la hipótesis H1 = “las muestras responden a distintos modelos” , se tendrán dos
juegos de parámetros (σ R , a R ), (σ T , a T ) , y entonces
L1 =
1
{
Exp − 12 ( N ´ R + N ´T . }
σˆ RN ´R σˆ TN ´T ( 2π ) N ´R + N ´T
N´ N´
L0 σˆ R R σˆ T T
λ= = .
L1 σˆ pN ´R + N ´T
Al implementar este criterio, hay dos decisiones que deben tomarse: el orden de los modelos a
ajustar, y la cantidad de puntos a considerar. Para elegir el orden, se tomaron en consideración
el modelo FPE de Akaike y diversas pruebas hechas sobre distintos grupos de datos. Se
observó que, para los datos analizados, si bien el mínimo de FPE se obtiene para órdenes
relativamente altos (7 o más) su valor cae abruptamente del orden 2 al 3, y luego las
variaciones son muy pequeñas. Asimismo, las distancias calculadas con distintos órdenes de
ajuste (mayores que 3) preservan la monotonía (al menos en las muestras tomadas; no se
intentó una demostración teórica). Por esto, frente al ahorro computacional que significa,
pensando en la implementación en tiempo real, se decidió trabajar con ajustes de orden 3.
La cantidad de puntos en cada segmento a identificar es una variable de trabajo dentro del
problema. Si la señal presenta una marcada periodicidad, una vez incluidos un cierto número
de períodos la información es redundante y el modelo identificado no se altera mayormente.
En cambio, si presenta grandes variaciones, pretender un único modelo de ajuste que
contenga toda la señal resulta una pérdida de información. Por eso, los algoritmos de
segmentación descriptos más abajo detectan las variaciones cuando los modelos identificados
al tomar sólo parte de los puntos resultan diferentes. Es sin embargo un problema a explorar
la longitud óptima de los segmentos.
Se presentan aquí los resultados de aplicar estos conceptos a SEA provenientes del
desgaste de la crapodina.
En primer lugar, se buscaron variaciones dentro de la señal haciendo sucesivas
fragmentaciones “anidadas” de la misma (semejantes a un algoritmo de bisección),
comparando las distancias computadas entre los segmentos.
Las muestras provenientes del desgaste de la crapodina mostraban grandes diferencias,
evidentes a simple vista, incluso dentro del mismo grupo (las del comienzo y las del final).
Estas diferencias se detectan en las distancias calculadas, lo que es un comportamiento
deseable para permitir la automatización del sistema, si bien no permiten discriminar con
fineza los dos grupos (ver Tablas I y II; ya que las matrices son simétricas, los valores se
consignan sólo una vez).
3. Referencias
[1] André-Obbrecht, R., “On line segmentation of speech signals without prior recognition”, en Detection in
Abrupt Changes in Signals and Dynamical Systems, Ed. Basseville y Benveniste, Springer Verlag, 1986.
[2] Basseville, M., “The two-models approach for the on-line detection of changes in AR processes”, en
Detection in Abrupt Changes in Signals and Dynamical Systems, Ed. Basseville y Benveniste, Springer
Verlag, 1986.
[3] Chen, C., “On a segmentation algorthm for seismic signals”, Geoexploration, 23(1984/85)35-40.
[4] Kannatey-Asibu, E. Jr. y Dornfeld, D.A., “A study of tool wear using statistical analysis of metal- cutting
acoustic emission”, Wear, 76(1982)247-261.
[5] Whitehouse, D.J., “Beta functions for surface topology”, Ann. CIRP, 27(1978)491-497.
Tabla I: Distancias calculadas con ajustes de orden 3 tomando segmentos de 4096 puntos (los
segmentos ca y cb corresponden al comienzo del experimento y los fa, fb y fc al final.
cb fa fb fc
ca 1034.7 3389.7 2821.6 5671.1
cb 0.0 1253.1 1889.5 3572.7
fa 0.0 1209.1 1563.9
fb 0.0 3297.5
Tabla II: Distancias calculadas con ajustes de orden 3 tomando segmentos de 2048 puntos (los segmentos 1 y 2
son las dos mitades de los correspondientes en la Tabla I).
ca1 ca2 cb1 cb2 fa1 fa2 fb1 fb2 fc1
ca2 522.1 0.0
cb1 1470.3 711.8 0.0
cb2 164.9 227.1 777.9 0.0
fa1 1866.1 1839.8 731.2 1397.5 0.0
fa2 1384.2 1546.3 565.4 957.1 114.4 0.0
fb1 1434.9 1153.3 1169.3 1154.2 670.1 594.4 0.0
fb2 1502.9 1160.7 1107.0 1196.4 580.5 523.8 4.6 0.0
fc1 3311.6 2738.3 1716.4 2810.9 676.2 1166.4 1727.5 1673.9 0.0
fc2 3092.1 2601.4 1435.7 2554.4 542.4 974.1 1647.2 1574.5 35.1