Está en la página 1de 19

UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO

FACULTAD DE INGENIERÍA GEOLÓGICA, MINAS Y METALÚRGICA

ESCUELA PROFESIONAL DE INGENIERÍA METALÚRGICA

ANÁLISIS CRITICO

Presentado por:

EFRAIN TUNQUIPA CHUCHULLO

CUSCO - PERÚ

2021
1 Analisis

Las técnicas instrumentales, tales como la resonancia magnética nuclear en el dominio

del tiempo (TD-NMR) y la espectroscopía de infrarrojo cercano (NIR), se utilizan a menudo en

la industria para el control de calidad. La construcción de modelos predictivos estables basados

en estas señales, por tanto, es de gran importancia.

Cabe indicar que, para un modelo de regresión confiable, es de vital importancia

encontrar las dimensiones numéricas correctas u óptimas para el modelo.

En el enfoque clásico se usa ampliamente la validación cruzada, pero podría generar

modelos erróneos dependiendo de cómo se haga el diseño experimental. Otro factor limitante

importante para este enfoque es que requiere mucho tiempo para grandes conjuntos de datos.

La presencia de ruidos en estas señales puede enmascarar información importante y, por

lo tanto, dar problemas al construir modelos cualitativos o de predicción. Otra consecuencia

obvia del ruido es el sobreajuste del modelo en el que el ruido de las señales se incluye en el

modelo de predicción.

En caso de que los vectores sean informativos, también tendrán una forma estructurada,

mientras que los vectores no informativos serán desestructurados o "ruidosos", los Hasta ahora,

las técnicas de procesamiento de señales rara vez se han aplicado a estos vectores.

El trabajo propone la aplicación del criterio de Durbin-Watson (DW) a estos vectores,

esto con el fin de tener una medición objetiva de su estructura o comportamiento no aleatorio, y

así diferenciar variables latentes interesantes de las no interesantes, un paso importante en la

optimización del modelo. estabilidad.


2 Criterio de Durbin Watson

El criterio DW se usa generalmente en regresión para estudiar la aleatoriedad de los

residuos de regresión.

donde δxi y δxi − 1 son los residuos de puntos sucesivos en un vector y n es el número de

valores. El valor DW converge a cero si existe una fuerte correlación entre los puntos sucesivos.

Si existe una correlación débil entre los puntos sucesivos, es decir, una distribución aleatoria, el

valor DW converge a 2,0. Para n> 100, la distribución es aleatoria con un intervalo de confianza

del 95%, si DW está entre 1,7 y 2,3 . En la mayoría de los casos, si la señal adquirida por un

instrumento contiene información, las intensidades medidas entre puntos adyacentes están

altamente correlacionadas. En este caso, sería interesante caracterizar el grado de correlación

utilizando el criterio DW. Con este criterio, es posible tener una medida objetiva de la estructura

de la señal, o inversamente de un comportamiento no aleatorio de las señales.

3. Conjuntos de datos

Conjunto de datos 1: datos simulados

Se generaron cuatro vectores con 100 elementos, cada uno conteniendo una banda en

forma de Gauss, de intensidad 1.0, ubicados en 20, 40, 60 y 70, respectivamente, y con

desviaciones estándar de 10.0, 7.0, 12.0 y 11.0, respectivamente. A partir de estos cuatro

vectores, se generaron varias matrices (matrices X) (sumando las cuatro bandas). Se añadió ruido

gaussiano a niveles entre 0 y 50% a intervalos del 10% y una distribución gaussiana. La matriz

AY también se construyó usando los mismos valores aleatorios (distribuidos uniformemente

entre 0.0 y 1.0) que se usaron para las intensidades de banda en la matriz X. Estos valores, que

por lo tanto representan las intensidades de banda iniciales (ubicadas en 20, 40, 60 y 70) en la
matriz X antes de agregar el ruido, se introducen en una matriz Y de cuatro columnas, cada

columna representa la intensidad de una de las cuatro bandas utilizadas.

Fig. 1. Señal de RMN de dominio de tiempo sin procesar

típica para los diferenciales.

Conjunto de datos 2: TD-NMR de mantequilla y margarinas

El contenido de humedad de 12 mantequillas y margarinas “ligeras” y “tradicionales” se


determinó por triplicado mediante el método Karl-Fischer. Los valores oscilaron entre el 12 y el
60%. Los tubos de RMN de 10 mm de diámetro exterior se llenaron con cada esparcimiento
hasta una altura de 10 mm. Los tubos se termostatizaron a 20 ° C antes de transferirlos al aparato
de RMN. Las medidas se realizaron a 20 ° C en un aparato TD-NMR de 20MHz (QP20 +,
OXFORD INSTRUMENTS) con detección de cuadratura de fase. Para cada muestra, se adquirió
un conjunto de curvas de relajación insertando una secuencia Carr-Purcell-Meiboom-Gill
(CPMG) en una secuencia de inversión-recuperación (Inv-Rec):

Inv – Rec CPMG - RD] N

CPMG = 90◦x - τ - [{180◦y - 2τ} 3−180◦y - τ - medición] M

donde N = 20, i = 1, τ = 1ms, M = 100, RD = 3s y escaneos = 4.

Conjunto de datos 3: espectros NIR de soluciones fructoseacuas

Se prepararon por triplicado soluciones acuosas de fructosa a concentraciones de 5, 10, 20, 30,

40, 50 y 60% (masa / volumen).


Se adquirieron tres espectros de transmisión de infrarrojo cercano (NIR) para cada muestra entre

1100 y 2500 nm, con un paso de 4 nm, utilizando un Bran y

Luebbe Infralyzer 500, con la temperatura de la muestra ajustada a 25 ± 1 ° C. Usando la

ecuación. (2), el espectro de cada solución de azúcar se corrigió por densidad y molaridad, antes

de restar el espectro del agua [14] (Fig. 2):

1
espectro ajustado de fructosa= ¿( )
solución fracción mola r
−espectro de agua

Conjunto de datos 4: espectros NIR de muestras de gasolina

Se utilizaron sesenta espectros NIR de muestras de gasolina con números de octano conocidos

Fig. 2. Espectros NIR de las


soluciones de fructosa corregidos por
densidad, molaridad y sustracción de
agua
Conjunto de datos 5: espectros NIR de muestras de trigo

Este conjunto de datos se construyó a partir de espectros NIR de trigo. Contiene 100

muestras (espectros) con contenido conocido de proteína y humedad. Las muestras se

midieron usando reflectancia difusa de 1100 a 2500 nm a intervalos de 2 nm. Para este

trabajo, solo se estudió el contenido de humedad. La matriz X contenía 100 espectros

(filas) y 701 variables (columnas). El vector y contenía el contenido de humedad

especificado de 100.

Resultados y discusión

Ejemplo 1: datos simulados (conjunto de datos 1)

Para evaluar el potencial de utilizar el criterio DW como estimador del contenido de la

información en el contexto de los modelos de regresión, hemos comenzado por estudiar su

aplicabilidad a un conjunto de datos simulados. El procedimiento de regresión utilizado en

este caso fue PLS1 aplicado a una matriz de datos simulada con un nivel de ruido del 20%.

En la Fig. 5 se grafican los primeros 10 x vectores de cargas (p) dados por el

procedimiento PLS1.
Fig. 5. Primeras 10 x cargas (p) del procedimiento PLS1 para la matriz simulada con un nivel de ruido del 20% (los vectores se han

desplazado verticalmente para mayor claridad)

Fig. 6. Primeras cargas de 10 w (w) del procedimiento PLS1 para la matriz simulada con

un nivel de ruido del 20% (los vectores se han desplazado verticalmente para mayor claridad).
Fig. 7. Primeros 10 vectores b (b) del procedimiento PLS1 para la matriz simulada con un nivel de ruido

del 20% (los vectores se han desplazado verticalmente para mayor claridad)

vectores de regresión (w), y una vez más, el aumento del nivel de ruido a lo largo de las

variables latentes es evidente. Es interesante notar que el hecho de que este vector (w) sea más

ruidoso que los demás puede deberse a la influencia de la ponderación del vector y. Finalmente,

en la Fig. 7 se puede ver la representación de los primeros 10 b vectores (b), que son los que

sirven para predecir los valores de y para nuevas señales. Como puede verse aquí, su nivel de

ruido también aumenta en función de las variables latentes. El análisis de estos gráficos (Figs. 5-

7) muestra claramente que cuando se aumenta el número de variables latentes en un modelo de

regresión, hay un aumento en la relación señal / ruido.


Fig. 8. Perfiles de Durbin-Watson para los primeros 10 p vectores del 0 al 50% del nivel de ruido

Fig. 9. Perfiles de Durbin-Watson para los primeros 10 w vectores del 0 al 50% del nivel de ruido.
Fig. 10. Perfiles de Durbin-Watson para los primeros 10 vectores b del 0 al 50% del nivel de ruido.

Ejemplo 2: TD-NMR de mantequilla y margarinas (conjunto de datos 2)

Se aplicó una regresión PLS entre la matriz de señales TD-NMR adquiridas para

diferentes extensiones y el contenido de humedad de Karl-Fischer [10]. Para las primeras 10

variables latentes de la regresión PLS, se observa (Figs. 11 y 12): (a) una pérdida de estructura

en las gráficas de cargas; y (b) un aumento progresivo del nivel de "ruido".

Fig. 11. Vectores de carga (p) de las primeras 10 variables latentes (los vectores se han escalado y desplazado verticalmente para mayor
claridad).
Fig. 11. Vectores de carga (p) de las primeras 10 variables latentes (los vectores se han escalado y desplazado verticalmente para mayor
claridad).

Fig. 12. Vectores de carga (w) de las primeras 10 variables latentes (los vectores se han escalado y desplazado verticalmente para mayor
claridad).

Dado que los vectores b usados en el modelo de regresión PLS se calculan a partir de estos

vectores de carga (p y w), la inclusión de variables latentes “ruidosas” agregaría ruido al modelo,

lo que conduce a modelos predictivos sobreajustados y menos robustos. Para estas 10 primeras

variables latentes, se observa (Fig. 12) un incremento muy evidente en el criterio DW para los
vectores p, w y b, luego de la inclusión de la tercera variable latente. La evolución de los valores

de DW de los vectores p, w y b, en función del número de variables latentes incluidas en los

modelos, muestra que no fue necesario probar más de las tres o cuatro primeras variables latentes

cuando se emplearon valores cruzados. validación para encontrar el modelo óptimo. En la Tabla

2, donde la validación cruzada RMSECV (%).

Ejemplo 3: espectros NIR de soluciones de fructosolución acuosas (conjunto de datos 3)

Al hacer una PCR entre estos espectros NIR

(Fig. 2) y el contenido de fructosa, la gráfica de las cargas muestra claramente una disminución

en la relación "señal / ruido" para la variable latente posterior (Fig. 14). La gráfica DW se utilizó

para detectar objetivamente las variables latentes “ruidosas”. La figura 15 muestra la evolución

del criterio DW para los vectores de carga y los vectores b obtenidos por PCR, en función del

número de variable latente.


Fig. 13. Perfiles DW para los autovalores matriciales (X), vectores p, w y b de las primeras 10 variables latentes.
Fig. 14. Primeras 10 cargas (p) para la PCR entre los espectros NIR y la concentración de fructosa (los vectores se han escalado y desplazado
verticalmente para mayor claridad).

Fig. 15. Evolución del criterio de Durbin-Watson de los vectores de cargas (p) (primeros 50) y los vectores b (primeros 10) obtenidos por PCR.

En el caso de PCR, se puede calcular rápidamente el número máximo de componentes

principales (por medio de PCA) y luego usar los perfiles DW de cargas para elegir el número

máximo de PC para un paso de validación cruzada.

Ejemplo 4: espectros NIR de muestras de gasolinas (conjunto de datos 4)

Esta sección muestra la aplicabilidad y el rendimiento del método propuesto a un conjunto de

datos de referencia bien conocido.

Se aplicó el procedimiento de regresión PLS1 para la determinación del índice de octano basado

en los espectros NIR de la gasolina.


Fig. 16. Primeros 10 conjuntos de puntuaciones para la PCR entre los espectros NIR y la concentración de fructosa (los vectores se han escalado

y deslizando verticalmente para mayor calidad.

el aumento de ruido de los vectores b recuperados. Como se mostró anteriormente, esto es más

fácil de analizar usando el criterio DW. La gráfica de criterio DW se muestra en la Fig. 19 para

las cargas pyw y para los vectores b. El gráfico muestra claramente que después de la cuarta

variable latente hay un aumento de ruido presente en la regresión.

Fig. 17. Evolución del criterio de Durbin-Watson de los vectores de puntuaciones obtenidos por PCR.
Fig. 18. Primeros 10 b vectores de PLS1 entre los espectros NIR de gasolina y los números de octano (los vectores se han escalado y desplazado
verticalmente para mayor claridad).

Fig. 19. Evolución del criterio DW de cargas p, cargas w y vectores b obtenidos del modelo PLS1.

el enfoque “clásico” muestra que existen cuatro variables latentes, de acuerdo con los

resultados obtenidos utilizando el criterio DW. El modelo "óptimo" se destaca en la Tabla 4


junto con los valores DW para el vector b para la comparación. Es muy claro que el valor de DW

aumenta muy rápidamente entre la cuarta (0.052) y la quinta (0.150) variables latentes. Otro dato

interesante es que es más fácil detectar la transición entre la cuarta y la quinta variables latentes,

utilizando el criterio DW, que utilizando los valores RMSECV de validación cruzada. Estos

resultados muestran la ventaja de un enfoque basado únicamente en la estructura de la señal para

la determinación de la dimensionalidad del modelo.

Ejemplo 5: espectros NIR de muestras de trigo (conjunto de datos 5

En esta sección, se estudia un conjunto de datos más difícil e interesante y se muestra cómo se

podría utilizar el criterio DW para resaltar sus principales características.

Los primeros 15 vectores PLS1 b para la determinación del contenido de humedad se muestran

en la Fig. 20 (cálculos basados en la primera derivada). Está claro que para las variables de alta

latencia hay un aumento en el nivel de ruido. Los perfiles DW correspondientes y los

correspondientes a las cargas pyw se muestran en la Fig. 21.


Fig. 20. Primeros 15 vectores b de PLS1 entre los espectros NIR del trigo y el contenido de humedad (los vectores se han escalado y desplazado
verticalmente para mayor claridad).

Fig. 21. Evolución del criterio DW de cargas p, cargas w y vectores b obtenidos del modelo PLS1.

El hecho de este conjunto de datos es que los perfiles de DW para los vectores de regresión

presentan comportamientos diferentes, por lo que se discutirán de forma independiente. Un

examen detenido de la Fig. 21 muestra que para el caso de las cargas DW p (es decir, la

estructura de la señal de la matriz X) parece haber sólo tres variables latentes. Pero, dado que el

procedimiento PLS1 también usa la variabilidad del vector y (maximiza la covarianza entre X e

y), también se deben analizar las cargas wy los gráficos DW del vector b. Las gráficas de cargas

de DW muestran que el modelo podría tener tres o incluso ocho variables latentes. Se puede

observar que entre una y tres variables latentes, solo hay un pequeño aumento en el contenido de

ruido, seguido de un aumento más rápido hasta la octava variable latente.


Conclusión

Los resultados obtenidos en este trabajo muestran el potencial del criterio DW en la

caracterización objetiva del contenido de información de los vectores de regresión. Este criterio

morfológico se puede aplicar a los vectores de carga (p y w) ya los vectores b para detectar

variables latentes con bajas relaciones “señal / ruido”. Esto permitirá construir modelos de

regresión utilizando la mayor cantidad posible de información presente en las matrices,

incluyendo el menor ruido posible. Al mismo tiempo, este procedimiento permite analizar con

mayor claridad el comportamiento del modelo, ya que se tiene una medida objetiva del contenido

de información de cada dimensión del modelo. Otra ventaja de este enfoque es limitar el número

de variables latentes que se utilizarán al realizar los procedimientos de validación cruzada. Como

se ha mostrado aquí, Hay casos en los que el contenido de información (medido por DW)

asociado con cada dimensión presenta algunas variaciones (es decir, hay algunas variables de

latencia alta que parecen estar más estructuradas que las variables de latencia inferior), lo que

indica que este método también se puede aplicar para la selección.


Referencias

 DN Rutledge, AS Barros, F. Gaudard, Magn. Res. Chem.35 (1997) S13-S21.

 DN Rutledge, Analusis 25 (1) (1997) m8 – m13.

 J. Sun, J. Chemom. 10 (1996) 1–9.

 Y. Xie, JH Kalivas, Anal. Chim. Acta 348 (1997) 19-27. [5] DW Osten, J.

Chemom. 2 (1988) 39–48.

 IA Cowen, JW McNicol, Appl. Spectrosc. 39 (2) (1985) 257–266.

También podría gustarte