Analisis Critico

UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO
FACULTAD DE INGENIERÍA GEOLÓGICA, MINAS Y METALÚRGICA
ESCUELA PROFESIONAL DE INGENIERÍA METALÚRGICA
ANÁLISIS CRITICO
Presentado por:
EFRAIN TUNQUIPA CHUCHULLO
CUSCO - PERÚ
2021
1 Analisis
Las técnicas instrumentales, tales como la resonancia magnética nuclear en el dominio
del tiempo (TD-NMR) y la espectroscopía de infrarrojo cercano (NIR), se utilizan a menudo en
la industria para el control de calidad. La construcción de modelos predictivos estables basados
en estas señales, por tanto, es de gran importancia.
Cabe indicar que, para un modelo de regresión confiable, es de vital importancia
encontrar las dimensiones numéricas correctas u óptimas para el modelo.
En el enfoque clásico se usa ampliamente la validación cruzada, pero podría generar
modelos erróneos dependiendo de cómo se haga el diseño experimental. Otro factor limitante
importante para este enfoque es que requiere mucho tiempo para grandes conjuntos de datos.
La presencia de ruidos en estas señales puede enmascarar información importante y, por
lo tanto, dar problemas al construir modelos cualitativos o de predicción. Otra consecuencia
obvia del ruido es el sobreajuste del modelo en el que el ruido de las señales se incluye en el
modelo de predicción.
En caso de que los vectores sean informativos, también tendrán una forma estructurada,
mientras que los vectores no informativos serán desestructurados o "ruidosos", los Hasta ahora,
las técnicas de procesamiento de señales rara vez se han aplicado a estos vectores.
El trabajo propone la aplicación del criterio de Durbin-Watson (DW) a estos vectores,
esto con el fin de tener una medición objetiva de su estructura o comportamiento no aleatorio, y
así diferenciar variables latentes interesantes de las no interesantes, un paso importante en la
optimización del modelo. estabilidad.

2 Criterio de Durbin Watson
El criterio DW se usa generalmente en regresión para estudiar la aleatoriedad de los
residuos de regresión.
donde δxi y δxi − 1 son los residuos de puntos sucesivos en un vector y n es el número de
valores. El valor DW converge a cero si existe una fuerte correlación entre los puntos sucesivos.
Si existe una correlación débil entre los puntos sucesivos, es decir, una distribución aleatoria, el
valor DW converge a 2,0. Para n> 100, la distribución es aleatoria con un intervalo de confianza
del 95%, si DW está entre 1,7 y 2,3 . En la mayoría de los casos, si la señal adquirida por un
instrumento contiene información, las intensidades medidas entre puntos adyacentes están
altamente correlacionadas. En este caso, sería interesante caracterizar el grado de correlación
utilizando el criterio DW. Con este criterio, es posible tener una medida objetiva de la estructura
de la señal, o inversamente de un comportamiento no aleatorio de las señales.
3. Conjuntos de datos
Conjunto de datos 1: datos simulados
Se generaron cuatro vectores con 100 elementos, cada uno conteniendo una banda en
forma de Gauss, de intensidad 1.0, ubicados en 20, 40, 60 y 70, respectivamente, y con
desviaciones estándar de 10.0, 7.0, 12.0 y 11.0, respectivamente. A partir de estos cuatro
vectores, se generaron varias matrices (matrices X) (sumando las cuatro bandas). Se añadió ruido
gaussiano a niveles entre 0 y 50% a intervalos del 10% y una distribución gaussiana. La matriz
AY también se construyó usando los mismos valores aleatorios (distribuidos uniformemente
entre 0.0 y 1.0) que se usaron para las intensidades de banda en la matriz X. Estos valores, que
por lo tanto representan las intensidades de banda iniciales (ubicadas en 20, 40, 60 y 70) en la
matriz X antes de agregar el ruido, se introducen en una matriz Y de cuatro columnas, cada
columna representa la intensidad de una de las cuatro bandas utilizadas.
Fig. 1. Señal de RMN de dominio de tiempo sin procesar
típica para los diferenciales.
Conjunto de datos 2: TD-NMR de mantequilla y margarinas
El contenido de humedad de 12 mantequillas y margarinas “ligeras” y “tradicionales” se

determinó por triplicado mediante el método Karl-Fischer. Los valores oscilaron entre el 12 y el
60%. Los tubos de RMN de 10 mm de diámetro exterior se llenaron con cada esparcimiento
hasta una altura de 10 mm. Los tubos se termostatizaron a 20 ° C antes de transferirlos al aparato
de RMN. Las medidas se realizaron a 20 ° C en un aparato TD-NMR de 20MHz (QP20 +,
OXFORD INSTRUMENTS) con detección de cuadratura de fase. Para cada muestra, se adquirió
un conjunto de curvas de relajación insertando una secuencia Carr-Purcell-Meiboom-Gill
(CPMG) en una secuencia de inversión-recuperación (Inv-Rec):
Inv – Rec CPMG - RD] N
CPMG = 90◦x - τ - [{180◦y - 2τ} 3−180◦y - τ - medición] M
donde N = 20, i = 1, τ = 1ms, M = 100, RD = 3s y escaneos = 4.
Conjunto de datos 3: espectros NIR de soluciones fructoseacuas
Se prepararon por triplicado soluciones acuosas de fructosa a concentraciones de 5, 10, 20, 30,
40, 50 y 60% (masa / volumen).

Se adquirieron tres espectros de transmisión de infrarrojo cercano (NIR) para cada muestra entre
1100 y 2500 nm, con un paso de 4 nm, utilizando un Bran y
Luebbe Infralyzer 500, con la temperatura de la muestra ajustada a 25 ± 1 ° C. Usando la
ecuación. (2), el espectro de cada solución de azúcar se corrigió por densidad y molaridad, antes
de restar el espectro del agua [14] (Fig. 2):
1
espectro ajustado de fructosa= ¿( )
solución fracción mola r
−espectro de agua
Conjunto de datos 4: espectros NIR de muestras de gasolina
Se utilizaron sesenta espectros NIR de muestras de gasolina con números de octano conocidos
Fig. 2. Espectros NIR de las

soluciones de fructosa corregidos por
densidad, molaridad y sustracción de
agua
Conjunto de datos 5: espectros NIR de muestras de trigo
Este conjunto de datos se construyó a partir de espectros NIR de trigo. Contiene 100
muestras (espectros) con contenido conocido de proteína y humedad. Las muestras se
midieron usando reflectancia difusa de 1100 a 2500 nm a intervalos de 2 nm. Para este
trabajo, solo se estudió el contenido de humedad. La matriz X contenía 100 espectros
(filas) y 701 variables (columnas). El vector y contenía el contenido de humedad
especificado de 100.
Resultados y discusión
Ejemplo 1: datos simulados (conjunto de datos 1)
Para evaluar el potencial de utilizar el criterio DW como estimador del contenido de la
información en el contexto de los modelos de regresión, hemos comenzado por estudiar su
aplicabilidad a un conjunto de datos simulados. El procedimiento de regresión utilizado en
este caso fue PLS1 aplicado a una matriz de datos simulada con un nivel de ruido del 20%.
En la Fig. 5 se grafican los primeros 10 x vectores de cargas (p) dados por el
procedimiento PLS1.
Fig. 5. Primeras 10 x cargas (p) del procedimiento PLS1 para la matriz simulada con un nivel de ruido del 20% (los vectores se han
desplazado verticalmente para mayor claridad)
Fig. 6. Primeras cargas de 10 w (w) del procedimiento PLS1 para la matriz simulada con
un nivel de ruido del 20% (los vectores se han desplazado verticalmente para mayor claridad).
Fig. 7. Primeros 10 vectores b (b) del procedimiento PLS1 para la matriz simulada con un nivel de ruido
del 20% (los vectores se han desplazado verticalmente para mayor claridad)
vectores de regresión (w), y una vez más, el aumento del nivel de ruido a lo largo de las
variables latentes es evidente. Es interesante notar que el hecho de que este vector (w) sea más
ruidoso que los demás puede deberse a la influencia de la ponderación del vector y. Finalmente,
en la Fig. 7 se puede ver la representación de los primeros 10 b vectores (b), que son los que
sirven para predecir los valores de y para nuevas señales. Como puede verse aquí, su nivel de
ruido también aumenta en función de las variables latentes. El análisis de estos gráficos (Figs. 5-
7) muestra claramente que cuando se aumenta el número de variables latentes en un modelo de
regresión, hay un aumento en la relación señal / ruido.

Fig. 8. Perfiles de Durbin-Watson para los primeros 10 p vectores del 0 al 50% del nivel de ruido
Fig. 9. Perfiles de Durbin-Watson para los primeros 10 w vectores del 0 al 50% del nivel de ruido.
Fig. 10. Perfiles de Durbin-Watson para los primeros 10 vectores b del 0 al 50% del nivel de ruido.
Ejemplo 2: TD-NMR de mantequilla y margarinas (conjunto de datos 2)
Se aplicó una regresión PLS entre la matriz de señales TD-NMR adquiridas para
diferentes extensiones y el contenido de humedad de Karl-Fischer [10]. Para las primeras 10
variables latentes de la regresión PLS, se observa (Figs. 11 y 12): (a) una pérdida de estructura
en las gráficas de cargas; y (b) un aumento progresivo del nivel de "ruido".
Fig. 11. Vectores de carga (p) de las primeras 10 variables latentes (los vectores se han escalado y desplazado verticalmente para mayor
claridad).
Fig. 11. Vectores de carga (p) de las primeras 10 variables latentes (los vectores se han escalado y desplazado verticalmente para mayor
claridad).
Fig. 12. Vectores de carga (w) de las primeras 10 variables latentes (los vectores se han escalado y desplazado verticalmente para mayor
claridad).
Dado que los vectores b usados en el modelo de regresión PLS se calculan a partir de estos
vectores de carga (p y w), la inclusión de variables latentes “ruidosas” agregaría ruido al modelo,
lo que conduce a modelos predictivos sobreajustados y menos robustos. Para estas 10 primeras
variables latentes, se observa (Fig. 12) un incremento muy evidente en el criterio DW para los
vectores p, w y b, luego de la inclusión de la tercera variable latente. La evolución de los valores
de DW de los vectores p, w y b, en función del número de variables latentes incluidas en los
modelos, muestra que no fue necesario probar más de las tres o cuatro primeras variables latentes
cuando se emplearon valores cruzados. validación para encontrar el modelo óptimo. En la Tabla
2, donde la validación cruzada RMSECV (%).
Ejemplo 3: espectros NIR de soluciones de fructosolución acuosas (conjunto de datos 3)
Al hacer una PCR entre estos espectros NIR
(Fig. 2) y el contenido de fructosa, la gráfica de las cargas muestra claramente una disminución
en la relación "señal / ruido" para la variable latente posterior (Fig. 14). La gráfica DW se utilizó
para detectar objetivamente las variables latentes “ruidosas”. La figura 15 muestra la evolución
del criterio DW para los vectores de carga y los vectores b obtenidos por PCR, en función del
número de variable latente.

Fig. 13. Perfiles DW para los autovalores matriciales (X), vectores p, w y b de las primeras 10 variables latentes.
Fig. 14. Primeras 10 cargas (p) para la PCR entre los espectros NIR y la concentración de fructosa (los vectores se han escalado y desplazado
verticalmente para mayor claridad).
Fig. 15. Evolución del criterio de Durbin-Watson de los vectores de cargas (p) (primeros 50) y los vectores b (primeros 10) obtenidos por PCR.
En el caso de PCR, se puede calcular rápidamente el número máximo de componentes
principales (por medio de PCA) y luego usar los perfiles DW de cargas para elegir el número
máximo de PC para un paso de validación cruzada.
Ejemplo 4: espectros NIR de muestras de gasolinas (conjunto de datos 4)
Esta sección muestra la aplicabilidad y el rendimiento del método propuesto a un conjunto de
datos de referencia bien conocido.
Se aplicó el procedimiento de regresión PLS1 para la determinación del índice de octano basado
en los espectros NIR de la gasolina.

Fig. 16. Primeros 10 conjuntos de puntuaciones para la PCR entre los espectros NIR y la concentración de fructosa (los vectores se han escalado
y deslizando verticalmente para mayor calidad.
el aumento de ruido de los vectores b recuperados. Como se mostró anteriormente, esto es más
fácil de analizar usando el criterio DW. La gráfica de criterio DW se muestra en la Fig. 19 para
las cargas pyw y para los vectores b. El gráfico muestra claramente que después de la cuarta
variable latente hay un aumento de ruido presente en la regresión.
Fig. 17. Evolución del criterio de Durbin-Watson de los vectores de puntuaciones obtenidos por PCR.
Fig. 18. Primeros 10 b vectores de PLS1 entre los espectros NIR de gasolina y los números de octano (los vectores se han escalado y desplazado
Fig. 19. Evolución del criterio DW de cargas p, cargas w y vectores b obtenidos del modelo PLS1.
el enfoque “clásico” muestra que existen cuatro variables latentes, de acuerdo con los
resultados obtenidos utilizando el criterio DW. El modelo "óptimo" se destaca en la Tabla 4

junto con los valores DW para el vector b para la comparación. Es muy claro que el valor de DW
aumenta muy rápidamente entre la cuarta (0.052) y la quinta (0.150) variables latentes. Otro dato
interesante es que es más fácil detectar la transición entre la cuarta y la quinta variables latentes,
utilizando el criterio DW, que utilizando los valores RMSECV de validación cruzada. Estos
resultados muestran la ventaja de un enfoque basado únicamente en la estructura de la señal para
la determinación de la dimensionalidad del modelo.
Ejemplo 5: espectros NIR de muestras de trigo (conjunto de datos 5
En esta sección, se estudia un conjunto de datos más difícil e interesante y se muestra cómo se
podría utilizar el criterio DW para resaltar sus principales características.
Los primeros 15 vectores PLS1 b para la determinación del contenido de humedad se muestran
en la Fig. 20 (cálculos basados en la primera derivada). Está claro que para las variables de alta
latencia hay un aumento en el nivel de ruido. Los perfiles DW correspondientes y los
correspondientes a las cargas pyw se muestran en la Fig. 21.

Fig. 20. Primeros 15 vectores b de PLS1 entre los espectros NIR del trigo y el contenido de humedad (los vectores se han escalado y desplazado
Fig. 21. Evolución del criterio DW de cargas p, cargas w y vectores b obtenidos del modelo PLS1.
El hecho de este conjunto de datos es que los perfiles de DW para los vectores de regresión
presentan comportamientos diferentes, por lo que se discutirán de forma independiente. Un
examen detenido de la Fig. 21 muestra que para el caso de las cargas DW p (es decir, la
estructura de la señal de la matriz X) parece haber sólo tres variables latentes. Pero, dado que el
procedimiento PLS1 también usa la variabilidad del vector y (maximiza la covarianza entre X e
y), también se deben analizar las cargas wy los gráficos DW del vector b. Las gráficas de cargas
de DW muestran que el modelo podría tener tres o incluso ocho variables latentes. Se puede
observar que entre una y tres variables latentes, solo hay un pequeño aumento en el contenido de
ruido, seguido de un aumento más rápido hasta la octava variable latente.

Conclusión
Los resultados obtenidos en este trabajo muestran el potencial del criterio DW en la
caracterización objetiva del contenido de información de los vectores de regresión. Este criterio
morfológico se puede aplicar a los vectores de carga (p y w) ya los vectores b para detectar
variables latentes con bajas relaciones “señal / ruido”. Esto permitirá construir modelos de
regresión utilizando la mayor cantidad posible de información presente en las matrices,
incluyendo el menor ruido posible. Al mismo tiempo, este procedimiento permite analizar con
mayor claridad el comportamiento del modelo, ya que se tiene una medida objetiva del contenido
de información de cada dimensión del modelo. Otra ventaja de este enfoque es limitar el número
de variables latentes que se utilizarán al realizar los procedimientos de validación cruzada. Como
se ha mostrado aquí, Hay casos en los que el contenido de información (medido por DW)
asociado con cada dimensión presenta algunas variaciones (es decir, hay algunas variables de
latencia alta que parecen estar más estructuradas que las variables de latencia inferior), lo que
indica que este método también se puede aplicar para la selección.

Referencias
 DN Rutledge, AS Barros, F. Gaudard, Magn. Res. Chem.35 (1997) S13-S21.
 DN Rutledge, Analusis 25 (1) (1997) m8 – m13.
 J. Sun, J. Chemom. 10 (1996) 1–9.
 Y. Xie, JH Kalivas, Anal. Chim. Acta 348 (1997) 19-27. [5] DW Osten, J.
Chemom. 2 (1988) 39–48.
 IA Cowen, JW McNicol, Appl. Spectrosc. 39 (2) (1985) 257–266.

Analisis Critico

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Analisis Critico

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO

FACULTAD DE INGENIERÍA GEOLÓGICA, MINAS Y METALÚRGICA

ESCUELA PROFESIONAL DE INGENIERÍA METALÚRGICA

EFRAIN TUNQUIPA CHUCHULLO

Las técnicas instrumentales, tales como la resonancia magnética nuclear en el dominio

del tiempo (TD-NMR) y la espectroscopía de infrarrojo cercano (NIR), se utilizan a menudo en

la industria para el control de calidad. La construcción de modelos predictivos estables basados

en estas señales, por tanto, es de gran importancia.

Cabe indicar que, para un modelo de regresión confiable, es de vital importancia

encontrar las dimensiones numéricas correctas u óptimas para el modelo.

En el enfoque clásico se usa ampliamente la validación cruzada, pero podría generar

La presencia de ruidos en estas señales puede enmascarar información importante y, por

lo tanto, dar problemas al construir modelos cualitativos o de predicción. Otra consecuencia

El trabajo propone la aplicación del criterio de Durbin-Watson (DW) a estos vectores,

así diferenciar variables latentes interesantes de las no interesantes, un paso importante en la

optimización del modelo. estabilidad.

El criterio DW se usa generalmente en regresión para estudiar la aleatoriedad de los

altamente correlacionadas. En este caso, sería interesante caracterizar el grado de correlación

de la señal, o inversamente de un comportamiento no aleatorio de las señales.

Conjunto de datos 1: datos simulados

AY también se construyó usando los mismos valores aleatorios (distribuidos uniformemente

columna representa la intensidad de una de las cuatro bandas utilizadas.

Fig. 1. Señal de RMN de dominio de tiempo sin procesar

típica para los diferenciales.

Conjunto de datos 2: TD-NMR de mantequilla y margarinas

El contenido de humedad de 12 mantequillas y margarinas “ligeras” y “tradicionales” se

Inv – Rec CPMG - RD] N

CPMG = 90◦x - τ - [{180◦y - 2τ} 3−180◦y - τ - medición] M

donde N = 20, i = 1, τ = 1ms, M = 100, RD = 3s y escaneos = 4.

Conjunto de datos 3: espectros NIR de soluciones fructoseacuas

40, 50 y 60% (masa / volumen).

1100 y 2500 nm, con un paso de 4 nm, utilizando un Bran y

Luebbe Infralyzer 500, con la temperatura de la muestra ajustada a 25 ± 1 ° C. Usando la

de restar el espectro del agua [14] (Fig. 2):

Conjunto de datos 4: espectros NIR de muestras de gasolina

Fig. 2. Espectros NIR de las

muestras (espectros) con contenido conocido de proteína y humedad. Las muestras se

trabajo, solo se estudió el contenido de humedad. La matriz X contenía 100 espectros

(filas) y 701 variables (columnas). El vector y contenía el contenido de humedad

Ejemplo 1: datos simulados (conjunto de datos 1)

Para evaluar el potencial de utilizar el criterio DW como estimador del contenido de la

información en el contexto de los modelos de regresión, hemos comenzado por estudiar su

aplicabilidad a un conjunto de datos simulados. El procedimiento de regresión utilizado en

En la Fig. 5 se grafican los primeros 10 x vectores de cargas (p) dados por el

desplazado verticalmente para mayor claridad)

7) muestra claramente que cuando se aumenta el número de variables latentes en un modelo de

regresión, hay un aumento en la relación señal / ruido.

Ejemplo 2: TD-NMR de mantequilla y margarinas (conjunto de datos 2)

diferentes extensiones y el contenido de humedad de Karl-Fischer [10]. Para las primeras 10

en las gráficas de cargas; y (b) un aumento progresivo del nivel de "ruido".

de DW de los vectores p, w y b, en función del número de variables latentes incluidas en los

2, donde la validación cruzada RMSECV (%).

Ejemplo 3: espectros NIR de soluciones de fructosolución acuosas (conjunto de datos 3)

Al hacer una PCR entre estos espectros NIR

número de variable latente.

En el caso de PCR, se puede calcular rápidamente el número máximo de componentes

máximo de PC para un paso de validación cruzada.

Ejemplo 4: espectros NIR de muestras de gasolinas (conjunto de datos 4)

Esta sección muestra la aplicabilidad y el rendimiento del método propuesto a un conjunto de

datos de referencia bien conocido.

en los espectros NIR de la gasolina.

y deslizando verticalmente para mayor calidad.

variable latente hay un aumento de ruido presente en la regresión.