Está en la página 1de 2

(CARS), “competitive adaptive reweighted sampling”, tiene el potencial de selección de una

combinación óptima de las longitudes de onda existentes en el espectro completo junto con
regresión de mínimos cuadrados parciales mediante el uso de un principio simple pero
efectivo 'supervivencia del más apto' en el que la teoría de la evolución de Darwin se basa.

CARS demuestra ser un procedimiento prometedor para construir un modelo de calibración


de alto rendimiento.

CARS no está diseñado solo para datos espectrales. Es una estrategia general y, por lo tanto,
puede usarse para la selección variable de otros tipos de datos, como genómica y
metabolómicos.

La matriz de datos X contiene m muestras en filas y p variables encolumnas El vector y con


orden m × 1 denota la propiedad medida de interés.

El superíndice T denota la transposición vectorial o matricial. Al modelar, tanto X como y están


centrados en la media. Supongamos que el número de MC carreras de muestreo de CARS se
establece en N .

Con esta configuración, CARS seleccionará secuencialmente N subconjuntos de longitudes de


onda

En pocas palabras, en cada corrida de muestreo, CARS trabaja en cuatro Pasos sucesivos:

(1) Monte Carlo para muestreo modelo.

(2) Emplear EDF para realizar la selección de longitud de onda forzada.

(3) Adoptar ARS para realizar una selección competitiva de longitudes de onda

(4) Validacion cruzadavse utiliza para evaluar el subconjunto.

Monte Carlo para muestreo modelo

Al igual que la eliminación de variables no informativas, en cada muestra de prueba corrida


con CARS, se construye un modelo PLS utilizando los seleccionando al azar muestras
(generalmente 80–90% del conjunto de calibración) no todas las muestras de prueba en el
conjunto de calibración.

Desde el punto de vista del muestreo, este proceso puede considerarse como muestreo en el
espacio modelo combinado con la estrategia de Monte Carlo. Estamos destinados a
seleccionar las variables que son de alta adaptabilidad independientemente de la variación de
las muestras de entrenamiento.

Las corridas se realizan en CARS. Como se mencionó anteriormente, La selección de longitud


de onda en CARS consta de dos pasos. En el primer paso EDF se utiliza para eliminar las
longitudes de onda que son de relativamente pequeños coeficientes de regresión absoluta por
fuerza. En el i ésimo muestreo ejecuta la relación de longitudes de onda a mantener se calcula
utilizando un EDF

EDF = exponentially decreasing function


Figura 1 ilustra un ejemplo de EDF. Como se puede ver claramente, el proceso de reducción de
la longitud de onda puede dividirse aproximadamente en dos etapas .

En la primera etapa, las longitudes de onda se eliminan rápidamente, lo que realiza una
'selección rápida', mientras que en la segunda etapa, las longitudes de oonda se reducen de
una manera muy suave, que en su lugar se llama una etapa de 'selección refinada' en nuestro
estudio.

Por lo tanto, las longitudes de onda de poca o ninguna información en un espectro completo
se puede eliminar en un paso de manera inteligente y eficiente debido a la ventaja de EDF.

Muestreo adaptativo reponderado

Después de la reducción de longitud de onda forzada basada en EDF, adaptativa el muestreo


reponderado (ARS) se emplea en CARS para eliminar más longitudes de onda inactivas de
forma competitiva. Este paso imita el principio de "supervivencia del más apto", que es la base
de Darwin.

Supongamos que tenemos cinco variables ponderadas que al ser sometido a cinco
experimentos de muestreo ponderado aleatorio con reemplazo.

En el caso 1, cada variable tiene un peso igual a 0,20 indicando que se pueden muestrear con
la misma probabilidad. El resultado ideal es que cada variable se muestrea una vez.

El caso 2 muestra varios espacios 1 y 2 tienen el mayor peso 0.30 mientras que las variables 4 y
5son de los pesos más pequeños 0.10. Por lo tanto, las variables 1 y 2 se muestrean dos veces,
mientras que la variable 3 una vez. Las variables 4 y 5 no son muestreadas por ARS y por lo
tanto eliminado. Similar al caso 2, el caso 3 demuestra que solo las variables 1 y 3 se
muestrean en las cinco muestras ponderadas experimentos de pling debido a sus pesos
dominantes, mientras que las variables2, 4 y 5 son mucho menos competitivos y, por lo tanto,
están fuera de juego porque sus pesos sonrelativamente débiles

(CARS), “competitive adaptive reweighted sampling”, tiene el potencial de selección de una


combinación óptima mediante el uso de un principio simple pero efectivo 'supervivencia del
más apto' en el que la teoría de la evolución de Darwin se basa.

CARS trabaja en cuatro Pasos sucesivos:

(1) Monte Carlo para muestreo modelo.

(2) Emplear EDF-“exponentially decreasing function” para realizar la selección de longitud de


onda forzada.

(3) Adoptar AES-“Adaptive Reweighted Sampling” para realizar una selección competitiva de
longitudes de onda

(4)Y finalmente se utiliza Validacion cruzada para evaluar el subconjunto.

También podría gustarte