Está en la página 1de 40

Representative process sampling — in

practice: Variographic analysis and


estimation of total sampling errors (TSE)
Muestreo representativo del proceso: en la
práctica: análisis variográfico y estimación
de los errores de muestreo total (EET)
Resumen
Los conjuntos de datos didácticos que representan una variedad de procesos del
mundo real se utilizan para ilustrar "cómo hacer" el proceso representativo de
muestreo y caracterización de procesos. Los datos de proceso seleccionados
conducen a diversas expresiones de variograma con diferentes sistemáticas (sin
rango vs. rangos importantes; tendencias y / o periodicidad; diferentes efectos
de pepita y variaciones de proceso que van desde menos de un retraso hasta el
retraso total de variograma). El análisis de datos de variogramas conduce a una
descomposición fundamental en muestreo 0-D versus varianzas de proceso 1-D,
basado en los tres parámetros principales del variograma: rango, efecto de
umbral y nugget. La influencia en el variograma de tendencias significativas y
valores atípicos en la serie de datos original recibe atención especial, debido a
sus efectos adversos críticos. Destacamos la interpretación dependiente del
problemadel análisis variográfico sobre los antecedentes dependientes del
problema para las periodicidades y tendencias. Todos los casos presentados de
variografía resolvieron los problemas iniciales o sirvieron para comprender las
razones y causas detrás de las estructuras de proceso específicas reveladas en
los variogramas. Las tecnologías analíticas de proceso (PAT) no están completas
sin el proceso TOS.

Palabras clave
Muestreo representativo del proceso

Variografía

Teoría del muestreo (TOS)

Estimación de EET

Desarrollo de protocolo de muestreo


Estructura de datos de proceso

Interpretación del proceso

1 . Introducción
La Teoría del muestreo (TOS) se ha introducido en la quimiometría, la química
analítica y las tecnologías de proceso por un esfuerzo escandinavo reciente y dedicado,
basado en referencias TOS clásicas [1] , [2] , [3] , [4] , [5] , [6] . TOS presenta una
metodología completa para evaluar el error de muestreo total asociado tanto con el
muestreo estático (denominado 0-D) como con el muestreo de proceso (muestreo 1-
D). Aquí nos centramos en los aspectos prácticos del muestreo de procesos,
especialmente a la luz del enfoque actual en PAT: Tecnologías analíticas de
procesos. Nuestro objetivo es demostrar que TOS forma el eslabón perdido para PAT,
es decir, que PAT es seriamente negligente sin tener en cuenta el muestreo
representativo del proceso.
La representatividad de muestreo siempre estará fuertemente acoplada a los tipos de
proceso y producto, porque cada proceso / producto posee una característica intrínseca
de heterogeneidad. No es posible confiar en un esquema de muestreo general para todo
el muestreo de procesos, de hecho, tal noción es solo una ilusión. Se necesitan
evaluaciones empíricas y experimentales de errores de muestreo para cada producto o
proceso principalmente nuevo. TOS ofrece un enfoque completamente general para
caracterizar la heterogeneidad 1-D de cualquier proceso o flujo de material 1-D
denominado variografía . El variograma experimental permitirá una simulación de
cualquier esquema de muestreo contemplado, basado en una serie de un máximo de
unas 40-60 muestras solamente.
En este trabajo, el enfoque se centra en los problemas prácticos asociados con
un enfoque variográfico para estimar los errores de muestreo totales, incluidos los
errores analíticos ss Normalmente, los procedimientos de muestreo para procesos o
flujos de material 1-D se pueden dividir en tres pasos separados:

Muestreo primario , por ejemplo, un dispositivo de muestreo de flujo, una


válvula o cualquier otro implemento local. Los dispositivos de muestreo pueden
ser estructuralmente correctos o incorrectos, tal como lo define la Teoría del
muestreo (TOS) [1] , [2] , [3] , [4] , [6] .

A menudo es necesario un paso de muestreo secundario para la reducción de
masa (representativa) [5] de la muestra del proceso primario en un tamaño de
muestra manejable para el posterior manejo y análisis de laboratorio (laboratorio
de control de calidad o similar).

Un paso de muestreo terciario , asociado con la producción de la cantidad a


menudo diminuta de material realmente utilizado para el
análisis [1] , [2] , [3] , [4] , [5] , [6] .
Para el muestreo de procesos en la industria en general, con el tiempo se han
desarrollado localmente muchas combinaciones diferentes de equipos y procedimientos,
muchos de los cuales están lejos de basarse en una comprensión completa de la Teoría
del muestreo (TOS) desafortunadamente, ibid .
El alcance del presente trabajo es presentar un enfoque universal para evaluar el equipo
de muestreo existente y la heterogeneidad 1-D presente para cualquier proceso / flujo de
producto y sugerir iniciativas de mejora cuando sea necesario. A pesar de que existe
una situación de logística de producción y planta muy variable en los sitios de
producción tecnológica de procesos industriales en general, sin embargo, será posible
delinear un enfoque extremadamente simple basado en la estimación del error de
muestreo total (TSE) basado en un tratamiento analítico de datos (variográfico) de tan
solo 40–60 muestras solamente.
2 . Teoría del muestreo (TOS) - briéf
El proceso de tomar una muestra, que caracteriza un sistema complejo y grande basado
en una pequeña parte del mismo, es contrario a muchas creencias, no es fácil, aunque la
especificación de la tarea no podría ser más simple: una muestra es una porción, pieza o
segmento que representa una clase o un todo más grande (el lote). Si la muestra de
hecho no representa lo que se supone, invariablemente seguirán deducciones y
conclusiones erróneas, sin importar cuán preciso sea el análisis posterior. El gran
estadístico y analista de datos John Tukey dijo: "Es mejor estar aproximadamente en lo
correcto, que estar precisamente equivocado", lo que significa que tiene que haber un
equilibrio entre la precisión de la técnica de ensayo y la representatividad de la
materialización física de una muestra. . Esta distinción entre la precisión del proceso de
muestreo (también conocido como sesgo) y la precisión del análisis es crucial para
cualquier apreciación de TOS; se presenta en su totalidad en la literatura básica de
muestreo, por ejemplo, [1] , [2] , [3] , [4] , [5] , [6] .
Una terminología minimalista utilizada en TOS:

El lote es el material original sujeto al procedimiento de muestreo. Un lote puede
ser de dimensión cero (0-D) como un contenedor de muestra, una carga de
material de camión, o todo el material en un reactor o unidimensional (1-D), es
decir, fluir a través de una tubería o en una cinta transportadora.

Una muestra es el material extraído correctamente del lote (la definición sigue).


Una muestra es un material extraído del lote de manera incorrecta.


Un incremento es una unidad de muestra parcial, que combinada con otros


incrementos forman una muestra compuesta .

Un fragmento es la unidad físicamente separable más pequeña del lote. Por


ejemplo, una molécula, gránulo o grano.

Un grupo de fragmentos consiste en fragmentos espacialmente correlacionados,


que actúan como una unidad coherente durante el muestreo.

El grado analítico a  L del lote es la masa del analito dividida por la masa total
del lote.

El grado analítico a  S de la muestra es la masa del analito dividida por la masa
total de la muestra.
TOS define el muestreo como un proceso de etapas múltiples, que cubre todas las
operaciones desde que se materializa un incremento hasta que se administra una parte
alícuota (porción medida de una muestra tomada para análisis) a la operación analítica
final, por ejemplo, una determinación espectrométrica en el laboratorio de control de
calidad .
2.1 . Muestreo correcto (muestreo representativo)
El objetivo de un procedimiento de muestreo es extraer una muestra con las mismas
propiedades que el lote de donde proviene la muestra: una muestra representativa . El
requisito previo básico para un procedimiento de muestreo representativo es que todos
los elementos en un lote, contenedor o en una sección transversal de la tubería tienen la
misma probabilidad de ser seleccionados, y que los elementos seleccionados no se
alteran de ninguna manera después de la muestra (o incremento ) ha sido
tomado. Todos los elementos que no pertenecen al lote o al contenedor de muestra
deben tener una probabilidad cero de ser seleccionados, lo que significa, por ejemplo,
que se ha eliminado la contaminación cruzada entre muestras (incrementos). Estos dos
criterios constituyen el principio fundamental de muestreo (FSP), que nunca puede ser
violado.
Con el muestreo de proceso, una muestra siempre se materializa preferiblemente a
través de varios incrementos del lote para formar una muestra compuesta .
El error de muestreo relativo se define como:mi=unS-unLunL.
Se dice que un proceso de muestreo es preciso si el error promedio m  e es prácticamente
igual a cero ( m  e 2 ≈ 0); Esto da como resultado que no haya sesgo de muestreo. Del
mismo modo, se dice que el proceso de muestreo es reproducible si la varianza del error
de muestreo es menor que un pequeño valor predeterminado s  e 2 ≤ s  e 2 .
La noción representativa es una propiedad compuesta del error relativo, que incluye la
parte sistemática y aleatoria del error de muestreo, denominada r  e :rmi2=metromi2+smi2.
Solo un procedimiento de selección correcto [1] , [2] , [3] , [4] , [5] , [6] da como
resultado muestras que son precisas (propiedad de la media), reproducibles (propiedad
de la varianza), y por lo tanto representativo. Aún así, cualquier resultados analíticos
específicos, un  S , no es sino una estimación de la verdadera (promedio) una  L .
El componente aleatorio del error de muestreo representado por la varianza tiende a
reducirse al promediar un gran número de incrementos (o muestras, según sea el
caso). La parte sistemática, sin embargo, no. Es esencial asegurar un muestreo correcto
y por lo tanto preciso para cancelar la parte sistemática, la parte sesgada del error de
muestreo. Cuando existe un muestreo correcto, el potencial en TOS radica en
caracterizar y minimizar (si no eliminar) la mayor cantidad posible de los errores de
muestreo restantes, ibid .
2.2 . Errores de muestreo
Los resultados analíticos siempre tienen una incertidumbre inherente. Esta
incertidumbre es consecuencia de la imprecisión causada por los errores de muestreo,
además del error analítico final, en todos los eventos desde el momento en que se define
(delinea) la muestra hasta que se completa el procedimiento analítico. El muestreo no
se limita a la materialización real de la muestra, sino que también se compone de todos
los pasos desde la materialización hasta que se administra una alícuota al
analizador. El error de estimación global (GEE) es una suma del error analítico
total (TAE) y el error de muestreo total (TSE):CARAMBA=TAE+EET.
En TOS, el error de muestreo total (TSE) se divide en siete componentes de errores,
algunos de los cuales caracterizan el material muestreado y otros el procedimiento de
muestreo en sí. Cinco errores están presentes en cada etapa de muestreo ( n ). GEE se
puede expresar
como:CARAMBA=TAE+TFE+CFE+∑norte=1norteFSEnorte+GSEnorte+IDEnorte+IEEnorte+IP
Enorte.
Con excepción de IPE n ( error de preparación incorrecto ), todos los errores se
consideran variables aleatorias con un promedio dado (podría ser cero) y una varianza
(nunca cero).
FSE n y GSE n son el error de muestreo fundamental y el error de  agrupación y
segregación . Estos componentes de error juntos representan el error práctico mínimo o
el error de muestreo correcto y son errores específicos del material que siempre estarán
presentes en una situación de muestreo. El resto de los errores indexados se refiere a los
equipos y procedimientos de muestreo. Juntos se denominan los errores de muestreo
incorrectas y pueden todos ser eliminados de un esquema de muestreo, aunque esto no
es necesariamente una tarea fácil. Estos aspectos fundamentales se tratan con todo
detalle y profundidad en la literatura básica de TOS [1] ,[2] , [3] , [4] , [5] , [6] .
TFE y CFE ( error de fluctuación de tiempo y error de fluctuación  cíclica)
se relacionan solo con el muestreo 1-D, el muestreo de proceso, donde domina una
dimensión. Los lotes 1-D en el ámbito industrial normalmente serían un material que
fluye a través de una tubería o que se realiza en una cinta transportadora. Sin embargo,
un cuerpo conceptual 1-D, por ejemplo, una serie de unidades de producción (bolsas,
sacos, tambores, cajas, etc.) es igual de abierto para el muestreo del proceso.
2.2.1 . Error de muestreo fundamental (FSE); error de agrupación y segregación (GSE)
Las diferencias de composición entre las partículas en un lote siempre resultan en un
error de muestreo (llamado error de muestreo fundamental) porque no todas las
partículas se analizan. El adjetivo "fundamental" se fundamenta en el hecho de que este
error siempre está presente en cualquier situación de muestreo práctica, lo que significa
que incluso un implemento de muestreo perfecto no podrá materializar dos muestras
con la misma composición exacta. El error de muestreo fundamental (FSE) es el error
de muestreo más pequeño posible, pero generalmente habrá otros errores de muestreo
presentes si no se han tomado medidas extremas. El FSE solo puede alterarse
(minimizarse) cambiando la constitución del sistema de material muestreado, por
ejemplo, por conminución o aplastamiento.
El error de agrupación y segregación (GSE) se origina a partir de una tendencia
inherente de las partículas a segregarse y / o agruparse (coherencia espacial en mayor o
menor grado) en un lote. A diferencia de FSE, este error no es invariable, ya que la
mezcla o segregación cambiará (reducirá) su magnitud numérica.
2.2.2 . Error práctico mínimo (MPE)
MPE es, por definición, la suma del error fundamental (FSE) y el error de agrupación y
segregación (GSE):MPE=FSE+GSE.
El mínimo error práctico juega un papel particularmente importante en la variografía .
2.2.3 . Errores de muestreo incorrectos (ISE)
Se cometen diferentes errores durante el muestreo y todos afectan el grado de
representatividad de la alícuota final que ingresa al equipo analítico en el
laboratorio. Los errores de muestreo incorrectos provienen de procedimientos o equipos
de muestreo mal diseñados, mantenimiento no óptimo del mismo o errores
humanos. Sin embargo, son posibles de evitar cuando uno es consciente de su
existencia. Dos de los errores de muestreo incorrectos: el error de deliminación
incorrecto (IDE) y el error de extracción incorrecto(IEE) se refiere a la selección de
material. IDE está relacionado con la forma de la herramienta de muestreo, que extrae
físicamente un incremento del lote. La herramienta debe dividir cuidadosamente la
muestra del volumen de una manera que asegure un proceso de muestreo
reproducible. La delimitación defectuosa, no idéntica, de incrementos es a menudo la
causa de graves errores de muestreo. La EEI se refiere al llenado real de la herramienta
de muestreo. Físicamente, de acuerdo con los requisitos de TOS, todas las partículas
con su centro de gravedad dentro de los límites de la herramienta de muestreo deben
extraerse con el incremento. El error de preparación incorrecto (IPE) se relaciona con
todas las formas de alteracióndel incremento después de que se haya extraído. Esto
podría ser la pérdida de material (por ejemplo, finos o humedad), contaminación u otras
alteraciones del material de muestra.
Todos estos errores de muestreo incorrectos deben eliminarse en lugar de
estimarse [1] , [2] , [3] , [4] , [5] , [6] .
En principio, no hay compensación o negociación con errores de muestreo incorrectos,
pero en la práctica se puede investigar hasta qué punto un esquema de muestreo
específico se desvía de un proceso totalmente representativo para un tipo específico de
material y si se aceptan errores estructurales o no. "Desde un punto de vista
práctico". Si esto se contempla, la argumentación mínima absoluta debe incluir una
evaluación cuantitativa de la magnitud de todos los muestreos y errores analíticos.
Todo esto, y mucho más, se puede lograr en una sola operación, estableciendo una
caracterización de heterogeneidad variográfica del proceso 1-D o del cuerpo material en
cuestión.
2.3 . Muestreo 1-D: el variograma
La verdadera concentración de un componente particular en una corriente de material
(tubería, cinta transportadora, serie de productos) nunca se conoce. La serie conceptual
de concentraciones sucesivas del componente A a lo largo de la dimensión 1 es en
teoría una función continua del tiempo, a ( t ). Para fines prácticos, a ( t ) siempre se
estima extrayendo y analizando incrementos discretos en varios puntos en el tiempo, es
decir, como una función discreta en el tiempo. La frecuencia de muestreo adaptada
determina la resolución de la serie temporal a ( t) y, por lo tanto, la percepción general
del proceso: la frecuencia de muestreo limita nuestro conocimiento de qué tan rápido
varía o fluctúa el proceso. Siempre se debe plantear la pregunta: "¿Cuál es la frecuencia
de muestreo óptima?". Nunca puede haber una respuesta única a esta pregunta, pero
el variograma proporciona una respuesta muy informativa al cuantificar la
autocorrelación en función de la distancia entre los puntos de muestreo (retardos de
tiempo o solo retrasos ).
El variograma se define mediante la siguiente ecuación maestra:ν(j)=12(Q-j)∑q=1Q(hq+j-
hq)2=12(Q-j)unL2∑q=1Q(unq+j-unq)2.Q es el número de incrementos distribuidos
equidistantemente en la serie de tiempo a ( t ), j es el retraso, un parámetro
adimensional que refleja la distancia entre dos incrementos. Las muestras se
caracterizan por las concentraciones analíticas, a  q o por la contribución de
heterogeneidad relativa, h  q , como se define en la literatura
básica [1] , [2] , [3] , [4] , [5] , [6] ; para el presente propósito son las variaciones
relativas las que más importan. Los variogramas tienen muchas apariencias diferentes,
pero tres características importantes son:umbral , el rango y el efecto de pepita ,
ver Fig.1 .

1. Descargar: Descargar imagen a tamaño completo


La Fig. 1 . Variograma genérico v ( j ), que ilustra los tres parámetros clave: el efecto de
pepita, el rango y el umbral. Para este variograma en particular, el efecto de pepita ∼  3.5, el
umbral ∼  13.5 y el rango  =  10 rezagos.
El umbral representa la varianza global promedio de la heterogeneidad s  2 ( h  q ). Es una
característica importante, porque representa la variación máxima dentro de una serie de
tiempo y es un indicador de aleatoriedad espacial, lo que significa que cuando el
variograma converge hacia el umbral, los puntos en la serie de tiempo a ( t ) ya no están
correlacionados. El rango es esa parte del variograma para el cual la función del
variograma v ( j ) se encuentra debajo del umbral. Cuanto más pequeño es el retraso, y
más pequeño V ( j), para los retrasos dentro del rango, los incrementos son
progresivamente más auto correlacionados. Esto implica que el muestreo con estas
distancias incrementales detectará variaciones en el proceso con mayor confiabilidad (a
medida que la distancia de retraso disminuye) y esta característica permitirá una medida
concomitante de control de monitoreo del proceso.
El efecto de pepita se estima extrapolando el variograma hacia atrás a v (0). Un lapso de
tiempo igual a cero no tiene un significado físico en sí mismo, excepto que se deben
extraer dos muestras al mismo tiempo, pero nunca pueden representar réplicas
verdaderas del (mismo) volumen. Las muestras con un tiempo de extracción idéntico
colapsan la situación de muestreo 1-D a una situación 0-D, para la cual el efecto de
pepita refleja el error más pequeño realizado al muestrear dos veces en el mismo
material en la "misma localización" (en realidad: "volver a -back "incrementos /
muestras). El efecto de pepita también se denomina apropiadamente la varianza
del error práctico mínimo S  MPE 2 para el muestreo 1-D.
El efecto de pepita es una suma de todas las variaciones en la situación de muestreo 0-
D: errores de muestreo correctos e incorrectos, así como el error analítico
total [1] , [2] , [3] , [4] , [5] , [ 6] . La implicación práctica del efecto de pepita es que un
experimento de muestreo 1-D no solo dará como resultado un esquema de muestreo
óptimo basado en la correlación automática en el proceso, sino que también dará como
resultado una estimación confiable de la varianza para el error práctico mínimo S  MPE 2 .
La literatura histórica de TOS [1] , [2] , así como la reciente exposición didáctica de
Petersen y Esbensen [4] trata el muestreo de procesos y la variografía con todo detalle
conceptual y teórico. A continuación trataremos el proceso práctico de
muestreo exclusivamente.
3 . Experimental
Esta sección hace uso de conjuntos de datos industriales, tecnológicos y de otro tipo del
mundo real y ofrece una descripción de la configuración analítica y de muestreo que
admite una evaluación variográfica y una estimación del error de muestreo total para
cada uno. La información latente en la serie de datos de proceso, producida por una
cuidadosa interpretación dependiente del problema de los variogramas
correspondientes, conocida como análisis variográfico, o variografía, acompañará a
todos los conjuntos de datos. Después de la presentación y el análisis de estos conjuntos
de datos (los paneles superiores muestran las series de datos originales en unidades sin
procesar, así como en las contribuciones de heterogeneidad) y sus variogramas
correspondientes (paneles inferiores izquierdos), todos se examinan nuevamente, lo que
ahora permite una comprensión integral de la sistemática de estimación de EET, el error
de muestreo total.
La estimación práctica de EET es extremadamente fácil, ya que se deduce directamente
de los mismos cálculos básicos que asisten al variograma. Es posible, sin costo
adicional de muestreo o análisis , simular todos los esquemas de muestreo
imaginables que podrían contemplarse para mejorar un proceso de muestreo
actual. Todos los esquemas de muestreo de procesos se caracterizan completamente por
dos parámetros únicamente: la frecuencia de muestreo, r  samp , y el número de
incrementos por muestra, Q , que uno está dispuesto a emplear para reducir la EET. Se
ha diseñado un programa informático, VARIO, para realizar los cálculos fundamentales
de variogramas, así como para proporcionar una plataforma para evaluar combinaciones
opcionales de Qy frecuencia de muestreo con el TSE resultante. Por razones prácticas,
la frecuencia de muestreo a menudo se cuantifica por la "distancia de retraso"
inversamente relacionada.
Desde un punto de vista didáctico, resulta altamente ventajoso primero presentar los
conjuntos de datos específicos y sus interpretaciones variográficas; La Sección
4 resume sus problemas específicos de estimación de EET.
3.1 . Los "experimentos en acuarios"
2003 ACABS llevaron a cabo una amplia campaña experimental didáctico, diseñado
para ilustrar los principales factores de muestreo y su influencia en el error de muestreo
total, y su desglose en FSE, GSE, ISE, CSE, entre otros toma de muestras puntuales vs.
muestreo compuesto, el tamaño mínimo de la subasta vs . tamaño del lote, así como la
influencia fundamental en la variación de muestreo relacionada con los niveles de
concentración del analito. Todos los experimentos se realizaron de acuerdo con un
esquema idéntico: un lote modelo (un "acuario" de plexiglás, de ahí el nombre de estos
experimentos) siempre se vació por completo, cucharada por pala. La figura 2 muestra
los tres tamaños de cucharada incremental involucrados en la presente selección de
experimentos. El lote modelo se llenó con un sistema de gránulos de polímero de
diferentes colores (amarillo: analitoy negro: matriz (también llamada gangue en
TOS). Cada cucharada extraída se "analizó" separando la fracción de gránulos amarillos
del negro, seguido de pesaje. Usando una balanza de laboratorio precisa para este
pesaje, el TAE resultante fue esencialmente nulo, permitiendo que la influencia total de
los componentes del error de muestreo se manifieste de la manera más clara
posible. Aquí solo se utiliza una pequeña parte de los resultados totales de la campaña
para el análisis variográfico (los experimentos completos se presentan en otra parte).

1. Descargar: Descargar imagen a tamaño completo


Fig.2 . Lote “Acuario”, cargado con un sistema de mezcla de pellets amarillos al 25%
(analito), que se muestra en una etapa de 2/3 de vaciado completo. También se muestran los
tres tamaños de cucharada: 5 ml, 25 ml y 100 ml, involucrados en los experimentos
utilizados a continuación para el análisis variográfico. La premezcla no dejó tendencias de
concentración visibles mientras que aún conservaba una heterogeneidad espacial
significativa. Observe el tamaño relativo del lote y las cucharadas de incremento de
muestreo en relación con los gránulos individuales.
Aquí se investigan dos niveles de concentración diferentes: 0.1% y 25% (p / p). Estos
sistemas de mezcla se muestrearon completamente usando tres tamaños de cucharada: 5
ml, 25 ml y 100 ml respectivamente (relacionado de manera realista con el volumen
total del lote modelo). El peso total del material de la mezcla en el recipiente fue de
4.000 kg, correspondiente a un volumen de aproximadamente 3500 ml. Tanto para la
concentración de trazas, 0.1% como para la concentración de nivel principal, 25%, cada
carga del lote modelo se realizó como una premezcla de las fracciones de pellet
amarillo y negro en el acuario. La mezcla fue efectiva, pero no completa (es decir, no
alcanzó una heterogeneidad residual mínima completa), ya que se deseaba ilustrar el
muestreo de sistemas significativamente heterogéneos; por lo tanto, la mezcla se realizó
solo hasta que la inspección visual no reveló ninguna tendencia sistemática.La figura
2 muestra un lote de modelo vaciado 2/3 (concentración 25%).
Concentración nominal

25% 0.1%

Tamaño de cucharada nominal [ml]

100 25 55 100 25 55

Cucharada realizada avr. (gramo) 90,89 24,26 4.98 95,24 27,02 6.23

Scoop std. dev. (gramo) 11,55 2,24 0,55 11,51 2,56 0,65

Concentración realizada avr. (%) 25,14 25.05 25,01 0,10 0,10 0,10

Concentración estándar dev. (%) 2,30 2,25 3.098 0,04 0,08 0,15

3.1.1 . Concentración 0.1% –5 ml de tamaño de incremento – 642 cucharadas en total


La figura 3 muestra la serie de datos original correspondiente a las 642 determinaciones
analíticas individuales de concentración (mostradas como concentraciones absolutas,
así como expresadas en unidades de contribución de heterogeneidad - panel superior
izquierdo y derecho respectivamente). El panel inferior izquierdo muestra el variograma
derivado de la serie de datos anterior (panel izquierdo); el panel derecho muestra el
error de muestreo total estimado, TSE, derivado del variograma (más del cual en
secciones posteriores).
1. Descargar: Descargar imagen a tamaño completo
Fig.3 . Resultado VARIO que muestra datos brutos (arriba a la izquierda), contribuciones de
heterogeneidad (arriba a la derecha), variograma experimental (abajo a la izquierda) y
simulación de TSE (abajo a la derecha) para el sistema de mezcla con una concentración de
analito al 0.1% muestreada con una cuchara de 5 ml.
La figura 3 muestra un variograma plano muy distinto , que indica que los datos
originales no tienen tendencia. La estimación numérica de la varianza del umbral es
aproximadamente 2.0, que se puede leer directamente como la intersección del
variograma con el eje V ( j ). Esta estimación se comparará entre los sistemas
relacionados, también analizados a continuación.
3.1.2 . Concentración 0.1% –25 ml de tamaño de incremento – 148 cucharadas en total
El sistema de mezcla heterogénea con una concentración idéntica de analito (0.1%),
cuando se muestrea con una cuchara cinco veces más grande (25 ml), revela una
estimación del nivel de umbral de 0.6, en comparación con 2.0 para la cuchara más
pequeña (5 ml), Fig.4 . Al aumentar el tamaño de la cucharada cinco veces, se obtiene
una reducción en el error de varianza de muestreo general por un factor de tres. El
variograma es nuevamente completamente plano, sin ningún rango en absoluto: no hay
tendencias claras en la serie de datos producidas por el vaciado sucesivo completo del
lote del modelo (¿tal vez una tendencia creciente muy débil hacia el final?).

1. Descargar: Descargar imagen a tamaño completo


Fig.4 . Resultado VARIO que muestra datos brutos (arriba a la izquierda), contribuciones de
heterogeneidad (arriba a la derecha), variograma experimental (abajo a la izquierda) y
simulación de TSE (abajo a la derecha) para el sistema de mezcla con una concentración de
analito al 0.1% muestreada con una cuchara de 25 ml.
3.1.3 . Concentración 0.1% –100 ml de tamaño de incremento – 42 cucharadas en total
Por el contrario, ahora se usa una cuchara de 100 ml, lo que da como resultado solo 42
cucharadas antes de que el lote se vacíe por completo. Una reducción adicional en los
resultados de la varianza de muestreo, por un factor de 6 en comparación con la
cucharada de 25 ml anterior, y por un factor de 20, en comparación con la cucharada de
5 ml, ver Fig. 5 a continuación. Estas constituyen reducciones sustanciales en el proceso
de muestreo inducidas por las variaciones. El punto aquí es que ni este vaciado
completo revela ninguna tendencia, ni ningún rango.
1. Descargar: Descargar imagen a tamaño completo
Fig.5 . Resultado VARIO que muestra datos brutos (arriba a la izquierda), contribuciones de
heterogeneidad (arriba a la derecha), variograma experimental (abajo a la izquierda) y
simulación de TSE (abajo a la derecha) para el sistema de mezcla con una concentración de
analito al 0.1% muestreada con una cucharada de 100 ml.
3.1.3.1 . Lección de variografía - I
El nivel del umbral del variograma contiene información esencial de la varianza de
muestreo experimentada al repetir la operación de muestreo unitario con incrementos de
diferentes tamaños, atestiguada por la reducción progresiva del nivel general de la
varianza de muestreo: 2.0-0.6-0.09 respectivamente. La variografía de los tres sistemas
de concentración de trazas no reveló tendencias en la constitución espacial (3-D) de
todo el lote, lo que se evidencia en la ausencia de rangos o tendencias en los
variogramas.
3.1.4 . Concentración 25% –5 ml de tamaño de incremento – 803 cucharadas en total
Para una "concentración principal" típica del 25%, el sistema de material ya no se
comporta de la misma manera, ya que obviamente ya no se encuentra en el dominio de
concentración de trazas. En general, se supone que el muestreo debería ser mucho más
fácil a un nivel de concentración tan dominante desde el punto de vista compositivo
(con frecuencia se espera "menos heterogeneidad"). El sistema al 25% se
mezcló exactamente como para el sistema de concentración de trazas, compare
la Fig.6 .

1. Descargar: Descargar imagen a tamaño completo


Fig.6 . Resultado VARIO que muestra datos sin procesar (arriba a la izquierda),
contribuciones de heterogeneidad (arriba a la derecha), variograma experimental (abajo a la
izquierda) y simulación de TSE (abajo a la derecha) para el sistema de mezcla con una
concentración de analito del 25% muestreada con una cuchara de 5 ml. Una tendencia
significativa está presente dentro del rango: 250 rezagos.
La varianza de muestreo general, el alféizar, ahora es de aproximadamente 0.011, pero
lo más importante, se observa una tendencia distinta en el variograma. La tendencia está
presente en un rango de aproximadamente 250 retrasos. La inspección de la serie de
datos sin procesar (panel superior izquierdo) revela una tendencia estadísticamente
distinta y creciente casi exclusivamente para las últimas 250–300 primicias para las
cuales un nivel promedio de 23–24% aumenta hacia una concentración final de> 35%
(es cierto que solo por las muy, muy pocas primicias). Sin embargo, tanto la serie de
datos sin procesar como el variograma recogen una tendencia vertical espacial (3-D)
distinta en el lote que está muy disimulada por un "error estocástico" significativo en
los resultados analíticos individuales de 5 ml: a pesar del alto nivel de concentración,
sin embargo, existe un error de muestreo fundamental (FSE) altamente significativo al
muestrear con un volumen de incremento tan pequeño como 5 ml.
El principal problema aquí es que FSE (junto con GSE y TAE) se aísla, y se resta, en el
efecto de pepita (MPE), de manera destacada representa en el panel de variograma
inferior izquierda de la Fig. 6 . Se puede concluir que la mezcla "efectiva" de esta alta
concentración fue cualquier cosa menos efectiva (sic).
3.1.5 . Concentración 25% –100 ml de tamaño de incremento – 44 cucharadas en total
Cuando se toma la muestra con la cucharada más grande, 100 ml, la tendencia en el
sistema todavía está presente; de hecho, es claramente más clara; el variograma en
la Fig. 7 muestra una tendencia obvia dentro de un rango de aproximadamente 20
retrasos, más o menos (los resultados de la cucharada de 25 ml también revelaron esta
tendencia, no se muestra aquí). Esto es, tal vez, contradictorio a primera vista, pero la
causa subyacente de esta tendencia está relacionada con la eficacia de llenado y mezcla
en el lote solamente, y por lo tanto está presente en un grado menor o mayor (o nada)
únicamente como una función de la ineficacia de mezclar a mano.

1. Descargar: Descargar imagen a tamaño completo


Fig.7 . Resultado VARIO que muestra datos brutos (arriba a la izquierda), contribuciones de
heterogeneidad (arriba a la derecha), variograma experimental (abajo a la izquierda) y
simulación de TSE (abajo a la derecha) para el sistema de mezcla con una concentración de
analito del 25% muestreada con una cuchara de 100 ml. Una tendencia significativa está
presente dentro del rango ∼  20 rezagos.
Comparando la Fig. 6 , la Fig. 7 , está claro que la tendencia general de un variograma
puede superponerse con una fracción de dispersión en la disposición de los puntos de
datos individuales de retraso, j , V ( j ), más claramente delineados por el escasa
delineación de variogramas en la figura 7 . Es la tendencia subyacente la que lleva el
mensaje: en los sistemas naturales e industriales, uno siempre debe estar preparado para
tener que lidiar con cualquier nivel de dispersión significativa al evaluar el nivel de
umbral, el rango y el efecto de pepita en el variograma. Fig. 6 , Fig. 7 constituyen un
caso en pont, una tendencia / rango muy claramente definido ("bajo nivel de ruido")
frente a un ídem "muy ruidoso".
En la Fig. 7 se observa un posible valor atípico muy débil (o quizás un valor extremo,
que puede omitirse para fines de análisis de datos), incremento No. 17. Como
ilustración didáctica introductoria de la influencia que los valores atípicos pueden tener
en el variograma, también resultados actuales cuando este valor atípico (muy pequeño)
se ha descartado, Fig. 8 .
1. Descargar: Descargar imagen a tamaño completo
Fig.8 . Resultado VARIO que muestra datos brutos (arriba a la izquierda), contribuciones de
heterogeneidad (arriba a la derecha), variograma experimental (abajo a la izquierda) y
simulación de TSE (abajo a la derecha) para el sistema de mezcla con una concentración de
analito del 25% muestreada con una cuchara de 100 ml. Outlier No. 17 eliminado, en
comparación con la Fig. 7 .
La comparación revela que el único efecto de la eliminación de un valor atípico
marginal es un variograma plano ligeramente más bien expresado para los retrasos más
pequeños importantes (primera serie de medio retraso). Veremos más efectos adversos
de valores atípicos significativos más abajo.
3.1.5.1 . Lección de variografía - II
La tendencia del variograma contiene información esencial sobre el rango de tendencias
importantes en la serie de datos original. La variografía de los dos sistemas
seleccionados del 25% reveló tanto tendencias significativas como rangos que podrían
estar relacionados con el contexto del problema del que se originan las series de
datos. Los valores atípicos pequeños no influyen demasiado en el variograma.
3.2 . Planta de biogás Ribe: monitoreo de procesos
La planta de Ribe Biogas se puso en servicio en agosto de 1990. Durante una década, ha
sido la planta de digestión anaeróbica a base de estiércol agrícola y desechos
alimenticios más grande de su tipo en el norte de Europa. Se basa en tres biorreactores
(cada uno de un volumen: 1800 m 3 ) del tipo de digestor CSTR (Reactor de tanque
agitado continuamente: la temperatura de fermentación se mantiene constante a 53 °
C), Fig.9 . Las estrategias de alimentación tienen que hacer frente a biomasas que, por
naturaleza, son muy heterogéneas. Una estrategia de alimentación conservadora ha
estado funcionando durante 15 años, optando preferentemente por una fórmula probada
para mezclar tres tipos muy diferentes de materia prima: estiércol de vaca y cerdo (en
grandes cantidades), así como desechos industriales orgánicos. La producción diaria de
biogás es del orden de 15,000-18,000 m.3 , las fluctuaciones se mantienen lo más bajo
posible por las rutinas de gestión de alimentación.
El monitoreo del proceso y el análisis de laboratorio de muestras de rutina de la planta
de digestión anaerobia se realiza diariamente como parte de un programa sistemático de
garantía de calidad. Se analizan varios parámetros en las materias primas y el gas
producto. Aquí hacemos uso del parámetro más importante de producto, el metano
(CH 4 ) de rendimiento y un contaminante de sulfuro de hidrógeno en general
importancia (H 2 S). Debido al lento proceso de bioconversión anaeróbica (el tiempo de
retención es típicamente del orden de 2 a 3 semanas en plantas de digestión como esta),
las mediciones diarias de los parámetros analíticos esenciales del proceso a menudo son
suficientes. El enfoque para el monitoreo de plantas de biogás está en
los niveles y tendencias diarios / semanales / mensuales sobre todo.
El rendimiento del producto de biogás y el H contaminante 2 S no están correlacionados
entre sí, la Fig. 9 , por lo que el análisis variográfico debe llevarse a cabo de cada
parámetro por separado.

1. Descargar: Descargar imagen a tamaño completo


Fig.9 . Planta de biogás de Ribe, Dinamarca, cuyo núcleo consiste en tres reactores de
fermentación de 1800 m 3 . La alimentación de fermentadores grandes (diámetro: 8 m, altura:
22 m) es un asunto delicado, en el que la premezcla óptima de los diferentes miembros
finales de la composición de materias primas tiene una influencia crítica en la eficiencia del
proceso de biogás.
3.2.1 . Monitoreo de H  2 S (ppm) en biogás producido de enero a marzo de 2005 (90 muestras)
H 2 S se considera un contaminante grave en biogás producido. En presencia de
pequeñas cantidades de agua (vapor o líquido), y hay abundancia de esto en cada
sistema de biogás, se produce ácido sulfúrico, que no funciona bien en ninguna parte
metálica de los costosos sistemas combinados de generación de calor y energía.
utilizando el biogás producido, ni ninguna tubería u otro instrumento en contacto con el
biogás, por razones obvias. La concentración de H 2 por lo tanto S en el gas producido
se controla de cerca. La figura 10 muestra una serie de datos de tres meses.
1. Descargar: Descargar imagen a tamaño completo
Fig.10 . Diagrama de dispersión de CH 4 y H 2 S que no revela correlación significativa.
Desde la ciencia de la geoestadística , inducida en TOS [1] , [2] , es bien sabido que el
análisis variográfico depende de la característica esencial de que las series de datos
analizadas sean estacionarias , es decir, se asume que cualquier variabilidad presente en
la serie ser relativo a alguna forma de nivel promedio general general; La figura
11 constituye un ejemplo particularmente bueno de cumplimiento de este requisito
previo. Por lo tanto, es posible obtener el máximo de información del análisis
variográfico.

1. Descargar: Descargar imagen a tamaño completo


Fig.11 . Resultados VARIO de H 2 S Vigilancia en biogás producido en la planta de biogás
Ribe. Esta serie de datos de tres meses es estacionaria (dos paneles superiores), sin valores
atípicos, lo que permite un análisis variográfico de máxima información. Observe una
periodicidad de 7 días muy distinta en el variograma (parte inferior izquierda).
El variograma en el panel inferior izquierdo en la Fig. 11 muestra una naturaleza
compuesta, con un umbral y rango claros (∼  14 días), pero lo más interesante en este
caso, una ciclicidad muy pronunciada de exactamente 7 días, expresándose en la parte
superior (superpuesta ) en la forma genérica de variograma que se muestra en la figura
1 . Está muy claro que esta ciclicidad es mucho más perceptible en el variograma que
en la serie de fechas original debido a la resta de error 0-D en el efecto de pepita
(MPE), Fig. 12 .

1. Descargar: Descargar imagen a tamaño completo


Fig. 12 . Descomposición fundamental de la varianza de muestreo total, representada
por V ( j ), en el "efecto de pepita", también denominado error práctico mínimo (MPE), que
representa todas las fuentes de error 0-D involucradas (incluido TAE) y el verdadero
proceso varianza, la variación del proceso 1-D.
3.2.1.1 . Interpretación - I
El período exacto de 7 días está relacionado con el hecho de que durante los fines de
semana se limita la capacidad de una premezcla constante de la carga de materia prima
en bruto. A pesar de que todas las capacidades de almacenamiento están llenas para el
viernes por la noche, hay un retraso de los residuos industriales concentrados que se
mezclan en los biorreactores al final del fin de semana, más pronunciados los
domingos. Como consecuencia, la materia prima de biogás está cambiando su perfil,
experimentando reducciones en la cantidad de desechos industriales que contienen
cloruro de hierro. Cloruro de hierro en el residuo industrial orgánica reduce el
H 2 contenido de S. El resultado es una sistemática H 2 S gota centrado en los fines de
semana superpuestas por un efecto pequeño o más grande de los diversos grados de
propensión descomposición de los diversos otros tipos de material de desecho en la
composición de la biomasa. El crudo HLas series de concentración 2 S muestran este
efecto combinado regular y "efecto estocástico" muy claramente.
3.2.2 . Monitoreo del rendimiento diario de biogás: CH  4 (m  3 ), enero a marzo de 2005 hacer (90
muestras)
El análisis variográfico está fatalmente influenciado por valores atípicos significativos,
como lo ilustra muy bien la secuencia de la figura 13 , la figura 14 y la figura 15 , que
solo difieren en la exclusión secuencial de los dos valores atípicos prominentes,
incrementos n. ° 2 y 56 respectivamente.
1. Descargar: Descargar imagen a tamaño completo
Fig.13 . Resultado VARIO para la producción de biogás (CH 4 ). El conjunto de datos total
incluye dos valores atípicos significativos, revelados dramáticamente en los gráficos de
datos en serie (dos paneles superiores).
1. Descargar: Descargar imagen a tamaño completo
Fig.14 . Series de datos idénticas a las de la Fig. 13 , con la única excepción del incremento
original No. 2 eliminado.
1. Descargar: Descargar imagen a tamaño completo
Fig.15 . Series de datos idénticas como en la Fig. 14 con la única excepción del incremento
original No. 56 también eliminado. Observe la transformación completa de los variogramas
en la Fig. 13 , Fig. 14 , Fig. 15 .
El variograma en la Fig. 13 es ininteligible. Corresponde a ningún tipo conocido de
variograma adecuado que se haya encontrado [1] , [2] , [3] , [4] . La eliminación del
incremento n. ° 2 conduce al variograma representado en la figura 14 .
La diferencia en el variograma resultante no podría ser más contrastante. El variograma
ahora revela una, tal vez dos ciclicidades superpuestas en un umbral y rango algo
confusos, caracterizados por un rango de ∼  6–8 días (?). En lugar de saltar en cualquier
interpretaciones sin embargo, el siguiente valor extremo tiene que ser eliminado
primero, que conduce a la verdadera subyacente variograma se representa en la Fig.
15 .
El variograma resultante es ahora la simplicidad en comparación con sus dos
predecesores: el efecto de pepita muestra una reducción drástica (0.40, 0.006 y 0.001
respectivamente), al igual que el umbral (s), pero lo más importante, el verdadero
variograma subyacente revela un desconocido hasta ahora "Periodicidad" de unos
20  +  /  -  2 días de duración. Esta característica no corresponde a ninguna periodicidad
conocida en el diseño u operación interna del proceso de bioconversión (conocida por
más de 15 años de operación exitosa de esta planta en particular). La interpretación
detallada de esta característica ilustrará la naturaleza esencial dependiente del problema
de la variografía y la nueva visión derivada del proceso.
3.2.2.1 . Interpretación - II
La composición de la materia prima de biomasa consiste aproximadamente en un 60%
de estiércol de vaca, 20% de estiércol de cerdo y 20% de residuos orgánicos industriales
de procesamiento de alimentos. Todos estos tipos son claramente heterogéneos. La
periodicidad recién descubierta podría representar una variación "a largo plazo" en la
composición del desperdicio de alimentos (derivada de un ciclo de producción de ∼ 3
semanas), o, considerado más probable aquí, puede reflejar sistemáticas no reconocidas
en la logística detrás del transporte de estiércol animal: algunas granjas entregan
estiércol crudo semanalmente, mientras que las grandes usan 3 semanas. El estiércol de
estas granjas más grandes tiende a estar ligeramente más diluido. Los patrones de
transporte hasta ahora no reconocidos de transportar mayores proporciones de estiércol
de cerdo frente a estiércol de vaca también pueden afectar el nuevo cambio "periódico"
en la producción de biogás observado, junto con la posibilidad de influencia de
variaciones en el contenido total de sólidos del estiércol de varias granjas.
Independientemente de las explicaciones detalladas que finalmente quedaron al
descubierto, el efecto del análisis variográfico ya ha dado como resultado un
nuevo enfoque para la operación de la planta de biogás: en lugar de enfocarse en la
minimización económica y estrecha del combustible diario para los tanques de entrega a
través de un Optimización convencional del vendedor ambulante , el enfoque ahora
puede ser transferido ventajosamente a la creación de nuevas, más igualadoraslogística
de transporte, haciendo uso activo de estos patrones recién descubiertos, para ayudar a
optimizar una mejor premezcla de los tipos de estiércol recolectados y entregados a la
planta con el efecto de una composición general de materia prima más constante. Esto
constituye un nuevo ámbito operativo potencialmente más rentable para este productor
industrial a granel de baja tecnología, todo debido a un variograma (sic) simple y
atípico.
3.2.2.2 . Lección de variografía - III
Los valores atípicos, definidos aquí como extremos, o muy irregulares, los incrementos
"no confiables" faltantes o de buena fe influyen significativamente en todos los
variogramas, a veces fatalmente; los valores atípicos deben delinearse y
eliminarse secuencialmente . Los valores atípicos significativos enmascaran el
variograma verdadero subyacente en grados serios. No se debe realizar ninguna
interpretación de variograma antes de que se haya asegurado la eliminación de valores
atípicos.
La periodicidad de un variograma lleva información esencial sobre el proceso
subyacente caracterizado por la serie de datos. La variografía de los dos parámetros de
biogás seleccionados reveló ciclicidades con una expresión muy diferente y causas
claramente diferentes, completamente entendidas solo cuando se realizó una
interpretación detallada de la información del variograma en el contexto del problema
adecuado. Las razones y causas detrás de las periodicidades eran conocidas, o inferidas,
en el contexto actual. Esto demuestra cómo la interpretación detallada de la información
potencial presente en un variograma conduce a una mayor comprensión del proceso que
se analiza. Las periodicidades no reconocidas pueden tener fácilmente consecuencias
económicas negativas significativas.
3.3 . Análisis de proceso adecuado (precios de productos)
3.3.1 . Precios diarios de Zn de fin de comercio
Este conjunto de datos (descargado del dominio público) representa un sector en el que
el análisis variográfico juega un papel importante y creciente, el sector
financiero. Cualquier empresa comercial con un interés significativo en las materias
primas o productos metálicos, o materiales similares comercializados y cotizados en los
mercados internacionales de productos básicos, estará interesada en analizar (y, por lo
tanto, con una comprensión más completa) las fluctuaciones dinámicas en el tiempo
involucradas. La figura 16 muestra como un ejemplo de arquetipo de este campo, los
precios diarios de fin de comercio de Zink (Zn) en dólares estadounidenses por tonelada
durante un período completo de cinco años.
1. Descargar: Descargar imagen a tamaño completo
Fig.16 . Resultados de VARIO para un conjunto completo de datos de precio Zn de 5
años. Este variograma es solo de referencia.
Como es bien sabido, los tipos de datos como los precios de las acciones en bolsa, los
precios de los productos básicos y los datos de pronósticos económicos similares, se
caracterizan abrumadoramente por tendencias y / o ciclicidades . Por lo tanto, antes del
análisis variográfico, a menudo se aplica la tendencia.
En los círculos financieros, se cree firmemente que el análisis de los detalles del
comportamiento de tendencia, periódico o caótico de tales series de datos, denominado
"cartismo", puede conducir a una visión valiosa (en el sentido más original) en el
comportamiento futuro de precios, que pueden ser cobrados (de nuevo, en el sentido
más original) por juicios de futuros , coberturas , etc. Comprensiblemente, los
elementos específicos de dicho análisis son de propiedad y no de dominio público, pero
ciertamente no es una coincidencia, por ejemplo , que la prestigiosa Escuela de Minas
de Francia, con sede en París, cuenta con un departamento de análisis económico en el
que la "geoestadística" desempeña un papel central (la geoestadística y
la variografía están estrechamente relacionadas, histórica y
metodológicamente [1], [2] , [7] .
El objetivo del análisis de este conjunto de datos es simplemente ilustrar lo que se
puede obtener de una descomposición variográfica (e interpretación) en la que las
relaciones de proceso detrás de la serie de datos no se conocen con certeza, pero son
muy tenues en el mejor de los casos, si existen todos:
Cada cotización diaria de precios de fin de comercio es el resultado de una multitud de
evaluaciones individuales del "futuro probable" de los precios de Zn. Al principio, hay
muy poca interacción directa entre los actores en el campo comercial, pero habrá un
efecto de mercado (seguir al líder) tan pronto como los precios de tendencia se
establezcan y sean "notables", momento en el cual se inicia el proceso de
amplificación. Esto puede influir en los precios de manera sustancial y rápida (a veces
inflacionaria) tanto en direcciones positivas como negativas, aunque esta última
también puede conducir a un colapso catastrófico. Se puede decir mucho más, pero el
punto aquí no es dar una primera lección en el análisis del mercado capitalista, y la
comprensión de la fuerza del mercado, si existe. pero solo para introducir un tipo de
datos en el que no se conoce con certeza la fuerza impulsora subyacente (a pesar de las
afirmaciones de los especialistas del mercado y los analistas financieros).  Para este
tipo de datos hay una comprensión tácita de que cada dato lleva una "masa
estadística" idéntica.
Un análisis variográfico de dichos datos será solo una descripción objetiva y neutral
(pero, por supuesto, cualquiera es libre de especular e interpretar los
resultados). Nuestro principal interés en dicho análisis de datos será aislar e interpretar,
si es posible, el efecto de pepita (MPE) y, si es posible, interpretar el significado de
este, así como los otros parámetros de variograma en esta configuración particular.
Las principales tendencias en los datos de Zn cubren un aumento dramático a gran
escala al final de los 5 años en cuestión. Por lo que ocurrió anteriormente, no sería
interesante incluir estas tendencias a gran escala en el análisis variográfico. Una forma
de deshacerse de las "tendencias molestas" es podar la serie de datos en un conjunto de
segmentos estacionarios; La tendencia adecuada también se ilustrará a
continuación. Primero limitaremos el análisis variográfico a dos subconjuntos, ambos
con características aproximadamente estacionarias . Los conjuntos de datos Zn1 y Zn2
están definidos por precios <  1300 US $ / tonelada y <  900 US $ respectivamente.
3.3.1.1 . Interpretación
Hay una notable evolución en la serie de tres variogramas anteriores. Si bien el
variograma del conjunto de datos completo, así como el del conjunto de datos de
<  1300 US $ / tonelada, en realidad no son más que una megatendencia en sí misma, y
para todos los 750 y retrasos de más de 600 retrasos, para el centro " En la serie de
datos "tendencia" mostrada en la Fig. 17 , ahora se podría obtener una visión detallada
de las relaciones estacionarias de "volatilidad del mercado" (parámetros importantes en
el análisis económico). Dependiendo del nivel de competencia de análisis de mercado
de uno, uno podría notar que parecería haber un distinct bastante distinto Rango de 30
días, y nada más (sic): el mercado Zn experimentó una tranquilidad de mercado en este
período de tiempo. Si uno está interesado en llevar este sobre en particular al límite
absoluto, también podría considerar nociones sobre posibles periodicidades
superpuestas de 100 días y 150 días, y por qué no: este tema está realmente abierto a
la especulación .

1. Descargar: Descargar imagen a tamaño completo


Figura 17 . VARIO resulta del conjunto de datos Zn2 restringido a precios <  900 US $ /
tonelada, es decir, una serie de datos estacionarios de buena fe.
Sin embargo, para un punto de vista de análisis de datos científicos más estricto, hay
una nueva característica que aún no se ha encontrado en ninguno de los variogramas
anteriores: ¡no hay ningún efecto de pepita en absoluto! Esta sería una situación muy
rara para la mayoría de los escenarios de muestreo físico, aunque no totalmente
inaudito. El significado específico de TOS es claro: este conjunto de datos no
abarca ningún TAE, FSE, GSE ni ISE. Tras la reflexión, esto debe estar relacionado con
la naturaleza específica de estos datos: los precios de negociación al final del día no
experimentan ninguna incertidumbre; El precio se fijó con total certeza en el horario de
cierre diario de la sesión de comercio de productos básicos.
El variograma apropiado habla muy directamente: aquí solo hay variación del
proceso, Fig.17 . Es instructivo comparar con los variogramas tendencia de
influencia, Fig. 16 , Fig. 18 .

1. Descargar: Descargar imagen a tamaño completo


Fig.18 . VARIO resulta del conjunto de datos Zn1 para precios <  1300 US $ / tonelada,
todavía influenciado por demasiadas tendencias.
3.3.2 . Petróleo: precio spot de Europa Brent FOB
Una segunda ilustración se refiere a un análisis variográfico similar del precio spot
diario del petróleo crudo Brent del Mar del Norte, que sirve como un producto de
referencia.
Estas dos series de datos de precios del petróleo y variogramas, uno aparentemente
sufre tanto de un pico atípico prominente como de tendencias severas potencialmente
debilitantes ( Fig. 19 ), el otro cuidadosamente podado, sin embargo, muestra
características prácticamente idénticas, sin duda de interés comercial. , Fig. 20 : hay una
periodicidad de macroescala muy claramente expresada (período: ∼ 800 días)
superpuestos en un rango cero (de nuevo sin efecto de pepita) variograma de tendencia
que muestra signos de una tendencia de disminución decreciente con rezagos muy
grandes. Estas características son, por supuesto, más pronunciadas para el conjunto de
datos podados, pero sin embargo también pueden obtenerse a partir de un análisis
juicioso del conjunto de datos total, aunque solo con una experiencia considerable. La
interpretación detallada del significado de tales relaciones complejas pertenece al
ámbito geoestadístico. Una referencia completa y autorizada para el análisis de
variogramas complejos es Gringarten y Deutsch [8] .

1. Descargar: Descargar imagen a tamaño completo


Figura 19 . Precios del petróleo Brent en el período de enero de 1986 a septiembre de 2004.
1. Descargar: Descargar imagen a tamaño completo
Fig.20 . Proceso de aceite Brent: el segmento estacionario coherente más grande recortado
de la figura 19 .
3.3.3 . Datos PITARD: planta de flotación de alimentación más dura
El último conjunto de datos de demostración proviene del completo libro de texto TOS
de Pitard [2] , utilizado aquí para resaltar el valor de la tendencia . Si bien el conjunto
de datos sin procesar muestra una tendencia clara en aumento, quizás hasta cierto punto
amenazando con debilitar el análisis variográfico (la Fig. 21 se muestra principalmente
con fines de comparación), el conjunto de datos de tendencia en la Fig. 22 revela con
toda claridad la fuerza de TOS para presentando estructuras de datos ocultos , en este
caso una periodicidad oculta. Por lo tanto, el "variograma de tendencia" delinea un
comportamiento cuasicíclico con un período de ∼ 18-19 días, imposible de discernir en
los datos originales. Si bien esta periodicidad también está presente en el variograma de
los datos originales, pero como una característica mucho menos pronunciada (puede
identificarse mediante un análisis juicioso del variograma "en bruto", pero de nuevo
solo con una experiencia considerable), no hay ninguna duda con respecto a El
variograma periódico distintivo marcado en la figura 22 .
1. Descargar: Descargar imagen a tamaño completo
Figura 21 . Pitard [2] proporciona varios conjuntos de datos de proceso; Aquí se muestra la
serie de datos “Alimentación más dura de la planta de flotación”, con un total de 70
muestras (pág. 84). Compare con el variograma de Pitard en la pág. 94)
1. Descargar: Descargar imagen a tamaño completo
Fig.22 . La serie de datos de alimentación de plantas de flotación de Pitard [2] , más
reciente.
Una preocupación legítima podría ser que una tendencia a desencadenar demasiado
feliz quizás ponga en peligro la comprensión total del comportamiento de la serie de
datos original. Esta preocupación puede aliviarse por completo tratando siempre tanto la
serie original como la versión de tendencia, como se ilustra en la Fig. 21 , Fig.
22 anterior. Si es necesario, la serie de datos original también puede someterse a un
análisis de series de tiempo apropiado (sin embargo, el objetivo del análisis de series de
tiempo es bastante distinto de la variografía. El análisis de series de tiempo se refiere
principalmente al comportamiento que puede ser completamente modelado por un
suma de funciones periódicas, sin MPE específico respecto a los errores).
Pierre Gy confió en la extraordinaria fuerza didáctica y la claridad en lo que denominó
análisis de datos cronoestadísticos en sus muchos trabajos sobre muestreo de procesos y
variografía [1] , [9] , especialmente destacado en su resumen de toda la vida de TOS [10
] , que corresponde a los ejemplos dados anteriormente. Es conveniente cerrar el
presente tutorial de muestreo del proceso en esta nota.
3.3.3.1 . Lección de Variografía - V
Las tendencias significativas (y / o periodicidades) en la serie de datos original pueden
estar sujetas a un análisis apropiado de series de tiempo antes de ser pretratadas para
corresponder con el requisito previo de una serie de datos estacionaria . Dos opciones
para este pretratamiento se mostraron en acción (segmentación de tiempo y tendencia)
como enfoques efectivos.
El poder del análisis variográfico se demostró con total claridad: absolutamente todos
los detalles estructurales y / o MPE pertinentes se revelarán en el variograma; Los
ejemplos incluyen un MPE pequeño, pero completamente distinguible,
y periodicidades sistemáticas, omnipresentes, pero ocultas , acentuadas más claramente
por la tendencia dependiente del problema. Es significativo que la detección y
cuantificación de MPE juegue un papel crucial en este esfuerzo.
4 . Estimación de EET: simulación de posibles esquemas de muestreo
La estimación de TSE, el error de muestreo total, es extremadamente fácil, ya que se
deduce directamente de los mismos cálculos básicos que asisten al variograma. Es
posible-en ningún muestreo adicional o coste analítico : para simular todos los
esquemas de muestreo concebibles que podrían ser contemplados para la mejora de un
procedimiento de muestreo actual. Todas las ilustraciones de salida VARIO anteriores
también contienen una función de estimación de TSE (panel inferior derecho en todas
las figuras).
Cualquier esquema de muestreo de proceso se caracteriza completamente por dos
parámetros únicamente: la tasa de muestreo, r , y el número de incrementos por
muestra, Q , que uno está dispuesto a emplear para reducir el TSE actual si se considera
grande. VARIO ha sido diseñado para evaluar todas las combinaciones posibles de Q a
la frecuencia de muestreo r  samp . Por razones prácticas, la frecuencia de muestreo a
menudo se cuantifica por la "distancia de retraso" inversamente relacionada. Para todos
los gráficos de resultados VARIO dados anteriormente, el panel inferior derecho ha
mostrado el TSE (error de muestreo total) estimado en unidades absolutas que
corresponden directamente con la serie de datos original para un diseño experimental de
dos factores en r  samp y Q respectivamente.
Para todos los ejemplos , se ha utilizado un conjunto de Q que abarca 1, 2, 4 y 8 ( el
usuario puede especificar cualquier conjunto alternativo apropiado de Q ). Esto
corresponde a la sustitución de todas las muestras individuales consideradas hasta
ahora, por muestras compuestas compuestas alternativamente de 2, 4 y 8 incrementos
(en lugar de un solo incremento), es decir, haciendo un uso óptimo de la ventaja de
muestreo compuesto también en el escenario de análisis de proceso; Estas muestras
alternativas están compuestas por el número apropiado de incrementos centrados en los
tiempos / ubicaciones de muestreo individuales correspondientes a la frecuencia de
muestreo decidida.
Además, VARIO también permite una especificación completamente libre de la
frecuencia de muestreo, r  samp .
Juntas, estas dos características opcionales permitirán la simulación de cualquier
esquema de muestreo potencial que pueda preverse para una situación de muestreo de
proceso particular. Basado solo en un conjunto de datos regulares de buena
fe (preferiblemente 60 muestras; mínimo absoluto 42 [11] ), todos los escenarios de
muestreo posibles se pueden simular sin costo adicional (suponiendo que el
experimento variográfico se haya llevado a cabo de manera correcta en TOS ,
naturalmente). Este conjunto de datos debe ser lo más representativo posible del
comportamiento del proceso prevalente. Siempre será un desafío específico y
dependiente del problema seleccionar dicho conjunto de datos; El conocimiento y la
experiencia del proceso local son importantes para cualquier empresa de este tipo, y es
mucho más importante que cualquier receta estadística estándar.
4.1 . Valor de las gráficas de estimación de TSE
Es fácil encontrar una estrategia de muestreo óptima mediante la inspección de la trama
de EET en función de la  muestra Q y r . Será muy instructivo revisar las gráficas de TSE
solo de todos los resultados VARIO anteriores y, por lo tanto, seguir cómo evaluar
cualquier esquema de muestreo alternativo. El mejor enfoque es inspeccionar las cuatro
"piedras angulares" del panel de TSE, y decidir en qué dirección proporcionará la
disminución de descenso más pronunciada en TSE. Esto será mediante el uso de una
mayor frecuencia de muestreo r  samp , o mediante el uso de más incrementos Q, para
formar la muestra final. Si ambos factores parecen influir de la misma manera, se puede
elegir cualquier combinación que también minimice las restricciones externas,
especialmente económicas o prácticas. A menudo, especialmente cuando se usa equipo
automatizado, es más fácil incluir más incrementos en una muestra compuesta que
aumentar la velocidad de muestreo. Sin embargo, esto depende en gran medida de la
situación de muestreo en cuestión. El usuario puede invocar su propia creatividad de
muestreo frente a las realidades de limitaciones económicas, prácticas u otras. Todas las
simulaciones de TSE son en tiempo real; No hay muestreo adicional ni cómputo
necesario.
5 . discusiones y conclusiones
El nivel del alféizar del variograma lleva información esencial re. La varianza muestral
en diferentes rezagos.
La tendencia del variograma contiene información esencial sobre el rango de tendencias
importantes en la serie de datos original.
Los valores atípicos y los incrementos extremos o irregulares influyen
significativamente en todos los variogramas, a veces de manera fatal. Los valores
atípicos siempre deben eliminarse (tal vez de forma secuencial). Los valores atípicos
significativos enmascaran y modifican el variograma verdadero subyacente en grados
serios. No se debe realizar ninguna interpretación de variograma antes de que se haya
asegurado la eliminación de valores atípicos. Los valores atípicos pequeños no influyen
demasiado en el variograma: los analistas de datos están obligados a desarrollar la
experiencia necesaria con la variografía.
La periodicidad de un variograma contiene información esencial sobre la dinámica del
proceso subyacente y / o la estructura de datos 1-D, por ejemplo, la variografía de dos
parámetros de biogás seleccionados revelaron ciclicidades con expresiones muy
diferentes y causas claramente diferentes, entendidas completamente solo cuando se
interpreta la información del variograma. se realizó en el contexto del problema
adecuado. La interpretación detallada de la información potencial presente en un
variograma conduce a una mayor comprensión del proceso. Las periodicidades no
reconocidas pueden tener fácilmente consecuencias económicas negativas
significativas.
Los tipos de datos especiales, ilustrados aquí por series de precios de productos básicos,
tienen una característica que no se encuentra en los variogramas relacionados con el
muestreo de sistemas físicos: sin efecto de pepita. ¡Tales conjuntos de datos no
incluyen ningún TAE, FSE, GSE ni ISE! Es concebible que esta estructura de datos sea
un complemento importante en el muestreo 1-D.
Las tendencias significativas en las series de datos originales a menudo pueden tratarse
ventajosamente de manera ventajosa para que se correspondan con el prerrequisito
geoestadístico de estacionariedad . Se ilustraron dos opciones para pretratamientos
efectivos antes del análisis variográfico: segmentación de tiempo y tendencia adecuada,
lo que lleva a una plataforma de interpretación significativamente mayor, especialmente
con respecto a la delineación más efectiva de periodicidades ocultas , esta última
acentuada más claramente por la dependencia dependiente del problema tendencias.
La interpretación detallada de las relaciones complejas de variogramas pertenece
al ámbito de la geoestadística . Una referencia autorizada para el análisis de
variogramas complejos es Gringarten y Deutsch [8] , muy recomendable.
Se ha demostrado cómo el TOS correcto, es decir, el muestreo representativo del
proceso 1-D constituye un requisito previo crítico para un análisis variográfico
confiable. El análisis de variogramas revela una multitud de estructuras de datos 1-D o
de proceso por un conjunto de solo tres parámetros sistemáticos: el umbral, el rango y el
efecto de pepita. Se describieron ejemplos didácticos seleccionados de los contextos de
las series de datos y su manifestación al interpretar los variogramas resultantes,
diseñados para ilustrar los aspectos prácticos del muestreo de procesos y la estimación
de los errores de muestreo total asociados, EET. Es posible simular cualquier
procedimiento de muestreo pertinente basado solo en el experimento variográfico, no es
necesario un muestreo adicional. Estimación de TSE para todas las
posibles muestras r y Q Las opciones permiten un comando completo de cualquier situación
de muestreo propuesta.
En el contexto del trazado de series temporales populares y simples de una plétora de
parámetros actuales de Tecnologías de Análisis de Procesos (PAT) con interpretación
directa, por ejemplo, SPC, SPC multivariante oa - se ha puesto de manifiesto que los
TOS de proceso pueden iluminar el estado del proceso, la variabilidad del proceso
(heterogeneidad ) y procesar estructuras de datos con un poder de interpretación
claramente más objetivo. El proceso TOS forma un enlace faltante para PAT.
5.1 . Proceso TOS vs. química analítica / quimiometría
El análisis variográfico del proceso siempre podrá descomponer las variaciones 0-D
frente a 1-D. Es especialmente útil poder cuantificar el MPE específico asociado con un
procedimiento de muestreo existente o cualquier alternativa contemplada. Todos los
errores de muestreo están cubiertos en el enfoque integral de TOS, incluida la suma del
error analítico total.
Sin embargo, no todos los errores analíticos y analíticos de datos pueden ser delineados
y presentados por el proceso TOS. Todavía es necesario estar alerta para, por ejemplo,
"errores analíticos sistemáticos (constantes)", que no pueden ser detectados solo por
variografía del proceso, pero se detectará un error sistemático variable, contribuyendo a
un sesgo de muestreo, es decir, inflando MPE. Todos los problemas pertinentes de
calibración y validación asociados con el análisis per se (químicos, físicos, otros)
todavía están en la agenda.
También vale la pena mencionar que ninguno de los problemas tradicionales de
calibración y validación analítica de datos en la quimiometría tiene ninguna relación
con los temas discutidos en este documento. El análisis de datos es el último paso en la
trinidad: muestreo-análisis-análisis / modelado de datos, y como tal no puede influir en
la presencia ni en la magnitud de ningún error de muestreo. No hay forma de que
alguna forma de "corrección de sesgo" pueda sustituir el muestreo correcto; Ni siquiera
es posible estimar la magnitud de un sesgo de muestreo. El muestreo inexacto siempre
conducirá a un sesgo de muestreo significativo, que solo puede reducirse aplicando
procedimientos de muestreo correctos, es decir, representativos [1] , [2] , [3] , [4] , [5] ,
[6] , [7] , [8] , [9] , [10] .
Estos temas tienen una profunda influencia en la discusión permanente dentro de la
quimiometría de los méritos pro. et con. con respecto a la validación cruzada versus la
validación del conjunto de prueba; Se incluyó una primera introducción a este tema
en [12] , complementada con antecedentes detallados
en [3] , [4] , [5] , [6] , [7] , [9] , [10] . En resumen, no puede haber información
completa sobre la variabilidad de los errores de muestreo en un solo conjunto de datos,
el "conjunto de datos de calibración", relativo tambiéntener acceso a un segundo dibujo
independiente de la "población" (en el lenguaje estadístico y quimiométrico), el
"conjunto de prueba". Solo al incluir este último en la validación analítica de datos , se
permitirá a todos los CSE + ISE su impacto total, que es crucial para la estimación
realista de errores de predicción (para tomar el caso de la calibración multivariada). Sin
embargo, este no es el lugar para una discusión completa de estos temas.
6 . Vario
VARIO fue programado por Hans Henrik Friis-Pedersen . VARIO es un programa
gratuito, disponible en la página web de ACABS ( www.acabs.dk ). El programa
permite importar datos de diferentes tipos, realizando análisis estadísticos básicos
además del análisis variográfico; Es fácil de usar y funciona tanto en conjuntos de datos
grandes como en pequeños. El presente documento puede ser visto como una guía del
usuario para análisis e interpretación por VARIO; Se puede encontrar más información
en la página de inicio.
Agradecimientos
Agradecemos a dos árbitros anónimos por las críticas académicas, penetrantes y útiles.

También podría gustarte