dimensional objects Muestreo de materiales discretos : III. Enfoque cuantitativo: muestreo de objetos unidimensionales Resumen La Parte III delinea las relaciones cercanas que existen entre los objetos cero y unidimensionales. El modelo unidimensional de corrientes de materia que fluye se presenta con suficiente detalle para apreciar cómo, sobre esta base, es posible realizar una caracterización completa de los diversos componentes de heterogeneidad involucrados. Esto se logra mediante el variograma , que forma la herramienta TOS unidimensional central para fines de muestreo prácticos. El variograma y sus características y propiedades se presentan en detalle. Se delinean los tres modos principales de selección de muestreo de los sistemas unidimensionales. Por último, se explica cómo un experimento variográfico permite estimar los errores de muestreo involucrados en una estrategia de muestreo particular.
Palabras clave Objeto de dimensión cero
Objeto unidimensional
Autocorrelación
1 . Interrelación entre objetos unidimensionales y cero.
Desde un punto de vista teórico, la diferencia entre los objetos unidimensionales y cero se refiere a una diferencia en la correlación interna ("autocorrelación") y en la escala de observación . Según la definición estricta de un objeto de dimensión cero, no existe, o debería existir, ninguna correlación entre sus componentes. Sin embargo, el concepto de autocorrelación no es binario (0 o 1): puede tomar cualquier valor entre estos dos límites. Las autocorrelaciones de cero o uno son límites prácticamente inaccesibles que suponen una homogeneidad distributiva completa del material en el primer caso 1 una segregación completa de los constituyentes en el segundo. Una herramienta de análisis muy poderosa, el variograma , se definirá en la Sección 3. Un variograma detecta y cuantifica la autocorrelación entre las composiciones de los materiales que se encuentran en dos puntos del eje del tiempo. Muestra la autocorrelación cuantificada en función de la distancia entre estos dos puntos, de hecho, representa la autocorrelación para un rango completo de inter-distancias. Por lo general, cuanto menor es la distancia, mayor es la autocorrelación entre ellos. Considere una gran cantidad de L , que fluye desde el tiempo t = 0 al tiempo t = T L . En el eje de tiempo, este lote L puede ser dividido en una secuencia de segmentos adyacentes de longitud uniforme T I . Cada uno de estos segmentos admite un incremento potencial , I , que podría usarse para muestrear el flujo. La autocorrelación de la serie temporal es perceptible en la escala del intervalo de tiempo total [0, T L ], pero generalmente es imperceptible en la escala de los segmentos de tiempo individuales. 2A todos los efectos prácticos, cada segmento de tiempo T I puede considerarse como un objeto de dimensión cero. De ahí la conclusión práctica de que para nuestros propósitos de muestreo, un objeto unidimensional L puede considerarse como una serie temporal de objetos adyacentes de dimensión cero. Esta relación nos permite utilizar algunos de los hallazgos fundamentales del caso de dimensión cero también en el caso unidimensional, aunque con el debido respeto por la situación intrínsecamente dinámica de una corriente de material que fluye. 2 . Modelo unidimensional: heterogeneidad de un lote L que fluye del tiempo t = 0 al tiempo t = T L * 2.1 . Descripción y cuantificación. 2.1.1 . Función descriptiva a ( t ) Definimos a ( t ) como el grado (proporción del componente A ) de un corte elemental de materia que fluye más allá del área, delineada por la abertura del cortador, entre los instantes t y t + d t. La cantidad a ser estimada es proporcional a la integral de un ( t ) de tiempo t = 0 y t = T L . Uno de nuestros problemas proviene del hecho de que nunca conocemos la expresión continua de a ( t ), lo que permitiría un cálculo de su integral. Lo mejor que puede hacer es sustituir la curva a ( t ) con una serie de estimaciones discretas a ( t 1 ) ... a ( t Q ), obtenidas mediante el ensayo de un número Q de incrementos I q tomados en instantes t 1 , t 2 … T q … t Q y(1)∘para sustituir la media aritmética:uns={un(t1)+un(t2)+...+un(tq)+...+un(tQ)}Q (2)∘para la media integral:unL=∫un(t)retTL Esta sustitución se presenta en la Fig. 1 : 1. Descargar: Descargar imagen a tamaño completo La Fig. 1 . Ilustración que muestra la sustitución de la integral continua bajo la curva ABCDE por una estimación discreta del área escalonada, centrada en las estimaciones muestrales de los grados a ( t 1 ), a ( t 2 ) ... Observe el período de muestreo T o . La curva ABCDE se reemplaza por la línea escalonada formada por los segmentos horizontales que pasan por los puntos de ordenada a ( t 1 ), a ( t 2 ), ... a ( t q ) ... a ( t Q ). La cantidad a ser estimado, el contenido crítico un L del lote L , es igual al área comprendida entre la curva y el eje de la abscisa, dividido por T L . El contenido desconocido a L es reemplazado por su estimador una S , calculada fácilmente como el área comprendida entre la línea escalonada y eleje( x ) de la abscisa dividida por el número Q de puntos experimentales. Esta sustitución genera un nuevo error de muestreo, que se estudiará en las siguientes secciones, pero primero mostraremos un ejemplo de cómo seveuna serie de estimaciones puntuales de a ( t ). 2.1.2 . Propiedades cualitativas de la función a ( t ) Ejemplo : en un experimento llevado a cabo en la alimentación a una planta de cemento, se tomó una serie de Q = 60 incrementos I q en un intervalo de tiempo constante T o = 2 min desde cierto lote L (2 h de alimentación al lecho de la planta sistema de mezcla). Cada incremento se secó, se pesó y se analizó mediante fluorescencia de rayos X para una serie de elementos y más específicamente CaO, el componente de particular interés en este caso . Luego, de acuerdo con la definición matemática dada por la ecuación. (7) de la Parte II, calculamos los 60 valores de la contribución h q de cada incremento I q a latiempo la heterogeneidad del lote L . Esta serie de tiempo se representa en la figura 2 . La serie de valores de a ( t q ) es prácticamente la misma que la de h q debido a la identidad práctica de las masas de incremento (no mostradas aquí). 1. Descargar: Descargar imagen a tamaño completo Fig.2 . Serie de muestras de plantas de cemento de Q = 60 incrementos, I q , tomados en un intervalo de tiempo constante T o = 2 min. Aquí se muestran las contribuciones individuales de heterogeneidad h q . 2.1.3 . Autocorrelación de la serie: división de h q en una suma de dos componentes Observamos una correlación obvia entre el valor de h q y su rango q (en el eje x ). Prácticamente todas las series de datos de este tipo general (series de tiempo, series espaciales) presentan las mismas características: un cierto grado de continuidad, una tendencia, superpuesta por fluctuaciones cuasialeatorias . Será útil para el próximo paso de nuestro estudio analizar los componentes de esta "señal" compuesta; en general, hablaremos solo de una "curva" para no crear confusión innecesaria. La forma de esta curva sugiere fuertemente la superposición de dos componentes : ○
Un componente continuo h 2 q responsable de las tendencias de largo alcance de
la curva, disminuyendo en la primera parte ( q <35) y aumentando en la segunda parte, ○
Un componente discontinuo h 1 q responsable de las fluctuaciones aparentemente
aleatorias de la curva alrededor de esta tendencia continua. Por lo tanto, interpretamos esto de modo que h q es la suma de dos componentes: h 1 q y h 2 q(3)hq=h1q+h2q Hemos analizado este tipo de funciones h ( q ) o a ( t ) [16] y propusimos las siguientes definiciones. ▪ Relación continua y cuasifuncional : para cada valor de q hay un valor bien definido de h ( q ). La principal propiedad de esta relación es el hecho de que es continua en todos sus puntos de curva constituyentes. ▪
Relación cuasialeatoria discontinua : para cada valor de q , el valor de h puede
considerarse extraído al azar de una población con una media m y una varianza σ 2 . La principal propiedad de esta relación es el hecho de que es discontinua en todos los puntos. ▪
Relación estocástica : existe una cierta ambigüedad sobre el significado del
adjetivo "estocástico". Para ciertos autores, es simplemente un sinónimo redundante de "aleatorio" . En su "Introducción a los procesos estocásticos" (1960), MS Bartlett define un proceso estocástico como "un proceso físico en el mundo real que tiene algún elemento aleatorio involucrado en su estructura". Hemos propuesto desde 1979 [16] reformular la definición de Bartlett de la siguiente manera: "Se dice que una relación es" estocástica "cuando tiene un elemento no aleatorio (continuo) y un elemento aleatorio (discontinuo) involucrado en su estructura "(el elemento continuo está implícito en la definición de Bartlett de" un proceso físico en el mundo real "). Así, la contribución h q de Iq es unafunción estocásticade q . Para separar estos dos componentes de una función estocástica, hemos implementado la técnica de la media móvil , descrita en la Sección 5.6.3 de la Ref. [16], hoy en día más conocido como el operador de media móvil. Como es bien sabido, al aumentar el número de grados de libertad, reducimos la importancia del componente aleatorio. Esta media móvil h mq ( m para media) se define de la siguiente manera (con un rango que cubre 11 valores, 3 centrados en h q ):(4)hmetroq=[hq-5 5+hq-4 4+hq-3+hq-2+hq- 1+hq+hq+1+hq+2+hq+3+hq+4 4+hq+5 5]/ /11=∼h2q La media móvil, o la media variable h mq , es un buen estimador de la componente continua h 2 q . La figura 3 representa esta media móvil, aplicada a la serie de valores de h q . Muestra muy claramente la tendencia continua de la serie. 4 4 1. Descargar: Descargar imagen a tamaño completo Fig.3 . Serie de muestras de plantas de cemento de Q = 60 incrementos, I q , tomados en un intervalo de tiempo constante T o = 2 min. Resultados suavizados , h 2 q , (o h mq ) del operador de media móvil. La diferencia entre el valor h q y el de la media móvil , h mq , es un estimador del componente discontinuo h 1 q . Escribiremos:(5)h1q=hq- hmetroqohq=h2q+hmetroq=∼h1q+h2q La figura 4 representa esta diferencia sola. Muestra bien la parte de discontinuidad de la serie.
1. Descargar: Descargar imagen a tamaño completo
Fig.4 . Serie de muestras de plantas de cemento de Q = 60 incrementos, I q , tomados en un intervalo de tiempo constante T o = 2 min. Resultados de restar la tendencia suavizada de los datos brutos, revelando el componente discontinuo , h 1 q . Las fluctuaciones de h 1 q son de hecho aparentemente similares a las fluctuaciones aleatorias . En la Fig. 5 , mostramos tanto la curva de h q como la de h 2 q . 1. Descargar: Descargar imagen a tamaño completo Fig.5 . Serie de muestras de plantas de cemento de Q = 60 incrementos, I q , tomados en un intervalo de tiempo constante T o = 2 min. Ilustración compuesta tanto del componente de tendencia suavizado con el componente discontinuo superpuesto. Aquí hemos presentado un medio simple para analizar la función descriptiva h ( t ), representada por la serie de valores de h q y dividirla en dos componentes principales. Este resultado será interpretado y completado en la Sección 4 . Ahora debemos ver cómo se puede caracterizar y cuantificar la heterogeneidad temporal de L y cómo se pueden relacionar los errores de muestreo con esta heterogeneidad temporal cuantificada . Este será el objeto de la Sección 3 . Las siguientes derivaciones son en gran medida análogas a las de la Parte II. 3 . El modelo unidimensional, que caracteriza la heterogeneidad de un lote fluido L 3.1 . El variograma Georges Matheron , el fundador de la ciencia conocida como geoestadística , ha estudiado ampliamente las series autocorrelacionadas como a ( t ) , es decir, la ciencia de la evaluación espacial de las llamadas "variables regionalizadas", por ejemplo, depósitos minerales que se extienden en tres dimensiones. Matheron desarrolló una serie de herramientas matemáticas esenciales, incluido el variograma, que también es exactamente necesario para resolver el problema unidimensional actual. 3.1.1 . Definición del variograma. Nosotros no conocemos la función de un ( t ): todo lo que podemos hacer es obtener una serie temporal de valores de punto de una ( t q ) con q = 1,2, ... Q . Por lo tanto, utilizaremos la notación a ( t q ), recordando que esta es solo una estimación de los valores verdaderos, siempre desconocidos. El variograma experimental (observado) está diseñado para caracterizar , cuantificar la autocorrelación de la función a ( t ) y servir como puente entre el conjunto de valores a ( t q ) y la varianza de muestreo involucrada al sustituir la serie de puntos valores para la curva completa a ( t ). Supongamos que Q = 60 incrementos de I q haber sido tomada en un habitual intervalo T o durante el paso de la porción entre el tiempo t = 0 y t = T L . Cada incremento se analiza (si es necesario, se seca, se pesa y finalmente) y se calcula su contribución h q = h ( t q ). Definiremos un parámetro de retraso auxiliar:j:un número(j=1,2,...,J)tal que:j<=Q-qoq+j<=Q. Δ h ( q , q - j ) = h q - h q - j : Δ h es, por lo tanto, el incremento algebraico de h ( t ) entre el tiempo t q y el tiempo t q - j . Estos dos puntos están separados en el eje de tiempo por el intervalo jT o , que se llama retraso de tiempo. Los valores individuales, o el signo de Δ h ( q , q - j) no son importantes: solo nos interesan sus propiedades estadísticas, cuantificadas por su media cuadrática para cada intervalo de tiempo. Es por eso que la función se llama variograma v ( jT o ). v ( j ) se define como el cuadrado semi-medio del incremento algebraico (aumento o disminución) de h ( t ):(6)v(j)=12(Q-j)∑q[Δh(q,q- j)]2variograma deh(t) ¿Por qué usar el cuadrado semi-medio y no solo el cuadrado medio? Suponga que los dos valores de h q y h q - j se toman al azar de una población con una media cero y una varianza σ 2 . Si se usara el valor del cuadrado medio en lugar del cuadrado semi-medio, el variograma sería un estimador de 2 σ 2 . Al usar el cuadrado medio medio, es un estimador de σ 2 , que es consistente . 3.1.2 . Cómo calcular el variograma experimental: ilustración para j = 2 Esto ilustra la forma en que el autor solía calcular los variogramas en los años 60, en un momento en que las computadoras aún no estaban disponibles, ¡inimaginable para los científicos de hoy, pero es cierto! Las series de valores de h q se escriben en dos columnas idénticas, la segunda se desplaza j = 2 líneas más abajo que la primera. En una tercera columna se escribió la diferencia, calculada mentalmente, entre la primera y la segunda columna. La señal, irrelevante, fue olvidada. Para j = 2, la primera diferencia computable es h 3 - h 1 y la última h 60 - h 58 . El número de diferencias utilizadas en el cálculo del variograma es Q - j = 60−2 = 58. Solo quedaba cuadrar cada diferencia y resumir estos cuadrados. La suma de los cuadrados finalmente se dividió por Q - j = 60−2 = 58 para obtener el cuadrado medio, luego por dos para obtener el valor de v (2). Mediante el desplazamiento progresivo posterior de la segunda columna, una línea hacia abajo a la vez, todos los valores del variograma para todos los rezagos j = 2,3,4 ... Q también podrían calcularse. En 1962, el cálculo de un variograma que involucra 60–100 datos o más podría tomar desde varias horas hasta un par de días. Hoy, con computadoras modernas y un conveniente programa de hoja de cálculo, solo lleva unos segundos. ¡Progreso! La varianza σ 2 ( h q ) de la población de valores de h q se llama el alféizar del variograma (que es un término derivado de la geología, que significa "losa plana"). Asumiremos ahora que la serie de datos sin procesar se ha utilizado para calcular un variograma experimental. Nada nos impide calcular todos los valores del variograma hasta v ( Q −1), pero por varias razones (véanse las Refs. [17–20]), se recomienda retener solo los valores de ( Q - j ) mayores o iguales a Q / 2 o 30, lo que sea mayor. Inicialmente, el variograma se usó solo para estimar la varianza del Error de selección de punto (PSE). Pero el cálculo de numerosos variogramas desde 1962 mostró que también revelaba una forma de fluctuaciones de la función h ( t ), que no se había tenido en cuenta adecuadamente, es decir, cualesquiera fluctuaciones cíclicas que estuvieran presentes. Un análisis teórico mostró que las fluctuaciones cíclicas podrían de hecho también generar muy importantes errores de muestreo, especialmente cuando se toma incrementos de la corriente a una constante intervalo T o , que pasó a ser un múltiplo del período Pdel ciclo. El variograma, por lo tanto, además ofrece la posibilidad muy importante de detectar fluctuaciones periódicas, potencialmente perjudiciales para el muestreo. Por esta razón, ahora presentaremos una serie de variogramas reales según lo observado a partir del muestreo en sectores industriales del mundo real. 3.1.3 . Ejemplos de variogramas. 3.1.3.1 . Primer ejemplo: variograma de la alimentación a una planta de procesamiento de mineral de uranio (contenido de U) Se tomó una serie de 60 incrementos en un intervalo de 2 minutos y se calculó el variograma v ( j ) para valores de j de 1 (59 grados de libertad) a 30 (30 grados de libertad). El variograma y su alféizar se representan en la figura 6 .
1. Descargar: Descargar imagen a tamaño completo
Fig.6 . Variograma de alimentación a una planta de procesamiento de mineral de uranio (contenido en U). Visualización clara tanto de un alféizar como de un efecto de pepita (consulte el texto para más detalles). Este variograma presenta una cierta tendencia lineal hasta aproximadamente j = 20-25 (40-50 min), después de lo cual aparentemente se aplana. Tal variograma es típico de funciones sencillas. 3.1.3.2 . Segundo ejemplo: variograma de la alimentación a un horno de cemento (CaO%). Se tomaron nuevamente una serie de 60 incrementos a los 2 minutos. intervalo; el variograma v ( j ) también se calculó para j del 1 al 30. El variograma experimental y el umbral correspondiente se muestran en la figura 7 .
1. Descargar: Descargar imagen a tamaño completo
Fig.7 . Variograma de alimentación a un horno de cemento (CaO%), que muestra evidencia de un patrón cíclico más complejo superpuesto en el variograma de umbral básico ( Fig. 6 ). Esta serie temporal contiene tanto una autocorrelación básica (para distancias entre muestras por debajo de j -lags 25) como también una ciclicidad algo irregular (período indicado de aproximadamente 9 lags). Este variograma es menos directo que el anterior. Su forma también sugiere la existencia de un término cíclico complejo. Se sabía que el caudal de esta alimentación estaba regulado aguas arriba del punto de muestreo. El dispositivo de regulación del caudal funciona de forma cíclica entre un máximo y un mínimo. Para revelar sus propiedades, también calculamos el variograma de masa incremental. 3.1.3.3 . Tercer ejemplo: variograma de la misma alimentación al horno de cemento que en la Fig. 7 (para la masa M q de los incrementos I q ) Este variograma de masa particular se representa en la figura 8 . 1. Descargar: Descargar imagen a tamaño completo Fig.8 . Incremente el variograma de masa de la misma alimentación al horno de cemento que en la Fig.7 . Observe cómo la ciclicidad del proceso de producción es mucho más evidente en las series de tiempo en masa. Este variograma es muy obviamente cíclico, lo que refleja la naturaleza cíclica de la fluctuación de masa incremental, en sí misma una consecuencia del funcionamiento del regulador del caudal. Gracias a la acumulación de grados de libertad al calcular el variograma, esta naturaleza cíclica se mejora en el variograma. Cuando, por ejemplo, calculando el variograma de una curva sinusoidal, sen x , es fácil mostrar que el variograma resultante también es una curva sinusoidal con el mismo período. Este período es obvio en la figura 8 . Observamos cuatro mínimos ( j = 0; 9; 18; 27 o jT o = 0, 18, 36 y 54 min), que corresponden respectivamente a 0, 1 C o , 2 C o , 3C o , y también observamos tres máximos (9, 18 y 27 min) exactamente en el medio de los intervalos de fluctuación. Es fácil calcular C o = 9 min, lo que se confirmó mediante la observación del regulador de caudal. Más adelante veremos que también necesitamos una estimación de v (0), que se ha denominado el "componente de discontinuidad" del variograma (en geoestadística, este componente se conoce como el "efecto de pepita", como en "pepita de oro" "—Pero esta terminología no está particularmente bien elegida, como veremos más adelante). Esta estimación no es proporcionada por el variograma, ya que este último solo puede calcularse para j ≥1. En el caso de un variograma cíclico, la Fig. 8 sugiere (lo que confirma la experiencia adicional) que la mejor estimación (mejor porque se obtuvo con el mayor número de grados de libertad) de v (0) es igual a v ( C o), tal vez calculado como un promedio durante más ciclos (compárese con la Fig. 8 ). 4 . Modelo unidimensional: desglose h q y el variagrama v ( h q ) 4.1 . Romper h q Hemos visto arriba, la ecuación. (3) , que h q era, a primera vista, la suma de dos componentes principales: h 1 q y h 2 q . Pero como se mostró en nuestro libro de texto [18] (Capítulo 5), esto es a menudo un poco más complejo. En el caso más general, h q es de hecho la suma de cuatro componentes:(7)hq=h1q+h2q+h3q+h4 4q h 1 q es el componente de discontinuidad (compárese con la Fig. 4 ). Tiene en cuenta las heterogeneidades constitucionales y distributivas observadas en la escala de los incrementos I q . Es responsable de los errores asociados con el modelo de dimensión cero (Parte II). Estos errores son especialmente observables con sólidos en partículas, como se observa en la figura 4 . Sin embargo, con los líquidos suelen ser imperceptibles. h 2 q es el componente no cíclico de continuidad . Tiene en cuenta las fluctuaciones macroscópicas, las tendencias , observadas en la escala general del lote L e ilustradas en la figura 3 . Es responsable del error de fluctuación de tiempo (no cíclico) (TFE) (modelo unidimensional sin fluctuaciones cíclicas). h 3 q es el componente cíclico de continuidad. Sólo toma en cuenta las fluctuaciones observadas en la escala del lote L . Es responsable del error de fluctuación cíclica (CFE)adicional (tiempo) observado cuando hay fluctuaciones cíclicas, como se ilustra en la figura 8 .(8)Error de selección de punto:PSE=TFE+CFE h 4 q es el componente aleatorio de h q que tiene en cuenta todos los errores de medición , involucrados en la estimación de h q , es decir, muestreo, pesaje, procesamiento de muestras, análisis, etc. 4.2 . Romper v ( j ) Hemos demostrado que, a todos los efectos, el variograma de una suma de términos independientes es igual a la suma de los variogramas individuales de estos términos. Con v 1 ( j ), v 2 ( j ), v 3 ( j ) y v 4 ( j ) son los variogramas de h 1 q , h 2 q , h 3 q y h 4 q , respectivamente:(9)v(j)=v1(j)+v2(j)+v3(j)+v4 4(j) El variograma v 1 ( j ) del componente discontinuo h 1 q es una constante v 1 igual a la varianza σ 2 ( h 1 q ) de los verdaderos valores desconocidos de h 1 q . Esta variación resulta de la distribución heterogeneidad del lote L en la escala de los incrementos extraídos de L . Se ha expresado en la Parte II de este artículo como igual a la Heterogeneidad Distributiva (DH L ).(10)v1(j)=v1=DHL=v1(0 0)=Constante>0 0 El variograma v 2 ( j ) del componente continuo no cíclico h 2 q es una curva que comienza desde el origen de las coordenadas, ya que el variograma de una función continua se cancela para j = 0.(11)v2(0 0)=0 0 El variograma v 3 ( j ) del componente cíclico continuo h 3 q también es una curva cíclica que comienza desde el origen de las coordenadas, ya que, de hecho, el variograma de una función continua se cancela para j = 0. El variograma de y = h 3 sen 2 π j / P es (con v 3 = h 3 2 ).(12)v3(j)=v3(1-cos2πj/ /PAG)por lo tantov3(0 0)=0 0 El variograma v 4 ( j ) del componente aleatorio h 4 q es una constante igual a la varianza v 4 de los errores aleatorios asociados con la estimación de h q .(13)v4 4(j)=v4 4=Constante>0 0 La intersección v (0) del variograma v ( j ), es decir, el "efecto de pepita", se debe ver como la suma compuesta de las dos constantes v 1 y v 4 .(14)v(0 0)=v1+v4 4=Constante>0 0 Al ser la suma de dos variaciones de cantidades distintas de cero, v (0) es siempre una cantidad estrictamente positiva , lo que se confirma por experiencia: todos los variogramas tienen una intersección positiva. Por lo tanto, el efecto de pepita de término de los geoestadísticos , una expresión nunca aprobada completamente por el presente autor, es un concepto demasiado limitado, que no tiene en cuenta el hecho de que una parte significativa de v (0) también refleja errores de muestreo, procesamiento de muestras y ensayos. , todo lo cual no tiene nada que ver con pepitas físicas . 5 . Modelo unidimensional: desde el variograma hasta la varianza del error de selección de punto, σ 2 (PSE) 5.1 . Funciones auxiliares del variograma. No existe un vínculo directo entre la varianza de muestreo y el variograma. Debemos definir un cierto número de funciones auxiliares que se utilizarán para expresar la varianza de muestreo buscada. ▪
La integral única S ( j ) del variograma v ( j ),
▪
El valor medio w ( j ) de S ( j ),
▪
La integral doble S '( j ) del variograma v ( j ),
▪
El valor medio w ′ ( j ) de S ′ ( j ).
Para construir el variograma tenemos las series de puntos v (1), v (2), .. v ( q ), ... v ( Q ). ¿Cómo podemos calcular o estimar estas funciones auxiliares necesarias para la estimación de la varianza de muestreo? Los geoestadísticos han asumido el hábito de modelar los variogramas por medio de funciones algebraicas manejables que son fáciles de integrar al calcular S ( j ), w ( j ), S ′ ( j ), w ′ ( j ) .Lo mismo hizo el autor, cuando estaba implementando el variograma por primera vez, ca. 1960-1962. Pero pronto se descubrió, por experiencia, que esta estimación de la varianza muestral era tan buena o tan mala como la aplicabilidad, la validez, del modelo algebraico particular.usado. Dentro de la geoestadística hay cierta discusión sobre el uso de un conjunto de modelos estándar algo estilizados. Pero dentro del desarrollo de la teoría del muestreo, nuestra atención pronto se dirigió al hecho más serio de que, mientras que para los minerales y muchos tipos diferentes de materiales industriales, las fluctuaciones cíclicas eran más frecuentes de lo que cualquiera había esperado, eran raras en geología. Además, el modelado de tales fluctuaciones, que cuando es regular puede aproximarse mediante una suma de términos trigonométricos (p. Ej., Sinusoidales), era prácticamente imposible debido al hecho de que los períodos y las amplitudes de los fenómenos no eran necesariamente constantes: un buen ejemplo es presentado en el Capítulo 10 [15]. 5.2 . Cálculo punto por punto de una integral En lugar de buscar un modelo algebraico complicado y cuestionable, decidimos adoptar un cálculo aproximado de punto por punto de las integrales ilustradas en la figura 9 .
1. Descargar: Descargar imagen a tamaño completo
Fig.9 . Alternativa de cálculo integral punto por punto de TOS a la integración de la curva algebraica de variogramas para los pequeños rezagos, digamos 1-8. Esta integración gráfica conduce a una estimación de extrapolación hacia atrás de v (0). Lo que se llama un experimento variográfico proporciona un cierto número de puntos: v (1), v (2), ... v (8) para este cálculo. Pero no proporciona v (0). Por lo general, estimamos esto último por extrapolación gráfica (o, en raras ocasiones, por algebraica) de la serie v ( j ) hacia cero . Luego, hacemos dos hipótesis muy simples, naturales y realistas: ▪
El variograma real, desconocido, que queremos integrar, contiene todos los
puntos experimentales v ( j ) más la estimación de v (0) ▪
El variograma real, desconocido, es lineal entre dos puntos consecutivos.
Esto se ilustra esquemáticamente en la figura 9 . La integral de v ( j ) es el área comprendida entre la línea de escalera en negrita que une (de derecha a izquierda) v (8) a v (0) y el eje de la abscisa. Consideraciones geométricas muy simples muestran que esta estimación de la integral de v ( j ) entre j = 0 y J = 8 en esta figura es igual a: (15)Integral dev(j)=1/ /2v(0 0)+v(1)+...+v(J-1)+1/ /2v(J) Este método es extremadamente fácil de informatizar. Este esquema se ha implementado muchas veces desde su inicio y no necesita restar valor a nadie por su complejidad; Las hojas de cálculo actuales son excelentes vehículos para todos los cálculos necesarios. De hecho, el mismo programa puede en un primer paso calcular todos los valores de variograma v ( j ) y, en un segundo paso, los de todas las funciones auxiliares S ( j ), w ( j ), S ′ ( j ) y w ′ ( j ) de acuerdo con sus definiciones específicas. Solo hay un pequeño paso entre los cálculos manuales descritos anteriormente (difícil y muy laborioso) y la Fig. 9, pero estos últimos representan un acceso universal moderno de salto gigante a la poderosa instalación del variograma . 5.3 . Modos de selección La varianza de muestreo que queremos determinar no es solo una función de las funciones auxiliares del variograma, sino también de la forma particular en que se seleccionan los incrementos de puntos en el eje de tiempo, es decir, dependiendo de la estrategia de muestreo particular que uno desee adoptar. Uno puede imaginar una infinidad de modos de selección, pero en principio solo hay tres: ▪ Modo SY: selección sistemática con intervalo uniforme T SY entre incrementos consecutivos. El primer incremento I 1 se selecciona al azar (para garantizar la corrección) en el tiempo t 1 , entre t = 0 y t = T SY . Todos los incrementos I 2 , I 3 ... I q ... I Q se colocan en el eje del tiempo a una distancia igual T SY de sus vecinos. Es muy simple usar un temporizador, establecido en un intervalo T SY, que inicia la unidad de muestreo cada tantos minutos o segundos. ¿Por qué, por lo tanto, imaginar y usar modos de selección más complicados? Por una sola razón: en el caso de fluctuaciones cíclicas cuantitativas y / o cualitativas con un período P prácticamente constante (ver Fig. 8 ), una selección sistemática con un intervalo T SY igual a P o a un múltiplo de P daría como resultado un riesgo de, erróneamente, estimar una variación muy grande del Error de Selección de Punto (PSE). Nuestra experiencia ha demostrado que en unidades industriales,tales fluctuaciones cíclicas de calidad y caudal son, de hecho, muy frecuentes (es la regla más que la excepción) . Veremos ejemplos de esto a continuación. Es para suprimir este riesgo que también se pueden implementar otros modos de selección. ▪ Modo ST: selección aleatoria estratificada con longitud de estratos uniforme T ST . En un primer paso, el lapso de tiempo T L durante el cual fluye el lote L se divide en una secuencia de estratos de igual longitud T ST . En un segundo paso, se selecciona un incremento de puntos al azar (por lo tanto, correctamente) dentro de cada estrato. Supongamos que las fluctuaciones cíclicas son más o menos sinusoidal (sólo para las ideas fix), con un periodo P . Con una selección sistemática , si T SY es igual a P , la Qlos incrementos de puntos tienen la misma posición en la curva sinusoidal. En otras palabras, con respecto al Error de Selección de Punto (PSE), una muestra de incrementos de Q no produce más información que una muestra compuesta de una sola: esto resulta en una pérdida de reproducibilidad y / o pérdida de dinero. Si, por el contrario, implementamos una selección aleatoria estratificada con una longitud de estrato T ST igual a P , cada punto se selecciona al azar dentro decada ciclo de la curva sinusoidal. Sin embargo, en la práctica, si el riesgo existe, puede considerarse pequeño, pero el teórico tuvo que describir y cuantificar este riesgo. Esto se hizo en la Ref. [13] ya en 1967. Los dispositivos fueron inventados y patentados para generar secuencias de instantes que simulan este modo de selección (1965, 1966 y 1968). ▪ Modo RA: selección aleatoria directa de Q puntuales incrementos . Se elige un cierto número Q de incrementos para formar la muestra. Entonces, Q instantes son seleccionados al azar entre t = 0 y t = T L . Este modo de selección nunca es mejor que los otros dos . Se menciona aquí por una sola razón: todavía es recomendado por ciertos estándares, mientras que este modo debe abandonarse por completo para el muestreo unidimensional. ▪ Parámetros característicos: T SY, T ST y Q son los parámetros característicos de estos tres modos de selección. ▪ Comparación de las variaciones de selección : en los ejemplos presentados en nuestros libros, la variación de selección de puntos σ 2 (PSE) se calcula para los tres modos de selección presentados anteriormente. Estos ejemplos muestran que: ∘
En ausencia de fluctuaciones cíclicas , la varianza del modo SY siempre es
ligeramente menor que la del modo ST y mucho menor que la del modo RA . ∘
En presencia de fluctuaciones cíclicas , la varianza del modo ST es Q veces
menor que el máximo de la varianza del modo SY, y menor que la de RA . 5.4 . Funciones generadoras de errores W ( j ) En nuestro enfoque de variograma, las funciones generadoras de errores están destinadas a desempeñar el mismo papel, en el modelo unidimensional, que la varianza en el modelo de dimensión cero [18,20]. Cuando se conocen estas funciones, la varianza de muestreo, aquí la varianza de selección de puntos, se puede obtener simplemente dividiendo la función generadora de errores por el número Q de incrementos. Por supuesto, hay tres funciones generadoras de errores, una para cada modo de selección alternativa: W SY ( j ), W ST ( j ), W RA ( j ). Se derivan de las funciones auxiliares a continuación. 5 5Las derivaciones reales no se dan aquí, ya que son de una naturaleza más técnica, lo que no es necesario para apreciar plenamente su función: nos permiten estimar los errores de muestreo correspondientes asociados con las tres estrategias de muestreo alternativas.(dieciséis)■Selección sistemática:WSY(j)=2w(j/ /2)-w′(j) (17)■Selección aleatoria estratificada:WST(j)=w′(j)(18)■Selección aleatoria directa:WRUN(j)=σ2(hq)=DHL=constante 5.5 . Variación del error de selección de puntos (PSE) Aquí nuevamente, distinguiremos lo siguiente:(19)■Selección sistemática:σ2(PSE)SY=WSY(j)TSY(j)TSY/ /TL(20)■Selección aleatoria estratificada:σ2(PSE)ST=WST(j)TST/ /TL(21)■Selección aleatoria directa:σ2(PSE)RUN=WRUN(j)/ /Q=DHL/ /Q 6 . Recapitulación: modelo unidimensional Hemos podido desarrollar un enfoque de estimación completo para la varianza del error de selección de punto σ (PSE). Este enfoque consiste en: 2
Tomando del flujo un cierto número Q (tan grande como sea económicamente
posible, pero preferiblemente siempre mayor que 60) de incrementos I q , cubriendo todo el dominio {0, T L }, con un intervalo de tiempo constante T o ▪
(Secado, pesaje, si corresponde, y) ensayo de cada uno de estos incrementos
de Q I q . ▪
Lograr los siguientes cálculos mediante un simple programa de computadora:
▪
Calcular el valor de h q para cada incremento I q
▪ Calcular los valores consecutivos del variograma v ( j ) ▪
Estimando el valor de v ( 0 ), completando así las series v (0), v (1), v (2), etc.
( Fig. 9 ) ▪
Calcular el valor de todas las funciones auxiliares necesarias S ( j ), w ( j ), S ′
( j ) y w ′ ( j ) ▪
Calcular el valor de las funciones generadoras de
errores W SY ( j ), W ST ( j ), W RA ( j ) ▪
Calcular el valor de las variaciones de muestreo en consecuencia (ver también
la Sección 7 a continuación). 7 . Modelo y variogramas experimentales: muestreo de varianzas calculadas al final de un experimento variográfico Debemos distinguir cuidadosamente entre el variograma modelo v mod ( j ), que supone que los valores verdaderos de h q son conocidos e implementados en nuestros cálculos, y el variograma experimental v exp ( j ). Con el modelo variogram v mod ( j ), las ecuaciones. (19) , (20) , (21) expresan las variaciones del error de selección de punto (PSE) propiamente dicho. En la práctica, sin embargo, nunca estamos tratando con los valores verdaderos y desconocidos de h q, sino con las estimaciones experimentales., siempre alterado por muestreo, procesamiento de muestras, pesaje y análisis o errores de ensayo. En este caso, debemos calcular el variograma experimental v exp ( j ); las funciones auxiliares correspondientes w exp ( j ) y w ′ exp ( j ) y las funciones generadoras de errores W exp ( j ) relacionadas con esto. Las expresiones (19–21) dan como resultado el valor de la varianza del Error de muestreo total (TSE) que incluye no solo el Error de selección de punto (PSE) sino también incluye todos los errores experimentales anteriores, reconocidos como los "errores de dimensión cero". La diferencia más notable entre el modelo y los variogramas experimentales se refiere al valor de v (0).(22)Por definición:vmodificación(0 0)=0 0mientrasvExp(0 0)=v0 0>0 0(Nunca0 0) A todos los efectos, v 0 representa la varianza de todos los errores experimentales ; más específicamente, la varianza de los errores de muestreo de dimensión cero CSE + ISE, así como los errores analíticos totales (TAE) (que, sin embargo, generalmente son insignificantes, Parte I). El error de selección de punto (PSE), por definición, no está incluido en v 0 pero está dado por las ecuaciones. (19) , (20) , (21) . 8 . Errores cometidos durante el muestreo unidimensional: división del error de muestreo total, TSE La práctica operación de muestreo se puede dividir en dos fases independientes: Fase 1: Selección de un número determinado Q del inmateriales incrementos puntuales I . En términos generales, esta primera fase genera el Error de selección de punto (PSE). Esta selección suele ser correcta . El error de selección de punto (PSE) es arquetípico del modelo unidimensional. En el caso más general, el PSE se puede dividir en una suma de dos, y solo dos, componentes: ○
Error de fluctuación de tiempo, TFE (no cíclico)
○
Error de fluctuación cíclica, CFE
(23)PSE=TFE+CFE
Fase 2: Extracción de los incrementos de material correspondientes sobre los Q puntos
seleccionados. Esta operación, que se llama "materialización de los incrementos de punto", se lleva a cabo en la escala de grupos de elementos , donde es aplicable el modelo de dimensión cero . La materialización de los incrementos puede ser probabilística o no probabilística (Parte I, Sección 7, Fig. 6). Cuando este muestreo no es probabilístico , no hay forma de pronosticar los errores generados, ya que no existe un enfoque teórico posible para el muestreo no probabilístico. Cuando es probabilístico , el modelo de dimensión cero desarrollado en la Parte II es completamente aplicable. Los mismos errores están involucrados aquí, a saber: ○
Errores de muestreo correctos (CSE): CSE es la suma de dos, y solo dos,
componentes: ▪
Error de muestreo fundamental, FSE
▪
Error de agrupamiento y segregación, GSE(24)CSE=FSE+GSE
○ Errores de muestreo incorrectos (ISE): ISE es la suma de tres, y solo tres, componentes: ▪
Error de delimitación incorrecto, IDE
▪
Error de extracción incorrecto, IEE
▪
Errores de procesamiento incorrectos, IPE(25)ISE=IDE+IEE+IPE
Fases 1 + 2 para el modelo unidimensional: el error de muestreo total (EET) involucrado cuando el muestreo es probabilístico es la suma de siete, y solo siete , componentes divididos en tres grupos según las ecuaciones. (23) , (24) , (25) : (26)EET=PSE+CSE+ISE=(TFE+CFE)+(FSE+GSE)+(IDE+IEE+IPE) Esto completa nuestra introducción tutorial al muestreo unidimensional. El formato asignado no permite más elaboraciones aquí. Sin embargo, la introducción en la Parte III se relaciona razonablemente con las presentaciones aumentadas en [20], que contienen muchos más detalles.
Aplicación de Modelos de Series de Tiempo para La Predicción A Corto Plazo de La Producción de Post - Larvas de Camarón en La Empresa Farallon Aquaculture S.A. Las Peñitas, Leon.