Está en la página 1de 7

Universidad Nacional Mayor de San Marcos

Facultad de Ingeniería Geológica, Minera,


Metalúrgica y Geográfica
Escuela Profesional de Ingeniería Geológica

“Ajuste de mínimos cuadrados de la nube de variogramas”

Resumen

Asignatura: Geoestadística
Docente: Félix Cornelio Orbegozo
Elaborado por:
GRUPO 3

• Alcocer Sánchez, Jheferson


• Bustos Lostaunau, Alexandra
• Baldoceda Dionisio, Anghelo
• Huaman Rosas, Roxana Elizabeth
• Huarilloclla Ramirez, Merly
• Laura Paima, Diego

Enero, 2021
Ajuste de mínimos cuadrados de la nube de variogramas
Werner G. Müller

1. Introducción

En el análisis de datos geoestadísticos, la dependencia espacial de segundo orden generalmente


se caracteriza por un variograma

En aras de la simplicidad, supongamos que Z(.) es intrínsecamente estacionario, isotrópico


(bidimensional) campo aleatorio que se muestrea en n ubicaciones, produciendo datos Z (s1); Z
(s2),…, Z(sn). Supongamos también que el variograma sigue una forma paramétrica conocida, de
modo que tenemos las propiedades

donde denota la distancia (en una métrica adecuada) entre los sitios si y sj .
Es natural estimar el variograma por

Para el estimador de variograma clásico de Matheron (1963), el conjunto (intervalo de distancias)


Hk contiene todos los pares de puntos con distancias tales que hij = hk (hk es la secuencia ordenada
de todas las K distancias distintas); Nk denota el número de pares que caen en el contenedor
respectivo. Si los datos provienen de una cuadrícula irregular, estos contenedores suelen ser
ampliados para cubrir un determinado vecindario de cada hk. Los contenedores, que están
centrados en hk, deben estar separados y garantizar que .

Un ajuste paramétrico del (semi-) variograma generalmente se encuentra por regresión de


mínimos cuadrados a través de los puntos . Las 'observaciones' son generalmente
correlacionadas, como cada una de las n observaciones originales puede contribuir a la generación
de varios . Por tanto, los mínimos cuadrados ordinarios producen estimaciones ineficientes, y
situación requiere una estimación generalizada de mínimos cuadrados, es decir

(2)

donde ,y .
La sugerencia de ignorar la estructura de correlación (por simplicidad computacional) se remonta
a Cressie (1985), que utilizó el siguiente estimador de mínimos cuadrados ponderados basado en
(2):

(3)

Los pesos en (3) están motivados por la suposición de que Z(.) es un campo aleatorio gaussiano,
para lo cual tener
donde la última aproximación produce sólo una pequeña pérdida en la eficiencia de la estimación
(cf. también Cressie, 1985). Probablemente debido a su forma simple, el estimador se convirtió
en uno de los más utilizados en la estimación de variogramas. Sin embargo, varios autores han
notado un comportamiento deficiente de la muestra finita (ver McBratney y Webster, 1986; Zhang
et al., 1995). Una simulación estudio de Zhang et al. (1995) y la Sección 4 respalda esta
afirmación.

Debe enfatizarse que el supuesto de cero elementos fuera de la diagonal de Cov ( ) apenas se
cumple en práctica. Estrictamente, solo es válido para variogramas con 'rango' finito r (es decir,
pares de observaciones no correlacionadas de ubicaciones que están más alejadas que r) y un
esquema de muestreo específico. Tal esquema consiste en un espacio diseño de pares de puntos
que son remotos entre sí (para un algoritmo respectivo para su construcción, y la supresión de
'observaciones' con alto nivel de ruido (es decir, desde distancias muy grandes hk ≫ r). Así,
aunque el supuesto de es muy poco realista será un valor ilustrativo para la
investigación de las posibles deficiencias del variograma de mínimos cuadrados generalizados o
ponderados estimados.

2. Ajuste directo desde la nube de variogramas

Con la potencia informática actual (y en ausencia de valores atípicos graves) no hay muchas
razones para no utilizar la información completa de los datos evitando agruparlos en contenedores
y promediarlos (al menos para problemas de mediana escala). Un caso particular de (1) es elegir
cada H k para que contenga solo un elemento hij, es decir, . La colección
de pares (hij ; ) se llama entonces la (semi) nube variograma y podemos intentar estimar
directamente desde la nube (semi-) variograma sin agrupamiento previo y promediando.

Aunque este procedimiento sugiere una estimación eficiente a partir de la información total,
resulta que el comportamiento desfavorable de la muestra finita del ajuste por mínimos cuadrados
ponderados es aún más pronunciado aquí. Al investigar las posibles causas de esta deficiencia y
para encontrar una posible corrección es natural emplear teoría asintótica. Tenga en cuenta que la
consistencia del estimador de mínimos cuadrados ponderados no está en peligro bajo los
supuestos bajo asintóticas de 'dominio creciente') de Cressie (1985) (es
decir, agrupando con un número fijo de contenedores), sin embargo, aquí investigamos el caso
, por lo tanto, K → ∞ (estimación de la nube de variogramas).

Se vuelve muy transparente que es en este sentido un estimador inconsistente si se encuentra


por minimización de (3) bajo el esquema de muestreo anterior. La adopción de la prueba de
inconsistencia de Fedorov (1974) nos permite encontrar una simple corrección de . Podemos
separar el 'observaciones' , donde denota el parámetro verdadero. La suma a
minimizar de (3) también se puede separar en el límite en

Debido a la ley de los grandes números, esto da


y después de multiplicar y reagrupar encontramos que es equivalente a minimizar

y así estima consistentemente en lugar de


Tenga en cuenta que para el caso más general (2), otras distribuciones y una clase más amplia de
esquemas de muestreo (especialmente el estimador binned 'clásico') una prueba tan simple y una
corrección resultante no están disponibles. Nunca-Sin embargo, es bien sabido (al menos en un
escenario no correlacionado - cf. Fedorov, 1974) que los mínimos cuadrados ponderados. Los
estimadores, con ponderaciones que involucran los parámetros a estimar como (3), pueden ser
inconsistentes, lo cual es generalmente establecido por un sesgo permanente de las funciones de
estimación correspondientes (ver, por ejemplo, Heyde, 1997). Aquí, dado que la matriz de
covarianza también es en general una función de los parámetros , la estimación
funciones relacionadas con (2)

i = 1,…., p (el número de parámetros), también están sesgados.

Además, los resultados de la simulación de muestra pequeña en la Sección 4 indican que los
asintóticos estudiados pueden tener algún valor explicativo también para el estimador agrupado,
especialmente cuando el número de intervalos es grande en relación con el número de
observaciones y el factor de corrección 1/3 resulta útil también en estos entornos.

3. Reponderación iterativa

Si el número de observaciones es relativamente pequeño y si los recursos computacionales lo


permiten, se puede encontrar un estimador consistente más elaborado. En este contexto se ha
sugerido la técnica de reponderación iterativa ya por Cressie (1985) y fue utilizado por varios
autores sin justificar la causa. Fue nuevamente Fedorov (1989), quien correctamente argumentó
para y describió un algoritmo iterativo para el caso

Para el caso más general (2), este algoritmo se puede adaptar fácilmente. Esta versión, que fue
independiente propuesto por Genton (1998) con el propósito de ajustar semivariogramas
empíricos, es sin embargo computacionalmente mucho más intensivo y requiere la inversión de
una matriz K × K en cada paso:

Para un campo gaussiano y tenemos (cf. de nuevo Cressie, 1985)

donde , y las entradas de se pueden calcular a partir de una versión


paramétrica de (4).
En la práctica, las iteraciones deben iniciarse en una estimación inicial (digamos ). El
procedimiento luego cede Estimaciones asintóticamente eficientes y consistentes. Para obtener
una descripción general de dichas propiedades y más detalles, consulte del Pino (1989).

4. Resultados de la simulación

Para evaluar el comportamiento de muestra pequeña de los estimadores discutidos, un gran


número de experimentos de simulación ha sido interpretado. Los campos aleatorios gaussianos
con un variograma preespecificado se generaron aleatoriamente sitios seleccionados en el
cuadrado de la unidad. Como criterio de rendimiento, la distancia de Mahalanobis de la
estimación a Se eligió el variograma verdadero sobre todos los contenedores, es decir,
. El OLS y el las estimaciones de WLS (tanto en su binned y su
versión de nube de variograma), las estimaciones corregidas y Se compararon
las estimaciones de GLS iteradas .Para fines prácticos y una mejor comparabilidad,
tenemos usó la aproximación

lo que parece razonable para todos comparados.


El modelo de variograma paramétrico quizás más utilizado, el llamado (semi) variograma esférico

estaba equipado. Este (semi) variograma aumenta monótonamente desde un 'efecto pepita' de
cerca del origen a un 'valor umbral' de , que se alcanza en el 'rango' .

La Fig. 1 representa un caso típico de comportamiento relativo de las estimaciones del


variograma. La línea continua suave da el variograma verdadero, la línea sólida no suave da la
estimación del variograma clásico (con K = 10), la línea punteada es la estimación de OLS, la
línea punteada representa y la línea discontinua representa los últimos tres se
estiman a partir de la nube de variogramas.

El gráfico aparentemente indica que está considerablemente sesgado también en


muestras pequeñas, que pueden ser mejorado multiplicando el factor de corrección 1/3. De hecho,
resultó como resultado general que también la versión agrupada de está sesgada, incluso
para tamaños de agrupación moderados. La diferencia de desempeño del otro considerado
estimadores es más pronunciada cuanto menor es la influencia del efecto pepita. Por tanto, y por
brevedad informe en la Tabla 1 solo los resultados para , se pueden volver a calcular
otros ajustes utilizando el GAUSS-386.

La distribución de cualquier medida de desempeño en este contexto está muy sesgada. Por lo
tanto, la media y la se informa una mediana de más de 1001 carreras. Se puede ver que a medida
que n crece el rendimiento del ajuste mejora excepto por el método WLS "puro", que da resultados
muy pobres incluso para tamaños de muestra grandes. Sin embargo,

Fig. 1. Nube (semi) variograma y varios estimadores (semi) variograma para un conjunto típico
de datos simulados de 25 observaciones, horizontal h, vertical .

Tabla 1
Media (línea superior) y mediana (línea inferior) del criterio de rendimiento de varios
estimadores de variogramas (Â t = (1; 10; 1) T ; K = 10 para estimadores agrupados)

es evidente que el estimador WLS mantiene su deficiencia, cuando el número de bins es


relativamente grande en comparación con el tamaño de la muestra. Además, es notable que el
estimador WLS corregido tiene un excelente comportamiento medio, aunque los esquemas de
muestreo considerados pueden ser considerablemente diferentes del supuesto en el cálculo de la
corrección. Su desempeño mediano, sin embargo, es peor que el de los estimadores OLS, lo que
indica que este último está más fuertemente influenciado por casos extremos.

5. Conclusiones

Si el número de sitios de observación no es muy elevado, parece recomendable renunciar al


binning (y con ello pérdida de información) y trabajar directamente con la nube de
semivariogramas. Este punto de vista proporciona un tipo diferente de asintóticos como se
considera normalmente en la estimación de variogramas. La muestra finita pobre evidente el
comportamiento del estimador de variograma de mínimos cuadrados ponderados (directo)
(incluso bajo binning) tiene entonces una simple explicación.

Estos asintóticos y los resultados de la simulación también indican que es preferible emplear un
método iterativo estimador de variogramas de mínimos cuadrados generalizados reponderados
basado en la matriz de covarianza completamente especificada, que no es una práctica
geoestadística estándar. Todos los demás métodos basados en mínimos cuadrados son claramente
menos eficientes o incluso, como se muestra, potencialmente defectuoso. Sin embargo, cuando el
número de sitios crece (lo que suele ser el caso en la práctica) podría ser aún más conveniente
emplear el WLS, siempre que el factor de corrección dado en este se aplica papel.

Tenga en cuenta que otra fortaleza del ajuste a la nube de variogramas radica en evitar la elección
arbitraria
del número de intervalos de distancia (K) que en otros enfoques de mínimos cuadrados pueden
tener un impacto crítico en las estimaciones de parámetros. Esta propiedad deseable es compartida
por la verosimilitud (cf. Cressie, 1993) y bayesiana (cf. Ecker y Gelfand, 1997) métodos. Que la
corrección y el algoritmo presentados son útiles también en un El entorno se demuestra mediante
una aplicación a los datos de contaminación del aire en Müller (1998).

También podría gustarte