Está en la página 1de 6

Diagnóstico residual para el ajuste de variograma

Abstracto
La nube de variogram se emplea cada vez más en la geoestadística tanto como una herramienta exploratoria como para
el ajuste de variograma. Desafortunadamente, en su forma pura, la nube de variograma no se puede utilizar eficazmente
para evaluar el ajuste de un modelo de variograma paramétrico correspondiente. Esto se debe al hecho de que sus
entradas están altamente correlacionadas y heteroscedasticas (y posiblemente distorsionadas por la anisotropía).
Proponemos la adaptación de un modelo por mínimos cuadrados generalizados factibles, sugerimos algunos
diagnósticos para evaluar el ajuste e identificar posibles valores atípicos. A título ilustrativo, los aplicamos a un conjunto
de datos de ejemplo de las concentraciones de cloruro en el Su'dliche Tullnerfeld en Austria. Se proporcionó un paquete
R llamado vardiag para la exploración interactiva de los diagnósticos propuestos.

1. Introducción
Para la descripción y predicción de datos espaciales como la contaminación de las aguas subterráneas utilizamos la
noción de un campo aleatorio intrínsecamente estacionario

(1)

donde u(x) es un componente estocástico. Mientras que el término n(x) denota un modelo paramétrico o no
paramétrico que se utiliza para describir la parte determinista (la tendencia espacial), siendo x las coordenadas
espaciales. En el caso más simple, esto podría ser simplemente una función constante (con un solo parámetro medio) en
toda la región de interés. La parte estocástica describe la variación a escala corta. Parece razonable suponer que esta
variación es hasta cierto punto suave en corta distancia. Esto significa que dos observaciones en dos puntos del espacio
están correlacionadas y que la correlación (suavemente) disminuye con el aumento de la distancia entre las
observaciones. Tal estructura de correlación se caracteriza, en el caso de campos aleatorios isotrótrópicos
intrínsecamente estacionarios, generalmente se caracteriza por el llamado variograma

que generalmente se supone que tiene una forma paramétrica dada. Puesto que los parámetros para el
variograma generalmente no se conocen, deben estimarse a partir de los datos. La gráfica de dispersión de para todos

los pares de ubicación donde u denota datos


adecuadamente detendidos (por ejemplo, por un centro de la minería), ahora sirve como una visualización conveniente
de las dependencias espaciales. Se llama la nube de variogram y puede servir como base para estimar una forma
parametrizada (un modelo de variograma), como el llamado variograma esférico (que se utilizará como ejemplo en el
resto del papel) y con frecuencia su uso final en técnicas de predicción paramétricas como kriging (cf.

Matheron, 1971). Tenga en cuenta que este último no es nuestro objetivo


principal aquí. La nube de variogram también se puede utilizar eficazmente como una herramienta exploratoria (para
una serie de sugerencias a este respecto ver Ploner, 1999) y lo utilizaremos para la detección de valores atípicos y
observaciones influyentes. Esa robustez a la especificación errónea del modelo de variograma debido a tales fenómenos
es un tema importante está bien documentado en la literatura, véase, por ejemplo, recientemente Genton (2001).
Típicamente la nube de variograma exhibe la siguiente forma: las entradas a distancias cortas tienden a ser bajas con
baja variación, mientras que con el aumento de la distancia las entradas y su variación aumentan. Los parámetros para
un modelo de variograma paramétrico como se pueden estimar ajustando a la nube de variograma (véase un ejemplo
genérico en la Fig. 1). Dado que las «observaciones» γi están generalmente correlacionadas (ya que cada
observación original está contenida en una serie de «observaciones» derivadas), el procedimiento ordinario de mínimos
cuadrados produce estimaciones ineficientes. Por lo tanto, Mu'ller (1999) sugirió utilizar (una versión iterativa de)
mínimos cuadrados generalizados factibles, es decir.

donde ^V es una estimación adecuada de la matriz de covarianza de varianza de los residuos..


La matriz G contiene los regresores de un modelo linealizado adecuadamente. Tenga en cuenta de nuevo que este
procedimiento requiere datos destrendados. Esto podría lograrse estableciendo un valor inicial para la Z y
construyendo los residuos

que sirven como valores iniciales para calcular las estimaciones de FGLS para y a partir de (4) y las estimaciones para Z
iterativamente. También tenga en cuenta que hasta ahora se adujo la suposición de que la estructura de correlación es
isotrópica, lo que significa que el variograma para dos observaciones sólo depende de la distancia entre las ubicaciones
independientemente de la dirección de la línea de conexión entre sus ubicaciones. En el caso de la contaminación de las
aguas subterráneas, por ejemplo, una anisotropía podría deberse a una dirección predominante en la corriente de aguas
subterráneas. Para algunas estructuras de correlación anisotrópica, las coordenadas de las observaciones pueden
transformarse para alcanzar una estructura de correlación isotrópica. En este artículo sólo permitiremos casos en los
que se pueda inimituirse una transformación lineal necesaria en el proceso de estimación (para más detalles véase
Guttorp y Sampson, 1994 o en el contexto actual Glatzer, 2002).).
1.1. Ejemplo ilustrativo
Para ilustrar la presentación formal utilizamos el siguiente ejemplo. El gobierno de Baja Austria opera redes de medición
de aguas subterráneas en el Su'dliche Tullner Feld (véase la Fig. 2). El área cubierta tiene un tamaño de 208km 2: El
conjunto de datos consta de 746 mediciones en 35 ubicaciones que cubren el período de tiempo de 1992 a 1997
para una variedad de contaminantes. Debido al número relativamente grande de puntos de datos, seleccionamos las
mediciones de las concentraciones de cloruro para nuestro análisis. Los datos constituyen un conjunto de datos
espaciotemporal, donde los datos se recopilan en n ubicaciones distintas xk; k 1/4 1; . . . ; n en los puntos T en el
tiempo tj ; j 1/4 1; . . . . T: Estos datos se modelan mejor mediante un proceso espaciotemporal. Para el análisis de este
proceso se debe introducir una estructura de covarianza espaciotemporal. Como utilizamos los datos sólo con fines
ilustrativos y como los métodos presentados se limitan a las dimensiones espaciales, asumimos que las observaciones de
cada día son réplicas independientes de un proceso espacial (cf. Cressie, 1993, p. 274). Esto nos da una oportunidad
directa para estimar la tendencia espacial: simplemente usamos el promedio temporal. Después de eliminar la tendencia
se puede ver que los datos se distribuyen simétricamente, pero la kurtosis es mayor que la de una distribución normal.
John y Draper (1980) sugieren para casos como este la siguiente familia de transformaciones..

En nuestro caso, un valor de y-1/3 produjo el mejor resultado y, por lo tanto, los datos se transformaron para dar a 1/4
a u-1-3o; que
reemplaza a la palabra u en el resto del papel. También asumiremos que el campo transformado en consecuencia
constituye
un campo aleatorio gaussiano con la media 0.

2. Diagnóstico residual

2.1. Residuos ordinarios

En esta sección pretendemos dar una breve revisión de diferentes conceptos de residuos en nuestro contexto que
resultarán ser útiles para el trazado diagnóstico. Martin (1992) describe los conceptos de apalancamiento e influencia
en el caso de observaciones correlacionadas. Para la estimación generalizada de mínimos cuadrados lineales de la nube
de variograma, los residuos ordinarios are given by

La matriz H 1/4 GáG0V_1Gá_1G0V_1 y g es el vector de los valores ajustados. Los residuos ordinarios e y el ruido
asumido _; que se deriva de la aleatoriedad de la á u; están conectados por la siguiente relación.. Esta relación está
dominada por la matriz HH. Si los elementos de H son lo suficientemente pequeños, la e refleja el pozo _
desconocido. Los elementos diagonales hii de la matriz H desempeñan un papel importante para el análisis
residual. Para grandes hii el residual correspondiente ei es pequeño, independientemente del tamaño de _i :
Tenemos que tener en cuenta que hii siempre es inferior a 1. Esperamos grandes valores para hii en los casos en
que los valores correspondientes de xi son remotos del resto de los datos. El modelo ajustado estará muy influenciado
por tales observaciones y el residuo correspondiente será pequeño. Este hecho hace posible que los valores atípicos
pasen desapercibidos cuando solo se comprueban los residuos ordinarios. Los residuos ordinarios e tienen expectativa
E-e á1/4 0 y varianza. La variación de los residuos ordinarios viene determinada por H. Para los casos en los que hii es
grande (aquellos casos, en los que la xi están distantes del volumen principal), la varianza de los valores ajustados Vará
uiá1/4 hiivii es grande y la varianza de los residuos Varáeiá1/4 á1 _ hiiávii es pequeña. Tenga en cuenta que en la
práctica la matriz de covarianza V es desconocida, pero se puede estimar a partir de los datos. En el caso de la
estimación de variograma, esta matriz se expresa en función de los parámetros (estimados): "V y _ V" y":Por lotanto,
ya no se fija y los residuos e ya no se pueden ver como una simple transformación de los términos de error _: Los
residuos ordinarios se pueden utilizar para comprobar los supuestos del modelo de variograma. Por ejemplo, se
pueden utilizar residuos excepcionalmente grandes para detectar valores atípicos en la nube de variograma, que
normalmente se pueden rastrear a los valores atípicos de los datos originales. Como los residuos ordinarios tienen
diferentes varianzas, su valor se limita a este respecto. Para resolver este problema se han propuesto varias
transformaciones de los residuos ordinarios (véase Cook and Weisberg, 1982, Belsley et al., 1980 o Atkinson, 1985 y
particularmente en un modelo lineal generalizado de configuración Haslett y Hayes, 1998). Primero consideramos los
llamados residuos estudiantilizados.

2.2. Residuos estudiantes


La distribución de los residuos ordinarios depende i de la matriz de covarianza de los errores V (y, por lo tanto, de la
escala de y)y también delos valores hii (y por lo tanto en los regresores G). Para poder comparar diferentes
modelos de variograma es ventajoso tener a mano una versión estandarizada de los residuos que no dependa de la
escala del problema y que siga una distribución que se acerque a una distribución normal estándar. La estandarización
se logra dividiendo los residuos por su desviación estándar. Puesto que esta desviación estándar es desconocida, se
debe emplear un estimador. Esto conduce a una distribución Student-t para los residuos estandarizados. Por lo tanto,
estos residuos transformados se denominan residuos studentized estudiantilizados. Tenemos que distinguir entre la
studentización interna y externa. Para la estimación generalizada de mínimos cuadrados lineales, los residuos
internamente estudiados se definen de la siguiente manera..
El nombre interno se deriva del hecho de que el factor de escala en el denominador de (10) depende del residuo ei
que se está estandarizando. Todos los residuos estudiados tienen la misma varianza unitaria, pero siguen
correlacionados. Para los residuos estudiantes externos se utiliza un factor de escala, que no depende del residuo
que se va a escalar. Este factor se obtiene calculando la matriz de covarianza de varianza cuando la observación de
ith se cae en la estimación, denotada por el valor de la variablede ðila versión de la versiónde ladesviación.; Giii
denota una matriz regresiva respectiva. Los residuos estudiantes externos se calculan por

ð i ii ^V ð i Þ Þ Þ Þ G ð G i G ð i _1 _ V G 0 ð0 ð 1 ¼ (11) t i 1/4 - V i You_G, soy G 0. I- V_ 1, estoy a


punto de you_ _ _ 1 G 0, you_ _ ii s : (11) i Þ

Para los ti errores distribuidosnormalmente, los archivos de ðiÞ la claseV y ii son independientes entre sí y el
estudiante se distribuye con n2 _ _ _ p _ 1 grados de libertad. Los residuos estudiados se utilizan como sustituto
de los residuos ordinarios en los procedimientos de diagnóstico gráfico. Además, son una base para la construcción de
estadísticas formales para el diagnóstico de modelos.

2.3. Residuos de salida (también conocidos como residuos previstos)

Mientras que los residuos ordinarios se basan en un modelo que se ajusta a todos los datos, i los residuos de salida
hacia fuera se obtienen ajustando el modelo a todos menos a los casos i. Definimos los residuos de leave-
one-out por eáiá 1/4 gi _ g gi ; •yái_ _ ; i 1/4 1; . . . ; n 2 _ _ : (12)

En este yðiÞ caso, el parámetro estima que se recibe cuando se cae la observación i th. Los residuos de salida y
salidaðiÞ se pueden interpretar como errores de previsión, ya que los datos para el caso ino se utilizan para
ajustarel modelo. Los e-i-iÞ se distribuyen aproximadamente normalmente con la expectativa 0 y la varianza viiað1 _
hii: Por lo tanto, usarlos significa enfatizar casos con grandes hii en e comparación con el uso de residuos ordinarios.
Dividiendo los residuos de previsión por su desviación estándar se pueden obtener versiones estudiadas. La toma de los
residuos corrige sus varianzas desiguales, mientras que la estructura de correlación dada por Varáeá 1/4 V-I _ H-
permanece inalterada. Dado que su distribución es singular (debido a ðque el rango deI _ H es inferior a n)la
transformación a residuos no correlacionados da como resultado un número menor de residuos. Un
ya no es posible identificar residuos individuales con observaciones individuales. Los residuos transformados sólo se
pueden interpretar como un todo. A primera vista parece plausible utilizar residuos no correlacionados para probar la
suposición de errores distribuidos normalmente. Cook y Weisberg (1982) argumentan, sin embargo, que en el caso de la
heteroscedasticidad los residuos no correlacionados no tienen ninguna ventaja y se proponen utilizar los residuos
notransformados.

3. Gráficas de diagnóstico

3.1. Nube de variograma reescalada

(1991) emplean una forma reescalada de la nube de variogram para identificar valores atípicos. Utilizan la relación
conocida para la distribución de las diferencias cuadradas de las 'observaciones' ðx f á xiá _ á áðx áx0 iágðÞ2 gá 2ggi
áw2 á1á: (13) La nube de variograma reescalada representa f á uxxiá _ á á áx0 iág22ágági- trazado contra las

distancias gi ; = donde el valor de lavariogramaies de la palabrað"g"o "g" o "g" og ". En una fase exploratoria,
este estimador debe ser robusto como por ejemplo en Cressie (1993). La idea detrás de esto es que para un campo
aleatorio gaussiano los valores son Chisquare distribuido con un grado de libertad si la suposición de estacionaria se
mantiene y si no hay valores atípicos. Las observaciones sospechosas son grandes diferencias cuadradas a pequeñas
distancias espaciales, es decir, observaciones vecinas que llevan valores muy diferentes.

3.2. Nube de variogramas estudiantes

Tenga en cuenta que la nube de variograma reescalada no tiene en cuenta que se ha estimado un modelo de variograma
correspondiente y, por lo tanto, los residuos presentan más heteroscedasticidad. Para evaluar la bondad del ajuste de la
regresión e identificar los valores atípicos potenciales se pueden, en lugar de emplear los residuos originales e i—
utilizar los residuos estudiados ri dados en (10) con Váy yá; la matriz de covarianza de los errores, siendo
estimada utilizando FGLS y la relación (véase Cressie, 1993):): áV ii0 1/4 1/2Vá yá_ii0 1/4 1 2 gáxi _ xi0 á gi ; i • yá
gáxi _ xi0 _ gi0 ; x • yá n _gáxi _ xi0 á gi _ gi0 ; • yá _ gáxi _ xi0 ; • yo 2 : á14oÞ

Con estos residuos estudiados se puede construir la versión astuentada de la nube de variogram. Para cada par de
observaciones, trazamos la suma del valor previsto y un residual estudiante correspondiente (reescalado), es decir.
fgi ; ga y IncluirÞ þ i s gg: (15)

2i n p En este caso,s
1/4ffiPffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffiffffiPffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi 3 muestra la nube de
variograma estudiante para los datos de cloruro junto con el modelo estimado. Se puede ver que los puntos de datos
con valores negativos resultan de la studentización. Esta propiedad de la presentación podría causar irritación porque la
nube de variograma original no exhibe valores negativos ya que las entradas son diferencias cuadradas de
observaciones. Además, el problema sigue siendo que los residuos se distribuyen de forma asimétrica. Por lo tanto,
puede ser difícil reconocer patrones inusuales en la nube de variogramas estudiantes.

3.3. Nube de raíz cuadrada estudiante

Este problema se puede superar utilizando el hecho de que tomar la cuarta raíz de una variable distribuida chi-cuadrada
da como resultado una variable distribuida aproximadamente normalmente (Hawkins y Wixley, 1986). Por lo tanto,
ajustamos el modelo variogram a la nube raíz cuadrada en lugar de a la nube de variogram. La nube de raíz cuadrada es
la gráfica de los valores ð j á áxiá _ á x x0
iwaj1a2 contra las distancias gi : Para obtener el nuevo modelo tomamos la cuarta raíz de (2): j á á á xáðxáá á á áðá

x0 iáj1á2 _ 1/2 22gágá_Þ_1á4á21á1 á1á4: (16)

La cuarta raíz de una variable aleatoria distribuida de Chi-cuadrado se distribuye aproximadamente normalmente con
Eaw2 1-1a4-1/4 21a4G-34- p1a2 1/4 0:822: (17) G
Por lo tanto, el modelo transformado se puede escribir: j á uáxiá_ á uáx0 iáj1á2 1/4 0:822 1/22gági ; y-11a4o _: (18)
Los términos de error _ _ Ná0; Vde este modelo se distribuyen normalmente con la expectativa 0 y la matriz de
covarianza V. La matriz de covarianzas sigue a (véase Cressie, 1985).
Con esta información, un modelo variogram se puede ajustar de nuevo a los datos mediante mínimos cuadrados lineales
generalizados factibles. Para este modelo se pueden calcular de nuevo los residuos para validarlo. Para calcular las
versiones studentizadas de estos residuos necesitamos su matriz de covarianza. La expresión de la matriz de covarianza
contiene la matriz de diseño. Las columnas de esta matriz son los derivados parciales de la función de respuesta del
modelo:
•G ii0 1/4 0:822a1/22gðgi ; • yYou_1x4x~yi0: (23)
Mediante el uso de (10) podemos calcular de nuevo los residuos studentizados ar i 1/4 eiiáffiffiffiffiffimiip; donde los mii
son los elementos diagonales de la matriz M 1/4 g Cováeá 1/4 Vá~yá _ áGGá G0Vá~yá_1 gá_1 a G -G 00: (24)

Con estos residuos estudiados se puede construir de nuevo una versión studentizada de la nube raíz cuadrada. Allí, se
presenta el modelo ajustado y, además, para cada par de observaciones un punto consiste en el valor ajustado y el
residual (reescalado) correspondiente. La nube de raíz cuadrada estudiante es, por lo tanto, una gráfica de los puntos
fgi ; 0:822 1/22gðgi á yYou_1á4 i ári ágg: (25)

Para ver un ejemplo, véase el panel superior derecho en la Fig. 4. En el caso de un modelo correctamente especificado y
todos los supuestos cumplidos, esta gráfica debe exhibir una banda aproximadamente simétrica alrededor de la raíz
cuadrada del variograma estimado, la función que representa la dependencia espacial. Una posible desviación sería la
varianza de error no constante, es decir, la anchura variable de la banda de error a lo largo del eje horizontal. Si la forma
funcional del modelo no se corresponde con los datos, la nube mostrará una curvatura diferente a la del modelo
ajustado. Una segunda característica de esta gráfica es la fácil identificación de valores atípicos. Los residuos estudiantes
deben, en caso de errores normales, distribuirse normalmente también. Por lo tanto, las entradas en la nube que están
lejos de la curva ajustada son altamente sospechosas.

3.4. Parcela residual de salida

Estas entradas se pueden comprobar dos veces mediante una segunda gráfica que en lugar de los residuos
convencionales emplea los residuos de licencia-uno-out e éi-: Está claro que estos tipos de residuos son más
capaces de detectar valores atípicos (así como observaciones influyentes para el caso). Sin embargo, la construcción de
este segundo tipo de residuos no es del todo problemática en nuestro caso, ya que una sola entrada en la nube de
diferencias de raíz cuadrada puede verse afectada por dejar fuera cada una de una de las observaciones originales.
Ahora tenemos para cada entrada en la nube de raíces cuadradas un residual convencional y dos residuos de salida.
Sugerimos trazar estos dos conjuntos de residuos de licencia de un solo frente a los
residuos y comparar sus posiciones con respecto al primer meridiano (cf. el panel inferior izquierdo de la Fig. 4).

3.5. Nube residual descorrelada

Por último, nos gustaría tener en cuenta que las entradas en la nube de diferencias de raíz cuadrada están altamente
correlacionadas. El modelo fue equipado por mínimos cuadrados generalizados. Eso equivale a un mínimo cuadrado
ordinario que se ajusta a un modelo transformado
Lj á uðxxiUsted_ á ux0 iáj 2 1/4 Lggi ; yTú L__i ; (26)

donde L es la descomposición Cholesky tal que L0L 1/4VV_1: Los residuos transformados Lei ahora no están
correlacionados y se pueden trazar contra las predicciones transformadas Lgggi ; • ypara indicar las insuficiencias
(panel inferior derecho en la Fig. 4).

4. Parcelas interactivas

En las secciones anteriores se presentaron varias parcelas de diagnóstico. Cada uno de ellos ofrece una cierta vista de los
datos. La propiedad común de estas parcelas es que cada una de ellas muestra las cantidades que se calcularon después
de estimar un modelo. Es natural combinar algunas de estas parcelas para permitir mirar los datos desde diferentes
puntos de vista al mismo tiempo. Por lo tanto, utilizamos las ideas de cepillado donde los casos correspondientes en
varias parcelas se marcan juntos y de vincular donde se conectan varias vistas alternativas a los datos. Estas ideas
se presentan en detalle en Buja et al. (1996). Algunas cuestiones de implementación con respecto a la nube de
variogram se discuten en Symanzik et al. (1997).. (1991) aplican estas ideas a los datos espaciales. En su artículo
presentan herramientas para el análisis exploratorio de la variación local de los datos espaciales. Señalan que la vista
más importante para los datos es siempre la visualización en una vista de mapa. En esta vista de mapa se puede
superponer otra información espacial relevante que ayuda a profundizar la comprensión de los datos. Un vínculo
importante es el que existe entre la vista de mapa y el histograma. Seleccionando ciertas regiones del histograma (por
ejemplo, las observaciones con los valores más altos) y el resaltado posterior de las ubicaciones correspondientes en el
mapa
ver las regiones locales con anomalías se pueden encontrar. Mediante la selección de subregiones en la vista de mapa y
el resaltado posterior de la parte correspondiente del histograma, se puede sacar la anomalía final de las subregiones.
Otro enlace útil es el de la vista de mapa y la nube de variogram. Aquí se seleccionan los puntos extremos o regiones de
la nube de variograma (los que tienen diferencias cuadradas altas a distancias bajas) y los puntos correspondientes en la
vista de mapa se unen mediante líneas. (1991) han implementado estos métodos de diagnóstico en un software
independiente para la plataforma Macintosh. Barry (1996) intenta permitir la importancia de la vista de mapa uniendo
los puntos por líneas que tienen grandes diferencias cuadradas a distancias cortas y aquellos puntos que tienen
pequeñas diferencias cuadradas a grandes distancias. Allí las líneas se dibujan más gruesas para diferencias cuadradas
más extremas. Sin embargo, las diferentes fortalezas de la línea son difíciles de discernir. Parece sensato mostrar la
situación en dos parcelas separadas: una representa una vista de mapa con los puntos relevantes unidos y otra una nube
de raíz cuadrada con los puntos correspondientes resaltados. Esto tiene la ventaja de que el tamaño de las diferencias
cuadradas se puede leer directamente desde la parcela. Al utilizar gráficos dinámicos para diagnosticar estimaciones de
variograma, es importante tener en cuenta las diferentes relaciones. Primero hay n observaciones espaciales. A partir
de estas construcciones nán _ 1x=2 puntos para la nube de variograma. Así, para cada observación espacial
tenemos n _ 1 puntos en la nube de variogram y n _ 1 residuos leave-one-out. Por otro lado tenemos para cada
punto de la nube de variograma dos observaciones espaciales a partir de las cuales se construye este punto. Y hay 2n _
1- residuos de salida de salida correspondientes a este punto. En la Figura 4 continuamos el concepto de parcelas
enlazadas vinculando una vista de mapa con una versión estudiante de la nube raíz cuadrada, una gráfica de residuos de
salida y una gráfica de residuos descorrelados. Los puntos resaltados en la vista de mapa (panel superior izquierdo) son
de color rojo y azul y su línea de conexión magenta; los residuos relacionados con estas ubicaciones se colorean,
respectivamente, en las otras gráficas. En el ejemplo particular que se muestra
en la Fig. 4 la observación desde el sitio más oriental es un atípico obvio, que de otra manera no habría sido detectado.
En la vista de mapa es posible mostrar una tercera dimensión por círculos de diferente tamaño. El área de los círculos
puede corresponder al valor de las observaciones y,a las distancias de Cook o a las reducciones en la falta de ajuste.
Estos métodos de diagnóstico se implementan en un paquete R denominado vardiag, descargable desde CRAN:
http://cran.rproject.org/src/contrib/PACKAGES.html para que estén disponibles en un entorno de análisis común. Una
descripción detallada de su uso y los comandos disponibles se da en Glatzer y Mu'ller, 2003.

5. Limitaciones y perspectivas

El ajuste de un modelo de variograma a la nube de variograma sin un agrupamiento previo de los vectores de distancia
se vuelve problemático cuando el número de observaciones aumenta. En este contexto, gran media un número de
aproximadamente 70 observaciones dependiendo del rendimiento del equipo en uso. Con 70 observaciones la matriz de
covarianza de las entradas de la nube de variograma es de dimensión 2500 2500: La inversión de una matriz de este
tamaño es simplemente factible en un ordenador con un procesador de 900 MHz bajo Windows 2000. Con un sistema
más reciente el límite es algo más alto. Con un mayor número de observaciones, uno tiene que usar agrupamiento para
la estimación del variograma como con el estimador de Matheron. Una vez más, los residuos se pueden calcular a partir
de este modelo. A continuación, se debe adaptar el cálculo de la matriz de covarianza y calcular los residuos
ponderados. Los detalles de la adaptación se pueden encontrar en Pardo-Igu' zquiza y Dowd (2001). Una alternativa es
ajustar los modelos de variograma para partes de los datos, que podrían ser dados por una ventana móvil de
ubicaciones. Este tema es una de otras extensiones más detalladas en Glatzer (2002). Para los datos que se describen
mejor mediante modelos anisotrópicos para la estructura de correlación una posibilidad es el uso de variogramas
zonales como por ejemplo se define en Myers y Journel (1990). Por lo tanto, para diferentes direcciones de vectores de
distancia se montan diferentes modelos de variograma. Para cada dirección sólo se consideran aquellos pares de
observaciones cuyo vector de distancia se encuentra dentro de un rango angular dado alrededor de esta dirección, por
ejemplo, Norte-Sur, Este-Oeste, Noreste-Suroeste y Noroeste-Sureste. Otra posibilidad en caso de anisotropía
geométrica es la estimación de la matriz de transformación junto con el ajuste del modelo de variograma. De este modo
se estiman los parámetros del modelo y los elementos de la matriz de transformación (cf. Guttorp y Sampson, 1994). Así
se obtienen estimadores para los parámetros del modelo y para la matriz de transformación.

Agradecimientos
Estamos muy agradecidos a muchas observaciones apropiadas de uno de los dos árbitros, algunos de los cuales
ayudaron a mejorar el documento.

También podría gustarte