Está en la página 1de 127

Los Cuadernos del Centro de Morfologa Matemtica de Fontainebleau

Fascculo 5

LA TEORA DE LAS VARIABLES REGIONALIZADAS Y SUS APLICACIONES


Por

Georges MATHERON
1970 Traducido al espaol por

Marco ALFARO
2005

Propiedad del Centro de Geoestadstica de la Escuela de Minas de Pars. Prohibida su venta.

LA TEORIA DE LAS VARIABLES REGIONALIZADAS, Y SUS APLICACIONES TABLA DE MATERIAS: PREFACIO 3 7

Captulo 0 INTRODUCCION. 0-1 0-2 0-3 0-4

Notaciones 7 Producto de convolucin 8 Geoestadstica y Teora de las variables regionalizadas Mtodos transitivos y Teora intrnseca 10 14

Captulo 1 LOS METODOS TRANSITIVOS. 1-1 1-2 1-3 1-4 1-5

Ejemplo introductorio 14 El covariograma transitivo 16 Regularizacin y subida 19 La estimacin de las variables regionalizadas Ejercicios sobre los mtodos transitivos 44 50

24

Captulo 2 LAS FUNCIONES ALEATORIAS INTRINSECAS. 2-1 2-2 2-3 2-4 2-5 2-6 2-7 2-8 2-9 2-10

Definiciones generales 50 Propiedades de la covarianza y del variograma 53 Regularizacin de una F.A.I. 59 Varianzas de extensin y de estimacin 63 Mtodos de aproximacin en R1 68 Mtodos de aproximacin en Rn 72 El efecto de pepita 75 El esquema esfrico 77 Inferencia estadstica y cuasi-estacionaridad 81 Ejercicios sobre las F.A.I. 86 99

Captulo 3 EL KRIGEADO. 3-1 3-2 3-3 3-4 3-5 3-6

Los objetivos del krigeado 99 Notaciones 102 F.A. estacionaria de esperanza nula o conocida 104 F.A. estacionaria de esperanza desconocida 106 Caso de una F.A.I. sin covarianza 111 Ejercicios sobre el krigeado 112 121

Captulo 4 EL KRIGEADO UNIVERSAL. 4-1 Introduccin 126 121

BIBLIOGRAFIA.

PREFACIO

Este texto es la redaccin del curso que impart en 1970 en la Escuela de Verano de Fontainebleau. Es el fruto de varios aos de reflexin acerca del carcter ambiguo de la operacin que consiste en interpretar en trminos probabilsticos un fenmeno natural nico pero parcialmente desconocido, y, sobre el problema difcil de la investigacin de las condiciones de posibilidad de la inferencia estadstica a partir de una realizacin nica de una funcin aleatoria no estacionaria. He puesto entonces el acento en los problemas metodolgicos ms que sobre el aspecto matemtico de la teora. Del punto de vista de las aplicaciones prcticas, los resultados tiles son aquellos proporcionados en el Fascculo 2 de estos Cuadernos (Cours de Gostatistique, con la excepcin del krigeado universal), pero presentados bajo una nueva luz. La solucin del problema metodolgico mencionado consiste en introducir una hiptesis de cuasi-estacionaridad, lo suficientemente dbil para ser siempre fsicamente plausible. El acercamiento de los captulos 1 (mtodos transitivos) y 2 (teora de las funciones aleatorias intrnsecas) muestra que el problema de la inferencia estadstica tiene entonces solucin (y luego la teora operativa), en lo que respecta la estimacin global de una variable regionalizada. El captulo 4 consagrado al krigeado universal conduce a una conclusin anloga respecto del problema de la estimacin local. No he presentado el krigeado universal en trminos de espacios de Hilbert, para evitar cualquier dificultad matemtica y concentrar toda la atencin en los problemas metodolgicos. Entonces hay que referirse al Fascculo 1 de estos Cuadernos para la demostracin de ciertos resultados (principalmente los teoremas de existencia y de unicidad). He examinado la nocin capital de deriva a partir de puntos de vista muy diferentes (deriva funcional, deriva aleatoria, mxima verosimilitud, teora de interpoladores) que muestran el carcter ambiguo, o al menos ligado estrechamente a consideraciones de escala y he demostrado que estos puntos de vista aparentemente opuestos conducen a conclusiones convergentes: lo cual nos proporciona confianza en el plano metodolgico. Una palabra acerca de los ejercicios propuestos al final de cada captulo, y de los cuales la mayor parte fueron tratados en la Escuela de Verano de 1970. Algunos de ellos son ejercicios simples destinados a familiarizar al lector con el manejo real de una teora un poco abstracta. Otros son verdaderos complementos al curso mismo, y aportan resultados nuevos en los cuales algunos tienen una importancia metodolgica fundamental. Para cada uno de ellos proporciono la solucin, el camino a seguir para llegar al resultado, y las conclusiones metodolgicas que conviene sacar. Espero haber dicho bastante para convencer al lector la necesidad de hacer efectivamente estos ejercicios.

G. MATHERON

PREFACIO DEL TRADUCTOR

He decidido pasar a formato electrnico la traduccin caligrfica que haba realizado hace algunos aos del Fascculo 5, La Thorie des Variables Rgionalises, et ses Applications del Maestro Georges Matheron, publicada en 1970, a mi juicio, uno de los mejores libros de Geoestadstica. En conversaciones con G. Matheron trat de convencerlo acerca de la conveniencia de editar el Fascculo 6, a la luz de los adelantos de los medios de clculo, y, tambin como una etapa para llegar a su ltima obra Estimating and Choosing. An Essay on Probability in Practice, Springer Verlag, 1989; lamentablemente no fu posible editar el Fascculo 6... Adems de rendirle un homenaje de reconocimiento y de afecto al creador de la Geoestadstica, con la satisfaccin de haber sido su Secretario en la efmera Asociacin Internacional de Geoestadstica, el propsito de esta publicacin es doble: por una parte servir de ayuda y complemento para los estudiantes de minas, de geologa y los profesionales interesados en la estimacin de recursos mineros, por otra parte, como una referencia para mostrar que ciertos conceptos y el uso de algunas herramientas han sido desvirtuados con el correr de los aos. La varianza de estimacin, nocin capital en todo el libro, constituye un excelente ejemplo. La traduccin es casi textual pero he omitido en lo cual G. Matheron estaba de acuerdo - la presentacin del modelo de De Wijs y los bacos de los modelos de variograma. La palabra semivariograma es reemplazada siempre por variograma. En vez del anglicismo kriging he preferido traducir krigeage por la palabra correcta en espaol krigeado o krigeaje (se prefiere krigeado porque krigeaje no suena bien en espaol). El krigeado universal solo se presenta como una introduccin. Respecto de los ejercicios, los resolv casi todos en mi publicacin (tambin caligrfica) Ejercicios sobre las Variables Regionalizadas, Departamento de Minas de la Universidad de Chile, 1972. El avance de los medios de clculo ha sido importante, como muestra este ejemplo: se me ocurri vectorizar la figura donde aparece la varianza de estimacin de superficies por una malla de reconocimiento cuadrada de lado a, con presencia de Zitterbewegung (fenmeno de micro-oscilaciones descubierto por E. Schrdinger en el marco de la mecnica cuntica, tambin presente en problemas geolgicos!) para lo cual tuve que construr un programa computacional para realizar nuevamente los clculos. Comprob que la figura de G. Matheron (que data de los aos 60 y aparece por ltima vez en Estimating and Choosing, en 1989) no representa bien este fenmeno pre-aleatorio (ver figura A-1), en efecto, tal como muestra un acercamiento (ver figura A-2), el fenmeno es mucho ms complicado que lo que se crea, sobre todo cuando la malla a tiende a 0. En el texto inclu entonces una nueva figura.

Figura A-1: Zitterwebegung en la estimacin de la superficie de un crculo de dimetro unidad por una malla cuadrada a (segn G. Matheron). En abscisa la malla a. En ordenada, la varianza de estimacin correspondiente.

Figura A-2: Acercamiento de la figura A-1 y nuevo clculo de la varianza de estimacin de superficies.

El nivel matemtico de la obra es difcil, recomiendo entonces, como texto de apoyo el excelente libro en espaol Teora de la Probabilidad de B. Gnedenko (estoy seguro que G. Matheron estara de acuerdo), Editorial MIR, Mosc 1979 (difcil de encontrar ahora, quizs una alternativa es la versin en ingls de la Editorial Chelsea, 1967). Existen otros manuscritos que he realizado, que ir poco a poco pasando a formato electrnico, ponindolos a disposicin de la comunidad minera.

M. ALFARO

0 INTRODUCCION 0-1 NOTACIONES ... puntos del espacio de n dimensiones (n = 1, 2 elementos de longitud (n = 1), de superficie (n = 3), centrados en los mismos puntos, por f(x), g(y) estos puntos.

Designaremos por x, y, o 3), por dx, dy, ... 2) o de volmenes (n = etc., ... funciones de

La integral (extendida a todo el espacio) de una funcin f(x) se escribe:

f ( x)dx
Por ejemplo, para n = 3 dimensiones, y, designando por (x1, x2, x3) las tres coordenadas del punto x, esta notacin se explicita de la manera siguiente:

f ( x)dx =

dx1 dx2 f ( x1 , x2 , x3 )dx1dx2 dx3


De la misma manera, escribiremos

f ( x)dx

para la integral de la funcin

f(x) sobre un dominio A del espacio de n dimensiones.

Para n = 2, si A es el rectngulo de la figura, se tiene, de manera explcita:

f ( x)dx = dx f ( x , x )dx dx
1 1 2 1 A a1 a2

b1

b2

Estas notaciones son a la vez muy condensadas y muy parlantes: en una primera lectura se las puede interpretar en el espacio de una dimensin, donde su significacin es, en general, muy clara. La generalizacin a los espacios de dos o tres dimensiones se hace as ms fcil. Ejemplo: Sea V un volumen, y g(h) = g(h1, h2, h3) una funcin del vector h de coordenadas h1, h2, h3 . Sean x = (x1, x2, x3) e y = (y1, y2, y3) el origen y la extremidad del vector h, es decir h=y-x. El valor medio de la funcin g(h) cuando los dos puntos x e y recorren (cada uno a su manera) el volumen V, se escribe:

1 dx g ( y x)dy v2 v v
En notacin explcita, lo anterior se escribira como:

1 v2

dx dx dx g ( y
1 2 3 v v

x1 ; y2 x2 ; y3 x3 )dy1dy2 dy3

La primera notacin es un smbolo, que describe directamente el concepto de valor medio; la segunda es un algoritmo que indica el camino a seguir para calcular esta cantidad, pero cuya significacin no aparece a primera vista. 0-2 PRODUCTO DE CONVOLUCION (media mvil)

El producto de convolucin de dos funciones f1(x) y f2(x) se define por:

g ( x) = f1 ( y ) f 2 ( x y )dy = f 2 ( y ) f1 ( x y )dy
Se escribe, en notacin simblica:

g = f1 f 2
Esta operacin de convolucin juega un papel fundamental en Geoestadstica (como tambin en probabilidades y en toda la fsica terica). La convolucin se puede asociar con la nocin intuitiva de media mvil: Regularizada de una funcin f (media mvil ponderada de la funcin)

Sea p(y) una funcin de ponderacin. El valor en el punto x0 de la media mvil de la funcin f ponderada por p es:

f p ( x0 ) = p ( y ) f ( x0 + y )dy = p ( y ) f ( x0 y )dy
(se atribuye el peso p(y)dy al valor tomado por f en el punto x0 + y. La segunda expresin se obtiene al cambiar y por y).
 Sea p la funcin transpuesta de la funcin p (por definicin:   p (x)=p(-x)). fp(x0) es el valor en x0 de f* p :

 fp = f p
Esta media mvil fp de la regularizada (de f por p). funcin f (ponderada por p) se llama

Ejemplo 1 (toma de una muestra v en el punto x) Sea v la muestra implantada en el origen de coordenadas, y sea k(x) su funcin indicatriz (por definicin k(x)=1 si x v y k(x)=0 si x v). Tomemos como funcin de ponderacin p(x)=(1/v)k(x). La media mvil correspondiente:

fv =

 1 f k v

representa la ley media de la muestra v tomada en el punto x. De manera explcita, se tiene:

f v ( x) =
Ejemplo 2 (radiactividades)

1 f ( x + y )dy v v

Si en el origen 0 de coordenadas se pone una masa unitaria de una sustancia radiactiva, se observa a la distancia d una radiactividad igual a Ae-d/d (A es una constante y es el coeficiente de absorcin del medio). Sea ahora f(x) la ley en el punto x de esta sustancia radiactiva. Designemos por d(x-x0) la distancia entre dos puntos x y x0. La masa f(x)dx localizada en x genera en x0 una radiactividad:

Ae d ( x x0 ) / d ( x x0 ) f ( x)dx
En total, se observa en x la radiactividad:

A f ( x )

e d ( x x0 ) dx d ( x x0 )

Esto no es otra cosa que el producto de convolucin Af* (con una funcin  p de ponderacin p(x)= e-d/d, la cual es adems simtrica, es decir p = p ) 0-3 GEOSTADISTICA Y TEORIA DE LAS VARIABLES REGIONALIZADAS. La Geoestadstica es la aplicacin de la teora de las variables regionalizadas a la estimacin de los depsitos mineros (con todas las aproximaciones que esto implica). De manera general, diremos que un fenmeno es regionalizado cuando se desplaza en el espacio, manifestando una cierta estructura. Las ciencias de la tierra, entre otras, nos proporcionan numerosos ejemplos. Si f(x) designa el valor en el punto x de una caracterstica f de este fenmeno, diremos que f(x) es una variable regionalizada, abreviado, una V.R. Se trata de un trmino

neutro, descriptivo, probabilstica.

anterior,

en

particular

toda

interpretacin

Entonces, del punto de vista matemtico, una V.R. es simplemente una funcin f(x) del punto x, pero es, en general, una funcin muy irregular: ejemplo: una ley en un depsito minero. Una variable regionalizada se presenta bajo dos aspectos contradictorios (o complementarios): un aspecto aleatorio (alta irregularidad, y variaciones imprevisibles de un punto a otro) un aspecto estructurado (la V.R. debe sin embargo reflejar a su manera las caractersticas estructurales de un fenmeno regionalizado)

La teora de las V.R. se propone entonces dos objetivos principales: en el plano terico, expresar estas caractersticas estructurales en una forma matemtica adecuada en el plano prctico, resolver el problema de la estimacin de una V.R. a partir de un muestreo fragmentario.

Estos dos objetivos estn relacionados: para un mismo conjunto de muestras, el error de estimacin depende de las caractersticas estructurales; este error, por ejemplo, es ms grande cuando la V.R. es ms irregular y ms discontinua en su variacin espacial. Campo y Soporte de una V.R. El campo V de una V.R. es el dominio donde sta es diferente de 0. Un panel es un subconjunto V de V. Soporte A menudo, no se conoce f(x), sino ms bien su valor medio fv(x) dentro de la muestra v tomada en el punto x. Esta regularizada fv(x) es efectivamente ms regular que la V.R. f(x). El volumen v se llama soporte de la V.R. fv, regularizada de f. Otra tarea importante de la teora de las variables regionalizadas consistir entonces en determinar las caractersticas de fv conociendo las de f. Ejemplo: en un depsito, prever las caractersticas de los paneles V(variable fV), conociendo las caractersticas de f o de fv (muestras). Ms generalmente, se buscar relacionar las caractersticas de f con las de una regularizada fp dada (ejemplo de las radiactividades).

0-4

METODOS TRANSITIVOS Y TEORIA INTRINSECA.

Para alcanzar los objetivos disponemos de dos grupos de mtodos: mtodos transitivos: absolutamente generales, en particular no necesitan ninguna hiptesis de naturaleza probabilstica, y, a fortiori, ninguna hiptesis de estacionaridad. teora intrnseca: se trata de una aplicacin de la teora de las funciones aleatorias; entonces se introducen interpretaciones probabilsticas, y adems, una cierta hiptesis de estacionaridad (hiptesis intrnseca)

10

Desde el punto de vista terico, estos dos grupos de mtodos conducen a resultados equivalentes, lo cual muestra que los resultados de la teora intrnseca no estn, en realidad, ligados a la hiptesis de estacionaridad (por otra parte, se puede construir una teora probabilstica sin utilizar esta hiptesis, la cual permite encontrar los resultados principales de la Geoestadstica). Encontramos aqu un problema metodolgico que presenta una importancia capital, tanto para la teora como para el examen crtico de los resultados a los cuales conduce esta teora. Es claro que el carcter ambiguo, localmente errtico, de nuestras V.R. invoca una interpretacin probabilstica, y, de hecho, nuestro segundo grupo de mtodos, invocar de manera explcita la teora de las funciones aleatorias. Pero ahora se plantean dos preguntas fundamentales, de las cuales la primera es la siguiente: a/ Cul es la significacin epistemolgica1 verdadera de la operacin que consiste en considerar un fenmeno natural nico (nuestra V.R.) como una realizacin de una funcin aleatoria (es decir como el resultado de un experimento al azar efectuado en una poblacin infinita de V.R. consideradas como posibles)? En verdad, una interpretacin probabilstica de este tipo es en s misma una conceptualizacin de la realidad (un modelo constitutivo) ms que una hiptesis capaz de ser invalidada o confirmada experimentalmente. Esta hiptesis se justifica solamente en la medida que ella permite captar mejor la realidad, y, resolver efectivamente problemas prcticos insolubles de otra manera. Parece prudente entonces procurar, al comienzo, de ver hasta donde es posible llegar sin recurrir a esta interpretacin veremos que es posible llegar bastante lejos. As aparece este primer grupo de mtodos que llamaremos transitivos, en los cuales no interviene, en apariencia, ningn concepto probabilstico. Aqu la V.R. est caracterizada por su covariograma transitivo g(h), no probabilstico, el cual resume las caractersticas estructurales esenciales y permite si se conoce g(h) resolver completamente ciertos problemas prcticos como el problema de la estimacin. Si fuera efectivamente posible determinar este g(h) a partir de datos experimentales fragmentarios, podramos entonces quedarnos aqu, y economizar cualquier interpretacin probabilstica. Sin embargo, esto no es cierto, y un anlisis ms fino mostrar que es necesario introducir un cierto tipo de hiptesis relacionadas al comportamiento analtico de g(h) en una vecindad del origen, hiptesis cuya significacin epistemolgica es exactamente la de un paso camuflado a la esperanza matemtica. Entonces no es posible evitar la interpretacin probabilstica, y es mejor introducirla de manera explcita. Es aqu donde se plantea la segunda pregunta fundamental: b/ Una vez admitida esta interpretacin probabilstica, es posible la inferencia estadstica a partir de una realizacin nica? Dicho de otra manera, a partir del material experimental disponible (que es la misma V.R., o un muestreo fragmentario de esta V.R. nica) es realmente posible reconstituir, al menos en parte, la ley de probabilidad de la Nota del T.: La epistemologa estudia la naturaleza y validez del conocimiento; su propsito es distinguir la ciencia autntica de la seudociencia, la investigacin profunda de la superficial. 11
1

funcin aleatoria realizacin?

hipottica

de

la

cual

nuestra

V.R.

sera

una

Con el propsito de responder afirmativamente a esta segunda pregunta, a menudo se introducen hiptesis, de tipo estacionaridad y ergodicidad, bastante ms fuertes de lo que es realmente necesario: en muchas aplicaciones estas hiptesis son groseramente falsas (ejemplos: un depsito en el cual las leyes decrecen ms o menos regularmente a partir de un corazn rico; la topografa submarina, en la cual las profundidades aumentan cuando uno se aleja de las costas, etc. ...: se trata de fenmenos manifiestamente no estacionarios. Frecuentemente, estas hiptesis aparecen como inverificables. Debido a lo anterior, buscaremos constantemente debilitar las hiptesis, hasta reducirlas a un mnimo a la vez indispensable y admisible. Ms precisamente, reemplazaremos la pregunta b/ anterior por la siguiente: b/ Cul es la caracterstica probabilstica mnima que necesitamos conocer para resolver un problema prctico dado (por ejemplo, el calculo de una varianza de estimacin) y cul es la hiptesis mnima que hay que introducir con el propsito de hacer posible la estimacin de esta caracterstica a partir de una realizacin nica? Esta hiptesis mnima, suficientemente dbil para ser casi siempre al menos fsicamente admisible, consistir en suponer que la funcin aleatoria es cuasi-intrnseca (es decir, asimilable, localmente, a una funcin aleatoria intrnseca), mientras que la caracterstica mnima que ser a la vez necesaria y posible de estimar estar ligada esencialmente al comportamiento en una vecindad del origen de un variograma o de una funcin de covarianza cuasi-estacionaria. La reduccin del problema a sus caractersticas probabilsticas mnimas permite comprender el xito de los mtodos transitivos (los cuales, una vez explcitamente probabilizados, no necesitan, evidentemente, ninguna hiptesis de tipo estacionario) y tambin la equivalencia de sus resultados con los de la teora intrnseca. Esta reduccin subraya adems el inters capital que va a presentar para nosotros el comportamiento en una vecindad del origen de un variograma o de un covariograma transitivo. Del punto de vista prctico, finalmente, esta reduccin muestra que muy a menudo es lcito aplicar, a fenmenos manifiestamente no estacionarios, procedimientos de clculo de los cuales se puede creer, al comienzo, que su legitimidad estaba ligada a alguna hiptesis de estacionaridad. En la prctica la teora intrnseca es ms fcil de construir, y es casi siempre la teora que se utiliza, salvo el caso particular, muy importante, de la estimacin de una superficie o de un volumen (problema geomtrico) Respecto de la bibliografa (ver referencias al trmino de este Fascculo), se encontrar en [4] la exposicin completa de la teora de las variables regionalizadas, y en [5], una exposicin abreviada de esta misma teora, adems de un tratado completo de Geoestadstica aplicada, conteniendo, en particular, el estudio de los problemas de optimizacin econmica (el texto original en francs puede ser consultado en la Biblioteca de la Escuela de Minas de Pars). La tesis de J. Serra proporciona, por una parte una exposicin general muy concreta (sin

12

dificultades matemticas), y por otra parte, un estudio detallado del esquema esfrico. El antiguo tratado [3] est obsoleto en gran parte, salvo en lo relacionado con el esquema de De Wijs. La tesis de A. Carlier [1] estudia (solamente para el esquema de De Wijs) los problemas especiales propuestos por los depsitos de substancias radiactivas. Los problemas de optimizacin econmica se tratan en dos artculos de los Annales des Mines [8], lo ms esencial figura en [5]. Finalmente, para el krigeado universal se consultar [6].

13

CAPITULO 1 LOS METODOS TRANSITIVOS 1-1 EJEMPLO INTRODUCTORIO Consideremos el fenmeno de transicin ms simple que se pueda imaginar: presencia o ausencia de una caracterstica. Sea por ejemplo una formacin geolgica de extensin limitada. Un sondaje perforado en el punto x la intersecta o no la intersecta. Designemos por k(x) la indicatriz del conjunto S, es decir la funcin definida por:

1 si x S k ( x) = 0 si x S
Se trata de un fenmeno nico, para el cual no es posible realizar una formulacin probabilstica: hablar de la probabilidad de que un punto dado x pertenezca a S no tendra gran sentido. Se puede observar tambin que todo el inters se concentra aqu en la frontera de S. En efecto, k(x) es constante tanto al interior como al exterior de S, solamente al pasar esta frontera k(x) vara, pasando de 1 a 0 o de 0 a 1. Esta es la justificacin del nombre de fenmeno de transicin, y del nombre mtodos transitivos. El rea S de nuestra formacin est dada, evidentemente, por:

S = k ( x)dx

El valor S constituye una informacin muy interesante desde el punto de vista prctico: a menudo, se busca estimar este valor a partir de una red de sondajes. Sin embargo este parmetro no nos aporta ninguna informacin de naturaleza realmente estructural. En efecto, se puede definir la estructura de un conjunto como el sistema de relaciones existentes entre los elementos o las partes de este conjunto. Tendremos informacin de naturaleza estructural al hacer intervenir simultneamente, al menos, dos puntos. Sean entonces dos puntos x y x+h (es decir el conjunto estructurante ms pequeo que podamos imaginar. Consideremos entonces la expresin k(x)k(x+h): vale 1 si x y x+h pertenecen los dos a S, y 0 en otro caso.

14

Pero decir que x+h pertenece a S equivale a decir que x pertenece al trasladado S-h de S segn la traslacin h. Se tiene entonces:

1 si x S S h k ( x ) k ( x + h) = 0 si x S S h
Integremos en x esta expresin: obtenemos una funcin de h:

K (h) = k ( x)k ( x + h)dx = medida ( S S h )


que representa la medida (el rea) de la interseccin de S y de su trasladado por h. Esta funcin es simtrica, porque las dos intersecciones SS-h y SSh se deducen una de la otra por traslacin. Esta funcin K(h) es el covariograma geomtrico asociado a S. La funcin K(h) proporciona una cierta imagen de la forma del conjunto S: Propiedades del covariograma geomtrico K(h) a/ Simetra: Desigualdades: Relaciones: K(h) = K(-h) 0 K(h) K(0) S = K(0)

S 2 = K (h)dh
b/ Alcances: el alcance a() en la direccin es la distancia a partir de la cual K(h) se anula en esa direccin. Entonces es la dimensin ms grande de S en esta direccin. c/ Pendiente en el origen (derivada a la derecha y a la izquierda)

15

Si el mdulo r de h es pequeo, se tiene:

K (h) = K (0) rD
es la mitad de la superficie pequea barrida por el vector r cuyo origen describe el contorno de S. D es la variacin diametral de S en la direccin (si S es convexo, D es el dimetro aparente en esa direccin). A pesar de que existe una derivada K(0)=-D en cada direccin , se observar, cuidadosamente, que la funcin K(h), en si misma, no es derivable en h=0. El ejercicio 6 (al final de este captulo) muestra como la formula de Minkowski permite relacionar las derivadas K(0) en las diferentes direcciones , al permetro de S ( o a su superficie si nos ponemos en el espacio de 3 dimensiones). Estas relaciones son muy tiles en Morfologa Matemtica.

rD

1-2

EL COVARIOGRAMA TRANSITIVO

Sea f(x) una V.R. nula fuera de un campo V acotado. El covariograma transitivo de esta V.R. es la funcin g(h) definida por: (1-1)

g (h) = f ( x) f ( x + h)dx

Propiedades del covariograma transitivo g(h) a/ Simetra: desigualdad: Sea Q = (1-2) g(h)=g(-h)

g (h) g (0) = [ f ( x) ] dx
2

f ( x)dx

la cantidad de metal, se tiene:

Q 2 = g (h)dh

(para demostrar (2), reemplazar g por su expresin (1), e integrar en h) b/ Alcance: a() se define por la condicin g(h)=0 cuando h>a() para el vector h de direccin : es una propiedad del campo de la V.R. c/ Comportamiento de g(h) en una vecindad del origen. La regularidad de g(h) en una vecindad del origen refleja las propiedades de continuidad de la V.R. en su variacin espacial. Lo anterior resulta de:

g (0) g (h) =

1 2 [ f ( x + h) f ( x)] dx 2

Si f(x) es continua por trozos, g(h) tiene un comportamiento lineal en una vecindad del origen.

16

Si f(x) es derivable, g(h) tiene un comportamiento parablico.

A menudo, g(h) no es continuo en h=0: dicho de otra manera, g(0) es mayor que el lmite de g(h) cuando h tiende a 0. Se dice entonces que hay un efecto de pepita. Ms que una discontinuidad verdadera, se trata, a menudo, de una zona de transicin muy rpida, la cual, experimentalmente, se presenta como una discontinuidad. Volveremos a estudiar ms tarde este efecto de pepita en la versin probabilstica de la teora y su interpretacin en trminos de escala (ver tambin el ejercicio 7 de este captulo, y, para una representacin del efecto de pepita por una medida de Dirac, los ejercicios 16 a 20). Caso istropo En las aplicaciones, se busca (por ejemplo, mediante una transformacin lineal) llegar al caso en que el covariograma g solo depende del mdulo
2 r = h = (h12 + h22 .... + hn )

del vector h, y se expresa entonces como una funcin g(r) del nico argumento r. Solamente las potencias pares de g(r), r2k son 2k+1 , las indefinidamente derivables en h=0. Las potencias impares r potencias r, no entero, y tambin los trminos logartmicos del tipo r2nlog(r) presentan todos una irregularidad en h=0. De esta manera, en el caso istropo, se distinguirn dos partes en el desarrollo limitado de g(r) en una vecindad del origen: una parte regular, que solo contiene potencias pares, y una parte irregular la cual agrupa los trminos en r, diferente de un entero par, eventualmente con trminos logartmicos:

g (r ) = g (0) + a2 r 2 + ...... + a r + a2 k r 2 k log(r )

parte regular

parte irregular

El trmino de ms bajo grado de la parte irregular proporciona una medida precisa del grado de irregularidad de la V.R. en su variacin espacial. Por ejemplo, la indicatriz k(x) de un conjunto S est caracterizada desde este punto de vista por un termino irregular de orden 1: K(h)=S-D|h|, como lo demostramos antes.

17

d/ El covariograma g(h) es una funcin de tipo positivo. Se dice que una funcin g(h) es de tipo positivo si para cualquier entero k>0, cualquier conjunto x1, x2, ..., xk de puntos del espacio Rn y cualquier sistema 1, 2, ..., k de nmeros reales, se tiene:

(1-3)

g(x x ) 0
i j i j i, j

Las funciones de tipo positivo juegan un papel importante en Fsica (donde tienen, en general, una significacin energtica) y en teora de probabilidades (las funciones caractersticas de las leyes de probabilidad son de tipo positivo). Veremos en el captulo 2 que las funciones de covarianza de las funciones aleatorias son tambin de tipo positivo. Probemos que un covariograma transitivo es de tipo positivo. En efecto, segn la relacin (1-1), se puede escribir:

g ( x x ) = f ( y) f ( y + x x )dy =
i j i j i j i j i, j i, j

= i j
i, j

f ( y + x j ) f ( y + xi )dy = i f ( y + xi ) dy 0 i

Luego, para la eleccin de un modelo de covariograma transitivo, debemos limitarnos, obligatoriamente, a funciones de tipo positivo (veremos, en el prrafo 1-4 que esta condicin expresa que las varianzas de estimacin son necesariamente positivas). Segn el teorema clsico de BOCHNER, una funcin continua es de tipo positivo si y solo si es la transformada de Fourier de una medida positiva sumable. Lo anterior nos proporciona una segunda verificacin de esta propiedad fundamental del covariograma transitivo. Designemos por la transformada de Fourier de la V.R. f(x), y por G la transformada de su  covariograma g = f * f . Se sabe que la transformada de Fourier de un producto de convolucin es el producto multiplicativo ordinario de las  transformadas de los factores. Como la transpuesta f de f tiene por transformada el imaginario conjugado * de , encontramos que: (1-4)

G=

y, por consiguiente, se tiene bien que G 0. Observacin Desde el punto de vista matemtico el covariograma g y su transformada G son herramientas perfectamente equivalentes. Como la relacin (1-4) es particularmente simple, a menudo, es ms cmodo, en ciertas demostraciones tericas, utilizar G en vez del covariograma g. Pero, desde el punto de vista experimental, y, en las aplicaciones, el covariograma g es, en general, una herramienta bastante mejor que G. En efecto, el comportamiento de g(h) en una vecindad de h=0 tiene por imagen

18

No es, en general, las propiedades de G en una vecindad del infinito. fcil apreciar el comportamiento de una curva experimental en el infinito. Esta es la razn, por la cual, el punto de vista del anlisis armnico, no es muy interesante en las aplicaciones prcticas de la teora de las V.R.

1-3 REGULARIZACION DE UNA V.R. Y SUBIDA 1-3-1. Regularizacin de una V.R. Sea f(x) una V.R., p(x) una funcin de ponderacin, regularizada de f por p. La relacin (1-1) puede escribirse:
 fp=f* p

la

 g= f*f
lo cual muestra que el covariograma transitivo es la autoregularizada de la V.R. f. El covariograma

     gp = f * p* f * p = f * f * p* p = fp * fp
se puede poner en la forma:

gp = g *P
 con P = p * p : entonces el covariograma de la regularizada se obtiene regularizando g con el covariograma transitivo P de la funcin de ponderacin p: gp es una funcin ms regular que g, as como fp es ms regular que la V.R. inicial f.

1-3-2 La Subida Vamos a dedicar el resto de este prrafo a una operacin llamada subida, la cual tiene gran importancia en la teora de las V.R. (debido a que permite, por ejemplo, reducir el clculo de una varianza de estimacin en un espacio de n dimensiones, a una serie de operaciones mucho ms simples, realizadas en el espacio de una dimensin). En trminos mineros, la subida es simplemente la transposicin abstracta de la operacin que consiste en implantar un sondaje en un punto (x1, x2) de la superficie topogrfica. Si f3(x)=f3(x1, x2, x3) es una V.R. en el espacio de tres dimensiones (por ejemplo), se dice que la V.R.:

f 2 ( x1 , x2 ) = f 3 ( x1 , x2 , x3 )dx3
definida en el espacio de dos dimensiones se deduce orden 1, paralela al eje de los x3). Por ejemplo, puntual, f2(x1, x2) es la acumulacin (cantidad cuadrado) del sondaje implantado en el punto (x1, topogrfica. de f3 por subida (de si f3(x) es una ley de metal al metro x2) de la superficie

19

No hay dificultad para definir subidas de orden superior. Por ejemplo, la subida de orden 2 (paralela al plano x1, x2) conduce a la V.R.

f1 ( x3 ) = f3 ( x1 , x2 , x3 )dx1dx2
definida en el espacio de una sola dimensin (el eje de los x3) y que representa, en trminos mineros, la cantidad de metal por metro de profundidad aportada por el nivel de cota x3. Se tiene que el covariograma g2(h1, h2) de la V.R. f2 deducida de f3 por subida de orden 1 se obtiene efectuando directamente esta misma operacin de subida sobre el covariograma g3(h1, h2, h3) de la V.R. f3, dicho de otra manera, en lenguaje breve: el covariograma sube al mismo tiempo que la V.R. asociada. Demos una demostracin de este resultado a partir de Sea fn(x1, x2, ..., xn) una V.R. en Rn, n(u1, u2, ..., de Fourier. Por subida de orden 1 a lo largo del obtiene la V.R. fn-1(x1, x2, ..., xn-1) cuya transformada (1-5) la relacin (1-4). un) su transformada eje de las xn, se de Fourier es:

n-1(u1, u2, ..., un-1)= n(u1, u2, ..., un-1,0)

Dicho de otra manera, segn el mecanismo de calculo evidente (el cual se encuentra tambin en teora de probabilidades, al pasar a una ley marginal) se obtiene n-1 haciendo un=0 en la expresin de n. Designemos ahora por gn y gn-1 los covariogramas de fn y fn-1, por Gn y Gn-1 sus transformadas de Fourier tomadas en los espacios respectivos Rn y Rn-1. Segn (1-4) se tiene:

Gn = n
Segn (1-5), se deduce:

, Gn 1 = n 1

Gn 1 (u1 , u2 ,..., un 1 ) = n (u1 ,..., un 1 , 0) = Gn (u1 ,..., un 1 , 0)


Luego, se obtiene Gn-1 anulando un en la expresin de Gn. Segn la reprocidad de la transformada de Fourier y la expresin (1-5) de la subida, resulta bien que gn-1 se deduce de gn por subida de orden 1. 1-3-3 La subida en el caso istropo Examinemos ahora el caso istropo, es decir el caso en que la V.R. fn(x), x Rn admite un covariograma gn(r) el cual solo depende del vector r=|h|. En este caso no es necesario especificar en qu direccin se efecta la subida. Las subidas de orden 1, 2, ... proporcionan variables regionalizadas fn-1, fn-2, ... cuyos covariogramas gn-1(r), gn-2(r), ... dependen nicamente del vector r (del espacio de n-1, n-2, ... dimensiones). De acuerdo a lo anterior, estos covariogramas se deducen de gn por subida, y se encuentra, sin dificultad:

20

2 2 g n 1 (r ) = 2 g n ( h + r )dh 0 g (r ) = 2 g ( h 2 + r 2 )hdh n n2 0

El cambio de variables u2=h2+r2, proporciona:


u ( ) 2 = g r g n (u ) du n 1 (u 2 r 2 r = ( ) 2 g r g n (u )udu n2 0

(1-6)

Aparece as una diferencia notoria entre las subidas de orden 1 y 2. La subida de orden 1 (y, ms generalmente la subida de orden impar) es una operacin elemental. Se inversa fcilmente por derivacin: (1-7)

g n (r ) =

1 2 r

' gn 2

Por el contrario, la subida de orden 1 (y, ms generalmente de orden impar) es una operacin ms difcil, debido a la presencia de una raz cuadrada bajo el signo de integracin, y, no se invierte fcilmente. Es posible demostrar que las subidas, y sus inversas o descensos, consideradas como operadores sobre funciones istropas de tipo gn(r) constituyen un grupo (ver [4]). Para encontrar la expresin del descenso de orden 1 (gn-1gn), se puede primero efectuar un descenso de orden 2, lo cual conduce, segn (1-7) a:

g n +1 =

1 2 r

' gn 1 ( r )

luego una subida de orden 1 que da, segn (1-6):

g n (r ) = 2 g n +1 (u )
r

udu u2 r2

g
r

' n 1

(u )

du u2 r2

En otras palabras, hemos establecido las expresiones recprocas de la subida y el descenso de orden 1:

21

(1-8)

udu g n 1 (r ) = 2 g n (u ) 2 2 u r r g (r ) = 1 g ' (u ) du n 1 n u2 r2 r

Se encontrar ms tarde (Ejercicio 11 bis) una aplicacin interesante de estas frmulas de reciprocidad al problema que consiste en reconstituir la granulometra de una poblacin de esferas del espacio de 3 dimensionas, a partir de la granulometra de crculos o de lneas (cuerdas) inducidas por planos o rectas. Adoptemos ahora el punto de vista de la transformacin de Fourier,y sea G=Fngn la transformada del covariograma gn (tomada en el espacio de n dimensiones). Como la funcin gn es istropa, su transformada de Fourier solo depende del radio vector:
2 2 = (u12 + u2 + ... + un )

del espacio de n dimensiones en el cual estn definidas las transformadas Fn. Luego G es tambin una funcin istropa del tipo G(). Segn (1-5) se obtiene Fn-1(gn-1) al anular un en la expresin de Fn(gn). Pero anular un en la expresin del radio vector conduce a la expresin (u12+...+un-12)1/2,es decir al radio vector del espacio de n-1 dimensiones, que podemos de nuevo designar por . Por consiguiente, la transformada G() del covariograma istropo gn es invariante por subida (y, tambin por descenso): (1-9) G() = Fn(gn) = Fn-1(gn-1) = Fn+1(gn+1) = ...

Se dispone aqu de un medio analtico cmodo para explicitar una subida o un descenso. El principio de correspondencia. Examinemos ahora cmo se comporta en la subida lo que ms nos interesa en un covariograma istropo, es decir, la parte irregular de su desarrollo limitado en una vecindad del origen (prrafo 1-2). El resultado esencial (cuya demostracin se encuentra en [4]) es el siguiente: se puede efectuar la subida trmino a trmino sobre la parte irregular de gn, segn la regla de correspondencia: (1-10)

r = A r +1

( no entero)

y este principio de correspondencia proporciona el desarrollo limitado de gn-1(r) salvo una serie entera par. No existe una regla anloga para la parte regular (pero esto no ser problemtico porque, tal como veremos, las varianzas de estimacin solo dependen de la parte irregular). El orden del trmino irregular de ms bajo grado se aumenta as en 1, y esta circunstancia nos muestra bien el efecto de regularizacin que tiene la subida.

22

En lo que respecta a los trminos de grado entero par y los trminos logartmicos de la parte irregular, el principio de correspondencia trmino a trmino es tambin aplicable de la forma siguiente:
2k 2 k +1 r log (r ) A2 k r 2 k +1 A2 k +1r 2 k + 2log (r ) r

(1-11)

Se obtiene as, por subidas sucesivas, la serie singular alternan trminos impares y trminos logartmicos. Por ejemplo:

donde

se

log (r ) r r r 2log (r )
Clculo de los coeficientes A Para una demostracin rigurosa, ver [4]. Daremos aqu una justificacin simblica, cuyo principio nos servir tambin para el clculo de varianzas de estimacin. Al considerar que r es una distribucin (y no como una funcin, lo que implica que esta justificacin es slo simblica), r admite, en el espacio de n dimensiones, la transformada de Fourier siguiente:

Fn (r ) =

+n / 2

+n 2 1 +n 2

( no entero). Segn (1-9), la subida de orden 1 realizada sobre r conduce a Fn-1(Fn(r)). Al calcular Fn-1(--n) y segn la frmula anterior, se tiene:

Fn 1 ( n ) =

n +1 + 2

+1 2 +1 r +n 2

y se deduce la expresin del coeficiente A de la regla de correspondencia (1-10), con la ayuda de las funcin de Euler , es decir:

(1-12)

1+ 2 = tg A = 2 2

1 + 2 1 + 1 + 2

Esta justificacin, repitmoslo, es solamente simblica, y, en particular, no muestra que la regla de correspondencia (1-10) proporciona el resultado de la subida salvo una serie entera. Sin embargo, el resultado (1-12) es correcto. En el caso de una serie singular (1-11), se obtiene (por pasos al lmite sobre los cuales no insistiremos aqu):

23

(1-13)

2k k ! 22 k (k !) 2 = A2 k = 1 3 (2k + 1) (2k + 1) 2 2 k A = 2 (2k + 1)! 2 k +1 k !(k + 1)!

1-4 LA ESTIMACION DE LAS VARIABLES REGIONALIZADAS En este prrafo, fundamental, definiremos la varianza de estimacin para una malla regular, proporcionando dos expresiones equivalentes (rigurosas) vlidas en el espacio de n dimensiones (prrafo 1-4-1). En el prrafo (1-4-2), examinaremos el caso de una malla aleatoria estratificada. A continuacin, buscaremos mtodos de aproximacin, primero en el espacio de 1 dimensin (1-4-3) luego a 2 o ms dimensiones (1-4-4) y aplicaremos estos resultados al problema geomtrico (1-4-5). Un examen crtico de las condiciones mediante las cuales es posible aplicar estos resultados permitir preparar el paso a la versin probabilstica de la teora. 1-4-1 Expresin rigurosa de la varianza de estimacin (malla regular) Para abreviar, explicitaremos los clculos en el espacio de 1 sola dimensin. Sin embargo estos resultados se generalizan sin dificultad al espacio de n dimensiones. Sea f(x) una V.R. en la recta y:
+

Q=

f ( x)dx

la cantidad de metal asociada. Para estimar Q, se dispone de una malla de muestreo con una malla regular a. En otras palabras, si designamos por x0 la abscisa de una (cualquiera) de las muestras de la red, conocemos los valores f(x0+pa) de la V.R. f(x) para p entero positivo o negativo. En realidad f(x) es diferente de 0 en un conjunto acotado, solamente un numero finito de estos valores f(x0+pa) es diferente de 0, y, en adelante, no nos preocuparemos acerca de la convergencia de las series (que tienen, en realidad, un nmero finito de trminos). En la prctica no ser necesario que la red de muestras sea realmente infinita; bastar con que sobrepase un poco el campo geomtrico de la V.R. Para estimar la cantidad de metal Q, se forma entonces el estimador:

Q* ( x0 ) = a f ( x0 + pa )
p =

p =+

que es una funcin peridica (de perodo a) de la abscisa x0 elegida arbitrariamente como origen de la red. El error Q-Q*(x0) asociado a esta estimacin es igualmente una funcin peridica de x0, vamos a caracterizar su magnitud posible mediante una varianza de estimacin que escribiremos 2(a).

24

De acuerdo a nuestro hilo conductor metodolgico (prrafo 0-4) no introduciremos todava ninguna interpretacin probabilstica relativa a la V.R. f(x) misma: f(x) representa una realidad fsica nica, perfectamente determinada (an si no la conociramos efectivamente). Pero, justamente porque al comienzo no conocemos nada, acerca de f(x), implantamos nuestra red de muestras no importa donde o al azar relativamente a esta realidad fsica desconocida. No es difcil dar un sentido epistemolgico ms preciso a este no importa donde admitiendo que todo sucede como si el origen x0 de la red se implant al azar sobre un segmento de longitud a segn una ley de probabilidad de densidad uniforme. Esta hiptesis expresa simplemente la ignorancia en que estamos, al comienzo, respecto de la localizacin exacta de un fenmeno determinstico, y no implica entonces un compromiso epistemolgico grave. Segn esta implantacin aleatoria del origen x0 en el segmento (0,a), la estimacin Q*(x0) es una variable aleatoria. Calculemos su esperanza matemtica y su varianza: diremos, por definicin que esta varianza es la varianza de estimacin 2(a). Para la esperanza se encuentra:
a dx + E (Q* ) = a f ( x0 + pa ) 0 = f ( x)dx = Q p a 0

Nuestro estimador Q* es entonces un estimador insesgado. La varianza de estimacin es:


* (a) = E (Q ) Q = Q ( x0 ) 2 *2 2 0 a 2

dx0 Q2 a

Evaluemos la integral de [Q*(x0)]2. Se tiene:


* 2 Q ( x0 ) =a 2

p = q =

f ( x0 + pa ) f ( x0 + qa ) = a 2 f ( x0 + pa) f ( x0 + pa + ka )
k p

Integremos de 0 a a. Se tiene:

Q ( x )
* 0 0

dx0 =a

f (x
k 0 p

+ pa ) f ( x0 + pa + ka )dx0 =

= a2

f ( x0 ) f ( x0 + ka )dx0 = a 2 g (ka )
k

Al tomar en cuenta la relacin (1-2), se obtiene entonces la frmula: (1-14)

(a) = a g (ka )
2 k =

g (h)dh

25

En el espacio de n dimensiones, se tiene un resultado totalmente anlogo. Por ejemplo, para n=3, y para una malla en forma de paraleleppedo a1 a2 a3 se tiene:

2 (a1 , a2 , a3 ) = a1a2 a3 g (k1a1 , k2 a2 , k3 a3 ) g (h)dh


k1 k2 k3

Observacin La varianza de estimacin (1-14) es la diferencia entre un valor aproximado


2

el

valor

exacto

de

la

integral

consiguiente (a) es ms pequea cuando:


g (h)dh .

Por

la malla a es ms pequea la funcin g, luego tambin la funcin f, es ms regular.

Si la malla es pequea con respecto al alcance de g(h), la frmula (1-14) tiene un gran nmero de trminos. Lo anterior nos conduce a buscar frmulas de aproximacin (ver prrafos 1-4-3 y 1-4-4). Daremos una segunda expresin (equivalente para la varianza de estimacin, utilizando esta vez la transformada de Fourier G del covariograma g. El estimador Q* es una funcin peridica, luego admite un desarrollo en serie de Fourier:
x + 2 i p 0 * a = Q ( x ) C e p 0 p = a x C = 1 Q* ( x )e 2i p a dx 0 p a 0

Si reemplazamos Q*(x0) por coeficiente de Fourier Cp es:


a

su

expresin
x a +

explcita,
y a

se

ve

que

el

C p = f ( x + ka )e
k 0

2 i p

dx =

f ( y )e

2 i p

dy

Por consiguiente, si (u) es la transformada de Fourier de f(x), se tiene:

p Cp = a
En particular C0 = (0) = Q. Las propiedades de ortogonalidad de las funciones trigonomtricas conducen a:

2 (a) = C p Q 2
2
p

y, considerando (1-4):

26

(1-15)

2 (a) = G G (0) a
p

Esta frmula, equivalente a (1-14) muestra que 2(a) es positiva si G es una funcin positiva (luego, cuando g es de tipo positivo). Se generaliza al caso pluridimensional. Para R2, por ejemplo, con una malla rectangular (a1, a2) se encuentra: (1-16)

2 (a1 , a2 ) = G
p ,q

p q , G (0, 0) a 1 a2

Observacin De lo anterior se debe retener sobretodo este resultado fundamental: la varianza de estimacin 2(a) solo depende del covariograma transitivo g(h) y de la malla a. La frmula (1-14) muestra adems que esta varianza depende linealmente de g(h). Entonces, si conocemos el verdadero covariograma g de una V.R., estaramos en condiciones de resolver el problema de la estimacin, de una manera totalmente satisfactoria y sin probabilizar el fenmeno real. En vista de preparar el paso a la versin probabilstica de la teora, que tendr lugar en el prrafo (1-4-6), mostremos que en lo anterior hay algo ilusorio. En efecto, si solo se dispone de los datos experimentales f(x0+pa), para un x0 fijo, no se conocer el verdadero covariograma g(h). Solamente se podrn estimar los valores numricos de los g(ka) con la ayuda de los estimadores:

g * (ka ) = a f ( x0 + pa ) f ( x0 + pa + ka)
p

De la misma manera, para estimar el trmino

el cuadrado [Q*(x0)]2 del estimador Q*(x0) mismo. Pero, si sustituimos estos estimadores en la frmula (1-14), obtenemos idnticamente 0, tal como muestra el clculo fcil siguiente:
* a g * (ka ) Q ( x0 ) =0 2 k

Q 2 = g (h)dh , se podr tomar

Este resultado se entiende bastante bien: al reemplazar en (1-14) los valores verdaderos por sus estimaciones, hemos implcitamente reemplazado la verdadera V.R. f(x), definida en la recta real, por su restriccin f(x0+pa) al conjunto discreto constituido por los puntos de muestreo x0+pa. El resultado obtenido significa simplemente que Q*(x0) es un excelente estimador de Q*(x0). En trminos menos triviales, esto significa que es ilusorio esperar, por procedimientos puramente empricos, extraer de un mismo material experimental (los f(x0+pa)), a la vez una estimacin de Q y la precisin de esta estimacin. Para salir de este impasse metodolgico, es obligatorio recurrir a un modelo terico. Se elegir una expresin matemtica apropiada

27

g(h;,,...) la cual depende de uno o varios parmetros , , ... que ajustan de la mejor manera posible los puntos g*(ka) experimentales (es intil e ilusorio hacer pasar la curva terica por los puntos experimentales), y es, a este g(h;,,...) al cual se la aplicar la frmula (1-14). El resultado que se obtendr tendr, exactamente, el mismo valor que la eleccin del modelo de covariograma. Indiquemos ahora que la eleccin de g(h) no es arbitraria. En primer lugar la funcin g(h;,,...) debe ser de tipo positivo (prrafo 1-2). En segundo lugar, se deber asignar una importancia extrema al comportamiento de esta funcin en una vecindad del origen, es decir a su parte irregular: el orden del trmino irregular de ms bajo grado, eventualmente la presencia de un efecto de pepita. Estas caractersticas tienen la significacin de leyes fsicas y constituyen caractersticas objetivas del fenmeno real. La experiencia ayuda, rpidamente se sabe (aprovechando ocasiones en las cuales se dispone de redes de muestras particularmente densas) que tal tipo de fenmeno se caracteriza por este u otro comportamiento analtico de su covariograma. Definitivamente (prrafo 1-4-3) es de este comportamiento del cual depender la varianza de estimacin, lo que implica que el problema se reducir, en grueso, a determinar el coeficiente del trmino irregular de ms bajo grado, y esto es posible de hacer, en general, experimentalmente de una manera satisfactoria. 1-4-2 Caso de una malla aleatoria estratificada Sea f(x) una V.R. en Rn, g(h) su covariograma, y sea V el paraleleppedo de lados a1, a2, ..., an, centrado en el origen. Designemos por hi los vectores cuyas componentes son mltiplos enteros p1a1, p2a2, ..., pnan de los lados del paraleleppedo V, de manera que los trasladados Vhi de V por los hi cubren todo el espacio. La malla aleatoria estratificada definida por el paraleleppedo V se construye como sigue:

se elige un origen x0 V para cada ndice i, se elige al azar un punto xi V de manera tal que los xi sean independientes admitiendo la misma ley de densidad uniforme en V. se efecta un muestreo en cada uno de los puntos x0+hi+xi. fijo, es entonces:

El estimador Q*(x0) de la cantidad de metal, con x0 V

Q* ( x0 ) = vf ( x0 + hi + xi )
i

Si x0 es fijo, los vf(x0+hi+xi) son variables aleatorias independientes. Expresemos sus esperanzas y sus varianzas con la ayuda de la regularizada:

f v ( x) =

1 f ( x + y )dy v v

(que representa la media de f en el paraleleppedo vx centrado en x). Se encuentra: 28

E ( f ( x0 + hi + xi ) x0 ) =

1 f (x0 + hi + y )dy = f v ( x0 + hi ) v v 1 f 2 (x0 + hi + y )dy f v 2 ( x0 + hi ) v v

D 2 ( f ( x0 + hi + xi ) x0 ) =

Estas variables son independientes cuando x0 est fijo, se deduce entonces la esperanza y la varianza condicional de Q*(x0):

E (Q* | x0 ) = vf v ( x0 + hi ) = Q D (Q | x0 ) = v 2 D 2 ( f ( x0 + hi + xi ) | x0 ) = vg (0) v 2 f v2 ( x0 + hi )
2 * i i i

Si x0 es fijo, Q*(x0) es tambin un estimador insesgado. Pero de la misma manera que en el prrafo anterior nuestra ignorancia inicial respecto a la localizacin del fenmeno real se formaliza asimilando x0 a una variable aleatoria, independiente de los xi, admitiendo tambin una densidad uniforme en v. Como E(Q*|x0)=Q no depende de x0, la varianza a priori de Q*(x0) es decir la varianza de estimacin de la malla aleatoria estratificada se obtiene tomando directamente la esperanza matemtica en x0 de la varianza condicional D2(Q*|x0), es decir:

D 2 (Q* ) =

1 D 2 (Q* | x0 )dx0 = vg (0) f v2 ( x0 + hi )dx0 = v i v v

= vg (0) v f v2 ( x)dx
Designemos por gv el covariograma de la regularizada fv. Segn el prrafo (1-3-1), este covariograma se deduce del covariograma geomtrico K(h) del paraleleppedo por la relacin:

gv =
En particular:

1 g*K v2

g v (0) =

1 g (h) K (h)dh = f v2 ( x)dx v2

Segn el algoritmo de Cauchy (ver ejercicio 2), gv(0) representa el valor medio de g(x-y) cuando x e y describen separadamente el paraleleppedo v, y la varianza de estimacin buscada se escribe: (1-17)

D 2 (Q ) = v [ g (0) g v (0) ]

Esta varianza depende solamente del comportamiento de g(h) en una vecindad del origen definido precisamente por el paraleleppedo v mismo.

29

1-4-3 Frmulas de aproximacin para el espacio de una dimensin. Sea ahora f(x) una V.R. del espacio de una dimensin, g(h) su covariograma, y a una malla de muestreo. Cuando la malla es pequea, la frmula (1-14) contiene un nmero demasiado grande de trminos, luego es til obtener frmulas de aproximacin que permitan un calculo rpido. En realidad, el inters de las frmulas de aproximacin que vamos a establecer va ms lejos de las simples razones de comodidad, y, presenta una significacin epistemolgica fundamental para el problema que nos interesa. En efecto, vamos a ver que (salvo un termino fluctuante del cual debemos examinar su significado) la varianza de estimacin 2(a), para a pequeo, depende solamente del comportamiento analtico de g(h) en una vecindad de h=0. La estructura de la frmula (1-14) muestra que la varianza de estimacin 2(a) no es otra que el error numrico que se comete si se desea evaluar la integral

g (h)dh

a partir de la suma discreta a

g (ka) .

Luego si g(h)

fuera una funcin suficientemente regular (es decir derivable en todas partes un nmero suficiente de veces) se podra evaluar directamente 2(a) por los mtodos clsicos basados en la frmula de Euler-Mac Laurin. Pero g(h) no es, en general, suficientemente regular en todo h. Los modelos tericos de covariograma que se utilizan en la prctica localizan las irregularidades analticas en dos lugares cruciales:

en una vecindad del origen, como ya hemos visto pero tambin en una vecindad de h=b, siendo b el alcance, debido a que la interseccin en b de g(h) puede ser ms o menos brutal.

Sin embargo, los modelos tericos de g(h) no presentan nunca irregularidades analticas. Esto no quiere decir que esto sea as para los covariogramas verdaderos. Pero no conoceremos nunca estos covariogramas verdaderos, y, como lo vimos al final del prrafo (1-4-1), estamos siempre obligados a reemplazarlos por un modelo terico. En el prrafo 1-4-6 se examinar el alcance epistemolgico de esta operacin ambigua que consiste en reemplazar el covariograma verdadero (desconocido) por un modelo terico, analticamente simple, cuyas irregularidades se encuentran concentradas en el origen y en el alcance:

Por el momento, partiremos de la hiptesis que las irregularidades se encuentran localizadas efectivamente en estos dos puntos. Mediante clculos sobre los cuales no insistiremos aqu (ver [4]), se puede

30

demostrar que la varianza de estimacin, para a pequeo, es la suma de dos trminos:

2 (a) = T (a) + Z (a)


El primer trmino T(a), o trmino de extensin, depende del comportamiento de g(h) en h=0. El segundo, Z(a), o trmino fluctuante o Zitterbewegung, depende del comportamiento de g(h) en una vecindad del alcance b. Respecto del trmino fluctuante Z(a), se puede demostrar que depende esencialmente de =b/a Modulo 1 (ms precisamente: se puede encontrar un entero n tal que na b (n+1)a y sea =(b-na)/a). Z(a) es una funcin peridica de , de perodo 1, y admite un desarrollo en serie de Fourier, sin trmino constante, luego de valor medio nulo cuando vara entre 0 y 1:

Z (a)d = 0
0

La expresin terica de este trmino fluctuante es posible de determinar tericamente. Su magnitud no es en absoluto despreciable, a menudo tiene un valor considerable (ver figura 1 y el ejercicio 14). Sin embargo, en las aplicaciones, no se podr nunca calcular el valor exacto de este trmino, debido a que precisamente, el valor exacto del alcance b es conocido con un error de a, luego, = b/a Modulo 1, es una cantidad totalmente indeterminada. Nos autorizamos a despreciar simplemente este trmino fluctuante, debido al hecho que su valor medio en en el intervalo [0,1] de este trmino fluctuante es siempre nulo, que es lo que haremos en adelante. Se observar el carcter probabilstico camuflado de esta aproximacin, sobre la cual volveremos en el prrafo 1-4-6. Examinemos ahora el trmino principal T(a), o trmino de extensin, ligado nicamente al comportamiento analtico de g(h) en h=0. Un estudio analtico detallado (ver [4]) muestra que este trmino solo depende de la parte irregular del desarrollo limitado de g(h) en una vecindad del origen. Ms precisamente, se puede establecer la validez de un principio de correspondencia trmino a trmino, anlogo al que encontramos en el estudio de la subida istropa: cada trmino en |h| del desarrollo limitado de g(h) aporta a la varianza 2(a) una contribucin en Ta+1, con un coeficiente T que solo depende de : (1-18)

h T a1+

Para entero par, se encuentra T=0, y esto confirma que la parte irregular del covariograma no aporta ninguna contribucin al desarrollo limitado de la varianza de estimacin. Para entero impar, la regla (118) subsiste, sin modificacin. Para un trmino logartmico en h2nlog(h), se encuentra, sin dificultad:

h 2 n log(h) T2'n a1+ 2 n

31

con un coeficiente T2n igual a la valor en =2n de la derivada

d T . d

Clculo del coeficiente T. Se encontrar en [4] un clculo riguroso del coeficiente T que figura en la regla de correspondencia (1-18). Nos contentaremos con una justificacin simblica (anloga a la que dimos para el clculo del coeficiente A de la subida). Si G(u) es la transformada de Fourier del covariograma g, se tiene, segn (1-15):

2 ( a ) = 2 G a
p =1

Si tuviera un sentido tomar la transformada de Fourier de la funcin |h|, la transformada de Fourier (en el sentido de las distribuciones) sera:

G (u ) =

+1/ 2

+1 2 1 | u |1+ 2

y, si la frmula (1-15) siguiera vlida para esta transformada tomada en el sentido de las distribuciones, se encontrara que:

2 (a) =

2a

1+

+1/ 2

+1 1 2 p1+ p =1 2

De donde se deducira la expresin de T:

(1-19)

+1 1 2 2 T = p1+ 1 + 2 p =1 2

Se encuentra que el valor T obtenido mediante este razonamiento aproximado corresponde bien con el valor correcto. En particular:

1 T1 = 6 T2 ' = 0.0609...
El principio de correspondencia permite un clculo fcil y rpido de la varianza de estimacin. Sin embargo, no hay que olvidar, que se ha despreciado un Zitterbewegung, cuya amplitud puede ser enorme, y que lo

32

que se obtiene es en realidad el desarrollo limitado de 2(a) en una vecindad de h=0, luego un resultado utilizable solamente para las mallas pequeas. Por otra parte, para una malla a grande, la frmula general contiene un nmero modesto de trminos y puede ser utilizada directamente. Cuando la malla es superior al alcance, solo subsiste, en (1-14), el trmino correspondiente a k=0, y se obtiene la frmula simple: (1-20)

2 (a ) = ag (0) g (h)dh

(a b)

El sentido probabilstico de esta ecuacin est indicado en el ejercicio 15. Observacin: Si L=na es la longitud mineralizada, y n el nmero de muestras positivas, al covariograma en |r| le corresponde la varianza de estimacin siguiente:

2 (a) = T a1+ = (T L1+ )

1 n
1+

Esta varianza est en razn inversa de n1+ (y no en 1/n como lo habra sugerido una aplicacin errnea de la estadstica clsica). 1-4-4 Frmulas de aproximacin en Rn. Vamos a estudiar en detalle el caso del espacio de dos dimensiones, la generalizacin a Rn es simple. Nuestro objetivo es desarrollar un segundo principio de aproximacin, que permita reducir el clculo de una varianza de estimacin 2(a1, a2) a la suma de dos varianzas de estimacin de una sola dimensin, como las reglas de correspondencia (1-18) y (1-19), luego, muy fciles de calcular. Designaremos este principio como principio de composicin de trminos de lnea y de rebanada. Examinemos primero, el sentido intuitivo de este principio. Sea (a, a2), con a1>a2, una malla rectangular, f(x, y) una V.R. definida en el plano, g(h1, h2) su covariograma, y g1(h) el covariograma que se deduce de g por subida a lo largo del eje de las y:

33

Nuestro principio de correspondencia enuncia que la estimacin 2(a1, a2) de la malla rectangular es la suma:
2 2 (a1 , a2 ) = 12 (a1 ) + a1 2 (a2 )

varianza

de

(1-20)

de dos trminos: el primero, 12(a1) se calcula con la relacin (1-14) aplicada al covariograma subido g1, y representa el error que se comete al estimar la cantidad de metal Q a partir de las lneas de mayor densidad de muestreo (en el dibujo, paralelas al eje y); es el trmino de lnea. El segundo trmino, a122(a2) se llama trmino de rebanada o de rebanada. Este trmino representa el error que se comete al estimar la acumulacin de las lneas a partir de muestreos puntuales. Se calcula 22(a2) aplicando la frmula (1-14) a la malla a2 y al covariograma de 1 dimensin g(0,h). El principio (1-20) expresa entonces que: desde el punto de vista del clculo de las varianzas de estimacin, los dos errores cometidos: primero al estimar la acumulacin de las lneas a partir de las muestras, segundo al estimar la cantidad de metal a partir de estas acumulaciones, que se supone conocidas, pueden ser considerados como no correlacionados. Antes de dar una justificacin aproximada, precisemos el enunciado de este principio. Para abreviar las notaciones, designaremos por a al operador lineal asociado, segn (1-14), a la varianza de estimacin para una malla a:

a ( g ) = a g (ka)
k =

g (h)dh

Sean (x0, y0) las coordenadas de una de las muestras. Designemos por:

Li ( x0 ) = f ( x0 + ia1 ; y )dy
la acumulacin de la lnea i de abscisa x0, y por:

L* i ( x0 , y0 ) = a2

p =

f ( x0 + ia1 ; y0 + pa2 )

el estimador que se puede formar. Hemos visto en el prrafo (1-4-1) que x0 e y0 deben ser considerados como dos variables aleatorias independientes que admiten densidades uniformes en (0,a1) y (0,a2) respectivamente. La acumulacin Li(x0) de la lnea i es entonces una variable aleatoria, y es claro que si se fija x0 se tiene:

E ( L* i | x0 ) = Li ( x )
Para estimar

Q = f ( x, y )dxdy , se forma el estimador:


Q* ( x0 , y0 ) = a1 L* i ( x0 , y0 )
i

34

y el error de estimacin se puede escribir: (1-21)

Q Q* = (Q a1 Li ) + a1 ( Li L* i)
i i

El primer trmino es el error que se comete al estimar Q a partir de las acumulaciones. Segn la definicin misma de la subida, la varianza de este trmino (trmino de rebanada) se obtiene al aplicar (1-14) al variograma g1 de una dimensin, deducido de g2(h1, h2) por subida a lo largo del eje y, es decir, con nuestras notaciones:

12 (a1 ) = a ( g1 )
1

El segundo trmino es la suma de los errores Li-L*i cometidos al estimar cada una de las acumulaciones a partir de muestras puntuales. Para cada lnea i, se acaba de ver que la esperanza matemtica de este error es nula cuando x0 est fijo.

E ( Li L* i | x0 ) = 0
Si x0 est fijo, la V.R. f(x0+ia1;y) definida en la lnea i admite el covariograma de una dimensin gi definido por
+

(1-22)

g i ( h) =

f ( x0 + ia1 ; y ) f (x0 + ia1 ; y + h)dy

y la varianza condicional de Li-L*i es entonces:

D 2 ( Li L* i | x0 ) = a2 ( g i )
Ahora establecemos la hiptesis (que justificaremos ms tarde) segn la cual los Li-L*i pueden ser considerados sin correlacin cuando x0 est fijo. La varianza condicional del trmino de lnea es entonces:
2 a12 D 2 ( Li L* i | x0 ) = a1 a2 ( g i ) i i

Como E(Li-L*i)=0, se deduce la varianza a priori del trmino de lnea al tomar la esperanza matemtica en x0, es decir:

a1 dx0 a2 ( gi )
0 i

a1

Pero queda claro que el operador lineal

se puede permutar con la

sumatoria en i y la integral en x0. Al utilizar (1-22), se encuentra entonces para el trmino de lnea:

35

a1 a2 dx0 f ( x0 + ia1 ; y ) f (x0 + ia1 ; y + h)dy =


0 i

a1

= a1 a2

dx f ( x, y ) f ( x, y + h)dy = a1 a2 ( g (0, h))

El trmino de lnea es entonces:


2 a1 a2 ( g (0, h)) = a1 2 (a2 )

en conformidad con (1-20). Para obtener la relacin (1-20) misma, queda por admitir la ausencia de correlacin de los dos errores Q a1 Li y a1 ( Li L* ) que figuran en (1-21). i Este principio de composicin de trminos de lnea y de rebanada presenta gran importancia, por razones prcticas, primero, porque permite calcular muy fcilmente un valor aproximado de la varianza de estimacin, segundo, tambin por razones metodolgicas: porque al considerar el principio de correspondencia, se muestra que, en el espacio de dos dimensiones, tambin la varianza de estimacin depende esencialmente del comportamiento de g(h) en una vecindad del origen. Encontraremos de nuevo este principio de correspondencia, en una forma equivalente, en la versin probabilstica de la teora. Luego, no est de ms, dar una justificacin, por lo menos simblica. Para ello aplicaremos el principio de correspondencia. A cada trmino en r de la parte irregular del covariograma g le corresponde, por subida el trmino Ar1+ en el covariograma subido g1 (relaciones (1-10) y (1-12)), despus el trmino AT1+a12+ en la expresin del trmino de rebanada (relaciones (1-18) y (1-19)). Igualmente, r contribuye con Ta1a21+ al trmino de lnea. Nuestro principio de composicin se traduce entonces por la regla de correspondencia: (1-23)
+ r A T1+ a12+ + T a1a1 2

Inversamente, la regla (1-23) permite reconstituir el principio (1-20) (con la nica condicin que el covariograma g sea istropo o pueda reducirse a la forma istropa por una transformacin lineal). Esta es la regla que vamos a justificar. Justificacin de la regla (1-23). Partamos de la frmula general (1-16), en que G(u,v) es la transformada de Fourier del covariograma g. Esta frmula se escribe:

2 (a1 , a2 ) = G
p ,q

p q , G (0, 0) a1 a2

En la suma doble, los trminos correspondientes a q=0 proporcionan el trmino de rebanada.

36

12 (a1 ) = G
p

p , 0 G (0, 0) a1

En efecto G(u,0) es la transformada del covariograma subido g1(h), y la frmula (1-15) muestra que el trmino anterior es precisamente la varianza de 1 dimensin 12 (a1 ) = a1 ( g1 ) , calculada en el variograma subido g1. El segundo trmino o trmino de lnea, tiene entonces la expresin exacta:

q =1 p =

G a

p q , 1 a2

Para justificar (1-23), es necesario probar que la contribucin del trmino en r a esta expresin en el desarrollo de g es Ta1a21+. En el espacio de dos dimensiones, la transformada de r es:

+1 1 1 2 F2 (r ) = 1+ 1+ (u 2 + v 2 ) 2 2
Debemos establecer entonces la relacin:

(1-24)

+1 + + 2 1 2 + = T a1a1 2 1+ 1+ q =1 p = 2 p q2 2 + 2 2 2 a1 a2

para un entero q fijo, se tiene:

(1-25)

p =

1 p q 2 + 2 a1 a2
2 2 1+

a = 2 q

+2

p =

1 pa 1 + qa
2 2 2 2 1 2 1+

Por otra parte se supone que a2 es pequeo respecto de a1, luego la cantidad:

b=
es pequea. La suma de Riemann:

a2 qa1

b (1 + b 2 p 2 )
1+

proporciona una buena aproximacin de la integral:

37

dx (1 + x )
2 1+

Por otra parte se puede demostrar que el error cometido al reemplazar la suma discreta por una integral es de un orden muy elevado en b. Se deduce, con una aproximacin excelente:

b (1 + b 2 p 2 )
1+

1 b

dx (1 + x 2 )
1+

1+ 1 2 = b 1 + 2

Al reemplazar b por su valor a2q/a1, e introduciendo este valor en (1-25), se tiene:

p =

1 p2 q2 2 + 2 a1 a2
1+

+ =a1a1 2

1+ 2 1 q1+ 1 + 2

Al llevar este resultado al primer miembro de (1-24) se obtiene:

1+ + 1 2 2 + a1a1 q1+ 2 1 + 2 q =1 2
Pero, segn (1-19) esta expresin es precisamente igual a Ta1a21+, de manera que la relacin (1-24) se verifica, luego tambin la regla de correspondencia (1-23) y el principio de composicin se encuentra justificado. 1-4-5 Aplicacin a la estimacin de una superficie. Apliquemos el principio de composicin del prrafo anterior al caso de la estimacin de una superficie S. La V.R. a estimar es la funcin indicatriz k(x) del conjunto S. Hemos visto que el covariograma geomtrico K(h) asociado es lineal en una vecindad del origen (prrafo 1), es decir:

K (h) = S | h | D + ...
En que D es la variacin diametral en la direccin del vector h.

38

a/ Consideremos primero el caso istropo, es decir en el caso en que la variacin diametral D=D es aproximadamente independiente de la direccin . Con T1=-1/6 y a1T2=-0.0609, la regla (1-23) proporciona la varianza de estimacin de S para una malla rectangular (a1, a2), en la forma: (1-26)
2 2 = D a1a2 + 0.0609a13 S

1 6

(a2 a1 )

Busquemos ms bien la varianza relativa S2/S2. En realidad no conocemos el verdadero valor de S, sino simplemente su estimador na1a2, siendo n el nmero de puntos positivos de la red. Al dividir por (na1a2)3/2(S), se obtiene la expresin interesante:
2 S 3/ 2 a2 1 D 1 a2 = + 0.0609 S 2 n3/ 2 S 6 a1 a1

(1-27)

(a2 a1 )

Por otra parte, no conocemos la variacin diametral D. Para estimarla, se reemplaza el conjunto S desconocido por la unin de las zonas de influencia (rectngulos a1, a2). Se cuentan los nmeros 2N1 y 2N2 de elementos lineales a1, a2 que constituyen el permetro del contorno obtenido. Las variaciones diametrales correspondientes son D1=N1a1 y D2=N2a2. Como estamos, por el momento, en el caso istropo, se tiene:

D = N1a1 = N 2 a2
Sustituyendo en (1-26), y dividiendo por S2=(na1a2)2. Queda: (1-28)
2 S

S2

N12 1 N2 + 0.061 n2 6 N2

( N 2 N1 )

b/ En general, sin embargo, el contorno no ser suficientemente istropo para que D pueda ser considerado como una constante D. Por ejemplo, puede presentar una direccin principal de alongamiento. Si uno de los lados de la malla es paralela a esta direccin principal (lo cual ser a menudo el caso), la frmula (1-28) anterior sigue siendo vlida: en efecto, tomando esta direccin principal como eje de las x, y multiplicando las coordenadas por un mdulo conveniente, obtenemos una nueva figura, istropo esta vez (al menos en primera aproximacin) para la cual (1-28) es vlida. Pero esta transformacin no ha modificado ni N1

39

ni N2, ni la varianza relativa S2/S2, de manera que (1-28) es vlida tambin en el caso de una figura inicial anistropa. Ejemplo: en la figura adjunta, se estima el rea mineralizada por 10 veces el rectngulo de malla a1 a2: La figura tiene un hoyo (una laguna). Al contar N1 y N2 deben figurar tambin los elementos exteriores y los elementos interiores.

Se lee en la figura: 2D1 = 12 a1 2D2 = 8 a2 Por consiguiente:


2 S

es decir es decir

N1 = 6 N2 = 4

1 4 36 1.21 + 0.061 = 100 6 4 100

Es decir una desviacin estndar relativa S/S = 11/100, y un error relativo (con 95% de confianza) de 22%. No se debe olvidar que este clculo fluctuante o Zitterbewegung, del cual magnitud enorme. hace abstraccin del trmino sabemos que puede tener una

40

Figura 1: Zitterbewegung en la estimacin de la superficie de un crculo de dimetro 1, a partir de una malla cuadrada de lado a. En abscisa, la malla a. En ordenada, la varianza de estimacin correspondiente 2(a). La curva en morado representa el valor exacto, calculado a partir de la frmula exacta (1-14), la curva en azul representa la frmula 2(a) = 0.2276 a3 + 0.0047 a5 obtenida despreciando el Zitterbewegung y reteniendo los dos primeros trminos del desarrollo limitado dado por el principio de correspondencia (Nota del T.: no corresponde a la figura original).

41

1-4-6 Paso a la versin probabilstica de la teora. En este primer captulo hemos adoptado el punto de vista espontneo y, si se puede decir, ingenuo, que consiste en tomar el fenmeno que se quiere estudiar tal como se presenta, sin hacer sobre ste ninguna hiptesis particular. Sin embargo, si los mtodos transitivos pretendan, al comienzo, construir la teora de las V.R. sin introducir interpretaciones probabilsticas, esta pretensin no ha tardado en revelarse como injustificada. En primer lugar, un fenmeno inesperado como el Zitterbewegung (prrafo 1-4-3) es muy caracterstico de una situacin pre-aleatoria la cual los fsicos conocen bien: aquella en que una ligera modificacin de las condiciones iniciales, imprevisible experimentalmente (aqu es la razn de la malla mdulo 1), provocan al cabo de un cierto tiempo, una modificacin radical del fenmeno observable. Ms profundamente an, el covariograma g(h) si lo conociramos perfectamente presentara pequeas ondulaciones, puntos singulares, toda una estructura de detalle la cual proporcionara tanta informacin, o casi, que la misma V.R. Pero esta rica estructura de detalle, nunca es accesible experimentalmente. Partiendo de puntos experimentales discontinuos, ajustamos un modelo terico de covariograma, que ser una curva regular y continua, salvo en una vecindad del origen y del alcance (observacin final del prrafo 1-4-1). Ms precisamente, somos llevados a hacer una hiptesis sobre el comportamiento analtico (en h por ejemplo) del g(h) en una vecindad del origen. En efecto, no hay nada que nos diga que el verdadero g(h) presenta un comportamiento analtico de un tipo tan simple. Desde el punto de vista matemtico, las operaciones de alisamiento o de regularizacin que implican una hiptesis de este tipo, son difciles de analizar con precisin. Pero es claro que estas hiptesis evitan necesariamente la estructura fina de g(h) y toda la riqueza de informacin potencial contenida. Si bien el carcter matemtico de estas operaciones es ms bien oscuro, su significacin epistemolgica es evidente: Constituyen un equivalente camuflado de un paso a la esperanza matemtica. As, los mtodos transitivos, que se mostraban al comienzo como puramente geomtricos, se revelan, cuando se analizan las condiciones de su puesta en prctica efectiva, como de un rico contenido probabilstico implcito. Haremos aparecer entonces, por fin, estas hiptesis probabilsticas que disimulaban los mtodos transitivos, y esto ser nuestra teora de las funciones aleatorias intrnsecas. Sin embargo los fenmenos a los cuales nos interesamos deben, en general, ser considerados como nicos, y la inferencia estadstica ser (en principio) posible mediante una hiptesis especial, del tipo estacionaria o intrnseca. Esta hiptesis aparecer a veces plausible, a veces francamente contraria a los datos experimentales, y, en todos los casos, como una hiptesis arbitraria. Por otra parte puede parecer ilusorio interpretar un fenmeno de la naturaleza como una funcin aleatoria si no estamos en condiciones de restituir, sin ambigedad, la ley de probabilidad de esta funcin aleatoria (F.A.) a partir del fenmeno real. Vemos aparecer as una nueva contradiccin. Recin, los mtodos transitivos revelaban un contenido probabilstico inconfesable: pero no implicaban ninguna hiptesis de estacionaridad (y es aqu donde reside su inters metodolgico). Ahora vamos a poner a plena luz estas hiptesis probabilsticas, anteriormente escondidas, pero nos va parecer que estas hiptesis solo tienen sentido mediante esta hiptesis de estacionaridad, la cual, justamente, no era necesaria en el caso de los mtodos transitivos.

42

La aproximacin de estos dos puntos de vista opuestos indica claramente la solucin: la interpretacin probabilstica es inevitable, pero la hiptesis estacionaria no es realmente necesaria. La V.R. deber ser considerada, en general, como una realizacin de una F.A. no estacionaria, y la herramienta de base ser una covarianza no estacionaria C(x, y) la cual depende, de manera separada de los dos puntos de apoyo x e y (y no solamente de la diferencia x-y). La inferencia estadstica permanecer imposible, en el sentido que no podemos determinar C(x, y) a partir de los datos disponibles. Pero no tenemos necesidad de conocer efectivamente esta covarianza. Para verlo bastar de transformar en trminos probabilsticos los resultados de los mtodos transitivos. Si se trata, por ejemplo, de estimar un dominio V, cuya indicatriz es k(x), los mtodos transitivos muestran que es necesario conocer la funcin:

g (h) = k ( x) f ( x)k ( x + h) f ( x + h)dx


En la versin probabilstica, el covariograma geomtrico es en s mismo una F.A. y es su esperanza E(g(h)) lo que es necesario y suficiente conocer para resolver el problema de la estimacin. Esta esperanza se deduce de la covarianza no estacionaria por la relacin: (1-29)

E ( g (h)) = k ( x)k ( x + h)C ( x, x + h)dx

Es, por otra parte, la relacin que se aplicaba implcitamente cuando se sustitua un modelo terico al verdadero g(h) desconocido. Esta esperanza, salvo un factor, no difiere de la covarianza seudoestacionaria C ( h) , valor medio de C(x, y) en el domino V a estimar, que se atribuira a la funcin aleatoria si se la considera como estacionaria (a pesar de que, quizs, no lo es). En efecto, se tiene claramente:

C ( h) =

1 E ( g (h)) k ( x)k ( x + h)C ( x, x + h)dx = K ( h) K ( h)

As, es esta esperanza E[g(h)] o esta covarianza media C (h) lo que basta conocer para resolver el problema de la estimacin. Adems, los mtodos de aproximacin que hemos desarrollado, muestran que es suficiente conocer el comportamiento en el origen de esta funcin E[g(h)] o C (h) . Mostraremos ms adelante que la inferencia estadstica a partir de una realizacin nica es posible para aquello que nos interesa (este comportamiento en una vecindad del origen) mediante solamente una hiptesis de cuasi-estacionaridad que precisaremos al hacer camino: pero esta hiptesis ser esta vez lo suficientemente dbil para ser fsicamente admisible en todos los casos que nos interesan. Dicho de otra manera, el problema de la estimacin ser posible de resolver en un marco explcitamente probabilstico y utilizando solamente los datos experimentalmente disponibles. Se comprueba aqu la importancia metodolgica de este primer captulo, el cual, a primera vista, puede parecer un poco terico: una vez probabilizados, los resultados de los mtodos transitivos, muestran que es posible evitar la famosa hiptesis de estacionaridad, y esta es la

43

razn por la cual dimos una exposicin bastante completa. Pasemos ahora a la versin probabilstica de la teora. 1-5 EJERCICIOS SOBRE LOS METODOS TRANSITIVOS. 1-5-1 Ejercicios sobre los prrafos 1-1 y 1-2. Ejercicio 1 (Funcin triangular) En el espacio de una dimensin, encontrar el covariograma geomtrico K(h) asociado a un segmento de largo b. (Solucin: K(h)=b-|h| para |h|b, y 0 en otro caso. Observar el comportamiento lineal en una vecindad de h=0 y el empalme brutal en h=b). La misma pregunta en R2 para el rectngulo axb (Solucin: K(h1, h2)=(a|h1|)(b-|h2|) para |h1|a y |h2|b) y en R3 para el paraleleppedo axbxc. Ejercicio 2 (Algoritmo de Cauchy) Sea V un conjunto en Rn, K(h) su covariograma geomtrico, y g(h) una funcin cualquiera de un argumento vectorial h. Probar que el valor medio de g(x-y) cuando las dos extremidades x e y del argumento de g describen separadamente V, se deduce de K(h) por la frmula:

1 1 dx g ( x y )dy = 2 g (h) K (h)dh 2 V V V V


(Solucin: explicitar la integral doble con la ayuda de la indicatriz de V, hacer un cambio de variable e invertir el orden de integracin. Este algoritmo es de empleo constante en la teora de las V.R.) Aplicacin (ver ejercicio 1) si g=g(r) solo depende del mdulo r=|h|, el valor medio de g en el rectngulo axb es:

4 dx (a x)(b y ) g ( x 2 + y 2 )dy 2 2 ab 0 0
Ejercicio 3 Sea en R1 la funcin f(x)=e-ax para x0 y f(x)=0 para x<0. Probar que el covariograma asociado es lineal en el origen).

g (h) = (1/ 2a )e a|h| (comportamiento

Ejercicio 4 Sea f(x) la funcin igual a x en el intervalo (-b,b) y 0 en otras partes. Probar que g(h)=(2/3)b3-b2|h|+(1/6)h3 (lineal en el origen. Verificar que

g (h)dh = 0

e interpretar.

Ejercicio 5 Sea en R1 la funcin:

f ( x) = b 2 x 2 para b x b, f ( x) = 0
Probar que el covariograma asociado es:

para x (b, b)

44

16 4 h 2 2 | h3 | 1 | h |5 g ( h) = b + 2 3 b3 30 b5 15 3 b
5

Observar el trmino irregular principal en |h|3: se trata de una funcin continua. Ms que hacer un clculo directo, se mostrar que si f es   derivable, su covariograma g = f * f tiene por derivada segunda g " = f ' ( f ') , y se utilizar el ejercicio 4. Luego hay que integrar dos veces, observando que g(0)=0 y calculando directamente g(0). Ejercicio 6 (frmula de Minkowski) Sea S un conjunto suficientemente regular de R2, K(h) su covariograma geomtrico y 2L su permetro. Establecer la relacin:
' 2 L = K (0)d 0

(poner K(0) en la forma de una integral curvilnea extendida al contorno de S, e integrar primero en ).

(1/ 2) | cos( ) | ds

Igualmente, si V es un conjunto de R3, K(h) su covariograma geomtrico, y S su superficie, probar que:

S =

K (0)d
'

(en que es el ngulo slido elemental en torno a la direccin , integracin sobre 4 estreoradianes). (Estas frmulas son muy tiles en morfologa matemtica: permiten reconstituir el permetro o la superficie especfica a partir de la derivada de la funcin de covarianza o del covariograma, es decir de observaciones exclusivamente lineales). Ejercicio 7 (Efecto de pepita) En R1 se divide el intervalo (0,b) en n intervalos iguales de largo l/n, y se consideran n variables aleatorias Xi las cuales admiten la misma esperanza m y la misma varianza 2. Se pone f(x) = Xi para cada (i-1)a x ia, i = 1, 2, ..., n y f(x) = 0 al exterior de (0, b). Encontrar la esperanza g(h) del covariograma de f(x). (Solucin: 2(b - n|h|) + m2(b - |h|) para h a, m2(b - |h|) para a<|h|b, 0 en otro caso. Para a pequeo o n grande, este esquema corresponde a un efecto de pepita. Ejercicio 8 (Granulometra de un grano convexo) a/ Sea S un conjunto convexo de R2, g su covariograma geomtrico, el cual se expresar mediante g(r,), r y designan las coordenadas polares. Para fijo, la derivada en r, -g(r; ) corresponde a la medida de la interseccin SSh sobre una perpendicular a la direccin . Deducir que la granulometra de las transversales de S en la direccin admiten la funcin de distribucin de probabilidades F(r) definida por:

1 F (r ) =

g ' (r ; ) g ' (0; )

45

Deducir que para fijo y r0, g(r; ) es una funcin convexa de r. b/ Ahora se sortea al azar la direccin segn la ley de densidad:

D g ' (0; ) d = 2L 2L

(ver ejercicio 6 para verificar que se trata bien de una ley de probabilidad). Esta ley atribuye a cada direccin una probabilidad proporcional al contorno aparente de S en esa direccin, correspondiendo exactamente a la ley (condicional) de las intersecciones de S con una red previa de rectas aleatorias en las cuales las direcciones estn distribuidas uniformemente en (0, ) . Mostrar que la granulometra de la transversal correspondiente es:

1 1 F ( h) = g ' (h; )d 2L 0
con el valor medio:

E ( h) =

S 2L
Encontrar el

Ejercicio 9 (covariograma geomtrico de la esfera). covariograma K(h) de una esfera de dimetro D en R3. (Solucin:

3 | h | 1 | h |3 + K ( h) = 1 6 2 D 2 D3

D3

para h D.

Partir de la relacin:

K ' ( h) =
e integrar, observando que g (0) =

(D

h2 )

D 3 ).

Ejercicio 10 (subida de orden 2) Efectuar directamente la subida istropa de orden 2 sobre la funcin gn(r)=r (0r1), gn(r)=0 (r>1). Deducir que los coeficientes A de la relacin (1-10) verifican: 2 A A +1 = +2 (Solucin: g n 2 (r ) =

2 (1 r + 2 ) para r1, y 0 para r>1. La subida de orden 2 +2

verifica la regla r A A +1r + 2 , respecto de la parte irregular; esta regla proporciona el resultado salvo una serie par, en este caso reducida a una constante)

46

Ejercicio 11 Covariograma de la funcin f ( x) = ( / 4)( D 2 x 2 ) para -DxD, 0 en otro caso (f(x) es la seccin de una esfera de dimetro D por un plano de cota x) (Solucin:
1 h 2 | h |3 1 | h |5 5 g (h) = ( 2 / 6) 2 + 3 D 5 D5 D 5 D Hacer directamente la subida de orden 2 sobre el covariograma geomtrico del ejemplo 9. Comparar con el ejemplo 5).

Ejercicio 11 bis (Reconstitucin de la granulometra de esferas) - Se tiene, en R3 una poblacin de esferas. Sea 3 el nmero de esferas por unidad de volumen, y sea F3(D) la granulometra de estas esferas. Dicho de otra manera, 3[1-F3(D)] es el nmero de esferas de dimetro D presentes por unidad de volumen. Estas esferas inducen crculos y transversales (cuerdas) sobre planos y rectas respectivamente. Sea 2 el nmero de crculos por unidad de longitud y sea 1-F2(D) su granulometra (que es la granulometra inducida por F3 en los planos); sea 1 el nmero de transversales por unidad de longitud y sea 1- F1(D) la granulometra (inducida sobre las rectas por F3 y tambin por F2). a/ Establecer las relaciones:

1[1 F1 (h)] = 2
h

D D 2 h2 D D 2 h2

[1 F2 ( D)]dD = [1 F3 ( D)]dD

3 [1 F3 ( D)]2 DdD
h

2 [1 F2 (h)] = 3
h

(primero establecer que, por ejemplo, 1[1 F1 (h)] = 2 D 2 h 2 F2 ( D)dD , y hacer


h

una integracin por partes. b/ Invertir las relaciones: al utilizar (1-8), probar que se tiene, por ejemplo:

1 F1' (h) =

3h[1 F3 (h)]
2

2 [1 F2 (h)] =
Deducir que 3 =

1 F1' (u )
h

du u 2 h2

1 hu de los crculos y de las esferas a partir de la granulometra de las transversales. F "(0)1 , 2 =

1 F1 (du ) , y reconstituir las granulometras

Ejercicio 12 (Subida sobre la exponencial de Gauss) La subida de orden 1 transforma exp(-ar2) en:

47

e ar

Ejercicio 13 (Covariograma exponencial) Sea, en el espacio de una dimensin, una V.R. con covariograma transitivo g (h) = e |h| . Determinar la expresin exacta de la varianza de estimacin 2(a), encontrar su parte principal, y concluir en ausencia de Zitterbewegung. Solucin:

2 (a) = a

2 1 2 2 1 a a a 1 e 6

(llevando el desarrollo ms lejos, se identificarn tambin los trminos T1, T3, T5, ... de las relaciones (1-18). En particular T1=-1/6). Ejercicio 14 (Covariograma triangular) Sea en el espacio de una dimensin la V.R. igual a 1 en el intervalo (0,b). a/ Encontrar el covariograma de f(x) (Solucin: g(h)=b-|h| para |h|b y 0 para resultado por un razonamiento geomtrico). |h|>b; establecer este

b/ Calcular la varianza de estimacin para una malla a pequea, por medio de la frmula de aproximacin. (Solucin: (1/6)a2). c/ Se dispone de n+2 sondajes S0, S1, ..., Sn, Sn+1 en una malla regular en la cual el primero y el ltimo de los sondajes son negativos y el resto todos positivos. Se admite que cada una de las dos extremidades del intervalo del cual se quiere estimar la longitud b puede caer en cualquier parte del segmento (S0, S1) y (Sn, Sn+1) respectivamente, de manera independiente una de la otra, con una densidad uniforme. La longitud b es entonces una variable aleatoria. Probar que E(b)=na; D2(b)=a2/6: se encuentra bien la varianza de estimacin tal como la proporciona la frmula de aproximacin, pero no se obtiene el trmino fluctuante. d/ Calcular el valor exacto de la varianza de estimacin de b/ (Solucin: poner b=na+a con 0<1. Si la primera muestra positiva es en x (0x<a), se tiene la estimacin (n+1)a para xa, y na para a<x<a. El punto x est implantado al azar en el segmento (0,a) con una densidad uniforme de probabilidad. Esta estimacin es una variable aleatoria de esperanza b y de varianza (-2)a. Esta expresin considera el Zitterbewegung. Cuando (el cual, en la prctica, es siempre desconocido) es asimilado a una variable aleatoria, con distribucin uniforme en (0,1), el valor medio de esta expresin coincide con la expresin aproximada de b/ (en la cual se excluye en Zitterbewegung). Ejercicio 15 (Varianza de estimacin en el caso aleatorio) Sea, en el espacio de dos dimensiones una V.R. f(x) de covariograma g(h) y de soporte S. Si el rectngulo de malla (a1, a2) es grande respecto de S, a lo ms, un solo sondaje es positivo, y todo sucede como si esta muestra nica fuera sorteada al azar dentro de un rectngulo de lados a1, a2

48

conteniendo S. Si la muestra cae en un punto x S , se toma el estimador Q*(x)=a1a2f(x), y 0 si x S . Q*(x) es as una variable aleatoria. Probar directamente que:

E (Q* ) = f ( x)dx E ((Q* ) 2 ) = a1a2 ( f ( x) ) dx


2

D 2 (Q* ) = a1a2 g (0) g (h)dh

49

CAPITULO 2 LAS FUNCIONES ALEATORIAS INTRINSECAS 2-1 DEFINICIONES GENERALES. Nocin de Funcin Aleatoria. En teora de probabilidades se define la nocin de variable aleatoria (V.A.) vectorial (Y1, Y2, ..., Yk) de k componentes: es una familia de k V.A. ordinarias Y1, Y2, ..., Yk (en general no independientes). Cuando el nmero k de estas componentes se hace infinito, se obtiene una familia infinita de variables aleatorias: esto es una funcin aleatoria. En particular, si x es un punto del espacio de n dimensiones Rn, se puede definir una familia infinita (Y(x)), xRn. A todo punto x0 del espacio corresponde as una V.A. ordinaria Y(x0). Y(x) es entonces una funcin del punto x, cuyo valor en x0 no es un nmero, sino una V.A (a saber Y(x0)). Se dice que Y(x) es una funcin aleatoria (abreviado F.A.). Se observar que, en general las V.A. correspondientes a dos puntos de apoyo x1 y x2 no son independientes. Si Y es una V.A. ordinaria, el resultado particular de un experimento al azar segn la ley de probabilidad de Y es un valor numrico particular y. Anlogamente, si Y es una V.A. vectorial (Y1, Y2, ..., Yk), un sorteo al azar segn la ley (de k variables) de Y proporciona un vector y=(y1, y2, ..., yk), es decir k valores numricos particulares. Finalmente, si Y(x) es una F.A. es decir una V.A. vectorial con una infinidad de componentes un sorteo al azar, efectuado segn la ley (de una infinidad de variables) de Y(x) proporciona una funcin numrica particular y(x), en general, extraordinariamente irregular. Se dice que y(x) es una realizacin de la F.A. Y(x). Siempre se puede considerar una realizacin de una y(x) de una F.A. Y(x) como una variable regionalizada. Inversamente, se puede interpretar una V.R. como una realizacin de una cierta F.A. Y(x): esta interpretacin permite aplicar a las V.R. los resultados de la teora probabilstica de las F.A. Observaciones 1/ No se puede afirmar que una V.R. y(x) es una F.A. Esto tendra el mismo sentido que decir: el nmero 98 es una V.A. El enunciado correcto de la hiptesis probabilstica de base que deseamos introducir es: y(x) es una realizacin de una F.A. Y(x). 2/ Para que esta hiptesis probabilstica tenga un sentido real, es necesario poder reconstituir, al menos en parte, la ley de la F.A. de la cual suponemos que la V.R. y(x) es una realizacin, lo cual supone que la inferencia estadstica es posible. Por otra parte, la inferencia estadstica no es, en general, posible si se dispone de una sola realizacin y(x) de Y(x) (de la misma manera, no se puede reconstituir la ley de una V.A. Y a partir de un resultado numrico y=98 de un nico experimento.). Para que la inferencia estadstica sea posible, es necesario introducir hiptesis suplementarias acerca de la F.A. Y(x), de manera de reducir en nmero de parmetros de los cuales depende la ley de Y(x). Este es el objetivo de la hiptesis estacionaria que vamos a definir: una F.A. estacionaria se repite, de una cierta manera, en el

50

espacio, y, esta repeticin hace posible la inferencia estadstica a partir de una realizacin nica. Precisemos ahora esta hiptesis: F.A. estacionaria. Se dice que una F.A. Y(x) es estacionaria si su ley es invariante por translacin. Dicho de otra manera, si x1, x2, ..., xk son k puntos de apoyo arbitrarios (k entero cualquiera), las k variables aleatorias Y(x1), Y(x2), ..., Y(xk) tienen la misma ley de probabilidad (de k variables) que las k V.A. Y(x1+h), Y(x2+h), ..., Y(xk+h). En adelante, Y(x) designar una F.A. estacionaria. Esperanza matemtica. Consideremos un punto de apoyo x0. Si la V.A. ordinaria Y(x0) admite una esperanza matemtica, sta es una funcin m(x0)=E[Y(x0)] del punto de apoyo x0. Pero Y(x) es estacionaria, por consiguiente, se tiene: m(x0+h)=m(x0), para todo vector h, luego m(x0) es una constante m, independiente de x0:

m = E[Y ( x)]
Se puede suponer a menudo que m=0, al reemplazar (suponiendo siempre que esta esperanza existe). Y(x) por Y(x)-m

La covarianza K(h). Consideremos ahora dos puntos de apoyo x0 y x0+h. Si las dos V.A. Y(x0) e Y(x0+h) admiten varianzas finitas (luego tambin una esperanza m que supondremos nula), Y(x0) e Y(x0+h) admiten tambin una covarianza K(x0;h), que depende, en principio, del punto de apoyo x0 y del vector h. Pero como Y(x) es estacionaria, se tiene: K(x0+a;h)=K(x0;h) para todo vector a, luego K(x0;a) no depende de x0, y nosotros escribiremos simplemente K(h): (2-1)

K (h) = E[Y ( x)Y ( x + h)]


la del covariograma transitivo: K(h) es la g(h). Para h=0 se tiene K(0)=E([Y(x)]2): Y(x0). Para que una F.A. Y(x) admita una necesario y suficiente que Y(x) admita una

Se comparar esta definicin a transpuesta probabilstica de que es la varianza de la V.A. funcin de covarianza K(h), es varianza finita K(0).

Hiptesis estacionaria de orden 2. Diremos que una F.A. Y(x) es estacionaria de orden 2 si la V.A. Y(x0) admite una esperanza m independiente del punto de apoyo x0, y, si para todo vector h la covarianza:
2 K (h) = E[Y ( x)Y ( x + h)] m0

existe y no depende de x0. Esta hiptesis (la cual no implica la estacionaridad en sentido estricto, tal como la definimos antes) es suficiente para la teora de las V.R. Sin embargo esta hiptesis supone la existencia de una varianza a priori finita K(0). Varianza a priori infinita. Por otra parte, existen numerosos fenmenos que presentan una capacidad de dispersin ilimitada y no pueden ser descritos correctamente si se les atribuye una varianza a priori finita: esta afirmacin puede sorprender, sin embargo hay que ver que la naturaleza nos tiende aqu una suerte de trampa. Cuando se toman muestras v en un campo V, se obtiene un histograma a partir del cual se puede calcular numricamente una varianza, la cual toma un valor perfectamente

51

definido. Pero esta varianza es, en realidad, una funcin 2(v|V) del soporte v y del campo V. Esta varianza aumente, en particular, cuando el campo V aumenta. Si las muestras de tamao v poseen una varianza a priori finita, sta debe ser igual al lmite cuando V tiende a infinito, de la varianza experimental 2(v|V). Es as como los autores de Africa del Sur (D. G. Krige, etc., ...), a partir de cientos de miles de muestras tomadas en el gran yacimiento de oro de Rand, calcularon la varianza de las muestras en paneles cada vez ms grandes, luego en toda una concesin, luego en el yacimiento de Rand en su conjunto: obtuvieron una relacin experimental de la forma:

2 (v | V ) = log

V v

El crecimiento de la varianza se produce siempre segn esta ley logartmica (frmula de De Wijs) hasta el ltimo punto experimental, en el cual V/v es del orden de la decena de billones: Se puede concluir, con plena seguridad, que, en este caso, no existe una varianza a priori finita. Entonces estamos conducidos a reemplazar la hiptesis estacionaria de orden 2 por una hiptesis ms dbil pero de significacin anloga: Hiptesis intrnseca. En el caso en que la varianza a priori K(0) no existe (es infinita), puede ocurrir que los incrementos Y(x0+h)-Y(x0) tengan una varianza finita. Diremos entonces que la F.A. Y(x) verifica la hiptesis intrnseca si, para todo vector h, el incremento Y(x0+h)-Y(x0) admite una esperanza y una varianza independientes del punto de apoyo x0 (pero dependiendo de h), es decir:

E[Y ( x + h) Y ( x)] = m(h) D 2 [Y ( x + h) Y ( x)] = 2 (h)


La funcin m(h) es la deriva lineal. Para demostrar que es lineal en h, se parte de la relacin evidente:

Y ( x + h "+ h ') Y ( x) = [Y ( x + h "+ h ') Y ( x + h ')] + [Y ( x + h ') Y ( x)]


y se pasa a las esperanzas, de donde: m(h+h)=m(h)+m(h). Se puede suponer siempre que esta deriva lineal m(h) es nula, al reemplazar Y(x) por Y(x)-m(x) La funcin (h): (2-2)

(h) = D 2 (Y ( x + h) Y ( x ) )

1 2

se llama variograma o funcin intrnseca. Una F.A. que verifica la hiptesis intrnseca constituye lo que se llama un esquema intrnseco, caracterizado por su variograma. Observacin. Si Y(x) verifica la hiptesis estacionaria de orden verifica tambin la hiptesis intrnseca y se tiene, en este caso: 2,

52

(2-3)

(h) = K (0) K (h)

Como |K(h|K(0), se tiene (h)2K(0), de manera que el variograma de una F.A. estacionaria de orden 2 est necesariamente acotado. Existen esquemas intrnsecos de uso muy corriente cuyo variograma (h) no est acotado, y que no pueden, por consiguiente, verificar la hiptesis estacionaria de orden 2 (tienen una varianza a priori infinita). Ejemplo, esquema de De Wijs ((h)=3log|h|), esquema lineal ((h)=A|h|). 2-2 PROPIEDADES DE LA COVARIANZA Y DEL VARIOGRAMA La covarianza o el variograma son funciones simtricas:

K ( h ) = K ( h)

, ( h) = ( h)

La covarianza verifica adems la desigualdad de Schwarz:

K (h) K (0)
Para el variograma, se encuentran solamente las relaciones: (h)0 y (0)=0. Sin embargo, es posible demostrar que el crecimiento en el infinito de un variograma es necesariamente menos rpido que el crecimiento de |h|2; es decir:

lim

( h)
| h |2

=0

Estas condiciones son necesarias pero no son suficientes. Sea K o una covarianza o un variograma que verifican estas relaciones, entonces no necesariamente existe una F.A. estacionaria o intrnseca admitiendo la covarianza K o el variograma . En efecto, la condicin necesaria y suficiente es que K pertenezca a la clase de funciones de tipo positivo y a la clase de funciones de tipo positivo condicional. Por ejemplo, las funciones log(r) y r con <2 pueden servir como variogramas, pero no la funcin r para 2. Estas condiciones expresan, entre otras, que las frmulas que estableceremos ms adelante para las varianzas de extensin o de estimacin, conducen, necesariamente a valores positivos (lo que no sera el caso si se toma una funcin cualquiera como variograma). Estas condiciones merecen ser examinadas de manera ms cercana, para precisar la clase de combinaciones lineales que se pueden utilizar cuando no existe una varianza a priori finita. 2-2-1 Las combinaciones lineales autorizadas. Primero veamos el caso estacionario de orden 2, sea m=0 y tomemos N puntos x1, x2, ..., xN de Rn y N coeficientes arbitrarios 1, 2, ..., N. La expresin: (2-4)

Y = iY ( xi )
i

53

es una V.A. (una combinacin lineal finita de V.A.). Como por hiptesis existe una funcin de covarianza K(h), la variable aleatoria Y admite una varianza finita, y un clculo elemental proporciona: (2-5)

D 2 (Y ) = i j K ( xi x j ) 0
i, j

La condicin evidente D2(Y)0 expresa (prrafo 1-3) que las funciones de covarianza son de tipo positivo. A la inversa, si K(h) es una funcin de tipo positivo, se muestra que es posible construir una F.A. cuya covarianza es precisamente K(h). Esta frmula (2-5) aparecer de nuevo, en formas ligeramente diferentes, en todas las etapas de la teora. Observamos, por el momento, que, en el caso estacionario de orden 2, todas las combinaciones lineales finitas tienen una varianza finita, y que su utilizacin es siempre legtima. No ocurre lo mismo cuando existe solamente el variograma, y no hay covarianza. En efecto, en este caso, solamente las combinaciones lineales que verifican la condicin: (2-6)

=0

tienen una varianza finita. Luego, en el caso de una F.A.I. sin covarianza, solo se autoriza el uso de combinaciones lineales en las cuales la suma de los coeficientes es igual a 0. Esta observacin juega un papel fundamental en toda la teora intrnseca. Probemos que la relacin (2-6) es suficiente. Si esta relacin es vlida, se puede escribir:

Y ( x ) = [Y ( x ) Y (0)]
i i i i i i

Por otra parte la F.A. (no estacionaria) definida por:

Z ( x) = Y ( x) Y (0)
admite una funcin de covarianza C(x,y)=E(Z(x)Z(y)), porque Z(x), incremento de la F.A.I. Y(x) admite una varianza finita. Calculemos esta funcin de covarianza (no estacionaria) C(x,y) cuya expresin nos ser de utilidad ms tarde. Lo ms simple para esto, es partir de la definicin del variograma: (2-7) de donde:

2 ( x y ) = E [Yx Y0 Yx + Y0 ] = 2 ( x) + 2 ( y ) 2C ( x, y )
2

C ( x, y ) = ( x ) + ( y ) ( x y )
Cuando (2-6) se verifica, la combinacin lineal la varianza finita:

Y
i

i xi

= i (Yxi Y0 ) admite
i

54

D 2 (Y ) = i j C ( xi , x j )
i, j

Es decir, segn (2-7):

D 2 (Y ) = i j ( x j ) + j i ( xi ) i j ( xi x j )
i j j i i, j

Al considerar (2-6): (2-8)

D 2 (Y ) = i j ( xi x j )
i, j

Se obtiene un resultado que ser muy til en lo que sigue: cuando la suma de los coeficientes de una combinacin lineal es 0, se puede calcular su varianza segn la frmula (2-5) como si existiera una covarianza K(h), con la condicin de reemplazar esta covarianza por . Se trata de un mecanismo de clculo muy general, que aporta, a menudo, grandes simplificaciones. Inversamente, si no hay varianza a priori finita, una combinacin lineal de varianza finita es necesariamente una combinacin lineal de incrementos de la F.A. Y(x), debido a que, por hiptesis, estos incrementos tienen varianza finita. Por consiguiente esta combinacin lineal verifica la condicin (2-6) la cual es bien necesaria y suficiente, como lo habamos anunciado. Ahora podemos introducir, de manera natural, la condicin siguiente segn la cual debe ser de tipo positivo condicional. Diremos que una funcin g(h) es de tipo positivo condicional si para todo entero N, todo sistema de puntos x1, x2, ..., xN del espacio Rn y todo sistema 1, 2, ...,N que verifican la condicin i=0, se tiene:

g(x x ) 0
i j i j i, j

Como las combinaciones lineales autorizadas tienen una varianza positiva o nula, la relacin (2-8) significa bien que es de tipo positivo condicional. Inversamente, si es de tipo positivo condicional, se puede mostrar que es efectivamente posible construir una F.A.I. la cual admite como variograma. Se trata entonces de una condicin necesaria y suficiente. 2-2-2 Continuidad en media cuadrtica y otras propiedades. Daremos algunas indicaciones complementarias acerca de las propiedades de una covarianza o de un variograma. Anlogamente a los mtodos transitivos, el inters se va a concentrar en el comportamiento en una vecindad del origen. a/ Se puede observar que el variograma proporciona un contenido preciso a la nocin tradicional de zona de influencia de una muestra: su crecimiento ms o menos rpido refleja, en efecto, la manera ms o menos

55

rpida de cmo se deteriora la influencia de una muestra sobre zonas ms y ms lejanas del yacimiento. b/ Las anisotropas se manifiestan por un comportamiento diferente del variograma en las diferentes direcciones del espacio. En ausencia de anisotropa, (h)=(r) solo depende del mdulo r del vector h, y no de la direccin de este vector. Se dice que existe anisotropa geomtrica cuando una transformacin lineal simple de las coordenadas restablece la isotropa. Existen tipos ms complejos de anisotropas. Por ejemplo en el espacio de tres dimensiones puede suceder que Y(x) solo dependa de la tercera coordenada y permanezca constante en los planos paralelos a los dos primeros ejes de coordenadas. El variograma (h)=(h3) depende solamente d la tercera componente de h. El caso ms corriente ser aqul en que Y(x) no ser realmente constante en los planos horizontales, pero en ellos variar menos rpido o ms regularmente que en la direccin vertical. Se tomar entonces un variograma de la forma siguiente (anisotropa zonal):

(h) = 0 (h1 , h1 , h3 ) + 1 (h3 )


c/ Alcance. En el caso estacionario de orden 2, el alcance a() en una direccin es el valor de la distancia a partir de la cual, en esta direccin, Y(x) e Y(x+h) no tienen correlacin (o su correlacin es despreciable): K(h)=0 (o 0) para |h| a().

Segn c/, K(h)=0 equivale a (h)=K(0)=(): el alcance es tambin la distancia a partir de la cual el variograma llega a su valor lmite () o meseta. As, una F.A: intrnseca cuyo variograma no est acotado, no puede tener un alcance finito. d/ Comportamiento en una vecindad del origen. La continuidad y regularidad en el espacio de la F.A. Y(x) se manifiestan en comportamiento de (h) en una vecindad del origen. Por orden regularidad decreciente, se pueden distinguir cuatro tipos: la el de

56

Comportamiento parablico: (h) es dos veces derivable en h=0. Y(x) es entonces derivable (en media cuadrtica), luego presenta un alto grado de regularidad en el espacio.

Comportamiento lineal (tangente oblicua en el origen): (h) es continuo en h=0, pero no es derivable en este punto, Y(x) es continua en media cuadrtica, pero no es derivable, luego es menos regular.

Efecto de pepita: (h) no tiende a 0 cuando h tiende a 0 (discontinuidad en el origen). Y(x) no es continua en media cuadrtica, luego es extraordinariamente irregular.

57

Caso lmite completamente aleatorio: Y(x) e Y(x) son independientes para dos puntos cualesquiera distintos, por cercanos que sean (ruido blanco de los fsicos o efecto de pepita al estado puro) Parte irregular. En el caso istropo ((h)=(r)) y en ausencia de efecto de pepita, se caracteriza el comportamiento de (h) por un desarrollo limitado de la forma:

(r ) = a2 n r 2 n + c r + c2 n r 2 n log(r )
Exactamente como en el caso de los covariogramas transitivos, se distinguir un parte regular (trminos de grado entero par), y una parte irregular (trminos en r, con diferente de un entero par y tambin trminos logartmicos del tipo r2nlog(r)). Si no hay parte irregular, la F.A. sera indefinidamente derivable, luego perfectamente regular. Por consiguiente solamente la parte irregular representa el grado de irregularidad de la F.A., y, en esta parte irregular, el trmino de ms bajo grado es el que juega el papel principal: se puede definir el grado de regularidad de la F.A. como el grado del trmino irregular principal. Daremos a continuacin algunas indicaciones matemticas complementarias (sin entrar en detalles, porque se trata de resultados clsicos). e/ Continuidad y derivacin en media cuadrtica. Se dice que la F.A. Y(x) es continua en media cuadrtica (continua m.c.) si se tiene:

E ([Y ( x + h) Y ( x)]2 ) 0

para

| h | 0

Esto ocurre (por definicin) si y solo si (h) es continuo en h=0, es decir en ausencia de efecto de pepita. En el espacio de una dimensin, se dice que la F.A. Y(x) es la derivada en media cuadrtica de Y(x) (derivada m.c.) de la F.A. Y(x) si:
2 Y ( x + h) Y ( x ) Y '( x) 0 E h

para

| h | 0

Se tienen definiciones anlogas para el espacio de n1 dimensiones. Se demuestra que una F.A. intrnseca Y(x) admite una derivada m.c. Y(x) si y solo si (h) es derivable dos veces en h=0. La derivada segunda (h) existe entonces para todo h, Y(x) es estacionaria de orden 2 (an

58

en el caso en que Y(x) es solamente intrnseca) y admite como covarianza la funcin (h). Anlogamente, Y(x) es derivable m.c. n veces si y solo si la derivada (2n)(h) existe en h=0 (existe entonces para todo h). Si es el grado del trmino irregular principal de (h), Y(x) admite entonces una derivada m.c. de orden n si y solo si >2n (si el trmino principal es r2nlog(r), Y(x) es n-1 veces derivable m.c., pero no es derivable n veces). 2-3 REGULARIZACION DE UNA F.A. INTRINSECA. Para simplificar la exposicin, haremos los razonamientos en el caso de una F.A. estacionaria de orden 2 con covarianza K(h), sin embargo todos los resultados que expresaremos con la ayuda de la funcin intrnseca (h)=K(0)-K(h) seguirn siendo vlidos para el caso de una F.A. intrnseca (luego, sern vlidos an en el caso en que (h) no est acotado, y si, por consiguiente, la covarianza K(h) no existe): esto resultar de manera muy simple al aplicar el mecanismo de clculo que vimos en el prrafo 2-2-1. Aqu tambin, no entraremos en detalles, porque se trata de un recordatorio simple de resultados clsicos. 2-3-1 Integral estocstica

I = Y ( x) p ( x)dx
v

Se define la integral I como el lmite en media cuadrtica (si existe) de las sumas discretas:

I n = Y ( xi ) p ( xi )xi
i =1

(los xi son pequeos elementos de volumen disjuntos cuya unin es el conjunto v, y xi es un punto de xi). La integral estocstica I es entonces una V.A., como las In. Se demuestra que esta V.A. existe si y solamente si la integral (2-9)

D 2 ( I ) = p ( x)dx K ( x y ) p ( y )dy
v v

es finita, y D2(I) es entonces la varianza (finita) de esta V.A. Se encuentra fcilmente este resultado (2-9) mediante el clculo (no riguroso) siguiente:

I 2 = Y ( x) p ( x)dx Y ( y ) p ( y )dy
v v

59

E ( I 2 ) = p ( x)dx E[Y ( x)Y ( y )] p ( y )dy =


v v

= p ( x)dx K ( x y ) p ( y )dy
v v

(el clculo no es riguroso porque, al comienzo, no es evidente que se pueden invertir los smbolos E y : en efecto, se demuestra que esta inversin es legtima). 2-3-2 Convolucin estocstica. El producto de convolucin Y*f de la F.A. Y(x) por una funcin ordinaria f(x) es la integral estocstica (si existe):

Y ( x x ') f ( x)dx '


 Se puede definir as la regularizada Yp = Y p de la F.A. Y(x) por una funcin de ponderacin p(x). Es la media mvil ponderada:

Yp ( x) = Y ( x + x ') p( x)dx
Cuidado: la regularizada de Y(x) regular que Y(x) pero siempre regularizar, por un procedimiento desaparecer como por arte de magia es tambin una funcin aleatoria (ms aleatoria): no basta con alisar o de medias mviles, una F.A. para hacer el carcter aleatorio de esta funcin.

La varianza de la regularizada Yp est dada por la frmula (2-9) anterior, e Yp(x) existe en el sentido de la integracin m.c. si y solo si D2(Yp)<. Calculemos la covarianza

Yp ( x0 )Yp ( x0 + h) E
Se tiene:

de

Yp ( x0 ) e Yp ( x0 + h)

Yp ( x0 )Yp ( x0 + h) = p ( x ') p ( x ")Y ( x0 + x ')Y ( x0 + h + x ")dx ' dx "


Pasemos a las esperanzas intercambiando E y . Queda:

E[Yp ( x0 )Yp ( x0 + h)] = p( x ') p( x ") K (h + x " x ')dx ' dx "


Esta covarianza no depende de x0 sino solamente de h. Luego, regularizada Yp es estacionaria de orden 2, y admite la covarianza: (2-10) la

K p (h) = p ( x)dx K (h + x y )dy


una forma ms

Esta frmula generaliza (2-9). Para presentarla en sinttica, hagamos el cambio de variables x=y+z. Queda:

60

K p (h) = K ( x + z )dx p( y + z )dy


 Sea P el covariograma transitivo ( P = p p ) de la funcin de ponderacin p. Se tiene, por definicin:

P ( z ) = p ( y + z ) p( y )dy
y, por consiguiente:

K p (h) = K (h + z ) P ( z )dz
 es decir, utilizando productos de convolucin (porque P = P ):

(2-11)

Kp = K P

Se obtiene la covarianza Kp de la regularizada Yp al regularizar la covarianza K(h) de Y con el covariograma transitivo de la funcin de ponderacin. Se comparar este resultado con el obtenido en el caso de los mtodos transitivos. El variograma p de la regularizada Yp es Kp(0)-Kp(h). Al reemplazar K(h) por K(0)-(h) en (2-9) y (2-10), observamos que K(0) se elimina, y queda: (2-12)

p (h) = (h + z ) P( z )dz ( z ) P( z )dz p = P A

Se puede tambin escribir:

La constante A se determina con la condicin p(0)=0. Estas relaciones siguen siendo vlidas para cualquier F.A. intrnseca (an en el caso en que la covarianza no existe) (ver observacin anterior). 2-3-3 La subida recta a potencia constante. La subida constituye un caso particular de la regularizacin. En los mtodos transitivos podamos integrar la V.R. de - a + con respecto a una de las coordenadas, por ejemplo x3, debido a que esta V.R. era nula al exterior de un campo acotado. Ahora, solo podemos integrar en un largo finito A . Llamaremos entonces subida bajo potencia constante A a la operacin que nos hace pasar de la F.A. Y3(x1,x2,x3) definida en el espacio de tres dimensiones a la F.A. Y2(x1,x2) definida en el espacio de dos dimensiones por:

Y2 ( x1 , x2 ) =

1 Y ( x1 , x2 , x3 )dx1dx2 dx3 A 0

Si Y3(x) es la ley puntual en una formacin estratiforme de potencia A , Y2(x1,x2) es la ley media del sondaje implantado en el punto (x1,x2) de la superficie topogrfica.

61

No es difcil establecer la formula para el variograma 2(h1,h2) de F.A. Y2(x1,x2) que es intrnseca como Y3 en funcin del variograma 3 Y3 (el lector lo podr hacer como ejercicio). En el caso particular que 3 = 3(r) es istropo, se obtiene el algoritmo siguiente (de subida recta bajo potencia constante en el caso istropo):

la de en la

n 1 (r ) =

2 2 (A x) n ( r 2 + x 2 )dx 2 (A x) n ( x)dx 2 A 0 A 0

Como en el caso de los mtodos transitivos, existe tambin una regla de correspondencia trmino a trmino entre las partes irregulares de n(r) y n-1(r). Estas reglas, un poco menos simples que en el caso transitivo, se escriben:
2+ r1+ ' r + A 2 r A A A 2 n +1 2n+2 r 2n ' r r r A A log( ) log(r ) + 2n 2n A A2 2 n +1 r 2n+2 r n +3 ' r A r A log( ) + 2 n +1 2n+2 A A2

(2-13)

En que los coeficientes A, A2n, A2n+1 son los mismos que los que aparecen en los mtodos transitivos (frmulas (1-10) a (1-13)), tenemos aqu una primera manifestacin de la similitud profunda de los dos aspectos (transitivos y probabilsticos) de la teora de las V.R. Observamos, adems que las reglas (2-13) son menos simples que las reglas (1-10). En lugar de r1+, encontramos r1+ / A , el coeficiente 1/ A se introduce por razones dimensionales evidentes (en teora intrnseca, se razona sobre las leyes medias y no sobre las acumulaciones como en la teora transitiva). Pero al lado del trmino principal A r1+ / A - que es el equivalente exacto del trmino transitivo vemos aparecer un trmino complementario A ' r 2 + / A 2 , con un coeficiente A cuya expresin explcita no es til darla aqu (ver [4]). Este trmino suplementario proviene del carcter finito (subida bajo potencia finita A ) del campo de integracin, o, si se prefiere, de la presencia del trmino en x ( r 2 + x 2 ) bajo el signo de integracin en el algoritmo de la subida recta. De todas maneras, este trmino suplementario es en r2+, luego de orden ms elevado que el trmino principal, y la parte principal de n-1(r) en una vecindad de r=0 es entonces idntica a la que proporciona la regla transitiva. Observamos tambin que el dominio de validez del desarrollo de n-1(r) obtenido por la regla (2-13) es necesariamente dentro de la bola de radio A . En las grandes distancias, se deduce fcilmente del algoritmo de la subida recta que:

2 n 1 (r ) n (r ) 2 (l x) n ( x)dx A 0

(r  A)

62

de manera que salvo una constante, el variograma subido es igual al variograma inicial. 2-4 VARIANZAS DE EXTENSION Y DE ESTIMACION 2-4-1 Varianza de extensin. Definamos, en primer lugar, la nocin fundamental de varianza de extensin. Sea Y(x) una F.A., la cual supondremos, por el momento, como estacionaria de orden 2, y sea K(h) su covarianza. Designemos por Z(v) y Z(v) las leyes medias de dos dominios v y v del espacio de n dimensiones, es decir las integrales estocsticas:

Z (v ) =

1 Y ( x)dx v v

Z (v ') =

1 Y ( x) dx v' v'

La frmula (2-9) muestra que, si v y v son acotadas, Z(v) y Z(v) tienen varianzas finitas. La primera, por ejemplo, tiene la expresin:

2 (v ) =

1 dx K ( x y )dy v2 v v

Calculemos tambin la covarianza (v, v) de Z(v) y Z(v). De:

Z (v) Z (v ') =

1 Y ( x) dx Y ( y )dy vv ' v v'

se deduce, al pasar a las esperanzas matemticas:

(v, v ') =

1 1 dx E[Y ( x)Y ( y )]dy = dx K ( x y )dy vv ' v v ' vv ' v v'

Llamaremos varianza de extensin de v a v (o de v a v) a la varianza del error Z(v)-Z(v) cometido al atribuir a v la ley media Z(v) de v. Esta varianza de extensin 2E es igual a:
2 E = 2 (v) + 2 (v ') 2 (v, v ')

Al considerar los valores calculados antes, se tiene entonces:


2 E =

1 1 2 dx K ( x y )dy + 2 dx K ( x y ) dy dx K ( x y )dy 2 v v v v ' v' v' vv ' v v'


K(0)

Reemplacemos K(h) por K(0)-(h): observamos que la constante desaparece de la expresin de 2E, y queda la frmula fundamental:

63

(2-14)

2 E =

2 1 1 dx ( x y )dy 2 dx ( x y )dy 2 dx ( x y )dy vv ' v v v v v v ' v' v'

Se puede demostrar que (2-14) sigue vlida para toda F.A. intrnseca, luego tambin en el caso en que K(h) no existe (esto resulta del mecanismo de clculo del prrafo 2-2-1). 2-4-2 Varianza de estimacin. Supongamos ahora que en vez de conocer la ley media Z(v) de Y(x) en un volumen v, conocemos la ley media:

Z'=

1 N

Y (x )
i =1 i

de N muestras tomadas en los puntos xi. Z es una variable aleatoria, cuyas caractersticas se deducen sin dificultad a partir de K(h) o de (h). Llamaremos varianza de estimacin 2N (de v por las N muestras tomadas en los N puntos xi) a la varianza de la diferencia Z(v)-Z(v). Para obtener la expresin de 2N, se debe, en cada una de las etapas del razonamiento que nos condujo a (2-14), reemplazar las integrales sobre el conjunto v por sumas discretas sobre los N puntos xi. Se encuentra as la segunda frmula fundamental: (2-15)
2 N =

2 1 1 ( xi x)dx 2 dx ( x y )dy 2 Nv i v v v v N

( x x )
i j i j

Esta frmula, en la cual se alternan expresiones exactas y aproximadas de las mismas integrales, presenta una estructura sobresaliente; anloga, un poco ms compleja, a la frmula (1-14) de los mtodos transitivos. En particular, se observa que la varianza de estimacin es ms dbil:

cuando la red de muestras xi es ms densa y ms representativa de la geometra del volumen v a estimar cuando la funcin (h) es ms regular, luego cuando la F.A. es ms continua en su variacin espacial.

Sin embargo, en la prctica, si N es grande, la frmula (2-15) conduce a clculos bastante largos. Ms adelante proporcionaremos frmulas de aproximacin ms simples, las cuales permitirn una comparacin metodolgica muy instructiva con las frmulas anlogas de los mtodos transitivos. Observacin: No hay ninguna diferencia conceptual entre las nociones de varianza de extensin y de estimacin: la frmula (2-15) es un caso particular de (2-14), en que v se reemplaza por la unin de los N puntos xi. La prctica ha reservado el trmino varianza de extensin a la extensin de una muestra nica en su rea de influencia, y el de varianza de estimacin a la extensin de un nmero ms grande de muestras, en el depsito entero, o en un gran panel.

64

2-4-3 Varianza de v en V. La nocin de varianza 2(v|V) de una muestra v en un dominio V parece, a primera vista, evidente desde el punto de vista experimental. Sin embargo, esta nocin, solamente tiene sentido en el caso en que V es la unin V = vi de volmenes vi disjuntos, todos iguales entre s, e iguales a un conjunto v y trasladados unos de otros. Cuando se han tomado n muestras vi en un campo V cualquiera, suponiendo que se conocen sus leyes Yi, el clculo numrico siguiente:

Y =

1 Yi n i 1 s 2 = (Yi Y ) 2 n i

constituye una estimacin de la varianza de v en V = vi (unin de n volmenes vi que constituyen las muestras reales). Este camino experimental va a inspirar las definiciones que siguen. a/ Examinemos primero el caso en que las muestras vi son puntos (en este caso la relacin V = vi se verifica evidentemente, porque V es la unin de puntos), y definamos la varianza 2(0|V) de las muestras puntuales en V. Designemos por:

Z (V ) =

1 Y ( x)dx VV

la ley media de V. Cuando se fija la realizacin Y(x), Z(V) es una integral ordinaria, y la varianza experimental de las muestras puntuales es: (2-16)

s 2 (0 | V ) =

1 2 [Y ( x) Z (V )] dx VV

Tambin se puede interpretar esta relacin (2-16) diciendo que 2(0|V) es la varianza condicional (a realizacin fija) de la V.A. Y(x) obtenida al implantar al azar, con una densidad de probabilidad uniforme, un punto x en V. Llamaremos varianza 2(v|V) de v en V a la varianza obtenida al des-condicionar la variable aleatoria Y(x) respecto de las realizaciones, es decir la varianza de la V.A. Y=Y(x), en que Y(x) es esta vez la F.A. (y no su realizacin) y x un punto aleatorio en V. Si la realizacin es fija, la esperanza condicional de Y(x) es evidentemente Z(V). Se obtiene entonces: (2-17)

2 (0 | V ) = E ( s 2 (0 | V )) =

1 2 E[Y ( x) Z (V )] dx VV

Que es el valor medio de (x-y) cuando x e y describen separadamente V.

65

b/ Cuando V es la unin de N volmenes vi disjuntos, de leyes Zi, la varianza experimental:

s 2 (v | V ) =

1 N

[Z
i =1

Z (V )]2 dx

es la varianza de la poblacin finita constituida por N leyes Zi (los Zi son nmeros, si la realizacin es fija), o, si se quiere, es la varianza de la V.A. Zi obtenida al sortear al azar uno de los ndices i. Al descondicionar con respecto a las realizaciones, se obtiene una V.A. Zi en la cual el ndice i se sortea como antes, y donde Zi es ahora una integral estocstica (y no numrica). La varianza de esta variable descondicionada es (por definicin) la varianza 2(v|V) de v en V. Se confirma, como antes, que esta varianza es igual al valor medio en i

2 (v | V ) =

1 N

E ([Z
i =1

Z (V )]2 )dx

de la varianza de extensin de vi en V. Un clculo fcil a partir de la frmula (2-14) muestra que se tiene esta vez: (2-18)

2 (v | V ) =

1 1 dx ( x y )dy 2 dx ( x y )dy 2 V V V v v v

En particular, se tiene: (2-19)

2 (v | V ) = 2 (0 | V ) 2 (0 | v)

c/ En el caso general en que v y V son volmenes cualesquiera, no necesariamente compatibles, se define la varianza por la misma frmula (2-18): esta cantidad representa solamente un artificio de clculo. En esta caso la varianza puede tomar valores negativos; en particular, se tiene siempre que: 2(v|V)=-2(V|v). d/ Relacin de aditividad. Sean v, V y V tres volmenes, tal que (por ejemplo): v V V ' . De la relacin (2-19) se deduce:

2 (v | V ) = 2 (0 | V ) 2 (0 | v) 2 (v | V ') = 2 (0 | V ') 2 (0 | v)
y por diferencia:

2 (v | V ') 2 (v | V ) = 2 (0 | V ') 2 (0 | V ') = 2 (V | V ')


es decir: (2-20)

2 (v | V ') = 2 (v | V ) + 2 (V | V ')

La varianza de la muestra v en el campo V es igual a la suma de las varianzas de v en el panel V y del panel V en el campo V. 66

e/ Covarianza de v y v en V. De manera anloga, se define la covarianza (v,v|V) de dos muestras v y v (cuya distancia y disposicin mutua es fija) en el campo V. Se encuentra:

(v , v ' | V ) =

1 1 dx ( x y )dy dx ( x y )dy 2 V V V vv ' v v'

f/ En particular, a menudo es cmodo expresar la varianza de estimacin (2-15) o la varianza de extensin (2-14) en funcin de las varianzas y covarianzas de las muestras en un campo V arbitrario. Se encuentra, por ejemplo, que:
2 E = 2 (v | V ) + 2 (v ' | V ) 2 (v, v ' | V )

como puede verse al sustituir las expresiones de estas varianzas en V: el trmino:

1 V V2 V
desaparece, y los tres trminos que quedan proporcionan el segundo miembro de (2-14). Se obtiene as una expresin, quizs ms intuitiva, de la varianza de extensin. 2-4-4 Aplicacin: mallas aleatorias y aleatoria estratificada. El caso de las mallas regulares, que es el ms difcil, lo trataremos ms adelante, examinaremos entonces los dos tipos usuales de mallas aleatorias. a/ Malla aleatoria pura. Para estimar la ley Z(V) de un volumen V, se dispone de los valores Y(xi) de la F.A. en N puntos xi implantados no importa donde en V. Admitiremos que todo ocurre como si cada xi estuviera implantado al azar en V con una densidad uniforme e independiente de las otras muestras. Se puede obtener la varianza de estimacin 2N al integrar (2-15) en V relativamente a cada uno de los xi. Este clculo es simple, pero es an ms simple observar que los errores parciales Y(xi)-Z(V) son independientes unos de otros (si la realizacin es fija) y admiten la misma varianza s2(0|V): el error resultante que es:

1 N
admite entonces la varianza:

[Y ( x ) Z (V )]
i

2 N =

1 2 s (0 | V ) N

Basta ahora con des-condicionar respecto de las realizaciones para ver que la varianza de estimacin, en el caso de una malla aleatoria pura, es igual a la varianza de una muestra en el campo V dividida por el nmero de muestras, es decir:

67

2 N =

1 2 (0 | V ) N

b/ Malla aleatoria estratificada. En este caso, el volumen V que se quiere estimar est dividido en N zonas de influencia iguales y disjuntas vi, y en cada vi se toma una muestra en un punto xi elegido al azar en la zona de influencia vi con una densidad de probabilidad uniforme, e independiente de las otras muestras. Se puede calcular 2N al integrar (215) en xi dentro de vi para cada uno de los vi, pero es ms simple observar que el error total es:

1 N

[Y ( x ) Z (v )]
i i i

y que cada uno de los errores parciales Y(xi)-Z(vi) es independiente de los otros y admite la varianza 2(0|V). Se deduce, razonando como antes, que, primero, con realizacin fija, luego des-condicionando respecto de la realizacin:
2 N =

1 2 (0 | v) N

En el caso de la malla aleatoria estratificada, la varianza de estimacin es entonces igual a la varianza de una muestra en su zona de influencia dividida por el nmero N de muestras. Observacin Es claro que la malla aleatoria estratificada proporciona siempre mejores resultados que la malla aleatoria pura. En efecto, segn (2-10) se tiene:

1 1 2 2 2 = (0 | V ) (0 | v ) N (v | V ) 0 N

2-5 METODO DE APROXIMACION EN R1 Cuando el nmero de muestras es grande, la frmula (2-15) es un poco pesada de calcular numricamente, luego es importante desarrollar mtodos de aproximacin que permitan un clculo rpido de una varianza de estimacin. Veremos reaparecer la similitud profunda con las frmulas anlogas obtenidas por los mtodos transitivos, similitud e importancia metodolgica que ya habamos mencionado a propsito de la subida. Pongmonos, por el momento, en el espacio de una dimensin. 2-5-1 El principio de correspondencia. Sea un segmento de longitud L=Na constituido por la unin de N segmentos de igual longitud a. En el centro de cada segmento se ha tomado una muestra puntual.

68

Para estimar la ley:

Z ( L) =
se forma el estimador:

1 Y ( x)dx L L

Z *( L) =

1 N

Y (x )
i i

La varianza de estimacin correspondiente est dada por la frmula general (2-15). Al realizar clculos anlogos a los presentados con ocasin de los mtodos transitivos, se pone en evidencia un principio de correspondencia trmino a trmino entre la parte irregular del variograma (h) y el desarrollo limitado de la varianza de estimacin en una vecindad de a=0. Este principio se resume por las reglas siguientes:
a ' a + | | h T T N N2 2n | h |2 n log(h) T a 2n N

(2-21)

Para entero par, T es nulo (pero no T) Los T tienen los mismos valores que los que figuran en la regla anloga (1-18) de los mtodos transitivos. Tal como vimos en la subida, aparece un trmino suplementario, de orden ms elevado (en 1/N2), ligado en este caso, al carcter finito de las operaciones que se efectan en teora intrnseca (promedio sobre un nmero N finito de muestras, y no, como en transitivo, en que la suma va, tericamente desde - a +). En la prctica este trmino es despreciable cuando N no es muy pequeo. Las reglas (2-21) permiten obtener una expresin aproximada de varianza de estimacin, para mallas a muy pequeas. Estas expresiones son validas cuando a es mayor que la distancia r0 a partir de la cual desarrollo limitado de (h) ya no es utilizable. Para valores de superiores a r0, estamos conducidos de introducir un segundo principio aproximacin: 2-5-2 Principio de composicin de varianzas de extensin elementales. a/ Las funciones intrnsecas auxiliares. Adems de (h), se utilizan en las aplicaciones las funciones siguientes: la no el a de

69

1 (h) = ( x)dx h0 F ( h) = 1 2 2 dx ( x y )dy = 2 x ( x)dx = 2 (h x) ( x)dx 2 h 0 0 h 0 h 0


h el
h h h h

F(h) es el valor medio de (h) cuando las dos extremidades de describen el segmento (0,h). As, la varianza del segmento h en segmento L es:

2 ( h | L) = F ( L ) F ( h)
(h) permite el clculo de covarianzas: la covarianza en L del segmento h con una de sus extremidades es:

2 (0, h | L) = F ( L) (h)
b/ Varianza de extensin elemental. Se llama as a la varianza de extensin de una muestra puntual localizada en el centro del segmento h.

Est dada por: (2-22)


2 = 2 F ( h) E 2

Se deduce (2-22) de (2-15) y de las relaciones establecidas en a/. c/ Principio de composicin de varianzas elementales. Sea el segmento L=Na a estimar. L est dividido en N zonas de influencia de longitud a, en cuyos centros se ha tomado una muestra puntual.

Sea Yi la ley de la muestra i, Zi la ley media de su zona de influencia, y

Z=

1 N

la ley de L. El error total es la media:

Z=

1 N

(Y Z )
i i i

de los errores parciales Yi-Zi. El principio de aproximacin consiste en admitir que estos errores parciales son independientes unos de otros (este principio se verifica con una aproximacin muy razonable para los

70

(h) usuales). Como la varianza de Yi-Zi es justamente la varianza de estimacin elemental calculada en (2-21), se encuentra: (2-23)
2 N =

1 2 1 a E = 2 F (a) N N 2

Se obtiene entonces la varianza de estimacin al dividir la varianza de estimacin elemental de una muestra en su zona de influencia por el nmero de sondajes. d/ Caso del dispositivo cerrado. A partir de N+1 muestras a malla regular, se desea estimar el segmento L=Na comprendido entre la primera y la ltima muestra:

Se demuestra que este dispositivo cerrado es equivalente al dispositivo centrado examinado en c/, y que la varianza de estimacin est dada tambin por (2-23) (siempre que n sea superior a 1): el dispositivo cerrado con N+1 muestras es equivalente al dispositivo centrado con N muestras.

Observacin: para N=1, el dispositivo proporciona la varianza de estimacin:

cerrado

con

dos

muestras

2 E ( h) ' = 2 ( h) F ( h)

1 2

que difiere de la varianza de estimacin elemental (2-23). No se puede dividir 2E por N, porque los errores parciales cometidos no son necesariamente independientes (en particular, estos dos segmentos tienen en comn la muestra central).

e/ Comparacin de los dos principios de aproximacin. Para a pequeo, se deduce de (2-23) un principio de correspondencia anlogo a (2-22), con coeficientes numricamente cercanos a T (para no muy grande), de manera que las reglas (2-23) y (2-22) son prcticamente equivalentes. Con un objetivo de simplificacin, en la prctica se utiliza siempre la regla (2-23) de composicin de varianzas elementales, debido a que esta frmula es vlida para las mallas grandes y pequeas.

71

2-6 METODO DE APROXIMACION EN Rn Trataremos explcitamente el caso del espacio de dos dimensiones. El caso general se deduce fcilmente por analoga. EL principio de aproximacin que utilizaremos es el principio de composicin de trminos de lnea y de rebanada, estudiado en detalle en el prrafo 1-4-4. En el caso intrnseco se puede proporcionar una justificacin anloga a la que presentamos a propsito de los mtodos transitivos, pero los clculos seran notoriamente ms complicados. Supondremos que el variograma es istropo (solo depende de r). En caso de anisotropa geomtrica es fcil adaptarse a este caso. a/ Las funciones auxiliares. Resulta cmodo introducir las funciones siguientes:

b(h): media de (x-y) cuando x e y recorren los dos lados paralelos de longitud b del rectngulo bxh (salvo una constante b(h) se deduce de (h) por subida de orden 1). b(h): media de (x-y), cuando x describe uno de los lados del rectngulo e y recorre el interior del rectngulo. Se tiene:

1 b (h) = b ( x)dx h0
F(b,h): media de (x-y) cuando x e y describen funcin es simtrica en b y h, y verifica:
h h

el

rectngulo.

Esta

F (b, h) =

2 2 x b ( x)dx = 2 (h x) b ( x)dx 2 h 0 h 0

Q(b,h): media de (x-y), cuando x describe el lado b e y describe el lado h, o tambin, x describe el rectngulo e y est fijo en uno de los vrtices.

b/ Extensin de un segmento medio en su rectngulo de influencia.

72

(2-24)

2 = 2 b F (b, h) b (0) E 2

c/ Estimacin de S por rebanadas paralelas equidistantes.

Sean b1, b2, ..., bn las longitudes de n rebanadas, h su equidistancia. Se asimila la superficie S que se quiere estimar a la unin de los rectngulos de influencia de las n rebanadas. La frmula (2-24) proporciona la extensin de bi a su rectngulo de influencia, es decir, 2Ei. Si Yi es la ley de bi, Zi la de su zona de influencia, admitiendo que los (Yi-Zi) son independientes, el error total:

b (Y Z ) b
i i i i

admite una varianza que se puede calcular ponderando por el cuadrado de los bi de las varianzas de extensin 2Ei. Se obtiene entonces la varianza de estimacin:
2 E =

(2-25)

b (b )
2 i

2 Ei 2

73

Observacin. Si los bi son iguales, queda simplemente:


2 2 E = E

1 n

d/ Composicin de trmino de lnea y trmino de rebanada. En el caso c/ anterior, sucede que a menudo no se conocen las leyes reales de las lneas, sino solamente una estimacin de estas leyes a partir de muestras puntuales en una malla regular a (a<h). Se admite entonces que los errores cometidos al estimar las lneas a partir de las muestras y de S a partir de las lneas (supuestamente conocidas) pueden ser mirados como independientes. La varianza de estimacin es entonces:
2 bi2 E 1 2 i = (a) + 2 N ( bi ) 2 E

(2-26)

2(a) es la varianza de extensin elemental (2-23) de una muestra puntual en su segmento a de influencia, N es el nmero total de muestras. (1/N)2(a) es el trmino de lnea, varianza del error cometido al estimar las lneas a partir de las muestras. El segundo trmino, que figuraba ya en (2-23) es el trmino de rebanada: varianza del error cometido al extender las lneas a sus rebanadas de influencia. Este principio (2-26) de composicin es vlido siempre que a sea inferior a h. Se aplica, en particular, al caso de un reconocimiento con malla rectangular axh. e/ Caso de una malla cuadrada. La varianza de extensin de un sondaje central a su cuadrado de influencia es:

(2-27)

2 = 2Q , F (a, a) E 2 2

a b

Para una malla cuadrada, se puede admitir que los errores cometidos al estimar cada cuadrado a partir de su sondaje central son independientes. La varianza de estimacin con N sondajes es entonces:

74

2 N =

1 2 E N

con un 2E dado por (2-27).

2-7 EL EFECTO DE PEPITA. 2-7-1 Gnesis de un efecto de pepita. Un variograma de alcance a finito caracteriza lo que se llama fenmeno de transicin: ms lejos de la distancia a, se alcanza la independencia, y el alcance a proporciona la escala de las estructuras elementales del fenmeno regionalizado correspondiente. Por otra parte, a menudo existe superposicin de varias estructuras de escalas bien diferentes, anidadas unas en otras. El variograma experimental muestra entonces una sucesin de alcances y de mesetas, cuyo anlisis permite reconstituir la jerarqua de estas estructuras anidadas. La nocin de escala juega aqu un papel primordial. A la escala de la decena o de la centena de metros, un fenmeno de transicin cuyo alcance es, por ejemplo, centimtrico, se manifiesta, sobre el (h) experimental como una discontinuidad en el origen, es decir como un efecto de pepita. De una manera general, un efecto de pepita es una reminiscencia de una estructura de transicin cuyas dimensiones fueron sobrepasadas a la escala a la cual se trabaja: los detalles y las caractersticas cualitativas de esta estructura anterior han dejado de ser perceptibles hace tiempo, y, la escala superior solo ha conservado un parmetro nico la constante de pepita que proporciona una suerte de medida global de la intensidad de esta estructura sobrepasada. Para analizar la gnesis de un efecto de pepita, localicmonos al nivel puntual, y supongamos que a una estructura primaria de dimensin a, se superpone una macro-regionalizacin, es decir una estructura secundaria de dimensiones mucho ms grandes. Si solo existiera la estructura primaria, se podra describir la V.R. correspondiente como una realizacin de una F.A. con covarianza C(h) de alcance a, o con un variograma:

1 ( h) = C C ( h)
de alcance y verificando ()=C=C(0). Para considerar la macroregionalizacin, se debe agregar un segundo componente 2(h), que representa la estructura secundaria, la cual vara con mucha lentitud a la escala de la primera estructura:

75

( h) = C C ( h) + 2 ( h)
(h) presenta entonces, en la vecindad del origen, una zona de crecimiento muy rpido, con dimensiones del orden de a. A la escala de la macro-regionalizacin, este (h) presenta entonces un efecto de pepita de amplitud C. 2-7-2 Influencia macroscpica de un efecto de pepita. Examinemos las consecuencias de este efecto de pepita. Primero, al nivel macroscpico, las muestras no sern puntuales, sino volmenes v ya grandes con respecto a a. Determinemos entonces el variograma v(h) de estas muestras v (el nico variograma accesible experimentalmente). v(h) es la suma de una componente muy continua 2 (la cual no ha sido sensiblemente alterada en esta regularizacin) y de lo que se obtiene al aplicar la frmula (2-12) a la componente C-C(h): esta componente peptica es entonces:

p ( h) =

1 1 dx C ( x y )dy 2 dx C (h + x y )dy 2 v v v v v v

Estudiemos entonces p. Se tiene p(0)=0, pero cuando h sobrepasa las dimensiones del volumen v, se tiene |h+x-y|a si xv, yv y C(h+x-y)=0. El primer trmino subsiste solo si h no es muy pequeo y se observa experimentalmente una discontinuidad en el origen, cuyo valor 2p (varianza de pepita) es:
2 p =

1 dx C ( x y )dy v2 v v

Por otra parte, por hiptesis, las dimensiones de v son grandes con respecto a a y se tiene:

C ( x y)dy = C (h)dh

76

(integral extendida a todo el espacio) salvo si x est a una distancia inferior a a de la frontera de v pero estos puntos ocupan un volumen despreciable, se puede entonces despreciar su influencia, que es del orden de a. Queda entonces:
2 p =

1 1 dx C (h)dh = C (h)dh 2 v v v v

Luego, la constante de pepita 2p que se observa experimentalmente es inversamente proporcional al volumen de las muestras:
2 p =

A v

y el coeficiente A=C(h)dh, que es la covarianza de las microestructuras, es el nico recuerdo de stas el cual subsiste a la escala de los volmenes v. El efecto de pepita aumenta de la misma manera la varianza de v en V, las varianzas de extensin y las varianzas de estimacin. En el caso de 2(v|V), por ejemplo, el aporte del efecto de pepita ser:

1 1 dx C ( x y )dy 2 dx C ( x y )dy 2 v v v V V V
es decir, segn el clculo anterior:

1 1 A v V
En el caso de la varianza de estimacin de V por N muestras de tamao v, se encuentra una componente peptica igual a:

1 1 A Nv V
En todos los casos, la varianza debida al efecto de pepita es inversamente proporcional al volumen de las muestras. Todo ocurre como si la V.R. admitiera dos componentes independientes, uno muy regular correspondiente al variograma 2, el otro completamente aleatorio y discontinuo el cual considera el efecto de pepita.

2-8 EL ESQUEMA ESFERICO. Para representar un fenmeno de transicin, se pueden utilizar esquemas de la forma:

77

(h) = A[ K (0) K (h)]


en que K(h) es el covariograma geomtrico de un volumen v. Si se toma por v la esfera de dimetro a, se tiene (ver ejercicio 9 de los mtodos transitivos, captulo 1):

3 h 1 h3 a 3 1 6 2 a 2 a3 K ( h) = 0 K ( h) =

si (| h |< a ) si (| h | a )

El esquema esfrico estar entonces definido por el variograma:

(r ) = C (r ) = 0

3 r 1 r3 3 2a 2a

si r < a si r a

El alcance es a, la meseta es C=(), la pendiente en el origen es (3/2)(C/a). Se tienen los bacos siguientes: Varianzas de estimacin diversas. Varianza de un punto en el rectngulo lxh:

1 A h F , C a a
Observacin A menudo, en las aplicaciones, los fenmenos de transicin estn acompaados de un efecto de pepita: se les representar entonces por un esquema esfrico con efecto de pepita C0:

78

Esquema esfrico Varianzas de extensin diversas

79

80

2-9 INFERENCIA ESTADISTICA Y CUASI-ESTACIONARIDAD. 2-9-1 F.A. cuasi-estacionaria. Volvamos al problema metodolgico evocado en el prrafo 1-4-6. Se trata de mostrar mediante una hiptesis bastante dbil de tipo cuasiestacionaridad que el problema de la estimacin global de un dominio acotado V tiene solucin. Esta va a resultar de los dos puntos siguientes:

La varianza de estimacin solo depende (por lo menos para mallas pequeas) del comportamiento en una vecindad del origen de un variograma o de una covarianza media. Este comportamiento es accesible experimentalmente, dicho de otra manera, la inferencia estadstica de lo que es til conocer es posible a partir de una sola realizacin, siempre que la F.A. no sea derivable en media cuadrtica.

Es posible poner como hiptesis mnima la caracterstica cuasiintrnseca, es decir la existencia de un variograma localmente estacionario el cual se deforma lentamente en el espacio. Nos limitaremos aqu a la hiptesis ligeramente ms fuerte de cuasi-estacionaridad que vamos a precisar: Una F.A. Z(x) es cuasi-estacionaria si tiene una esperanza matemtica m(x) y una covarianza centrada C(x,y) tales que: a/ m(x) es una funcin muy regular que vara de manera lenta en el espacio (a la escala de la malla utilizada); ms precisamente, m(x) puede ser considerada como una constante en el dominio cuyas dimensiones son las de la malla. b/ Existe una funcin de tres argumentos K(h;x,y) tal que se tiene C(x,y)=K(x-y;x,y) y que, cuando h es fijo, K(h;x,y) es una funcin regular y lentamente variable (en el mismo sentido anterior) de los argumentos x e y. Dicho de otra manera, cuando x e y pertenecen a un mismo dominio cuyas dimensiones son las de la malla, K(h;x,y) solo depende de h, y todo sucede como si la covarianza C fuera localmente estacionaria. En efecto, haremos an una hiptesis un poco ms restrictiva. Admitiremos que, en el dominio V que se quiere estimar, la funcin K admite un desarrollo en serie entera de la forma:

K (h; x, y ) = n ( x) n ( y )Cn (h)


n

Los n son funciones regulares que varan de manera lenta en la escala de la malla, y los Cn(h), funciones de covarianza. Es posible entonces encontrar funciones aleatorias Yn(x) estacionarias de orden 2, de esperanza matemtica nula, mutuamente independientes entre ellas, y tales que se tenga:

Z ( x) = m( x) + n ( x)Yn ( x)
n

81

Esta descomposicin es suficientemente general para lo que tenemos en vista. Las operaciones de tipo clculo de una varianza de estimacin, estimacin de un variograma, varianza de esta estimacin, etc. se van a presentar de manera lineal respecto de las componentes independientes Yn(x). Luego es suficiente tratar separadamente las componentes Yn(x), y adicionar luego los resultados obtenidos. Resulta as una simplificacin importante, porque nos reducimos al estudio del caso en que Z(x) es de la forma: (2-33)

Z ( x) = m( x) + ( x)Y ( x)

La cual admite la esperanza m(x) y una covarianza centrada de la forma: (2-34)

C ( x, y ) = ( x) ( y )C0 ( x y )

Examinemos ahora como se presentan nuestros dos problemas cuando estas dos relaciones (2-33) y (2-34) se verifican. 2-9-2 Clculo de la varianza de estimacin. Para simplificar, nos limitaremos al caso del espacio R1, y supondremos que se desea estimar el intervalo (0,L) a partir de n muestras implantadas en una malla regular L=na segn el dispositivo centrado. Se designarn por xi=(i-1/2)a los puntos de muestreo, y por:

Zi =

1 Z ( x)dx a (i 1) a

ia

la ley real de la zona de influencia nmero i. Si se toma el estimador:

1 Z ( xi ) n i
el error de estimacin es:

1 ( Z ( xi ) Zi ) n i
En el trmino Z(xi)-Zi, la contribucin de m(x) es despreciable, porque m(x) se considera constante en una zona de influencia: m(x) no juega ningn papel en el problema. Queda entonces:

Z ( xi ) Z i = ( xi )Y ( xi )

1 ( x)Y ( x)dx a (i 1) a

ia

y, como ( x) se considera constante en una zona de influencia:


ia 1 ( ) Z ( xi ) Z i = ( x) Y ( xi ) Y x dx = ( xi )[Y ( xi ) Yi ] 1) a a ( i

82

La varianza de este error individual es entonces:


2 D 2 [ Z ( xi ) Z i ] = [ ( xi ) ] E 0 2

al

designar

por

2 E

la

varianza

de

extensin

de

xi en

su

zona

de

influencia calculada con la covarianza C0 de Y(x). Por otra parte, los mtodos de aproximacin que hemos presentado en el prrafo (2-5) muestran que los errores Y(xi)-Yi pueden ser considerados como sin correlacin. Resulta que nuestra varianza de estimacin es:
2 2 Est =E

1 n2

2 ( xi )
i L

1 2 1 E0 2 ( x)dx 2 n a0

es decir:
2 2 Est = E

1 n

1 2 ( x)dx L0

Luego, esta varianza de estimacin es la misma que si se tuviera la covarianza estacionaria:

1 C (h) = C0 (h) 2 ( x)dx L0


Designemos ahora por C (h) la covarianza (seudo-estacionaria) media:

1 C ( h) = Lh

Lh

C0 (h) L h ( x) ( x + h)dx C ( x, x + h)dx = Lh 0

Para ha, ( x + h) no difiere mucho de ( x) y se tiene:

1 Lh

Lh

( x) ( x + h)dx

1 2 ( x)dx L0

Luego, para ha, C(h) = C (h) , y la varianza de estimacin es la misma que para una F.A. estacionaria cuya covarianza sera precisamente esta covarianza media C (h) . Para a pequeo, resta demostrar que es posible estimar efectivamente C (0) C (h) .

83

2-9-3 Posibilidad de inferencia estadstica. Pondremos:

(h) = C (0) C (h), 0 (h) = C0 (0) C0 (h) ,

etc.

Buscamos estimar el comportamiento de C (h) en una vecindad del origen, es decir de (h) para h pequeo. Para ello tomaremos el estimador:

* ( h) =

1 2( L h)

Lh

( ( x + h)Y ( x + h) ( x)Y ( x)) 2 dx

1 2( L h)

Lh

( x)(Y ( x + h) Y ( x)) 2 dx

Con las aproximaciones que hemos realizado, este estimador es insesgado:

E ( * ( h) ) = ( h)
Queda por evaluar su varianza. Aqu es necesario introducir una hiptesis sobre la ley espacial de la F.A., porque van a intervenir, necesariamente, momentos de orden 4. Lo ms simple es limitarse al caso gaussiano, como en el ejercicio 16. Los clculos realizados en los prrafos a/ y b/ siguen siendo vlidos y queda: (2-35)
Lh Lh

1 D ( (h)) = 2( L h) 2
2 *

( x)dx

( y )[ 0 ( x y + h) + 0 ( x y h) 2 0 ( x y )]2 dy

Evaluemos esta integral cuando h es pequeo. Es claro que esta integral es equivalente a:

1 2 L2
Pongamos:

Lh

2 ( x)dx

Lh

( y )[ 0 ( x y + h) + 0 ( x y h) 2 0 ( x y )]2 dy

F (u ) = [ 0 (u + h) + 0 (u h) 2 0 (u )]2
y designemos por R al covariograma transitivo de la funcin igual a 2 ( x) en el intervalo (0,L) e igual a = en otro caso. El algoritmo de Cauchy nos proporciona:

D 2 ( * (h)) =

1 R (u ) F (u )du L2 0

Para u>h, F(u) es una funcin regular de u, equivalente a h4((u))2. Luego nuestra varianza es de la forma:

84

D 2 ( * (h)) = Ah 4 +

R(0) F (u )du L2 0

Todo va a depender ahora del comportamiento d F(u) en una vecindad de 0. Designemos por bh (eventualmente bh2log(h)) la parte principal de 0 en h=0. La parte principal de F(u) es:
2

u u 2 2 b h 1 + + 1 2u h h

Por consiguiente, la varianza ser de la forma: (2-36)

D 2 ( * (h)) = Ah 4 +

B 1+ 2 h L2

Hay que distinguir entonces dos casos: a/ <2 (F.A. no derivable m.c.) La varianza relativa, para h pequeo es del tipo:

D 2 ( * (h))

( ( h) )

= A ' h 42 +

B' h L2

Esta varianza es infinitamente pequea con h, y la inferencia estadstica es posible. En el lmite, cuando (h) tiene un comportamiento en h2log(h), se encontrara una varianza relativa en A/log(h): la inferencia estadstica es an posible, pero sera muy difcil, en la prctica, debido al decrecimiento muy lento de 1/log(h). b/ Para =2 (F.A. derivable m.c.) la varianza relativa D2(*)/2 tiende hacia una constante A no nula cuando h tiende a 0. Esto significa (a menos que L sea muy grande con respecto del alcance de C0(h) que la inferencia estadstica es imposible. En resumen, la inferencia estadstica es siempre posible cuando la F.A. no es derivable en media cuadrtica y este es el nico caso en el cual nuestro problema es solucionable de manera terica en toda generalidad. Esta circunstancia, un poco extraa que castiga las F.A. muy regulares y prohibe la inferencia de su covarianza a menos de disponer de una realizacin muy extendida, tomar todo su sentido en el estudio del krigeado universal, y, particularmente, la nocin de deriva aleatoria.

85

2-10 EJERCICIOS SOBRE LAS FUNCIONES ALEATORIAS INTRINSECAS. 2-10-1 Construccin de F.A.I. Ejercicio 1. Se elige al azar un origen x0 en (0,a), luego se divide la recta en segmentos de longitud a mediante los puntos de subdivisin x0+ka (k entero, positivo o negativo). Sea Y(x) la F.A. que toma en cada uno de estos segmentos de longitud a un valor aleatorio constante Y, sorteado al azar de manera independiente de un segmento a otro, segn una ley de probabilidad de media m y de varianza 2. Probar que la probabilidad de que dos puntos x y x+h pertenezcan al mismo segmento es 1-|h|/a para |h|a y 0 para |h|>a. Deducir el variograma de Y(x) (Solucin: |h|2/a para |h|a y 2 para h>a). Ejercicio 2. La misma pregunta que en el ejercicio precedente, pero las longitudes de los segmentos sucesivos siguen la misma ley exponencial exp(-l) (dicho de otra manera, los puntos de discontinuidad constituyen un proceso de Poisson) (Solucin: la probabilidad para que x y x+h estn en el mismo segmento es exp(-h). Se deduce: (h)=2(1-exp(-h))). Ejercicio 3. Sea en la recta real un proceso de Poisson (puntos aleatorios separados por distancias independientes las cuales admiten la misma ley de probabilidad de densidad aexp(-ax)). Se define (salvo una constante) una F.A. Y(x) tomando Y(x)=constante fuera de los puntos poissonianos xi, y, en cada xi, Y+(xi)-Y-(xi)=Xi, con V.A. Xi independientes que siguen una misma ley de esperanza m y varianza 2. Probar que la F.A. es intrnseca (pero no es estacionaria de orden 2), que admite una deriva mah y el variograma a(m2+2)|h|/2 (lineal). (Este proceso es un proceso de Poisson compuesto, con incrementos independientes y estacionarios. Para calcular la deriva y el variograma, se podrn calcular las esperanzas E[Y(x+h)-Y(x)] y E[Y(x+h)-Y(x)]2 condicionando sobre el nmero n de puntos poissonianos que caen entre x y x+h, luego des-condicionar en n). Ejercicio 4. Sea Y(x) una F.A. estacionaria de orden 2, m su esperanza y C(h) su covarianza. Probar que la F.A.

Z ( x) = Y ( y )dy
0

es intrnseca (pero no estacionaria de orden 2), admite la deriva mh y el variograma:

(h) = (h x)C ( x)dx


0

(Solucin: partir de =C). b/ Aplicacin al proceso de pendientes aleatorias: se consideran puntos de discontinuidad poissonianos, como en el ejercicio 3, la pendiente w permanece constante en cada un o de los intervalos entre los puntos de discontinuidad. Estas pendientes w son aleatorias e independientes, de esperanza nula y de varianza 2 en cada intervalo. Probar que el proceso

86

Y(x) as definido (salvo una constante) es una F.A.I. estacionaria de orden 2) sin deriva, con variograma:

(Y(x)

no

es

e ah 1 + ah a2

(Solucin: el proceso derivado es del tipo del ejercicio 2, basta con aplicar a/ a Y(x)).

2-10-2 Ejercicios sobre las varianzas de estimacin. Ejercicio 5 Se considera el variograma h (0<<2) en el espacio de una dimensin. Calcular las funciones auxiliares y F, la varianza de extensin elemental de un punto a su segmento de influencia (dispositivo centrado), la varianza de extensin a este segmento del promedio de sus dos extremidades (dispositivo cerrado). Comparar y discutir.

( h) =

h 2h ; F ( h) = ( + 1)( + 2) +1

2a 1 1 1 2 ; a +1 2 + 2 + 2 2
Se tiene: 2E> 2E, para >1 e inversamente, con igualdad para =1: para >1, alta continuidad y la muestra nica pero bien ubicada es superior a las dos muestras mal ubicadas; para <1, estamos prximos del caso aleatorio puro, y las dos muestras, a pesar de estar mal ubicadas, proporcionan siempre mejores resultados que la muestra nica; para =1 los dos dispositivos son equivalentes. Ejercicio 6 Con el variograma h en el espacio de una dimensin, calcular la varianza de estimacin del segmento L=na, por n muestras puntuales, en los tres casos siguientes:

malla regular (dispositivo centrado)

1 2a 1 1 n +1 2 + 2

malla aleatoria estratificada

1 2a n ( + 1)( + 2)

malla aleatoria pura

1 2 L n ( + 1)( + 2)
87

Ejercicio 7 Sea, en el espacio de dos dimensiones, el variograma r. Sea un depsito reconocido lneas de longitudes superiores a su equidistancia h. a/ Calcular la varianza de extensin de una lnea de largo l en su rectngulo lxh de influencia. (Solucin: la subida bajo potencia constante l transforma r en Ar+1/l (o a log(r) en r/l); de donde:
2 =A E

2 1 1 h1+ h1+ B = 1+ A +2 + 3 2 A

b/ deducir la varianza de estimacin (ponderar por los cuadrados de las longitudes de las lneas, poner L=li y S=Lh, poner entonces la varianza de estimacin en la forma:

S 1+ L2+

Ejercicio 8 Mismo problema que en 7, pero se supone que adems las lneas estn estimadas a partir de muestras (canaletas) a la malla a. Calcular el trmino de lnea. (Solucin:

C 1+ 2 1 1 ) a con C = L +1 2 + 2
Optimizacin econmica: sea w el costo del metro de galera, p0 el costo de una muestra, y l0=p0/w. Optimizar la precisin si el presupuesto de reconocimiento es fijo, o, lo que es lo mismo, optimizar el costo de reconocimiento si la precisin es fija. (Solucin: Todo consiste en minimizar Cha1++Bh2+ con la condicin 1/(hl0)+1/(ha)=C. Se obtiene la relacin siguiente:

B (2 + )h1+ = Ca1+ + C (1 + )

a 2+ A0

que proporciona la equidistancia h de los niveles en funcin de la malla de canaletas. 2-10-3 Ejercicios sobre el efecto de pepita y el esquema esfrico. Ejercicio 9: Efecto de pepita al estado puro Sean pepitas puntuales distribuidas en el espacio segn un esquema de Poisson (definicin: el nmero N(v) de pepitas en un volumen v es una variable de Poisson de media v; si v y v son disjuntos, N(v) y N(v) son independientes). a/ Se toman volmenes v, y se pone Y(x)=N(vx) en que vx representa el trasladado de v implantado en el punto x. Probar que la covarianza de Y(x) e Y(x+h) es la varianza de N(vxvx+h), es decir K(h), siendo K(h) el covariograma geomtrico del volumen v.

88

b/ Se supone ahora que las pepitas tienen pesos aleatorios independientes (con media p0 y varianza 2p, y se toma para Y(x) la suma P1+P2+...+PN de los pesos de los N=N(vx ) pepitas contenidas en v. Calcular la media y la varianza de Y(x) (solucin: E(Y)=vp0, D2(Y)=v(p20+2p)). Deducir la covarianza de Y(x) e Y(x+h) (reemplazar v por K(h)). Ejercicio 10: Esquema de dilucin. Se tienen grmenes poissonianos como en el ejercicio 9. Sea f(x) una funcin. Se pone:

Y ( x) = f ( x xi )
i

en que xi representa las implantaciones de los diferentes grmenes. Se trata entonces de una dilucin de estos grmenes por la funcin f.  Encontrar la covarianza K(h) de Y(x) e Y(x+h) ( g (h), con g = f f ). (Hay que limitarse al caso en que f es a soporte compacto, considerar dos puntos x0 y x0+h y un domino acotado V que contiene los trasladados por x0 y x0+h del soporte de f. Se razonar suponiendo que el nmero n de puntos poissonianos cados en V es fijo, luego se des-condicionar en n). Ejercicio 11: Esquema esfrico de una dimensin Calcular las funciones auxiliares del esquema esfrico:

(A ) =

3 A 1 A3 para A a 1 para A a 2 a 2 a3 3 A 1 A3 3a para A a 1 para A a (A ) = 3 4a 8a 8A 1 A 1 A3 3 a 1 a2 F (A ) = para a 1 para A a A + 2 a 20 a 3 4 A 5 A2

b/ Varianza de extensin elemental de una muestra en su segmento b de influencia, para ba y b2a . Interpretar.

1 b 3 b3 3 a 1 a2 y 1 + 3 4 b 5 b2 4 a 160 a

2-10-4 Ejercicios sobre las grandes mallas. Los tres ejercicios que siguen constituyen un test. Si usted es capaz de comprender el camino de solucin de los dos primeros, y de efectuar los clculos correspondientes (que son fciles), quiere decir que usted ha asimilado bien los mecanismos mentales que deben ser los mecanismos del geoestadstico. Si adems, usted puede aceptar, sin confusin, las conclusiones crticas del tercer ejercicio (no validez en las grandes mallas del principio de composicin de trminos de lnea y de rebanada, y validez solamente muy aproximada del principio de composicin de varianzas de estimacin elementales), esto prueba que vuestra comprensin se extiende en profundidad, permitindole juzgar el sentido y los lmites de cada una de las hiptesis de aproximacin de la Geoestadstica operativa.

89

Del punto de vista epistemolgico, se notar tambin que en las grandes mallas (es decir superiores al alcance), la forma exacta de la covarianza o del variograma (h) pierde toda importancia: el K(h) solo interviene por su valor C en el origen y sus primeros momentos (A0 y A1 en R1; A0, A1, A2 y A3 en R2; en R3 habra que ir hasta A5). Luego, en R2, por ejemplo, todos los esquemas se reducen, en las grandes mallas, a un tipo nico, el cual depende solamente de los 4 parmetros esenciales A0, A1, A2 y A3 y del parmetro C (que solo interviene como un factor). En las grandes mallas estamos prximos de las condiciones de validez de la estadstica clsica: a la varianza de estimacin C/n a la cual conducira la estadstica, el clculo geoestadstico agrega trminos correctivos, cuyos coeficientes son precisamente los Ai. Ejercicio 12 (1 dimensin) Se designar por (h)=(r) un variograma (istropo) de tipo transitivo, es decir de la forma:

(r ) = C K (r ) con K (r ) = 0 para r > alcance


1/ En el espacio de una dimensin, para A >alcance, se tiene:

C F (A ) =
Deducir que:

2 2 (A x) K ( x)dx = 2 (A x) K ( x)dx 2 A 0 A 0

A0 A1 + A A2 A (A ) = C 0 2A F (A ) = C
Con:

A0 = 2 K ( x)dx
0

A1 = 2 xK ( x)dx
0

2/ Varianza de extensin para una malla a>alcance:


2 1 E = 2 F (a) = C 0 2 a a 2

Para una galera de longitud A =na, la varianza de estimacin es:

A A 1 2 a E = C 0 1 A A aA n

90

Ejercicio 13 (2 dimensiones) 1/ Funcin F(a,b): El valor medio de (h)=(r) en el rectngulo (a,b) es:

F ( a, b) =

4 2 2 ab

(a x)(b y) (
0 0

a b

x 2 + y 2 )dxdy

2/ Sea (h)= C-K(h) un esquema de tipo transitivo (es decir K(h)=0 para r=|h|>, siendo el alcance). En las grandes mallas (a y b > alcance) 1/ proporciona:

C F ( a, b) =
deducir que:

4 2 2 ab

(a x)(b y) K (
0 0

a b

x 2 + y 2 )dxdy

F ( a, b) = C
Con:

A1
ab

2 A2 1 1 A3 + ab a b a 2b 2

A1 =

\2

K (h)dh = 2 rK (r )dr
0

A2 = 2 r 2 K (r )dr
0

A3 = 2 r 3 K (r )dr
0

3/ Deducir (a;b), (a;b), Q(a,b) (siempre para a,b > alcance). Aplicar:

( a; b ) =

1 a2 F a a 2

2 a2 F ( a; b ) = 2 a 2 Q ( a, b) =
Lo cual debe dar:

1 2 a 2b 2 F ab ab 4

91

=C =C
Q=C

A1
2ab

A2 ab 2

A1
4ab

4/ Varianza de extensin de una galera en A xh. A , h/2 > alcance.

2 E = 2 ; A F ( h, A ) F ( A ) 2

2 E =

A0 1 1 1 1 A1 + 2 + 2 A2 2 2 + A3 2 2 A hA Ah A hA h A

5/ Varianza de extensin S por galeras de longitud A i > alcance (equidistancia > alcance). Poner A i=L. Sea N el nmero de galeras.

A ( A )
2 i
i

2 Ei 2

A0 N N 1 N A1 + 2 + 2 A2 2 2 + A3 2 2 L hA Lh L hA h A

= A0

h2 N h N hN 1 A1 + 2 + 2 A2 2 + A3 2 S S hS S S S

6/ Estimacin de S por galeras (equidistancia h>alcance), muestreadas con malla a superior al alcance:

2 Est

h2 N ah h N hN 1 = C + A0 A1 + 2 + 2 A2 2 + A3 2 S S S hS S S S

7/ Varianza de extensin de un sondaje:

A A2 A3 a a 2 E = 2Q , F (a, a ) = C 2 1 4 3 + 4 a a a 2 2
De donde obtenemos la varianza de estimacin de S:

92

A A a2 A 1 2 E = C 1 4 2 + 23 n S S aS a S
Ejercicio 14 (Crtica) 1/ Dar una mirada crtica: Para h=a la frmula 6 no es compatible con el resultado encontrado en 7/ (salvo el primer trmino C/n, que es la aproximacin de la estadstica clsica). De los dos principios de aproximacin siguientes: composicin de trminos de lnea y de rebanada (utilizado en 6/) composicin de varianzas de extensin elementales (utilizado en 7/) por lo menos uno de ellos no es aplicable al caso de las grandes mallas. Al reflexionar, aparece que la varianza de estimacin asociada a una malla rectangular (a,b), cuando a y b son superiores al alcance, solo debe depender de la superficie ab del rectngulo de la malla, y no de su alongamiento (a/b). Pero la frmula 6/ hace intervenir, de manera explcita, esta razn a/h. Se puede concluir que el principio de composicin de trminos de rebanada y de lnea no es aplicable a las grandes mallas, y que debe preferirse la frmula 7/. 2/ Para verificarlo, de manera rigurosa, partir de la frmula general:
2 Est =

1 S2

K ( x y)dxdy NS K ( x y)dy + N K ( x x )
i S S i

i, j

Cuando las distancias entre sondajes |xi-xj|, as como las distancias entre los sondajes y la frontera de S son superiores al alcance, la frmula anterior se traduce en la frmula (rigurosa) siguiente:
2 Est = C F (S ) +

C 2 A1 N S

frmula que es independiente de la forma de la malla ( y aplicable, en particular, tambin a mallas irregulares). C-F(S) solo depende de la superficie S (y no de la malla) y tiene como parte principal (para S grande): A1/S, de donde se obtiene la frmula de aproximacin:
2 Est

C A1 N S

3/ Examinemos si el principio de composicin de varianzas de extensin elementales proporciona mejores resultados. Se encuentra:

1 N

A1 A2 1 1 A3 a b C 2Q 2 , 2 F (a, b) = N S 2 S a + b + Sab
orden superior (en de b, mientras que de S. Sin embargo primer trmino es

Los dos primeros trminos son buenos. Los trminos de A2 y A3) no son aceptables, porque an dependen de a y la frmula exacta solo hace intervenir la geometra esta frmula es mejor que 6/ (en la cual solo el bueno).

93

4/ En el mismo espritu que 2/ anterior, probar que la varianza de estimacin de un segmento de longitud L por una malla a>alcance es (rigurosamente):

C F ( L) +

A C 2 0 N L

Deducir que la varianza de estimacin de una dimensin (Ejercicio 12, prrafo 2) es en realidad:
2 Est =

C A0 A1 N L L2

Luego, en una dimensin, el principio de composicin de varianzas de extensin proporciona el valor exacto en los dos primeros trminos, pero no en el tercero. 5/ Concluir del prrafo anterior que solo los dos primeros trminos de la frmula del prrafo 5/ Ejercicio 13 son vlidos (varianza de estimacin de S por galeras perfectamente muestreadas). Para reconstituir la frmula exacta, se supondr que S es el rectngulo A xh, y se razonar directamente sobre el variograma deducido de por subida bajo potencia A . Para h superior al alcance, la funcin F(h) de este esquema transitivo de una dimensin es de la forma:

F '(h) = C '

A '0 A '1 + 2 h h

(ver ejercicio 12). Probar, por un razonamiento directo, que la nueva constante C es:

C ' = C F (A, 0) =

A0 A1 L L2
la

Para determinar los nuevos coeficientes A0 y A1, identificar expresin de F( A ,h) (Ejercicio 13, prrafo 2/), lo que da:

A '0 =

A1 A2 2 2 A A A A3 A '1 = 2 2 2 A A
de

Mostrar, al aplicar el resultado 4/ anterior, que la varianza estimacin por galeras de longitud A equidistantes de h=H/N es:
2 Est =

C ' A '0 A '1 N H H2 A A 1 1 1 = 0 A1 2 + + 2 2 NA S S A H NA

A3 + 2 S

94

Comparar con el ejercicio 13, prrafo 5. 2-10-5 Inferencia estadstica para las F.A. Ejercicio 15 (Estimacin de un variograma) Sea Y(x) una F.A.I. sobre la recta real R1, (h) su variograma. Se supone conocida una realizacin de Y(x) en el intervalo (0,L), y, para estimar (h) se forma el estimador siguiente:

1 ( h) = 2( L h)
*

Lh

[Y ( x + h) Y ( x)]
0

dx

a/ Probar que * es un estimador insesgado, es decir E[*(h)]= (h). b/ (Lema) Sean X1, X2, X3 y X4 cuatro V.A. gaussianas de esperanzas nulas. Sea ij la matriz de covarianzas de los Xi. Probar que:

E ( X 1 X 2 X 3 X 4 ) = 12 34 + 13 24 + 14 23
(identificar el trmino en u1u2u3u4 de la funcin caracterstica de 4 variables. Tambin se puede admitir este lema sin demostracin y pasar adelante en el ejercicio). c/ Se supone que los incrementos de la F.A.I. Y(x) tienen leyes gaussianas (Nota: esta hiptesis tiene simplemente el objetivo de permitir el clculo de los momentos de orden 4). Utilizando el lema b/, establecer la relacin:
2 2 2 E (Y ( x + h) Y ( x)) (Y ( y + h) Y ( y )) = 4 (h) + 2 [ ( x y + h) + ( x y h) 2 ( x y ) ] 2

y deducir la varianza D2(*(h)) del estimador *(h):

1 D ( ( h) ) = 2( L h) 2
2 *

Lh

Lh

dx

[ ( x y + h) + ( x y h) 2 ( x y)]
0

dy

(utilizar la simetra en x e y de la funcin a integrar) d/ Efectuar los clculos explcitos para (h)=|h|. Para esto, mostrar que:

D 2 ( * ( h) ) =
distinguir dos casos: Para hL/2, queda:

4 2 ( L h) 2

Lh

dx

Sup (0, x h )

[h + x y]

95

4 h3 1 h4 2 D ( ( h) ) = 2 3 L h 3 ( L h)
2 *

y para h>L/2,

1 4 D 2 ( * (h) ) = 2h 2 + (l h) 2 h( L h) 2 3 3
En particular, para h muy pequeo, la varianza relativa es:

D 2 ( * ( h) )

( ( h) )

4h 3L

La cual tiende a 0 con h, y, por consiguiente la inferencia estadstica es posible en condiciones aceptables respecto del comportamiento de (h) en una vecindad del origen, a pesar de que solo se dispone de una sola realizacin de Y(x). Sin embargo, cuando h no es pequeo respecto de L, la varianza relativa es enorme y la inferencia estadstica no es posible: el variograma experimental * debe normalmente ser considerablemente diferente de su esperanza (h). Por ejemplo, para h=L/2, la varianza relativa es igual a 1 (es decir enorme). Ejercicio 17 (Estimacin de la varianza 2(0|L). - En las mismas condiciones que en el ejercicio anterior, se estima la varianza en L de las muestras puntuales por el estimador:

S2 =

2 1 Y x Y ( ) dx L 0
L

con: a/ Poner S2 en la forma:

1 Y = Y ( x)dx L0

1 L3

(Y ( x) Y ( y))(Y ( x) Y ( y '))dxdydy '


0 0 0

L L L

y probar que: E(S2)=2(0|L). b/ Calcular la varianza D2(S2) suponiendo que los incrementos de Y(x) son gaussianos. Para ello se formar S4 que es una integral sxtuple, se utilizar el lema b/ del ejercicio 15 para explicitar el argumento de la integral, y se mostrar que el resultado se expresa, con la ayuda de las funciones auxiliares y F en la forma siguiente:

96

4 8 D ( S ) = 2 ( F ( L) ) + 2 ( L x) 2 ( x)dx 3 x 2 2 ( x)dx L 0 L 0
2 2 2

8 x( L x) ( x) ( L x)dx L3 0

c/ Aplicar b/ al caso en que (h)=|h|, y probar que la varianza relativa en S2 es igual a 4/5 (es decir enorme): las fluctuaciones de la varianza experimental respecto de su esperanza tienen siempre una amplitud enorme. Ejercicio 17 (Seudo-covarianza) A menudo es habitual admitir, sin un examen profundo, que las V.R. que se estudian pueden ser consideradas como realizaciones de funciones aleatorias estacionarias de orden 2 (mientras que a menudo, un estudio ms fino muestra que solamente los incrementos de esta F.A. tienen momentos de orden 2 dicho de otra forma, bien a menudo, no existe la covarianza C(h), sino un variograma (h)). Por otra parte, se encuentra que los procedimientos de inferencia estadstica que se utilizan, tienen, sistemticamente, por efecto, a partir de los sesgos que implican, de hacer esta hiptesis admisible, an cuando esta hiptesis es totalmente falsa. Nos contentaremos con mostrar este fenmeno con un ejemplo: el caso del movimiento browniano, con variograma (h)=|h|, del cual se conoce una realizacin en el intervalo (0,L). Se supone entonces que:

E[Y ( x + h) Y ( x)] = 0 1 2 D [Y ( x + h) Y ( x)] =| h | 2


En la prctica usual, para estimar la hipottica covarianza C(h), que en efecto no existe en este caso, se calculan sucesivamente los valores (experimentales) de las expresiones:

Y =

C * ( x, y ) = (Y ( x) Y )(Y ( y ) Y )
y se deduce la covarianza experimental:

1 Y ( x)dx L 0

C * ( h) =

1 Lh

Lh

C ( x + h, x)dx
* 0

Ahora, si el variograma es (h)=|h|, la esperanza de C*(x,y) es:


* E C ( x, y ) =

2 x2 + y 2 L+ 2 Sup ( x, y ) 3 L

para h>0 se tiene entonces:

97

C * ( x, x + h ) = E

2 x 2 + ( x + h) 2 L+ 2 x 2h 3 L

y, al integrar en x, se ve que la covarianza experimental admite la esperanza:

1 4 2 h2 * E C ( h ) = L h + 3 3 3 L
Que es una parbola de pendiente -4/3 en el origen. Se encontrar entonces una varianza aparente C(0)=L/3, ligada nicamente a la longitud L del intervalo en el cual se trabaja, y que constituye un artefacto puro (porque la varianza real es infinita). Cuando no existe covarianza estacionaria, sino solamente un variograma lineal, los sesgos que introduce este procedimiento de estimacin, tienen como efecto proporcionar una confirmacin aparente de la existencia de esta covarianza. Se observa que la estructura est profundamente deformada: no solamente la recta se reemplaza por una parbola, sino adems la pendiente en el origen se encuentra afectada (4/3 en lugar de 1). El C*(h) es un puro artefacto, y no conserva casi nada de la estructura real del proceso. Se observar que el variograma experimental:

1 ( h) = 2( L h)
*

Lh

[Y ( x + h) Y ( x)] dx
2 0

tiene como esperanza:


* E (h) = ( h)

no est afectado por el sesgo anterior, y constituye, por consiguiente, una herramienta ms segura para el experimentador que la covarianza.

98

CAPITULO 3 EL KRIGEADO 3-1 LOS OBJETIVOS DEL KRIGEADO En trminos mineros el krigeado consiste en encontrar la mejor estimacin lineal posible de la ley de un panel, considerando la informacin disponible, es decir las leyes de las diferentes muestras que se han tomado, sea al interior, sea al exterior del panel que se quiere estimar. El krigeado consiste en efectuar una ponderacin, es decir atribuir un peso a la ley de cada muestra, estos pesos se calculan de manera de hacer mnima la varianza de estimacin resultante, considerando las caractersticas geomtricas del problema (formas, dimensiones e implantacin relativa del panel y de las muestras). En grueso, como es natural, el krigeado atribuir pesos dbiles a las muestras alejadas, e inversamente. Sin embargo esta regla intuitiva puede ser parcialmente puesta en duda cuando aparecen fenmenos ms complejos de efecto de pantalla y de transferencia de influencia. No es posible resolver un problema de krigeado, es decir calcular efectivamente el peso ptimo que conviene atribuir a cada muestra, sin hacer ciertas hiptesis sobre las caractersticas Geoestadsticas del depsito que se estudia, es decir, esencialmente, de darse la funcin de covarianza o el variograma de la F.A. cuyas leyes puntuales se supone que constituyen una realizacin. En principio no es necesario introducir una hiptesis estacionaria o intrnseca, y las ecuaciones del krigeado tienen un alcance general (en la prctica, naturalmente, es necesario comenzar por estimar la covarianza o el variograma a partir de los datos experimentales, y es aqu donde la hiptesis en cuestin encuentra su importancia). Nos limitaremos al caso de las F.A. intrnsecas o estacionarias de orden 2. El caso general de las F.A. no estacionarias corresponde al krigeado universal. El primer inters del krigeado deriva de su misma definicin. Al minimizar la varianza de estimacin, estamos seguros de sacar el mejor partido posible de la informacin disponible, o, si se prefiere, de obtener la estimacin ms precisa posible del panel en estudio. Esta ventaja es a menudo notable, pero no se justificara siempre, debido a las complicaciones suplementarias que introduce necesariamente una ponderacin. El inters prctico ms importante de lejos del krigeado, proviene, no del hecho que asegura la mejor precisin posible, sino ms bien porque permite evitar un error sistemtico. En la mayora de los yacimientos metlicos, se deben seleccionar, para la explotacin, un cierto nmero de paneles, considerados como rentables y se deben abandonar otros paneles considerados no-explotables. D. G. Krige ha mostrado que, si esta seleccin fuera realizada considerando exclusivamente las muestras interiores a cada panel, resultara necesariamente en promedio una sobre-estimacin de los paneles seleccionados. La razn de este problema muy general es que la varianza de las leyes reales de los paneles es siempre ms dbil que la varianza de los resultados de un muestreo interior. Dicho de otra manera, el histograma de las leyes reales de los paneles comporta menos leyes extremas (ricas o pobres) luego tiene ms leyes intermedias que el histograma deducido de las muestras interiores, y, si se calcula el

99

efecto de una seleccin sobre este ltimo histograma, los paneles eliminados sern en realidad menos pobres que lo que se haba previsto, y los paneles conservados menos ricos.

Nuestra nocin de krigeado permite interpretar fcilmente este fenmeno, y corregir sus efectos. Cuando se selecciona un panel rico, la aureola de muestras exteriores tiene, en general, una ley ms dbil que las muestras interiores, sin embargo su influencia sobre el panel a estimar no es despreciable porque el krigeado le atribuye un peso no nulo. Si no se toma en cuenta esta aureola exterior, se introduce, necesariamente, una causa de error sistemtico por exceso. Para ilustrar esta nocin, imaginemos un yacimiento filoniano reconocido por dos galeras AA y BB

Se considera que las leyes de BB con explotables, mientras que las leyes de AA son explotables en el segmento CC. Si nos contentamos con calcular la media de las leyes BB y CC, estamos seguros de cometer un error por exceso: porque los trozos AC y CA pobres por construccin tienen una influencia no despreciable sobre el trapecio BB CC. Si fuera posible dibujar una frontera precisa entre mineral explotable e inexplotable, en general, la frontera real, no coincidira con las rectas BC o BC, sino que sera una curva cualquiera, a menudo bastante

100

irregular, tal como la lnea complicada BDEFC. Adems en el panel rico subsistiran enclaves pobres y recprocamente. En la explotacin estaremos obligados de abandonar ciertas porciones ricas, y de tomar ciertas partes pobres, y este ensuciamiento traduce de manera concreta la influencia de los trozos pobres AC y CA sobre el panel rico (como se trata de un yacimiento homogneo, y que la frontera precisa de la ley es dudosa, nosotros hablaremos de krigeado, y no de ensuciamiento. Emplearemos la palabra ensuciamiento en el caso en el cual los minerales ricos y pobres son geolgicamente heterogneos, y estn separados por una frontera continua, representable por una curva relativamente regular, tal como BDEC, que, por otra parte, no tiene ninguna razn para coincidir con la recta BC). En este caso el krigeado conduce a ponderar las leyes de BB, CC, y de los trozos AC y CA por coeficientes convenientes, que seran - por ejemplo 60% para BB, 27% para CC y 13% para los dos trozos. El efecto esencial de esta ponderacin es eliminar en promedio un error sistemtico por exceso, luego un error inquietante. Al considerar este objetivo primordial, la mejora de la precisin propiamente dicha, aparece como secundaria. Proporcionaremos ahora, algunas indicaciones acerca de la manera como D.G. Krige formul el problema en el comienzo de los aos 50. Desde haca tiempo, los mineros de Africa del Sur conocan este efecto de sobreestimacin de los paneles ricos, y aplicaban ciertos factores correctivos empricos. Para encontrar estos coeficientes, KRIGE parte de la hiptesis que el muestreo est bien hecho, dicho de otra forma, que la esperanza matemtica de la ley de las muestreas que se toman en un panel es igual a la ley media real de este panel. Si estas variables son gaussianas (en los yacimientos de Africa del Sur, las leyes eran en realidad lognormales, pero esto no cambia esencialmente nada), la recta de regresin que proporciona la esperanza condicional de la muestra en funcin de la ley del panel es entonces igual a la primera bisectriz.

101

La otra recta de regresin, la que entrega la esperanza de la ley media del panel en funcin de la ley de la muestra (que es la ms interesante) tiene entonces una pendiente inferior a la unidad. Si la ley x de la muestra es superior a la media general m, la esperanza del panel es entonces inferior a x, e inversamente. KRIGE corrigi este error utilizando la ecuacin: (3-1)

y = m + ( x m)

de esta segunda recta de regresin, con un coeficiente de regresin <1. Ms precisamente, si es el coeficiente de correlacin, x y y las desviaciones estndares de las muestras y de los paneles, los dos coeficientes de regresin (1 y respectivamente) son:

1=
y, por consiguiente:

x y

, =

y x

2 y <1 x2

El coeficiente es igual a la razn de las varianzas (en todo el yacimiento) de los paneles y de las muestras. Un examen ms detallado media m, no es conocida aritmtica m*=(1/n)xi de si se reemplaza m por m*, de (3-1) sugiere otras posibilidades. La ley en general, y se le estima tomando la media las muestras disponibles en el yacimiento. Pero (3-1) toma el aspecto:

Y * = ai X i
i

de una combinacin lineal de las leyes disponibles Xi de las muestras, por otra parte con la condicin:

=1

Sobre la cual volveremos largamente: Pero ahora, en lugar de atribuir a todas las muestras exteriores el mismo peso ai=(1-)/n sin diferenciar entre ellas, independientemente que se trate de muestras cercanas o alejadas, es natural buscar atribuir a cada una de ellas, un peso ai apropiado, el cual considere su localizacin con respecto al panel a estimar. Se llaga as a la investigacin de los pesos ptimos ai, es decir a la nocin de krigeado, tal como la hemos presentado anteriormente. 3-2. Notaciones En todo el captulo, utilizaremos el mismo sistema de notaciones:

102

Z(x) designa una F.A. (estacionaria o no), en general de esperanza no nula, e Y(x) una F.A. (no necesariamente estacionaria ni intrnseca) de esperanza nula: por ejemplo, a menudo se tomar:

Y ( x) = Z ( x) E[ Z ( x)]

Se designar por S al conjunto de Rn sobre el cual se conoce experimentalmente la realizacin de la F.A. En el caso en que S es un conjunto finito, se designar, por ndices griegos, los puntos experimentales x, x, ... de S, es decir:

S = { x , = 1, 2,..., N }

Dependiendo del caso, se buscar estimar, sea el valor Z(x0) en un punto x0 que no pertenece a S, o bien el promedio (1/ V ) Z ( x)dx en un
V

dominio V diferente de S, es decir, ms generalmente (para reunir todos los casos posibles en una escritura nica) un promedio:

Z 0 = p (dx) Z ( x)

( p(dx) = 1)

ponderado de Z(x) por una medida p de suma unidad y de soporte disjunto de S.

Para ello se formarn estimadores lineales a partir de los datos disponibles, que sern los Z(x), xS. En el caso discreto se escribir siempre:

Z = Z ( x )

( x S )

anlogamente, para las funciones f(x), C(x,y), etc., ...:

f = f ( x )

, C(x , x ) = C

En el caso discreto, se tomar siempre la convencin de suma mediante la cual se debe sumar sobre todo ndice que aparezca dos veces (en general, una vez en posicin inferior, o covariante, y una vez en posicin superior, o contravariante). As, se escribir:

en vez de

Los estimadores que utilizaremos se escribirn siempre en la forma:

Z * = Z
En el caso en que S es infinito, se utilizarn, estimadores, medidas con soporte en S, es decir: para formar los

103

Z * = (dx) Z ( x)
S

se escribir, simplemente:

Z * = (dx) Z ( x)
porque la medida , por definicin, tiene su soporte en S. Pasemos ahora a las ecuaciones del krigeado, distinguiendo 3 casos (F.A. de esperanza nula o conocida; F.A. estacionaria de esperanza desconocida; F.A. intrnseca sin deriva). En todos los casos supondremos que la covarianza o el variograma son conocidos.

3.3 F.A. ESTACIONARIA DE ESPERANZA NULA O CONOCIDA A PRIORI. Sea Y(x) una F.A. de esperanza nula, (x,y) su covarianza S={x} el conjunto de los puntos experimentales, que en primer lugar supondremos finito, Y0=p(dx)Z(x), la variable a estimar. Como estimador se va a utilizar una combinacin lineal:
YK = K Y

y determinar los coeficientes K por la condicin de minimizar la esperanza de E(Y0-YK)2, es decir (porque la esperanza de la F.A. es nula) la varianza D2(Y0-YK). Por otra parte esta varianza es:
E (Y0 YK ) = D 2 (Y0 ) 2K Y0 + K K
2

con:

Y = p (dx) ( x , x) 0 2 D (Y0 ) = p (dx) ( x, y ) p (dy )


Al derivar las derivadas parciales en K de esta forma cuadrtica, se obtiene el sistema: (3-2)
K = Y
0

Este sistema que tiene N ecuaciones y N incgnitas es regular y admite una solucin nica si y solamente si la matriz de covarianzas es estrictamente definida positiva (luego con determinante>0), lo cual supondremos siempre. La varianza 2K (o varianza de krigeado) de esta estimacin ptima es igual al valor de la forma cuadrtica E(Y0-YK)2 cuando se toma como coeficientes K la solucin de (3-2). Por otra parte (3-2) implica:

104

K K = K Y

Existe entonces, en el ptimo, igualdad entre el trmino rectangular y el trmino cuadrtico, y se encuentra: (3-3)
2 K = D 2 (Y0 ) K Y
0

En el caso del krigeado puntual (estimacin de Y(x0) para un punto x0 que no pertenece a S) el sistema se reduce a:
K = , x0 2 K = x0 , x0 K , x0

(3-4)

La solucin K(x0) correspondiente:

depende,

evidentemente

de

x 0,

el

estimador

K ( x0 ) = K ( x0 )Y

es un interpolador exacto, en el sentido de que:

YK ( x0 ) = Y0
si x0 viene a coincidir con un punto experimental
x 0 S : esto se puede

verificar directamente del sistema (3-4), pero es evidente a priori que el estimador Y 0 es ptimo, porque es de varianza nula. Cuando el conjunto S es infinito, se busca estimar Y0 por medio de un estimador de la forma: (3-5) y el sistema (3-2) queda:

YK = K (dx)Y ( x)
S

(3-6)

K (dx) ( x, y ) = y ,Y y S 0 S 2 2 K = D (Y0 ) K (dx) x ,Y0 S

Pero aqu se imponen ciertas reservas. Si existe una medida K con soporte en S verificando (3-6), esta solucin es nica, y (3-5) es el estimador ptimo. Sin embargo (a menos que la covarianza sea muy regular, ver ejercicio 8), no siempre existe una medida K verificando este sistema. Se puede demostrar (ver [6]) que siempre existe un estimador ptimo nico YK perteneciente al espacio de Hilbert H(S) engendrado por los Y(x), xS (es decir: lmite en media cuadrtica de combinaciones lineales finitas de los Y(x), xS), pero YK no admite necesariamente una representacin de la forma (3-5) con una medida K.

105

Se puede aclarar este resultado observando que los sistemas (3-4) y(3-6) pueden escribirse como:

(3-7)

Cov(YK Y0 , Y ( y )) = 0 (y S ) 2 2 K = D (Y0 ) Cov(YK , Y0 )

As YK es el nico elemento del espacio de Hilbert tal que YK-Y0 es ortogonal a todos los elementos Y H(S) (es decir, con covarianza nula con todo Y H). Esta propiedad caracteriza YK como la proyeccin ortogonal de Y0 en H(S), de donde resulta la existencia y la unicidad, pero esto no implica (salvo el caso finito en que H es un espacio eucldeo) la existencia de una representacin integral de la forma (3-5) Sea ahora Z(x) una F.A. la cual admite una covarianza centrada (x,y) y una esperanza constante m=E[Z(x)], no nula, pero conocida. Llegamos inmediatamente al caso precedente al razonar sobre la F.A. Y(x)=Z(x)-m. El estimador ptimo es entonces: (3-8) o bien:
Z K = m + K ( Z m )

Z K = m + K (dx)( Z ( x) m)
S

Con coeficientes K o una medida K verificando los mismos sistemas (3-2) o (3-6). La varianza 2K mantiene la misma expresin.

3-4 FUNCION ALEATORIA ESTACIONARIA DE ESPERANZA DESCONOCIDA. 3-4-1 Las ecuaciones del krigeado. Sea ahora Z(x) una F.A. de esperanza m constante pero desconocida, y (x,y) su covarianza centrada. Se desea estimar:

Z 0 = p(dx) Z ( x)
a partir de los Z, valores de la realizacin sobre un conjunto finito:

S = { x , = 1, 2,..., N }
por medio de una combinacin lineal de la forma:

Z * = Z
Debido a que la esperanza m no se conoce, es necesario imponer a los coeficientes la condicin siguiente, llamada condicin de universalidad:

106

(3-9)

= 1

En efecto, la mejor combinacin lineal posible es la que minimiza la esperanza de (Z0-Z*)2. Se tiene:

= m 2 (1 ) 2 + D 2 ( Z 0 ) 2 Z0 + K K

E ( Z * Z 0 ) 2 = E ( Z 0 2 ) 2 E ( Z 0 Z * ) + E[( Z * ) 2 ]

Como m es desconocido, solo se puede minimizar esta expresin cuando ella no depende de m, es decir, si (3-9) se verifica Tambin se puede justificar esta condicin (3-9) imponiendo al estimador Z* la condicin de ser insesgado cualquiera que sea el valor (desconocido) de m (estimador universal). Se tiene:

E ( Z 0 Z * ) = m m

y, de nuevo, esta esperanza es nula cualquiera que sea m si se verifica (3-9). Cuando esta condicin consiguiente: (3-9) se verifica, E(Z0-Z*) es nula, y por

E ( Z 0 Z * ) 2 = D 2 ( Z 0 Z * ) = D 2 ( Z 0 ) 2 , Z0 +
Expresando que esta forma cuadrtica es mnima considerando la condicin (3-9), se obtiene el sistema siguiente donde figura un parmetro de Lagrange:

(3-10)

= , Z0 + = 1
ecuacin por y teniendo en cuenta la

Al multiplicar la primera segunda, se encuentra:

= , Z + = , Z +
0

De donde se obtiene la expresin de la varianza del krigeado, la cual hace intervenir el parmetro de Lagrange: (3-10)

D 2 ( Z * Z 0 ) = D 2 ( Z 0 ) + , Z0

En el caso del krigeado puntual de un punto x0, este sistema queda:

107

(3-11)

= , x0 + = 1 D2 (Z * Z ) = + x0 x0 , x0 0
directamente que el krigeado puntual es un

Tambin se verifica interpolador exacto.

Se demuestra que el sistema (3-10) es siempre regular. En el caso continuo, existe siempre un elemento nico Z* H(S), lmite en media cuadrtica de combinaciones lineales finitas, las cuales verifican la condicin (3-9), y tal que se tiene:

Cov( Z * Z 0 , Z ( y )) = 0

y S

Este elemento nico es la proyeccin de Z0 en la variedad lineal cerrada definida en H(S) por la condicin de universalidad, luego el estimador ptimo Z* existe y es nico. Aqu tambin Z* no admite necesariamente una representacin de la forma (dx) Z ( x) con una medida la cual verifica:
S

(3-12)

(dx) ( x, y ) = y , Z + 0 S (dx) = 1 S
puede encontrar una medida

y S

Pero, si se entonces:

la

cual

verifica

(3-12),

Z * = (dx) Z ( x)
es la nica solucin del problema. 3-4-2 La estimacin ptima de m. En lugar de estimar una media espacial del tipo

p(dx) Z ( x) ,

se puede

tambin buscar estimar la misma esperanza matemtica m=E[Z(x)]. Formaremos el estimador ptimo m* de m, y, en el prrafo siguiente, nos preguntaremos acerca de la relacin entre m* y Z*. Nos limitaremos al caso en que S es finito, la extensin al caso infinito se puede hacer enseguida sin dificultad, con las reservas de uso respecto de la existencia de una representacin de nuestros estimadores por medio de medidas con soporte en S. Para estimar m, se forma una combinacin lineal:
m* = 0 Z

108

Se impone a los coeficientes 0 la condicin de universalidad:

= 1
0

Que expresa que m* es insesgado cualquiera que sea el valor desconocido de m, y se eligen los coeficientes 0 que minimizan D2(m*)=E(m-m*) considerando esta condicin. De la relacin:
D 2 (m m* ) = 0 0

se deduce que los 0 constituyen la nica solucin del sistema siguiente, donde figura un parmetro de Lagrange 0:

(3-13)

0 = 0 = 1 0

En el ptimo se encuentra que:


0 0 = 0 0 = 0

de manera que el parmetro de Lagrange 0 es igual a la varianza del estimador ptimo: (3-13)

D 2 ( m* ) = 0

3-4-3 El teorema de aditividad. Al final del prrafo (3-3), hemos indicado cmo formar el estimador ptimo cuando la esperanza m no es nula pero es conocida: se calculan los coeficientes K ptimos del caso m=0, y se efecta la correccin, muy simple, que consiste en reemplazar Y(x) por Z(x)-m, es decir: (3-8)
Z K = m + K ( Z m )

Probemos que el estimador ptimo Z* del caso en que m no es conocida (prrafo 3-4-1) y el estimador ptimo m* de m, estn relacionados por la relacin siguiente (muy similar a (3-8)): (3-14)
* ZK = m* + K ( Z m* )

con los mismos coeficientes K, solucin del sistema (3-2). Este resultado significa que se puede krigear como si m fuera conocida, con la condicin de reemplazar el valor desconocido de m por su estimador ptimo m*. En efecto, consideremos el segundo miembro de (3-14):

109

m* + K ( Z m* ) = K (1 K ) Z + 0
Las cantidades:
' = K + 0 (1 K )

verifican la condicin de universalidad, porque:

' = + 1 = 1
K 0

al considerar

= 1 (sistema
0

(3-13)). Formemos ahora la expresin:

' = K + 1 K ) 0

Segn (3-2) y (3-13), queda:


' = , Z + 1 K ) 0
0

Luego, los verifican parmetro de Lagrange (3-15)

bien

la

primera

relacin

(3-11),

con

el

= 1 K ) 0

Segn la unicidad de la solucin, se tiene bien = , luego la ecuacin (3-14) es vlida. En lo que respectan las varianzas, se tiene igualmente un teorema de aditividad. En efecto, segn (3-14) se tiene:
Z * Z 0 = ( K Z Z 0 ) + (1 K ) m*

Z Z 0 est en Por otra parte, el sistema (3-2) expresa precisamente que K correlacin nula con todos los Z, luego tambin con sus combinaciones lineales, y, en particular, con m*. Se tiene, entonces:

2 D 2 ( Z * Z 0 ) = D 2 ( K Z Z 0 ) + (1 K ) D 2 ( m* )

es decir:

110

(3-16)

2 2 D2 (Z * Z0 ) = K + (1 K ) D 2 (m* )

El primer trmino es la varianza 2K del krigeado cuando m es desconocido. El segundo proporciona una medida exacta de la prdida de informacin que se tiene, relativo a Z0, cuando no se conoce el verdadero valor de m. 3-5 CASO DE UNA F.A.I. SIN COVARIANZA. Sea ahora Z(x) una F.A.I. sin deriva, con variograma pero no existe la covarianza. Para estimar:
Z 0 = p (dx) Z ( x)

con

p(dx) = 1

buscaremos una combinacin lineal

Z * = Z
tal que:

a/ el error Z*-Z0 sea una combinacin lineal autorizada (prrafo 22-1), es decir su varianza es finita. b/ tal que esta varianza de estimacin sea mnima.

La condicin a/ proporciona:

p(dx) = 0

es decir la misma condicin de universalidad que en el prrafo anterior:

=1

Cuando esta condicin se verifica, segn el mecanismo de clculo del prrafo (2-2-1) que se puede calcular la varianza de Z*-Z0 como si existiera una covarianza igual a . Se puede entonces, transponer directamente el sistema (3-11): los coeficientes del estimador ptimo constituyen la nica solucin del sistema:

(3-17)

= p (dx) ( x, x ) = 1

y la varianza 2K correspondiente es:


2 K = p(dx) ( x, y ) p(dy ) + + p(dx) ( x, x )

111

En el caso continuo (con las restricciones de uso respecto de la existencia de una representacin de Z* mediante una medida) se tiene, anlogamente:

(3-18)

(dx) ( x, y ) = p (dx) ( x, y ) S (dx) = 1 S 2 = p p + + p K


en el caso puntual, se obtiene tambin un interpolador

Finalmente, exacto.

Observacin Sea (x0) la solucin del krigeado en el punto x0:

(3-19)

( x0 ) = ( x0 , x ) ( x0 ) ( x0 ) = 1 2 ( x ) = ( x ) + ( x ) ( x , x ) 0 0 0 K 0

segn el carcter lineal de los segundos miembros de (3-17), la solucin del krigeado de

p(dx)Z ( x)
es:

= p(dx) ( x)
Hay superposicin, o combinacin lineal de los krigeados puntuales: esta relacin se extiende tambin al parmetro de Lagrange:

= p (dx) ( x)
Sin embargo la varianza (3-17) no se obtiene por una combinacin lineal de las varianzas 2K(x0) de los krigeados puntuales. 3-6 EJERCICIOS SOBRE EL KRIGEADO. Ejercicio 1 (Krigeado de un segmento de longitud l) a/ Se tiene en la recta una F.A.I sin deriva cuyo variograma es (h) y cuatro puntos de muestreo: x1, x2=x1+l, x3=x2+l, x4=x3+l. Se desea krigear el segmento (x2,x3) de longitud l a partir de los valores Z1, Z2, Z3, Z4 de la realizacin en x1, x2, x3, x4. Escribir el sistema (3-17) utilizando las funciones auxiliares y F del prrafo 2-5-2. (Solucin: probar que 1 = 4 = /2, 2 = 3 = (1-)/2, lo cual es evidente por simetra, con solucin del sistema:

112

1 (l ) + (2l ) = (l ) + 2 2 2 1 1 (l ) + (2l ) + (3l ) = 2 (2l ) (l ) + 2 2 2

(l ) +

y eliminar el parmetro de Lagrange , de donde:

(3l ) (2l ) (l ) = 2 (2l ) 2 (l ) (2l )


b/ Aplicar al caso (h)=|h|, 0 < 2 , e interpretar. (Solucin: utilizar el ejercicio 5 del captulo 2. Se encuentra:
2 4

1 2

1 2

1 2

1 + 2 +1 3

+1

(2 1)

Para =0, =1/2 (efecto de pepita puro, el estimador ptimo es la media aritmtica de las 4 muestras). Cuando aumenta, decrece, se anula para =1 (propiedad markoviana del variograma lineal) y es negativo para 1<<2: para >1, la realizacin presenta buenas propiedades de continuidad y el dibujo adjunto hace comprender que, para (Z1+Z4)/2<(Z2+Z3)/2 (por ejemplo), el estimador debe ser mayor que (Z2+Z3)/2, luego <0:

(comparar con el ejercicio 12 del captulo 4) Ejercicio 2 (Yacimiento reconocido por dos sistemas de lneas)- Sea un yacimiento reconocido por dos redes regulares de galeras paralelas a dos direcciones perpendiculares.

113

Sean ZM y ZT las leyes medias de las lneas, sea Z la ley media desconocida del yacimiento y sean 2T = D2(Z-ZT) y 2M = D2(Z-ZM) las varianzas de estimacin del yacimiento por las solas lneas horizontales y las solas lneas verticales respectivamente. Se admite que (lo cual es verdadero con una buena aproximacin) E[(Z-ZM)(Z-ZT)]=0. a/ Probar que el estimador ptimo (krigeado) de Z es Z*=ZM+(1-)ZT con:

T2 2 2 T +M

(ponderacin por el inverso de las varianzas de estimacin respectivas) y que la varianza correspondiente es:
2 2 M T 2 T2 + M

(Solucin: los ponderadores son de la forma y 1- debido a la condicin de universalidad. Partir luego de:
2 2 D 2 ( Z Z * ) = D 2 [ ( Z Z M ) + (1 )( Z ZT )] = 2 M + (1 ) 2 T

y minimizar en . Ejercicio 3 (Propiedad markoviana de la covarianza exponencial y del variograma lineal). Este ejercicio preparatorio ser de utilidad para la comprensin de los ejercicios siguientes. a/ Una F.A. Z(x) en la recta real es markoviana si, para todo x0, los Z(x), x>x0 y los Z(x) son condicionalmente independientes a Z(x0) fijo. Probar que una F.A. estacionaria de orden 2 con ley gaussiana es markoviana si y solo si su covarianza centrada es de la forma C(h)=Ce-a|h|. [Dos variable gaussianas son independientes cuando su coeficiente de correlacin es nulo. Si X1, X2, X3 son gaussianas, el coeficiente de correlacin de X1 y X3 con X2 fijo es:

(1 )(1 )
2 12 2 23

13 12 23

Deducir que la F.A. es markoviana si y solo si C(h+h)=C(h)C(h) (h, h positivos)] b/ Sea Z(x) una F.A.I. en la recta real. Se dice que Z(x) es a incrementos independientes si los Z(xi)-Z(yi) son independientes cuando los intervalos (yi,xi) son disjuntos o tienen un punto en comn. Probar que una F.A.I. cuyos incrementos son gaussianos es a incrementos independientes si y solo si su variograma es lineal (la F.A.I. constituye entonces un proceso de Wiener-Lvy, o proceso del movimiento browniano). [Solucin: un clculo muy simple muestra que los incrementos son sin correlacin si y solo si el variograma es lineal).

114

Ejercicio 4 (covarianza exponencial, caso continuo) a/ Sea, en la recta, una F.A. Y(x) de esperanza nula y sea C(h)=e-a|h| su covarianza. Se conoce la realizacin de Y(x) en el intervalo (-R,R). Krigear el punto x0=R+h (h>0). [Solucin: si Y(x) es gaussiana, se deduce de la propiedad markoviana del ejercicio 3 que el estimador ptimo es e-a|h|Y(R) con la varianza 1-e-2a|h|. Esta propiedad, ligada exclusivamente a la covarianza permanece vlida si Y(x) no es gaussiana. Se verificar directamente que la medida K=e-a|h|R (R = Dirac localizada en el punto R)es efectivamente la solucin de (36) para todo yR, y se calcular directamente 2K]. b/ Sea en la recta una F.A. de esperanza m desconocida y sea C(h)=e-a|h| su covarianza centrada. Probar que el estimador ptimo m* de m (cuando la realizacin es conocida en (-R,R)) verifica:

m* =

1 Z R + Z R ar Z+ 1 + ar 1 + ar 2 1 1 + ar

(Z =

1 Z ( x)dx) 2 R R

D 2 (m* ) =

[Solucin: establecer las relaciones:

1 ( R + R )e a| x y| = e ar cosh(ay ) 2
y:

a| x y |

dx =

2 2 ar e cosh(ay ) a a

-R y R

deducir que la medida:

0 =

1 0 1 + aR

es la solucin buscada, con el parmetro de Lagrange:

0 = D 2 (m* ) =

1 ] 1 + ar

c/ En las mismas condiciones que en b/, krigear el punto x0=R+h (h>0), aplicando el teorema de aditividad. [Solucin:

Z * = e a|h| Z R + (1 e a|h| )m* D 2 ( Z x0 Z * ) = 1 e 2 a|h| + (1 e a|h| ) 2 1 + aR

115

Ejercicio 5 (covarianza exponencial, caso discreto) a/ Sea, en la recta, Y(x) una F.A. de esperanza nula y de covarianza estacionaria C(h)=e-a|h|. Se conoce la realizacin en los n+1 puntos de abscisa 0, 1, 2, ..., n. Formar el krigeado puntual del punto x0=i+ (0<<1), (i<n). [Solucin: segn la propiedad markoviana, se debe buscar una solucin de la forma YK=Yi+Yi+1. Probar que el sistema (3-4) se verifica para j=0 (ji, ji+1):

i = =

senh(1 )a senh(a )

i +1 = ' =

senh( a ) ] senh(a)

b/ Sea, en las mismas condiciones, Z(x) una F.A. de covarianza C(h)=e-a|h| y con esperanza m desconocida. Probar que el estimador ptimo m* es de la forma:

m* = (1 b) Z + b
con:

Z0 + Zn 2

(Z =

1 n Zi ) n + 1 i =0

b=

2 1 + ea 2 * , = D ( m ) = 0 (n + 1)e a (n 1) (n + 1)e a (n 1)

[Solucin: establecer primero la relacin:

e
j =0

a|i j |

e a + 1 e ai + e ( n 1) a = a e 1 ea 1

buscar, para el sistema (3-13), una solucin de la forma:

= A + B( 0 + n )
e identificar]. c/ En las mismas condiciones, krigear un punto x0 comprendido entre i e i+1 cuando m es desconocido. [Solucin: aplicar la relacin de aditividad). Ejercicio 6 (variograma lineal) a/ Sea, en la recta, una F.A.I. sin deriva y (h)=|h| su variograma. Se conoce la realizacin en x=R y en un nmero finito o infinito de puntos <R. Probar que el krigeado de x0=R+h (h>0) es Z(R) mismo, con 2K=2|h|. [Solucin: esta solucin la sugiere la propiedad markoviana de |h|. Verificar que la medida (dx)=R es bien la solucin del sistema (3-18), para todo yR]. b/ Se supone ahora que la realizacin es conocida en dos puntos x1 y x2 y en un nmero cualquiera de puntos exteriores al intervalo (x1,x2). Probar que el krigeado de un punto x0 comprendido entre x1 y x2 es:

116

Y * ( x0 ) =
2 =2 K

x2 x0 x x Y ( x1 ) + 0 1 Y ( x2 ) x2 x1 x2 x1

x1 x0 x2

( x2 x0 )( x0 x1 ) x2 x1

[Solucin: la propiedad markoviana sugiere que la solucin es del tipo Y1+(1-)Y2. Mostrar que con =(x2-x0)/(x2-x1) (interpolacin lineal entre los dos puntos ms cercanos conocidos) la medida:

= x + (1 ) x
1

verifica:

(dx) | x y |=|x

y|

y x1 o y x

para y<x1 o yx2. El parmetro de Lagrange es nulo, y el clculo de 2K es inmediato]. Ejercicio 7 (variograma lineal con efecto de pepita) Se conoce, en el segmento (-R,R), una realizacin de una F.A.I. cuyo variograma comporta un trmino lineal y un trmino de pepita. Como estamos en el caso continuo, se tomar =|h|- (efecto de pepita representado por una medida de Dirac). Krigear el punto x0=R+h (h>0): para ello: a/ Establecer las relaciones:

R R

| x y | cosh(ax)dx =

2R 2 senh(aR) + 2 cosh(ay ) a a 2R 2 cosh(aR ) + 2 senh(ay ) a a

| x y | senh(ax)dx =

con:

a=
Deducir que:

2 C

R R

(| x y | dx C (dx) ) cosh(ax) =

2R senh( aR) y a 2R cosh(aR) y a

(| x y | dx C (dx) ) senh(ax) =

b/ Mostrar que la funcin:

117

( x) =
verifica el sistema:
R

asenh(ax) acosh(ax) + 2cosh( aR) 2 senh( aR)

R R

( x)dx = 1 (| x y | dx C (dx)) ( x) = y + R
R

Deducir que el estimador ptimo es:

Z * ( x0 ) =

( x)Z ( x)dx
1 a

con el parmetro de Lagrange =x0-R=h y la varianza:


2 K = 2h + cosh(aR)

[observar que la presencia de un efecto de pepita ha hecho desaparecer la propiedad de Markov. La densidad (x) atribuye pesos positivos a todas las muestras. Se dice que el efecto de pepita levanta las pantallas]. Ejercicio 8 (exponencial de Gauss) Cuando la covarianza es muy regular, puede suceder que la solucin del krigeado no sea representable por una medida. Por ejemplo, consideremos sobre la recta una F.A. estacionaria la cual admite la covarianza C(h)=exp(-h2/2) y una esperanza nula. Se desea krigear el punto x0=R+h, conociendo la realizacin en (-R,R). Si el estimador ptimo tiene una representacin del tipo:

YK =
entonces la medida verifica:

(dx)Y ( x)
( x0 y ) 2 2

(dx)e

( x y )2 2

=e

y ( R, R)

Probar que no puede existir una medida que verifique esta relacin. [Solucin: la medida:

(dx) = e
debera verificar la ecuacin:

x2 2

(dx)

118

xy

(dx) = e

2 x0 + x0 y 2

Segn las propiedades de la transformada de Laplace, la nica medida que verifica esta ecuacin es:

e x0 / 2 x0
pero su soporte no est en (-R,R)]. Ejercicio 9 (krigeado en las grandes mallas) (ver ejercicios 12 a 14 del captulo 2) Se desea krigear una superficie S con la ayuda de n+k muestras, de las cuales k fueron tomadas al interior de S y n al exterior. Se supone que las distancias entre dos muestras distintas y la distancia entre cada muestra a la frontera de S son todas mayores que el alcance. Las notaciones son las mismas que la de los ejercicios 12 a 14 del captulo 2. a/ Escribir las ecuaciones del krigeado. Probar que estas se reducen a:

C i = Si +

=1
y Si=A1/S para las muestras

con Si=0 para interiores.

las

muestras

exteriores

Deducir que las k muestras interiores tienen el mismo peso y las n muestras exteriores el mismo peso , con:

A 1 n + 1 n + k n + k CS 1 k A '= 1 n + k n + k CS

b/ Calcular la varianza de este krigeado. [Solucin:


2 = C F (S ) K

2k A1 nk A1 1 C + n+k S n+k S C n+k

en particular, si S es grande, se tiene la frmula aproximada:


2 K

C n k A1 + ] n+k n+k S

c/ Comparar estos resultados con la frmula (3-1) del prrafo 3-1, y probar que, en el caso de las grandes mallas, el estimador ptimo es 119

idntico al que KRIGE obtuvo originalmente por su mtodo de regresin lineal. [Solucin: el coeficiente de regresin es:
2 y C F ( S ) k A1 = = 2= x C/k C S

Cuando m es conocido, el estimador ptimo es idntico al que proporciona la regresin lineal:

1 ZK = m + Xi m k i
siendo Xi las leyes de las muestras interiores. Segn (3-4-3) se debe tomar:
* 1 Z * = m* + X i m k i

con:

m* =

1 X i + Yj n+k i j

(Yj son las muestras exteriores). Se encuentra as y . d/ Calcular la varianza a partir del teorema de aditividad: [Solucin: si m es conocido, la varianza es:
2 y (1 2 )

Probar que:

2 = =
Se deducir entonces que:

k A1 C S

2 2 K =y (1 ) + (1 ) 2 D 2 (m* ) = (1 )

A1 C + (1 ) 2 S n+k

y se verificar que este resultado es idntico al del prrafo b/].

120

CAPITULO 4 EL KRIGEADO UNIVERSAL 4-1 INTRODUCCION 4-1-1 Crtica de los mtodos de mnimos cuadrados. Nos proponemos, en lo que sigue, de formular, en trminos de funciones aleatorias no estacionarias el problema de la estimacin de las derivas12 (o tendencias), y demostrar que el problema admite una solucin ptima, bastante diferente de las soluciones propuestas por los mtodos llamados trend surface analysis: estos ltimos, que consisten, en general, en ajustar un polinomio por el mtodo de los mnimos cuadrados, proporcionan una sensacin de incomodidad: en efecto, se tiene la impresin de violentar la naturaleza, imponindole a la fuerza una expresin polinmica, la cual no tiene ninguna razn a priori de presentar una mnima relacin con la estructura real del fenmeno que se quiere representar. De una manera ms precisa, haremos tres reproches principales a estos mtodos de mnimos cuadrados: En primer lugar, estos mtodos implican a menudo una confusin de tipo operativo y conceptual. Pocos autores se dan el trabajo de definir la significacin de este trend que ellos estiman por un mtodo de mnimos cuadrados. Se tiene a menudo la impresin que este famoso trend no es ms ni menos el resultado numrico al cual conduce un modo operativo es decir, quizs, un puro y simple artefacto Analizando, parece que el trmino poco claro de trend se refiere, uno despus de otro, y, a veces simultneamente en un mismo contexto, a tres nociones bien distintas, por lo menos: si Z(x) es la variable regionalizada de inters, y P(x) el polinomio ajustado por mnimos cuadrados a partir de valores experimentales en los puntos x1, x2, ..., se puede atribuir al valor en x de P(x) una de las significaciones incompatibles siguientes: a/ P(x) es (una estimacin de) la esperanza a priori sentido a/ es el que siempre daremos al trmino deriva. E(Z(x)): este

b/ P(x) es una estimacin del verdadero valor (desconocido) Z(x) tomado por la variable regionalizada en el punto x: este sentido b/ que se asocia a nuestro trmino krigeado puntual. Ms precisamente, el krigeado puntual ser el mejor estimador lineal de Z(x) construido a partir de los datos disponibles Z(x1), Z(x2), ... c/ Finalmente, se atribuye a veces a P(x) el sentido de una media mvil. P(x0) sera entonces (una estimacin) del valor medio de Z(x) en una zona ms o menos grande (a precisar) la cual contiene el punto x0. En nuestra terminologa, el krigeado designar el mejor estimador lineal de esta media mvil. Estas distinciones tienen una gran importancia terica y prctica. Es esencial definir con precisin el objetivo que se desea (a/ b/ o c/). En cartografa submarina, son los valores verdaderos Z(x) que hay que Para evitar cualquier antropomorfismo, utilizaremos siempre el trmino deriva en lugar de tendencia, o trend.
2

121

estimar y cartografiar (caso b/). En una explotacin minera, el inters est en la ley media de un panel de tamao dado (caso c/). Finalmente, en ciertos estudios de carcter ms fundamental, se busca reconstituir los mecanismos generales que han dado nacimiento al fenmeno que se estudia, es en la deriva misma (caso a/) en la cual se espera encontrar un reflejo de la estructura de estos mecanismos. En geofsica, por ejemplo, la nocin de anomala regional, corresponde a nuestra nocin de deriva. Llegamos as al segundo cuestionamiento que se puede formular a los mtodos de mnimos cuadrados. No es posible que el mismo polinomio resuelva a la vez los tres problemas a/ b/ y c/. Veremos que P(x) constituye, en efecto, una solucin del problema a/. Pero, en general, no es la mejor solucin posible: estos mtodos llave maestra que utilizan siempre los mismos polinomios, cualesquiera que sean las caractersticas estructurales del fenmeno que se estudia, tienen poca chance, en general, de conducir a un ptimo. Finalmente, en tercer lugar, los mtodos de mnimos cuadrados no permiten de ninguna manera evaluar el error que se comete al estimar la deriva con la ayuda de un polinomio P(x). La varianza de los residuos, contrariamente a lo que se cree a veces, no es una varianza de estimacin: la varianza de las desviaciones Z(xi)-P(xi) en los puntos xi en los cuales la realidad es conocida, es, por construccin, sistemticamente ms dbil (en realidad bastante ms dbil) que la varianza de la desviacin Z(x)-P(x) en un punto x diferente de los xi. Luego, la varianza de los residuos no es la varianza de estimacin de Z(x) (problema b/). Tampoco es la varianza de estimacin de la deriva (problema a/), porque esta vez no hay ninguna relacin conceptual entre la desviacin Z(xi)-P(xi) y la calidad de P(xi) considerado como un estimador de la esperanza a priori E[Z(xi)]. Si embargo, si los mtodos de mnimos cuadrados se revelaban como insatisfactorios, el objetivo que perseguan, y que no alcanzaban o lo alcanzaban mal, corresponde a un problema muy real y muy importante. En la realidad existen fenmenos que absolutamente no se pueden asimilar a (realizaciones de) funciones aleatorias estacionarias. Retomando el ejemplo de la cartografa submarina, es cierto que la profundidad va en aumento cuando nos alejamos de las costas. Ensayaremos formular y resolver, en el marco de la teora de las funciones aleatorias no estacionarias, los problemas importantes que crean las derivas. 4-1-2 Posicin del problema e hiptesis generales. La variable regionalizada que se estudia ser interpretada como una realizacin de una funcin aleatoria Z(x) en general no estacionaria. En un primer grupo de hiptesis, supondremos que Z(x) admite momentos de orden 1 y 2: (I)

E[ Z ( x)] = m( x) E[ Z ( x) Z ( y )] = m( x)m( y ) + C ( x, y )

Diremos que la funcin m(x) es deriva de la F.A. Z(x). Nos parece, en efecto, que la nica definicin conceptualmente clara de la nocin de deriva es bien esta: momento de orden 1 de una F.A. no estacionaria. La

122

funcin C(x,y) que depende por separado de los puntos x e y es la covarianza (no estacionaria) habitual. En muchos hiptesis hiptesis aleatoria casos (como lo muestra la prctica de la Geoestadstica) estas (I) sern restrictivas, y debern ser reemplazadas por las (I) siguientes que expresan que los incrementos de la funcin Z(x) (y no Z(x) misma) admiten momentos de orden 1 y 2:

(I)

E[ Z ( x) Z ( y )] = m( x) m( y ) 1 2 D [ Z ( x) Z ( y )] = ( x, y ) 2

En este caso la deriva queda determinada salvo una constante, porque, en general, la esperanza E[Z(x)] no existe: el punto de vista de las hiptesis (I) consiste entonces en estudiar la funcin aleatoria Z(x) salvo una constante aditiva. La funcin (x,y) es el variograma habitual. (En el espacio de una dimensin, procesos tan usuales como el movimiento browniano o los procesos de Poisson proporcionan ejemplos simples de F.A. sin esperanza, los cuales verifican las hiptesis (I) pero no las hiptesis (I). Vamos a resolver los dos problemas siguientes (relacionados, pero diferentes): conociendo los valores numricos tomados sobre un conjunto S (el conjunto de los puntos donde se dispone de datos experimentales) por una realizacin z(x) de la F.A. Z(x), debemos: 1/ Estimar la funcin m(x) (en S y al exterior de S): es el problema a/ anterior. 2/ estimar z(x) en un punto x S (problema b/), o, ms generalmente, estimar una media mvil (dx) z ( x) en que es una medida dada cuyo soporte es disjunto de S (problema c/). Adems, deberemos ser capaces de representar por varianzas de estimacin los errores cometidos en estas operaciones, y esforzarnos de elegir nuestros estimadores de manera de minimizar (si se puede) esta varianza de estimacin. Respecto de este ltimo punto, indiquemos que nos limitaremos a investigar el mejor estimador lineal de m(x) o de (dx)z(x) que se pueda formar a partir de los valores numricos z(y), yS: los estimadores no lineales son mucho ms complicados para ser operativos, y, por otra parte, sus propiedades no solo estn ligadas a los momentos de orden 1 y 2, que figuran en las hiptesis (I) o (I), sino que hacen intervenir tambin la totalidad de la ley espacial de la F.A. Z(x). (En el caso en que esta ley espacial es gaussiana, se sabe, por otra parte, que el mejor estimador lineal posible coincide con el mejor estimador lineal). Formulado el problema en toda su generalidad (las funciones m(x) y C(x,y) son completamente desconocidas), nuestro problema es manifiestamente insoluble, y, por otra parte, desprovisto de sentido. Pero en los problemas concretos, la nocin de deriva solo presenta una significacin real en el caso en que la funcin m(x) vara de una manera continua y regular respecto de la escala de trabajo (y de los datos disponibles experimentalmente): si la funcin m(x) fuera irregular y catica a esta escala, se debera considerar que m(x) misma como una realizacin de una

123

nueva funcin aleatoria. Del punto de vista fsico (y no matemtico) la nocin de deriva est as manifiestamente ligada a la de escala. Si se estudian las cotas topogrficas, a la escala de una decena de metros, la nocin de montaa se traduce por una deriva; a la escala de una decena de kilmetros, solo le corresponde una funcin aleatoria, y la deriva, a esta escala, expresar ms bien la nocin de cadena de montaas (ver tambin la nocin de estructuras anidadas, [7]). Pero esta condicin de regularidad impuesta a priori a la funcin m(x), para que la nocin de deriva tenga un contenido fsico real, implica tambin que una estimacin de m(x) debe ser siempre ms o menos posible localmente. Esta condicin expresa en efecto que en una cierta vecindad V de un punto x0 dado la funcin m(x) debe ser aproximada con una excelente precisin por una funcin de la forma: (II)

m( x) f ( x) = aA f A ( x) =aA f A ( x)
A =0

En que los f A ( x) son funciones conocidas, elegidas una vez para siempre (por ejemplo polinomios) y los aA coeficientes desconocidos: respecto de la vecindad V de x0 en la cual la aproximacin (II) es aceptable, sin ser demasiado grande, debe si el problema tiene sentido contener un nmero suficiente de puntos experimentales para que sea posible estimar los k+1 coeficientes a1, a2, ..., ak. Queda el problema de la funcin C(x,y), o (x,y) sobre la cual no se sabe nada, tampoco a priori. Pero una vez ms, y por las mismas razones, se puede suponer que C o son localmente asimilables a funciones de tipo conocido y que se deforman lentamente en el espacio, a la escala a la cual se trabaja. El caso ms favorable ser aquel de una funcin (o C) de la forma:

( x, y ) = r
(variograma lineal): verdadera covarianza x=y hasta distancias circunstancia es tan

(r =| x - y |)

Basta, para esto, que el verdadero variograma o la tenga un comportamiento lineal en una vecindad de comparables a las dimensiones de la vecindad V: esta comn que a veces no se cree.

Sin embargo, en general, adems del factor , ser conveniente introducir uno o ms parmetros suplementarios. Por ejemplo, se tomar:

( x, y ) = r
o tambin:

(0 < < 2)

( x, y ) = e ar
En el primer caso, el parmetro est en relacin con el grado de continuidad de la variable regionalizada. En el segundo (covarianza exponencial), el parmetro a, o ms bien su inverso, proporciona una medida del alcance del fenmeno (distancia a partir de la cual las correlaciones se terminan). 124

Naturalmente, el control experimental de una hiptesis de este tipo, y de la estimacin de los parmetros correspondientes ( y sobretodo o a) implicar problemas bastante delicados de estadstica matemtica: a pesar de su importancia crucial para las aplicaciones, no ser posible tratar aqu completamente estos problemas, y apenas los evocaremos. En resumen, el problema que debemos tratar se encuentra esquematizado como sigue: se tiene una F.A. Z(x) la cual verifica las hiptesis (I) o (I). En una vecindad V de x0, la deriva m(x) es de la forma (II) con coeficientes aA desconocidos. Se conoce a priori (eventualmente salvo un factor) la covarianza C(x,y) o el variograma (x,y). Finalmente, se conocen los valores numricos de (la realizacin de) Z(x) para los puntos que pertenecen a un conjunto S V . Se quiere encontrar los mejores estimadores lineales: 1/ de los coeficientes aA desconocidos de la deriva. 2/ del valor numrico de (la realizacin de) Z(x) en x0 S (pero x0 V ) o de

(dx)Z ( x)

para una medida cuyo soporte es disjunto de S.

3/ deseamos adems, poder controlar la validez de la hiptesis que hemos realizado al elegir una expresin matemtica particular para la covarianza o el variograma, y estimar los parmetros de esta expresin. Para simplificar la exposicin, no formularemos la teora en trminos de espacios de Hilbert. Luego, habr que referirse a [6] para ciertas demostraciones (sobre todo para establecer los teoremas de existencia y de unicidad). Utilizaremos las notaciones del prrafo 3-2. No habrn dificultades reales, salvo el caso en que el conjunto S de datos experimentales es infinito: la existencia (en el sentido de los espacios de Hilbert) de nuestros estimadores ptimos esta siempre asegurada, pero no resulta necesariamente que los estimadores admitan representaciones del tipo (dx) Z ( x) con medidas con soporte en S. Escribiremos, en general, en adelante, las ecuaciones integrales relativas al caso continuo sin repetir explcitamente esta reserva esencial, que el lector debe siempre guardar presente en su espritu.

125

BIBLIOGRAFIA. [1] CARLIER, A. Contribution aux mthodes destimation des gisements duranium. Tesis. Fontenay aux Roses, 1964 Cours de Gostatistique. Ecole des Mines de Nancy, 1965 (no publicado). Trait de Gostatistique Applique. Tomo 1 (1962), Tomo 2 (1963). Ediciones Technip, Pars. Les Variables Rgionalises et leur estimation (Tesis). Masson, Pars, 1965. Osnovy Prikladno Geostatistiki. Ediciones MIR, Mosc, 1968. Le Krigeage Universel. Les Cahiers du Centre de Morphologie Mathmatique, Fascicule 1, Fontainebleau, 1968. Echantillonage et estimation locale des phnomnes de transition minires. Tesis. Nancy, 1967. Recherche doptima dans la reconnaissance et la mise en exploitation des gisements miniers. Annales des Mines, Mayo y Junio 1963.

[2] FORMERY, Ph. [3] MATHERON, G.

[4] MATHERON, G.

[5] MATHERON, G. [6] MATHERON, G.

[7] SERRA, J.

[8] FORMERY, Ph. y Matheron, G.

126

También podría gustarte