Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Georges Matheron
Estimar
y Elegir
____________________
Un Ensayo acerca
de la Prctica de las Probabilidades
Traducido al espaol por
Marco Antonio Alfaro Sironvalle
2008
TABLA DE MATERIAS
2
PREFACIO DEL TRADUCTOR.
Al fin he terminado la traduccin de la ltima obra del Maestro Georges Matheron, Estimer
et Choisir publicada por la Escuela de Minas de Pars en 1978. Existe una versin en ingls,
de la editorial Springer, traducido por A. M. Hasofer, en 1989.
Confieso que esta traduccin al espaol ha sido una tarea dura y difcil, dado el gran nivel
filosfico e intelectual de la obra. Recurro entonces a la buena voluntad de los lectores
De manera de respetar al mximo posible la versin original, he tenido que usar palabras que
no pertenecen a la lengua espaola tales como anticipatoria, decisible, chance, etc
La frase aprs le coup, aparece como 70 veces el texto, y se refiere a despus de haber
tirado los dados, la he traducido por despus de la tirada (en la versin inglesa aparece
after the fact).
Buena lectura y comprensin de la prctica de las probabilidades a los fenmenos naturales
nicos y a la filosofa de la geoestadstica !
3
PRIMERA PARTE
A LA BUSQUEDA DE LA OBJETIVIDAD.
4
INTRODUCCION
Este libro no es desinteresado. Ms que una tesis, defiendo una prctica, un conjunto de
modelos, mtodos y vueltas de mano, a veces poco ortodoxas, elaborados1 , desde hace
aos, para describir, estudiar, estimar fenmenos muy variados: puede tratarse de clulas
cancergenas o de bosques; de la estructura de una roca o la de una aleacin metlica; de un
yacimiento de petrleo, o de una capa de una autopista; de contaminacin o de meteorologa;
de cartografa submarina, o de prospeccin geofsica etc.... Esta metodologa y esta prctica
tienen su origen en un problema totalmente terrenal: el problema de la estimacin de los
yacimientos mineros. Este dominio bien particular ha servido de banco de ensayo, y ha
proporcionado verificaciones muy numerosas y muy decisivas.
El problema de las materias primas est hoy, as parece, en el corazn de las preocupaciones
de cada uno de nosotros. Sin embargo, exceptuando un pequeo nmero de especialistas de la
industria minera, pocas personas soportan escuchar hasta el final una exposicin seria acerca
de la nocin de reservas recuperables de un yacimiento minero. Es an ms difcil mostrarles
las dificultades, mltiples y realmente sutiles, que es necesario elucidar una a una, y resolver
efectivamente, antes de poder proponer una estimacin simplemente sensata de estas reservas.
La disciplina nueva que ha sido necesaria forjar para este propsito la Geoestadstica minera
que ya ha pasado sus pruebas, sorprendera quizs, por su complejidad, a los estadsticos o
los probabilistas que tendran el coraje de tomar conocimiento de ella. Pero el aspecto tcnico
de estos problemas desanimar, lo s, al lector de mejor voluntad. En adelante, solo hablar,
por alusiones discretas acerca de estos problemas.
Que conste que, los problemas que nos interesan presentan dos caractersticas importantes: de
una parte, se desplazan en el espacio fsico, en el cual vivimos, y se manifiestan, como lo
decimos nosotros, en una forma regionalizada. Por otra parte, y lo ms a menudo, se trata de
fenmenos nicos. Habiendo tratado y resuelto, con un xito real, confirmado por la prctica,
un gran nmero de estos casos particulares, sospechamos, es cierto, que estos problemas no
eran quizs tan nicos como nos pareca al comienzo. La metodologa que nos ha permitido
resolverlos, habiendo pasado sus pruebas, refleja sin ninguna duda una cierta forma de
objetividad, que llamaremos objetividad externa : es, simplemente, la sancin de la prctica.
Pero estos objetos siguen siendo nicos, como individuos tales que no se encontrar nunca en
otra parte idnticos a ellos mismos. No existen dos yacimientos, ni dos bosques, ni dos
estrellas idnticas. En que medida una estimacin, o un modelo probabilstica respecto de
este yacimiento, de este bosque (y no un yacimiento o un bosque en general) posee una
significacin objetiva? Es a la investigacin de los criterios de esta objetividad interna que
est consagrado este ensayo.
No puede entonces, de ninguna manera, eludir la famosa pregunta, tan mal formulada: La
probabilidad es subjetiva u objetiva?. En realidad no hay probabilidad en s. Solo hay
modelos probabilsticas. O si se prefiere, lo aleatorio no es de ninguna manera una
propiedad unvocamente definida, ni an definible, del fenmeno mismo. Sino, solamente,
una caracterstica del, o de los, modelos que nosotros elegimos para describir, interpretar, y
1
5
resolver tal o tal problema que nosotros nos proponemos. Y, siguiendo la naturaleza de estos
problemas, podemos bien adoptar, sucesivamente, modelos diferentes, atribuyendo, segn el
contexto, probabilidades diferentes a un suceso dado cuyo enunciado, aparentemente, sigue
siendo el mismo. El nico problema real es saber si un modelo dado, en un contexto dado,
posee o no, una significacin objetiva y, si no es as, hacer un orden: Quiero decir, entre los
conceptos, enunciados, parmetros etc... que figuran en el modelo, distinguir los que poseen
en (lo que llamamos) la realidad una contraparte objetiva, observable, medidle, etc... y los
otros: estos ltimos, que llamar convencionales (en vez de subjetivos) podrn jugar un papel
heurstico til en la elaboracin y la implementacin del modelo. Pero debern desaparecer de
la formulacin ltima de nuestras conclusiones y de nuestros resultados. Porque, en la medida
misma en que los problemas que buscamos resolver son problemas reales, las soluciones que
proponemos deben, ellas tambin, con el riesgo de revelarse ilusorias, respetar el principio de
realidad.
No se trata, digmoslo bien, de adoptar alguna posicin conciliadora entre estos dos
extremos que representan las tesis objetivistas y subjetivistas. Es necesario cortar por lo
sano. De los bayesianos, retengo mucho: Su crtica feroz de los postulados implcitos de los
objetivistas, postulados que, en muchos casos, no pueden ser dichos ni verdaderos ni falsos,
sino solamente sin sentido; o bien an el papel fundamental que ellos atribuyen, con razn, a
lo que ellos llaman la informacin a priori, es decir, la informacin no numrica o
cualitativa, de naturaleza estructural, que nos dice, en suma, muy simplemente, de qu se
trata: delante de una misma sucesin de 0 y de 1, no elegiremos el mismo modelo segn se
trate de resultados de un juego de cara o cruz, de una alternancia de das de lluvia y de buen
tiempo, o de la escritura binaria de un nmero trascendente.
Pero no concluyo de ninguna manera, que nuestros modelos probabilsticos deben ser
abandonados, sin recurso, al arbitrario de la subjetividad individual. Yo propongo, al
contrario, en primer lugar de hacer un orden, como ya lo dije, luego, sobretodo, de ponernos
en la escuela de los fsicos, y de proceder a la reconstruccin operatoria de los conceptos de
nuestro modelo, o al menos de aquellos que nuestra crtica inicial habr considerado como
aptos para transportar una informacin objetiva.
Esta posicin metodolgica se refleja en la terminologa que yo adopto. Los estadsticos
ortodoxos habran dicho: estimar y predecir. Los bayesianos, o subjetivistas: evaluar y prever.
Yo preferir: estimar y elegir. Esto merece un comentario. Yo utilizo el verbo estimar cada
vez que se trate de evaluar una magnitud que no conocemos, pero que existe
independientemente de nosotros y del estado de nuestra informacin: la estimacin, entonces,
se refiere a una magnitud fsica, objetiva, e importa poco que esta magnitud sea asociada, en
nuestro modelo, a una variable aleatoria o a un parmetro. De hecho, una misma realidad
digamos, la ley media de un yacimiento minero, ser, segn el caso, tratada en el modelo, sea
como un parmetro (objetivo), sea como una variable aleatoria. Pero en un caso como en el
otro, yo hablar de la estimacin de esta ley media (y no de su prediccin o de su previsin).
Utilizar el verbo elegir como en un sentido neutro (sin prejuzgar del sentido, objetivo o
convencional, que conviene atribuir al parmetro as elegido) como tambin en un sentido
limitativo, cuando se tratar, por razones de comodidad, de atribuir un valor numrico a un
parmetro convencional (no objetivo), valor que puede ser elegido de manera ms o menos
arbitraria sin comprometer la objetividad de la gestin tomada en su conjunto. En suma, se
estiman magnitudes (objetivas), se eligen los mtodos, los modelos, o los parmetros
convencionales, y se convienen los criterios. Para los bayesianos, no hay estimacin, sino
6
solamente elecciones. Ellos evalan probabilidades (subjetivas) y obtienen previsiones
(igualmente subjetivas) respecto de los sucesos o las magnitudes desconocidas. Los
ortodoxos, u objetivistas, al contrario, reservan el trmino estimacin a la eleccin de los
parmetros de sus modelos, sin preguntarse de antemano, si estos parmetros poseen o no, una
contraparte objetiva en la realidad. Al contrario, ellos predicen los valores (futuros o
desconocidos) de variables aleatorias, an si ellas no representan realidades fsicas efectivas.
Su terminologa transporta una suerte de platonismo clandestino: el modelo y sus parmetros
vienen del cielo de las ideas, y sacan de este noble origen una realidad substancial, un status
ontolgico bien superior a aquel que podran reivindicar sus plidas y terrestres imitaciones
(las variables del modelo, es decir las magnitudes fsicas de la realidad). Esta es la presuncin
substancial que denuncian, con razn, los bayesianos. Para nosotros, solamente, despus de un
examen crtico efectuado en cada caso particular, daremos este status objetivo a tal o tal
parmetro y, en consecuencia, hablaremos de su estimacin.
Lo anterior dicta el plan de este ensayo. En la primera parte, examinar los criterios, y las
limitaciones, de la objetividad externa, o metodolgica, que es simplemente la sancin (a la
larga) de la prctica, y la objetividad interna, la cual se funda, definitivamente, en las
caractersticas fsicas, concretas, del objeto individual. En este estadio, los ejemplos que yo
doy estn tomados de un fondo cultural comn: La lluvia y el buen tiempo, el juego de cara o
cruz, las molculas de protenas. En la segunda parte, se tratan ms especficamente los
fenmenos regionalizados en el espacio, y los modelos topo-probabilsticos que los
representan. El objetivo es entonces desarrollar criterios de objetividad interna: Cmo elegir
un modelo, coma hacer la separacin entre lo que es objetivo y lo que no lo es, cmo localizar
en esta jerarqua el punto preciso en el cual nosotros introducimos, en Proxy, esta hiptesis
anticipativa, llena de informacin objetiva no contenida en los datos, que nos permite resolver
los problemas que nos hemos propuesto, pero que no nos garantiza nunca contra un riesgo de
error radical ? Estas son las preguntas que ensayar de responder: En la tercera parte, tratar,
pero en casos particulares solamente, de reconstruir en trminos operatorios, a la manera de
los fsicos, algunos de los conceptos subyacentes de nuestros modelos. Esta reconstruccin
nos permitir precisar la naturaleza de la famosa hiptesis anticipada.: Se tratar simplemente,
de una aproximacin banal, pero adoptada, como una hiptesis, antes que su validez pueda ser
realmente controlada. De aqu el riesgo, siempre presente, del error radical. De la misma
manera, la inferencia estadstica se despojar, en gran parte, de su misterio: an en el caso
de estudiar un parmetro convencional, se trata en suma de un falso problema. En el caso
contrario, cuando ella apunta una realidad fsica, se trata simplemente del clculo numrico
aproximado de una integral en el espacio.
La gran vctima de este examen ser quizs la esperanza condicional, nocin matemtica muy
profunda, la cual se revelar como no apta, en nuestro contexto, para recibir el status de
concepto fsico. Como consuelo propondr un sustituto ms simple, el estimador disyuntivo, y
yo dir algunas palabras tambin del uso, posible y legtimo mediante ciertas condiciones, de
modelos puramente heursticos.
A pesar que los modelos probabilsticos permiten abordar problemas muy variados,
cuantitativos y cualitativos2, es por razones de simplicidad, que centrar la exposicin sobre la
2
7
estimacin. Las dificultades que genera el problema de la estimacin no son de naturaleza
matemtica, o al menos principalmente. Se les encuentra en los dos niveles extremos: en la
etapa inicial de la conceptualizacin, es decir de la eleccin del modelo, y en la etapa
terminal, de la implementacin prctica.
En la etapa inicial, vemos surgir preguntas inevitables respecto del sentido, la objetividad y la
validez de todas las etapas ulteriores. Siendo dado un fenmeno nico, perfectamente
determinado an si queda largamente desconocido, es posible, y esto presenta an un
sentido, conceptualizarlo en la forma de un modelo probabilstico, es decir, en suma, de
representar este fenmeno como uno, cualquiera, tirado al azar en una familia de fenmenos
virtuales considerados como posibles? La eleccin de este modelo tiene significacin
objetiva, es decir, es susceptible de prestarse a tal o tal forma de control experimental, o debe
ser abandonado sin recurso al arbitrario de la subjetividad individual?
Finalmente, si suponemos que estos controles experimentales son posibles, conducen a
resultados positivos que permitan concluir sin ambigedad, la validez objetiva o al menos
parcial del conjunto inicial?
En la etapa terminal, es decir al nivel de las aplicaciones prcticas, se ven surgir preguntas
anlogas, pero en una forma particular. A partir de la informacin que disponemos para
estimar, siempre fragmentaria, a menudo de calidad mediocre, por ejemplo en un yacimiento
minero, podemos especificar un modelo probabilstico adecuado a estos datos (luego, en
particular, podemos evaluar de manera razonable los valores numricos de los parmetros de
los cuales depende el modelo) y, suponiendo que esto sea posible, en qu medida podemos
enseguida extrapolar de lo conocido a lo desconocido, es decir, deducir del modelo,
contrastando con los datos conocidos, conclusiones vlidas para las partes no informadas del
yacimiento? A esta pregunta (bastante kantiana) Cmo es posible la estimacin? parece
bien que solo se puede aportar una respuesta que aceptando, de una forma u otra, una
hiptesis de homogeneidad estadstica, al menos local, en la cual la estacionaridad clsica
constituye un extremo fuerte, exageradamente severa: El fenmeno debera, en suma,
comportarse, donde no se le conoce, de una manera razonablemente anloga a lo que se puede
observar sobre los datos disponibles en la vecindad. Pero, se esta hiptesis es indispensable
para fundar la posibilidad de la estimacin, no resulta automticamente que esta se verifique
en todas partes. Es fcil dar contra ejemplos, en la figura siguiente, en que los puntos A, B, C,
..., J representan los datos disponibles, se puede ver un caso de este tipo: Nada permite prever
la anomala X y la estimacin no es posible (cualquiera que sea el mtodo): El error radical
es aqu, inevitable.
8
Una palabra an, para terminar esta introduccin un poco larga. No se encontrar en lo que
sigue ninguna concepcin del mundo, explcita o implcita, sino solamente consejos
metodolgicos para los que practican las probabilidades. Se puede, si se quiere distinguir el
motor y el cdigo. El elemento motor, o dialctico, est siempre presente implcitamente.
Es este elemento el que nos incita a progresar, a generar siempre nuevas diligencias, sin
quedarse nunca en reposo. Es l quien nos permite comprender todo el desarrollo anterior
en, una vasta sntesis retrospectiva pero, solamente, a destiempo, a la manera de la lechuza
de Minerva, que se levanta despus que se acuesta el sol. Por otra parte, podra bien haber
alguna ilusin de tipo antropomrfico. De todas maneras, este punto de vista conviene a un
historiador o a un filsofo de las ciencias, el cual busca reconstituir las etapas recorridas por el
espritu humano en su esfuerzo para elaborar y reconstituir lo real, pero no a un prctico: Este,
en el curso de su trabajo, tiene ms bien necesidad de un cdigo, o digamos de una plomada
para construir muros bien rectos. Esto no quiere decir que l adhiere a una filosofa cualquiera
de la plomada, sino solamente, que le gusta su oficio.
9
CAPITULO I
EL AZAR DE J. MONOD
O
COMO ATRAVESAR LOS LIMITES DE LA OBJETIVIDAD.
En una obra seria, escrita por un autor competente, sobre un tema cientfico, una expresin tal
como este fenmeno de debe al azar, constituye en principio, simplemente, una manera
rpida de hablar, significando en realidad todo sucede como si este fenmeno se debiera al
azar, o, en un lenguaje ms preciso: Para describir, o interpretar, o formalizar este
fenmeno, hasta ahora, solo los modelos probabilsticos han proporcionado buenos
resultados. Se trata entonces simplemente de constatar un hecho. Eventualmente, el autor
puede agregar: Y no me parece que esta situacin sea de naturaleza tal que se puede
modificar en un futuro previsible. Esta vez existe una toma de posicin personal, una
eleccin metodolgica, que abre posibilidades a la investigacin, pero cierra otras. Se
entiende bien que el autor, que conoce su sujeto debido a que lo ha practicado durante aos,
desea evitar a sus colegas caer en un impasse y ahorrarles un tiempo precioso. Hay un riesgo,
porque despus de todo, nada prueba que maana o en 10 aos otro investigador publicar
una teora determinstica que explique maravillosamente e integralmente el fenmeno en
cuestin, y nosotros quizs habremos perdido el carro por haber seguido el consejo implcito
de nuestro autor: Esto es un riesgo real, pero normal e inherente a la prctica del trabajo
cientfico porque de todas maneras estamos obligados de hacer elecciones metodolgicas.
Entendiendo en este sentido, puramente operatorio, el recurso al azar, es decir, en realidad, la
decisin de utilizar modelos probabilsticos, es perfectamente legtima, y no nos hace salir del
marco de las disciplinas positivas.
Pero a veces tambin, lo ms a menudo en las obras de divulgacin o de sntesis filosfica
como en los trabajos propiamente cientficos, se desliza otra interpretacin. Se sugiere, o
igualmente se afirma, que el Azar (a veces con letra mayscula), ejerce una accin decisiva
sobre el curso de los sucesos: No se trata ms de una eleccin metodolgica, el azar es
apostatado3 , provisto de atributos positivos, erigido en deus ex machina. En estas
condiciones, imputar el fenmeno al Azar o a la Providencia constituyen dos actitudes
equivalentes, ajenos a la metodologa cientfica.
EL AZAR, CONCEPTO METAFISICO.
El uso ilegtimo de conceptos cientficos ms all de los lmites al interior de los cuales tienen
un sentido operatorio: Esto es el pasaje subrepticio a la metafsica, peligro que acecha an los
ms grandes. Tomemos una obra famosa, escrita por un bilogo de alto renombre, El Azar y
la Necesidad de J. Monod. En la ltima pgina encontramos esta afirmacin angustiosa: La
antigua alianza se rompi: El hombre sabe finalmente que est solo en la inmensidad
indiferente del Universo de donde l emergi por azar. Aqu, la palabra est visiblemente
3
10
empleada en una concepcin metafsica (no operatoria). Por otra parte4, nosotros capturamos
en vivo el paso de un status a otro:
Diremos que estas alteraciones [es decir alteraciones genticas] son accidentales, que se
deben al azar 5. Y, porque constituyen la nica 6 fuente disponible de modificaciones del texto
gentico, depositario nico a su turno de estructuras hereditarias del organismo, se deduce
necesariamente que le azar es la nica fuente de cualquier novedad, de cualquier creacin en
la biosfera: El azar puro, el nico azar, libertad absoluta, pero ciega, est en la raz del
prodigioso edificio de la evolucin: esta nocin central es la nica concebible, como la nica
compatible con los hechos de observacin y de experiencia
La primera frase (las alteraciones genticas se deben al azar) puede an ser entendida en un
sentido cientfico (es decir operatorio), y significa en este caso: Los datos experimentales que
poseemos son compatibles con tal modelo probabilstico (que, por otra parte sera necesario
especificar), y nosotros no disponemos de algn modelo determinstico apto para tomar en
cuenta de manera ms satisfactoria. Al contrario, a partir de la segunda frase, el azar es crdito
de un papel activo, positivo: Constituira la nica fuente posible de cualquier novedad en la
biosfera. En qu manera el azar puede ser fuente de cualquier cosa? Para darse cuenta que
hay un pasaje subrepticio a la metafsica, basta, con reemplazar la palabra azar por su
definicin operatoria. Esto proporciona aproximadamente: El hecho que, hasta ahora, solo
los modelos probabilsticos se hayan revelado compatibles con lo que nosotros sabemos
acerca de las alteraciones genticas constituyen la nica fuente de cualquier creacin y de
cualquier novedad en la biosfera. El sentimiento de malestar que nosotros experimentamos
con la lectura de este extrao enunciado est ligado a la heterogeneidad radical del sujeto (una
constatacin metodolgica, relativa a nuestra modesta prctica cientfica y a su escala
limitada) y al papel activo y universal que se le atribuye (el de un demiurgo7 cosmolgico).
J. Monod tena, en parte, conciencia de esta temible confusin de estilos. A continuacin del
pasaje que acabamos de citar, agrega en efecto que es muy importante precisar el sentido
exacto en el cual la palabra azar puede y debe ser empleada, tratndose de mutaciones como
fuente de la evolucin. El introduce entonces una distincin entre dos tipos de incertidumbre:
una incertidumbre operacional y una incertidumbre esencial. Yo no estoy seguro que se
trata de una distincin pertinente. Porque, con el riesgo de salir del marco de las disciplinas
positivas, sera necesario definir un criterio operatorio que permita discriminar sin equvocos
los dos tipos de incertidumbre. Podemos dudar que esto sea posible. La base propiamente
emprica sobre la cual nosotros fundamos nuestro diagnstico de incertidumbre es, en efecto,
la misma en los dos casos: En el estado actual de nuestros conocimientos no podemos
predecir con certeza tal suceso o tal fenmeno: En el primer caso, admitimos que una mejora
considerable (concebible, al menos tericamente, an si no tenemos apenas la esperanza de
verlo realizado en la prctica) de nuestros conocimientos o de nuestros medios de
investigacin nos permitiran levantar esta incertidumbre. En el segundo caso, nosotros
decretamos categricamente que esto est excluido: Pero somos nosotros que lo decretamos,
no los datos empricos que poseemos, que siguen perfectamente mudos sobre este punto. Esto
4
5
6
7
Pgina 127.
Subrayado por m.
Subrayado por J. Monod
Nota del traductor: Dios creador en la filosofa platnica.
11
no es una constatacin, sino una interpretacin sobre ajustada, una extrapolacin al infinito, y
por esto mismo ilegtima, an si se basa en consideraciones tericas serias: porque, en el
dominio de las disciplinas empricas, no podemos extrapolar al infinito una teora por muy
corroborada que sea, sin salir ipso-facto de los lmites al interior de los cuales esta teora
posee un sentido operatorio y ha recibido la sancin de la experiencia.
LA PARABOLA DEL PLOMERO Y DEL MEDICO.
Es notable, por otra parte, que el ilustre bilogo no haya, de ninguna manera, pensado en
definir un criterio operatorio que permitiera distinguir los dos tipos de incertidumbre. Lo
mejor, dice l, es tomar algunos ejemplos. El primer ejemplo, clsico, es el de los juegos de
dados o el de la ruleta. Es bien cierto que si nosotros conociramos con una precisin
suficiente las condiciones iniciales (posicin, velocidad y momento cintico del dado en el
momento en que cae) y las condiciones en los lmites (la topografa precisa de la tabla en que
se juega el partido) las leyes de la mecnica nos permitiran, en principio, prever con certeza
el nmero destinado a salir. Ahora bien, se encuentra que variaciones muy ligeras de estas
condiciones iniciales, muy inferiores a las que somos capaces de controlar
experimentalmente, bastan para modificar el resultado final (sacar 5 en vez de 6, etc...).
Encontramos aqu la condicin de inseparabilidad de las condiciones iniciales,
caracterstica, segn J. Ullmo8 de la introduccin de modelos probabilsticos en fsica. Se trata
bien de una incertidumbre operacional, y no esencial, y es bien que por razones puramente
metodolgicas nosotros recurrimos al clculo de probabilidades. Esto es incontestable, y en
suma trivial. Esperamos con impaciencia el segundo ejemplo, el que nos va a aclarar sobre la
naturaleza un poco misteriosa el segundo tipo de incertidumbre, la incertidumbre esencial.
!Ay!, lo que sigue es la parbola ultra conocida del plomero Dubois trabajando en un techo
y dejando caer inadvertidamente su martillo, el cual viene a quebrar el crneo del doctor
Dupont quin pasaba justamente por all, llamado de toda urgencia por uno de sus enfermos.
Ningn lector de este bello y gran libro que es El Azar y la Necesidad no ha podido, yo
pienso, defenderse de un sentimiento de malestar al encontrar un argumento tan dbil cado de
una pluma tan ilustre. Esta parbola es reputada para definir la nocin de coincidencia
absoluta o, lo que equivale a lo mismo, de azar esencial, es decir, nos dice Monod,
tomando una idea que viene de Cournot, inherente a la independencia total de dos series de
sucesos cuyo encuentro produce el accidente.
La terminologa desarrollada denuncia por si sola la extrapolacin ms all de todo lmite. La
coincidencia es absoluta, la independencia es total. Estos adjetivos tienen un sentido, al
aplicarlos a nociones aproximadas, de alcance limitado, como la coincidencia o la
independencia? Por otra parte, hay una contradiccin al hablar de dos series de eventos
totalmente independientes, y sin embargo se encuentran. La nocin de independencia
utilizada aqu no est definida. Se nos dice solamente que estas dos series de sucesos no
tienen nada que ver uno con el otro. Pero, cualquiera que sea el sentido de este lenguaje
aproximado, es claro que solamente es a nuestros ojos que estas dos series no tenan nada
que ver. Lo que significa, de nuevo, que ramos incapaces de prever su encuentro y el
accidente que deba resultar: nada ms. En qu difiere esta imprevisibilidad de la asociada
8
Ver, por ejemplo, Les Concepts Physiques, en Logique et Connaissance Scientifique, por J. Piaget y otros,
Pars, 1967, La Pliade.
12
a un juego de dados? La diferencia existe bien, pero est relacionada con el nivel de
abstraccin en que nos hemos localizado para considerar las dos categoras de sucesos, y no a
la naturaleza de estos ltimos. En el primer caso, se trataba de una partida de dados en
general, en el segundo, de un suceso nico, singular, enteramente especificado por la
identidad del plomero y del mdico (tambin se podra haber agregado el lugar y la fecha):
solo la disimetra de los dos puntos de vista crea una impresin de contraste. Ahora bien, yo
puedo particularizar el primer punto de vista, aquel relacionado con las partidas de dados, y
proponer la parbola siguiente, simtrica de la del plomero y el mdico: Ese da, a tal hora,
Duval entra en el caf X, encuentra su viejo amigo el seor Durand a quien no haba visto
desde hace tres aos, riega abundantemente este feliz suceso, luego, a sugestin del barman,
entabla con el seor Durand una larga partida de dados, en la tirada 26, el dado tirado de
manera torpe, aterriza en la taza de caf que el seor Duparc vena de vaciar y poner en el
mostrador, mostrando as la cifra 6! Se trata esta vez de un suceso tambin totalmente
imprevisible, de un azar tambin esencial que en la fbula del plomero y del mdico. La
moraleja de esta historia trivial es sin duda que no importa el suceso singular que sobreviene
en el mundo en que vivimos, una vez que lo individualicemos especificando todos los detalles
que lo han acompaado, comprendiendo las condiciones de tiempo y de lugar, aparece como
el fruto de un encuentro, no de dos, sino de un gran nmero de series de sucesos que no
tenan mucho que ver los unos con los otros, y es el relevo de un azar ni ms ni menos
esencial que aquel que invoca J. Monod. Y esto consiste solamente en decir, lo que es
trivial, que un suceso nico y singular, como tal, no puede relevar un conocimiento cientfico,
la condicin de repetitividad que, sola, funda la objetividad de nuestras disciplinas
empricas haciendo aqu falta por definicin.
En sentido inverso, si despojamos en el pensamiento al suceso nico y singular de tales o
cuales circunstancias anecdticas que lo acompaan (y, principalmente, las condiciones de
tiempo y de lugar) de manera de reducirlo al status de ocurrencia particular de una clase ms
general de sucesos susceptibles de repetirse, entonces, por este mismo paso, nosotros le
constituimos como objeto, de un conocimiento cientfico posible. Y, por lo mismo, seremos
capaces de avanzar modelos o teoras (determinsticas o probabilsticas), susceptibles de ser
corroboradas o refutadas segn que estos se revelen o no de acuerdo no solamente con este
suceso, sino ms bien con todos aquellos que dependen de la misma clase (constituida por
nosotros) y que nosotros hayamos tenido la ocasin de observar. Por ejemplo, aqu estaramos
conducidos a proponer un modelo probabilstico el cual contiene, por lo menos, tres
elementos, a saber: A (cada del martillo de un plomero en un punto y en un instante dado) B
(presencia de un crneo pasando en el mismo punto, en el mismo instante) y AB (interseccin
de los dos anteriores) la asercin relativa a la independencia de estos dos sucesos significara
simplemente que, en este modelo, la probabilidad de AB es igual al producto de las
probabilidades de A y B, es decir la relacin habitual P(AB) = P(A) P(B). En este estadio, se
trata solamente de una caracterstica de nuestro modelo y no de un enunciado relativo a la
realidad. Para atravesar este paso y obtener un enunciado que tenga una significacin objetiva,
debemos atribuirle a nuestro modelo an otras caractersticas (por ejemplo, la estacionaridad
en el tiempo) mediante las cuales podemos legtimamente identificar (con un grado de
aproximacin que la estadstica matemtica permite en principio evaluar) la probabilidad P(A)
de un suceso A con la frecuencia media (emprica) (A) de su realizacin en el curso del
tiempo. Ahora, pero ahora solamente, obtenemos un enunciado objetivo, es decir controlable
experimentalmente. A saber: La frecuencia (AB) del suceso producto debe ser igual (con el
13
mismo grado de aproximacin anterior) al producto (a)(B) de las frecuencias de los dos
sucesos en cuestin.
Incidentemente, y a pesar que no disponemos de los datos estadsticos necesarios, podemos
prever que, segn toda verosimilitud, la relacin (AB) = (A)(B) no sera verificada. Por
la simple razn que en los momentos en que no hay, en general, plomeros sobre los techos (la
noche, los das muy fros o de chaparrones torrenciales etc...) son tambin, en promedio,
aquellos en que hay pocos transentes en las calles. As, los dos sucesos que nos haban
presentado como el ejemplo tpico de la independencia total revelaran, sin duda, en el
anlisis una correlacin positiva, estadsticamente significativa.
LAS CADENAS POLIPEPTIDICAS.
Es con un sentimiento de molestia que yo anticipo estas crticas tan pesadas y triviales en
contra de un libro que, por otra parte, yo admiro. Pero estas crticas quizs no son intiles: Si
un gran espritu cientfico, como J. Monod cay en una trampa epistemolgica tan grosera, es
que aparentemente el peligro es real: Para examinar un ejemplo menos trivial, veamos ms
bien cmo nuestro autor utiliza la nocin de azar en un dominio que le es propio, la biologa
molecular. La misma confusin de gneros, lamentablemente, se va a manifestar. Abramos el
libro en la pgina 110. Se trata de las protenas, molculas constituidas por la polimerizacin
lineal de cuerpos llamados amino-cidos Estos amino-cidos, en nmero total de 20, se
suceden en un orden cualquiera a lo largo de esta cadena polipeptdica, y el nico modelo
compatible con lo que se sabe hoy de esta sucesin es el de la alternativa repetida
generalizada, a saber: La frecuencia (o, en el modelo, la probabilidad) con la cual un cido
dado se manifiesta en un punto de la cadena, no depende ni de la posicin de este punto en la
cadena, ni de la naturaleza de los cidos que ocupan las posiciones vecinas. En trminos
probabilsticos, hay (en este modelo) a la vez estacionaridad a lo largo de la cadena, e
independencia (estocstica) entre los elementos que afectan los diferentes puntos de esta
cadena. Pero es mejor que citemos:
Decir que la secuencia de los amino-cidos en un polipetdico es al azar no cuesta nada, es
necesario insistir, a una confesin de ignorancia, pero que expresa una constatacin de hecho:
A saber que, por ejemplo, la frecuencia media con la cual tal residuo [= cido] es seguido de
otro en los polipeptdicos es igual al producto de las frecuencias medias de cada uno de los
residuos en las protenas en general. Es esta forma, el enunciado es absolutamente
inatacable. No desborda de ninguna manera los lmites operatorios del modelo, y solo recurre
a hechos efectivamente observados. Lamentablemente, est inmediatamente precedido por
otro enunciado, de ninguna manera equivalente, lejos de ser: Estas estructuras (las de los
polipeptdicos) son al azar en el sentido que, conociendo exactamente el orden de 199
residuos en una protena que contiene 200, es imposible formular alguna regla terica o
emprica que permitira prever la naturaleza del nico residuo no an identificado por el
anlisis.
Bien lejos de ser equivalentes, estos dos enunciados son incompatibles y se refutan uno del
otro, al menos si nosotros los consideramos como enunciados empricos. En efecto, el primero
afirma que un modelo probabilstico bien definido, el de la alternativa repetida generalizada,
no ha sido, hasta el presente, desmentido por la experiencia. Ahora bien, para controlar un
modelo de naturaleza probabilstico, el camino usual consiste en proceder con tests
14
estadsticos: Se hace la eleccin (antes, evidentemente, de haber tomado conocimiento de los
datos, o por lo menos, sin dejarse influenciar por ellos) de un suceso, el cual tiene (en el
modelo) una probabilidad muy dbil, y se conviene en rechazar el modelos este suceso, en
efecto, realizado. Hay siempre, un cierto equvoco, porque despus de todo, un suceso poco
probable puede, a pesar de todo, producirse. Pero esta ambigedad es ms reducida cuando la
probabilidad del suceso en cuestin es ms dbil. En particular si un suceso (definido de
antemano) cuya probabilidad, en el modelo, es inferior a 10-10 o an a 10-100 sin embargo se
realiza, todo el mundo estara de acuerdo en refutar el modelo (en el caso contrario, sera
simplemente imposible, debido a la falta de criterios de control, utilizar los modelos
probabilsticos en el dominio de las ciencias empricas).
Para servir de test, en el caso que nos ocupa, elijamos el suceso siguiente, que llamaremos A
para abreviar: Entre las distintas protenas cuya frmula qumica se conoce en la actualidad,
hay por lo menos dos que presentan la misma secuencia de 199 amino cidos. Evaluemos
groseramente la probabilidad P(A) de este suceso en el modelo alternativa repetida
generalizada. Yo ignoro el nmero exacto de protenas distintas cuya frmula qumica se
conoce hoy. Pongamos, para no quedar corto, que hay cien mil, es decir n = 105 , y
supongamos que las frecuencias de cada uno de estos 20 amino cidos sean todas iguales a
1/20 (en realidad, los diferentes amino cidos no son equiprobables, pero un clculo riguroso,
que tenga en cuenta las frecuencias empricas observadas sobre cada uno de ellos, conducira
a los mismos rdenes de magnitud). La probabilidad para que una molcula dada comience
por una secuencia dada de 199 cidos es entonces (en el modelo) 20-199 es decir cercano a
10-258 : Es fcil de ver que P(A) es a lo ms igual a (1 / 2) n2 * 10-258 , luego, se tiene:
P(A) 10-248
Esta probabilidad es inconcebiblemente pequea. Si el suceso A se realizara, esta sera la
ocasin o nunca rechazar un modelo probabilstico.
Ahora bien, el segundo enunciado de Monod si lo interpretamos como una constatacin
emprica, y no como el simple resultado de una deduccin terica efectuada en el modelo sin
haber recibido confirmacin experimental implica que este suceso A, extraordinariamente
improbable, de hecho se realiz. En efecto, no podemos afirmar como un hecho
experimentalmente probado que no existe ninguna regla terica o emprica que permita prever
el 200vo cido, conociendo los 199 primeros, que si nosotros hemos observado efectivamente
al menos una vez dos protenas comenzando por la misma secuencia de 199 cidos y que
difieren una de la otra a partir del 200vo residuo. Ahora bien, esto implica que A se realiz y,
por esto mismo, conduce a rechazar el modelo probabilstico.
Se puede ir ms lejos, y mostrar que el modelo probabilstico no excluye, sino al contrario
implica la existencia de una regla emprica la cual permite prever el 200vo cido a partir de
los 199 primeros. Sabiendo que el nmero de protenas distintas presentes en un animal
superior es del orden de un milln, y admitiendo que, en nuestra galaxia, un millar de
planetas, a lo ms, han podido dar nacimiento cada uno a un millar de especies diferentes,
podemos evaluar como 1024 el nmero de protenas existentes o que hayan existido en nuestra
galaxia (se trata ciertamente de una evaluacin por exceso). Ahora bien, la probabilidad (en el
modelo) para que, entre 1024 molculas distintas, existan dos que presenten la misma
15
secuencia inicial de 199 residuos es a lo ms (1 / 2) 1048 / 20199 , es decir cercano a 10-210 :
Probabilidad tan pequea que el suceso correspondiente debe ser considerado como
prcticamente imposible. Es decir, con un riesgo de error inferior a 10-210 , nosotros podemos
afirmar que el conocimiento de los 199 residuos permite identificar, con toda seguridad, y sin
equvocos, cualquiera de las protenas existentes o que hayan existido en nuestro universo
(seguramente, puramente emprica) permitiendo prever sin riesgo de error no solamente el
200vo residuo, sino igualmente, todos los dems, a partir de los 199 primeros.
La naturaleza de esta regla es sin misterio. Se la puede comparar con el estado civil. El
conocimiento de un nmero pequeo de parmetros (nombre, apellido, fecha y lugar de
nacimiento) permite, con un riesgo de error despreciable, identificar cada uno de los 50
millones de ciudadanos de nuestro pas. Luego, como se nos amenaza, los datos biogrficos
relativos a cada uno de ellos fueran puestos en la memoria de cualquier computadora,
cualquier persona (con la reserva de tener acceso a la Gran Computadora) sera capaz de
prever con toda seguridad la estatura, la profesin, etc de cualquier ciudadano francs a
partir solamente de su estado civil. No hay que preocuparse en decretar que este modo
operatorio es extrao a la ciencia. Porque las clasificaciones sistemticas, en botnica o en
zoologa, no proceden de una manera fundamentalmente diferente.
En el caso de las protenas, la regla que permite hacer esta previsin es actualmente, y
continuar sin ninguna duda para siempre, fuera de nuestro alcance, porque es bien cierto que
no conoceremos nunca la frmula exacta de las 1024 protenas. Pero esta no existe (o
entonces, el modelo probabilstico de Monod es, por lo mismo, refutado). Ahora, por otra
parte, sobre la base de algunas centenas o millares de protenas, de las cuales nosotros
conocemos efectivamente la estructura, un cierto tipo de previsin es posible: Si, luego del
anlisis de una especie nueva, encontramos que los 199 residuos coinciden con los de una
molcula conocida, podemos apostar, con toda seguridad (si el modelo es bueno) que se trata
de la misma protena, y luego prever con toda certidumbre los resultados que an no han sido
analizados.
UNA PARADOJA APARENTE.
El lector podr estar perturbado por esta paradoja aparente: A pesar, o ms bien, justamente
debido al carcter puramente aleatorio del modelo utilizado para describir la sucesin de los
amino cidos a lo largo de la cadena de los polipeptdicos, podemos afirmar igualmente, con
un grado de certeza que es raro alcanzar (una probabilidad de error a lo ms de 10-210! ) que
existe una regla la cual permite prever el 200vo residuo conociendo sus 199 predecesores. Se
trata, se dir quizs, de una regla emprica, muy complicada, que solo podremos explicitar
en la forma de un inventario exhaustivo, y de la cual ninguna teora simple podr rendir
cuenta. Pero es esto una objecin? Nadie, y Monod menos que cualquiera, no ha exigido que
esta regla sea simple. Por otra parte, no es fcil definir con precisin lo que se puede
entender, por simplicidad, esta regla, si es que existe, y es: si ella no nos parece simple, se
trata de un juicio de valor de parte nuestra, es decir una apreciacin puramente subjetiva que
no mancha para nada la objetividad de la regla en cuestin. Con qu derecho, despus de todo,
exigiramos nosotros al cosmos que quede conforme con nuestras estructuras mentales o a
nuestras preferencias estticas?
16
Por otra parte, no es totalmente cierto que la regla en cuestin no sea simple, y sera difcil
probar experimentalmente que no lo es. Tomemos un ejemplo. Tomemos los 20 amino cidos
en un orden cualquiera, pero fijo (lo que es posible de 20! = 2.4*108 maneras diferentes), de
manera que a cada cido le corresponde un nmero a bien definido comprendido entre 0 y
19. La regla siguiente (llammosla R):
(R)
Puede ser llamada simple. Esta regla nos parece a priori poco plausible, porque, diramos, no
hay ninguna razn para que las cosas se pasen de esta manera. Pero, para demostrar
experimentalmente que esta regla es falsa, debemos ensayar sucesivamente las 2.4*1018
versiones posibles, y exhibir para cada una de ellas un contra ejemplo experimental. Por otra
parte, nadie lo ha hecho, y, ciertamente no lo har nunca. Supongamos que basta con un
milsimo de segundo en promedio para encontrar cada contra ejemplo, sera necesario un
milln de siglos para acabar la verificacin. Y, por supuesto, se pueden considerar otros tipos
de reglas simples. Se objetar que ninguna persona sensata , en la actualidad, aceptara la
posibilidad de reglas tan absurdas, es decir que no presentan ninguna relacin inteligible
con el contexto biolgico presente, y de mi parte no aconsejara a un joven investigador
comprometerse en una va de investigacin tan estril. Sin embargo, no olvidemos que es para
nosotros solamente que no hay una relacin inteligible entre esta regla y el fenmeno, y que,
por otra parte, el buen sentido nos hace rechazarla hoy da, sin examen. Durante siglos, la
humanidad se ha complacido con especulaciones aritmetolgicas ms bien extraas.
Para hacer ms puntuda la paradoja, notemos que la regla R conducira a secuencias
numricas que pareceran (salvo algunas elecciones muy particulares y poco numerosas de la
secuencia inicial, por ejemplo a1 = a2 = = a199) secuencias puramente aleatorias, es decir
obtenidas por sorteos independientes al azar. Ms precisamente, es muy fcil demostrar el
teorema siguiente: Si a1, a2, , a199 son 199 variables aleatorias independientes
uniformemente distribuidas en los 20 primeros enteros, entonces las 199 variables aleatorias
a2 a3, , a199 son tambin mutuamente independientes. Es solamente en el orden 200, es decir
cuando interviene explcitamente la ley de distribucin simultnea de las 200 variables
aleatorias a1, a2, = a200 que es posible poner en evidencia el efecto de la independencia
funcional. Dicho de otra manera, los tests estadsticos usuales, an si se dispone de secuencias
de 200 valores numricos obtenidas por este procedimiento, concluiran regularmente e
infaliblemente a la ausencia completa de la dependencia.
Por otra parte las tcnicas de simulacin reposan sobre procedimientos muy anlogos, los
cuales son bien conocidos por todos aquellos que han tenido la ocasin de utilizar en la
prctica la teora de las probabilidades. Contrariamente a lo que se cree, no es para nada fcil
elegir un nmero al azar entre, digamos 1 y 106 , y es an ms difcil realizar un nmero
grande de estos sorteos independientes unos de otros. Esta dificultad tcnica, bien conocida
por los prcticos, debera incitarnos a una mayor circunspeccin en el manejo de nociones
falsamente claras como la del azar. Sera imprudente, en efecto, extrapolar a la escala
csmica un concepto que somos incapaces de controlar de manera realmente operatoria a una
escala tan modesta como la simulacin de algunos millares de valores numricos. La manera
como se hace, en la prctica, es paradojal, (y por lo mismo muy instructiva). Los
17
procedimientos que utilizan, en general, los prcticos, son en efecto, de una aritmtica simple,
y absolutamente determinstica, totalmente comparable, en esto, con la regla R anterior. Por
ejemplo, se elige un nmero inicial n1 cualquiera entre 0 y 106 , se eleva al cubo y se
retienen las 6 cifras centrales de la escritura decimal del nmero obtenido: n2 es el nmero
cuya escritura decimal est dada por las 6 cifras as retenidas. Se puede reiterar la operacin
varios millares de veces, y someter los valores obtenidos a los ms severos tests estadsticos:
Se obtiene, en general, una buena confirmacin de la independencia estas llamadas
variables aleatorias (salvo, de tiempo en tiempo, para ciertos valores particulares del nmero
inicial n1. Y sin embargo, el procedimiento de generacin de estos nmeros al azar es
absolutamente determinstico. Estamos seguros aqu, porque somos nosotros los que los
hemos elegido, que existe una regla terica simple, la cual permite prever el millonsimo
nmero conociendo el primero. La apariencia aleatoria del resultado, que resiste los tests
ms severos, proviene, nadie lo duda, del carcter extrao, heterogneo, de las diferentes
manipulaciones numricas que nosotros efectuamos. Elevar al cubo y retener los 6 decimales
centrales son operaciones aritmticas que no tienen nada que ver entre ellas, por lo menos
para nosotros, y esto permite comprender porqu los nmeros as fabricados nos parecen al
azar. Pero estos nmeros no lo son, y tests ms potentes efectuados sobre una secuencia
extremadamente larga haran aparecer el carcter determinstico (por ejemplo, luego de un
milln de operaciones, se cae, necesariamente sobre un valor numrico ya escrito, y a partir
de ese momento, la sucesin se hace peridica, y se reproduce de la misma manera hasta el
infinito). Ahora bien, no se trata de ninguna manera de una curiosidad aritmtica, sino de un
procedimiento corriente utilizado por los prcticos para fabricar nmeros al azar : La
existencia de una regla terica simple, de naturaleza determinstica no contradice de ninguna
manera, a sus ojos, el carcter aleatorio empricamente bien corroborado, de los nmeros
que ellos obtienen.
EL UMBRAL DE REALISMO O DE OBJETIVIDAD.
Estos ejemplos ilustran bien, yo creo, la diferencia capital que existe entre un teorema y un
enunciado emprico. Un modelo dado, por muy bien testeado y corroborado que haya sido,
contiene siempre necesariamente teoremas que no corresponden a enunciados empricos
controlados, ni an controlables ms all de un cierto lmite. Existe siempre un umbral de
realismo, ms all del cual el matemtico puede, claro est, perseguir alegremente sus
deducciones, las cuales el fsico debe respetar, con el riesgo de obtener solamente enunciados
incontrolables en primer lugar, luego, poco a poco, incontrolables, es decir desprovistos de
significacin objetiva, o si se quiere, metafsicos en el sentido que toma este adjetivo en el
uso de las ciencias positivas. En el caso de nuestras protenas, para todo entero n, la
probabilidad (en el modelo) de una secuencia dada a1, a2, , an de n amino cidos es igual
al producto P(a1)P(a2) P(an) de las probabilidades individuales, es decir a 20-n en el caso
en que los diferentes amino cidos son equiprobables. Esto es un teorema del modelo. Para
que le corresponda un enunciado objetivo o emprico, es decir controlable
experimentalmente, es necesario que, entre las 20n secuencias9 posible, algunas al menos se
encuentran repetidas un nmero suficiente de veces entre las 1028 secuencias que sera
(tericamente!) posible observar. Si queremos, por ejemplo, que exista (en el modelo) una
9
Al admitir que las protenas contienen 104 cidos en promedio, las 1024 molculas del universo contienen
(aproximadamente ) 104 * 1024 = 1028 secuencias de 200 cidos consecutivos.
18
probabilidad superior a 1/100 para que una, al menos, de estas 20n secuencias se repita al
menos 10 veces (y es verdaderamente el mnimo que se pueda exigir) se ve fcilmente que n
no puede sobrepasar un valor del orden 24 aproximadamente. Un enunciado de orden
superior, por ejemplo del orden n = 200, como el de Monod, es empricamente vaco 10. Si
ahora, no consideramos el conjunto de las molculas que existen en el universo, sino
solamente aquellas de las cuales conocemos efectivamente la frmula, en nombre, admitamos,
de 1000, lo que da a lo ms 108 configuraciones observadas, debemos esperar a que una
secuencia dada, de largo n figure, en promedio, 108 * 20-n veces en nuestro material
experimental. Para n = 2 y 3, tendremos ms de 105 y 104 repeticiones, en promedio, y
por consiguiente muy buenas posibilidades de control experimental. Para n = 6 , ya, este
nmero promedio es del orden de la unidad: en el orden de 6 , solo ser posible controlar
algunas secuencias (en un nmero muy pequeo) aquellas que, por azar se han repetido,
digamos, al menos diez veces. Ms all de n = 7 o 8 , el material experimental disponible
hoy da no permite prcticamente ningn control (o, esto significa por el hecho mismo que el
modelo probabilstico es refutado).
En resumen, una asercin relativa a la independencia de orden n = 10 no puede, si el modelo
es bueno, ser considerada como experimentalmente establecida hoy da. Respecto de la
nocin de independencia de orden n 30 (y a fortiori de orden 200) ella est totalmente
desprovista de significacin objetiva. Cmo, entonces, podramos extrapolar a la escala
csmica, y afirmar categricamente, como si se tratara de un hecho experimental probado, o
an simplemente de un enunciado que presente una significacin objetiva cualquiera, que el
azar constituye la nica fuente posible de cualquier creacin y de cualquier novedad en la
biosfera? Es verosmil que J. Monod haya concebido su filosofa, antes de todo, como una
mquina de guerra contra la de Teilhard de Chardin11 . Es esto lo que explica su semejanza. El
10
Atraigamos, al pasar, la atencin de los lgicos sobre el status extrao (que recuerda, en sentido ms
complejo, la famosa paradoja del Mentiroso) de los enunciados obtenidos, como el de Monod, quebrantando
largamente el umbral de realismo de un modelo probabilstico: estos son a la vez teoremas y falsificadores
virtuales del modelo. Si son verdaderos (empricamente), son falsos (tericamente) [es decir: Si se verifican
experimentalmente, o an simplemente si las condiciones de un control experimental posible se encuentran
reunidas, el modelo de donde fueron deducidas es, por lo mismo, refutado]. Si son verdaderos (tericamente),
son incontrolables (empricamente) [si el modelo puede ser considerado como bueno, es decir, no es desmentido
por la experiencia, las condiciones de un control experimental del enunciado no estn reunidas]. Es por esto que
pueden ser llamados objetivamente vacos: Ms precisamente, stos solo podran tener significacin objetiva
cuando el modelo en el cual han sido deducidos ha sido refutado por la experiencia.
11
Los sentimientos de Monod respecto de Teilhard de Chardin me parecen del tipo amor decepcionado,
transformado en odio. Althusser ha revelado las numerosas reminiscencias teilhardianas que salpican los textos
de Monod, y ha analizado (lamentablemente en el lenguaje y segn el punto de vista un poco rgido de una
Escuela) las relaciones ambiguas que existen entre estos dos autores. Se encontrar un buen anlisis (en un
lenguaje normal, y segn un punto de vista menos particular) y una bibliografa en Madelaine BarthlemyMadaule, Lidologie du hazard et de la necessit, Pars, 1977. Este autor, filsofo universitario, me parece
que vio bastante bien lo esencial: a saber que el ilustre bilogo, cuando empleaba palabras tales como azar o
probabilidad, no saba simplemente de qu hablaba. Pero no siendo ella misma una probabilstica, se crey
autorizada para decir las cosas tan brutalmente. Por otra parte, el modelo de Monod ha sido seriamente
contestado en el fondo (es decir del punto de vista de la biologa) por los mismos bilogos. No me pertenece,
debido a mi falta de competencia, tomar posicin en este debate, y solo puedo referirlos a la exposicin de J.
Raffi, en De la biologie la culture , Pars, 1976, pginas 205 y siguientes. El lector habr entendido que mi
nico objetivo en las pginas anteriores, era ilustrar, sobre un ejemplo impresionante, los peligros que comporta
la extrapolacin al infinito a partir de conceptos o de modelos probabilsticos.
19
azar de J. Monod es el hermano enemigo del punto Omega del buen Padre: Su enemigo,
ciertamente, pero fundamentalmente su hermano; ellos son bien de la misma familia.
20
CAPITULO II
12
21
EL PROBLEMA.
En las pginas anteriores, hemos visto como se puede atravesar lo que hemos llamado el
umbral de la objetividad de un modelo probabilstico, umbral ms all del cual, la deduccin
solo proporciona enunciados empricamente vacos. Pero existe realmente un tal umbral ms
all del cual un modelo probabilstico sea susceptible de presentar alguna significacin
objetiva? Se sabe que una escuela del pensamiento lo contesta. Los subjetivistas 13, o
partidarios de la interpretacin puramente subjetiva de la probabilidad, dicen que es
imposible dar un sentido objetivo a un enunciado probabilstico respecto de un suceso nico y
singular. Si yo digo, por ejemplo, que hay una chance sobre dos para que una forma de vida
inteligente exista en el planeta Marte, no se puede ver en este enunciado solamente una
opinin personal (puramente subjetiva). Pero, si un contradictor me hace una objecin pero
no, esta probabilidad es 7/10 (o 3/10 etc) nadie podr desempatarnos nunca: sabremos
con verosimilitud en un futuro prximo si Marte est o no habitado, pero esta constatacin
experimental no confirmar ni refutar ninguno de nuestros enunciados probabilsticos, los
cuales continuarn as insolubles para siempre. El argumento es incontestable. Pero resulta
que, necesariamente que la probabilidad no puede nunca, en ningn contexto, representar
nada ms que una opinin puramente subjetiva ?. Los objetivistas replican que ellos no se
interesan de ninguna manera en la prediccin de un suceso nico y singular: se trata en este
caso, segn ellos, de una pregunta ajena a la ciencia.
Citemos K. R. Popper 14 toda controversia relativa a la pregunta de saber si hay sucesos que
solo se producen una vez y no pueden ser repetidos no puede ser zanjado por la ciencia: se
trata de una controversia metafsica. Lo que les interesa, es solamente el comportamiento
estadstico de grandes efectivos, y las leyes perfectamente objetivas que los rigen. Una
probabilidad a la escala del individuo emerge, por el juego de la ley de los grandes nmeros,
bajo la forma de una frecuencia que podemos alcanzar y medir. Nuestros enunciados
probabilsticos son entonces perfectamente objetivos, porque los podemos controlar
experimentalmente, con la reserva de poder repetir un nmero suficiente de veces la misma
experiencia. A esto los bayesianos responden: Son ustedes los que juzgan que se trata de la
misma experiencia. Esta es una opinin subjetiva que nosotros no estamos obligados a
compartir. De esta opinin que ustedes han adoptado, resulta lgicamente que despus de un
nmero n bastante elevado de experiencias, ustedes deben utilizar la frecuencia observada
para evaluar la probabilidad (subjetiva) que ustedes atribuyen a la experiencia (n + 1) vo, an
no realizada: Pero esto no significa de ninguna manera que esta probabilidad haya adquirido
una significacin objetiva. Y el dilogo de sordos podr continuar por mucho tiempo.
Se percibe bien que el argumento de los subjetivistas es excesivo. Delante de los xitos
indiscutibles, brillantes, obtenidos por los modelos probabilsticos en dominios tan diversos
13
Se les llama tambin bayesianos debido al uso intensivo que hacen del teorema de Bayes (bastante clsico):
Denominacin impropia, porque este teorema, como todo teorema, es de naturaleza puramente formal
(matemtico) y no prejuzga de la interpretacin subjetivista u objetivista que se le puede dar, en las aplicaciones,
a las probabilidades que considera.
Los fsicos, objetivistas por vocacin, tambin utilizan este teorema (por ejemplo en el anlisis de la
retrodiccin - Nota del traductor: Tambin se usa teleologa - trmino forjado por analoga con prediccin
para designar la reconstitucin del pasado a partir del presente).
14
La logique de la dcouverte scientifique, p.43 de la edicin francesa.
22
como la termodinmica, la mecnica cuntica, los seguros, la demografa, etc, delante de
las previsiones precisas a las cuales conducen, y regularmente confirmadas por la experiencia,
es simplemente poco razonable negar su valor objetivo. Los fsicos, alentados por sus xitos,
estn convencidos con justa razn de la objetividad de sus probabilidades, y se oponen
categricamente a esta intromisin de los subjetivistas. Pero, en sentido inverso, los
argumentos de estos ltimos sobre la imposibilidad de dar un sentido objetivo a la
probabilidad de un suceso nico son aparentemente irrefutables. Se podra, como Salomn,
proponer cortar al nio en dos, quiero decir abandonar sin recursos los fenmenos nicos a la
arbitrariedad de los subjetivistas, y limitar la objetividad de los mtodos probabilsticos al
dominio solo de los fenmenos regulares y repetibles, semejantes los que estudian los
fsicos. Pero nuestro objetivo, en estas pginas, es justamente examinar si, y en qu medida,
un fenmeno nico puede ser objeto de una estimacin o de una previsin sobre la base de
una informacin fragmentaria: Como las tcnicas de estimacin utilizadas en la prctica estn,
lo ms a menudo, fundadas en modelos probabilsticos, no es posible eludir el debate.
23
contenidas en el nico elemento 0 que habra sido elegido as el primer da: Todo el resto,
el espacio entero, y el ocano infinito de virtualidades que contiene, desapareci, borrado
para siempre por este sorteo nico. Intil, es decir sin valor explicativo, por la misma razn de
fondo: Porque las propiedades que podemos observar en nuestro universo estn contenidas en
este nico elemento 0 , y no dependen ms de otra cosa. De manera que podemos olvidar
resolutivamente todas las riquezas que estaban latentes en los otros elementos , los que no
han sido elegidos. Este elemento 0 , el nuestro, tena sin duda una probabilidad nula de ser
sorteado, y nuestro universo era en suma casi imposible: sin embargo es el nico universo que
nos ha sido dado, y el nico que podemos estudiar.
15
Sobre la objetividad, concebida como el fruto de una elaboracin o de una reconstruccin de lo real por el
sujeto (epistmico), ver los trabajos de J. Piaget, y principalmente, Logique et Connaissance Scientifique, ya
citado.
16
Ver la cita de Sneca en el epgrafe de este captulo.
24
En suma, la objetividad de un enunciado, de una opinin, etc est ligada a la posibilidad de
controlar su exactitud. Segn K. R. Popper 17, la objetividad de los enunciados cientficos
reside en el hecho que pueden ser sometidos a tests nter subjetivos. Sin embargo, hay lugar
para distinguir dos casos bastante diferentes, segn que se trate de enunciados singulares o
universales.
En el caso singular tenemos los enunciados del tipo constatacin de un hecho. Por
ejemplo: Llueve (aqu, en este momento), o las tropas aliadas han desembarcado el 6 de
Junio de 1944 en las playas de Normanda. Entiendo bien que no existen datos inmediatos
ni hechos brutos, y que cuando nos referimos a esas palabras, siempre resultan de una
elaboracin y construccin primaria. Pero, en la prctica, (en la vida de todos los das, como
tambin en la prctica cotidiana del trabajo cientfico) esta observacin presenta poco inters.
Diremos simplemente que, por hiptesis o por convencin (como se quiera), suponemos que
un cierto consenso se realiza en lo que respecta el sentido de las palabras y su adecuacin a
(lo que nosotros llamamos) la realidad. Dos observadores presentes en el mismo momento y
en el mismo lugar se pondrn de acuerdo para decir si llueve (o no). Dos historiadores, con
acceso a todas las fuentes, admitirn que el desembarco tuvo lugar ese da. As, en lo que
concierne a los enunciados singulares, es decir las constataciones (posibles) respecto de un
hecho (presente, pasado o futuro), el criterio de objetividad reside en el hecho que una vez
reunida toda la informacin necesaria, se realiza un consenso entre las personas sensatas
respecto de la verdad o la falsedad del enunciado en cuestin: se trata de enunciados
decidibles, es decir enunciados en los cuales sera unvocamente posible decidir si son
verdaderos o falsos, siempre que se disponga de las informaciones deseadas. Puede suceder,
que un enunciado decidible (como: Llovi en Pars el 1 de Julio del ao 251 A. C.)
contine, en efecto, indecidido, debido a que no tenemos acceso a las fuentes. Esto no le quita
en nada objetividad: Esta, igualmente, es independiente de la pregunta de saber si, en
definitiva, el enunciado se revelar verdadero o falso. Un enunciado objetivo puede bien ser
falso. Basta con que sea posible declararlo falso.
Enseguida vienen los enunciados de tipo universal. Se les encuentra, evidentemente, en las
ciencias llamadas positivas (por ejemplo dos cuerpos se atraen en razn inversa al cuadrado
de su distancia) como, tambin, en la vida cotidiana (llueve todos los das en Londres).
Estos se refieren a una clase ilimitada, no necesariamente infinita, pero de extensin
indefinida: todos los cuerpos existen, existieron o existirn en el universo etc Afirman que
todos los elementos de esta clase verifican una propiedad controlable (en principio). No
pueden ser verificables (constatar que son verdaderos), a menos de poder proceder a un
inventario exhaustivo del universo. Pero se les puede falsificar (mostrar que son falsos) al
exhibir al exhibir contraejemplos (por ejemplo, testigos pueden asegurarnos que no llovi en
Londres el 1 de Julio del ao pasado): Su objetividad est ligada a su propiedad de falsificar.
En materia cientfica, tratndose de un enunciado, de un modelo, de una teora, etc
(considerados como tales cuando se refieren a un sector bien definido del mundo que nosotros
llamamos real) diremos que tienen una significacin objetiva se, y en la medida que, sea
posible someterlos al control de experiencias o de observaciones cuyo resultado sea
interpretado sin equvoco (lo que quiere decir que el enunciado de estos resultados deben ser
susceptibles de realizar el consenso de los especialistas) . Lo ms a menudo, un enunciado
17
25
cientfico es de tipo universal, y no puede por consiguiente ser el objeto de una verificacin
(lgica) rigurosa, la cual implicara la realizacin efectiva de una infinidad de observaciones o
de experiencias. Al contrario, siempre debe ser posible deducir de un enunciado cientfico
general, enunciados ms particulares (prediccin del resultado de experiencias o de
observaciones efectuadas en condiciones bien definidas, verificables o falsificables). Si son
confirmados, no resulta que el enunciado general sea verificable, sino solamente que es
corroborado (no refutado). Al contrario, si uno de ellos es invalidado, el enunciado general
es por esto falsificado (refutado). Dicho de otra manera, el enunciado general tiene una
significacin objetiva en la medida en que es falsificable, y posee una validez (relativa y
siempre provisoria) en la medida en que ha sido corroborado, es decir ha resistido
victoriosamente todas las tentativas de falsificacin a las cuales ha sido sometido hasta el
presente: y nosotros le proporcionaremos un grado de validez mayor en la medida en que
estas tentativas han sido ms numerosas y ms severas. Tal es el criterio de falsificabilidad
que propone K. R. Popper 18 como lnea de demarcacin entre enunciados metafsicos y
enunciados empricos u objetivos. Este es el criterio que utilizaremos.
Op. Cit.
Los conceptos fsicos, en Logique et Connaissance Scientifique.
20
La longitud de una regla es definible, digamos, a la dcima de milmetro, pero no con 15 decimales exactos :
con mayor razn, la pregunta de saber si esta longitud se expresa en centmetros por un nmero racional o
irracional, no tiene ningn sentido para un fsico.
19
26
los conceptos operatorios y las leyes fsicas que los soportan han sido reunidos en el marco de
un modelo matemtico, la tentacin de olvidar esos lmites es grande y, confiando de manera
ciega en el formalismo matemtico, de sacar deducciones del modelo, las cuales van bien ms
all que su dominio de validez objetiva. Hemos visto en el captulo anterior un ejemplo que
sobrepasaba este umbral de objetividad. La existencia de este umbral, y la tentacin de
atravesarlo, constituyen un peligro permanente, peligro que debemos guardar en nuestro
espritu cuando implementamos modelos probabilsticos.
LA SUBJETIVIDAD.
La nocin de subjetividad, debido a que designa las opiniones, creencias, sentimientos de
conviccin de tal o tal individuo, nos retendr por menos tiempo. Sobretodo notamos que esta
nocin no constituye de ninguna manera el contrario lgico de la objetividad. Las personas
dichas razonables o sensatas proporcionan, lo ms a menudo, su consentimiento
(subjetivo) a un enunciado (objetivo) bien corroborado, tal como: Cuando una manzana se
despega del rbol, cae a tierra y no vuela hacia las estrellas. En este sentido, evidentemente,
un enunciado probabilstico, en la medida en que un cierto individuo le da su adhesin, puede
siempre ser dicho subjetivo, pero esto no excluye a priori su objetividad (una ley objetiva
como la ley de atraccin universal, en la medida en que yo la creo verdadera puede, ella
tambin, ser dicha subjetiva, porque representa, en efecto, tambin mi opinin personal). Los
subjetivistas juegan a veces con las palabras, lo que no es evidentemente que ellos las
entienden. Cuando ellos dicen que la probabilidad es subjetiva, esto quiere decir
puramente subjetiva en el sentido en que est desprovista de cualquier significacin
objetiva: Sin que esto implique una connotacin arbitraria o de fantasa (irracional). Ellos se
refieren ms bien al hecho (innegable) que dos individuos diferentes, localizados en la misma
situacin y teniendo la misma informacin, pueden bien comportarse de manera diferente, sin
que sus comportamientos sean irracionales. Simplemente sus gustos, sus aspiraciones etc
difieren, y tambin sus apreciaciones personales de la situacin (apreciaciones que, segn los
bayesianos, pueden siempre ser explicitadas en la forma de evaluacin de la probabilidad
(subjetiva) atribuida a las diferentes eventualidades).
Es decir que contiene al menos un elemento distinto del elemento imposible (vaco) y del suceso seguro
(total).
22
Nadie, parece, habla de espacio vectorial subjetivo (o objetivo).
27
est en causa aqu no es la teora de probabilidades como tal, sino su aplicacin a la realidad.
Lamentablemente, nadie ha aplicado nunca, y no aplicar nunca a la realidad ni la teora de
las probabilidades, ni otra teora matemtica. A la realidad, solo se pueden aplicar
operaciones reales (fsicas, tcnicas, etc), y no operaciones matemticas. Estas ltimas se
aplican a modelos matemticos de la misma naturaleza que ellas. Dicho de otra manera
siempre, y solamente, se aplica la teora de las probabilidades a modelos probabilsticos. Y la
pregunta que aparece es examinar si estos modelos probabilsticos pueden, o no, tener una
significacin objetiva. Yo no contesto que sea posible23 y an til, para un individuo, poner
orden en sus ideas u opiniones representndolas en la forma de modelos probabilsticos. Pero
esto implica que los modelos u otros que podemos formar por otras vas estn
necesariamente desprovistos de objetividad?
Para resumir: No hay probabilidad en s. Hay solamente modelos probabilsticos. La nica
pregunta que aparece en realidad, en cada caso particular, es la de saber si tal modelo
probabilstico, en relacin a tal fenmeno real, presenta o no un sentido objetivo. Como
hemos visto, esto equivale a preguntarse si el modelo es falsificable. La prctica muestra que
la respuesta a esta pregunta puede ser positiva. Hay, en efecto, casos en que todo el mundo, a
la luz de los resultados experimentales, convendr en abandonar el modelo probabilstico que
haba sido propuesto al inicio. Pero qu es un modelo probabilstico?
La tcnica de apuesta utilizada por los subjetivistas para sus evaluaciones de probabilidades me parece
utilizable en la prctica solamente cuando un nmero pequeo de variables aleatorias (no independientes)
intervienen simultneamente: Su procedimiento sera difcil de implementar en el caso de las funciones
aleatorias , donde interviene (tericamente) una infinidad de variables (a menudo, en la prctica, varios millares).
28
tipo de modelo constituye una hiptesis, mientras que el problema de la especificacin (de
los valores numricos de los parmetros) lleva el nombre de inferencia estadstica o de
estimacin de estos parmetros. Debido a que esta terminologa tiene supuestos implcitos24
(respecto de la existencia real, objetiva, de estos parmetros), nosotros utilizaremos el trmino
neutro y puramente descriptivo de eleccin (del tipo de modelo, de los parmetros, etc: Y
de hecho, en cualquier estado de causa, somos nosotros los que los elegimos).
Sobre este punto, yo apruebo en gran parte la crtica severa que hacen los subjetivistas de esta terminologa.
Ver por ejemplo B. de Finetti, Theory of probability, J. Wiley, 1974, passim (pero yo no saco las mismas
conclusiones).
25
Yo no digo de ninguna manera que se trata de la misma experiencia, lo que (los subjetivistas tienen razn
en esto) no tendra, hablando estrictamente, ninguna significacin objetiva.
26
Se trata de la definicin del modelo matemtico, en absoluto de una afirmacin relativa al mundo fsico. Los
subjetivistas (ver por ejemplo B. de Finetti, op. Cit) tienen razn al recalcar que cualquier asercin relativa a la
independencia de los resultados del primer y segundo experimento (de esta partida, jugada tal da, con esta
moneda, , por los seores Durand y Dubois) est desprovista de significacin objetiva.
29
recoleccin de una cierta cantidad de informaciones experimentales antes de terminar la
especificacin de nuestro modelo. Tambin puede ocurrir (como veremos en otro captulo)
que no necesitemos, realmente, proceder a esta ltima eleccin. Lo esencial, del punto de
vista metodolgico, es distinguir cuidadosamente los dos papeles muy diferentes que
atribuimos a este mismo smbolo p. De un lado, p es un parmetro del modelo. Luego, es
susceptible, como el modelo mismo, de presentar (o no) una significacin objetiva y, la
asercin p = 1 / 2 puede ser (o no) falsificable (es decir objetiva o emprica). Por otro
lado, el mismo smbolo figura en la igualdad P( X10 = 1 ) = p . En este caso, se afirma que la
probabilidad de xito en la tirada 10 (de este juego) tiene un valor numrico determinado,
por ejemplo p = 1 / 2 : enunciado singular e indecidible, luego ciertamente desprovisto de
significacin objetiva como todo enunciado relativo a la probabilidad de un suceso nico27 .
30
las probabilidades), sino ms bien para mostrar con qu facilidad los mejores espritus
cientficos30 se equivocan cuando se habla de azar y de probabilidades. Esta ley no
tiene nada de misterioso, en efecto, por la simple razn de que no es una ley, sino un
criterio convencional , el nico por otra parte, que nos permite falsificar (o rechazar)
un modelo probabilstico.
b) Una dificultad (terica) proviene del hecho que existe, en general (en el modelo) una
infinidad no numerable de sucesos casi imposibles. En los casos de la alternativa
repetida, no es solamente la secuencia infinita de xitos (1, 1, ) sino tambin cada
una de las sucesiones particulares (x1, x2, ) que recibe una probabilidad nula:
Cualquiera que sea el resultado de una sucesin infinita de experiencias, esta es casi
imposible. Sin embargo, uno de estos resultados casi imposibles debe necesariamente
realizarse31 .
Esto significa que se debe siempre elegir antes (antes de conocer los datos, o, en todo
caso, sin dejar influenciarse por estos) el suceso (o los sucesos en nmero finito, o a
lo ms numerable) de probabilidad nula o muy dbil destinado a servir de test. Hay
aqu, sin duda, algo de arbitrario, incmodo desde el punto de vista terico. Pero el
consenso se establece sin demasiadas dificultades en las aplicaciones prcticas.
c) Otra dificultad es la siguiente: Lo ms a menudo, los sucesos casi imposibles del
modelo dan cuenta de casos lmites, y no corresponden a constataciones
experimentales realmente posibles (no se puede efectuar en la realidad una infinidad
de tiradas). En la prctica los estadsticos elegirn entonces como test un suceso de
probabilidad pequea, pero no nula. Cunto hay que tomar = 10-2, 10-6, 10-9,
etc? Aqu hay un peligro real de arbitrariedad. Volveremos sobre este punto.
d) Como nuestro criterio es convencional, los subjetivistas estarn libres de refutarlo, lo
cual harn, sin duda, con la lgica de hierro que siempre los ha caracterizado. Aqu,
sin embargo, su lgica de hierro peligra de entrar en contradiccin con la prctica
cientfica normal, , y con el simple buen sentido. Espero no deformar demasiado su
pensamiento al atribuir a ellos el argumento siguiente: En primer lugar, ellos no
utilizan nunca un modelo enteramente especificado ( p = 1 / 2 por ejemplo ) porque
nadie est absolutamente asegurado que la moneda no est trucada. Ellos utilizarn
entonces el modelo no especificado, pero agregando esta restriccin importante, la
cual modifica la naturaleza probabilstica: p para ellos, no ser un parmetro de valor
desconocido con valor fijo, sino una primera variable aleatoria a la cual ellos atribuyen
una ley de probabilidad (subjetiva), la cual considera la informacin que ellos
disponen antes de comenzar la partida, pero que en definitiva expresa su propia
opinin. Por ejemplo, ellos elegirn para p una ley uniforme en el intervalo (0, 1) (o
cualquier otra ley). Es, entonces, solamente con p fijo que las variables Xn son
independientes. Pero p no es fijo, y las Xn no son independientes en su modelo.
Supongamos ahora que despus de una partida muy larga, digamos n = 106 tiradas, se
30
31
31
haya obtenido un milln de xitos consecutivos. Al considerar esta informacin nueva,
ellos reemplazan la ley inicial (a priori) que ellos atribuan a p antes de la
experiencia por la ley condicional que toma esta variable cuando se ha observado un
milln de sucesos. En nuestro ejemplo, esta ley admite la densidad (n + 1) pn y la
esperanza E(p) = (n + 1) / (n + 2) = 0.999999 (pero no 1). Esto quiere decir que, si se
va a apostar sobre la tirada (n + 1), ellos se comportarn como se existiera una chance
sobre un milln de ser un fracaso.
Del punto de vista prctico, esto es ms o menos equivalente a la certitud del suceso,
pero subsiste una diferencia tericamente irreducible. No se puede refutar su modelo,
que es, por construccin, compatible con todos los resultados experimentalmente
posibles: Lo que es lgico, porque, justamente, ellos niegan a este modelo, cualquier
significacin objetiva. Sin embargo, en este caso, como lo hemos observado, la actitud
cientfica ms recomendable consistira en admitir (provisoriamente) el modelo
determinstico: Se gana siempre en este juego, y a buscar porqu (la moneda no
comportara, por ejemplo, dos lados cara, asumiendo que pila representa xito
etc). Lo que descalifica aqu la interpretacin subjetivista, no es su falta de lgica,
sino simplemente su falta de inters32 .
Llevada a su fin, esta lgica conduce a atribuir una probabilidad subjetiva a cada uno de los enunciados
singulares deducidos de las leyes fsicas. Por ejemplo, se evaluar a 1 sobre mil (o un milln, o un millar!, o
como se quiera) la probabilidad (subjetiva) para que estos dos cuerpos aqu, maana a tal hora, no se atraigan
en razn inversa del cuadrado de su distancia: Se puede hacer , pero esto no es muy interesante. Mi tesis es
simplemente que ciertos modelos probabilsticos (no necesariamente todos) y ciertos de los conceptos que ponen
en juego (no todos) poseen una objetividad del mismo tipo que lo que el consenso general atribuye a los
conceptos y a las leyes de la fsica.
32
Es bien as como proceden los fsicos, en el caso de la alternativa repetida, para construir el
concepto (matemtico) de probabilidad p y transformarlo en un concepto fsico muy
diferente, el de frecuencia terica. Su enfoque puede ser descrito as: a cualquier sucesin
(finita) de n pruebas que proporcionen los resultados (x1, x2, , xn) le asociamos el nmero
medio de xitos que contiene, es decir el nmero:
fn =
1 n
xk
n k =1
33
Si el fsico constata que la amplitud de las oscilaciones, al comienzo muy fuertes, se atena de
manera ms o menos regular, de manera que, siendo n creciente, la curva parece que se
estabiliza bien respecto de una asntota horizontal de ordenada p, entonces adoptar
provisoriamente la hiptesis fn converge hacia p y proceder a realizar diversos controles:
Seguir la experiencia ms all de N; extraer y estudiar separadamente subsucesiones (por
ejemplo la sucesin de los impares (f3, f5, ) y la sucesin par (f2, f4, ); recomenzar con
otras series34 de experiencias etc Estos diversos controles y confirmaciones mutuas, se
conceden para poner en evidencia la existencia del mismo lmite asinttico p , concediendo
por esto a este el status de concepto operatorio : El concepto matemtico est ahora
reemplazado por el concepto fsico as construido, al cual se le puede dar el nombre de
frecuencia terica. A este concepto, le asociamos el valor numrico del lmite asinttico as
desarrollado por el procedimiento mismo que nos ha servido para construir el concepto, y
nosotros designamos todava por p el resultado de esta medida. En efecto, p solo se conoce
con una cierta aproximacin. Pero esta es la maldicin de todos los conceptos y de todas las
medidas fsicas. Por otra parte, podemos, en principio, mejorar esta aproximacin, si lo
deseamos, procediendo a nuevas experiencias. Adems, la rapidez con la cual la secuencia fn
converge hacia p (en el modelo) es el objeto de teoremas precisos, cuyos enunciados pueden,
ser reconstruidos en trminos operatorios y ayudarnos a apreciar el orden de magnitud de la
aproximacin obtenida.
Otros conceptos pueden tambin beneficiarse de esta metamorfosis: la estacionaridad por
ejemplo. No podemos verificar que P(Xn = 1) es independiente de n , porque este es un
enunciado que pone en juego probabilidades de sucesos individuales. Pero, si hemos
efectuado N = 10000 ensayos, por ejemplo, podemos cortar esta secuencia en 100 rebanadas
de 100 ensayos consecutivos, examinar si cada una de estas 100 frecuencias correspondientes
es, o no, vecina de p , comparar la distribucin emprica de estas 100 frecuencias con aquella
que deja prever el modelo, hacer tests estadsticos precisos (sugeridos por el modelo) etc
De nuevo, todo este conjunto de controles y de recortes da nacimiento a un concepto
operatorio, el de la estacionaridad fsica.
Tambin para la independencia. Nunca podremos verificar que X3 y X4 son
independientes (debido a que no es un enunciado objetivo). Pero, de la misma manera que
hemos construido el concepto operatorio de frecuencia (de una sucesin), podemos construir
el de la frecuencia de dos xitos consecutivos, o de un xito seguido de un fracaso etc
Podemos as poner en evidencia una ley fsica, segn la cual la frecuencia de dos sucesos
consecutivos es igual al producto de las frecuencias de cada uno, ley fsica que, en turnos,
sirve como definicin operatoria del concepto fsico de independencia de orden 2. Se puede,
anlogamente, dar un sentido fsico a la independencia de orden 3 o 4 (pero, como hemos
visto, no se podr ir muy lejos, y la independencia de orden 200, por ejemplo, quedar
inaccesible).
En este caso (ideal), hemos logrado, a partir del modelo matemtico inicial, reconstruir un
modelo fsico enteramente objetivo. La transposicin no es y no puede ser total. Nada nos
garantiza nunca (suponiendo que esto tiene sentido) que los ensayos 13 y 14 eran
34
Esto supone, en principio, una ampliacin del modelo inicial, el cual debe contener ahora variables con 2
ndices X n, m (la cual representa el resultado n de la experiencia m) pero este punto no presenta dificultades.
34
independientes y tenan la misma probabilidad que los otros. En el juego de cara o cruz ,
podra darse que para estos dos ensayos, justamente, con la exclusin de todos los otros, se
haya sustituido la moneda inicial por una moneda trucada: El anlisis estadstico no nos
permitir nunca darnos cuenta. Pero lo esencial, yo quiero decir el contenido objetivo de
nuestro modelo, ha sido protegido.
En nuestro lenguaje, no se trata aqu de una hiptesis, sino de una eleccin de un tipo de modelo y, en caso
contrario, de su especificacin p = 1 / 2. Pero esta eleccin implica bien, como lo veremos, una hiptesis
objetiva (falsificable).
35
corroboran la validez del modelo para estos 20 datos, no nos garantiza de ninguna manera que
el fenmeno no cambiar de naturaleza ms adelante). Debido a que ella es objetiva
(introduce una informacin suplementaria, no contenida en los 20 datos), esta hiptesis nos
permite sacar de estos datos ms que lo que contienen, y de avanzar una previsin. Debido a
que es anticipativa (adaptada antes de que su validez haya sido controlada) introduce un
riesgo de error radical36 : Y este riesgo es la contraparte obligada de la ganancia de
informacin que ella introduce. Ms adelante volveremos largamente sobre este punto.
Otras eventualidades inesperadas pueden manifestarse. Supongamos que tenemos la idea
(extraa) de poner una coma despus de las dos primeras cifras 1, y leer la sucesin (S)
como la escritura binaria de un nmero x < 4: Al poner x en escritura decimal, encontramos,
porque hay 20 smbolos binarios, que x est comprendido entre 3.141590 y 3.141594.
Debemos concluir que (por una razn desconocida) se tiene bien x = , y avanzar como una
previsin determinstica que los 10000 ensayos por venir corresponden a los smbolos de la
escritura binaria del nmero , y avanzar como una previsin determinstica que los 10000
ensayos por venir corresponden a los smbolos siguientes de la escritura binaria del nmero
. Esta es una hiptesis anticipativa mucho ms fuerte que la anterior (ms fcilmente
falsificable) pero de la misma naturaleza y, cosa curiosa, de ninguna manera incompatible37 .
Cuya amplitud es de otro orden de magnitud que el nivel de error de 5% de 100 que predice el modelo. Es
la razn porqu yo hablo de error radical.
37
En el sentido que los tests usuales, aplicados a la sucesin de los n primeros smbolos binarios de , no
conduciran con verosimilitud al rechazo del modelo alternativa repetida. El suceso mismo (x1, x2, , s.f.) = n
primeros smbolos binarios de tiene, en el modelo, la probabilidad 1/2n , muy dbil ya para n = 20 (un
millonsimo), pero no puede, en principio, servir de criterio porque su eleccin ha sido sugerida por los datos.
De hecho, cada sucesin de 20 smbolos puede ser considerada como el comienzo de la escritura de un nmero
ms o menos notable (mltiplos enteros y potencias de etc.: basta con encontrar un milln).
38
Se encuentra, en el caso de algunos subjetivistas, proclamaciones estrepitosas, respecto, por ejemplo, del siglo
21, que ser, parece, un siglo valles ano. An un autor que se expresa de manera muy sensata y corts, como
B. de Fnete, deja caer a veces usases definitivos. Speaking of unknown probabilities must be forbidden as
meaningless, texto que leemos en su Theory of Probability (J. Wiley and Sons, 1974, p. 190). Porqu este
ruido de botas en la repblica de los sabios?
36
privada de cada uno de nosotros. Con el costo de una exageracin, se opondr el carcter
objetivo y desinteresado del conocimiento cientfico a la subjetividad y a la rapacidad salvajes
que se desencadenan en el dominio de la accin prctica; o, al contrario, se exaltar la vida del
hombre de accin, en detrimento del investigador, acusado de huir de la vida real y de sus
responsabilidades. Se puede tambin, quizs ms razonablemente, pensar que se trata de una
oposicin de grado ms que de natura. Porque la informacin que dispone el cientfico nunca
es perfecta, y el tambin por consecuencia, debe avanzar bajo su responsabilidad, hiptesis
cuya validez, por muy bien corroborada que est hoy, puede ser en cada instante ser puesta en
causa por el resultado inesperado de una experiencia nueva. Y, de su lado, el prctico no est
nunca despojado para que las hiptesis anticipativas (explcitas o implcitas) sobre las cuales
el funda sus decisiones estn totalmente desprovistas de valor objetivo: sino, el juego sin
piedad de la seleccin natural lo hara desaparecer rpidamente de la escena de la accin
prctica.
No existe una oposicin real, entre los objetivos que se proponen, y los criterios que se
utilizan en estos dos tipos de actividades. En lo que respecta a los objetivos, primero, se puede
observar que nuestras ciencias y nuestras tcnicas parecen vacilar, u oscilar, entre un modo
especulativo o explicativo, y un modo instrumental o de manipulacin. El primero, realista y
desinteresado 39 , pretende aspirar al conocimiento mismo, comprender o explicar el objeto
tal como si existiera independiente de nosotros y de las aplicaciones prcticas que podramos
hacer: No es que desprecie las aplicaciones, sino que estas deberan ser, de alguna manera,
como un bono, y el solo se interesar en la medida que estos vengan a ilustrar y corroborar
sus modelos explicativos. El segundo modo, por el contrario, quiere transformar el mundo,
ms que explicarlo, manipular y domesticar el objeto, sin interesarse a lo que es en realidad.
Es nominalista: El modelo no es la realidad, y muy instrumentalista: El mejor modelo es el
ms eficaz. Esta oposicin no es por otra parte irreducible: La manipulacin solo es eficaz en
la medida que el modelo utilizado es, de una u otra manera, adaptado a la realidad, o al
aspecto de la realidad, en el cual nosotros estamos interesados; y las teoras las ms
desinteresadas son cientficas en la medida en que sean operatorias: es, en definitiva la
eficiencia de las previsiones la que permite que se juzgue el grado de su validez. Pero, si
tomamos en consideracin el nmero, la amplitud y la generalidad de los objetivos
perseguidos, podemos decir, en grueso, que los modelos o teoras cientficas pretenden ser
mientras que los modelos prcticos, o tcnicos, se contentan mas
panscpicas40
modestamente, de ser poliscpicas, o an estrictamente monoscpicas.
En efecto, un modelo, o una teora cientfica, para ser vlida, debe, por definicin, permitir
prever correctamente el resultado de toda experiencia, de toda observacin, que nuestros
medios tcnicos y nuestros conocimientos actuales nos permiten imaginar y realizar
efectivamente (al menos en el dominio en el cual la teora es operatoria).. Y ella debe
entonces permitir tambin la solucin eficaz de todos los problemas prcticos, que tienen un
sentido actual, que somos o seramos capaces de proponernos en este dominio. As, el criterio
de validez es la eficiencia operatoria respecto de todos los objetivos considerables. Diremos
entonces que las teoras cientficas tienen un carcter panscpico.
39
La accin desinteresada es, en realidad, muy interesante, e interesada, admitiendo que seala Nietzche
(Par dela le bien et le mal).
40
Panscpicas: Todos los objetivos; monoscpica: Un solo objetivo.
37
Pero, para alcanzar este ideal cientfico panscpico, es necesario tiempo, reflexin, medios, y
una masa enorme de informacin. En las actividades prcticas, este ideal aparecer a menudo
como un lujo que, en el fuego de la accin, no tiene ni el tiempo, ni los medios para ofrecerse.
De donde el carcter ms o menos monoscpico de los modelos prcticos, el cual resulta en
alguna medida de un principio de economa. De hecho, en las actividades tcnicas,
econmicas, el hombre est confrontado sin cesar a problemas prcticos que deben
imperativamente recibir una solucin (lo ms buena posible, pero es necesario elegir una), y a
decisiones que deben imperativamente ser tomadas sobre la base de una informacin
insuficiente. En estas condiciones, no queda la distraccin (ni an el gusto) de interrogarse
largamente sobre las caractersticas objetivas de la situacin que no concierne directamente al
problema a resolver, o la decisin a tomar.
Lo que el esperar entonces, antes de todo, de un modelo (probabilstico o no) es la eficiencia
operatoria real en el nico dominio que le interesa, y le importar poco que el modelo sea
groseramente falso respecto de otros aspectos de la situacin que no le interesan directamente.
Su objetivo es monoscpico, y esto por razones de urgencia y de eleccin de prioridades.
Los criterios de validez no son evidentemente los mismos para los dos tipos de modelos. Una
teora cientfica (panscpica) se encuentra automticamente refutada si una cualquiera de las
consecuencias que se pueden deducir (en el dominio donde ella es operatoria) es refutada por
la experiencia. El modelo monoscpico, debe ser juzgado despus de su adecuacin al nico
objetivo que persigue. Pero, correlativamente, no se debe, no ms, esperar de el respuestas
sensatas a las preguntas para las cuales no estaba concebido para resolver.
Adems, contrariamente a las teoras cientficas, que presentan siempre un grado ms o menos
elevado de universalidad, el modelo monoscpico concierne lo ms a menudo un fenmeno
particular, una situacin nica, que no se encontrar nunca ms idntica a ella misma. La
condicin de repetitividad, sin la cual es difcil fundar definiciones operatorias y de justificar
la validez objetiva de un modelo, falta aqu. Si se agrega a esto que el modelo monoscpico se
elige en el fuego de la accin, es decir sobre la base de una informacin insuficiente por
definicin, y constituye entonces siempre una hiptesis anticipativa, que podr eventualmente
ser controlada despus de la tirada, pero de la cual nadie, en todo rigor, permitir afirmar la
validez en el momento que se adopta, se concibe que nos podemos interrogar sobre su status
epistemolgico, y tambin como los Bayesianos sobre su significacin objetiva.
Volveremos largamente al caso de la pregunta importante de la significacin y del valor
objetivo de los modelos probabilsticos monoscpicos. Lo ms importante a retener, por el
instante, es que en el momento en el cual se elige, este modelo monoscpico introduce una
hiptesis anticipativa cuya legitimidad no puede, de ninguna manera, ser garantizada por su
compatibilidad con los datos numricos disponibles: Porque esta hiptesis consiste, en suma,
justamente, a admitir que las caractersticas estructurales que hemos inducidos a partir de
estos datos pueden ser extrapoladas tal cual a las partes desconocidas del fenmeno; o an, si
se quiere, que el fenmeno se comporte, donde no se le conoce, de una manera
suficientemente anloga a lo que se ha observado donde es conocido. Esto implica dos
consecuencias: Para elegir una hiptesis de este tipo, es necesario tener en cuenta,
cuidadosamente, todas las fuentes de informacin, numricas o no, de las cuales se dispone
(conocimientos generales acerca de la fsica de este fenmeno, experiencia adquirida en casos
38
anlogos, etc); por otra parte debilitar al mximo esta hiptesis, de manera de reducirla al
mnimo estrictamente indispensable para permitir alcanzar el objetivo al cual mira el modelo
monoscpico: Valorizacin mxima de todas las fuentes de informacin, y principio de
economa estricta sobre la eleccin de las hiptesis anticipativas.
39
realizacin, hecha en una clase de pruebas eventualmente no idnticas, pero perteneciendo al
mismo gnero, definido de manera ms o menos ancha, que se funda a la larga la objetividad,
y no quizs de una previsin singular, sino al menos la de la metodologa que la ha conducido.
Si esta previsin solo representa nada ms que el estado de nimo del prctico o del que toma
decisiones, esto no interesara a nadie, ni an al que toma las decisiones: Debido a que lo que
el quiere, sobretodo, es que su decisin sea la ms eficaz posible, y esta eficiencia depende
evidentemente de la situacin objetiva.
Este criterio externo de objetividad consiste entonces, en suma, a examinar si se tiene o no
razn en promedio de utilizar tal metodologa para tratar de resolver tal categora de
problema.
Para tratar de formular esto de manera un poquilito ms tcnica, observamos primero que,
para utilizar el modelo de la alternativa repetida, o modelos anlogos del tipo 42 sucesin de
variables aleatorias independientes e idnticamente distribuidas no hemos, en ningn
momento, supuesto que se trataba (en la realidad) de la misma experiencia repetida
indefinidamente. Yo no afirmara de manera tan categrica, como los subjetivistas, que una
tal expresin no pueda, en ningn caso, presentar la menor significacin objetiva. Porque,
despus de todo, los fsicos me parecen personas que saben lo que dicen (y lo que hacen).
Pero, en el dominio que es el nuestro, las dificultades seran muy reales. Se encuentra,
felizmente, que no necesitamos de ninguna manera una hiptesis de este tipo para fundar
nuestro criterio de objetividad externa (metodolgica). Puede tratarse, en principio, de
experiencias cualesquiera, siempre que se sepa, o se pueda, identificarlas. Naturalmente, en
materia cientfica, no ms, no est prohibido tener buen sentido, , y no se introducir de
manera voluntaria en el mismo modelo las elecciones francesas de 1978, los yacimientos de
petrleo de Oriente Prximo, la edad del capitn y la cabra del seor Seguin. Pero puede
tratarse de experiencias realmente muy diferentes.
Lo mejor es tomar un ejemplo. Existen tipos sorprendentemente variados de yacimientos de
cobre, pequeos y grandes, muy ricos o con ley media muy baja, de estructura simple o
complicada, con leyes dbilmente o fuertemente dispersas, etc Por otra parte, la
informacin de la cual se dispone para proceder a su estimacin es, tambin, extremadamente
variable en naturaleza, cantidad y calidad. Descartemos los detalles tcnicos, y supongamos
unvocamente definida la nocin de recurso o cantidad Q , expresada en millares de toneladas
de cobre contenido en un yacimiento dado. Esta cantidad solo ser conocida una vez
42
La clase ms general de modelos de este tipo est dada por un especio de probabilidad (, A, P) definido
como el producto de una sucesin infinita de espacios (n, An, Pn) idnticos (en lenguaje riguroso: Isomorfos).
Cada espacio factor describe un fenmeno o una experiencia dada, el espacio producto corresponde al conjunto
de estos fenmenos o experiencias: Debido a que la probabilidad P est definida como el producto de las
probabilidades Pn , las variables Xn, Yn, etc las cuales describen la experiencia n son, por construccin
independientes (en el modelo) de las variables relacionadas con las otras experiencias. Esta clase de modelos
constituye la transposicin matemtica de la nocin fsica de repetitividad. Se observa el carcter formal, o
convencional, del espacio (definido, simplemente, en suma, como el conjunto de todos los resultados posibles
de todos los experimentos que se puedan considerar). Y su carcter modular (en el sentido de ser extensible a
voluntad): Siempre puede ser enriquecido a voluntad al agregarle nuevos factores isomorfos (n, An, Pn) cada
vez que el deseo de tomar en cuenta una nueva sucesin de experiencias posibles se haga sentir. Esto contrasta
con el carcter concreto del espacio de los modelos para los cuales existen (como en fsica) criterios internos
de objetividad.
40
efectuada la explotacin efectiva. Supongamos (lo que es el caso) que nosotros disponemos
de una metodologa la cual nos permite integrar, en un modelo probabilstico, cualquier
informacin disponible en el momento en el cual se debe estimar este yacimiento (luego,
entes de su puesta en explotacin). En este modelo, le corresponde a Q una variable aleatoria
que tambin llamaremos Q, y nuestro modelo contiene el enunciado: Hay una chance sobre
dos para que Q sea superior a q. Aqu, q es un valor numrico el cual somos capaces de
calcular (en el modelo, q es la mediana de la variable Q condicional a la informacin
disponible). Poco nos importa, por el momento, que este enunciado individual tenga o no un
sentido objetivo. Si hemos estimado as un centenar de yacimientos, numerados de n =1 a n
= 100, podemos comparar, para cada uno de ellos, sus recursos Qn , ahora conocidos, y la
mediana qn que nuestra metodologa haba atribuido a la variable correspondiente del
modelo. Poniendo Xn = 1 si Qn qn y Xn = 0 si Qn < qn , estamos en presencia de una
sucesin de xitos y fracasos a la cual le asociamos el modelo (especfico) de la alternativa
repetida con p = : podemos entonces testear este modelo (ms precisamente, controlar la
validez del modelo fsico que este modelo probabilstico permite reconstruir). Si se juzga que
100 pruebas no bastan (en la prctica yo quiero decir: a los ojos de los prcticos de la
industria minera, bastarn con certitud), se puede esperar tener 200 o 1000 . Pero estamos (o
estaremos) en medida de tener un juicio sobre el valor de nuestra metodologa. Esta es
entonces objetiva, porque puede ser, y ser descalificada si conduce, en promedio, a errores
notables de previsin 43.
CRITERIOS DE OBJETIVIDAD INTERNA, LIGADAS AL CARCTER CONCRETO
DEL ESPACIO .
Segn el texto ya citado de J. Ullmo 44, la idea de azar, es decir, en realidad, el uso de
modelos probabilsticos se introduce en fsica cuando las condiciones iniciales inseparables
experimentalmente son seguidas ulteriormente de una separacin manifiestamente de los
fenmenos observados. Lo mejor que podemos hacer aqu es ilustrar esta concepcin
profunda con un ejemplo simple: Consideremos el caso (ideal) de un billar circular. La bola,
la cual se lanza inicialmente sin efecto de rotacin rebota en la banda circular respetando las
leyes de la reflexin, de manera que, de un choque al siguiente, el ngulo que fija su
posicin aumenta en una cantidad (en principio) constante . Admitiremos adems que las
prdidas de energa pueden ser despreciadas, de manera que la bola circula indefinidamente
sobre el billar. Introduzcamos una nocin fsica simple, la de frecuencia de visita fn(l) de un
arco cualquiera de longitud l contada en radianes sobre la banda, en el curso de n rebotes
consecutivos. Dicho de otra forma, se tiene fn(l) = k/n , en que k es el nmero de ocasiones en
que el rebote se produce en un punto del arco l. Se demuestra, entonces, el teorema
siguiente: cuando n tiende a infinito, la frecuencia de visita tiende hacia la razn l/2 ,
siempre y cuando /2 no sea un nmero racional. Si, al contrario, /2 es un nmero
racional, la bola pasar indefinidamente de nuevo por los mismos puntos, en nmero finito, y
43
Se puede ir ms lejos. A cada Qn nuestra metodologa le asocia la ley de probabilidad Fn de la variable que
le corresponde en el modelo, Fn(Qn) es entonces una variable con distribucin uniforme en (0, 1). Se puede
entonces, utilizando la sucesin Xn = Fn(Qn) de los valores numricos obtenidos, testear la validez del modelo
sucesin de variables independientes e uniformemente distribuidas en (0, 1)
44
Los conceptos fsicos, en Logique et Connaissance Scientifique, por J. Piaget y otros, Pars, 1967, p. 649.
41
Desde el punto de vista fsico, esta restriccin no es molesta: Porque para atribuir un tomo bien localizado a
este ley, sera necesario tener una informacin extraordinariamente precisa (experimentalmente imposible) sobre
el error .
42
reemplazar n por n + n para obtener, de nuevo, la misma ley: Este fenmeno de
convergencia hacia una ley lmite unvocamente impuesta es una manifestacin de la
propiedad conocida con el nombre de ergodicidad.
La manera ms simple para definir el modelo probabilstico consiste en hacer corresponder a
una variable aleatoria la cual tiene una ley cualquiera, siempre que admita una densidad.
Entonces es de la forma = 0 + , con un 0 numricamente conocido, y, en el
modelo n = 0 + n0 + n es una variable aleatoria, cuya ley de nuevo, converge hacia la
ley uniforme. El inters de esta formulacin es que, ahora, los casos de excepcin (/2
racional) tienen, en el modelo, una probabilidad nula (cualquiera que sea la ley de la cual
admite una densidad).
Se puede tambin mejorar el modelo al observar que, el plano del billar y la banda presentan
lgicamente pequeas irregularidades, los incrementos sucesivos n = n+1 - n no podrn
ser rigurosamente iguales. An si, por azar, uno de ellos fuera un mltiplo racional de 2, los
otros no lo seran. De manera que los casos de excepcin son efectivamente excluidos por esta
consideracin fsica. Al tomar esta vez n = + n , con (en el modelo) variables
aleatorias n cualesquiera (no necesariamente independientes, basta con que no sean muy
correlacionadas), se demuestra entonces que n, 2n, 3n , etc para n bastante grande son,
en el modelo, variables independientes, las cuales admiten siempre esta misma ley uniforme.
Y el valor de este modelo puede, ahora, ser controlado experimentalmente, sin que sea
necesario repetir la experiencia.
No insistir ms con este ejemplo 46 , cuyo objetivo era solamente mostrar como las
consideraciones fsicas concretas imponen, en ciertos casos, la eleccin de un modelo
probabilstico nico y bien determinado: Es el anlisis fsico del fenmeno mismo el que nos
ha proporcionado los criterios de objetividad interna (es decir que permite juzgar desde el
interior la objetividad del modelo probabilstico, sin recurrir a la repeticin de la misma
experiencia).
Sin embargo, en estas indicaciones ejemplares que nos ofrece la fsica, no se trata
verdaderamente de fenmenos nicos, porque la condicin de repetitividad est siempre
presente, y nos permite reforzar y recortar mediante controles externos, basados en la
repeticin, los criterios propiamente internos de la objetividad de estos modelos. Demos
entonces un ejemplo, de apariencia totalmente banal, pero que sin embargo se revelar
esclarecedor cuando abordemos, en la tercera parte, la bsqueda de modelos estrictamente
objetivos, o, como los llamaremos, de representaciones probabilsticas , los cuales permiten
describir los fenmenos nicos.
Sea S un dominio acotado del espacio usual (con dos dimensiones por ejemplo) y f(x) una
funcin 47 definida en S . Nos damos, igualmente, una ley de probabilidad en S , por ejemplo
la ley de densidad uniforme en S . En el modelo en que x designa el punto aleatorio
46
43
obtenido al tirar al azar un punto de x en S segn esta ley de probabilidad 48 , la funcin
f(x) es una variable aleatoria. La ley de esta variable est definida por su funcin de
distribucin F: F(a), probabilidad de tener f(x) a , es la medida (superficie, si el espacio es
de dos dimensiones) del subconjunto de S definido por la condicin f(x) a. Esta ley tiene
un sentido absolutamente concreto y, en particular, objetivo: Una vez que se conoce la
funcin f, cualquier enunciado probabilstico relativo, en este modelo, a la variable aleatoria
f(x) es, en efecto, decidible, en sentido estricto. Todos los parmetros asociados a esta ley
tienen, ellos tambin, una estricta significacin objetiva. Por ejemplo, la esperanza
matemtica m de la variable f(x) de este modelo es, por construccin, igual al valor medio
en S de la funcin f , es decir:
m=
1
S
f ( x ) dx
S
44
SEGUNDA PARTE
LOS CRITERIOS DE LA OBJETIVIDAD INTERNA EN EL CASO DE FENOMENOS
UNICOS.
Traduccin aproximada: Toda cosa que existe fuera del pensamiento, es por ello mismo una
cosa singular.
45
CAPITULO III
EL BOSQUE POISSONIANO.
En las pginas que siguen y, salvo excepcin, hasta el fin de esta obra, concentraremos
nuestra atencin sobre el caso de un objeto o fenmeno nico un bosque, un yacimiento
minero, una cadena de montaas etc ocupando una porcin bien delimitada y acotada del
espacio en el cual vivimos. Estos objetos son interesantes por s mismos. Pueden ser, y son
efectivamente, estudiados del punto de vista panscpico que es aqul del conocimiento
cientfico. Pero ellos son tambin tiles. El prctico encargado de administrarlos y de
explotarlos el forestal, el minero encuentran problemas, de naturaleza esencialmente
prctica, los cuales debe resolver, de una manera u otra para llevar bien su tarea: El minero,
por ejemplo, debe estimar las diferentes partes de su yacimiento, antes de decidir cuales
explotar y cuales abandonar, como muy pobres. Para hacer esta estimacin, solo dispone, por
la fuerza de las cosas, de una informacin limitada y fragmentaria: Su punto de vista ser
entonces, esencialmente monoscpico: No porque no le interesen otros aspectos de su objeto,
sino que se observa, a menudo, por el contrario, en los profesionales, una suerte de
entusiasmo contenido; pero el debe pensar primero en cumplir su tarea. En adelante, adoptar
unas veces uno y otras veces el otro de estos puntos de vista, pero el balance se inclinar ms
bien a favor de los modelos monoscpicos: Es a propsito de estos ltimos, en efecto, que el
problema de la objetividad se plantea de la manera ms aguda; es de ellos tambin que yo
adquir, por una prctica larga, el mximo de experiencia directa, por consiguiente de ellos yo
puedo esperar hablar sabiendo ms o menos lo que digo.
La objetividad externa, es decir la de la metodologa general que sirve para construir los
modelos individuales, no ocasiona problemas mayores: Es simplemente, la sancin de la
prctica. La Geoestadstica, por ejemplo, ya ha servido para estimar ms de un centenar de
yacimientos mineros, y ya ha hecho sus pruebas, y puede ser considerada como objetivamente
fundada. Se tratar entonces, en lo que sigue, esencialmente de la objetividad interna: la de los
enunciados respecto de este yacimiento, este bosque. Comenzaremos por un ejemplo como
introduccin, el del bosque poissoniano.
46
EL PARAMETRO : EXISTE, ES UTIL?
Para entrar concretamente en el corazn del sujeto, consideremos el modelo poissoniano a
veces utilizado por los forestales para representar la distribucin de los rboles (asimilados a
puntos) en el estudio del bosque (J. P. Marbeau 50 ). Naturalmente, decir que el bosque es
poissoniano es una manera abreviada de indicar que los datos disponibles no son
incompatibles con esta interpretacin poissoniana. En la ptica estadstica ortodoxa, el
problema ms importante que se planteara entonces sera el de la inferencia estadstica, es
decir, el de la estimacin de la densidad desconocida de este proceso poissoniano. En
efecto, una vez que este parmetro es conocido, se pueden calcular todas las otras
caractersticas del proceso. Este punto de vista atribuye, implcitamente, una existencia real,
objetiva, a la densidad : an en el caso en que nuestra informacin solo nos permita una
estimacin que se aproxima al verdadero valor , esto no cambia el hecho de su existencia en
la naturaleza, y podra ser objeto de una medida rigurosa si nuestra informacin fuera
perfecta. Por otra parte, no es cierto que esta afirmacin tenga un sentido operatorio: Para
determinar rigurosamente, sera necesario que el bosque se extienda hasta el infinito
(permaneciendo poissoniano), mientras que su extensin real est evidentemente limitada.
Esta falsa evidencia (la existencia de ) reposa sobre una identificacin resumida del modelo
(el proceso de Poisson) y la realidad (el bosque): Esta confusin, frecuente en los estadsticos,
es un verdadero corto circuito epistemolgico. Porque, por muy adaptado que sea el modelo a
su objeto, no tenemos en ningn caso la garanta que todas sus caractersticas sean el reflejo
fiel de propiedades objetivas que les correspondera biunvocamente en la realidad.
Si mantenemos cerradamente esta distincin necesaria entre el modelo y la realidad, el
problema (en estricto rigor insoluble) de la inferencia estadstica pierde en gran parte su
importancia. El parmetro quedara en parte indeterminado, an si conociramos
perfectamente el bosque: Se puede entonces poner seriamente en duda su existencia
objetiva , y por consiguiente tambin de no juzgar como demasiado grave su
indeterminacin. De hecho, el problema prctico que interesa al forestal no es en ningn caso,
la estimacin de la densidad poissoniana del modelo terico: Esta (si se recurra a ella) no
intervendr nunca, solamente como un intermediario cmodo de clculo, y desaparecer
siempre del resultado final. En realidad, el forestal desea, por ejemplo, estimar el nmero
N(S) de rboles presentes en una superficie S dada, conociendo el nmero N(s) de rboles
contados en la superficie s muestreada. Para estimar (S) y N(S), l calcular las
cantidades:
(1-1)
1
s
* ( S ) = N ( s)
N * (S ) =
S
N (s)
s
47
(terminologa ms vaga, pero relativa a la realidad fsica, y no ms al modelo, y presentando
un sentido para los prcticos).
Al contrario, el carcter poissoniano del modelo interviene efectivamente en el momento del
clculo de la varianza de estimacin 2 , es decir, la varianza (en el modelo) del error N(S) N*(S). Si se supone que la superficie muestreada s est incluida en la superficie S a estimar
( s S ) , se encuentra sin dificultad la expresin siguiente:
E2 =
S (S s)
s
(1-2)
SS
E2 = N ( s ) 1
ss
48
adecuado para representar una realidad fsica dada. Una vez admitida y este es un punto
crucial - una cierta interpretacin fsica de la realidad (homogeneidad en el espacio, e
independencia de zonas disjuntas) la cual conduce a adoptar el modelo genrico
poissoniano, el problema de la especificacin de este modelo (la estimacin de ) solo
presenta una importancia limitada, o, anlogamente no existe realmente: Ni las expresiones
(1-1) de los estimadores, ni la varianza (1-2) que se les atribuye dependen de . Solamente
para simplificar el lenguaje se dir este bosque puede ser representado por un proceso de
Poisson el cual admite la densidad = tantos rboles por hectrea (y el valor numrico
atribuido a coincidir con el del estimador *(S) de la densidad media en S).
49
hiptesis son compatibles con los datos, es decir son verificadas en parcelas
muestreadas. Es necesario admitir tambin que estas hiptesis siguen siendo vlidas en
las zonas no muestreadas. Y esto, solamente despus de la tirada, lo sabremos. La
eleccin del modelo constituye una hiptesis anticipativa, e implica siempre un riesgo
de error radical, y es porque se debe imperativamente tener en cuenta, no solamente
los datos numricos, sino igualmente todas las otras fuentes de informacin que se
puede disponer (conocimientos generales sobre este tipo de fenmeno, experiencia de
los prcticos, etc).
Para localizar mejor el aporte de la informacin positiva y la aparicin correlativa de
la vulnerabilidad del modelo, habr a menudo inters en distinguir dos etapas en la
eleccin del modelo genrico: Eleccin de un modelo genrico en sentido amplio,
luego eleccin de un tipo particular en el modelo. Aqu, el modelo genrico (en
sentido amplio) sera proceso puntual estacionario. La palabra puntual significa que
hemos decidido considerar, en primera aproximacin, los rboles como puntos en el
plano. Esto es una decisin (constitutiva) la cual no implica ni aporte de informacin
ni riesgo de desmentido experimental. Al contrario, la palabra estacionario est
asociada a una hiptesis de homogeneidad en el espacio, e implica aporte positivo y
vulnerabilidad, pero con un grado relativamente dbil. Por tipo de modelo,
entenderemos un modelo en el cual solo falta para ser completamente especificado
conocer valores numricos de un nmero pequeo de parmetros. Aqu, el tipo de
modelo elegido es el proceso de Poisson, con un solo parmetro indeterminado (el
parmetro ). La eleccin de este tipo est ligada a una hiptesis muy fuerte (ausencia
de influencia entre zonas vecinas); el introduce una informacin muy rica (que permite
entre otras cosas el clculo de varianzas de estimacin) y entonces tambin riesgos de
desmentido experimental. Esto es una circunstancia general: Lo ms a menudo, es la
eleccin de un tipo en un modelo genrico lo que constituye la decisin crucial, la que
abre el mximo de posibilidades operatorias, y, correlativamente, introduce el mximo
de riesgo de error.
(3) La ltima etapa, finalmente, es la eleccin del modelo especfico o, como diremos
tambin, la especificacin del modelo (aqu la eleccin del valor numrico = tantos
rboles por hectrea). La estadstica matemtica atribuye una importancia
absolutamente predominante a este tercer aspecto de la eleccin del modelo, y le
asigna el nombre de inferencia estadstica (es decir estimacin numrica de los
parmetros), la cual juega aqu un papel muy apagado, o an nulo, porque los resultados
esenciales (la estimacin y la varianza) se expresan, en definitiva, con la ayuda de los
datos experimentales solos, en una forma que hace intervenir las elecciones 1) y 2) (y
sobre todo la eleccin del tipo poissoniano) pero de ninguna manera la eleccin 3) del
valor numrico de . En suma, solamente por comodidad de lenguaje, y para fijar las
ideas, nosotros procedemos a la especificacin del modelo, mientras que la eleccin 1)
(epistemolgica) y la eleccin 2) (el modelo genrico y su tipo), junto a la informacin
numrica aqu N(s) - nos proporcionan una base operatoria suficiente para resolver
los problemas que nosotros nos proponemos.
La distincin precisa de estos tres aspectos acerca de la eleccin del modelo parece elemental
y poco interesante en un caso tan simple como el del bosque poissoniano. Pero las cosas
cambiarn rpidamente en la medida en que examinemos modelos ms ricos. Una vez
50
admitida la eleccin del modelo constitutivo (decisin epistemolgica) el problema capital es
la eleccin 2) , la del modelo genrico y ms particularmente del tipo de modelo: Porque, una
vez adoptado un tipo de modelo que se adapta convenientemente a los datos experimentales,
es en general razonablemente posible especificarlo (si se desea verdaderamente)
conformemente a estos mismos datos. El problema importante no es entonces la inferencia
estadstica, sino la eleccin del modelo genrico y de su tipo. Notamos bien que no se trata
simplemente aqu de testear una hiptesis con la ayuda de los datos: Este punto de vista,
que es el de la estadstica ortodoxa, deja escapar lo esencial: No solo necesitamos estar de
acuerdo con los datos disponibles, sino que con la hiptesis mucho ms fuerte que el tipo
elegido sea compatible tambin con los datos no disponibles, es decir con las partes
desconocidas o inaccesibles del fenmeno. Es esta ltima hiptesis la que explica la
fecundidad del mtodo, y tambin, lo hemos visto, su vulnerabilidad. La compatibilidad con
los datos es, evidentemente, necesaria, pero ella no basta en ningn caso para garantizarnos
contra un desacuerdo siempre posible con lo que no nos es dado (y que justamente buscamos
estimar).
Examinaremos en el captulo 4, en un marco ms general, la jerarqua de los modelos topoprobabilsticos, y el problema de la eleccin, tal como se presente en cada una de las tres o
cuatro etapas que hemos distinguido. Antes, vamos a proceder a un examen crtico de nuestro
ejemplo elemental, lo que nos permitir extraer algunos hilos directores.
51
interpretacin poissoniana. Es cierto que las respuestas que dan los tests estadsticos son
siempre equvocos. Pero, tratndose de poblaciones que tienen al menos 100 individuos, y en
general mucho ms (hasta 250.000 para el valor ms pequeo de s), estas respuestas sern
suficientemente netas para que nosotros podamos despreciar este margen de ambigedad o de
indeterminacin (inherente, lo hemos visto, a la definicin de cualquier concepto operatorio).
Si estas poblaciones son suficientemente poissonianas, y si las varianzas (experimentales)
correspondientes 2(s) son aproximadamente proporcionales a la superficie s (y el grado de
aproximacin admisible puede igualmente, en una cierta medida, ser precisado en la base de
consideraciones estadsticas), hemos puesto en evidencia la existencia de una ley
(aproximada) 2(s) = s , que constituye justamente la definicin operatoria de la densidad
poissoniana .
Dicho esto, es necesario agregar inmediatamente:
i)
ii)
E [ N (s)] =
s
s
s
N ( S ) ; Var [ N ( s ) ] = 1 N ( S )
S
S S
52
Para un estadstico, esta eliminacin del parmetro proviene del hecho que (S) = N(S)
/ S constituye una estadstica exhaustiva, es decir resume la totalidad de la informacin
que disponemos para estimar , lo que se traduce aqu por el hecho que la ley
condicional de las variables N(s) asociada a las diferentes parcelas no depende ms de
cuando N(S) es fijo. En esta forma, se trata de una particularidad del proceso de
Poisson, la cual no permanecera en el caso de procesos ms generales. Pero esta manera
de presentar las cosas consiste en invertir los papeles, yo quiero decir un juicio sobre la
realidad ponindose en el punto de vista del modelo. Dar ms lejos un enunciado general
del criterio de objetividad que necesitamos. Por el momento, sigamos el estudio de nuestro
bosque poissoniano.
UN CRITERIO DE OBJETIVIDAD: LAS MAGNITUDES REGIONALES.
En este estado del anlisis, comenzamos a sospechar que el parmetro del modelo
terico est quizs bien desprovisto de existencia objetiva, porque todas las caractersticas
objetivas que le hemos atribuido, comprendiendo su definicin operativa, estn tambin
considerados por el pretendido estimador (S) = N(S) / S (y, en efecto, mejor, porque la
frmula (1-3) de la varianza conserva un sentido para s = S: La varianza de N(S) es
efectivamente nula, porque N(S) es fijo). Se ve as caer el punto de vista de la estadstica
ortodoxa: Lo que era considerado como una realidad, desconocida pero existente
objetivamente y que debe ser objeto de una inferencia estadstica (el parmetro ), se
revela una ficcin intil, y es la pretendida estimacin (la densidad media (S) = N(S) / S
del bosque real) la cual recibe sola, ahora una significacin objetiva.
Convenimos en llamar magnitudes regionales, o simplemente regionales las cantidades
como N(S) , o tambin los nmeros N(s) asociados a todas las parcelas s posibles, se
encuentran definidas sin equvoco cuando el fenmeno regionalizado en el cual estamos
interesados (aqu, el bosque) es suficientemente conocido en la totalidad de su extensin
espacial (o campo) S. El parmetro no es una magnitud regional, y, tambin, lo hemos
visto, est desprovisto de significacin objetiva. Podemos enunciar un primer principio,
til para orientarnos en la eleccin de modelos probabilsticos destinados a describir los
fenmenos nicos:
Principio de las magnitudes regionales: Entre los parmetros de un modelo topoprobabilstico destinado a describir un fenmeno nico, solo tienen significacin objetiva
aquellos que se pueden expresar en trminos de magnitudes regionales. Anlogamente,
entre los conceptos introducidos por este modelo, solo tienen un sentido objetivo los que
pueden recibir una definicin operatoria en trminos de magnitudes regionales, es decir
una definicin constituida por un sistema de relaciones experimentalmente verificables
(en un dominio de validez dado, con una aproximacin dada) entre tales magnitudes.
As, el concepto de ley de distribucin (poissoniana o binomial) del nmero N(s) de
rboles presentes sobre las parcelas de talla s tiene, innegablemente, un sentido
operatorio, siempre que s no sea ni muy pequeo ni muy grande. Al contrario, para s =
S, no tiene ningn sentido operatorio considerar N(S) como una variable poissoniana de
esperanza S.
53
EL PUNTO DE VISTA DE LA PRACTICA.
Vamos ahora al segundo problema, el de la posibilidad de una estimacin sobre la base de
una informacin parcial. En particular, debemos preguntarnos si el concepto de varianza
de estimacin introducido anteriormente, es susceptible de recibir una definicin
operatoria en trminos de regionales. La respuesta es diferente si nos localizamos
despus de la tirada (es decir si se supone el bosque perfectamente conocido, y si se
compara con la realidad las estimaciones que se habran podido hacer sobre la base de tal
o tal informacin parcial que nosotros podemos elegir a voluntad) o en el calor de la
accin (es decir si se supone que solamente se tiene una informacin parcial a nuestra
disposicin).
Despus de la tirada, la respuesta es ciertamente positiva: Se puede definir la varianza de
estimacin en trminos de magnitudes regionales (en el caso general, hay tambin, varias
formas no equivalentes de hacerlo, y esta dificultad retendr ms tarde nuestra atencin.
Pero, en el caso poissoniano, todas estas definiciones son equivalentes y la ambigedad
desaparece). La frmula (1-3), en efecto, la cual proporciona la varianza de N(s) (con
N(S) fijo) expresa una relacin, experimentablemente verificable, entre magnitudes
regionales: En la medida en que ella ha sido efectivamente verificada, tenemos el derecho
de deducir la varianza del error asociado a la estimacin de N(S) sobre la informacin
N(s) aportada por el muestreo de una superficie (de forma cualquiera) de talla s, lo cual
proporciona:
(1-4)
E2 = 1 N ( S )
s
Si, ahora, nos localizamos en el calor de la accin, N(S) es desconocido (es justamente
esta magnitud la que queremos estimar) y solo se puede sustituir por su estimacin, que es
(S / s) N(s) . Se encuentra de nuevo la relacin (1-2), que constituye una aproximacin
razonable de (1-4), siempre que s no sea muy pequeo.
El valor objetivo de la frmula (1-2) la nica que se puede utilizar en la prctica es
entonces inferior, pero comparable con la de la definicin operatoria (1-4). Solamente la
validez de esta ltima solo puede ser definitivamente establecida en el caso despus de la
tirada (cuando se conoce todo el bosque) y no sobre la base de informacin parcial
disponible en el calor de la accin. Por consiguiente tambin, el valor de (1-2) depende
de la validez de una hiptesis anticipativa (que puede revelarse como falsa despus de la
tirada) segn la cual el carcter poissoniano, que hemos podido razonablemente testear en
la porcin muestreada, puede ser extendido a toda la superficie S.
Esta es una circunstancia general: Nunca estaremos al abrigo de malas sorpresas: El hecho
que el modelo est en buen acuerdo con un muestreo parcial no nos garantizar nunca que
permanecer compatible con la totalidad del fenmeno. Por consiguiente toda previsin
(comprendiendo la de una varianza de estimacin o de cualquier otro concepto expresable
en trminos de magnitudes regionales) hecha sobre la base de una informacin parcial y
de un modelo puede revelarse groseramente falsa. El grado de confianza que nosotros
54
podemos atribuirle est ligado al valor objetivo de una hiptesis anticipatoria la cual,
justamente, solo podremos juzgar despus de la tirada. En materia cientfica, siempre se
puede suspender el juicio esperando disponer de informacin complementaria. Pero el
prctico, el, est obligado de tomar una decisin en el calor de la accin, es decir sobre la
base de una informacin en general insuficiente, y esto implica siempre un riesgo de error
radical.
55
CAPITULO IV
Ahora es necesario definir con un poco ms de precisin los niveles que hemos
encontrado a propsito del ejemplo simple del bosque poissoniano: El modelo
constitutivo, el modelo genrico, su tipo de especificacin. La situacin de referencia es la
siguiente: nos interesamos en un cierto fenmeno definido en un dominio acotado S del
espacio (euclidiano, con 1, 2 o 3 dimensiones, eventualmente 4 si se desea tambin
hacer intervenir el tiempo). Supondremos que este fenmeno se deja describir de manera
satisfactoria por el conocimiento de una (o eventualmente varias) funcin z definida en
S , que llamaremos, de una manera general, variable regionalizada (V. R.). La expresin
despus de la tirada significar siempre que nos localizamos, en el pensamiento, en la
situacin ideal en la cual se conoce el valor numrico de z(x) en cada punto x S; la
expresin in praxis 51 , al contrario, designa la situacin, habitual en la prctica, en que
solo se dispone de un muestreo parcial de la V. R., por ejemplo de los N valores
numricos z = z(x) tomados por ella en N puntos experimentales dados, x , = 1, 2,
, N (se puede tambin, naturalmente, considerar el caso en que los z son valores
numricos de tales o cuales funcionales de z , por ejemplo los valores medios de la V. R.
en conjuntos dados s S , aquel en el cual los valores medios de la V. R. estn afectados
de errores de medida, etc). Pero se entiende que, an en praxis, tenemos tambin,
adems de la informacin numrica, ciertos conocimientos de naturaleza cualitativa y
estructural sobre la fsica del fenmeno, algunas ideas (intuitivas o rigurosas, por otra
parte, eventualmente errneas) sobre el tipo de comportamiento que es susceptible de
presentar, una experiencia adquirida por haber tratado ya casos similares, las opiniones
(eventualmente contradictorias) de diversos especialistas y prcticos etc Estas diversas
fuentes de informacin, a pesar de su naturaleza heterognea y su desigual calidad, miden
un gran peso en el momento en que se debe elegir un modelo, es decir adoptar in praxis
una hiptesis anticipativa. Nosotros los designaremos de manera general como la
informacin no numrica o cualitativa.
In praxi: en la accin. Con un poco de lirismo, se puede entender como: en el fuego de la accin.
56
sugerido el criterio de K. R. POPPER, la nica falsificabilidad, porque, despus de la
tirada, por definicin, todos los falsificadores virtuales del enunciado son ellos mismos
decididos, es decir clasificados unvocamente como verdaderos o falsos. En estas
condiciones, por otra parte, el valor de verdad del enunciado (1 si es verdadero, 0 si es
falso) aparece como un funcional de z , luego tambin es un valor regional.
En adelante, flexibilizaremos este criterio demasiado rgido, y volveremos al criterio
popperiano fundado en la falsificabilidad solamente. Es que en efecto la variable
regionalizada z no es de ninguna manera igual a la realidad, pero constituye por ella misma
un primer modelo. No hay, originalmente, en la naturaleza, nada como los puntos x S o los
valore numricos z(x) : Somos nosotros los que los introducimos, despus de una primera
poda o de una primera simplificacin de la abundancia de la realidad. Esta diferencia original
queda desapercibida la mayor parte del tiempo, pero reaparece en ciertas ocasiones crticas,
cuando se hace sentir el deseo de un anlisis ms fino acerca de ciertos conceptos
matemticos (la continuidad y la derivabilidad por ejemplo). Volveremos sobre esta dificultad
en el prrafo consagrado al modelo primario, y razonaremos, por el momento, como si
tuviramos el derecho de identificar la V. R. a la realidad.
Segn este criterio, enunciados tales como: La variable regionalizada z es la realizacin de
una funcin aleatoria, o tambin, ms precisamente, de una funcin aleatoria estacionaria
no tienen significacin objetiva: No podran ser declarados ni verdaderos ni falsos, an si
conociramos todos los valores numricos de z , es decir el mximo de informacin emprica
que nos es posible adquirir. Anlogamente, un enunciado como: Hay 99 chances sobre 100
para que el valor medio de z sea superior a 2.5 no tiene significacin objetiva, al menos
con el criterio presente, que es un criterio de objetividad interna.
En la prctica, sin embargo, se utilizan enunciados de este gnero. Se tiene razn de hacerlo,
y, por otra parte, se est casi obligado: Pero es necesario invocar un criterio diferente, el que
hemos llamado la objetividad externa, o metodolgica.
Entre los parmetros que sirven para especificar nuestro modelo, solamente tendrn
significacin objetiva aquellos para los cuales ser posible su identificacin con magnitudes
regionales. Les llamaremos parmetros objetivos, y los otros sern llamados parmetros
auxiliares o convencionales. Por ejemplo, en el modelo en que la variable regionalizada z es
considerada como una realizacin de una funcin aleatoria, con esperanza m = E[ Z(x)] , esta
esperanza no es un parmetro objetivo, sino un parmetro convencional. Anlogamente, un
concepto, an en el caso de admitir en el modelo una definicin matemtica, ser considerado
como operatorio (en un dominio de validez definido) si es posible redefinirlo por medio de un
sistema de relaciones experimentalmente controlables despus de la tirada (con una
aproximacin dada, en un dominio dado), entre valores regionales.
EL MODELO CONSTITUTIVO.
En el caso que nos ocupa, el modelo constitutivo es el de la funcin aleatoria (F. A.). Elegir
este modelo significa que nosotros decidimos considerar la V. R. z(x) , x S como (la
restriccin a S de) una realizacin de una F. A. Z(x), que debemos especificar ms adelante,
57
pero en este estadio se trata solamente de la nocin (matemtica) de F. A. en general. Se trata
entonces nicamente de una eleccin metodolgica, de una decisin que nosotros tomamos, y
no de una hiptesis verificable o falsificable. Hemos visto, por otra parte, que la proposicin
la V. R. z es una realizacin de una F. A. est desprovista de significacin objetiva. Esto
no significa que esta decisin sea arbitraria. Si la tomamos, es que tenemos buenas razones
para pensar que es la mejor decisin posible, la nica quizs, que nos proporciona un marco
conceptual en el cual podemos esperar la formulacin y la mejor resolucin de los problemas
que nos ocupan. Antes de tomarla, nosotros habremos ciertamente ensayado, en este caso o en
otros anlogos, de ajustar un modelo determinstico o funcional, que nos habra, es cierto,
permitido previsiones ms precisas, pero siempre, sin xito (esto se entiende, evidentemente,
in praxis: despus de la tirada, disponemos siempre de un modelo funcional muy preciso, a
saber la funcin z misma. Pero, an despus de la tirada este modelo perfecto tiene el riesgo
de ser mucho ms complicado para que se le pueda utilizar de manera cmoda).
Esta eleccin no es constitutiva respecto del fenmeno mismo (que existe y que es
independiente de las decisiones que tomemos respecto se su materia), mi respecto de la . R.
z(x) tambin: sta representa por otra parte un primer modelo constitutivo, anterior a la F. A. ,
porque delimita y constituye un primer objeto de estudio, operando una primera reduccin o
simplificacin en el aumento desproporcionado de la realidad. Pero esta eleccin (del modelo
F. A.) es constitutiva porque funda o constituye el objeto que nosotros vamos efectivamente
estudiar (que es ahora: La V. R. como una realizacin de una F. A.), y determina as de
antemano los mtodos que utilizaremos para este estudio (es decir: Las tcnicas
probabilsticas).
La intuicin que gua esta eleccin fundamental es evidentemente la de la coexistencia, en el
seno mismo del fenmeno, de un aspecto estructurado y de un aspecto aleatorio o catico.
Sospechamos la existencia de ciertos rasgos estructurales, escondidos por la variabilidad
catica que manifiesta el fenmeno a nivel local, y que excluye cualquier representacin
funcional simple.
Esta interpretacin probabilstica es relativamente efmera, y difcil de explicitar. Puede an
desaparecer completamente con una eleccin diferente del modelo constitutivo. Por ejemplo,
podramos elegir representar la V. R. z(x) por un desarrollo del tipo:
z ( x) = an f n ( x)
(x S)
58
diremos, que las leyes de los An no corresponden a ningn concepto operatorio. Este modelo
(los An aleatorios), en efecto, no es especificadle en trminos de magnitudes regionales.
En realidad, no tendramos ninguna necesidad de probabilizar los coeficientes an del
desarrollo de z(x). Una vez que la V. R. es perfectamente conocida, estos coeficientes quedan
numricamente determinados, y constituyen entonces parmetros objetivos. Si nuestro
objetivo es realizar un anlisis espectral (energtico), los |an|2 nos proporcionan lo que
buscamos. Si deseamos una representacin simplificada, alisada, del fenmeno, podemos
descomponer z en dos trminos:
N
D = an f n
n=0
R=
n = N +1
an f n
P [ Z ( x1 ) z1 ; Z ( x2 ) z2 ;...; Z ( xn ) zn ]
Para todos los enteros n 1 , y todas las elecciones posibles de los puntos de apoyo x1, x2 ,
xn S y los nmeros reales z1, , zn . Ahora bien, no es posible proceder a la estimacin
de todas estas leyes, a partir de la informacin, disponible in praxis, la cual est constituida de
un nmero finito de muestras tomadas en S . Contrariamente a lo que sucede en fsica por
ejemplo, donde se tiene, en principio la posibilidad de repetir tan a menudo como se quiera
una misma experiencia, y donde se puede as disponer de varias realizaciones de una misma
59
F. A. , debemos tratar aqu una sola realizacin muestreada en un nmero finito de puntos
solamente. La inferencia estadstica de la ley espacial (en su totalidad) no es ciertamente
posible in praxis. Y, lo que es ms importante, es fcil darse cuenta que tampoco es posible
despus de la tirada, es decir si se conoce z(x) en todo x S. Del punto de vista clsico,
nos enfrentamos con un problema insoluble o indeterminado. Para nosotros, considerando
nuestro criterio de objetividad en trminos de magnitudes regionales, concluiremos que se
trata ms bien de un falso problema: La ley espacial no est unvocamente definida por la V.
R., y se encuentra entonces desprovista de significacin objetiva.
Por consiguiente, nosotros debemos, de una manera u otra, introducir condiciones limitativas
en vista de levantar la indeterminacin. Del punto de vista clsico, estas condiciones
limitativas son lo ms a menudo consideradas como hiptesis (por ejemplo la hiptesis de
estacionaridad) que, en caso de ser verificadas, permiten disminuir el nmero de parmetros a
estimar y hacen razonablemente posible la inferencia estadstica in praxis. An, sera
necesario, que sean controlables despus de la tirada. Ahora bien, del mismo punto de vista
clsico, una hiptesis muy general como la estacionaridad no puede ser objeto de tests
estadsticos significativos. En efecto, cualquier funcin z definida en un dominio acotado S
puede siempre ser considerada como la restriccin a S de una funcin peridica, cuyos
perodos (segn los ejes de coordenadas) definen un paraleleppedo grande respecto del
campo S. Mediante una traslacin por un vector aleatorio (distribuido uniformemente en el
paraleleppedo de los perodos) esta funcin peridica es, en todo rigor, una funcin aleatoria
estacionaria cuya funcin z dada en S puede, muy razonablemente, ser considerada como
una realizacin. De aqu se deduce que, en general, ningn test para comprobar la
estacionaridad no podr nunca conducir a una respuesta negativa.
Esta conclusin no debe sorprendernos: Significa que en general la estacionaridad no es
decidible 52 en trminos de magnitudes regionales, y entonces no tiene significacin objetiva.
Por consiguiente, entre las condiciones limitativas que introduciremos, debemos, muy
cuidadosamente, distinguir entre las que corresponden realmente a hiptesis objetivas
(decidibles 53 despus de la tirada) y aquellas que constituyen solamente elecciones
metodolgicas. Las primeras solas, conducen esta informacin suplementaria substancial que
nos permite sacar de los datos disponibles in praxis ms de lo que est realmente contenido.
Son estas las que constituyen, hablando bien, la hiptesis anticipadora, mencionada varias
veces, la cual puede encontrarse como desmentida despus de la tirada. Esta vulnerabilidad es
la contraparte obligada de su fecundidad, y es para disminuir, lo ms posible, esta
vulnerabilidad que debemos elegirlas in praxis segn un principio de economa estricta: En la
ptica monoscpica que es aqu la nuestra, una hiptesis objetiva solo debe ser adoptada in
praxis si esta es absolutamente indispensable para alcanzar el objetivo que nosotros
perseguimos (y, naturalmente, si no es incompatible con la informacin - numrica y
cualitativa que disponemos). Las segundas por el contrario, no introducen ni informacin
positiva, ni riesgo de vulnerabilidad, sealan simples decisiones metodolgicas: La regla ser
entonces elegir aquellas que conducen a la solucin ms eficaz del problema que se busca
52
60
resolver (notemos tambin, como cada vez que intervienen elecciones metodolgicas, que la
manera en la cual efectuamos estas elecciones, en cada caso particular, proviene de una
metodologa ms general que a la larga ser sometida a la sancin de la prctica, y esto no
est entonces desprovisto de objetividad a largo plazo a pesar que cada eleccin particular
queda en un sentido arbitraria).
De todas maneras, una vez introducidas las condiciones limitativas (hiptesis objetivas y
elecciones metodolgicas), no debemos ms buscar nuestra F. A. Z(x) en el conjunto
infinitamente ms vasto de todas las F. A. posibles, sino solamente en la familia F ms
restringida definida por estas condiciones, al interior de la cual el nmero de parmetros que
definen una F. A. individual se encuentra substancialmente reducido (bien que queda, lo ms
a menudo, an infinito). Naturalmente, si agregamos condiciones limitativas suplementarias,
obtenemos una jerarqua de modelos o de submodelos F0 F1 al ir del ms general al
ms particular. En este caso diremos que F0 es un modelo genrico , y un submodelo F1 F0
, restringido lo suficiente para que la identificacin de un individuo dentro de F1 solo haga
intervenir un nmero pequeo de parmetros (dos o tres por ejemplo, raramente ms),
constituye lo que llamaremos un tipo del modelo genrico F0 .
Por ejemplo, la familia de las F. A. estacionarias y gaussianas constituye un modelo genrico
F0 . Para definir una F. A. Z F0 , es necesario darse una esperanza m y una funcin de
covarianza (h) . El submodelo F1 de las funciones aleatorias estacionarias gaussianas con
covarianza exponencial (h) = 2 exp (-a | h |) constituye un submodelo o tipo de F. A. en F0,
en la cual un individuo est identificado por tres parmetros (la esperanza m, la varianza 2 ,
y el parmetro de escala a de la covarianza).
En lugar de la F. A., se considerar muy a menudo clases de equivalencia de F. A., y se
llamar tambin modelo genrico a una familia F de tales clases de equivalencia. Por
ejemplo, en los casos de estimacin lineal, solo se necesita conocer los momentos de orden 1
y 2 de una F. A. Se llamar entonces F. A. de orden 2 la clase de todas las F. A. que tienen
una esperanza m(x) y una covarianza (x, y) dadas. As la familia de las F. A. estacionarias
de orden 2 constituir un modelo genrico F0 en el cual un individuo queda especificado por
el conocimiento de una esperanza m y de una covarianza estacionaria (h) . Las F. A.
estacionarias de orden 2 con covarianza exponencial constituyen entonces un tipo F1 en F0 ,
donde un individuo est definido por 3 parmetros solamente (m, 2 y a): Pero este
individuo es en realidad el mismo una clase de F. A. (que no se distingue de los otros
individuos): Diremos que constituye un modelo especfico o una especificacin del modelo
genrico F0 (y del tipo F1).
Esta jerarqua con 3 niveles (modelo genrico,, tipo y especificacin) puede parecer arbitraria.
En el uso se revela til, porque, lo ms a menudo, la eleccin del modelo genrico proviene
de una simple decisin metodolgica, mientras que la eleccin del tipo tiene casi siempre un
alcance objetivo: Es en general en el momento en que se elige (in praxis) el tipo en un modelo
genrico cuando se introduce la hiptesis anticipativa ms vulnerable y la ms fecunda. La
especificacin (in praxis), es decir, si se quiere, la estimacin de algunos parmetros de los
cuales depende el tipo, a partir de la informacin disponible, implica evidentemente tambin,
riesgos serios de errores (es el problema clsico de la inferencia estadstica pero de
61
naturaleza quizs menos fundamental. En efecto, una vez que hemos elegido el tipo de
modelo, la estadstica matemtica (aplicada en el marco de este tipo) puede indicarnos si la
estimacin de los parmetros, puede ser considerada en condiciones razonables o no, sobre la
base de la informacin actual. Si no lo es, esto quiere decir que no podemos resolver el
problema que nos interesa en el marco de este modelo genrico y de este tipo, y debemos
buscar otra formulacin. Notemos tambin que, por razones fciles de comprender, la
informacin cualitativa (no numrica) interviene de manera esencial en el momento de la
eleccin del tipo, mientras que la especificacin se hace, lo ms a menudo, sobre la base de la
informacin numrica sola.
En resumen, un modelo genrico se caracteriza por su extensin y sus criterios de
especificacin. La extensin: Es simplemente el conjunto de las F. A. que pertenecen a una
de las clases del modelo. Por ejemplo, en el modelo genrico F. A. estacionaria de orden 2,
la extensin est constituida por todas las F. A. que admiten momentos estacionarios de orden
1 y 2. De su lado, los criterios de especificacin sirven para definir (o especificar) las clases
del modelo genrico, llamadas tambin modelos especficos. En nuestro ejemplo, un modelo
especfico est constituido por todas las F. A. que admiten una misma esperanza y una misma
covarianza, de manera que los criterios de especificacin estn constituidos por el
conocimiento de una constante m y de una funcin (h) de tipo positivo. A medio camino,
encontramos de nuevo la nocin de tipo, o de submodelo, en el cual los criterios de
especificacin se reducen e un pequeo nmero de parmetros (por ejemplo: Las F. A.
estacionarias de orden 2 con covarianza exponencial).
En lo que respecta los criterios de especificacin, es importante saber si ellos tienen, o no, una
significacin objetiva. De este punto de vista, el ejemplo anterior no es muy feliz, porque ni
m ni (h) son estrictamente identificables a magnitudes regionales. Anlogamente, los
parmetros m, 2 y a, que intervienen en el tipo con covarianza exponencial, no son
parmetros estrictamente objetivos (salvo, quizs, si el campo S es muy grande con respecto
de 1 / a). Al contrario, veremos que el producto a 2 (que representa la pendiente del
variograma en el origen) tiene una significacin objetiva.
Del punto de vista metodolgico, notemos tambin que adoptar un modelo genrico dado
implica que se renuncia a distinguir entre ellas las diferentes F. A. que pertenecen a un mismo
modelo especfico, es decir que responde a los mismos criterios de especificacin. Como
consecuencia inmediata, solamente se tiene el derecho de utilizar en adelante otros
instrumentos de trabajo los cuales son los mismos criterios de especificacin. Por ejemplo, en
el caso del modelo genrico F. A. estacionaria de orden 2, los nicos instrumentos de
trabajo autorizados sern la esperanza m y la covarianza (h); esto significa, por ejemplo, en
lo que respecta al problema de la estimacin, que debemos restringirnos a la clase de
estimadores lineales afines (de la forma 0 + i z(xi) ), y, entre las caractersticas
probabilsticas de los estimadores de esta forma, solamente utilizar sus esperanzas y sus
varianzas, las cuales solas, se expresan con la ayuda de m y de (h). En todo rigor, sera
conveniente tambin ser ms severo an, y, entre los estimadores de este tipo, limitarse a
aquellos cuyas caractersticas (esperanza y varianza) son susceptibles de ser redefinidas
despus de la tirada en trminos de magnitudes regionales. En la prctica existen acomodos de
esta regla un poco un poco demasiado estricta, pero, en grueso, uno se esfuerza para
satisfacerla de manera ms o menos aproximada.
62
PRIMERAS INDICACIONES SOBRE LOS CRITERIOS DE ELECCION
No es posible, aqu, examinar de manera profunda las reglas y las precauciones que conviene
observar en el momento de elegir ( in praxis !) un modelo, y nos contentaremos con dar
algunas indicaciones resumidas. Se entiende, tambin, que nosotros nos localizamos
decididamente en el punto de vista monoscpico, que es en general el que adopta el prctico
cuando debe tomar una decisin. En una investigacin ms desinteresada, se apunta ms bien
a un modelo lo ms panscpico posible, luego presentando un alto grado de especificacin
posible en base a la informacin disponible: Porque un modelo es tanto ms rico y mejor
adaptado para representar los aspectos ms variados de la realidad cuando contiene ms
criterios de especificacin. El prctico, por el contrario, para garantizarse mejor contra el
riesgo de tomar una decisin errnea, debe debilitar lo ms posible, las hiptesis
anticipatorios sobre las cuales est bien obligado de fundarse. El busca, por consiguiente, el
grado de especificacin ms dbil posible compatible con la resolucin efectiva del problema
propuesto.
En todos los casos, el modelo debe verificar las cuatro condiciones siguientes:
a) Debe ser operacional: Una vez especificado , el modelo debe permitir obtener una
solucin efectiva, numrica, del problema que se desea resolver. Resulta (lo que est
bien conforme con nuestro punto de vista monoscpico) que la definicin del modelo
a utilizar est ligada estrechamente con la naturaleza del objetivo que se persigue. Esto
es un punto metodolgico fundamental, sobre el cual volveremos. El principio de
economa que preside la eleccin de los modelos monoscpicos puede enunciarse de
la manera siguiente: Los criterios de especificacin deben contener todo lo que es
necesario para resolver el problema planteado, y es intil que contengan ms.
b) Debe ser especificable. En una forma un poco vaga, que trataremos de precisar en
adelante, esto significa que debe ser razonablemente posible, sobre la base de la
informacin (numrica y cualitativa) disponible, de elegir el tipo de modelo y de
estimar los valores numricos de los parmetros que lo especifican.
c) Debe ser compatible con los datos (numricos y cualitativos) en un sentido que
debemos precisar progresivamente: Los problemas que plantean esta condicin y la
anterior son anlogos (pero no idnticos) a los que la estadstica clsica conoce con el
nombre de tests de hiptesis e inferencia estadstica de los parmetros. Ellos
tienen solamente una relevancia parcial en la estadstica matemtica. Porque, de una
parte, si un parmetro est desprovisto de significacin objetiva, no debe influenciar
sensiblemente la solucin de un problema real (porque un problema real se enuncia y
se resuelve en trminos operatorios, luego con magnitudes regionales). Por
consiguiente, este parmetro puede ser elegido de manera relativamente arbitraria: El
hecho que la inferencia estadstica no sea posible pierde una gran parte de su
importancia. Por otra parte, en sentido inverso, si un test de hiptesis concluye a la
aceptacin del tipo de modelo elegido, es decir a que no es incompatible con los datos
actuales, esto no significa que otra suerte de test habra conducido al rechazo. Y sobre
todo, nada nos garantiza que los datos futuros, los cuales no disponemos ahora,
confirmarn nuestra conclusin. El riesgo de error radical est siempre presente.
63
Finalmente, la verdad nos obliga a reconocer que es raro, en la prctica, que se pueda
proceder a tests verdaderamente sofisticados: Sea, simplemente, porque no existen, o,
si existen, debido a que son muy complicados; o tambin, porque su implementacin
necesitara una informacin la cual no disponemos (para testear los momentos de
orden dos, sera necesario, por ejemplo, conocer ahora los momentos de orden cuatro,
etc).
d) Debe ser eficiente, es decir conducir a una solucin correcta (en un sentido al menos
estadstico) del problema planteado. Este punto solo puede, evidentemente, ser
verificado despus de la tirada. Pero la experiencia adquirida con la ocasin de casos
anlogos juega tambin un papel importante: La sancin de la prctica, semejante a la
seleccin natural, elimina a la larga, sin piedad, las metodologas ineficaces y los
modelos inadecuados.
En lo que respecta al punto a) , observamos la importancia decisiva de la eleccin del mtodo
adoptado para resolver un problema dado. El problema es lo que es: una obligacin. Pero
tenemos, en general, la eleccin para resolverlo, entre varios mtodos, ms o menos potentes,
ms o menos aproximados, los cuales necesitan tambin para ser implementados, ms o
menos prerrequisitos. La primera tarea a hacer es proceder, para cada mtodo posible, a un
anlisis estricto de los prerrequisitos mnimos que el mtodo exige realmente (esta poda
revela a menudo que ciertos parmetros, que se crean indispensable, son de hecho totalmente
superfluos).
Como se tiene inters en tener un modelo lo menos especificado posible, se buscar en hacer
coincidir, lo ms que se pueda, los criterios de especificacin del modelo con los
prerrequisitos mnimos exigidos por el mtodo elegido: Esta es una de las reglas directrices en
la eleccin de un modelo genrico. Los criterios de especificacin deben contener los
prerrequisitos mnimos, y es intil que contengan otros.
Mientras ms potente es un mtodo, ms prerrequisitos mnimos exige, y ms, por
consiguiente, el modelo utilizado debe ser especificado. Pero hay siempre un lmite, porque
los datos disponibles no permiten nunca sobrepasar un cierto grado de especificacin. De
donde la segunda regla, relativa esta vez a la eleccin del mtodo a utilizar para resolver un
problema dado: Elegir el mtodo ms potente entre aquellos cuyos prerrequisitos mnimos
pueden ser razonablemente especificados a partir de los datos disponibles.
La tercera regla es, evidentemente, la de la no incompatibilidad del modelo con los datos
experimentales y nuestra intuicin fsica del fenmeno. Al contrario, su compatibilidad con la
realidad misma, nunca est absolutamente asegurada, an si el examen crtico de la
posibilidad de especificacin (es decir, de la estimacin de las magnitudes regionales
requeridas) ha conducido a una respuesta positiva. Nunca estamos completamente al abrigo de
malas sorpresas. Pero no tenemos eleccin, es necesario, en un momento dado, hacer una
hiptesis que permita unir, de una manera u otra, la estructura de la parte desconocida del
fenmeno con la de los datos disponibles.
64
EL MODELO PRIMARIO.
En las pginas anteriores, hemos razonado como si fuera posible identificar la realidad con la
simple coleccin de los valores numricos de la variable regionalizada. Pero esto no agota
nunca la riqueza de lo real. Hay siempre otra cosa adems de los valores numricos puntuales.
Una cadena de montaas puede, evidentemente, ser definida como una coleccin de cotas
topogrficas, pero este punto de vista, analtico y exhaustivo, no es forzosamente el ms
interesante: Tambin existe la estructura geolgica de conjunto de la cadena, su historia, su
tectnica, etc El mapa topogrfico simple no basta, y debemos introducir tantas V. R. como
magnitudes geolgicas a considerar, debemos tambin conservar constantemente en la
memoria, el aspecto evolutivo del fenmeno, su gnesis, an si la observacin directa no nos
proporciona nada de esto. En un sentido, entonces, lo real es inagotable. Sin embargo, los
problemas - tcnicos y modestos que tenemos en vista son de naturaleza estimatoria o de
interpolacin, y se acomodan bastante bien a una reduccin de toda la riqueza de la realidad al
conocimiento de una o varias funciones z en S (las V. R.). El resto las ideas que podemos
hacer acerca de la gnesis y la estructura del fenmeno, y, ms generalmente la intuicin
fsica que nos formamos contina a jugar un papel muy importante. Es, en general, en este
tesoro arquetpico que nosotros tendremos chances de encontrar los esquemas o los principios
motores de modelos verdaderamente adaptados. Nos abstendremos entonces del purismo que
consiste en identificar lo real con una coleccin de valores numricos. Primero, porque los
valores numricos no son lo real, sino una primera imagen (analticamente muy rica,
estructuralmente muy pobre) de ste. Luego, porque los esquemas de la intuicin fsica nos
proporcionan exactamente el hilo director que necesitamos para orientarnos en el problema de
la eleccin de un modelo. Pero la reduccin analtica de lo real a una coleccin de valores
numricos, sola, proporciona las bases de una metodologa operatoria. Entre los diferentes
modelos posibles, y los conceptos que se les puede asociar, retendremos como objetivos (no
metafsicos) solamente los que son enteramente explicitables en trminos de magnitudes
regionales (es decir: Determinados por el conocimiento de una o varias V. R. en el dominio
S).
Esto es aqu un poco como en lgica: Se sabe bien que, en un concepto, hay mucho ms que
su extensin, a saber el elemento motriz, el movimiento dialctico, etc Pero el tratamiento
formalizado riguroso solo es posible si se acepta identificar el concepto a su extensin.
Solamente a este precio evitaremos las ilusiones metafsicas obteniendo un formalismo
operatorio. El contenido rico del concepto, fascinante e inembargable, desapareci, en
apariencia, para dar lugar a una metodologa rigurosa, operatoria, helada, y un poco aburrida.
Pero, en realidad, nada se ha perdido. Porque el elemento motriz del concepto contina,
secretamente, inspirando nuestros trmites (y sin l, sin duda, no emprenderamos nada). Pero
estos trmites, y sus resultados, son enseguida traducidos en la lengua del formalismo ms
depurado, el ms riguroso, el nico oficialmente reconocido.
La variable regionalizada no es idntica a la realidad, pero constituye ya ella misma un
modelo primario. Esto es porque: El criterio de simple decisibilidad en trminos de regionales
se revela insuficiente cuando se hace sentir el deseo de un anlisis ms fino: Es necesario
entonces volver al criterio Popperiano, fundado sobre la falsificabilidad solamente.
65
Esta necesidad se manifiesta de manera imperiosa, cada vez que es necesario considerar la
significacin fsica de las magnitudes que manipulamos, y los lmites al exterior de los cuales
los conceptos que les corresponden cesan de ser operatorios. De hecho, no existen en la
naturaleza ni puntos x S, ni valores numricos z(x) unvocamente afectados en cada punto
x. Para un fsico, en efecto, no hay puntos, en sentido matemtico, sino solamente elementos
de volumen, pequeos con respecto de la escala a la cual se ha elegido trabajar, pero grandes
respecto de las escalas inferiores para las cuales el fenmeno que se estudia cesa de ser
definible en trminos operatorios. Si, por ejemplo, si se supone que z(x) representa la ley en
un metal en un punto x dado de un yacimiento minero, el volumen elemental v de
referencia ser lo ms a menudo elegido como grande respecto de las dimensiones
granulomtricas. Si se quiere estudiar el fenmeno a esta ltima escala, lo cual es posible, la
ley z(x) tomar una forma de todo o nada, casi nula en los granos de estril, casi constante en
los granos mineralizados. En todos los casos, depender de la constitucin mineralgica del
mineral. Pero, an a esta escala granulomtrica, los volmenes elementales v , pequeos
respecto de los granos, quedan muy grandes respecto de las dimensiones atmicas o infra
atmicas: A esta ltima escala, por otra parte, solo se podra observar un caos de funciones de
ondas, el modelo usual del espacio euclidiano con 3 dimensiones cesara de ser operatorio y
ahora ni los puntos x S ni la ley z(x) estn unvocamente definidos.
As, como todo concepto fsico, el de V. R. est sometido a limitaciones bastante estrictas
fuera de las cuales cesa de ser operatorio. Desde este punto de vista, no debemos tomar al pie
de la letra enunciados puramente matemticos respecto de la continuidad y derivabilidad de la
V. R. o ms generalmente las propiedades topolgicas que hacen intervenir todas las
vecindades, por pequeas que sean, de un punto x dado. Se trata aqu, siempre, de
caractersticas del modelo, y no, en todo rigor, de propiedades de la realidad fsica, porque,
fuera de un cierto nivel infinitesimal, el fenmeno de alguna manera se desvanece o cambia
de naturaleza.
Sin embargo, el contraste de las escalas es tal que podemos, en primera aproximacin,
despreciar estos efectos de imprecisin (que se manifiestan de alguna manera a nuestra escala
de trabajo) y considerar en primera aproximacin, el modelo V. R. como bien
representativo de la realidad. Pero, an as, subsisten serias dificultades. En efecto, el
conjunto de los valores numricos {z(x) , x S} es entonces infinito, y por consiguiente no
es accesible a un conocimiento experimental exhaustivo. As, un enunciado como Z es
continuo o derivable en el punto x el cual hace intervenir una infinidad (la cual es tambin no
numerable) de puntos y de valores numricos, escapa, en todo rigor, a cualquier posibilidad de
control experimental efectivo, y por consiguiente debe ser considerado como desprovisto de
significacin objetiva. De hecho, cualquiera que sea la verdadera funcin z (en el caso en
que sea definible), no podemos encontrar una funcin continua, derivable, etc que se le
aproxime lo suficiente para que sean experimentalmente coincidentes. Porque solo se
conocer realmente los z(xi) en una malla {xi} lo ms cerrada que se quiera, pero siempre
finita, y se podr siempre interpolar con una funcin tan regular como se quiera.
Naturalmente, del punto de vista fsico, la nocin clave es aqu la de escala. La funcin as
elegida ser muy regular (derivable, etc en el sentido estricto de los matemticos), pero
66
solamente a la escala de la malla muy cerrada por los {xi} : Esta muy alta micro regularidad
no prohbe para nada para que esta funcin se comporte, prcticamente, a una escala ms
elevada, como un puro ruido blanco. Si se considera el fenmeno a esta escala, sera
fsicamente falso ( a pesar que matemticamente verdadero) considerar la funcin como
continua y derivable.
Figura 1. Es matemticamente correcto pero fsicamente incorrecto considerar esta funcin como derivable.
67
la posibilidad de errores cometidos en la eleccin del tipo y en la estimacin de los
parmetros que los especifican. De una manera general, una operacin puede ser dicha
robusta (respecto de una causa de error) si su resultado est dbilmente afectado por esta
causa de error. La robustez especfica puede ser estudiada de manera cuantitativa, porque
siempre se pueden hacer variar los parmetros del modelo respecto de valores elegidos, y
examinar en qu medida estas desviaciones influencian los resultados de una operacin dada.
La robustez de tipo, ligada a la incertidumbre de una eleccin estructural, es ms difcil de
estudiar, porque existen, en general, un nmero ilimitado de tipos imaginables, casi
igualmente compatibles con los datos y la informacin disponible. Aqu tambin, el buen
sentido, la intuicin fsica y la experiencia adquirida tienen su palabra que decir.
En lo que respecta a estos umbrales, lo que importa antes de todo, es conservar siempre en el
espritu la distincin clara entre las caractersticas del modelo y las propiedades fsicas del
fenmeno real. En el marco de la interpretacin probabilstica, esto equivale, ms o menos, a
distinguir cuidadosamente la F. A. misma (nocin matemtica), definida por su ley espacial, o
caracterizada simplemente en la prctica, por una funcin de covarianza o un variograma por
una parte, y por otra parte, la realizacin particular, nica y limitada a un dominio S ,
conocida en su totalidad (despus de la tirada), o ms a menudo (in praxis) en parte
solamente. Este realizacin no es otra cosa que la V. R. inicial, reinterpretada en un marco
probabilstico. Pero an en este marco, de ninguna manera existe una identidad entre la F. A.
y su realizacin: si el modelo terico es estacionario y ergdico, del solo hecho que la
realizacin est restringida a un dominio S acotado, no hay identidad entre las magnitudes
regionales (interpretadas ahora como realizaciones de variables aleatorias) y sus valores
tericos en el modelo, que son las esperanzas correspondientes. Ahora bien, solo las
magnitudes regionales, calculadas sobre la realizacin, representan la realidad fsica y tienen
una significacin objetiva. Su contraparte terica es solamente un parmetro convencional (no
objetivo, a menos que, por chance, este parmetro coincida casi seguramente en el modelo
con el valor regional correspondiente).
Se echar de menos quizs que hemos puesto el acento sobre los aspectos pragmticos, en
detrimento de los aspectos tericos del enfoque topo-probabilstico. Es innegable que los
problemas evocados en estas pginas, los mtodos y modelos que aqu se describen, parecen
mucho ms prximos del polo monoscpico e instrumental que del polo especulativo y
panscpico. Pero la manipulacin solo es eficiente en la medida en que el modelo es, de una
manera u otra, grosso modo adaptado a la realidad o al aspecto de la realidad del cual nos
interesamos. Los criterios de especificacin de nuestros modelos genricos, o ms bien, las
magnitudes regionales que les corresponden (y que podemos siempre considerar por si
mismas independientes de la interpretacin probabilstica que nosotros elegimos) expresan
tambin propiedades estructurales del fenmeno real, y poseen por si mismas una rica
significacin fsica. As, el comportamiento de un variograma en la vecindad del origen
expresa la mayor o menor regularidad (continuidad) de una variacin espacial. El variograma
del modelo terico es, es cierto, desprovisto de existencia emprica, pero no es lo mismo para
su versin regional. Ciertamente, el variograma regional no est dado tal cual. Resulta de una
primera reduccin, o modelizacin del fenmeno, al cual al inicio le dimos el status de V. R.,
luego de una manipulacin efectuada sobre los datos numrico as fabricados (o extrados) a
partir de la realidad. El es real, pero mas bien de una manera tcnica que natural. Resulta de la
aplicacin de un esquema (o procedimiento de construccin). Los elementos motrices de este
68
esquema salieron de nuestra intuicin fsica del fenmeno, lo cual nos sugiere el tipo de
modelo (probabilstico o no, etc) al cual debemos recurrir. Enseguida, el modelo terico se
anima de vida propia (que es la de una ficcin reguladora), y nos sugiere de vuelta la eleccin
de la forma de instrumentos matemticos (los criterios de especificacin) ms adaptados a dar
una representacin numrica precisa de las caractersticas fsicas que han retenido nuestra
atencin. La eleccin del modelo juega entonces un papel heurstico capital, pero, en
definitiva, solo sirve de intermediario. Porque, finalmente, nosotros efectuamos
manipulaciones numricas sobre datos numricos. Cualesquiera que sean las intuiciones
fsicas y las interpretaciones tericas que han conducido la eleccin de estas operaciones,
estas manipulaciones pueden y deben ser analizadas por si mismas: Nuestros problemas se
reducen siempre a elegir magnitudes regionales y a (ensayar de) estimarlas sobre la base de
una informacin limitada. De este punto de vista, no hay milagro: cualquiera que sea la
riqueza de nuestra intuicin y la sutileza de nuestros modelos, son siempre los mismos datos
numricos los que nosotros amasamos y moldeamos indefinidamente, sin que estas
operaciones puedan, por si solas, engendrar la menor informacin suplementaria. As como in
praxis existe un umbral de robustez, debe existir un umbral de realismo que sera ilusorio
pretender sobrepasarlo. Sobre la base de una informacin muy pobre o limitada, se podr
formar una solucin aproximada de ciertos problemas simples. Pero se deber renunciar
honestamente a resolver otros problemas ms complejos. Reconocer la existencia de estos
umbrales de robustez y de realismo, y saber apreciarlos correctamente en cada caso particular,
esto es lo limpio del buen prctico, y este sentido fsico es en definitiva mucho ms
importante que la teorizacin matemtica.
69
Test de robustez
Esto no es una trampa, sino un test para evaluar la robustez de nuestros mtodos de ajuste de
variograma. Yo pido a cada destinatario ajustar un modelo de variograma, y dar las varianzas
de extensin correspondientes a partir de los valores numricos siguientes:
A
1 = 0.63
2 = 0.80
3 = 0.89
4 = 0.94
5 = 0.97
6 = 0.99
Ms all del paso 6, los valores difieren poco de 1. La unidad de largo elegida es igual a la
malla de sondajes (es decir u = 180 m para fijar las ideas). El nmero N de sondajes es
grande (varias centenas), de manera que los puntos experimentales pueden ser considerados
como muy buenos.
Le pido a cada uno de hacer su ajuste exactamente de la manera como l procede en la
prctica real, y de hacerlo de manera independiente de los otros geoestadsticos y sin dejarse
influenciar por ellos
Con el modelo ajustado, le pido calcular la varianza de extensin de un punto central en el
segmento unidad y en el cuadrado unidad
B
A solicitud del geoestadstico, se ejecut una cruz de sondajes con malla 1 / 9 (es decir 20 m)
en una zona bien representativa, y proporciona:
1/9 = 0.25
2/9 = 0.34
3/9 = 0.40
4/9 = 0.46
5/9 = 0.50
Modificara usted su ajuste inicial? Cules son las nuevas varianzas de extensin?
C
Luego se cierra la malla, que pasa a 90 m, es decir de nuestra unidad, y se encuentra:
1/2 = 0.49
Varianza de extensin para la malla 1 / 2?
70
Nota: Estos valores numricos estn deducidos de un esquema de tipo no habitual. El inters
del test es entonces doble: Pondr en evidencia la dispersin de las evaluaciones individuales,
y sus desviaciones con las que se deducen del esquema en cuestin (estos ltimos no son los
verdaderos valores, porque, en un caso real, nada nos garantiza que este modelo particular
sea el verdadero modelo).
Las 10 respuestas que recib presentan ajustes bastante y notablemente diferentes. En general,
el primer modelo era de tipo efecto de pepita ms un esquema exponencial o esfrico (o
tambin dos esfricos superpuestos). Despus de la obtencin de la cruz de sondajes, el
modelo se enriquece y queda sea: pepita + esfrico + esfrico o pepita + exponencial +
esfrico o pepita + exponencial + exponencial (y tambin pepita + 3 esquemas esfricos)
tambin, por otra parte, bastante diferentes de un modelo a otro: Otros modelos fueron
propuestos, uno de ellos difera un poco del mo. Grficamente, sin embargo, estos diferentes
ajustes fueron poco diferentes y conducen a valores bastante poco dispersos para las varianzas
de extensin.
Estos valores se dan a continuacin. Para el primer modelo, ajustado sin tener en cuenta la
cruz de sondajes, los valores son bastante dispersos, y en general, demasiado dispersos: En
ausencia de informacin de micro estructuras, el geoestadstico elige, por razones de
seguridad, la hiptesis de un efecto de pepita bastante fuerte, luego sobre estima
deliberadamente las varianzas de estimacin. Una vez realizado el reajuste con la ayuda de la
cruz de sondajes, los modelos utilizados, a pesar de ser muy diferentes, conducen
prcticamente a los mismos valores numricos.
Modelo A
0.377
0.377
0.330
0.372
0.409
0.370
0.396
0.353
0.347
0.369
0.405
0.412
0.370
0.405
0.430
0.405
0.430
0.388
0.372
0.402
Modelo B
(malla = 1)
0.309
0.321
0.330
0.307
0.302
0.303
0.303
0.304
0.306
0.313
Modelo C
(malla = 1/2)
0.364
0.381
0.370
0.370
0.376
0.367
0.380
0.364
0.368
0.346
0.231
0.243
0.232
0.227
0.232
0.225
0.227
0.225
0.237
0.232
0.272
0.288
0.284
0.273
0.262
0.272
0.265
0.262
0.266
0.272
71
LA ROBUSTEZ RESPECTO DE LOS DATOS.
De una manera general, una operacin es robusta si su resultado queda poco influenciado por
los errores que hemos podido cometer, sea en la toma de los datos experimentales, sea en la
eleccin (o) en la especificacin del modelo genrico. Hay entonces tres tipos de problemas y
tres tipos de robustez a considerar: La influencia de los datos dichos aberrantes, la de un error
en la especificacin del tipo de modelo, finalmente la de un error en el tipo mismo, y
correlativamente: Robustez de los datos, robustez especfica, robustez de tipo. Hemos hablado
lo suficiente de las dos ltimas. Nos queda por decir algunas palabras sobre la primera, es
decir examinar la robustez de los datos y el problema de los datos aberrantes.
Entre los datos disponibles, algunos pueden estar manchados con errores groseros (errores de
trascripcin, punto decimal mal puesto, medidas falsas por una razn u otra) y deben en lo
ms posible ser eliminados. Es a menudo cmodo, cuando los datos son numerosos, disponer
de procedimientos automticos, los cuales permiten individualizar las medidas sospechosas
candidatas a una eliminacin eventual. Procedimientos muy simples (histogramas, nubes de
correlacin) proporcionan a menuda muy buenos resultados. Paro un dato sospechoso no es
necesariamente falso o aberrante y no debe nunca ser eliminado automticamente. Este dato
puede muy bien reflejar el comportamiento real del fenmeno (ejemplo de la figura 3).
54
Nota del traductor: La piedra de toque es un talismn que puede convertir cualquier metal en oro.
72
La robustez de los datos ha sido objeto de estudios muy profundos, cuyos resultados son, sin
duda, en parte, transportables a los modelos topo-probabilsticos: Por otra parte, uno no se
trata de premunir contra el efecto de los datos aberrantes, sino tambin contra la influencia
muy exagerada que ejercen a veces, sobre los estimadores usuales, los valores experimentales
(muy fuertes o muy dbiles) que se manifiestan cuando se tienen leyes de distribucin muy
alejadas del tipo gaussiano. Por ejemplo, en el caso de ciertas distribuciones simtricas
respecto de un valor central , se muestra que la mediana es un estimador de ms robusto
(menos sensible al efecto de valores extremos) que la media aritmtica.
Sin embargo, si se ha mejorado la robustez respecto de los dados, se ha, quizs, deteriorado la
robustez respecto del modelo (debemos ahora suponer que la ley es simtrica, etc). Esta
es una objecin seria contra estos estimadores robustos, sofisticados, que nos presenta la
estadstica matemtica: Ellos son a menudo, menos robustos, con respecto al modelo, que los
estimadores ms simples. Adems, estos fueron siempre concebidos para estimar un
parmetro (en general no objetivo) del modelo (un valor central, etc) y no una magnitud
regional. De manera que no es ciertamente posible transponerlos tal cual en nuestros modelos
topo-probabilsticos. Sera necesario estudiar el problema ms general de la robustez de la
estimacin de una magnitud regional a la vez con respecto de los datos, del tipo y de la
especificacin. Esto no es ciertamente un problema simple.
Nos damos cuenta que un estimador robusto (respecto de los datos) como la mediana, no es
necesariamente adecuado para la estimacin, digamos, por ejemplo, de la media regional
z = (1/ S ) z ( x)dx , al observar esto: Nuestro estimador, con la forma:
S
z * = ( z1 ,..., zn )
Si es ptimo en un sentido cualquiera, debe ciertamente verificar la condicin siguiente: Si la
malla constituida en S por los puntos experimentales se aprieta ms y ms (N tiende a
infinito y los puntos experimentales cubren en el lmite el campo S entero), el estimador z*
debe converger hacia el valor real z , y la variable z* que se le asocia en el modelo debe
converger casi seguramente hacia z : En efecto, cuando todos los puntos son conocidos, el
mejor estimador de z es z mismo, el cual ahora es experimentalmente accesible. Ahora
bien, manifiestamente, un estimador como la mediana, por robusto que sea, no verifica esta
condicin. Entonces, la mediana es un mejor estimador que la media aritmtica cuando la
malla es grande y el nmero N de puntos experimentales es pequeo, pero llega ciertamente
un momento en que la malla es ms cerrada y N ms grande, en que la conclusin se da
vuelta: La media aritmtica se recupera, por lo menos como un estimador de la regional z .
73
CAPITULO V
HACER EL ORDEN
Cuando se ha elegido un modelo (genrico) queda por hacer el orden, yo quiero decir
examinar, entre los diversos criterios y parmetros especficos del modelo, cuales
corresponden a realidades y cuales juegan un papel puramente convencional. Para comodidad
de la exposicin, distinguir dos etapas en esta bsqueda de la objetividad. La primera que
corresponde al orden propiamente dicho, es examinada en este captulo. Es una crtica interna
del modelo, efectuada ponindose en el punto de vista del modelo mismo. Consiste en
buscar, entre las variables aleatorias que el modelo asocia a las diversas regionales, las que, en
el modelo, coinciden casi seguramente (= con una probabilidad unidad) con su esperanza
matemtica. Este punto de vista nos conducir a examinar dos nociones importantes: Una
clsica, que es la ergodicidad ; la otra, menos clsica, pero no menos importante para nuestro
propsito, recibir el nombre de microergodicidad. Ser necesario naturalmente tambin
examinar como las cosas se presentan in praxis, es decir abordar el problema de la estimacin
de estas magnitudes objetivas (es decir regionales) a partir de una informacin fragmentaria.
Despus de este orden, o crtica interna del modelo, vendr la segunda etapa, la de la
reconstruccin de los conceptos y de la reformulacin del modelo mismo en trminos
operatorios. Este ser el objetivo de la tercera parte.
74
a es una funcional de la variable regionalizada z en S . En adelante, consideraremos los dos
ejemplos simples siguientes: El de la media (regional) de la V. R. en su campo S , es decir:
z=
(1)
1
z ( x)dx
S S
Y el del variograma regional R : se trata de una funcin la cual proporciona, para cada valor
del argumento vectorial h , el valor medio del cuadrado de la diferencia de los valores
tomados por la V. R. en dos puntos x y x + h , es decir:
(2)
R ( h) =
1
2
[ z ( x + h) z ( x)] dx
2 K ( h) S ( h )
1
2
( h ) = E ( Z ( x + h ) Z ( x ) )
2
Yo he puesto la letra R como ndice en R(h) para recordar que se trata de la magnitud
regional asociada al variograma. No se debe decir que R constituye la versin regional de
, lo que sera invertir la prioridad epistemolgica, sino ms bien al contrario que es la
versin teorizada de R.
Si ahora, en la definicin a = a(z) , sustituimos la F. A. Z por la V. R. z , obtenemos una
variable aleatoria A = a(Z) , en lugar de una magnitud numrica a . En el marco de la
interpretacin probabilstica, a se considera entonces como una realizacin de la V. A. as
definida, A = a(Z) . Esto no significa de ninguna manera que la esperanza = E(A) de esta
V. A. (que es una caracterstica del modelo) deba ser considerada como ms verdadera o
ms real que el valor efectivo a = a(z) (el nico objetivo), lo que consistira, en suma, en
admitir que la realidad est equivocada y que el modelo tiene razn. En nuestro primer
ejemplo, la media regional z se asocia a la V. A. Z cuya esperanza (si el modelo elegido es
estacionario) es igual a la esperanza constante m = E(Z(x)) :
z Z=
1
Z ( x)dx ; E ( Z ) = m
S S
75
R ( h) R ( h) =
1
2
(
)
(
)
Z
x
+
h
Z
x
dx
[
]
2 K (h) S ( h )
E [ R ( h) ] = ( h )
No hay que olvidar nunca que , m, (h) etc son parmetros del modelo y dependen de
la manera en que este ha sido elegido: Son, en efecto, en general, parmetros convencionales,
sin significacin objetiva. En todo rigor, el nico caso en que es un parmetro objetivo es
aqul en que se tiene casi seguramente (en el modelo) A = , es decir justamente el caso en
que el valor terico coincide con el valor objetivo a (la estimacin de sobre la base de
una informacin fragmentaria plantea otro tipo de problema).
Conforme a la terminologa habitual, convengamos en llamar fluctuacin a la V. A. (del
modelo) igual a A , cuya desviacin a entre la magnitud regional a y la
caracterstica del modelo que se la asoci es interpretada como una realizacin. Si el
parmetro tiene un sentido objetivo, entonces, por definicin, la fluctuacin es casi
seguramente igual a 0 en el modelo. Inversamente, si la fluctuacin no es casi seguramente
igual a 0 , esto significa que el parmetro no es objetivo.
A la fluctuacin A , de esperanza nula, se le asocia (en el modelo) otras caractersticas,
por ejemplo su varianza Var( A ) etc Convengamos en decir que Var( A ) es la
varianza de fluctuacin (en el modelo) de la magnitud regional. Si esta varianza es grande, no
debemos decir que la inferencia estadstica del parmetro es difcil o mala. Debemos
decir, al contrario, que este parmetro tiene poca, o no tiene, significacin objetiva. En efecto,
A , o ms bien su realizacin a - agota completamente el contenido objetivo que se puede
atribuir a la operacin definida por la aplicacin de la funcional a a la V. R. z . En otras
palabras, la varianza de fluctuacin da una medida, no de la dificultad de la inferencia
estadstica del parmetro del modelo, sino ms bien, de la falta de significacin objetiva
de este parmetro.
En nuestro primer ejemplo, si se designa por (h) la covarianza centrada (del modelo
estacionario), se demuestra que la varianza de fluctuacin de la media local es (en el modelo):
(3)
Var ( Z m) =
1
(h) K (h)dh
S2
Y es solamente en la medida en que esta varianza sea muy pequea, que la esperanza m
(parmetro convencional) toma una significacin objetiva (aproximada). Discutiremos ente
punto en el prrafo consagrado a la ergodicidad.
De la misma manera, en el modelo intrnseco, la fluctuacin del variograma regional admite
una varianza, cuya expresin explcita hace necesariamente intervenir los momentos de orden
4 de los incrementos de la F. A. En el caso (particular) en que estos incrementos obedecen a
leyes de Gauss (modelo F. A. intrnseca gaussiana), se demuestra que esta varianza de
fluctuacin est dada por la expresin:
76
(4) Var [ R ( h) ( h) ] =
[ ( x y + h) + ( x y h) 2 ( x y )]
2 [ K ( h) ]
dxdy
55
S (h) S (h)
Cuando el mdulo |h| del vector h no es pequeo, esta varianza de fluctuacin puede llegar
a ser enorme 56. Esto no quiere decir que la inferencia estadstica del variograma sea
imposible; sino solamente que este variograma fuera de la vecindad del origen, tiene una
significacin convencional. Consecuencia importante: Entre las caractersticas del modelo (las
varianzas de estimacin por ejemplo) que se expresan con la ayuda del variograma , solo
podremos utilizar, para resolver un problema real (por ejemplo la estimacin de z ), aquellas
que solo dependan, esencialmente, del comportamiento del variograma para los valores
pequeos de |h| , y relativamente estn poco afectadas por la forma que presenta esta funcin
fuera de una cierta vecindad del origen. Esta condicin de robustez, sola, nos garantiza la
objetividad de las magnitudes que nosotros calculamos con la ayuda del variograma. Al
contrario, para |h| pequeo, la varianza definida en (4) es, en general, muy pequea, y esta
circunstancia nos permitir ilustrar la nocin de microergodicidad.
LA ERGODICIDAD.
En la ptica clsica, siempre, en definitiva, la posibilidad de la inferencia estadstica se funda
en una propiedad ergdica.. Esto es cierto, evidentemente, en el caso simple de una prueba
indefinidamente repetida. Si se admite la independencia de las pruebas sucesivas, y sobre
todo, que la probabilidad p de xito quede constante, se ha visto, en efecto, que la
frecuencia emprica converge hacia p con una probabilidad unidad. De estas dos
hiptesis, la primera puede ser debilitada. Basta con que las correlaciones entre pruebas
sucesivas se amortigen lo suficientemente rpido con la distancia en el tiempo. La segunda
es esencial, e implica antes que nada la estacionaridad: Se la puede arreglar, diciendo por
ejemplo que la probabilidad p(t) de xito en el tiempo t es tambin una F. A. estacionaria y
ergdica: En todos los casos se debe introducir la estacionaridad.
Consideremos ahora el caso del modelo F. A. aleatoria, y, por ejemplo, de la estimacin
de la covarianza C(x, y) . Si se trata de un fenmeno el cual se puede repetir, es decir, si se
dispone de tantas realizaciones que se quiera de la misma F. A., la situacin es
sustancialmente la misma que en el caso de la prueba en todo o nada. Se ver bien (en
trminos de fsico, sino de matemtico) si el valor medio del producto Z(x) Z(y) converge o
no hacia un lmite C(x, y) cuando el nmero de realizaciones aumente indefinidamente.
No es por otra parte necesario suponer la independencia de las pruebas sucesivas, sino
solamente su estacionaridad en el tiempo (y su ergodicidad). Por ejemplo, Z(x, t) puede ser
la temperatura observada en el tiempo t en una estacin meteorolgica implantada en el
punto x del territorio europeo. Se puede admitir (lo que por otra parte no es evidente,
55
Nota del traductor: Correg esta frmula, la cual es errnea en las versiones en francs e ingls.
He desarrollado este punto en Les variables rgionalises et leur estimation, Pars, Masson, 1965, Captulo
XIII. Nota del traductor: Tambin existe versin en espaol: Las variables regionalizadas y su estimacin,
traducido por Marco Alfaro. Ver biblioteca en lnea del Centro de Geoestadstica de la Escuela de Minas de
Pars: www.cg.ensmp.fr.
56
77
intervienen tendencias seculares, sin duda, incompatibles con un modelo realmente
estacionario) que la media de las temperaturas observadas en x el primero de enero de cada
ao a las 0 horas tiende hacia un lmite cuando la serie temporal disponible crece
indefinidamente. Se puede tambin, para tener en cuenta, en primera aproximacin, de las
tendencias seculares, admitir que estas hacen sentir sus efectos solamente a largo plazo, y que
a la escala de la decena de aos (digamos entre 1970 y 1980), todo sucede como si la
temperatura fuera estacionaria, con una media m = m(t) que sera, en realidad, una funcin
que vara muy lentamente en el tiempo t . Esto es, en suma, nuestro modelo de estacionaridad
local 57. Se puede, tambin utilizar modelos de tipo clsico deriva secular (funcional) + F.
A. estacionaria. La estacionaridad es aqu un concepto operatorio, porque, bien que es
actualmente finita, la sucesin de observaciones es virtualmente infinita y aumenta con el
tiempo, de manera que un contratiempo de la estacionaridad terminar, ciertamente, a la larga,
por ser revelado, corregido en primera aproximacin por el ajuste de una deriva secular,
luego, por su parte, luego de su parte, los residuos se revelarn como no estacionarios, etc
Ciando se trata de un fenmeno nico, de extensin acotada (como un yacimiento minero), la
situacin es sensiblemente diferente, porque, no hay esta vez ninguna posibilidad de
repeticin. Para evaluar E(Zx Zy) , suponiendo que lleguemos a darle un sentido operatorio a
esta esperanza, solo disponemos en todo y para todo que del nico valor numrico zx zy . De
donde, por supuesto, hacemos un llamado a una hiptesis de estacionaridad la cual
permitir reemplazar la no repetitividad en el tiempo por la repeticin en el espacio.
Elegiremos entonces (siempre que esto no sea contrario con la informacin cualitativa sobre
el fenmeno) un modelo estacionario, y naturalmente, tambin, ergdico.
Aqu no podemos evitar un parntesis corto un poco ms tcnico. Entre las diferentes
acepciones que puede vestir el trmino ergodicidad, nos referiremos nicamente a la
propiedad segn la cual las medias espaciales, tomadas en dominios S de ms y ms grandes,
convergen hacia la esperanza matemtica. Pero hay que distinguir netamente un teorema
ergdico, totalmente general, y una hiptesis ergdica, que constituye una particularidad de
ciertos modelos de F. A. estacionarias, pero no de todas. El teorema ergdico nos dice esto: Si
Z(x) es una funcin aleatoria estacionaria y si se tiene una sucesin de dominios Sn que
tienden a infinito (en el sentido que cualquier bola de radio dado est contenida en Sn cuando
n es bastante grande), entonces la sucesin de medias en el espacio:
Zn =
1
Sn
Z ( x)dx
Sn
Converge hacia un lmite M (en un sentido bien definido, por ejemplo la convergencia casi
segura o, en el caso de las F. A. de orden 2, la convergencia en media cuadrtica etc).
Este lmite M solo depende de la sucesin Sn elegida. En particular, es invariante por
traslacin. Pero el teorema no afirma de ninguna manera que M sea idntico a la esperanza
m . En general, este lmite M , que existe para casi todas las realizaciones posibles de la F.
A., toma valores diferentes para las diferentes realizaciones. Es entonces una variable
aleatoria, no una magnitud numrica, luego se puede decir solamente que es invariante por
57
Ver el captulo 7.
78
traslacin, no que es una constante. En los modelos que verifican lo que se llama la
propiedad o la hiptesis ergdica, por definicin, las nicas variables aleatorias invariantes
por traslacin son las constantes, y en este caso, evidentemente, M = m , o si se prefiere, las
medias espaciales Zn convergen hacia su esperanza m .
Cualquiera que sea su importancia, en mecnica estadstica por ejemplo 58, la distincin entre
el teorema y la hiptesis ergdicas no puede jugar ningn papel en el caso de un fenmeno
nico: En efecto, porque solo disponemos y no dispondremos nunca que una sola realizacin
de la F. A. (a saber la variable regionalizada z ) no sabremos nunca si el lmite M habra
tomado, o no, un valor diferente sobre otra realizacin: La distincin entre M y m no
presenta, en este contexto, ninguna significacin objetiva.
Por consiguiente, si (raramente) hubiramos elegido para Z un modelo que no posee la
propiedad ergdica, deberamos apresurarnos en reemplazarlo por otro modelo en el cual esta
propiedad sera verificada (bastara, por ejemplo, con condicionar la F. A. inicial por la
variable M , lo que asegura automticamente la igualdad M = m sin destruir la
estacionaridad). Lo que equivale a elegir como definicin de la esperanza m el lmite de la
sucesin de las medias espaciales Zn . Si m y M solo tienen un status puramente
convencional, no hay ningn inconveniente para identificarlos. Si tienen una significacin
objetiva, esta significacin es la misma para m y M : a saber, para una como para la otra, el
lmite de la media espacial cuando S tiende hacia el infinito.
En todo rigor, por otra parte, esta definicin, solo puede ser convencional: Del hecho que el
campo real es irreductiblemente acotado, no es posible, en ninguna forma posible, hacer
tender realmente S hacia el infinito, y la nocin de esperanza m o de lmite ergdico M ,
cuya definicin hace intervenir el comportamiento (ficticio) del fenmeno en el infinito est,
por lo mismo, desprovista 59 de significacin objetiva, por lo menos en el sentido estricto. Sin
embargo, no es necesario ser tan purista: Si el campo S es verdaderamente muy grande, la
varianza que da la frmula (3), sin ser nula, puede ser lo suficientemente pequea para ser
considerada como despreciable, y el parmetro correspondiente del modelo, sin ser
rigurosamente igual a la magnitud regional, puede sin embargo ser confundido con esta
regional con una buena aproximacin. Diremos, entonces, que la ergodicidad se alcanza
prcticamente, en lo que respecta a este parmetro, y esto nos autoriza para hacer su uso
legtimo.
EL ALCANCE.
Desde el punto de vista prctico, la nocin capital es aqu la de alcance de la covarianza, es
decir, en trminos aproximados, de la distancia a partir de la cual las correlaciones se apagan
o llegan a ser despreciables. Es solamente en la medida en que el campo S es grande con
58
Ver el anlisis profundo que proporciona F. Fer, en L irreversibilit, fondement de la stabilit du monde
physique, 1977.
59
En la tercera parte, procederemos a la reconstruccin operatoria de nuestros modelos, y la situacin ser bien
diferente: El parmetro m ser entonces definido como una cierta media espacial, y su objetividad ser as
garantizada automticamente.
79
respecto al alcance que se puede esperar alcanzar prcticamente la ergodicidad, y
proporcionar as un sentido objetivo a la esperanza m .
El examen de la frmula (3) permite comprender porqu.. En esta frmula, K(h) represente
la medida del dominio S(h) , interseccin del campo S y de su trasladado por el vector - h .
En particular, K(0) es igual a la medida de S . Es entonces fcil probar que, para S bastante
grande, la varianza de Z m es poco diferente de (1/ S ) (h)dh . Esto sugiere la
definicin siguiente: Llamaremos alcance integral la cantidad:
(5)
A=
(h)dh
2
N
80
por definicin, la varianza v(s / S) de s en S , expresin cuyo valor numrico constituye una
magnitud regional, accesible (despus de la tirada) a una determinacin experimental. A esta
regional v(s / S) se le asocia, como de costumbre, en el modelo, una variable aleatoria V(s /
S) cuya esperanza E[V(s / S)] = 2(s / S) puede ser llamada, si se quiere, varianza terica de
s en S . Esta ltima cantidad es un parmetro del modelo, que se expresa fcilmente con la
ayuda del solo variograma (explcitamente, 2 ( s / S ) = ( S ) ( s ) , escritura en que ( s )
, por ejemplo, designa el valor medio de (x y) cuando las dos extremidades x e y
recorren, independientemente el uno del otro, el dominio s ). Estas expresiones no tienen
forzosamente significacin objetiva, porque, por ejemplo, el clculo de ( S ) , pone en juego
los valores de (h) para argumentos h que alcanzan el dimetro de S. Pero, despus de la
tirada, por lo menos, podemos controlar si la relacin v( s / S ) = ( S ) ( s ) es, o no,
aproximadamente verificada. Observamos que es exactamente de esta manera que hemos
procedido en el captulo 3 para reconstruir la nocin de densidad poissoniana. Se puede as
poner en evidencia la existencia de una ley fsica vlida, con una cierta aproximacin, en un
cierto dominio de variacin s y de S (es necesario, evidentemente, que s sea lo
suficientemente pequeo respecto de S , para que tengamos, a nuestra disposicin, un
efectivo estadstico no demasiado dbil, digamos al menos 10 individuos).
Por otra parte, la teora nos hace prever esto: Si s (y con mayor razn S ) es grande respecto
del alcance A , tal como lo definimos en la relacin (5), entonces ( s ) difiere muy poco de
2 A / s . Por consiguiente, si nuestro modelo es bueno, podemos esperar de observar una
relacin de la forma:
(6)
1 1
v( s / S ) = A
s S
Esta relacin constituye una ley fsica, porque v(s / S) es una regional. Si nosotros podemos
(despus de la tirada) controlar experimentalmente que ms all de un cierto valor de s esta
ley es efectivamente vlida, hemos, por esto, logrado construir, en trminos operatorios el
concepto de alcance integral: Es ahora la ley fsica (6) que constituye por si misma la
definicin operatoria del concepto.
Esta reconstruccin solo es, en principio, realizable despus de la tirada. Lo ms a menudo, es
posible, an en praxis, de darse cuenta si el campo S es lo suficientemente grande para que
se pueda considerar la ergodicidad como alcanzada o realizada: Un ndice seguro lo
proporciona la forma del variograma experimental (es decir la estimacin del variograma
regional que se puede formar, in praxis, a partir de un nmero limitado de muestras). Si este
variograma experimental llega a una meseta o asntota horizontal, la cual parece estable
(haciendo abstraccin de las fluctuaciones residuales que siempre se espera observar) se
puede, sin gran riesgo de error, avanzar la hiptesis que el alcance existe bien (objetivamente)
y hacer una medida aproximada. La figura 4 muestra un ejemplo muy parlante.
81
Figura 4: Variogramas asociados a facies observadas en una mina: 1, concreciones calcreas; 2, minerales
interconcreciones; 3, uniones arcillosas. Segn J. Serra 60.
60
Morphologie Mathmatique et gnse des concrtions carbonates des minerais de fer de Lorraine.
Sedimentology, 10 (1968), 183-208
82
Figura 5: Variogramas experimentales de cotas topogrficas (falla de Noiretable 1/25000). Segn J. P. Chils 61
(h) = log | h |
(Variograma logartmico o Wijsiano). Se trata de un variograma indefinidamente creciente,
luego sin meseta ni alcance. Se puede, evidentemente, imaginar que la curva terminar bien
modificndose, ms all del ltimo punto experimental observado, e introducir, a la fuerza,
una meseta (o varianza 2 ) y un alcance finito: Pero se tratara de parmetros puramente
convencionales, a los cuales no se les podra asociar ninguna realidad observable. Por otra
parte, esto no tendra ninguna importancia: porque este modelo con meseta y alcance finitos,
siempre que coincida, aproximadamente, con el modelo Wijsiano hasta el valor ms grande
posible de |h| , conducira exactamente a las mismas conclusiones que este ltimo, en lo que
respecta, por lo menos, a los problemas reales que nos planteamos respecto de este fenmeno:
Si se trata de un problema real, no puede poner en juego distancias mayores que las que
existen entre los puntos del objeto real.
61
Gostatistique des phnomnes non stationnaires dans le plan, Tesis, Nancy, 1977.
83
Figura 6: Varianzas experimentales de las leyes de oro en bloques de tamao fijo en zonas ms y ms grandes,
en un yacimiento de oro de Africa del Sur. Segn D. G. Krige, citado en A. Journel 62.
LA MICROERGODICIDAD.
Supongamos que hemos medido los valores de la variable regionalizada z en n puntos
implantados, por ejemplo, en una malla cuadrada de lado a , en el campo S (que se supone
bidimensional) . Hay dos maneras bien diferentes de hacer tender n a infinito. O bien, la
malla queda constante, se aumenta el campo de investigacin, de manera de mantener
constante la densidad de muestreo, mientras que la superficie muestreada tiende hacia infinito
o bien, al contrario, se deja fija la superficie muestreada y se cierra la malla, de manera que
esta vez a tiende hacia 0 , o la densidad de muestreo tiende a infinito. En el primer caso (y
mediante ciertas restricciones poco importantes), se encuentra de nuevo lo esencial, la
situacin ergdica clsica, tal como la hemos analizado aqu.
En el segundo caso, al contrario, se encuentra, en el lmite, para a = 0 , la situacin ideal
dicha despus de la tirada cuyo inters epistemolgico ya hemos notado, que es aquella en
que el valor numrico de la V. R., interpretada ahora como realizacin de la F. A. del modelo,
es conocida en todos los puntos del campo S . Hemos insistido largamente sobre el hecho que
las magnitudes regionales, solas, poseen una significacin objetiva, y que por consiguiente,
los parmetros del modelo que no se dejan identificar con tales magnitudes son, en sentido
62
A. Journel y Ch. Huijbregts, Mining Geostatistics. Academic Press, Nueva York, 1978.
84
estricto, desprovistos de realidad. Entre estos parmetros, entonces, hay que hacer un orden, y
este ser, desde el punto de vista tcnico, uno de los aspectos ms importantes de la eleccin y
de la especificacin del modelo: Para un modelo dado de F. A. y un dominio S , cules son
los parmetros del modelo que se encuentran rigurosamente (o con una aproximacin dada)
determinados si se conoce una (sola) realizacin de la F. A. en S - y cules son aquellos que
no lo son? Solo los primeros tienen un sentido objetivo y son susceptibles de una definicin
operatoria en trminos de a tiende a 0 . Diremos que estos son micro-ergdicos. En cuanto
a los otros, estando desprovistos de realidad operatoria, pueden, en una muy grande medida
ser elegidos arbitrariamente (porque nunca tendremos indicacin experimental
verdaderamente exigente a su respecto).
Esta propiedad de micro-ergodicidad es totalmente distinta de la propiedad ergdica habitual
y merecera, a mi juicio, un estudio sistemtico. An en el caso de un modelo estacionario y
ergdico, ni la media ni la varianza son micro-ergdicos. Por el contrario, el comportamiento
del variograma en la vecindad de h = 0 es micro-ergdico, siempre que, como lo vamos a
ver, no sea demasiado regular. Bien mejor, y mediante ciertas hiptesis bastante dbiles, esta
micro-ergodicidad subsiste an en el caso no estacionario (se trata entonces, evidentemente,
del variograma medio definido como el valor medio en S del variograma no estacionario).
As, la estacionaridad y la ergodicidad clsica no implican, de ninguna manera, la microergodicidad, e inversamente, la micro-ergodicidad, puede ser verificada an en ausencia de
estacionaridad.
Examinemos, en efecto, la frmula (4) que proporciona (en el modelo F. A. intrnseca) la
varianza de fluctuacin del variograma regional R(h) (esta frmula solo es vlida en el
caso gaussiano, en el caso no-gaussiano, las consecuencias pueden ser diferentes 63). Hemos
visto que, a menos que |h| sea pequeo (o, agregumoslo, porque ahora podemos, a menos
que el fenmeno admita un alcance finito, pequeo respecto del campo S ), esta varianza
poda ser muy grande, privando as de significacin objetiva al comportamiento del
variograma terico para los valores grandes de |h|.
Para |h| pequeo, al contrario, se pueden presentar dos casos bien diferentes. Supongamos,
para abreviar la discusin, que el variograma del modelo sea istropo (es decir que solo
depende del mdulo |h| del vector h y no de su direccin,) y que para |h| pequeo, (h)
sea equivalente 64 a una expresin de la forma a|h| . La teora prev que son posibles dos
eventualidades:
63
Para el caso no-gaussiano, ver Alfaro-Sironvalle, M. Etude de la robustesse des simulations des fonctions
alatoires. Tesis, Fontainebleau, 1979.
64
Dicho de otra manera (h) / |h| tiende hacia a para |h| tendiendo a 0.
85
Se demuestra entonces (en el modelo) que la varianza de la razn R(h) / (h) es, para |h|
pequeo, equivalente a una expresin de la forma:
C |h|4 2 + B |h| n
(n es el nmero de dimensiones del espacio, es decir n = 1, 2 o 3).
Luego, esta varianza relativa tiende hacia 0 si y solamente si es inferior a 2, es decir si la
F. A. no es diferenciable en media cuadrtica. O tambin, en el modelo, se tiene la
convergencia:
(7)
R ( h)
a
| h |
(En el sentido en media cuadrtica o, tambin en, el sentido casi seguramente) siempre
que sea inferior (estrictamente) a 2, y el parmetro a es entonces micro-ergdico. Al
contrario, si = 2 , esta convergencia no tiene lugar, y la micro-ergodicidad no est ahora
asegurada.
Luego se desarrolla una conclusin muy instructiva: Los parmetros que definen el
comportamiento del variograma en la vecindad del origen son micro-ergdicos, y luego, el
particular, poseen una significacin objetiva, siempre que solamente el fenmeno (o ms bien
la F. A. que le corresponde en el modelo) no sea demasiado regular.
Esta conclusin no debe sorprender. El campo S puede ser muy pequeo (basta con que
contenga un conjunto abierto, por ejemplo una bola de radio arbitrariamente pequeo).
Figura 7.
86
que conoce las propiedades del proceso de Wiener-Levy comprender sin dificultad lo que
hemos dicho aqu, en trminos un poco vagos.
Notemos, sin embargo, que la convergencia (7) , para < 2 , es un suceso (casi seguro) del
modelo, pero su contraparte, escrita en trminos de regionales:
R ( h)
a
| h |
No es, realmente, controlable experimentalmente, porque se trata de un lmite, el cual pone en
juego una infinidad de puntos. Estamos entonces en un caso en el cual es necesario distinguir
entre el modelo primario (la V. R.) y la realidad fsica.
Para precisar el contenido fsico de la nocin, aparentemente simple, de comportamiento del
variograma en la vecindad del origen ser necesario proceder a una verdadera reconstruccin
operatoria. Volveremos sobre este punto en la tercera parte.
87
Encontrar tal que Var [ A ( Z1 ,..., Z N ) ] sea mnimo con la condicin
E [ A ( Z1 ,..., Z N ) ] = 0
A esta limitacin evidente (solo buscar en la clase de estimadores en los cuales somos
efectivamente capaces de calcular su esperanza y la varianza que el modelo le atribuye) hay
que agregar restricciones respecto la significacin objetiva de esta esperanza y de esta
varianza. El examen de esta ltima pregunta necesita, en efecto, la reconstruccin operatoria
del modelo, y ser abordado en la tercera parte, y anotamos solamente aqu algunas
observaciones preliminares.
Desde el punto de vista prctico, lo esencial se resume en una lnea:
CUIDADO CON LOS UMBRALES DE REALISMO Y DE ROBUSTEZ
Lo mejor en este estadio, es sin duda examinar algunos ejemplos.
88
Ms generalmente, localizndose en un punto de vista puramente terico (y a suponer siempre
que se ha logrado especificar completamente el modelo de F. A.) se podra creer que el mejor
modelo posible a utilizar en el problema de la estimacin es el de la F. A. inicial Z(x)
tomada condicionalmente a la informacin disponible, es decir a Z(x) = z , = 1, , N
fijos. Pero el trazo ms destacado de la ley espacial as condicionada es que, por construccin,
la ley espacial no contiene ningn elemento accesible a un control experimental directo: En
efecto, todos los datos experimentales pasaron al lado de las variables condicionantes, y
juegan el papel de parmetros en la expresin de la ley condicionada. Se concibe que es
errneo dar una confianza de hierro al modelo elegido para osar utilizar, a ojos cerrados, esta
ley condicionada. Hay todo lugar para temer que en este estado, no solamente el umbral de
robustez sino tambin el umbral de realismo han sido sobrepasados hace tiempo.
EJEMPLO DEL KRIGEADO 65.
Para tomar un ejemplo menos ambicioso, consideremos ahora el caso del modelo genrico F.
A. estacionaria de orden 2, en el cual los parmetros de especificacin son entonces: Una
esperanza m y una covarianza centrada (h) estacionaria. Supongamos que deseamos
estimar el valor z(x) de la V. R. en un punto x diferente de los puntos experimentales x
( = 1, 2, , N) , o ms generalmente, una media ponderada del tipo:
z ( p ) = p ( dx ) z ( x )
En que p es una medida de suma unidad y con soporte en S , es decir una magnitud
regional definida por una funcional lineal de la V. R. z . La clase de los estimadores
posibles (caracterizables con la ayuda de los solos criterios de especificacin del modelo) est
constituida por combinaciones lineales afines de la forma a + z . La versin teorizada
del problema de la estimacin es entonces la siguiente:
Encontrar las constantes a y , = 1, 2, , N, que minimicen E[Z(p) - a - Z ]2 .
(No agregamos la condicin de insesgamiento E( Z* - Z(p)) = 0 , que, en esta formulacin,
est automticamente verificada). La solucin, como se sabe, se obtiene al tomar el estimador:
z * = m + ( z m)
Con pesos que verifican el sistema:
( x x ) = p(dx) ( x x )
La expresin de este estimador depende, evidentemente, de los criterios de especificacin
elegidos, m y (h) . Adems, si los puntos experimentales x son en nmero elevado (N =
65
Este trmino que tiene su origen en la Geoestadstica Minera, hace alusin a los trabajos de D. G. Krige, y
significa mejor estimador lineal verificando tal o tal condicin de insesgado.
89
100, o 1000, etc), nos podemos preguntar si el sistema est bien condicionado.
Finalmente, si se trata de estimar z(x) en un punto dado, o una media z(p) tomada en una
vecindad inmediata de este punto, nos damos cuenta, examinando estas frmulas, que existe
el riesgo de atribuir un peso exageradamente importante a los puntos experimentales muy
alejados del punto a estimar. Parece fsicamente poco plausible que estos puntos tan alejados
ejerzan una influencia tan fuerte. Sera necesario aqu de nuevo, dar una confianza
verdaderamente total al modelo F. A. estacionaria de orden 2 para aplicar estas frmulas
con los ojos cerrados. Aqu, el sentido fsico debe intervenir, y rectificar lo que es demasiado
rgido en el modelo terico. Ciertamente, la realidad es ms o menos estacionaria (en un
sentido fsico, difcil de precisar), pero ms o menos solamente, y debemos prohibirnos de
utilizar estimadores tan poco robustos como este respecto de la estacionaridad del modelo
terico. En la prctica entonces:
i)
ii)
i ( xi x j ) = p (dx) ( xi x j ) +
i = 1
90
Ejemplos como este no dejan lugar a dudas en lo que respecta la significacin objetiva (y la
validez) de la nocin de varianza de estimacin. Pero, en la prctica se encuentra una
dificultad bien real: Es que la varianza de estimacin, tal como se la puede evaluar in praxis,
es decir sobre la base de una informacin parcial y de una estimacin aproximada de los
parmetros del modelo elegido, es, en efecto, por si misma, una estimacin: Sera necesario
entonces, de nuevo, avaluar la varianza de esta estimacin, y as sucesivamente hasta el
infinito.
Si el modelo ha sido bien elegido, la varianza de estimacin que se desea evaluar se expresa,
en principio, con la ayuda de los solos parmetros objetivos del modelo, es decir aquellos que
se expresan en trminos de magnitudes regionales. Pero la dificultad subsiste: Para apreciar la
posibilidad de la estimacin de regionales que especifican el modelo, es en general necesario
hacer intervenir otros instrumentos de trabajo adems de los que tenemos el derecho en este
marco. De donde la obligacin:
66
i)
ii)
91
calcular, digamos, la varianza de estimacin correspondiente, es necesario hacer
uso de los momentos de orden 4. La estimacin de estos momentos de orden 4 es a
veces posible (en regla general, en condiciones menos favorables que las de los
momentos de orden 2 mismos), pero nos obliga a adoptar un modelo ms
especificado (especificado por los momentos de orden 2 y 4), y se ve as comenzar
un desastroso regressus ad infinitum (desastroso, porque experimentalmente no se
puede nunca ir muy lejos, y por otra parte los umbrales de robustez y de realismo
seran rpidamente sobrepasados). A menudo, por otra parte, la estimacin directa
de los momentos de orden 4 no aparece como razonablemente posible. Se puede
entonces tratar de abrirse introduciendo una hiptesis mucho ms fuerte, la cual
permita deducir, por el clculo, los momentos de orden 4 a partir de los momentos
de orden 2 (por ejemplo, se puede admitir que la ley espacial es gaussiana o
lognormal, etc). Pero esta hiptesis suplementaria (que nos impone para entrar
al juego la eleccin de un modelo an ms especifico que el anterior) debe tambin
ser justificada. Y de nuevo, la carrera al mal infinito. En la prctica, sin embargo,
no nos preocupamos demasiado de esta dificultad terica: Porque un error sobre la
varianza de estimacin es evidentemente menos grave que un error sobre la
estimacin misma (y as en adelante).
92
TERCERA PARTE
LA RECONSTRUCCION OPERATORIA
93
CAPITULO VI
En los tres ltimos captulos de esta obra, quisiera sobre todo dedicarme a dar luz al
contenido fsico implcito de los modelos probabilsticos que utilizamos para representar
los fenmenos regionalizados. La riqueza de un concepto fsico depende del nmero y de
la variedad de fenmenos entre los cuales este concepto permite establecer acercamientos,
luego de la riqueza de la red de relaciones y de leyes fsicas en las que interviene, y que
constituyen, hablando claro, la definicin misma de este concepto como operatorio.
Entonces debemos entregarnos a una verdadera reconstruccin operatoria de nuestros
modelos probabilsticos: Tarea inmensa, que, evidentemente, no es posible cumplir en su
totalidad. Me contentar entonces con examinar algunos casos particulares tpicos, sin, por
otra parte, pretender de ninguna manera, que el camino que adoptar (paso por el
intermediario de las representaciones probabilsticas) sea el nico posible, ni an,
forzosamente el mejor.
El ejemplo del variograma nos retendr largo tiempo. Precisemos bien que no se trata del
variograma del modelo, cuyo status objetivo es an en parte incierto, sino ms bien de
lo que hemos llamado el variograma regional R : No su esperanza, sino el valor medio en
el espacio del cuadrado de la diferencia z(x + h) z(x) . Reescribamos su definicin, es
decir la frmula (2) del captulo precedente:
R ( h) =
1
2
[ z ( x + h) z ( x)] dx
2 K ( h) S ( h )
En esta escritura, nada evoca las probabilidades. El valor regional R es una realidad
fsica, que podemos considerar por s misma, independiente de interpretaciones
(probabilsticas o no) las cuales le adjuntaremos ms adelante. El variograma regional
constituye, por si mismo, una suerte de resumen de las caractersticas estructurales de la
V. R., y vehicula una informacin ya muy rica, de naturaleza fsica y no probabilstica.
Hemos visto como su comportamiento a los grandes valores de |h| era revelador para un
prctico: Si las curvas observadas en las diferentes direcciones del espacio se estabilizan
en torno de una asntota horizontal comn (o meseta) tenemos un ndice seguro de la
estacionaridad (en un sentido fsico), es decir de la homogeneidad del fenmeno en el
espacio. A esta realidad fsica se le asocia un concepto operatorio, el de alcance, en el cual
hemos visto su construccin a partir de una ley fsica (varianza de s en S ). Por el
contrario, si las curvas divergen violentamente en las diferentes direcciones, diremos que
hay una deriva: Concepto ms difcil a delimitar, sobre el cual debemos volver, pero
que corresponde, sin embargo, a alguna forma de realidad fsica, a una cierta forma de la
variacin espacial de la V. R.
Ms rico an de enseanzas, quizs, se revela el comportamiento del variograma en la
vecindad del origen. Por su definicin misma, adems, R caracteriza las propiedades de
94
regularidad y de continuidad del fenmeno: O ms precisamente, nos proporciona una
imagen promedio de estas propiedades. Mientras ms rpido es su crecimiento, cuando |h|
aumente, ms rpido se deteriora en promedio la influencia de un punto x sobre su
vecino x + h , y luego, ms discontinuo e irregular se revela el fenmeno mismo. Somos
llevados a representar el comportamiento de R en una vecindad de |h| = 0 por modelos
simples, que son de hecho, aproximaciones, utilizables solamente en una cierta escala de
trabajo: Por ejemplo, comportamiento parablico (en |h|2 ), o lineal (en |h| ) o efecto de
pepita (discontinuidad en el origen). Estos tipos de comportamiento responden a
propiedades reales del fenmeno. En el caso parablico, se tiene un fenmeno muy
regular, el cual es posible de cartografiar a esta escala, con todos sus detalles. En el caso
lineal, la cartografa es an, en grueso posible, pero deja escapar muchos detalles, ligados
a la demasiado grande irregularidad local. Finalmente, si hay un efecto de pepita, se sabe
de antemano que cualquier carta ser, en gran parte ilusoria. Estas observaciones,
puramente empricas, se imponen al prctico con una evidencia o una necesidad
ineluctable: Las leyes fsicas estn aqu a la obra, a pesar que no han sido an
formalizadas, y van a permitir la reconstruccin operatoria de la nocin de aspecto del
variograma en la vecindad del origen.
Para llevar ms lejos el anlisis, vamos a tratar una etapa intermedia: Entre la V. R. inicial
y el modelo probabilstico, vamos a insertar lo que llamaremos las representaciones
probabilsticas, es decir modelos perfectamente objetivos que presentan en una forma
probabilstica la totalidad de la informacin contenida en la V. R.: modelos tautolgicos,
accesibles solamente despus de la tirada, e inutilizables en si mismos. Servirn como
criterios para juzgar los modelos ms simples utilizados en la prctica (estacionarios,
intrnsecos, etc). Estos ltimos no caern ms como hechos del cielo de las ideas. Su
status ser el de simples aproximaciones anticipadas de estos modelos estrictamente
objetivos, inaccesibles, que nosotros llamaremos representaciones.
El misterioso problema de la inferencia estadstica aparecer, el tambin, en una forma
un poco nueva. Por ahora, en efecto, lo esencial de la realidad fsica de la cual queremos
darnos cuenta se encuentra sintetizada en el variograma regional, el problema no es
inferir el misterioso del modelo terico, sino estimar la integral espacial que figura
en la frmula (1), en la base de datos que disponemos in praxis: No se trata entonces de
inferencia estadstica sino ms bien del clculo aproximado de una integral a partir de un
nmero pequeo de puntos experimentales. Por lo tanto el problema no est resuelto, pero
la oscuridad que nos ocultaba su verdadera naturaleza se ha disipado un poco.
En el prrafo siguiente, definiremos dos tipos de representaciones probabilsticas de una
V. R. : Las representaciones transitivas, tiles para el estudio de problemas globales (por
ejemplo, la estimacin de la integral Q = z ( x)dx , y las representaciones deslizantes,
que nos permitirn abordar problemas locales (por ejemplo, la estimacin del valor z(x)
en un punto x dado). El resto de este captulo ser consagrado a los problemas y a los
modelos globales, los modelos locales sern el objeto del captulo siguiente.
95
LAS REPRESENTACIONES, O MODELOS PROBABILISTICOS ESTRICTAMENTE
OBJETIVOS.
Debido al principio de objetividad extremadamente estricto que hemos adoptado, tenemos
el buen derecho de preguntarnos si es solamente posible, para una V. R. dada, encontrar
(despus de la tirada) un modelo probabilstico perfectamente objetivo, es decir en el cual
todos los parmetros puedan ser identificados con magnitudes regionales. Esto quizs
puede ser una exigencia excesiva. Nosotros solo buscaremos, en efecto, modelos
monoscpicos es decir elaborados expresamente en vista de resolver un problema dado,
por medio de un mtodo que hemos elegido: La definicin de este problema y de este
mtodo hace, en general, llamado a ciertos parmetros, independientes de la V. R. pero
determinados sin ningn equvoco. Los llamaremos parmetros metodolgicos. Por
ejemplo, supongamos que el problema propuesto consiste en estimar la integral
Q = z ( x)dx de una V. R. z en el espacio de dos dimensiones, a partir de los resultados
z(x) proporcionados por el muestreo de una red regular de puntos experimentales x
implantados segn una malla cuadrada (a x a) : Este parmetro a o malla, no est ligado
a la V. R., pero lo impone el problema a resolver: Es un parmetro metodolgico, que se
puede, sin arbitrariedad, incorporar al modelo monoscpico con el ttulo de parmetro
auxiliar.
Convengamos en decir que un modelo es estrictamente objetivo si sus criterios de
especificacin solo hacen intervenir parmetros objetivos (identificables con magnitudes
regionales) y parmetros metodolgicos (impuestos sin ambigedad por el problema a
resolver y el mtodo elegido) con exclusin de cualquier otro tipo de parmetros
convencionales. Vamos a ver que es efectivamente siempre posible, despus de la tirada,
definir modelos estrictamente objetivos, que nos habran permitido resolver de manera
perfecta el problema propuesto si nos hubiera sido posible especificarlos correctamente in
praxis: Naturalmente, no hay milagro, y la especificacin perfecta de un modelo objetivo
queda fuera de ser alcanzado, in praxis, precisamente porque no conocemos los valores
exactos de las regionales asociadas a los parmetros objetivos. Tericamente, esto es un
crculo vicioso. Es claro, por otra parte, que un modelo estrictamente objetivo y es
justamente porque es estrictamente objetivo solo puede ser tautolgico: Solo hace
presentar en otra forma la misma informacin, la que est contenida en los datos de la
misma V. R. , y que es accesible solamente despus de la tirada. Se trata simplemente de
una representacin de la misma V. R.
En la prctica, sin embargo, la introduccin de ciertas hiptesis de aproximacin
razonables o de simplificacin permiten romper el crculo: Es aqu donde vamos a
encontrar de nuevo nuestras famosas hiptesis anticipativas (con la fecundidad y la
vulnerabilidad que estas implican), y que nosotros podremos ensayar de precisar un poco
su status epistemolgico, que es el de una aproximacin anticipada: a la representacin
rigurosa de la V. R. (modelo muy rico para ser especificable in praxis) vamos a sustituir
una representacin aproximada mucho ms simple, es decir un tipo de modelo cuyos
parmetros pueden ser objeto de una estimacin razonable in praxis, y que sin embargo
conduzcan a una solucin del problema, prcticamente equivalente a la que se habra
elegido si se hubiera podido disponer de la representacin rigurosa. Naturalmente, es,
96
como siempre, que solamente se puede afirmar esta equivalencia prctica, despus de la
tirada. El riesgo de error no ha sido eliminado, quedar simplemente mejor circunscrito.
Dicho esto, la representacin, o modelo estrictamente objetivo, es de naturaleza
probabilstica, mientras que la situacin real es nica, con nada de aleatorio, por lo menos
a la partida. Est caracterizada por dos elementos: De una parte la V. R. z , definida en un
campo S , y conocida despus de la tirada solamente; por otra parte la red de puntos
experimentales x , = 1, 2, , N en los cuales estn dados in praxis los valores
numricos z = z(x) . Para probabilizar, debemos acompaar, de alguna manera, esta
situacin actual de un halo de estados virtuales considerados como posibles, y admitir,
de una manera u otra, que el estado actual es solamente uno, cualquiera, de estos estados
posibles, y no se singulariza por nada de particular. Se acabar la construccin del modelo
al darse una ley de probabilidad sobre este conjunto de estados considerados como
posibles. Aqu, el principal peligro a evitar es evidentemente el peligro a lo arbitrario. En
la definicin probabilstica de estos estados virtuales, no podemos utilizar (si deseamos
quedar estrictamente objetivos) nada ms que la misma V. R. y la estructura de la red de
informacin. Pero al mismo tiempo, debemos proporcionar una cierta movilidad relativa a
estos dos elementos del problema, con el propsito, precisamente, de engendrar una
familia de estados virtuales realizables. La idea directriz, muy simple, consiste en
imaginar que la red de informacin se desplaza (o deforma) en el campo S de la V. R.
Para fijar las ideas, consideremos el caso ms simple posible, en el cual los puntos
experimentales x forman una red regular, con malla cuadrada o rectangular en el espacio
de dos dimensiones, y donde el problema planteado es el de una estimacin lineal. Las
cosas se presentan de manera bastante diferente segn que se trate de una estimacin
global o local.
Q = z ( x )dx
97
La forma exacta del campo S de la V. R. es desconocida (in praxis), pero el problema
de la estimacin global se plantea, razonablemente en la prctica, cuando la red regular
de los puntos x , en nmero necesariamente finito, desborda, en efecto, de manera
suficiente el campo S para que se pueda, sin inconvenientes, prolongarlo al infinito
(atribuyendo un valor cero a estos puntos ficticios suplementarios). Este punto de vista
corresponde a las representaciones transitivas 67: Uno, cualquiera, de los puntos
experimentales, sea x0 , se elige como origen de la red, y se supone que se desplaza en
el rectngulo definido por la malla, arrastrando con el, el conjunto de la red. Este
desplazamiento define el conjunto de estados virtuales, y basta enseguida con
considerar este punto x0 como un punto aleatorio distribuido uniformemente en el
rectngulo de la malla, para terminar con la definicin del modelo.
La palabra transitivo se emplea, aqu, como un equivalente espacial de transitorio. Indica que deseamos
tener en cuenta, en nuestro modelo, fenmenos de discontinuidad que se observan cuando se atraviesan las
fronteras del campo S .
98
estimar, la que se desplaza en su conjunto (en la terminologa minera, se habla de dispositivo
de tipo campo flotante e implantacin preferencial: entendiendo que el campo flotante
corresponde a la zona a estimar (x0) y no ms al campo total S que queda, evidentemente,
fijo en el espacio.
Q = z ( x)dx
99
(2)
Q* ( x0 ) = v z ( x0 + hi )
En que v es la medida del elemento de base (longitud, superficie o volumen, segn que el
espacio sea de 1, 2, o 3 dimensiones). Como x0 es (en el modelo) aleatorio en , este
estimador Q*(x0) es una variable aleatoria definida en el espacio = provisto de la
probabilidad uniforme en . Segn la manera como esta V. A. ha sido definida, todas sus
propiedades se expresarn con la ayuda de las solas caractersticas de (parmetros
metodolgicos) y de la V. R. z (parmetros objetivos). Se trata bien entonces de un modelo
estrictamente objetivo (o representacin).
La esperanza de esta variable es, por definicin:
E[Q* ] =
1 *
Q ( x0 )dx0
v
Al reemplazar Q*(x0) por su expresin (2), se ve sin dificultad que la sumatoria sobre todos
los vectores hi de la malla, junto a la integracin en el rectngulo de base, reconstituye la
integral extendida a todo el espacio entero, de manera que queda:
E[Q* ] = z ( x ) dx = Q
Se trata entonces (en el modelo) de un estimador sin sesgos del parmetro (objetivo) Q el
cual buscamos estimar. Un clculo totalmente anlogo muestra que el momento de orden 2, es
decir la esperanza matemtica de (Q*)2 es:
E[(Q* ) 2 ] = v z ( x) z ( x + hi ) dx
i
g (h) = z ( x) z ( x + h)dx
g (h)dh = Q
100
(4)
Var Q * = v g ( hi ) g ( h ) dh
i
Esta frmula merece un comentario. Une una nocin objetiva, definida sin ambigedad, la
varianza de estimacin, con una funcin muy simple, el covariograma transitivo g : el cual,
como se puede ver en la frmula (3), constituye en alguna manera el equivalente
determinstico de la covarianza C(h) = E[Z(x)Z(x + h)] de una F. A. estacionaria Z.
Rendir, en todo caso, los mismos servicios en la prctica. Pero no ha sido necesario
introducir ninguna hiptesis de estacionaridad respecto la V. R. : Esta no ha sido, por otra
parte, en ningn momento, interpretada como la realizacin de una funcin aleatoria. La
estacionaridad que se manifiesta aqu, no es una propiedad del fenmeno, sino solamente una
caracterstica de nuestra red de muestreo. Nuestro covariograma transitivo contiene
exactamente la misma informacin estructural que una covarianza estacionaria, pero presenta
sobre esta ultima una ventaja decisiva: Est definida sin ambigedad por la relacin (3), y su
significacin es puramente objetiva. Si nos contentamos, como se hace a menudo en la
prctica, con caracterizar la precisin de de la estimacin global por la sola varianza de
estimacin, la frmula (4) muestra que se trata de un problema bien planteado, el cual admite
una solucin definida sin equvoco, por lo menos despus de la tirada.
La significacin fsica de esta frmula (4) es por otra parte simple y fcil de captar. La
varianza de estimacin aparece, en efecto, como la diferencia entre el valor aproximado y el
valor exacto de una misma integral g(h)dh , luego, si se quiere, como el error que se
cometera al evaluar esta integral con la ayuda de una suma discreta sobre los puntos hi de la
malla. Segn lo que se sabe del clculo numrico aproximado de integrales, se debe entonces
esperar que varianza sea ms pequea, cuando la malla es ms cerrada, lo que es bien natural;
y tanto ms pequea, tambin, cuando la funcin g es ms regular. Como la regularidad de g
refleja las propiedades medias de continuidad de la variable regionalizada z misma, aparece
entonces que, para una malla dada, la estimacin ser mucho ms precisa cuando la V. R. ser
tambin ms regular y continua en su variacin espacial: Esto est en conformidad con lo que
la intuicin nos sugiere, y proporciona al contenido de esta intuicin, una expresin
matemtica rigurosa.
101
Para un vector h dado, la estimacin de g(h) = z(x)z(x + h)dx es anloga a la de Q (la V.
R. misma se reemplaza simplemente por z(x) z(x + hi) ), y esto conduce a tomar el
estimador:
g * (hi ) = v z ( x0 + h j ) z ( x0 + hi + h j )
i
Debido a que la red es invariante por traslacin, los puntos (x0 + hi + hj) estn, en efecto,
disponible al mismo tiempo que los (x0 + hj) . Para hi fijo, el producto z(x) z(x + hi) es
tambin una funcin de x , es decir una V. R. Sin embargo, el campo de esta nueva V. R. es
la interseccin S S-hi , luego ms pequea que el campo inicial, y los datos tiles
(diferentes de 0) son entonces menos numerosos que los que se dispone para estimar Q . Se
podra pensar, para apreciar la precisin de esta estimacin, aplicar la frmula (4) al
covariograma asociado a la V. R. producto de z(x) z(x + hi) , y as sucesivamente: Esto nos
conducira a una desastrosa regresin al infinito, introduciendo covariogramas de orden ms y
ms elevados, que sera necesario estimar a partir de datos de menos en menos numerosos
(del hecho de la disminucin del campo til), y por otra parte en condiciones ms y ms
dudosas (se sabe bien, en estadstica, que la estimacin de los momentos de orden un poco
elevados pierde rpidamente robustez). No ser entonces posible ir bien lejos en esta
direccin, y, en la prctica, se renunciar a menudo a asociar una varianza al estimador g*(hi).
El segundo problema es el de la interpolacin de g entre los valores (estimados g*(hi) ). En
verdad, segn la frmula (4), solo necesitamos en apariencia la integral g(h)dh = Q2 , y
se podra pensar entonces sustituirla a su estimador (Q*)2 .
Lamentablemente, esta sustitucin conducira a atribuir a Var Q* el valor 0 . Esto resulta de
la identidad fcil de verificar:
v g * ( hi ) (Q* ) 2 = 0
i
102
posible con la ayuda de los datos experimentales (los g*(hi) ) . Esta eleccin presenta una
importancia crucial porque en definitiva el resultado que obtendremos al aplicar la frmula (4)
al modelo g (una vez especificado) solo tendr valor en la medida en que este modelo
simplificado representar una aproximacin aceptable del verdadero g(h) desconocido. Lo
peor que se puede hacer aqu sera dejarse llevar ciegamente con algn procedimiento
automtico para interpolar entre los valores experimentales g*(hi) .
Para hacer esta eleccin con conocimiento de causa, conviene examinar de ms cerca la
estructura de la frmula (4), de manera de identificar, lo mximo posible, los factores que
ejercen la mayor influencia sobre la varianza de estimacin. Segn la definicin (3), el
covariograma transitivo g es una funcin de tipo positivo. Es, por otra parte, esta
condicin la cual nos garantiza que la expresin (4) es necesariamente positiva, como
conviene a una varianza. El modelo g que nosotros elegimos deber, entonces, el mismo, ser
una funcin de este tipo. Ahora bien, las irregularidades de estas funciones estn localizadas,
en lo esencial, en la vecindad del origen, y ahora, entonces, de nuevo, nuestra atencin es
atrada por el comportamiento del covariograma respecto de h = 0. De hecho, un anlisis
ms fimo muestra que el valor numrico proporcionado por la frmula (4) depende
principalmente del comportamiento de g(h) en una vecindad del origen, cuyas dimensiones
son comparables con las del elemento de base de la red de muestreo. El punto crucial
concierne entonces la interpolacin de g (h) entre g*(0) y los primeros puntos
experimentales disponibles en la vecindad de 0 , y el tipo de comportamiento analtico que
presenta el modelo elegido g en esta zona (por ejemplo: Lineal con efecto de pepita, o
comportamiento en |h|, 0 < < 2 : Es en efecto, la eleccin de este tipo de comportamiento
en la vecindad de h = 0 , la que constituye lo esencial de la hiptesis anticipatoria.
103
constante, luego, de promedio nulo. Se le llama, por esta razn, trmino fluctuante (o
Zitterbewegung). Su amplitud puede ser considerable, como lo muestra la figura 9:
Figura 9: Zitterbewegung en la estimacin de un crculo de dimetro unidad con la ayuda de una red de malla
cuadrada. En abscisa la malla a . En ordenada, la varianza de estimacin correspondiente 2(a). La curva en
azul representa el valor exacto T(a) + T(a) , calculado a partir de la frmula exacta (4). La curva morada
representa la frmula 2(a) = 0.2276 a3 + 0.00477 a5 obtenida al despreciar el Zitterbewegung y reteniendo los
dos primeros trminos del desarrollo limitado de 2(a). Nota del Traductor: No corresponde a la figura original,
la cual es, en parte, errnea.
A pesar que se sabe formar su expresin terica, no se puede nunca, en las aplicaciones,
prever su valor exacto: Porque, justamente, el valor exacto del alcance L se conoce con un
104
error a , y que , que es L/a Modulo 1 est entonces totalmente indeterminado. Estamos
autorizados, del hecho que el valor medio, en , de este trmino es igual a 0 a despreciarlo
puramente y simplemente. Se observar el carcter probabilstico camuflado de esta
aproximacin. Todo ocurre, en efecto, casi como si se considerara que 2(a) es una variable
aleatoria, cuya esperanza sera el trmino regular T(a) , mientras que el trmino fluctuante
T(a) representa la parte puramente aleatoria e imprevisible. De hecho, la figura 9 evoca la
situacin prealeatoria analizada por J. Ullmo, en la cual condiciones iniciales inseparables
implican ulteriormente una separacin de los fenmenos observados.
En lo que respecta al trmino regular T(a) , est ligado al comportamiento de g(h) en la
vecindad de h = 0. Por ejemplo, en un modelo en el cual g(h) es de la forma g(h) = g(0)
A|h| + (0 < 2), se encuentra, cuando la malla es pequea, una expresin asinttica del
tipo:
T(a) = A T a1 +
2 (a ) =
C
n1+
2 (a) =
C
1+
Por ejemplo, en el caso frecuente en que es igual a 1 , la varianza de estimacin est, esta
vez en razn inversa de la potencia 3/2 del nmero de datos tiles.
105
Estas relaciones (5) o (6) constituyen , en efecto, leyes fsicas. Despus de la tirada al menos,
es posible, en efecto, controlarlas experimentalmente. Ellas nos muestran de qu manera el
orden de magnitud de la varianza de estimacin se relaciona con el nmero de muestras. Y,
porque se trata de leyes fsicas, el parmetro que ponen en juego recibe, de la misma
tirada, un status operatorio: Estas relaciones nos garantizan que el modelo de comportamiento
que le hemos atribuido al covariograma g representa ms que una simple aproximacin
grfica: A saber un concepto fsico (el del comportamiento de g en la vecindad del origen,
representado por un grado de regularidad ) as como las leyes fsicas que constituyen este
concepto y permiten medirlo.
106
Notemos bien que en general (a diferencia de lo que pasa cuando se trata de avanzar una
hiptesis de estacionaridad respecto de la realidad fsica) tenemos en la mano, in praxis,
todos los elementos de apreciacin como si nosotros mismos hubiramos implantado la red, o
como si nosotros tuviramos a nuestra disposicin por lo menos la historia del
reconocimiento. Hay casos sin equvoco (por ejemplo el caso en el cual las implantaciones de
los puntos han sido realmente tiradas al azar segn un esquema aleatorio o aleatorio
estratificado): Tambin, a menudo, la red se presenta como muy heterognea, pero puede, sin
demasiada ambigedad dejarse dividir en dos o ms subzonas homogneas, en las cuales se
tiene todo el inters de tratarlas en forma separada. Esta circunstancia se encuentra
frecuentemente en geoestadstica minera, donde tal o tal parte del yacimiento ha sido objeto
de un reconocimiento ms exagerado que el resto (en razn de su riqueza particular, o
simplemente por la planificacin de la explotacin). Pero hay tambin casos ms difciles, por
ejemplo cuando se sabe que la implantacin de la red ha sido influenciada por hiptesis
(verdaderas o por otra parte, falsas) respecto de la V. R. As, en materia minera, se sabe que
en el estado del primer reconocimiento los sondajes se implantan en funcin de un objetivo
estructural, por ejemplo, para verificar una hiptesis de naturaleza geolgica etc Este efecto
preferencial es un generador de sesgos importantes pero difciles de apreciar, y prohbe
prcticamente toda estimacin cuantitativa precisa.
Desde el punto de vista matemtico, este modelo (red de muestreos considerada como un
proceso puntual estacionario) conduce a frmulas anlogas a (4). Aqu tambin se puede
poner en evidencia el papel crucial que juega el comportamiento del covariograma en la
vecindad del origen. Por ejemplo, en el caso de una malla aleatoria estratificada, se
encuentra, para la varianza de estimacin, la expresin:
Var Q* = v [ g(0) g() ]
En que g() representa el valor medio de g(x y) cuando los dos puntos x e y describen
el rectngulo que define la malla: En esta frmula intervienen los valores que toma g en
una vecindad del origen cuyas dimensiones son del mismo orden de magnitud que la malla
misma.
107
tipos de efecto, al reemplazar la integral por el valor medio correspondiente, es decir,
poniendo:
(7)
CR ( h) =
1
g ( h)
z ( x) z ( x + h)dx =
K ( h) S ( h )
K ( h)
En ciertos casos, esta separacin es ilusoria. Por ejemplo, si la V. R. presenta un aspecto zonal
tpico, caracterizado por un decrecimiento ms o menos continuo a partir de un corazn rico,
la geometra del campo est ligada de manera demasiado ntima con el aspecto de la variacin
espacial de la V. R. para que sea posible distinguir estos dos factores. Al contrario, en otros
casos, se tiene la impresin que el campo corta, como un sacabocados, una regionalizacin
que perfectamente, podra bien seguir ms all: En este ltimo caso, que es el de los
fenmenos que presentan una cierta forma de estacionaridad (en el sentido fsico), CR(h)
representa, mejor que g(h) , las propiedades de la V. R. z misma , considerada como
independiente de la geometra del campo.
Esta funcin CR(h) tiene, evidentemente, el sentido de una covarianza. De hecho, si elegimos
el modelo F. A. estacionaria, la expresin CR(h) escrita en (7) representa exactamente el
estimador que se utilizara despus de la tirada para proceder a lo que el punto de vista
clsico llama la inferencia estadstica de la verdadera covarianza C(h) (no centrada) del
modelo. En efecto, sabemos que la media espacial CR(h) agota el contenido objetivo de la
nocin de covarianza, porque ninguna informacin suplementaria nos permitir nunca
remontar ms lejos en la direccin de la covarianza ideal. Podramos identificar estas dos
funciones, y elegir justamente CR(h) como la covarianza del modelo 68 . Pero esta manera de
ver deja escapar un punto importante. De hecho el covariograma transitivo, el cual suponemos
es conocido despus de la tirada, presentara pequeas ondulaciones, puntos singulares y toda
una estructura de detalle que proporcionara tanta informacin o casi, que el conocimiento de
la V. R. misma. Pero esta rica estructura de detalle es absolutamente inaccesible in praxis.
An despus de la tirada, por otra parte, seramos llevados a simplificar, a reemplazar el
verdadero g(h) , demasiado complejo, por un modelo ms accesible. En particular, como lo
hemos visto, introducimos una hiptesis respecto el comportamiento (en |h| por ejemplo) de
esta funcin en la vecindad de h = 0 : Hiptesis que tiene una significacin perfectamente
objetiva 69, en la medida en que ella implica relaciones, como (5) o (6), que tienen el sentido
de leyes fsicas, y se prestan a un control experimental. Pero se puede, naturalmente, tambin,
interpretar este reemplazo de la verdadera funcin g , o CR , por un modelo ms simple como
un paso a la esperanza matemtica: Es entonces este modelo simplificado, el cual tiene un
sentido objetivo, el que puede servir de definicin de la covarianza C(h) .
Por otra parte, a menos que solo nos interesa la estimacin global, no tenemos ninguna razn
para limitar nuestra eleccin a los solos modelos estacionarios: Los resultados esenciales que
nos han proporcionado el estudio de las representaciones transitivas no dependen, en efecto,
68
Con la reserva de verificar que esta funcin es bien de tipo positivo; g y K son, por construccin, de tipo
positivo pero no forzosamente su razn.
69
En el sentido del criterio popperiano (falsificabilidad), y no en el sentido del criterio demasiado estricto de
decisibilidad en trminos de regionales (ver captulo 4, el prrafo consagrado al modelo primario).
108
de ninguna manera de una hiptesis cualquiera que concierne la estacionaridad fsica del
fenmeno. Estn ligados solamente con la estacionaridad de la red de muestreos. Esto sugiere
el camino siguiente: Sin riesgo alguno de desmentido experimental, podemos considerar la V.
R. z(x) como la realizacin de una F. A. no estacionaria de orden 2 , Z(x) , caracterizada por
una covarianza C(x ; y) = E[Z(x) Z(y)] , la cual depende separadamente de los puntos de
apoyo x e y , y no solamente de su diferencia x y . En la ptica clsica, esta covarianza no
estacionaria no puede ser objeto de una inferencia estadstica, porque disponemos de una
sola realizacin. Preferimos decir que la covarianza no presenta significacin objetiva, y
juega, en nuestro modelo, un papel puramente convencional. Esto no tiene ninguna
importancia, porque nosotros no tenemos realmente necesidad de conocerla. En efecto, en
nuestro modelo, el covariograma transitivo es una funcin aleatoria de h, a saber:
G ( h) =
Z ( x) Z ( x + h)dx
S (h)
La esperanza de esta V. A. G(h) puede ser identificada, no a g(h) mismo, sino ms bien al
modelo simplificado g(h) que le hemos sustituido, el que comportaba (por ejemplo) un
comportamiento en |h| en la vecindad del origen, y del cual hemos sealado la significacin
fsica. Es fcil de ver que esta esperanza E[G(h)] = g se expresa de manera simple con la
ayuda de la covarianza no estacionaria C(x , y). Designemos, en efecto, por C (h) el valor
medio de la covarianza C(x , x + h) relativa a dos puntos x e y = x + h distantes de h ,
cuando el punto x recorre el domino S(h) . Se encuentra la relacin simple:
109
parmetros que sirven para especificar el modelo, los que permiten resolver el problema
planteado y los que poseen el ms rico contenido fsico.
Una observacin para terminar. A la varianza de estimacin (4) de las representaciones
transitivas se encuentra hora asociado, en el modelo, la variable aleatoria obtenida al sustituir
G(h) en g(h) . La esperanza 2 = E( Var Q* ) de esta V. A. constituye lo que podramos
llamar la varianza de estimacin terica. Como E(G) es igual, por definicin, al modelo
g de covariograma, esta varianza terica se calcula a partir de g exactamente de la misma
manera que Var Q* a partir de g . Dicho de otra manera, esta varianza terica se identifica
con el trmino regular, ligado al comportamiento del covariograma en h = 0 , mientras que la
fluctuacin Var Q* - 2 , variable aleatoria de esperanza nula en el presente modelo, coincide
con el trmino fluctuante ligado al comportamiento de g(h) en la vecindad del alcance: El
aspecto prealeatorio, e imprevisible in praxis, de este trmino fluctuante se encuentra as, el
tambin, tomado en cuenta en la nueva formulacin.
En que Y(x) es una funcin aleatoria estacionaria, con esperanza nula y de alcance finito ((se
puede, evidentemente, considerar tambin modelos ms complejos). Diremos que m(x) es la
deriva y que Y(x) el residuo , o la fluctuacin. En este modelo, la deriva m(x) es la
esperanza (no constante) de la F. A. Z(x) asociada a la V. R. z(x) . A la fluctuacin, o F. A.
Y(x) del modelo, le corresponde una nueva V. R. , es decir y(x) = z(x) m(x) . Se entiende
que y(x) representa, tambin, una realidad fsica, y de ninguna manera un error de la
naturaleza (en nuestro ejemplo: La influencia de las estructuras superficiales), y la F. A.
110
Y(x) del modelo no es un simple ruido. Posee, tambin, caractersticas estructurales (una
covarianza, un alcance, etc), pero a una escala ms modesta que la deriva m(x) .
Este primer ejemplo no es demasiado ambiguo, porque un modelo fsico previo nos garantiza
que la dicotoma deriva + residuo corresponde a una realidad (estructuras profundas y
accidentes de superficie). Pero no siempre es as. En cartografa submarina, se espera bien que
la profundidad aumente cuando nos alejamos de las costas. Se trata, manifiestamente, de un
fenmeno no estacionario. Pero nosotros estamos en condiciones de definir con alguna
precisin la nocin de deriva que conviene utilizar aqu. Podemos, convencionalmente, elegir
de llamar deriva el resultado proporcionado por tal o tal procedimiento de alisamiento (media
mvil, filtro de altas frecuencias, etc). Pero aqu se trata de una definicin puramente
instrumental, y no de un concepto. La dificultad proviene, sin duda, del hecho que la
representacin intuitiva que tenemos en la cabeza, cuando hablamos de deriva, est
esencialmente ligada a una escala de trabajo. Para tomar otro ejemplo, consideremos una
montaa: Si trabajamos a la escala de una decena o de la centena de metros, la montaa se
presenta como una deriva funcional, y los accidentes locales del relieve (pequeos barrancos,
roqueros aislados, etc..) hacen la figura de residuos. Pero si se trabaja a la escala de la decena
de kilmetros, estudiamos ahora el conjunto de la cadena a la cual pertenece nuestra montaa,
sta solo nos parece una fluctuacin local que nada en particular nos permite distinguir entre
las montaas circundantes. El modelo ha cambiado. Lo que recin nos pareca una deriva, ha
sido tomada en cuenta, a la escala de la cadena, por una funcin aleatoria eventualmente
estacionaria.
DE hecho, entre los dos trminos de la dicotoma (8), un cierto balance es siempre posible:
Podemos, en una cierta medida, elegir de incorporar tal o tal caracterstica estructural del
fenmeno, a voluntad, sea en la deriva, sea en el residuo: Aqu aparecen varios modelos
posibles aproximadamente equivalentes, unos presentan una deriva compleja y un residuo
pobre, de alcance muy corto, otros, al contrario, una deriva muy simple (lineal o cuadrtica
por ejemplo) y, en contraparte un residuo de estructura ms rica, una funcin de covarianza
ms complicada, un alcance ms grande etc No hay aqu, un criterio unvoco de
objetividad, y se impone el punto de vista monoscpico. Es mediante el uso que aprendemos a
elegir, en cada caso particular, el tipo de modelo que nos permite resolver lo mejor posible el
problema que nos hemos planteado.
Luego, la nocin de deriva, o de tendencia, corresponde a una falsa evidencia, y se revela, a
un anlisis singularmente equvoco. Se oscila entre dos polos: El primero corresponde a una
simple atraccin visual: se representa, instintivamente, la deriva como la curva o la superficie
regular que pasa lo ms cerca posible de los puntos experimentales. Por superficie
regular, se entiende, lo ms a menudo, sea un polinomio de grado dado (este es el punto de
vista correspondiente a la tcnica de ajuste por mnimos cuadrados), sea una superficie
sometida a condiciones de curvatura (por ejemplo) que le imponen un cierto tipo de
regularidad (este es el punto de vista de la tcnica de las funciones spline). Estas tcnicas son
perfectamente defendibles, y proporcionan grandes servicios en ciertos tipos de problemas.
No hay nada que objetarlos, mientras que:
Que se reconoce claramente su carcter convencional y puramente instrumental, y
i)
que no se tomen los resultados numricos a los cuales conducen, ni por la
realidad fsica, ni por la realizacin de un concepto, y:
111
ii)
Este ltimo punto es importante. Lo que se obtiene al aplicar, por ejemplo, la tcnica de los
mnimos cuadrados a los datos experimentales z(x) no constituye de ninguna manera el
mejor estimador del resultado que dara la misma tcnica aplicada a la V. R. z conocida en
todos los puntos x de S . Para obtener esta mejor estimacin, conviene estimar estos
mnimos cuadrados futuros en la base de la informacin disponible. Por ejemplo, se
efectuar un krigeado global, si se dispone de un modelo global, o mas simplemente un
pegado de krigeados locales si solo se dispone de un modelo local. Es fcil de ver que esto
consiste exactamente en aplicar la tcnica de los mnimos cuadrados a la superficie obtenida
al krigear los valores desconocidos de z(x) . Dicho de otra manera, se debe ajustar por
mnimos cuadrados, no los valores experimentales z(x) , sino los valores krigeados z*(x) , x
S.
El otro punto de vista (que tiene el fuerte riesgo de revelarse como puramente metafsico, a
menos que se disponga de un modelo fsico preliminar) corresponde a la creencia espontnea
en la existencia de una suerte de tendencia regular, o fondo continuo (trend), tendencia
respecto de la cual las desviaciones que presenta el fenmeno real constituiran errores de la
naturaleza o, mejor, a anomalas, con significacin puramente local. En efecto, no se ve
bien sobre qu bases se podra acusar a la naturaleza de cometer errores (yo no hablo aqu del
problema, bien diferente, y totalmente realista, que se plantea cuando los datos experimentales
estn afectados de errores de medida). El concepto de anomala es ciertamente ms rico y ms
interesante, pero muy difcil de elucidar.
De todas maneras, antes de elegir un estimador, es necesario definir de manera precisa y
operatoria lo que se quiere estimar. Concretamente, esta definicin estar constituida por un
algoritmo aplicable, despus de la tirada, a la V. R. z . Siempre es una magnitud regional lo
que se busca estimar, es decir aproximarla lo mejor posible con la ayuda de una funcin de los
datos disponibles. Si entonces los geofsicos, por ejemplo, nos piden, a la vista de resultados
discretos de una campaa de medidas, separar la anomala local y la anomala regional,
nosotros le plantearemos la pregunta crucial habitual: Si usted conociera su V. R. z(x) en
todos los puntos x del campo que les interesa luego todo lo que es, en principio
experimentalmente posible conocer respecto de este fenmeno - Cmo procedera usted
para separar estas dos componentes locales y regionales? Esta distincin resulta de un
modelo preciso, que usted ha sugerido por los conocimientos que usted puede tener sobre la
fsica de este fenmeno, y este modelo lo conducir, en caso de conocimiento experimental
exhaustivo, a una determinacin rigurosa de cada una de estas dos componentes, o al menos
un procedimiento de estimacin bien definido? O bien usted se contenta con aplicar
mecnicamente tal o tal procedimiento de filtrado o de ajuste por mnimos cuadrados?
En todos los casos, nosotros le exigimos a usted precisarnos, bajo su responsabilidad, el
procedimiento numrico el algoritmo que usted utilizara si conociera perfectamente
vuestro fenmeno.
112
El resultado (actualmente desconocido porque en efecto z est dado solo en algunos puntos)
al cual conducira el algoritmo elegido por usted constituye la magnitud regional que para
nosotros, y para su servicio, nosotros podemos estimar para usted de la mejor manera posible,
considerando la informacin que disponemos y del modelo que hemos logrado especificar
sobre esta base. Pero de nuestra parte, nosotros no disponemos una regla universal que
permita, al entrar al juego, separa deriva en si y residuo en si, liso y rugoso y as
sucesivamente.
En ciertos casos, la nocin de deriva se presta para una reconstruccin operatoria, anloga a la
que nos ha permitido definir el alcance, y presenta entonces una significacin objetiva sin
equvoco: Pero, ms a menudo la dicotoma (8) aparece irreductiblemente arbitraria. Ahora
bien, sabemos que una solucin sensata de un problema real no puede depender de una
eleccin puramente convencional. Dicho de otra manera, si la nocin de deriva no es
susceptible de una definicin objetiva, nosotros no la necesitaremos nunca para resolver un
problema real. Esta observacin conduce a buscar modelos ms sintticos que (8), en los
cuales se renuncia a separar deriva y residuo, pero que conservan sin embargo, una forma
atenuada de estacionaridad: Estacionaridad bastante dbil para que sea compatible con la
realidad, pero suficiente para permitir la inferencia estadstica clsica. Un buen ejemplo de
este gnero lo proporcionan las funciones aleatorias intrnsecas de orden k 70 . Se trata de
una F. A. Z(x) no estacionaria, pero en la cual los incrementos generalizados, ellos, son
estacionarios: Entre las combinaciones lineales de la forma iZ(xi) , solo son estacionarias
las combinaciones lineales autorizadas , es decir las que filtran (anulan) los polinomios de
grado inferior o igual a k . La funcin de covarianza de Z es de la forma:
(9)
C ( x, y ) = K ( x y ) + al ( x) f l ( y ) + al ( y ) f l ( x)
l
En esta relacin los f l representan los monomios de grado inferior o igual a k , y los al(x)
funciones cualesquiera (desconocidas), inaccesibles in praxis, y quizs tambin despus de la
tirada. La parte no estacionaria de la covarianza C(x, y) , es decir las dos sumas del tipo alfl
, tiene entonces una significacin puramente convencional. Por el contrario, la parte
estacionaria K(x y) , o covarianza generalizada es accesible (despus de la tirada) y
puede ser (in praxis) objeto de una estimacin: Debido a que las varianzas de las
combinaciones lineales autorizadas solo dependen de esta funcin K , y no de la parte no
estacionaria de la covarianza. Es entonces la covarianza generalizada K la que constituye el
criterio de especificacin del modelo genrico F. A. intrnseca de orden k. Corolario
obligado, si elegimos este modelo debemos restringirnos solamente a manipular
combinaciones lineales autorizadas: Limitacin real, pero no nos impide de ninguna manera
aportar soluciones sensatas a los problemas bien propuestos.
La nocin de deriva no figura entre los criterios de especificacin y las herramientas de
trabajo autorizadas por este modelo. Sin embargo est tomada en cuenta, pero de manera
implcita solamente. En efecto, a una misma covarianza generalizada K (modelo especfico)
70
Ver mi artculo Intrinsic Random Functions, Adv. In APP. Prob., Dic.1973, y la exposicin de P. Delfiner
Linears estimations of non stationary spatial phenomena, en Advanced Geostatistics in the Mining Industry,
Ed. Por M. Guarascio y otros, 1976, D. Reidel.
113
le corresponde toda una clase de F. A. , las cuales difieren unas de otras por polinomios con
coeficientes aleatorios. Si Y(X) es una de estas F. A., las otras son de la forma:
Z(x) = Y(x) + Al f l(x)
En que los f l son monomios, y los Al variables aleatorias, no independientes de Y(x) en
general. Cualquier combinacin lineal autorizada que filtre, por definicin, los polinomios de
grado k , define entonces una sola y misma variable i Z(xi) = i Y(xi) independiente de
la eleccin de Y o de Z . Se puede, si se desea, llamar deriva al polinomio aleatorio Al
fl(x) el cual es as, automticamente filtrado por las combinaciones lineales autorizadas. Pero
esta deriva no est definida, ni an es definible, porque, no existe, en general, en la clase de
las F. A. asociadas a una misma covarianza generalizada K , una funcin aleatoria
privilegiada (estacionaria por ejemplo) que pueda servir de referencia fija.
En el caso particular k = 0 , se obtienen clases de F. A. con incrementos estacionarios,
definidos salvo una constante (aleatoria), y, salvo un signo, la covarianza generalizada se
identifica al variograma, es decir K = - . Hemos visto anteriormente que el comportamiento
del variograma en la vecindad del origen presentaba una significacin objetiva innegable, rica
en contenido fsico, y se prestaba para una reconstruccin operatoria. Podemos esperar que
ser similar para la covarianza generalizada K(h) cuando h es mayor que 0 . Por razones de
comodidad, examinaremos este punto, en el captulo siguiente, consagrado a los modelos
locales.
114
CAPITULO VII
En esta captulo consagrado a los modelos locales es decir a los modelos en los cuales se ha
elegido solamente manipular puntos que relativamente sean poco distantes unos de otros
nuestra tarea ser casi la misma que en el captulo precedente: fundar la objetividad, esbozar
la reconstruccin operatoria. Esta tarea ser, en un sentido, menos arduo, porque la repeticin
en el espacio que, debido a la falta de repeticin en el tiempo, nos proporciona nuestro criterio
de objetividad interna, se introduce de manera particularmente natural cuando nosotros
adoptamos el punto de vista de los modelos locales. El camino, aqu tambin, consistir en
partir de un modelo estrictamente objetivo o representacin, que servir enseguida de criterio
de comparacin para juzgar la objetividad y el valor de los modelos usuales. Y, de nuevo, la
eleccin de estos ltimos, tal como se puede efectuar in praxis, nos aparecer como tributario
de una hiptesis de aproximacin anticipada.
115
(1)
z * ( x) = i z ( x + hi )
i
|| z * z ||2 =
1
S0
*
z ( x) z ( x) dx
2
S0
Al reemplazar z*(x) por su expresin (1), se ve aparecer la funcin C(h, h) definida por la
frmula:
(2)
C (h, h ') =
1
S0
z ( x + h) z ( x + h ')dx
S0
i, j
Si la funcin c(h, h) fuera conocida (in praxis, evidentemente, ser necesario estimarla) la
secuencia de operaciones (eleccin de los pesos i ptimos, etc) se desarrollara
exactamente como en el caso de un krigeado. Esta funcin C(h, h), segn su definicin (2),
tiene bien la significacin de una covarianza. Esto sugiere la definicin totalmente general
siguiente:
116
Siendo dados una vecindad deslizante V , un dominio S0 y una V. R. z , diremos que la F.
A. definida por:
(3)
Z ( h) = z ( x + h)
(h V )
Yo supongo aqu que V es una vecindad simtrica con respecto al origen 0 de coordenadas, de manera de
no tener que distinguir entre V y su simtrico con respecto al origen.
117
Z(h) no utiliza realmente la prolongacin (ficticia) de la V. R. al exterior de su campo natural.
Diremos que se trata de una representacin deslizante interna, modelo particularmente bien
adaptado al estudio de la variabilidad interna de z , es decir al interior de su campo S
haciendo abstraccin de su geometra.
La F. A. Z(h) se anula, idnticamente, sobre V cada vez que el punto aleatorio x cae al
exterior del dilatado S V del campo S por la vecindad V . Entonces, si el domino S0
elegido por nosotros contiene S V , o, lo que es lo mismo, si el campo S est contenido
en el erosionado S V (ver figura 10), todas las configuraciones no triviales que se pueden
observar en las vecindades deslizantes Vx intervienen efectivamente en la definicin de la F.
A. Z(h) . Diremos, en este caso, que se trata de una representacin externa o exhaustiva de la
variable regionalizada.
Se puede demostrar el teorema siguiente: Toda representacin deslizante externa es una
funcin aleatoria estacionaria en V. En particular, si se designa por g(h) al covariograma
transitivo de la V. R. z , la funcin de covarianza de la F. A. estacionaria sobre V que se le
asocia en una representacin externa es:
C (h, h ') =
1
g (h h ')
S0
Sin embargo, y a pesar de este bonito teorema, las representaciones externas son raramente
interesantes en las aplicaciones. Corresponden, en efecto, a una situacin donde se habra
decidido a priori, utilizar el mismo algoritmo invariante por traslacin tanto para las
configuraciones internas (Vx incluido en el campo de la V. R.) como para aquellas que
sobrepasan la frontera: Actitud en general poco realista porque, en la mayora de los casos,
existe un inters evidente en tratar aparte, de manera diferente, las configuraciones de borde
(que contienen datos nulos, exteriores al campo real). Por otra parte, a menudo, el dominio S
que nos interesa es una parte, seleccionada por nosotros, de un campo total ms vasto, y en
este caso la representacin deslizante es necesariamente interna. Estas representaciones
deslizantes externas son en realidad una versin localizada de las representaciones transitivas.
No pueden entonces, como estas ltimas, presentar inters solamente cuando la geometra del
campo de la V. R. presenta una gran importancia para el problema a resolver, por ejemplo, si
el campo S est constituido de un gran nmero de componentes conexas disjuntas o presenta
numerosos enclaves de estril.
PRIORIDAD DEL METODO.
El punto de vista de las representaciones deslizantes consiste, en suma, en tratar de hacer de la
estacionaridad una caracterstica (limitativa) elegida por nosotros en la clase de estimadores a
utilizar ms que considerarla como una propiedad de la realidad fsica (la V. R.) o tambin
como una caracterstica de un modelo de F. A. (no estrictamente objetivo) elegido a priori. La
operacin tiene xito perfecto en el caso de las representaciones externas (ver el teorema
anterior), solamente parcialmente en los otros casos. Volveremos sobre este punto. Nuestra
decisin metodolgica: Solamente utilizar estimadores con carcter local, asociados con
118
algoritmos invariantes por traslacin, no supone de ninguna manera la estacionaridad o la
homogeneidad del fenmeno en el espacio, pero no ser absurda en caso de heterogeneidad.
Es cierto, en caso de heterogeneidad, si fuera realmente posible (a partir de los datos
disponibles in praxis) dividir el campo total en subzonas en las cuales el fenmeno queda
aproximadamente homogneo (y especificar un modelo diferente para cada una de estas
zonas!)
se tendr inters, en general, en utilizar algoritmos diferentes, ajustados
especialmente para cada una de las subzonas: El error ser menor, en promedio, y adems las
varianzas de estimacin estarn localizadas (es decir sern diferentes de una subzona a otra,
conforme a lo que sugiere la intuicin fsica).
Lamentablemente, no es siempre posible definir, en condiciones aceptables, esta particin del
campo, ni de especificar los diferentes modelos adaptados a cada una de las zonas: Esto,
simplemente, porque los datos disponibles se hacen raros, a medida que estas subzonas se
multiplican, de manera que los errores cometidos comienzan a ser ms y ms grandes, y que
se tiene el riesgo fuerte de sobrepasar el umbral de robustez y tambin el umbral de simple
realismo.
Ante el mtodo potente, que utiliza algoritmos diferentes en cada una de las subzonas, pero
que necesita prerrequisitos demasiado numerosos, prcticamente inaccesibles in praxis (tantos
modelos especficos como subzonas), debemos a menudo, conforme con nuestras reglas
metodolgicas generales, sustituir un mtodo menos potente (un solo algoritmo invariante por
traslacin, por lo menos mientras x pertenezca a S ), pero necesariamente tambin con
menos prerrequisitos. Tendremos, es cierto, as una varianza de estimacin ms fuerte y no
localizada: El valor numrico que le atribuiremos representar solamente la media de los
valores diferentes que la varianza toma en cada una de las subzonas que hemos renunciado a
distinguir. En contraparte, caemos bajo del umbral de robustez, y la especificacin del modelo
vuelve a ser accesible in praxis.
Sin embargo observamos un punto importante: Aqu no se requiere ninguna hiptesis respecto
de la homogeneidad fsica del fenmeno. Por el contrario, nuestras representaciones
deslizantes son realistas solamente si el reconocimiento (la red de los puntos experimentales),
es suficientemente homogneo (en el dominio S0 V ). En efecto, para una configuracin
dada, centrada en x , nosotros calculamos la varianza de estimacin al tomar la media
cuadrtica del error cuando x describe S0 : Esto es sensato si se puede esperar encontrar
configuraciones idnticas, o al menos suficientemente anlogas, para implantaciones de x
repartidas de manera ms o menos uniforme en S0 . En el caso contrario, en efecto, tenemos
el riesgo de utilizar caractersticas globales de la V. R., bien diferentes quizs de las
caractersticas locales que habran convenido al tratamiento de esta configuracin demasiado
particular. En caso de heterogeneidad, la solucin consistir, en principio, de cortar el campo
en subzonas reconocidas de manera homognea (lo que es ms fcil, o menos riesgoso, que el
corte en zonas en que el fenmeno mismo es homogneo) y tratar separadamente estas
subzonas.
En este estado en que hemos llegado, conviene introducir una nocin general, la de regional
deslizante asociada a una regionalizacin deslizante, nocin en la cual el estimador (1)
119
constituye un caso particular. La V. R. z ha sido prolongada (por valores idnticamente nulos
al exterior de S) , consideremos una funcional cualquiera a(z; V) definida por la restriccin
de z a la vecindad V del origen 0 . Para cada x pongamos a(z; Vx) = a(z-x; V) , en que z-x
es la V. R. deducida de z por la traslacin -x , es decir z-x(y) = z(x + y) : Diremos que la
funcin x a(z; Vx) as definida constituye la regional deslizante asociada al algoritmo a(z;
V) invariante por traslacin. La restriccin de esta funcin a S0 (provisto de la ley uniforme)
Es entonces una variable aleatoria asociada a la F. A. Z(h) definida por la representacin
deslizante: A saber la V. A. a(z; V) . El formalismo de las representaciones deslizantes
permite entonces, en principio, estudiar cualquier regional deslizante, lineal o no, y entonces,
en particular, abordar los problemas de estimacin (local) no lineales, por medio de
esperanzas condicionales, o de estimadores de tipo disyuntivo etc: Bajo la reserva
(esencial) que la especificacin in praxis sea razonablemente accesible.
En toda generalidad, el problema de la estimacin local es el de la estimacin del valor en
todo x S0 de una regional deslizante a(z, Vx) . Si los puntos experimentales xi = x + hi
disponibles en la vecindad deslizante Vx del punto x han proporcionado los valores z(xi) =
zi , es decir un algoritmo a*(zi; hi) tambin invariante por traslacin y pudiendo jugar el papel
de un estimador. Para elegir un tal algoritmo, podemos adoptar diferentes criterios. El ms
simple de ellos consiste en minimizar (en el modelo) la varianza de estimacin, o tambin
simplemente, el error cuadrtico medio:
E[ (a(Z, V) a*(Zi, hi))2]
Cuando la funcin a* describe una familia elegida por nosotros. In praxis,
evidentemente, elegiremos una familia lo ms grande que pueda especificar nuestro modelo.
Por ejemplo podr ser la clase de estimadores lineales, los cuales verifican tal o tal
condicin de universalidad, o bien la de los estimadores disyuntivos (ver captulo 8) etc
La regional deslizante que debemos estimar puede ser ms o menos cualquiera (con la reserva
que su definicin solo haga intervenir valores observables sobre una misma vecindad V . Por
ejemplo, se puede tratar de una media mvil:
z p ( x) = z ( x + y ) p (dy )
De la V. R. ponderada por una medida p cuyo soporte est contenido en V : El caso ms
frecuente en la prctica es el de la ley media de un panel deslizante vx Vx . Pero a puede
tambin representar una funcional no lineal en z . Por ejemplo, si adems de la ley media de
los paneles deslizantes, nos interesamos tambin a sus leyes de distribucin, se buscar, para
cada x S y cada nmero real u , estimar la cantidad:
1 si z p ( x) u
0 si z p ( x ) < u
p ( x; u ) =
120
El problema a resolver (estimar la regional a(z, V) ) es un dato impuesto, sobre el cual no
podemos actuar. En lo que respecta a la eleccin del mtodo (es decir la eleccin en la clase
de los estimadores a utilizar) disponemos de una gran latitud. Mientras ms grande sea esta
clase , ms potente ser nuestro estimador, pero tambin sern ms numerosos los
prerrequisitos relativos a la ley espacial de la representacin deslizante Z(h) cuyo
conocimiento ser imperativamente requerido para determinar efectivamente el estimador
ptimo. Si la representacin deslizante estuviera completamente especificada (lo que sera el
caso despus de la tirada), se debera tomar para la clase ms grande posible, es decir la de
todas las funciones medibles. El estimador ptimo sera en consecuencia, la esperanza
condicional. Pero, in praxis, no es posible especificar suficientemente la representacin para
que la esperanza condicional sea accesible en condiciones de robustez razonables. La tctica a
observar va a consistir entonces en restringir la clase de los estimadores a utilizar, de
manera suficiente para que la especificacin de los prerrequisitos necesarios sea
razonablemente posible, pero sin embargo no demasiado, para no disminuir ms la potencia
de nuestro estimador.
Encontramos aqu de nuevo, muy exactamente, el problema de la eleccin y de la
especificacin de un modelo de F. A., tal como fue expuesto en el captulo 4, pero con una
diferencia capital: Como ahora se trata de representaciones, es decir de modelos estrictamente
objetivos, los parmetros de este modelo (salvo S y V que se eligen de una sola vez) todos
tienen una significacin puramente objetiva.
Mucho mejor, la pertenencia de Z(h) a tal o tal modelo genrico es decidible despus de la
tirada, de manera que un enunciado como la representacin Z(h) es una F. A. estacionaria
de orden 2 constituye ahora una hiptesis objetiva, verdadera o falsa, pero decidible despus
de la tirada. Despus de la tirada, en efecto, podemos calcular las expresiones:
S0 S0
Y constatar si estas son, o no, invariantes por traslacin. En la prctica, no sern nunca
(rigurosamente) estacionarias. Pero nosotros no demandamos tanto, y estamos todos
dispuestos a contentarnos con una estacionaridad aproximada. Si encontramos, con una
aproximacin aceptable (para h, h pertenecientes a V ):
(4)
m( h) m
121
Reemplazaremos, sin dificultad, la verdadera representacin Z(h) por el modelo estacionario
de orden 2 definido por m y C (h h ') . Respecto a lo que hay que entender por
aproximacin aceptable, esto depende evidentemente del problema a resolver y de los datos
disponibles: A partir de estos datos, el modelo exacto y el modelo aproximado deben conducir
a estimadores poco diferentes, y atribuirles varianzas de estimacin poco diferentes.
Naturalmente, solamente despus de la tirada podremos constatar si esta condicin se
satisface y si el modelo genrico F. A. estacionaria de orden 2 constituye una aproximacin
aceptable de la representacin Z(h). Adoptar este modelo in praxis constituye siempre una
hiptesis anticipatoria (a la vez fecunda y vulnerable), como en el captulo 4, pero ahora la
significacin es puramente objetiva (decidible despus de la tirada); y cuyo status
epistemolgico es perfectamente claro: La eleccin in praxis de un modelo genrico por la
representacin deslizante constituye simplemente una hiptesis de aproximacin anticipada.
Ahora vamos a pasar en revista algunos modelos genricos que se utilizan a menudo en la
prctica como una aproximacin de las representaciones deslizantes. Diremos que se trata de
modelos locales. El adjetivo local no debe hacer ilusin. El modelo dicho local, en efecto,
no pretende de ninguna manera distinguir las unas y las otras caractersticas que posee la V.
R. en las diferentes partes de su campo, sino que presenta solamente una imagen media de
estas diversas propiedades localizadas. Se dice local porque permite hacer estimaciones
locales, y solo est definido en la vecindad V del origen. Pero los parmetros que lo definen
tienen todos una significacin global (estn definidos por integrales en S ).
De aqu esta consecuencia (que es paradojal en apariencia) importante para la metodologa:
La especificacin in praxis de un modelo local plantea siempre un problema de estimacin
global. Para abordar este problema, hay, en general, inters en distinguir dos etapas:
i)
ii)
m=
1
m ( h ) dh
V V
122
En forma explcita, m aparece como una regional, y constituye una media de los valores de
z(x) en S0 V , ponderados por una funcin que considera la distancia del punto x a la
frontera del dominio S0 . Cuando la vecindad mvil V es relativamente pequea con
respecto de S0 (lo que es el caso ms usual) m difiere poco de la media (ordinaria) de z(x)
en S0 .
Anlogamente, para la covarianza C (u ) se la puede definir como el valor medio de C(h, h +
u) cuando h recorre el dominio V(u) , igual a la interseccin de V y de su trasladado por u . En forma explcita, la regional C (u ) aparecer como un valor medio en S0 V de la
expresin z(y) z(y + u) , ponderada por una funcin que tiene en cuenta la proximidad de las
fronteras. Aqu tambin, si V es pequeo delante de S0 , aparecern simplificaciones, y
C (u ) ser poco diferente de la media no ponderada da la misma expresin tomada en el
dominio S0(u): Es en suma, la covarianza media C (h) = g (h) / K (h) del ltimo prrafo del
captulo precedente.
Resulta de lo anterior que el problema de la estimacin, in praxis, de m y de C (u ) se
presentar, formalmente, en las mismas condiciones que el de la inferencia estadstica
clsica. Sin embargo con esta diferencia, importante del punto de vista metodolgico, que
sabemos exactamente lo que buscamos estimar: Integrales del espacio, y que conocemos la
naturaleza de los errores que cometemos, los que acompaan necesariamente el clculo
numrico aproximado de una integral a partir de un nmero finito de puntos.
(h, h ') =
1
2S0
[ z ( x + h) z ( x + h ')]
dx
S0
123
(con la diferencia que el campo real S est reemplazado por el dominio S0 elegido por
nosotros).
La estimacin in praxis se hace en las mismas condiciones que la del variograma de una F. A.
intrnseca a partir de una realizacin nica: Habiendo elegido clases de ngulo y de
distancia ui de centros ui , se forma una expresin de la forma:
* (ui ) =
(5)
1
Ni
[ z ( x ) z ( x )]2
2
ii)
124
misma hiptesis de aproximacin la cual avanzamos como una anticipacin, por
otra parte, a nuestros riesgos y peligros, porque esta vez nos podemos equivocar, y
que solamente despus de la tirada podremos verificar su validez.
De un punto de vista epistemolgico, se puede notar que una hiptesis de aproximacin de
este tipo (reemplazo del verdadero (u) por un (u) de tipo ms simple) no es solamente
legtima sino adems, en un cierto sentido, obligatoria. Porque, si se vuelve a la significacin
fsica de las magnitudes puestas en juego, nos damos cuenta que ms all de una escala
pequea, la nocin misma de V. R. queda vaga y mal definida, de manera que a esta escala el
concepto de comportamiento analtico del verdadero (u) cesa de ser operatorio. Pero, si la
simplificacin o tipificacin del variograma es obligatoria por razones fsicas, es cierto que el
tipo que nosotros elegimos in praxis es mucho ms simple que el que podramos adoptar
despus de la tirada, de manera que introduciremos realmente una hiptesis (anticipada) de
aproximacinAl lado del problema de la inferencia estadstica, problema del cual hemos precisado su
status epistemolgico, la Estadstica Matemtica considera igualmente los tests de hiptesis.
Desde el punto de vista muy positivista que es aqu el nuestro, nos refutamos a plantear
estos problemas al nivel de las generalidades: Pensamos que no hay gran sentido en estimar
un parmetro que no ha sido previamente objeto de una definicin operatoria precisa, y,
anlogamente, nos refutamos a testear hiptesis desprovistas de significacin objetiva. En el
caso que nos ocupa, el variograma a estimar est definido de manera precisa por una integral
del espacio. Anlogamente, la hiptesis intrnseca que habra que testear es la hiptesis de
aproximacin (h, h) (h h) . Esta hiptesis tiene un sentido objetivo, porque podemos
siempre, despus de la tirada, juzgar si se trata de una aproximacin aceptable (en relacin
con la solucin de un problema dado). Pero no es fcil someterla in praxis a un control
preciso, utilizando criterios bien definidos: Debido a que, si es posible en general de estimar
in praxis el (que solo depende del argumento u ), no es lo mismo para el (h; h) el cual
depende de dos argumentos: En general, los datos disponibles no permiten estimar de manera
significativamente diferente (h; h) y su trasladado (h +u ; h + u).
De hecho, los contratiempos eventuales a la estacionaridad, o al carcter intrnseco, de la
representacin deslizante son imputables nicamente a la forma que presenta la V. R. en la
zona de borde, comprendida entre el dilatado S0 V y el erosionado S0 V : Luego, esta
zona contiene, en general, muy pocos puntos experimentales para que sea posible testear con
precisin su homogeneidad o su heterogeneidad. En la prctica, sin embargo, un
geoestadstico entendido no vacilar mucho. De un lado, en efecto, la informacin no
numrica (cualitativa) que el geoestadstico posee sobre el fenmeno fsico, le indica, en
general, si es o no razonable admitir que la proximidad de la frontera no ejerce influencia
sensible. Enseguida, el aspecto de los variogramas brutos (los *(ui) ) en las diferentes
direcciones es en general bastante revelador: Dos tipos de anisotropa incoherentes e
inestables, formas violentamente convexas contrastan con el crecimiento ms moderado que
se puede observar en otras direcciones, constituyen ndices muy seguros de no estacionaridad.
Por el contrario, variogramas relativamente estables, de forma cncava o a lo ms lineal,
anisotropas de tipo simple etc incitarn a adoptar el modelo intrnseco local.
125
126
V. R. es ella misma un polinomio de grado k ). Se puede decir tambin que el error de
estimacin queda invariante cuando se agrega a z un polinomio de grado k .
Se vio, al final del captulo precedente, que una funcin aleatoria intrnseca de orden k debe
ms bien ser considerada como una clase de F. A. la cual admite covarianzas de la forma:
(6)
En que K es una covarianza generalizada, caracterstica del modelo, mientras que las
funciones al dependen de la versin elegida y quedan inaccesibles in praxis. Pero la varianza
de una combinacin lineal autorizada, y, en particular nuestra varianza de estimacin, solo
dependen de K , y no de la parte no estacionaria de la covarianza. Esto sugiere la definicin
del modelo F. A: localmente intrnseca de orden k: Este modelo consiste en admitir que la
covarianza C(h, h) de la representacin deslizante verifica (aproximadamente) la relacin
(6) para una covarianza generalizada K dada. Se trata entonces, como en todos los problemas
locales, de una hiptesis de aproximacin, que se adopta in praxis de manera anticipada y que
se puede, en principio, controlar despus de la tirada, al verificar que esta hiptesis modifica
poco la solucin del problema que nos interesa.
Observamos, al pasar, que con esta definicin, las condiciones de universalidad, que
imponemos a nuestros estimadores, no pueden ser interpretadas como condiciones de
insesgamiento. El insesgamiento es, por otra parte, una propiedad definida en el modelo
solamente, y solo podra recibir una significacin objetiva despus de haber soportado la
reconstruccin habitual. Nuestras condiciones son, en trminos fsicos, condiciones de
filtrado. Tienen por efecto eliminar la influencia de una deriva eventual, es decir una
componente suficientemente regular para que localmente (es decir sobre una vecindad Vx de
cada punto x ) pueda ser asimilada a un polinomio de grado k .
Este modelo est especificado por la sola covarianza generalizada K(h), que, por otra parte,
basta con definir en la vecindad 2V (doble de V ) del origen: No tenemos ninguna necesidad
de conocer las funciones al(h) de la frmula (6). Es posible despus de la tirada, definirlas de
manera objetiva en condiciones razonables, pero ciertamente no estimarlas in praxis. En lo
que respecta a la covarianza generalizada, su significacin objetiva es la misma que al de un
variograma local, y su reconstruccin operatoria puede ser efectuada de manera anloga. Su
estimacin in praxis (a partir de combinaciones lineales autorizadas que se pueden formar con
la ayuda de los datos experimentales) es, muy a menudo, posible en condiciones aceptables.
Preguntas ms complejas no pueden ser abordadas aqu, y el lector deber referirse a la
literatura especializada.
127
CAPITULO VIII
Los modelos locales que acabamos de revisar son todos modelos de orden dos (es decir
especificados por el conocimiento de una covarianza, de un variograma o de una covarianza
generalizada) y solo permiten abordar problemas de estimacin lineales: La clase a la cual
decidimos limitar la bsqueda de un estimador ptimo, del hecho mismo que adoptamos uno
de estos modelos, es la clase muy pobre de los estimadores lineales autorizados a tal o tal
orden. Pero la prctica plantea a menudo problemas en los cuales la solucin necesita el
recurso a estimadores ms potentes, no lineales. Citemos simplemente dos ejemplos:
Cuando se krigea, por ejemplo, un punto x a partir de los puntos experimentales disponibles
en la vecindad mvil Vx , se combina esta estimacin con una varianza de krigeado que se
sabe calcular. Pero, como lo hemos observado, esta varianza es un parmetro global, y no
local. La varianza de krigeado no est ligada especialmente, a las particularidades
estructurales que presenta la V. R. en esta vecindad Vx , sino que representa simplemente el
valor cuadrtico medio de los errores que se cometeran al estimar cada uno de los puntos de
S con la ayuda de la misma configuracin de puntos experimentales. Si se encuentra que en
la vecindad de un punto x considerado, la V. R. presenta un comportamiento ms errtico, o
al contrario, ms regular que el promedio, el error debera ser ms fuerte, o al contrario, ms
dbil en ese punto. Pero nuestra varianza de estimacin, solo tiene un sentido global, no puede
dar cuenta de este efecto. En el marco de una representacin deslizante, no es posible, por
construccin, proporcionar una significacin local a la varianza de estimacin. Pero a falta de
poder localizar el error, (es decir expresar la varianza en funcin del punto x a estimar)
podramos esperar de condicionarla (es decir expresarla en funcin de los valores zi
observados en los puntos experimentales xi Vx ). Esta varianza condicional constituira un
buen sustituto de la varianza localizada que no podemos alcanzar en el marco de este modelo.
En efecto, si la V. R. presenta, en la vecindad del punto x una dispersin ms fuerte o ms
dbil que en otras partes, los valores experimentales zi observados en Vx son ellos mismos
ms, o menos, dispersos que en promedio, y por consiguiente, si el modelo es bueno, la
varianza condicional puede rendir cuenta de este efecto local.
El segundo ejemplo est tomado de la polucin (se tendra una formulacin anloga, pero ms
compleja, en el caso de las minas con el problema de la explotacin selectiva). Se han medido
las leyes z de un contaminante en un cierto nmero de puntos x , y estamos inquietos por
la probabilidad para que la ley media : z (vx0 ) = (1/ v) z ( x0 + x)dx En contaminante en una
v
vecindad
vx0
de un punto
x0
z0 : En
128
Estos problemas y otros anlogos, necesitan el recurso de las leyes condicionales. Como de
costumbre, antes de hacer uso de un concepto matemtico, debemos plantearnos dos
preguntas: Es posible redefinir este concepto de una manera puramente operativa (punto de
vista despus de la tirada)?, y podemos nosotros, en la base de la informacin actual, obtener
una estimacin razonable (punto de vista in praxis)? La respuesta a la primera pregunta ser
parcialmente positiva; mientras que para la segunda pregunta, ser categricamente negativa a
partir de cuando hay uno o dos puntos condicionantes, y nuestra condicin ser la siguiente:
An si nosotros decimos y creemos utilizar la esperanza condicional, es decir buscar nuestro
estimador ptimo en la clase inmensamente vasta de todas las funciones medibles, lo que
hacemos en realidad es muy diferente, y el espacio de las funciones que manipulamos
realmente, es siempre ms restringido. La esperanza condicional tal como se puede definir
despus de la tirada en trminos operatorios, es siempre inaccesible in praxis (an si
tuviramos la ilusin de alcanzarla) y siempre le sustituimos (conscientemente o no)
expresiones mucho ms simples, ms o menos groseramente aproximadas.
L h1 ( 1 ) L h 2 ( 2 )
De los dos trasladados por -h1 y por -h2 de las dos lneas de nivel correspondientes. En R2
, esta interseccin est en general constituida por puntos aislados, en nmero infinito, si
nosotros atribuimos a la V. R. un microcomportamiento muy patolgico (anlogo, por
ejemplo a la de la trayectoria de un movimiento browniano), pero, lo ms a menudo, finito (si
hacemos una hiptesis fsicamente plausible sobre este microcomportamiento. En R3, la
misma circunstancia se produce a partir de tres puntos condicionantes, y, de manera general,
en Rn a partir de n puntos.
129
Figura 1.
L h 1 ( 1 ) ... L h p ( p )
Est vaca o reducida a un punto nico (salvo quizs para ciertos puntos excepcionales de los
valores 1, ,p ). Esto quiere decir que hay, en general, a lo ms una sola implantacin del
punto x tal que se tenga z(x + h1) = 1 , , z(x + hp) = p . Dicho de otra manera, las leyes
condicionales estn degeneradas. Para toda funcin f , existe una funcin F(1, ,p) tal que
se tiene (salvo quizs en algunos puntos x excepcionales):
f(x) = F( z(x + h1) , , z(x + hp) )
Porque el conocimiento de los valores numricos i = z(x + hi) , i = 1, , p es suficiente
determinar el punto x (luego tambin el valor f(x) de la funcin f en ese punto).
Naturalmente, esta funcin F tendr una estructura muy complicada, y no tenemos ninguna
esperanza de determinarla in praxis.
En efecto, esta ley condicional (degenerada) ser muy inestable, y nos podemos interrogar
sobre su realidad fsica. El punto x , en efecto, aparece como una funcin x(1, , p) de los
valores condicionantes. Pero esta funcin no est definida en todas partes, porque las
configuraciones z(x + hi) = i no existen necesariamente. Adems, podemos esperar que
variaciones dbiles de uno u otro de los valores condicionantes tengan como repercusin con
variaciones considerables del punto x , el cual podra pasar, por ejemplo, de una extremidad a
la otra del dominio S .
130
Las caractersticas de las leyes condicionales que ponemos as en evidencia estn ligadas de la
manera ms estrecha al microcomportamiento de la V. R. z(x) , y existe inters en pensar que
en la escala extraordinariamente fina a la cual estamos conducidos a trabajar, hemos
sobrepasado hace tiempo el umbral bajo el cual la nocin misma de V. R. cesa de ser
operatoria. En efecto, las propiedades finas de las lneas de nivel (y de las intersecciones de
sus trasladados) no son accesible ni tampoco definibles sobre una base experimental.
Exactamente como en el caso del examen crtico de la continuidad o de la derivabilidad ,
debemos volver al criterio popperiano - y aplicarlo a la misma V. R.
En este marco popperiano, las cosas se simplifican un poco, pero las conclusiones esenciales la extrema inestabilidad de las leyes y esperanzas condicionales, siguen siendo vlidas, como
muestra el anlisis siguiente. Primero, para tener en cuenta el hecho que los valores numricos
de z(x) solo son conocidos (y an definidos) experimentalmente con un nmero pequeo de
cifras significativas, debemos discretizar el parmetro , es decir retener un nmero finito de
clases de valores Ci . Las lneas de nivel L() se reemplazan as por bandas L(Ci) = {x :
z(x) Ci } las cuales presentan un cierto espesor. Anlogamente, debido a que no podemos
alcanzar experimentalmente una infinidad de puntos, debemos igualmente discretizar el
dominio S mismo. Por ejemplo, S ser considerado como la unin de un gran nmero de
cuadrados pequeos o pequeos cubos unidos, y los valores experimentalmente accesibles
representarn, no ya valores puntuales, sino ms bien medias tomadas en estos cuadrados
pequeos o cubos pequeos.
En esta versin discretizada de las cosas, ya no podemos ms afirmar que el punto x est
determinado por el conocimiento de los valores discretizados de los i . Esto depender del
nmero de clases retenidas. Una interseccin del tipo:
131
ALGUNOS ORDENES DE MAGNITUD.
Para extraer rdenes de magnitud, consideremos el ejemplo siguiente, que esquematiza un
caso banal de reconocimiento minero (con dos dimensiones). Los datos disponibles (sondajes)
representan leyes medias en un soporte s = 20 cm2 y estn implantados en una malla de
100m x 100m. La superficie S que nos interesa representa 200 hectreas, es decir S = 109s .
La vecindad mvil V es un cuadrado de 300m x 300m y contiene entonces 9 sondajes. Su
superficie es V = 4.5x107 s . El espacio del yacimiento se discretiza en pequeos cuadrados
de 20 cm2 (y se admite que los sondajes s son identificables a tales cuadrados pequeos). Los
valores de la ley se discretizan en C clases (por ejemplo C = 5, 10 o 20).
Nuestra vecindad mvil contiene 9 sondajes, buscamos calcular las esperanzas condicionales
en Z1, , Z9 . Es decir, 9 variables, cada una de ellas toma C valores, lo cual proporciona
C9 configuraciones posibles:
f1 ( z1 ) + f 2 ( z2 ) + ... + f N ( z N )
Suma de N funciones de una sola variable (N es el nmero de datos disponibles en V , aqu
N = 9 ). Con C clases de valores, el espacio corresponde a la dimensin CN (en lugar de CN
para la esperanza condicional), es decir aqu, con 9 datos y 10 clases, una dimensin de 90, ya
132
elevada, pero netamente ms razonable que un millar. El krigeado disyuntivo representa bien
el intermediario buscado.
133
S ( z0 ) = ( x) dx
S0
134
las solas leyes marginales de orden dos, es decir de las solas leyes de dos variables (Z(x),
Z(xi)) o (Z(xi), Z(xj)) del modelo. Y acabamos de ver que no era poco razonable de buscar la
estimacin in praxis estas leyes de dos variables: Estamos en presencia de un problema bien
planteado. La tabla siguiente muestra la situacin intermedia que es la del krigeado
disyuntivo:
Mtodo
Krigeado
Krigeado disyuntivo
Esperanza condicional
Estimador ptimo
entre las funciones
de la forma:
iZi
f 1(z 1) ++ f n(z n)
f(z 1, , z n)
La matriz de las
covarianzas
La ley de n + 1
variables
Prerrequisitos
135
orden 2 , E[(f(x))2] sea finito), entonces f(x) admite un desarrollo convergente (en media
cuadrtica) de la forma:
(1)
f(Y) = fp Hp(Y)
136
efectivamente, verificada aproximadamente, hemos transgredido ciertamente el umbral de
robustez, y quizs tambin el umbral de objetividad, al deducir de esta hiptesis que todos los
factores son, realmente dos a dos ortogonales. En todo rigor, el modelo isofactorial funciona
ya de manera simplemente heurstica.
De un punto de vista monoscpico, un modelo heurstico puede ser considerado como un
depsito de algoritmos, depsito en el cual vamos a buscar tal o tal elemento que nos parece
que conviene a la solucin del problema que buscamos resolver. Es, por otra parte claro, que
en ausencia de sugestiones de la teora, nosotros no habramos nunca pensado en formar
justamente este algoritmo: Es en este sentido que se trata de un uso heurstico del modelo.
Uso de ninguna manera ilegtimo, salvo con la condicin que nosotros acordemos una
confianza ciega al modelo, y que procedamos, despus de la tirada, y ya, si es posible, in
praxis, a un control experimental lo ms severo posible. Despus de la tirada, tendremos todo
el placer de comparar los valores reales con las estimaciones que se han podido formar por
krigeado disyuntivo, sobre la base de tales y tales puntos experimentales; de confrontar las
varianzas de estimacin previstas por el modelo con sus valores reales, experimentales; pe
poner en competencia, finalmente, los estimadores sugeridos por diferentes modelos
heursticos: krigeado disyuntivo, esperanza condicional, etc In praxis, las posibilidades de
control son ms reducidas. Sin embargo, las leyes de dos variables ya pueden ser examinadas,
y la hiptesis de anamorfosis gaussiana puede ser objeto de tests. Adems, podemos, para
cada punto experimental, hacer como si fuera desconocido, y estimarlo, por krigeado
disyuntivo, a partir de sus vecinos: De donde, de nuevo, la posibilidad de comparar valores
verdaderos y estimados, las varianzas experimentales y tericas etc Mediante estos
controles, nosotros le conferimos a nuestros estimadores una significacin objetiva, que no es
por otra parte la que les pretendan los modelos heursticos que nosotros les habamos
sugerido, y nosotros podemos enseguida proceder a la reconstruccin operatoria de los
conceptos fsicos que ellos ponen, implcitamente, en juego.