Está en la página 1de 30

03 - El Modelo Probabilstico

en Geoestadstica
Interpretacin probabilstica
Variables aleatorias
Funciones de distribucin y de densidad de probabilidad
Momentos
Ejemplos de distribuciones
Distribuciones bivariables y multivariables
Nocin de funcin aleatoria

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Interpretacin
Los fenmenos en Ciencias de la Tierra involucran procesos
complejos, luego, parecen aleatorios. Sin embargo, los datos
verdaderos no son resultado de un proceso aleatorio: se trata
solamente de una interpretacin por nuestro desconocimiento
de la realidad.

El valor de la variable regionalizada en un punto z(u) se


interpreta como la realizacin (outcome) de una variable
aleatoria Z(u).

Algunos problemas:
Cmo hacer inferencia acerca de la variable aleatoria si slo
disponemos de una realizacin?
Inferencia y Modelamiento

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Variable aleatoria
Variable aleatoria: Una funcin Z desde un espacio muestreal S en
los nmeros reales. Una forma de representar un valor z no
muestreado (desconocido). Se denota con letra mayscula

La variable aleatoria Z puede tomar cualquier valor dado por su


distribucin de probabilidad. sta modela la incertidumbre respecto a
su realizacin z. La variable puede ser continua o discreta:
Variable continua: puede tomar valores en forma continua entre dos
valores dados: ley, densidad, concentracin, precio,...

Variable discreta o categrica: pertenece a una clase.


Ejemplo: cdigos de litologa

Cmo caracterizar una variable aleatoria?

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Funcin de distribucin
acumulada
Funcin de Distribucin Acumulada (fda) de una variable
aleatoria Z:
F ( z ) Prob{Z z} [0,1]

Est definida para todos los valores de z

Probabilidad acumulada
Puede ser una funcin discontinua

lim FZ ( z ) 0 y lim FZ ( z ) 1
z z

FZ (z ) es una funcin no-decreciente


Esta frmula entrega el rea bajo la funcin de densidad de probabilidad de
la variable aleatoria Z, y equivale a la probabilidad de que la variable
aleatoria Z sea menor o igual a un valor de corte z.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Funcin de distribucin
acumulada
La probabilidad de superar cualquier valor de corte z se escribe:

Prob{Z z} 1 F ( z )

La probabilidad de que Z pertenezca a un intervalo [a,b] (donde


b>a) es la diferencia entre los valores de la funcin de distribucin
acumulada evaluada en los puntos b y a:

Prob{Z [a, b]} F (b) F (a)

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Funcin de distribucin
acumulada
Teorema: (importante para entender porqu la simulacin de
Monte-Carlo funciona):

Sea Z una variable aleatoria con funcin de distribucin


acumulada continua FZ (z ) y definamos la variable aleatoria Y
como Y FZ (Z ) . Entonces Y est distribuida uniformemente
entre 0 y 1, es decir,

ProbY y y, 0 y 1

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Funcin de densidad de
probabilidad
La funcin de densidad de probabilidad (fdp) es la
derivada de la fda, si es derivable:

F ( z dz ) F ( z )
f ( z ) F ' ( z ) lim
dz 0 dz

La fda se obtiene integrando la fdp:


z
F ( z) f ( z )dz

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Funcin de densidad de
probabilidad
Propiedades de la funcin de densidad de probabilidad:

f(z) 0

f ( z )dz 1

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Grfico de probabilidad
acumulativo
Permite ver todos los datos en un
grfico, reconocer y separar
poblaciones estadsticas
Permite tambin detectar valores
extremos
Puede usarse para verificar
modelos de distribucin:
Lnea recta en escala aritmtica
distribucin normal
Lnea recta en escala logartmica
distribucin lognormal
Pequeas divergencias pueden
ser importantes (especialmente
en los extremos)

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Valores extremos
Afectan considerablemente las estadsticas bsicas
Qu hacer con ellos?:
Declarar los valores extremos como errneos y eliminarlos
Clasificarlos en poblaciones estadsticas separadas
Usar estadsticas robustas, que son menos sensibles a los valores extremos:
mediana, coeficiente de correlacin de posicin
Transformar los datos para reducir su influencia
Bajarlos a un mximo razonable
Outliers: Observaciones que parecen no pertenecer a la misma
poblacin constituida por el resto de los datos. Generan considerables
problemas al aplicar regresin, debido a que tienen un efecto
desproporcionado sobre los valores estimados
Se puede eliminar los datos considerados extremos (outliers)
slo si se ha comprobado que estn errados. En caso de ser
datos verdaderos, proveen informacin que puede ser crtica para la
respuesta del modelo.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Suavizamiento de distribuciones
experimentales
Pocos datos: estadsticas y grficos errticos
Suavizamiento de la distribucin experimental permite reducir las
fluctuaciones, aumentar la resolucin de clases y extender la
distribucin mas all de los valores mnimo y mximo de la muestra
Tcnicas de suavizamiento ms flexibles (programacin cuadrtica) se
han aplicado para suavizar histogramas y grficos de dispersin:
mantienen las estadsticas de la muestra.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Momentos
Esperanza: (primer momento) es un promedio ponderado por las
probabilidades, si existe. Da una idea del centro de la distribucin

Caso discreto
donde:
n E{Z} = valor esperado o media de Z
E{Z } m wi zi wi = probabilidad de ocurrencia
i1 del i-simo valor
n = nmero de datos

Caso continuo

E{Z } m zdF ( z ) zf ( z )dz

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Momentos
Propiedades de la esperanza:
Ea a
EbZ b EZ
Ea bZ a b EZ

Eg ( Z ) g ( z) f ( z) dz

La varianza (segundo momento centrado). Nos da una idea de


la dispersin de la distribucin de la variable aleatoria Z. Se
define como la esperanza de la desviacin de Z respecto de su
media al cuadrado:
Var{Z } 2 E{[ Z m]2 } E{Z 2 } m2 0

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Momentos
Caso discreto

n
Var{Z } wi ( zi m) 2
2

i1

Caso continuo


Var{Z } ( z m) dF ( z ) ( z m) 2 f ( z )dz
2 2

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Momentos
La varianza es una medida de la dispersin de los datos en
torno a la media.
Propiedades de la varianza
Vara 0
VaraZ a 2 VarZ
Varb Z VarZ

La desviacin estndar, 2 , que es la raz cuadrada de


la varianza, tambin es una medida de la variabilidad de los
datos respecto a la media. Se escribe en las mismas unidades
de la variable.
El coeficiente de variacin (CV), que es adimensional, es la
razn entre la desviacin estndar y la media (/m).

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin Uniforme
1
fdp z [a,b]
f ( z) b a
0, en otro caso

0, z a
z
z a
fda F ( z ) f ( z )dz z [a,b]
b a
1, z b

Momentos ab
E{Z } m mediana
2
b
1 1 2
E{Z } (a ab b 2 )
2 2
z dz
ba a 3

(b a) 2
Var{Z } E{Z } m
2 2 2

12

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin Dirac
z = a (constante, sin incertidumbre)
fda 1, si z a
F ( z)
0, si no
fdp
0, z a
f ( z)
indefinida en z a

Momentos:
E{Z} = m = a
2 = 0

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin Normal
(Gaussiana)
La distribucin Gaussiana queda completamente caracterizada por dos
parmetros, la media m y la varianza 2:

1 1 z m 2 1 z2
g ( z) exp g o ( z) exp
2
2 2 2
La fdp normal estndar tiene una media de cero y una desviacin
estndar de uno:

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin Normal
(Gaussiana)
La fda de la distribucin gaussiana G(z) no tiene una expresin
analtica simplificada, pero la fda normal estndar Go(z) est
tabulada en la literatura:

zm
z
Go ( z ) g o ( z )dz G ( z ) g ( z )dz Go

Z
Si Z ~ N (,2 ) y definimos: Y , entonces: Y ~ N (0,1)

g(z)
0.40

La distribucin gaussiana es simtrica: 0.35

La media y mediana son iguales


0.30
0.25

La fdp g(m+z) = g(m-z) 0.20 95 %


0.15

0.10

0.05 2.5% 2.5%


0.00
0 2 4 6 8 10 12 14 16
z

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin Lognormal
Si Z es una variable aleatoria cuyo logaritmo est distribuido
como una normal, entonces Z tiene distribucin lognormal.

Z ~ log N (m,2 ), si Y ln Z ~ N (,2 )


g(z) G(z)
0.35 1.0

0.9
0.30
0.8
0.25 0.7

0.6
0.20
0.5
0.15
0.4

0.10 0.3

0.2
0.05
0.1

0.00 0.0
0 2 4 6 8 10 0 2 4 6 8 10 z
z

Muy interesante en Ciencias de la Tierra


Distribucin sesgada hacia la derecha (cola larga de valores altos):
asimtricas

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin Lognormal
Las distribuciones lognormales tambin se caracterizan por dos
parmetros: media y varianza. Sin embargo, pueden caracterizarse ya
sea por los parmetros aritmticos (m y 2) o por los parmetros
logartmicos ( y 2).
La fda y fdp lognormal se expresan mas fcilmente en funcin de sus
parmetros logartmicos:
ln z
FZ ( z ) Prob{Z z )} Go para todo z 0

dFZ ( z ) 1 ln z
f Z ( z) g o
dz z
Las relaciones entre los parmetros aritmticos y logartmicos son:

m e 2 m 2 [e 1]
2 2
/2

2
ln m / 2 2
ln 1 2
2

m
MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE
Combinacin de distribuciones
De la combinacin de distribuciones resulta una nueva distribucin.
F(z) =kkF'k(z) es un modelo de distribucin si las F'k(z) son funciones de
distribucin y si los k son positivos y suman 1.

Codificacin disyuntiva de un histograma experimental de datos z1, z2 zn:

n
1
F ( z ) zi ( z )
n i1

Una suma de n
distribuciones Dirac
de parmetros zi e
igual amplitud 1/n

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Teorema del Lmite Central
La suma o la media de un gran nmero de variables aleatorias
estandarizadas independientes igualmente distribuidas (no
necesariamente Gaussianas) tiende a distribuirse en forma
normal. Es decir, si n variables aleatorias Zi tienen la misma fda
y medias m, su media tiende hacia una fda normal, cuando n
tiende a infinito.
E{m } E{Z} m
1 n
m Z i Normal 1 2
n i1 Var{m } Var{Z }
n n

Corolario: el producto de un gran nmero de variables aleatorias


positivas, independientes e idnticamente distribuidas tiende a
distribuirse en forma lognormal

E{ } E{ log Z}
1 n
log Z i Normal 1 2
n i1 Var{ } Var{log Z }
n n
MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE
Distribucin bivariable
Funcin de densidad de probabilidad conjunta: f ( z1, z2 ) de
R2 en R es la funcin de densidad de probabilidad conjunta del
vector aleatorio bivariable (Z1,Z2) si para cada A R 2 :

Prob(( Z1 , Z 2 ) A) f ( z1 , z2 )dz1 dz2


A

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin bivariable
Funciones de distribucin acumulada y densidad conjunta:
z1 z 2
2 FZ1Z 2 ( z1 , z 2 )
FZ1Z 2 ( z1 , z 2 ) Prob{Z1 z1 , Z 2 z 2 } f

Z1Z 2 ( s,t ) ds dt f Z1Z 2 ( z1 , z 2 )
z1 z 2

Distribuciones marginales (univariables):



f Z1 ( z1 ) f

Z1Z 2 ( z1 ,t ) dt f Z 2 ( z2 ) f Z1Z 2 ( s, z 2 ) ds

Distribuciones condicionales (Ley de Bayes):


f Z1Z 2 ( z1 , z 2 ) f Z1Z 2 ( z1 , z 2 )
f Z 2 ( z 2 | z1 ) f Z1 ( z1 | z 2 )
f Z1 ( z1 ) f Z 2 ( z2 )

E{g ( Z 2 ) | Z1} g ( z) f

Z2 ( z | z1 ) dz

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin bivariable
5a. Fila Ejemplo de distribuciones en filas horizontales
La media corresponde a la de la lnea MN de regresin
Z1/Z22 = Z12(1-r2) = 2,835

6 7 7
4 4
1 1 1
Variable z1

1 2 3 4 5 6 7 8 9 10 11 12
9 N 9

8a. Columna

4a. Columna
8 8
1 1 1 1
4

1
7 L 7
15

1 2 3 3 3 1 1 1

3
6 6
31 31

1 1 4 7 7 6 4 1 Lnea de

1
Variable z 2

Variable z 2
regresin
5 5
1 4 6 7 7 4 1 de z 2 en z 1

4
4 4
15

K1 1 1 3 3 3 2 1

3
1
Distribucin Marginal (Global) de

3 3

de la lnea KL de regresin
La media corresponde a la
Ejemplos de distribuciones
1 1 1 1
4

1
Z2/Z1 = Z2 (1-r ) = 1,00
en columnas verticales
2 2

Lnea de regresin

2
1 1
M de z 1 en z 2

2
0 1 2 3 4 5 6 7 8 9 10 11 12 0
Z2 = 1,334
Z2 = 1,155

Variable z1
Media = 5

2
1 1 1 1
4 4
2

9 9
z2

15 15
20 20
Distribucin Marginal (Global) de z1 Coeficiente de
Media = 6 Correlacin
Z12 = 3,78 r = 0,5
Z1 = 1,945

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin bivariable
El momento de segundo orden de una distribucin bivariable es
la covarianza, definida como:
Cov{Z1 , Z 2 } E{[ Z1 m1 ][ Z 2 m2 ]} E{Z1Z 2 } m1m2

( z m )( z
1 1 2 m2 ) f Z1Z 2 ( z1 , z2 )dz1dz2

La covarianza entre la variable y ella misma es su varianza:

Cov{Z1,Z2} = Var{Z1}; Cov{Z2,Z2} = Var{Z2}

El coeficiente de correlacin entre dos variables se define


como la covarianza estandarizada por las desviaciones estndar:

Cov{Z1 , Z 2 }
Z1 Z 2 [1,1]
Var{Z1}Var{Z 2 }

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Distribucin multivariable
Funcin de distribucin acumulada:

F ( z1 , z2 ,...zn ) Prob{Z1 z1 , Z 2 z2 ,...Z n zn }

Caracteriza cmo se distribuyen conjuntamente las distintas


variables aleatorias

Se utiliza para describir la distribucin de los valores de la


variable regionalizada en el espacio, al considerar el conjunto de
las variables aleatorias en el dominio de inters: Z (u),uD

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Nocin de funcin aleatoria
Funcin Aleatoria: el conjunto de las variables
aleatorias en un dominio: Z (u),uD

La variable regionalizada es una realizacin


de una funcin aleatoria

Es importante caracterizar cmo se correlacionan


estas variables aleatorias, de modo de modelar la
continuidad espacial de los valores de la variable
regionalizada

anlisis variogrfico

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE


Nocin de funcin aleatoria
Ejemplo: mismos conjuntos de valores, pero distribuidos de forma
diferente en el espacio. Las variables aleatorias se modelarn con altas
correlaciones en el primer caso, y con bajas correlaciones en el segundo
caso.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

También podría gustarte