Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase Junio 12 Kriging PDF
Clase Junio 12 Kriging PDF
1 PrediccinEspacial
{ }
Sea el campo aleatorio Z (s ) : s D R d donde se ha observado el atributo Z
en las ubicaciones s1 , s 2 , , s n y se desear predecir dicho atributo en una
ubicacin no observada, basndose en los valores obtenidos en las muestras
hechas.Lastcnicasdeprediccinespacialsonmodalidadesdeunafamiliade
mtodosllamadaKriging.ElnombresedebealIngenieromineroD.G.Krige,
quien desarroll en la dcada de los 50, mtodos empricos para predecir
caractersticasdeunaminaenalgunaubicacindeintersdondenoseconocan
datos,usandolascaractersticasconocidasenlugarescercanosdondesihaban
sidotomados.SumtodooriginalesconocidocomoKrigingordinario.
1.1.1 Generalidadessobreelkriging
Elnmerodemuestrastomadas
Lacalidaddelamedicinencadapunto
Las ubicaciones de las muestras en la zona; si las muestras son igualmente
espaciadas se alcanza una mejor cobertura, dando mayor informacin
acerca de la zona que aquella que se obtendra de muestras muy
agrupadas en unos sectores y separadas en otros. Sin embargo, en la
prctica, debido a las caractersticas de las regiones de estudio, muchas
vecesesprecisotomarmuestrasirregularmenteespaciadas.
lasdistanciasentrelasmuestras;paralaprediccinesmasconfiableusar
muestras vecinas que muestras distantes, esto es, la precisin mejora
cuandolacercanadelasmuestrasaumenta,ysedeterioracuandoesta
disminuye.Laextrapolacinnoesaconsejable.
La continuidad espacial de la variable o atributo en estudio; es ms fcil
estimarelvalordeunavariablebastanteregularenunareginqueuna
quepresentagrandesfluctuaciones.
1.1.2 Introduccinalateoradelkriging
Ejemplo
Supongamos que se tienen las mediciones Z(s1), Z(s2), Z(s3) y Z(s4), en los
puntos s1, s2, s3 y s4 respectivamente, y se requiere predecir el valor Z(s0). El
valorapredecirseubicamascercades2quedecualquierotraubicacindonde
se tenga medicin; por lo tanto, es lgico pensar que Z(s0) es mas parecido a
Z(s2) que a cualquiera de los otros tres valores medidos. De acuerdo a lo
anterior, se puede optar para la prediccin, por una media ponderada de las
cuatromediciones,enlacualZ(s2)tienemayorpesoquecualquierotra,seguida
ensuordenporZ(s4),Z(s3)yporltimoZ(s1).
*s1 *s2
+s0
*s3 *s4
Donde los i , i = 1,2,3, 4 son los factores de ponderacin o pesos tales que
4
2 > 4 > 3 > 1 y i = 1 .
i =1
Losparmetros i sonlosfactoresdeponderacinocoeficientesdeponderacin
ysoncalculadosdeacuerdoalossiguientescriterios:
Z ( s0 ) seainsesgado
Var ( Z ( s ) Z ( s )) seamnima
0 0
Noteque
Var ( Z ( s 0 ) Z ( s0 )) = E ( Z ( s 0 ) Z ( s0 )) 2 E 2 ( Z ( s 0 ) Z ( s0 ))
2
= E ( Z ( s 0 ) Z ( s0 )) 2 E ( Z ( s 0 ) Z ( s0 )) = E ( Z ( s 0 ) Z ( s0 )) 2
Ahora
n n n
E ( Z ( s 0 ) Z ( s0 )) 2 = E i Z ( si ) j Z ( s j ) 2 i Z ( si )Z ( s0 ) + Z 2 ( s0 )
i =1 j =1 i =1
n n n
= i j E Z ( si ) Z ( s j ) 2 i E [ Z ( si ) Z ( s0 ) ] + E Z 2 ( s0 )
i =1 j =1 i =1
Sihaestimadoelsemivariogramaobienseconocelafuncindecovarianza,
tambinsetendrnlosvalores
E Z ( si ) Z ( s j ) , E [ Z ( si ) Z ( s0 ) ] y E Z 2 ( s0 )
Porlotanto,seencontrarnlos i minimizandoestavarianza.Delrespectivo
proceso de minimizacin se obtendr un sistema de ecuaciones, que cambiar
de acuerdo a las hiptesis que se tengan sobre la media y la covarianza del
proceso, y la distribucin de la variable en estudio. En la prxima seccin se
mencionarnalgunosdeestoscasos.
1.1.3 Clculodelosfactoresdeponderacinparaalgunoscasos
KrigingSimple
Definamoslavariable
Y (s) = Z (s)
donde eslamediadelavariableenlaregindeestudioyporlotanto
E Y ( s ) = 0 .
Entoncessiahoraencontramoslaprediccinde Y ( s0 ) ,tendremos
n
Y ( s0 ) = iY ( si ) .
i =1
errorcuadrticomediodeprediccin;estoes,hayqueminimizar
E Y ( s ) Y ( s ) ( )
2
0 0
Quesegnvimosenlaseccinanterior,sepuedeescribircomo
n n n
E (Y ( s 0 ) Y ( s0 )) 2 = i j E Y ( si ) Z ( s j ) 2 i E [Y ( si ) Y ( s0 ) ] + E Y 2 ( s0 )
i =1 j =1 i =1
n n n
= i j Cov si s j 2 iCov [ si s0 ] + Cov(0)
i =1 j =1 i =1
n
E Y ( s0 ) Y ( s0 ) = 2 j Cov si s j 2Cov ( si s0 ) = 0
2
i = 1 n
i j =1
conlocualquedadefinidounsistemadenecuacionesconnincgnitas.Paraj
( j = 1 n ) arbitrarialaecuacines:
n
2 j Cov si s j 2Cov ( si s0 ) = 0
j =1
n
Cov s
j =1
j i s j = Cov ( si s0 )
Queesunsistemaconnicasolucinenvirtuddelamatrizdecoeficientesla
cualesdefinidapositiva.
AsparapredecirlavariableoriginalZ
n
Z ( s0 ) = + i ( Z i )
i =1
ylavarianzadelerrordeprediccinqueda
( )
n
Var Z ( s0 ) Z ( s0 ) = Var ( Z ( si ) ) i Cov ( si s0 )
i =1
Dedondepodemosconcluirquelavarianzadelerrordeprediccinesmenora
lavarianzadelavariableenestudio,locualesconsecuenciadelconocimiento
delosparmetrosdelproceso.
KrigingOrdinario
Alnoconocerlamediaesnecesariogarantizarlapropiedaddeinsesgamiento:
[ ] n
E Z * (s0 ) Z (s0 ) = E i Z (si ) Z (s0 ) =
i =1
n n
E[Z (s )] E[Z (s )] = = 0
i =1
i i 0
i =1
i
n n
i 1 = 0 i 1 = 0
i =1 i =1
n
Cuando
i =1
i =1
( )
E Z = Z
Deestaforma,
n
E i Z ( si ) = E ( Z ) =
i =1
locualesequivalentea
n n
i E [ Z (si )] = i =
i =1 i =1
Portanto,esindispensablequesecumplalacondicindeque
i =1
i = 1
paraobtenerunestimadorinsesgado.Semantieneiguallasegundacondicin
que es la de mnima varianza; partamos de la expresin ya deducida de la
varianza
n n n
E ( Z ( s 0 ) Z ( s0 )) 2 = i j E Z ( si ) Z ( s j ) 2 i E [ Z ( si ) Z ( s0 ) ] + E Z 2 ( s0 )
i =1 j =1 i =1
Dondebajolasnuevascondicionessetiene:
E Z ( si ) Z ( s j ) = Cov ( si s j ) + 2
E Z 2 ( s0 ) = Cov(0) + 2 = 2 + 2
Sustituyendoenlavarianzaqueda
n n
E ( Z ( s 0 ) Z ( s0 )) 2 = i j Cov ( si s j ) 2 iCov ( si s j ) + C ( 0 ) + 2 i j 2 i + 1
n n n n
i =1 j =1 i =1 i =1 j =1 i =1
pero
n n n
2
n
i j 2 i + 1 = i 1 = 0
i =1 j =1 i =1 i =1
porlapropiedaddeinsesgamiento.
Asquelaexpresinaminimizares
Cov ( s s ) 2 Cov ( s s ) + C ( 0 )
n n n
i j i j i i j
i =1 j =1 i =1
bajolarestriccin
( )
E Z = Z
SeutilizaparaestoscasoselmtododelosmultiplicadoresdeLagrange:
( i , ) n
= iCov ( si s j ) Cov ( si s j )
i i =1
( i , ) n
= iCov ( si s j ) Cov ( si s j )
i i =1
Cov ( s s ) Cov ( s s ) = 0
n
i i j i j
i =1
Cov ( s s j ) = Cov ( si s j )
n
i i
i =1
( i , ) n
= i 1
i =1
n
1 = 0
i =1
i
n
i =1
i = 1
Dandocomoresultadoelsistemade n + 1 ecuacionesdelkrigingordinario:
Cov ( s s j ) = Cov ( si s j )
n
i i
i =1
i =1
i = 1
Porltimo,lavarianzadelerrordeprediccinparaestecasoes
( )
n
Var Z ( s0 ) Z ( s0 ) = Var ( Z ( si ) ) iCov ( si s0 ) +
i =1
que tal como es de esperarse es mayor que la del kriging simple, debido al
desconocimientodelamediadelavariableenestudio.
KrigingOrdinarioparavariablesintrnsecas
E Z ( s + h ) Z ( s ) = 0
1
( h ) = Var Z ( s + h ) Z ( s )
2
Nuevamente,hayqueimponerlassiguientesrestricciones
Estimacinlineal
n
Z ( s0 ) = i Z ( si )
i =1
Insesgamiento
( )
E Z = Z
Mnimavarianza
Var Z ( s0 ) Z ( s0 ) = E Z ( s0 ) Z ( s0 ) esmnima
2
( )
n
Var Z ( s0 ) Z ( s0 ) = i ( si s0 ) +
i =1
1. Anlisisdenormalidad
1.1 ANLISISGRFICO
GRFICOSGENERALES
Caractersticasdeladistribucindeprobabilidadnormaltalescomosimetray
apuntamiento, pueden ser ilustradas por los grficos clsicos de la estadstica
descriptiva,comoelhistograma,eldiagramadecajaybigotes,yeldiagramade
tallo y hojas; a continuacin estos grficos para una muestra de una variable
aleatoriacondistribucindeprobabilidadnormal:
85
80
75
70
65
60
55
Histogram of x
150
100
Frequency
50
0
50 55 60 65 70 75 80 85
x
Grfico1.Diagramadecajaehistogramadeunamuestraaleatoriaprovenientedeuna
distribucindeprobabilidadnormal
1
El procedimiento de verificar que a 1, 2 y 3 desviaciones estndar de la media se encuentra
respectivamente, el 68.26%, el 95.44% y el 99.74% de las observaciones se conoce como regla emprica.
Grfico2.DiagramadeTalloyhojasdeunamuestraaleatoriaprovenientedeuna
distribucindeprobabilidadnormal
Enestediagramadetalloyhojasseobservaclaramentelafiguraacampanada
deformahorizontal.
GRFICOQXQ
Elgrficocuantilcuantil,consisteenlacomparacindeloscuantilesmuestrales
conlospoblacionales,detalformaqueentremassimilaresseanestasdosseries
de datos, mejor ser el ajuste y por lo tanto, se espera que el diagrama de
dispersinentreellosseaproximebastanteaunalnearecta.Lospasosparala
construccindeestegrficosonlossiguientes:
Grfico3.CuantilCuantilenelcasoenelqueladistribucinnormalajustaadecuadamente
losdatosdelamuestra.
Enestecaso,lasobservacionesseaproximanbastantealarectayporlotanto,
sepuedepensarenqueelsupuestodenormalidadesvlido.Todoelsoftware
estadsticolotieneimplementado.
120000
100000
80000
salario
60000
40000
20000
-3 -2 -1 0 1 2 3
norm quantiles
Grfico4.CuantilCuantilenelcasoenelqueladistribucinnormalnorepresentaunbuen
ajusteparalosdatosdelamuestra.
Sibien,elanlisisgrfico,esmuyimportanteeilustrativo,continasiendouna
herramienta de estadstica descriptiva y por tanto no es concluyente. Incluso
cuando se tiene prcticamente la certeza sobre el comportamiento
aproximadamentenormaldelosdatos,esnecesarialaaplicacindeinferencia
estadstica, ya que la conclusin es acerca de la distribucin de la variable de
dondeprovienelamuestra.
Acontinuacin,serelacionanvariaspruebasdenormalidad.
1.2 PRUEBASDEHIPTESIS
PRUEBADESHAPIROYWILK
Estapruebasecentraendeterminarlabondaddelajustedeunarectaalgrfico
QQ.Esexclusivaparaprobarnormalidad.
Donde
eslavarianzamuestral,
sonloscoeficientestabuladosparaestapruebay
eseljsimoelementodelamuestraordenada
PRUEBASBASADASENASIMETRAYCURTOSIS
9 ASIMETRA
Si n > 50 ,elcoeficientedeasimetra,tieneunadistribucindeprobabilidad
asintticamentenormalconparmetros
6
E ( As ) = 0 y Var ( As ) =
n
As
Porlotanto, Z = ~ N(0,1)
6
n
As n
Z= ~ N(0,1)
6
9 CURTOSIS
24
E (k ) = 3 y Var(k ) =
n
k 3
Porlotanto, Z = ~ N(0,1)
24
n
Z=
(k 3) n
~ N(0,1)
24
9 PRUEBADEJARQUEYBERA(JB)
PRUEBADEBONDADDEAJUSTECHICUADRADODEPEARSON
Algoritmo
1. Construirunatabladefrecuencias,lacualenloposiblenotengamenos
de5intervalosyadems,nohayamenosde5datosencadaintervalo.
2. Encontrar las frecuencias esperadas segn , esto es, encontrar
,donde eslaprobabilidaddelintervaloi
3. Calcular el estadstico de prueba y comparar con el cuantil terico
correspondiente
PRUEBADEKOLMOGOROVSMIRNOV
Estapruebacalculaladistanciaentrelafuncindedistribucinmuestral
ylafuncindedistribucintericasupuestaenla ,
Algoritmo
1. Encontrarladistribucindefrecuenciasmuestral
Conbaseenlamuestraordenada
2. Encontrarlacorrespondientedistribucinterica
3. Calcularelestadsticodeprueba
Sudistribucinexactaseencuentratantoenlosprogramasestadsticos
comoenvarioslibrosdeestadsticanoparamtrica.
Nota1
Cuandolosparmetrosdelafuncinsonestimadosdelamuestra,esnecesario
aplicarlacorreccindeLillieforsaladistribucindel .
LaformageneraldelafamiliadetransformacionesBoxCoxeslasiguiente:
y 1
( ) para 0
y =
logy para = 0
Enelcasoenelcualnosecumpla yi > 0 ; i , i = 1,, n sepuederealizaruna
traslacindelavariabley;enestecasoquedara
( y + m ) 1
para 0
( y + m)
( )
=
log( y + m ) para = 0
Elvalorde quelogralamejortransformacindelavariabledeinters,esel
quemaximizalacantidad
eslaestimacinmximoverosmildelavarianzadelavariable .