Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modelos Espaciales
Modelos Espaciales
Autor
Carlos Alfonso Mantilla Duarte (alumno)
Director
José Miguel Angulo Ibáñez (tutor)
Autor
Carlos Alfonso Mantilla Duarte (alumno)
Directores
José Miguel Angulo Ibáñez (tutor)
Modelamiento de Datos Espaciales y Datos Espacio-Temporales: Análisis
Espacial y Espacio-Temporal del Desplazamiento Forzado
Carlos Alfonso Mantilla Duarte (alumno)
Resumen
Estimaciones recientes sugieren que cerca de 4.9 millones de colombianos han sido desplazados in-
ternamente como resultado del prolongado conflicto armado y la violencia política asociada que en-
vuelve al Estado y los grupos armados al margen de la ley.
Gran parte de ese desplazamiento forzado en los últimos años es el resultado directo o indirecto de
las ofensivas militares de contraguerrilla por parte de los organismos del Estado y de la disputa por el
control de las zonas rurales, que históricamente han tenido presencia guerrillera, entre paramilitares
y guerrilla.
La primera parte hace una revisión teórica de los elementos que permiten entender porqué se va a mo-
delar el fenómeno de desplazamiento forzado como un proceso espacial y, posteriormente, espacio-
temporal. Se comienza con una descripción de lo que son los Sistemas de Información Geográfica
que, para el estudio de caso, permiten definir los entes territoriales que son objeto de análisis.
Posteriormente, se realiza la definición de datos espaciales, sus características, tipos y formas de re-
gistro y visualización y las distintas funciones que describen un proceso espacial y se termina este
apartado con una descripción de algunos modelos de interdependencia espacial. En la siguiente sec-
ción se hace una descripción similar para el caso de los datos espacio-temporales.
En el capítulo final se presentan las conclusiones: los modelos SAR, SEM Y SDM son efectivos al
momento de explicar el fenómeno de desplazamiento forzado. Los modelos espacio-temporales no
son efectivos en el caso de estudio. Finalmente, se presenta la bibliografía relacionada. Se presenta
como anexo el código empleado en R.
Índice general
1. Marco Teórico 6
1.1. Sistemas de Información Geográfica (SIG) . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1. ¿Qué son los SIG? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2. Características de los SIG . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2. Datos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1. Evaluación del Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2. Estimación Óptima (Kriging) . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3. Estimación Empírica del Variograma y la Función de Covarianza . . . . . . 18
1.2.4. Modelización del Semivariograma . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.5. Modelos de Interdependencia Espacial . . . . . . . . . . . . . . . . . . . . . 21
1.3. Datos Espacio - Temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.1. Características de los Datos Espacio-Temporales . . . . . . . . . . . . . . . 27
1.3.2. Procesos Espacio-Temporales . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.3.3. Estacionariedad y Estimadores Espacio-Temporales . . . . . . . . . . . . . . 32
1.3.4. Propiedades de la Función de Covarianza Espacio - Temporal . . . . . . . . 33
1.3.5. Modelos Espacio - Temporales . . . . . . . . . . . . . . . . . . . . . . . . . 33
2
2.3.3. Modelo SDM: Spatial Durbin Model . . . . . . . . . . . . . . . . . . . . . 54
2.4. Modelo Espacio-Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.4.1. Modelo de Interdepencia Espacio-Temporal . . . . . . . . . . . . . . . . . . 58
2.4.2. Modelo VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3. Conclusiones 65
3
Índice de figuras
1.1. Ejemplo de Capas o Coberturas (layers) con información sobre la calidad del aire en
Madrid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2. Ejemplo de Capas Tipo Raster tomado de Hijmans (2016a) . . . . . . . . . . . . . . 8
1.3. Descripción de Estacionariedad: dos vectores con idénticos rezagos (Sherman, 2011) 18
1.4. Representación Gráfica de los Modelos para Semivariograma . . . . . . . . . . . . . 22
1.5. Representación Gráfica de los Modelos para Covarianza . . . . . . . . . . . . . . . 22
1.6. Ejemplificación de los casos de objetos espacio-temporales identificados por Pebesma
(2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4
2.12. Mapa Residuos Modelo SDM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.13. Locaciones Espacio-Temporales de las observaciones divididas en Zonas, gráfica de
comprobación de cuantiles y dependencia de las observaciones con el Área del Mu-
nicipio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.14. Validación Cruzada de los resultados para las posibles funciones base . . . . . . . . 60
2.15. Estimaciones de regresión de β1 (s) y β2 (s) en cada ubicación, con intervalos de con-
fianza del 95 %, en función del Área del municipio . . . . . . . . . . . . . . . . . . 61
5
Capítulo 1
Marco Teórico
Por su parte, Huisman & A. de By (2009) definen un SIG como “...un sistema de base computacional
que provee el siguiente conjunto de capacidades para manipular datos georreferenciados”:
4. Presentación de datos
Lo anterior implica que los usuarios de un SIG pueden introducir datos (georreferenciados) al sistema,
analizarlos por varios métodos y generar una presentación de los mismos mediante mapas y sistemas
de coordenadas geográficas.
6
(a) Capa de Información NO2 (b) Capa Información NO2 + Capa Mapa
Figura 1.1: Ejemplo de Capas o Coberturas (layers) con información sobre la calidad del aire en
Madrid
Los SIG se caracterizan por contar con una amplia gama de plataformas, aplicaciones, arquitecturas,
aplicaciones, procedimientos, etc., que permiten la gestión de datos espaciales.
La información en los GIS se estructura en capas o coberturas (layers) y cada capa ofrece un tipo de
información. Por ejemplo, las Figuras 1.1a y 1.1b muestran ejemplos de capas tomados de Perpiñán
(2014) con información sobre la calidad del aire para Madrid. Una capa en el prime caso; dos capas en
el segundo. La construcción de estas capas se hace a partir de un sistema de coordenadas geográficas
(georreferenciación).
La presentación de los objetos geográficos se hace mediante dos formatos básicos: vector y raster.
El vector se representa a partir de tres elementos: puntos, líneas y polígonos. El primero se localiza
mediante un par de coordenadas (x e y), la línea mediante dos pares de coordenadas y el polígono
mediante varios pares de coordenadas. La Figura 1.1a es un ejemplo de vector representado mediante
puntos.
Un “raster” es una estructura de datos espaciales que divide una región en rectángulos llamados celdas
o pixeles que puede almacenar uno o más valores para cada una de esas celdas (Hijmans, 2016a). Las
7
(a) ’Raster’ con 100 Celdas (b) ’Raster’ Generado desde Archivo
Figuras 1.2a y 1.2b muestran dos formas de visualización de objetos tipo raster: (a) es el “esqueleto”
del raster definiendo “a mano” el número de filas, el número de columnas y la resolución; (b) un
obtejo tipo raster creado a partir de otro objeto.
Entre otros, los usos más destacados de los SIG son: arqueología, medio ambiente, prevención de
desastres, cartografía y planimetría, exploración de recursos energéticos, demografía, marketing so-
cial, transporte, epidemiología, etc.; asociándose al manejo de datos espaciales.
Los datos espaciales (también conocidos como datos geoespaciales) están directa o indirectamente
referenciados con una localización sobre la superficie de la tierra (Perpiñán, 2014). Su referencia es-
pacial se compone de valores de coordenadas y un sistema de referencia para esas coordenadas. El
análisis de estos datos se hace a partir de la geoestadística la cuál cuenta con múltiples herramientas
para su modelamiento.
Con base en lo anterior, un proceso de interés para el análisis geoestadístico presenta una número
determinado de observaciones (n) y ese número de observaciones son denotados por Z(ss1 ), . . . Z(ssn ),
aunque algunas veces se denota como Z1 , . . . , Z2 (Sherman, 2011). Básicamente, el modelamiento
8
busca:
Para describir la relación entre los puntos, es necesario introducir los siguientes modelo de correla-
ción (Sherman, 2011):
1. E[Z(ss)] − µ = 0
1. E[Z(ss)] − µ = 0
El término 2γ(hh) es conocido como función de variograma y γ(hh) semivariograma. Según Sherman
(2011), las razones por las cuales se prefiere el supuesto de IS sobre el de SOS son:
2. Los variogramas adaptan de una manera más fácil las observaciones no estacionarias.
9
1.2.1. Evaluación del Error
El modelo inicial para una estimación óptima parte de una estructura simple que incluye la media
subyacente; según Sherman (2011) este modelo básico es:
La solución es:
n o2
2
b s0 ) − Z(ss0 )] } = E b s0 ) − E[Z(ss0 )|Z
E{[Z(s Z(s Z n ] − Z(ss0 )
Z n ] + E[Z(ss0 )|Z
n o2
= E Z(ss0 ) − E[Z(ss0 )|Z
b Z n] + E {E[Z(ss0 )|Z Z n − Z(ss0 )]}2
n o
+ 2E Z(s Z n ] {E[Z(ss0 )|Z
b s0 ) − E[Z(ss0 )|Z Z n − Z(ss0 )]} (1.4)
n o
Como 2E Z(s Z n ] {E[Z(ss0 )|Z
b s0 ) − E[Z(ss0 )|Z Z n − Z(ss0 )]} = 0, entonces:
n o2
b s0 )] = E
MSE[Z(s Z(ss0 ) − E[Z(ss0 )|Z
b Z n] Z n − Z(ss0 )]}2
+ E {E[Z(ss0 )|Z (1.5)
b s0 ) = E [Z(ss0 )|Z
Y 1.5 se minimiza cuando Z(s Z n ], la estimación de la varianza para este estimador es
(Sherman, 2011):
2
E {E [Z(s 0 )|Z n ] − Z(s 0 )}
s Z s (1.6)
b s0 ) = E[Z(ss0 )|Z
A partir de 1.6 el estimador Z(s Z n ] se hace, intuitivamente, la mejor estimación para
cualquier nueva observación basada en los valores observados y las expectativas dados los valores
10
observados. Cuando Z(ss) tiene una distribución continua las expectativas condicionales dependen de
la articulación de las distribuciones de las observaciones y el cálculo de la media condicional requie-
re del conocimiento de esta densidad articulada y el cálculo de una integral (n + 1) − dimensional
(Sherman, 2011). Dado que sólo se cuenta con n observaciones esta no sería la esperanza de las ob-
servaciones sino la esperanza de la estimación de las expectativas condicionales. Así, la mejor función
b s0 ) es:
lineal que permite la búsqueda del estimador Z(s
n
Zb (ss0 ) = ∑ λi Z (ssi ) (1.7)
i=1
Con esta condición en 1.7, se cambia el problema de estimar una distribución (n + 1) − dimensional
a estimar n constantes.
b 0 )] = µ; lo que implicaría
Como la media se asume constante en 1.2, parece natural requerir que E[Z(∼
que la expectativa del estimador es la expectativa de la estimación, es decir, el estimador es insesgado.
Para esto, se requiere que ∑ni=1 λi = 1; ahora, el objetivo es minimizar:
" #2
n n
E ∑ i i
λ s
Z(s ) − s
Z(s 0 ) sujeto a ∑ λi = 1 (1.8)
i=1 i=1
Según Sherman (2011), en 1.8 puede aparecer algún λi negativo, lo que puede ser inapropiado; sin
embargo, la presencia de pesos negativos es necesaria en un conjunto grande de observaciones, incluso
en un conjunto pequeño de observaciones.
Obtener una estimación óptima implica definir el mejor estimador lineal. Para encaminarse en este
objetivo, Sherman (2011) propone expandir el término del error:
h i2 n n n
Z(ss0 ) − Z(ss0 ) = Z 2 (ss0 ) − 2 ∑ λi Z(ss0 )Z(ssi ) + ∑
b ∑ λiλ j Z(ssi)Z(ss j ) (1.9)
i=1 i=1 j=1
11
Completando el cuadrado en los dos primeros términos de la derecha en 1.9, se tiene:
n n n
2
h i2 Z(ssi ) − Z(ss j )
b s0 ) = ∑ λi [Z(ssi ) − Z(ss0 )]2 − ∑
Z(ss0 ) − Z(s ∑ λi λ j (1.10)
i01 i=1 j=1 2
Si se considera que γ(hh) = 12 E [Z (ss + hh) − Z (ss)]2 para todo h , se tiene que 1.10 es la varianza de la
estimación para un estimador linear usando cualquier λi , i = 1, . . . , n (Sherman, 2011).
n
dH
= 2γ (ss0 −ssi ) − 2 ∑ λ j γ s i −ss j − m (1.12)
dλi j=1
m
dH
= − ∑ λi + 1 (1.13)
dm i=1
igualando a 0 las n+1 derivadas que se generan, la única solución del sistema está dada por (Sherman,
2011):
n m
∑ λ jγ s i −ss j + = γ (ss0 −ssi ) , i = 1, . . . , n (1.14)
j=1 2
n
∑ λi = 1 (1.15)
i=1
Donde 1.14 y 1.15 conforman un sistema lineal de la forma:
12
γ11 . . . γ1n 1 λ1 λ01
. .. .. .. . .
.. . . . . .
. .
= (1.16)
n1 . . . γnn 1
γ
λn λ0n
m
1 ... 1 0 2 1
donde γi j = γ s i −ss j
λ = Γ−1 γ (1.17)
Los primeros n elementos de λ dan los pesos del mejor estimador lineal de Z(ss0 ). El estimador
b s0 ) = ∑n λi Z(ssi ) con esos pesos óptimos es lo que se conoce como kriging (Sherman, 2011).
Z(s i=1
Los errores asociados al estimador kriging están dados por la varianza kriging:
h i2
σZ20 := E Z (ss0 ) − Zb (ss0 )
n n n
= 2 ∑ λi γ (ss0 −ssi ) − ∑ ∑ λi λ j γ s i −ss j (1.18)
i=1 i=1 j=1
n
m
= ∑ λiγ (ss0 −ssi) + 2 = λ Tγ
i=1
b si ) =
El estimador kriging es un interpolador exacto en el sentido que las ecuaciones kriging dan Z(s
Z(ssi ) para todas las variables observadas y para i = 1, . . . , n (Sherman, 2011).
Intervalos de Confianza
En general, estimar un intervalo de confianza para valores predictivos de Z(ss0 ) puede presentar varias
dificultades. Sin embargo, si las observaciones se encuentran normalmente distribuidas los intervalos
de confianza pueden resultar sencillos de estimar.
13
algún λi cuyo intervalo se puede representar:
q
Zb (ss0 ) ± Zα σz20 (1.19)
Distribución Log-Normal
Una de la distribuciones más populares en el campo de los datos espaciales es la distribución Log-
Normal. En particular, el problema de la estimación en los campos aleatorios log-normales tiene una
larga historia en la literatura geoestadística donde la metodología estadística asociada es llamada, ge-
neralmente, kriging log-normal (De Oliveira, 2006).
normal multivariada con media µ y varianza Σ , para algún vector v = (v1 , . . . , vn )0 y alguna función
de una variable g (·), es posible definir g (vv) := (g (v1 ) , . . . , g (vn ))0 (Rui & De Oliveira, 2008). Las
funciones de la media y la covarianza para el vector Z vienen dadas por (De Oliveira, 2006)
σ2
E [Z (ss)] = exp µY + Y =: µZ
2
cov {Z (ss) , Z (uu)} = µZ2 (exp {CY (s,
s, uu)} − 1)
σ2
E [Z (ss)] = exp µ(ss) +
2
cov Z (ssi ) , Z s j = µ(ssi )µ(ss j ) exp Σs i ,ss j − 1
Si el predictante Z(ss0 ) es definido junto con las observaciones de Z , entonces (Sherman, 2011):
14
2 T
C0Y
T µY0 σY0
Z T ∼ Λn+1 ,
Z (ss0 ) ,Z (1.20)
µY C0Y ΣY
es dado por:
σ ∗
b∗ ∗ b0Y
Z (ss0 ) = exp Yb (ss0 ) + (1.21)
2
donde
Yb ∗ (ss0 ) = E [Y (ss0 |Y T −1
Y )] = µ0 +C0Y Y − µY )
ΣY (Y (1.22)
∗ T −1
σb0Y Y )] = σ 2 −C0Y
= Var [Y (ss0 |Y ΣY C0Y (1.23)
son conocidos como estimador simple kriging y la varianza simple kriging de Y0 (De Oliveira, 2006),
asumiendo que µY es conocida (Sherman, 2011).
En general, como se asume que µY es desconocida, las opciones para predecir observaciones son
(Sherman, 2011):
1. Krigning Log-Normal:
En primer lugar, es necesario encontrar el mejor estimador linear insesgado de Y (ss0 ). Enton-
ces, se exponencia este estimador usando una corrección multiplicativa de sesgo para hacer
b s0 )] = E[Z(ss0 )]. En otras palabras,
E[Z(s
Yb 0K (ss0 ) = λ0Y
T
Y (1.24)
donde λ0Y es el vector de pesos ordinarios usados para predecir Y (ss0 ) con base en Y . Así, el
kriging log-normal está dado por (Rui & De Oliveira, 2008):
15
bLK 0K 1 0
Z (ss0 ) = exp Yb + Cy (ss0 ,ss0 ) − λ (ss0 ) ΣY λ (ss0 )
2
0K 1 0K 0
b b (ss0 ) −xx (ss0 ) m (ss0 )
= exp Y (ss0 ) + σ (1.25)
2 Y
h i
ZbLK (ss0 ) = exp Yb 0K (ss0 ) + σY20 − mOY (1.26)
2. Tratar de alcanzar el estimador óptimo L2 para estimar Zb (ss0 ) y no ln [Z (ss0 )] a partir de:
Zb (ss0 ) = exp aT Y − K0 , aT 1 = 1
(1.27)
Con manipulación matemática de 1.27, puede mostrarse que el estimador óptimo es (Sherman,
2011):
h i
2
Z = exp Z (ss0 ) + σY0 − 2mOY
e b (1.28)
Comparando 1.26 con 1.28 se observa que con un simple remplazo en el término que multiplica
mOY se obtienen expresiones equivalentes.
Kriging Universal
Uno de los ejemplos más comunes donde la función de la media no es constante es aquel donde
la función de media del campo espacial depende de la localización espacial; en cuyo caso se tiene
16
s = (x, y); en cuyo caso, un modelo razonable para algún entero positivo r sería (Sherman,2011):
Para observaciones en una cuadrícula regular, una función de media que depende de coordenadas
espaciales está dada por:
Donde c (x) describe la media en la coordenada x para todas las observaciones y r (y) la media en la
coordenada y. De manera más general se tiene (Sherman, 2011):
p
µ (ss) = ∑ fk−1,sβk−1 (1.32)
k=1
Z = Xβ + δ (1.33)
donde X es una matriz n × p. En el caso de un Modelo Lineal Generalizado, se tiene que los erro-
res se asumen como independientes; mientras, en este caso, los errores δ (ssi ) se supone que son la
estacionariedad intrínseca. Bajo este MLG, el predictante es (Sherman, 2011):
donde x0 describe las p covarianzas para la locación que se desea predecir. El estimador lineal se sigue
asumiendo de la forma Zb (ss0 ) = ∑ni=1 λi Z (ssi ) (Sherman, 2011); por lo que la imparcialidad requiere:
h i n n
E Z (s 0 ) = ∑ λi µ (s i ) = ∑ λixTi β = xT0 β
b s s (1.35)
i=1 i=1
Si se procede de manera análoga que con el estimador kriging ordinario, se tiene (Sherman, 2011):
λ = Γ −1γ (1.36)
17
Figura 1.3: Descripción de Estacionariedad: dos vectores con idénticos rezagos (Sherman, 2011)
matriz de dimensiones (n + p)×(n + p). Con esto, el estimador universal kriging y su varianza vienen
dados por (Zimmerman & Stein, 2010):
h −1 iT −1
X X T Γ −1X
Yb (ss0 ) = Γ +X X T Γ −1
x 0 −X Γ Y (1.37)
T −1
σ 2 (ss0 ) = γ T Γ −1 γ − X T Γ −1 γ −xx0 X T Γ −1X X T Γ −1 γ −xx0
(1.38)
En general, el variograma y las funciones de covarianza son desconocidas; hasta el momento, estas
han sido asumidas como conocidas y se requiere estimarlas a partir de los datos disponibles.
Para estimar de manera empírica el variograma y la función de covarianza se asume que la estaciona-
riedad se mantiene (bien sea la intrínseca (IS) o de Segundo Orden (SOS). La Figura 1.3 (Tomada de
Sherman, 2011) muestra un par de puntos separados por un rezago espacial h dada una estimación de
2γ (hh), a saber {[Z(ssi ) − Z(ss j )]2 } con s i −ss j = h . Lo que sugiere que el estimador intuitivo del semi-
variograma se obtiene a partir del promedio de todos los pares de puntos; por lo tanto, el estimador
empírico del semivariograma viene dado por (Zimmerman & Stein, 2010):
18
1 2
γb(hh) = ∑ eb(ssi ) − eb s j (1.39)
2N (hh) s −ss =hh
i j
1
Cb (hh) = ∑ Z (ssi ) − Z n Z s j − Z n (1.40)
N (hh) s −ss =hh
i j
Como se observa en 1.40, se emplea un estimador de µ, Z n para definir la covarianza; lo que hace
b h)] 6= C(hh). Sin embargo, es claro que E[γb(hh)] = γ(hh) lo que hace preferir la estimación de
que E[C(h
la función del variograma por sobre la función de covarianza.
De momento, se tiene un estimador intuitivo e imparcial; sin embargo, los estimadores del semivario-
grama y la función de covarianza presentan ineficiencias.
En primera instancia, estos estimadores no satisfacen las propiedades de la covarianza definida como
no negativa y el semivariograma definido no positivo (Sherman, 2011). En segundo lugar, este esti-
mador da, de momento, estimaciones de correlación sólo a los rezagos observados y, para estimar el
kriging en un punto, s 0 , no observado se requiere estimar la correlación para los rezagos no obser-
vados. En otras palabras, se necesita un estimador de la correlación espacial para cualquier rezago
espacial.
Una solución bastante común para estas ineficiencias es ajustar un modelo paramétrico que cumpla
algunas consideraciones (conocimiento previo, simplicidad computacional, flexibilidad suficiente) y
que se base en la evaluación del semivariograma empírico. Las siguientes condiciones son necesarias
y suficientes para que un modelo para el semivariograma sea válido (siempre que se mantenga para
todo θ ∈ Θ, donde Θ es el espacio paramétrico de θ ) (Gelfand et all, 2010):
1. γ (0, θ ) = 0
19
−h
−h; θ ) = γ (hh, θ )
2. γ (−h ∀ h
Existe una gran variedad de modelos que satisfacen los requerimientos anteriores (en R2 y R3 ); los
más empleados en la estimación del semivariograma γ(hh; θ ) y la función de covarianza C(hh; θ ) según
Gelfand et all (2010) y Sherman (2011) son 1
Esférico
θ1 3hh − h 33
2θ2 2θ
para 0 ≤ h ≤ θ2
γ (hh; θ ) = 2 (1.41)
θ1 para h > θ2
h3
3hh
C (hh; θ ) = θ1 1 − + para 0 < θ1 ; h ≤ θ2 (1.42)
2θ2 2θ23
Exponencial
h
γ (hh; θ ) = θ1 1 − exp − (1.43)
θ
2
h
C (hh; θ ) = θ1 exp − para 0 < θ1 ; 0 < θ2 ; h ≤ θ2 (1.44)
θ2
Gaussiano
2
h
γ (hh; θ ) = θ1 1 − exp − 2 (1.45)
θ
2 2
h 1
C (hh; θ ) = θ1 exp − para 0 < θ1 ; 0 < (1.46)
θ2 θ2
1 En este caso, θ1 = σ 4 ; θ2 = m (que es el rango de la correlación) y h ≡k h k y denota la longitud del vector
20
De Matérn
(h/θ2 )ν Kν (h/θ2 )
γ (hh; θ ) = θ1 1 − (1.47)
2ν−1 Γ (ν)
σ2
h h
C (hh; θ ) = Kν (1.48)
Γ (ν + 1/2) 2/θ2 θ2
De Potencia
La Figura 1.4 corresponde a la representación gráfica para las modelos citados, tomada de Gelfand
(2011). La Figura 1.5, tomada de Sherman (2011), corresponde a la representación gráfica de los
modelos de Covarianza.
En los procesos espaciales es posible incorporar relaciones mutuas entre variables que definen el
fenómeno estudiado. Todo modelo espacial ha de caracterizarse por su interdependencia, es decir,
deben incorporarse relaciones mutuas entre las observaciones de las variables económicas, sociales,
demográficas, etc. (Moreno & Vayá, 2000). Como tal, son varios los modelos que permiten realizar
un análisis confirmatorio de la interdependencia espacial.
El Modelo Espacial Autorregresivo (SAR2 ) es una variación del modelo de Mínimos Cuadrados Ordi-
narios (OLS3 ) que incorpora el rezago espacial de la variable dependiente (Zhukov, 2010). El modelo
puede expresarse como (Ward & Gleditsch, 2007):
2 Por su nombre en inglés Spatial Autoregressive Model
3 Ordinary Least Squares
21
Figura 1.4: Representación Gráfica de los Modelos para Semivariograma
22
Wy +X
Y = ρWy Xβ +ε (1.50)
ε ∼ N 0, σ 2I
(1.51)
donde I representa una matriz diagonal inversa. Si ρ = 0 se deduce que no existe dependencia espacial
y por lo tanto el modelo especificado corresponde a un modelo OLS.
Sin embargo, usar un modelo OLS para estimar la dependencia espacial puede ser problemático por
lo que es conveniente usar estimadores de máxima verosimilitud (MLE4 ) para el rezago espacial en
cuyo caso el estimador puede escribirse (Ward & Gleditsch, 2008):
−1
β = X 0X X 0 (II − ρW
W) (1.52)
En caso que ρ sea desconocida se dificulta la estimación del parámetro siempre que la función del
logaritmo de verosimilitud envuelve el determinante de |II − ρW
W |. Sin embargo, Ord demostró en su
texto de 1975 que si W tiene valores propios (ω1 , . . . , ωn ) entonces (Ward & Gleditsch, 2008):
n
|ωII − ρW
W | = ∏ (ω − ρωi ) (1.53)
i=1
n
|II − ρW
W | = ∏ (1 − ρωi ) (1.54)
i=1
Si se sabe que la función de verosimilitud logarítmica para un modelo clásico de regresión es:
N N X β )0 (y −X
(y −X Xβ)
lnL(β , σ 2 ) = − − 2
− 2
(1.55)
2ln(2π) 2ln(2σ ) 2σ
Por contraste, la función del logarítmica de verosimilitud para el modelo de dependencia espacial es
(Ward & Gleditsch, 2008):
4 Maximum Likelihood Estimator
23
2 N N (y − ρW X β )0 (y − ρW
W −X W −X
Xβ)
lnL(β , σ , ρ) = ln|II − ρW
W|− − − (1.56)
2ln(2π) 2ln(2σ 2 ) 2σ 2
Según Ward & Gleditsch (2008), Ord (1975) sugiere que ωi puede ser dado como una condición a
priori a la estimación lo que facilita la estimación del modelo.
El parámetro β refleja el impacto directo de corto plazo ed xi sobre yi . Sin embargo, es necesario
determinar el impacto directo xi sobre yi a partir de la influencia que yi ejerce sobre sus vecinos y j y
que retorna a yi , lo que se conoce como Efecto Equilibrio.
W )−1 ∆X
E[∆y] = (II n − ρW X (1.57)
Mientras que los modelos de variable dependiente (como el SAR) consideran la dependencia espacial
como sustancial, en el sentido que el valor de y en la localización i está influenciando el el valor de y
en la localización j (siempre que i 6= j), el Modelo de Error Espacial (SEM5 trata a la correlación es-
pacial como una molesta, al igual que muchos enfoques estadísticos trata la correlación serial espacial
como algo que debe eliminarse y, únicamente, como un problema de estimación (Ward & Gleditsch,
2007).
Este enfoque, generalmente, se concentra en la estimación del los parámetros para las variables in-
dependientes de interés en la parte sistemática del modelo y ,esencialmente, desestima la posibilidad
que la correlación observada pueda reflejar algo significativo sobre el proceso de generación de los
datos. Así, en lugar de dejar que yi afecte directamente a y j , el modelo de error espacial supone que
5 Spatial Error Model
24
los errores de un modelo están espacialmente correlacionados (Ward & Gleditsch, 2007).
Para plantear el modelo SEM se parte de la expresión presentada en la ecuación 1.50; si se considera
que wi denota el vector de W que indica que tan cercanas a las unidades i son las unidades j 6= i, el
modelo puede escribirse (Ward & Gleditshc, 2007):
yi = xi β + εi + λw
wi ξi (1.58)
Wξ +ε
y = X β + λW (1.59)
ε ∼ N(0, σ 2I ) (1.60)
donde es más fácil visualizar que si las observaciones i y j no presentan correlación espacial el pará-
metro λ será 0 y el modelo se reduce a una regresión lineal estándar.
n e0 e
lnL = − + ln |II − λW
W|− 2 (1.61)
2 2σ
e = (II − λW
W ) (y −X
Xβ) (1.62)
Como el SEM no involucra los rezagos espaciales de la variable dependiente, los parámetros β esti-
mados pueden interpretarse como derivadas parciales:
25
∂ yi
βk = ∀ i, k (1.63)
∂ xi j
El Modelo Espacial de Durbin (SDM6 tiene una motivación similar a la del modelo SEM: lo con-
cerniente a variables omitidas (Zhukov, 2010). Un punto de partida simple para la formulación del
modelo se observa en la ecuación 1.64:
W )−1u
y = X β + (II n − λW (1.64)
u = X γ +vv (1.65)
v ∼ N(0, σ 2I n ) (1.66)
Si se observa en detalle, es una variación del SEM donde γ y σ 2 son escalares que definen la fuerza
W )−1 .
de la relación entre X y (II n − λW
Wy + αιn +X
y = ρWy X β +W
WXXθ + ε (1.67)
que es la expresión del SDM donde se incluyen los rezagos espaciales tanto de la variable dependiente
como de las independientes. Así, la función de verosimilitud logarítmica se expresa de la forma:
n e0 e
lnL = − ln πσ 2 + ln |II n − ρW
W|− 2 (1.68)
2 2σ
e ∼ y − ρWy
Wy −Z
Zδ (1.69)
26
1.3. Datos Espacio - Temporales
En concreto, los procesos espaciales son procesos estocásticos representados como Y (ss) : s ∈ D ⊆ Rd × R
descritos dentro de un dominio Euclidiano; ahora bien, en el caso espacio-temporal debe considerarse
procesos de tipo (Gneiting & Guttorp, 2010):
n o
Y (ss,t) : (ss,t) ∈ D ⊆ Rd × R (1.70)
En particular, todo resultado técnico sobre funciones de covarianza espacial y predicción por mínimos
cuadrados o kriging en espacios Euclídeos aplica para los problemas espacio-temporales aplicando el
respectivo resultado sobre el domino Rd+1 (Gneiting & Guttorp, 2010).
Perpiñán (2014) plantea que los datos espacio-temporales se indexan tanto en el tiempo como en el
espacio y pueden consistir en un objeto vectorial espacial (como el caso de polígonos o puntos) o un
objeto en capas registrados en diferentes momentos.
27
El análisis de imágenes repetidas a lo largo del tiempo puede verse obstaculizado por los cambios
en las condiciones de luz, los errores en la georreferenciación que resultan en desajuste espacial y
modificaciones en áreas oscurecidas por los cambios de nubosidad (Pebesma, 2012). Por otro lado,
los datos suministrados por sensores fijos dan a menudo señales muy detalladas a través del tiempo,
lo que facilita el modelado, pero ofrecen poco detalle en el espacio ya que depende de la limitada
disponibilidad de sensores.
Güting & Schenider (2005) distinguen 10 tipos de datos generados en las dimensiones de espacio-
tiempo definidos, particulamente, por sus características7 :
28
1. El tiempo es instantáneo y la característica no se mueve (es decir, sólo puede existir en un
instante en el tiempo).
La Figura 1.6 muestra los casos identificados por Pebesma (2012): parte superior izquierda: el tiempo
es instantáneo; parte superior derecha: los objetos presentan movimiento; parte inferior izquierda: el
tiempo presenta intervalos consecutivos; y, parte inferior derecha: los intervalos de tiempo son alea-
torios. s1 se refiere a la primera característica/ubicación, t1 a la primera instante de tiempo o intervalo.
Las líneas continuas indican intervalos de tiempo; las flechas, movimiento. Los círculos rellenos de-
notan el momento inicial y los círculos vacíos el momento final o cierre.
Cuando el tiempo refleja intervalos significa que la característica espacial o los valores de los datos
asociados no cambian durante dicho intervalo pero refleja el valor o e lestado durante este intervalo
(Pebesma, 2012).
Los instantes de tiempo pueden reflejar momentos de cambio o eventos cero o con duración ilegible;
mientra que el movimiento refleja el hecho que existen objetos en movimiento y pueden cambiar de
ubicación durante un intervalo de tiempo. Para datos de objetos en movimiento los instantes de tiem-
po reflejan la ubicación del objeto en un momento en particular y los cambios de ubicación ocurridos
durante el registro del tiempo y las características; esto debe ocurrir simultáneamente.
Las trayectorias se refieren al caso donde el conjunto de puntos espacio-temporales forman secuencias
y representan un trayecto; su agrupación puede ser simple, anidada o compleja (Pebesma, 2012).
El interés general para el análisis de los procesos espacio- temporales se centra en la forma:
29
Figura 1.6: Ejemplificación de los casos de objetos espacio-temporales identificados por Pebesma
(2012)
30
donde Y (s,t) denota las observaciones espacio-temporales; µ (s,t) el la media del campo estructura-
do y ε (s,t) los residuales del campo espacio-tiempo.
La media del campo estructurado puede modelarse (Lindstrom, Szpiro, sampson, Bergen & Sheppard,
2013):
L n
µ (s,t) = ∑ γl Ml (s,t) + ∑ βi (ss) fi (t) (1.72)
l=1 i=1
donde Ml (s,t) representa las covarianzas espaciales; γl los coeficientes que definen las covarianzas;
{ fi (t)}m
i=1 es el conjunto de funciones básicas temporales y βi (ss) los coeficientes de variación para
A los coeficientes βi (s) en 1.72 se les da tratamiento de campos espaciales con una estructura de
Kriging universal permitiendo una estructura temporal que varía entre locaciones (Lindstrom et all,
2013b):
βi (s) ∈ N Xi αi , Σβi (θi ) para i = 1, . . . , m, (1.73)
donde Xi es una matriz con diseño n × pi ; αi es una matriz de coeficientes de regresión con diseño
pi × 1 y Σβi (θi ) es una matriz de covarianzas n × n.
1
Σν (θν ) 0 0
ν(s,t) ∈ N 0,
... (1.74)
0 0
0 T
0 Σν (θν )
| {z }
Σν (θν )
donde el tamaño de cada matriz Σtν (θν ) es el número de observaciones y nt cada punto en el tiempo
(Lindstrom, 2013c). La independencia temporal en 1.74 se basa en el supuesto que la base temporal,
{ fi (t)}m
i=1 ; en 1.72 explica la correlación temporal en los datos (Lindstrom, 2013b).
31
1.3.3. Estacionariedad y Estimadores Espacio-Temporales
A partir de 1.72 se tiene que µ(ss,t) denota la media de Z(ss,t) y define la covarianza entre dos variables
espacio-temporales como:
Cov [Z(ss, u), Z(tt , v)] = E {[Z(ss, u) − µ(ss, u)] [Z(tt , v) − µ(tt , v)]} (1.75)
La Estacionariedad de Segundo Orden (SOS) require que para cada ubicación s y cada momento t, se
mantenga (Sherman, 2011):
1. E [Z(ss,t)] = µ
2. Cov [Z(ss +hh,t + u), Z(ss,t)] = Con [Z(hh, u), Z(00, 0)] =: C(hh, u), para toda variación espacial h y
variación temporal u.
Como en el caso puramente espacial, alguna forma de estacionariedad es necesaria para permitir la
estimación del la función de covarianza subyacente. Así, la función del variograma espacio-temporal
está dada por (Sherman, 2011):
Pese a esto, la formulación de un modelo espacio-temporal está dado más en términos de la función
de covarianza (cuando existe); aunque, para propósitos de estimación puede considerarse la corres-
pondiente función de variograma espacio-temporal.
En particular, el predictor de Z(ss0 ,t0 ) para una nueva combinación espacio-temporal basada en las nT
observaciones espacio-temporales, está dado por (Sherman, 2011):
−1 T −1
µ (ss0 ,t0 ) = 1 T Σ −11 1 Σ Z n,T (1.78)
32
que es el estimador de Mínimos Cuadrados Generalizados de la media.
La estimación de la función de covarianza para las estructuras espacio-tiempo pueden resultar compli-
cada a no ser que se empleen algunas suposiciones: estacionariedad, separabilidad y simetría absoluta.
Además, algunas veces es deseable que el proceso espacio-temporal tenga una covarianza compacta,
tal que Cov{Z(s1 ,t1 ), Z(s2 ,t2 )} = 0 cuando k s1 − s2 k y/o |t1 − t2 | son lo suficientemente grandes
(Gneiting, Genton & Guttorp, 2007).
Una función de covarianza espacio-temporal es separable si existe una función de covarianza espacial,
Cs y una función de covarianza temporal, CT tal que (Gneiting & Guttorp, 2010):
para todo (hh, u) ∈ Rd × R. Por lo tanto, dadas dos ubicaciones espaciales, un modelo completamen-
te simétrico es incapaz de distinguir posibles efectos diferentes a medida que el tiempo avanza o
retrocede (Gneiting & Guttorp, 2010).
Algunos modelos de espacio-tiempo son considerados una estensión natural de las series de tiempo;
en otros casos, los modelos tratan explícitamente de los efectos de la dimensión espacio-tiempo y sus
interacciones (Sherman, 2011).
Modelos VAR
Una manera de ver los datos espacio-temporales es considerarlos una serie de tiempo multivariada
donde el orden de las observaciones multivariadas es el número de ubicaciones espaciales. Formal-
mente, se tiene que Z t = [Z(ss1 ,t), . . . , Z(ssn ,t)] denota el vector de n respuestas a lo largo de todos
33
los puntos espacialmente identificados en el tiempo t; entonces, un proceso ARMA(p, q) multivariado
está dado por (Sherman, 2011):
donde a 1 , . . . ,aa p y b 1 , . . . ,bbq son matrices n × n y el proceso de ruido blanco εt es tal que Var(εt ) = Σ
y, para todo t 6= s, Cov(εt , εs ) = 0.
Z t = aZ t−1 + εt (1.82)
1 1 2 2
y1t c1 a11 a12 y1t−1 a11 a12 y1t−2 ε1t
= + + +
y2t c2 a121 a122 y2t−1 a221 a222 y2t−2 ε2t
Donde Cov(ε1t , ε2t ) = σ12 para t = s; y 0 en otro caso. Es de notar que, en este caso (y puede gene-
ralizarse) cada ecuación tiene los mismos valores para los regresores de los retardos de y1t y y2t . Por
lo tanto, el modelo VAR(p) es sólo un modelo de regresión aparentemente no relacionado (SUR) con
variables rezagadas y términos deterministas como regresores comunes (Zivot & Wang, 2006).
a(L)Y
Y t = c + εt (1.83)
34
Tiene un módulo mayor que 1 o, equivalentemente, si los valores propios de la matriz complementaria:
a 1 a 2 . . . a n
I n 0 . . . 0
F=
.
0 . . 0 .. .
0 0 In 0
tiene módulo menor que 1. Asumiendo que el proceso ha iniciado en el pasado infinito, un proceso
VAR(p) es estacionario y ergódico cuando las medias, las varianzas y las autocovarianzas permanecen
invariables en el tiempo (Zivot & Wang, 2006).
Sin embargo, este enfoque es apropiado cuando el número de ubicaciones espaciales es relativamente
pequeño (Sherman, 2011).
Modelos STARMA
Los modelos STARMA desarrollados por Phillip E. Pfeifer y Stuart Jay Deutsch a comienzos de la
década de 1980 no podrían haber alcanzado la estructura teórica integrada como el método de Box-
Jenkins utilizado en el análisis convencional de series de tiempo. Pero, ofrece oportunidades para el
pronóstico y la estimación exitosos de manera similar a los modelos de Box-Jenkins en términos de
modelamiento espacio-temporal (Kurt & Tunay, 2015).
Así, un modelo espacio-temporal es un caso especial de modelos para series de tiempo el cual se
usa para calcular las dependencias lineales entre las variables considerando, a la vez, los factores de
tiempo y espacio. Con base en esto, es necesario identificar dos tipos de rezagos: los rezagos tempo-
rales, como se conocen en la teoría tradicional de series de tiempo; y los rezagos espaciales donde se
considera la asociación de una variable en una región con la misma variable en otra región.
9 Media Movil Autorregresiva Espacio-Temporal
35
Se debe, entonces, definir las fronteras y vecindades para poder calcular el operador de rezago es-
pacial. El primer paso es identificar cada región vecina de acuerdo a algunos criterios de selección
previos y agruparlos en conjuntos de vecindad (Kurt & Tunay, 2015). Entonces, si yi es la observación
de la región i y Js es el s − ésimo orden del conjunto de vecindad; el rezago espacial de orden s puede
definirse como (Zhou & Buongiorno, 2006):
(s)
L(s) yi = ∑ xi j x j s = 1, 2, . . . (1.84)
j∈Js
La implementación de los rezagos espaciales se hace de manera similar a los rezagos distribuidos; pe-
ro los rezagos espaciales no están en una dirección como la estructura de retardo distribuido utilizada
(s)
en el análisis de series temporales. En 1.84, se asume que los pesos wi j son, usualmente, externos,
no estocásticos y muestran la siguiente estructura (Zhou & Buongiorno, 2006):
(0, 1] si el sitio j es el orden s de i
(s)
wi j = (1.85)
0
en otro caso
(s)
∑ wi j =1 (1.86)
i∈Js
(s)
La matriz wi j corresponde a la matriz de pesos espaciales W (s) ; una matriz de dimensión n × n donde
(s)
cada fila de la misma suma uno. wi j puede representar propiedades físicas del área de interés (por
ejemplo, la longitud de la frontera) para hacerlas iguales para vecinos espaciales del mismo orden o
para representar las especificaciones espaciales de quien construye el modelo . Si existe poca teoría
o resultados apriori para seleccionar los pesos espaciales, se asigna el mismo peso a cada vecino del
(s) (s) (s)
mismo orden. Entonces, por cada región i, para cada vecino de orden s; wi j = 1/ni , donde ni es el
número de vecinos de orden s de i (Zhou & Buongiorno, 2006).
La notación matricial del modelo STARMA se puede escribir (Kurt & Tunay, 2015):
p kl q ml
(s)
yt = ∑ ∑ φlsW yt−l − ∑ ∑ θlsW (s)εt−l + εt (1.87)
l=1 s=0 l=1 s=0
36
donde εt está normalmente distribuido con media cero y (Zhou & Buongiorno, 2006):
σ 2I
0
n si s = 0
E εt εt+s =
0
en otro caso
Modelos STARIMA
Según Cheng, Wang & Li (2011) el modelo STARIMA expresa cada observación en el tiempo t y
locación i como una combinación lineal ponderada de la observación previa en la locación i (rezagada
en el tiempo) y las observaciones vecinas rezagadas en el espacio; describe las variaciones estocásticas
locales del término de erros ξi,t de la siguiente forma:
p ml q nl
(s)
ξi,t = ∑ ∑ φlsW ξi,t−l − ∑ ∑ θlsW (s)εi,t−l + εi,t (1.88)
l=1 s=0 l=1 s=0
donde p es el orden AR; q el orden MA; ml el orden espacial del l − ésimo término autorregresivo;
nl es el orden espacial de la l − ésima media móvil: φls es el parámetro autorregresivo del rezago
temporal l y el rezago espacial s; W (s) es la matriz n × n de pesos espaciales y εi,t está normalmente
distribuida con las siguientes propieadades:
E [εi,t ] = 0
σ 2I , i = j, s = 0
0
E εt ε j,t+s =
0, i 6= j, s 6= 0
0
E ξi,t εi,t+s = 0 para s > 0
p ml q nl
5d zt = ∑ ∑ φlsW (s) 5d zt−l − ∑ ∑ θlsW (s)εi,t−l + εi,t (1.89)
l=1 s=0 l=1 s=0
37
5zt = zt − zt−1
52 zt = zt − 2zt−1 + zt−2
y, además, se observa la similitud entre 1.88 y 1.89 por lo que ambos presentan las mismas condicio-
nes.
38
Capítulo 2
2.1. Antecedentes
Estimaciones recientes sugieren que cerca de 4.9 millones de colombianos han sido desplazados
internamente como resultado del prolongado conflicto armado y la violencia política asociada que
envuelve al Estado y los grupos armados de guerrilla de izquierda, así como una serie de grupos “pa-
ramilitares” de derecha altamente regionalizados y redes armadas de tráfico de drogas (Cantor, 2011).
Gran parte de ese desplazamiento forzado en los últimos años es el resultado directo o indirecto de
las ofensivas militares de contraguerrilla por parte de los organismos del Estado y de la disputa por el
control de las zonas rurales, que históricamente han tenido presencia guerrillera, entre paramilitares y
guerrilla. El gran número de grupos armados no estatales y al compleja naturaleza cambiante de sus
disputas desmienten cualquier intento de caracterización del desplazamiento forzado en Colombia
(Cantor, 2011).
39
personas emigran a buscar refugio mientras que otras prefieren quedarse.
El proceso migratorio involuntario va más allá de de la presencia y el actuar de los grupos armados,
tanto legales como ilegales, en las diferentes regiones. Mantilla (2015), además de los factores aso-
ciados a los eventos de violencia y conflicto armado, identifica otros Factores Comunes que incluyen
la creación de subsidios estatales, la inversión pública en salud y algunos aspectos relacionados con
la política y el desempeño fiscales como elementos determinantes en la decisión de abandonar un
territorio de manera no voluntaria. Sin embargo, el presente documento se ocupará únicamente del
fenómeno de desplazamiento forzado como resultado de las acciones bélicas registradas en el territo-
rio de desplazamiento.
La Figura 2.1 muestra la evolución histórica del total de víctimas del desplazamiento forzado en Co-
lombia, reportadas mes a mes, durante el periodo comprendido entre el 1 de enero de 2007 y el 31
de diciembre de 2016. El pico más alto observado en la serie coincide con el recrudecimiento de las
operaciones contra insurgentes del gobierno de Álvaro Uribe Vélez en contra de la guerrilla de las
FARC-EP1 .
El máximo lider de las FARC-EP, Pedro Antonio Marín, mejor conocido como Manuel Marulanda
Vélez o Tirofijo, fallece por causas naturales en marzo de 2008 y, al poco tiempo, es abatido en com-
bate Luis Edgar Devia, alias Raúl Reyes, segundo al mando después de Tirofijo (Agencia EFE, 2016),
hechos que propician el debilitamiento de este grupo armado, el repliegue de sus frentes y la reduc-
ción significativa del número de víctimas del conflicto.
El posterior inicio formal de negociaciones entre el Gobierno colombiano y la Guerrilla de las FARC-
EP tuvo como resultado, en términos de desplazamiento forzado, la reducción del reporte de víctimas
ante los organismo veedores del derecho internacional humanitario y los organismos del Estado co-
lombiano.
Si se tiene en cuenta que los grupos armados al margen de la ley establecen su territorio mediante ac-
ciones bélicas contra las fuerzas del Estado e intimidación y ataque a la población civil que lo habita
1 Fuerzas Armadas Revolucionarias de Colombia - Ejército del Pueblo
40
Figura 2.1: Total de Víctimas del Desplazamiento Forzado en Colombia (1 de enero de 2007 - 31 de
diciembre de 2016)
y que esto genera un fenómeno migratorio involuntario, surge, entonces, la pregunta: ¿es el desplaza-
miento forzado un fenómeno que pueda identificarse como un proceso espacial que puede expresarse
en términos de su registro temporal, es decir, obedece a un proceso espacio-temporal?
En un primer enfoque, se abordará el problema como un proceso espacial con el fin de determinar si
el fenómeno presenta algún tipo de relación con el territorio donde ocurre y si se relaciona con los
eventos registrados como acciones bélicas en el mismo territorio. El segundo enfoque empleado, será
el de un proceso espacio-temporal a fin de establecer si el tiempo es una dimensión determinante en
la definición del fenómeno de desplazamiento forzado para el caso particular de Colombia.
Los datos analizados en el presente documento proceden del Sistema Integrado de Información Huma-
nitaria (SIDIH) administrado la Unidad de Manejo y Análisis de Información de Colombia (UMAIC)
que recopila información suministrada por la Oficina de la ONU para la Coordinación de Asuntos
Humanitarios (OCHA).
41
(a) Mapa Distribución Espacial del Desplazamiento Forzado (b) Mapa Distribución Espacial de las Acciones Bélicas
Figura 2.2: Mapa de Variables de Conflicto Armado: Desplazamiento Forzado y Acciones Bélicas.
Total acumulado 2007 - 2016
La base de datos contiene el reporte mensual de casos registrados sobre desplazamiento forzado y
eventos asociados al conflicto armado durante el periodo comprendido entre el 1 de enero de 2007
y el 31 de diciembre de 20162 . Los mapas de la Figura 2.2 muestra la distribución espacial del total
de eventos de desplazamiento forzado y acciones bélicas: 2.2a Mapa de la distribución espacial del
desplazamiento forzado; 2.10b Mapa de la distribución espacial de las Acciones Bélicas.
La Figura 2.3 muestra el comportamiento, mes a mes, del total de víctimas de desplazamiento forzado
en el periodo 2007 - 2016. Se aprecia una tendencia global decreciente con un salto importante ob-
servado en el mes de febrero; los demás meses del conjunto de datos no muestran valores que puedan
considerarse atípicos. En la Figura 2.4 se puede apreciar la serie acumulada mes a mes de los casos
de desplazamiento forzado. Se observan leves cambios de tendencia en la mayoria de las gráficas,
particularmente, a partir del año 2009.
Como el interés de este estudio se centra el desplazamiento forzado, el análisis exploratorio se cen-
2 En realidad,el sistema recoge información desde el 1 de enero de 1995; sin embargo, este periodo de tiempo contiene
gran cantidad de datos perdidos y no están disponibles en la misma estructura periódica. La ventana de tiempo se redujo
a 10 años debido a que en este rango de fechas las variables de interés mostraban información completa.
42
Figura 2.3: Total Mensual Víctimas de Desplazamiento Forzado en Colombia (enero 2007 - diciembre
2016)
Figura 2.4: Total Acumulado Mensual Víctimas Desplazamiento Forzado en Colombia (enero 2007 -
diciembre 2016)
43
trará en la variable de desplazamiento. La variable que describe las acciones bélicas o incursiones
armadas se tomará como referencia más adelante en el capítulo dedicado a los distintos modelos.
Debido a que los casos se encuentran localizados en unidades territoriales, se hace necesario evaluar
la autocorrelación espacial para mapear adecuadamente la distribución del fenómeno. Se empleó la I
de Moran para efectos del análisis exploratorio de los datos, la cual se define como:
n n
n ∑i=1 ∑ j=1 wi j (xi − xb)(y j − b
j)
I= n (2.1)
S0 ∑i=1 (xi − xb)2
data: colb2$DESPLAZADOS
weights: col.W_cont_el_mat
La Figura 2.5 muestra la dispersión del desplazamiento forzado por municipio y su rezago espacial
(el promedio de desplazados en los centros poblados o municipios vecinos). Se observa una alta con-
centración de puntos cerca del centroide; sin embargo, la nube de datos muestra una tendencia hacia
el primer cuadrante del plano lo que sugiere la presencia de localidades con vecino de valores simi-
lares. casos excepcionales para las poblaciones de Tumaco y Buenaventura que se presentan como
valores atípicos. En el cuarto cuadrante sobresale la ciudad de Medellín cuya posición sugiere que las
3 Según Zhukov (2010), un valor cero indica un patrón espacial aleatorio, un valor −1 indica dispersión perfecta y un
valor +1 correlación perfecta.
44
Figura 2.5: Gráfica de Dispersión - I de Morán para Desplazamiento Forzado
Llama la atención que una gran proporción de los datos se ubican en la zona media superior lo que
indica que la mayoría de las poblaciones son zonas de transición de regímenes espaciales. Este as-
pecto sugiere que, pese a que en todos los municipios registraron casos de desplazamiento durante el
periodo de estudio, el fenómeno se concentra en unas zonas específicas.
Las observaciones influyentes del fenómeno de desplazamiento forzado entendido como un proceso
espacial se muestran a continuación:
45
LA APARTADA 0.07 0.00 0.07 0.99_* 0.00 0.00
APARTADO 0.03 0.15 0.17_* 0.99_* 0.01 0.00
CAUCASIA 0.00 0.04 0.05 1.01_* 0.00 0.01
PUERTO LIBERTADOR -0.01 0.23 0.24_* 1.00 0.03 0.01_*
CAREPA 0.09 0.05 0.13_* 0.98_* 0.01 0.00
CHIGORODO 0.04 0.09 0.12 0.99_* 0.01 0.00
TARAZA 0.01 0.14 0.16_* 1.00 0.01 0.01
SAN PABLO 0.00 0.00 0.00 1.01_* 0.00 0.00
TAME 0.00 -0.10 -0.11 1.01_* 0.01 0.01_*
SAN JERONIMO 0.10 -0.03 0.10 0.99_* 0.00 0.00
COPACABANA 0.12 -0.03 0.12 0.98_* 0.01 0.00
BELLO 0.09 0.06 0.14_* 0.97_* 0.01 0.00
MEDELLIN 0.40 -1.63_* -1.64_* 1.06_* 1.32_* 0.10_*
QUIBDO 0.00 -0.04 -0.05 1.01_* 0.00 0.01_*
GUARNE 0.11 -0.03 0.11 0.98_* 0.01 0.00
HELICONIA 0.14 -0.04 0.14_* 0.97_* 0.01 0.00
RIONEGRO 0.07 -0.01 0.07 0.99_* 0.00 0.00
RETIRO 0.07 -0.02 0.07 0.99_* 0.00 0.00
ITAGUI 0.11 0.03 0.13 0.97_* 0.01 0.00
ENVIGADO 0.11 -0.03 0.11 0.98_* 0.01 0.00
ANGELOPOLIS 0.07 -0.02 0.07 0.99_* 0.00 0.00
LA ESTRELLA 0.11 -0.03 0.11 0.98_* 0.01 0.00
EL LITORAL DEL SAN JUAN 0.12 0.18 0.26_* 0.94_* 0.03 0.00
BUENAVENTURA 1.90_* -6.51_* -6.52_* 1.37_* 19.93_* 0.36_*
DARIEN 0.14 -0.03 0.14_* 0.97_* 0.01 0.00
CHAPARRAL 0.00 0.00 0.00 1.01_* 0.00 0.00
DAGUA 0.16 0.04 0.19_* 0.93_* 0.02 0.00
CALI 0.02 0.24 0.26_* 0.99_* 0.03 0.01_*
JAMUNDI 0.15 0.05 0.19_* 0.94_* 0.02 0.00
LOPEZ 0.08 0.31 0.37_* 0.93_* 0.07 0.00
VISTAHERMOSA 0.00 0.01 0.01 1.01_* 0.00 0.00
SUAREZ 0.00 0.04 0.04 1.01_* 0.00 0.01
TIMBIQUI 0.02 0.16 0.18_* 0.99_* 0.02 0.00
SAN VICENTE DEL CAGUAN 0.00 -0.03 -0.03 1.02_* 0.00 0.01_*
SAN JOSE DEL GUAVIARE 0.00 0.00 0.00 1.01_* 0.00 0.01_*
EL TAMBO 0.00 0.05 0.06 1.01_* 0.00 0.01_*
PUERTO CONCORDIA 0.06 0.01 0.07 0.99_* 0.00 0.00
GUAPI 0.03 0.21 0.24_* 0.98_* 0.03 0.00
SANTA BARBARA 0.13 0.10 0.20_* 0.94_* 0.02 0.00
LA MACARENA 0.07 0.04 0.09 0.99_* 0.00 0.00
EL CHARCO 0.00 -0.01 -0.01 1.02_* 0.00 0.02_*
LA TOLA 0.11 0.02 0.12 0.97_* 0.01 0.00
FRANCISCO PIZARRO 0.24 0.08 0.30_* 0.86_* 0.04 0.00
ARGELIA 0.00 0.19 0.20_* 1.00 0.02 0.01_*
ROBERTO PAYAN 0.08 0.19 0.24_* 0.96_* 0.03 0.00
EL DONCELLO 0.06 0.05 0.09 0.99_* 0.00 0.00
BALBOA 0.04 0.06 0.09 0.99_* 0.00 0.00
MAGUI 0.05 0.04 0.08 0.99_* 0.00 0.00
LEIVA 0.06 0.04 0.09 0.99_* 0.00 0.00
FLORENCIA 0.00 -0.02 -0.03 1.01_* 0.00 0.01_*
TUMACO 0.57 -2.10_* -2.10_* 1.19_* 2.17_* 0.18_*
CALAMAR 0.06 0.01 0.07 0.99_* 0.00 0.00
POLICARPA 0.00 -0.01 -0.01 1.01_* 0.00 0.00
46
EL PAUJIL 0.06 0.05 0.09 0.99_* 0.00 0.00
BARBACOAS 0.02 0.26 0.28_* 0.98_* 0.04 0.01_*
RICAURTE 0.11 0.11 0.19_* 0.96_* 0.02 0.00
CARTAGENA DEL CHAIRA 0.01 0.12 0.13_* 1.00 0.01 0.01_*
PUERTO GUZMAN 0.00 0.04 0.04 1.01_* 0.00 0.01_*
PUERTO CAICEDO 0.05 0.03 0.07 0.99_* 0.00 0.00
PUERTO ASIS 0.00 0.10 0.11 1.01_* 0.01 0.01_*
SAN MIGUEL 0.08 0.11 0.16_* 0.98_* 0.01 0.00
ZONA BANANERA 0.00 0.02 0.02 1.01_* 0.00 0.00
MUTATA 0.06 0.02 0.07 0.99_* 0.00 0.00
Cabe resaltar que estas poblaciones señaladas coinciden con las que Cantor (2011) e Ibañes & Vélez
(2008) señalan como ejes del desplazamiento forzado en Colombia.
La Figura 2.6 corresponde a los valores del coeficiente de correlación espacial local I de Morán para
el desplazamiento forzado. Los "puntos calientes"del mapa indican aquellas poblaciones donde el vo-
lumen de casos de desplazamiento forzado son significativamente diferentes de los centros poblados
vecinos.
Los resultados observados hasta el momento conllevan al planteamiento de modelos que permitan
explicar los factores que motivan el desplazamiento forzado. El mapa de la Figura 2.10b, presentado
anteriormente, mostraba la distribución espacial de las acciones bélicas o incursiones armadas del
periodo 2007 - 2016 y el mapa de la Figura 2.2a la distribución espacial del desplazamiento forzado.
Se observaban múltiples coincidencias de presencia de los dos sucesos en los mapas lo que sugiere
que es posible emplear la variable que describe las incursiones armadas como factor explicativo del
desplazamiento forzado.
En el apartado siguiente se analizarán varios modelos que permitan explicar el desplazamiento for-
zado como fenómeno espacial dependiente de los eventos de conflicto armado, específicamente, las
acciones bélicas o incursiones armadas registradas durante el mismo periodo.
Finalmente, la Figura 2.7 representa la posible influencia de las acciones bélicas sobre el desplaza-
miento forzado.
47
Figura 2.6: Mapa de Correlación Local (Coeficiente I de Moran)
48
2.3. Modelos Espaciales
Un primer enfoque empelado para analizar el desplazamiento forzado en el caso Colombia corres-
ponde a modelos espaciales. Se emplearán tres modelos:
El Modelo Autorregresivo Espacial (SAR por su nombre en inglés: “Spatial Auto Regressive
Model”
Ward & Gletisch (2008) y Zhukov (2010) expresan este modelo como:
y = ρWy
Wy +X
Xβ +ε (2.2)
para el caso de estudio, y representa el volumen de casos de desplazamiento forzado por centro pobla-
do; X la variable acciones bélicas registradas en cada centro poblado, ρ describe la autocorrelación
espacial y W la matriz de pesos espaciales. Los resultados obtenidos para este modelo son:
Call:
lagsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,
zero.policy = T, tol.solve = 1e-12)
Residuals:
Min 1Q Median 3Q Max
-32798.902 -625.144 -260.921 16.111 104563.801
Type: lag
Regions with no neighbours included:
908 1119 1120 1121
Coefficients: (numerical Hessian approximate standard errors)
Estimate Std. Error z value Pr(>|z|)
(Intercept) 260.9630 174.3136 1.4971 0.1344
ACC.BELIC 121.3348 5.4784 22.1480 <2e-16
49
Figura 2.8: Mapa Residuos SAR
Según se observa, el desplazamiento forzado obedece a eventos del conflicto armado como el caso
de las acciones bélicas o incursiones armadas. Además, con base en la evidencia es posible afirmar
que existe dependencia espacial en el caso del desplazamiento forzado (ρ = 0,23192; p − value =
1,698 × 10−10 ). El mapa de la Figura 2.8 muestra los residuos espaciales del modelo.
Con base en lo anterior, es necesario evaluar si el modelo SAR tiene la capacidad de describir toda la
dependencia espacial, para lo que se va a calcular el coeficiente de correlación espacial I de Morán
50
para los residuos:
data: res.sar
weights: col.W_cont_el_mat
Como se observa, aunque la autocorrrelación espacial es pequeña (I = 0,0673) los residuos del mode-
lo no describen patrones espaciales aleatorios. La presencia de dependencia espacial en los residuos
sugiere la posibilidad de sesgo por variables omitidas.
El modelo SAR estimado puede resumirse como en la Tabla 2.1. Las cifras entre paréntesis corres-
ponden al p-valor asociado a las pruebas de hipótesis de los parámetros del modelo.
SAR
(Intercept) 260.96 (0.1344)
ACC.BELIC 121.33 (<2e-16)
ρ 0.23192 (1.6981e-10)
AIC 22267.33
I de Moran (residuales) 0.06735
S.E. I de Moran 4.2919 (8.856e-06)
En el análisis exploratorio se identificaron tres poblaciones con un volumen alto de casos de desplaza-
miento (Medellín, Buenaventura y Tumaco) por lo que se estimó el efecto de equilibrio (incremento
del volumen de desplazados) en el caso que se duplicaran las acciones bélicas en estos municipios.
La tabla 2.2 muestra los nombres de las 10 poblaciones que presentarían mayor cambio hipotético en
el desplazamiento forzado dado una duplicación hipotética de las acciones bélicas en las poblaciones
de Medellín, Buenaventura y Tumaco.
51
Tabla 2.2: “Top 10” del Efecto Equilibro para el Modelo SAR
Los mapas de la Figura 2.10 describen el efecto equilibrio de las acciones bélicas sobre el desplaza-
miento forzado.
Uno de los principales problemas del modelo SAR es la posibilidad de sesgo por variables omitidas.
Los Modelos SEM y SDM incluyen en su estructura la dependencia espacial del error, por lo que
pueden presentar un mejor ajuste.
Call:
errorsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,
zero.policy = T, tol.solve = 1e-15)
Residuals:
Min 1Q Median 3Q Max
-38626.287 -599.305 -315.093 55.915 101584.104
Type: error
Regions with no neighbours included:
908 1119 1120 1121
Coefficients: (asymptotic standard errors)
Estimate Std. Error z value Pr(>|z|)
(Intercept) 558.4053 238.9992 2.3364 0.01947
ACC.BELIC 141.5640 5.8862 24.0500 < 2e-16
52
Figura 2.9: Histograma del Efecto Equilibrio Modelo SAR
53
Tabla 2.3: Resumen Modelos SAR y SEM
SAR SEM
(Intercept) 260.9630 (0.1344) 558.4053 (0.01947)
ACC.BELIC 121.3348 (<2e-16) 141.5640 (<2e-16)
ρ 0.23192 (1.6981e-10)
λ 0.38862 (<2.22e-16)
AIC 22267 22219
I de Moran (Residuales) 0.06735 -0.0157
S.E. I de Moran 4.2919 (8.856e-06) -0.93427 (0.8249)
Con un nivel de significancia α = 0,05 la evidencia sugiere que el modelo SEM estimado permite
explicar adecuadamente la interdependencia espacial de las variables. El coeficiente λ es positivo y
altamente significativo lo que indica dependencia espacial en los errores. El cálculo del coeficiente de
correlación I de Morán para los residuales del modelo obtuvo los siguientes resultados:
data: res.sem
weights: col.W_cont_el_mat
Los valores observados sugieren que el modelo SEM recoge adecuadamente toda la autocorrelación
espacial de las variables. El resumen del modelo SEM, y comparado con el SAR, se aprecia en la
Tabla 2.3. El mapa para los residuales del SEM se observa en la figura
Otro modelo a estimar para definir la interdependencia espacial de las variables es el SDM. Motivado
por lo concerniente al sesgo por variables omitidas este modelo incluye, ademas de la autocorrela-
ción espacial de la variable dependiente, los rezagos espaciales de las covariables. Los resultados de
estimación de este modelo para el caso de estudio se presentan a continuación:
54
Figura 2.11: Mapa Residuos SEM
55
Call:
lagsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,
type = "mixed", zero.policy = T, tol.solve = 1e-12)
Residuals:
Min 1Q Median 3Q Max
-40541.855 -726.443 -501.743 57.329 100926.047
Type: mixed
Regions with no neighbours included:
908 1119 1120 1121
Coefficients: (numerical Hessian approximate standard errors)
Estimate Std. Error z value Pr(>|z|)
(Intercept) 581.4218 171.5297 3.3896 0.0006999
ACC.BELIC 148.6759 6.3953 23.2478 < 2.2e-16
lag.ACC.BELIC -78.3992 10.1965 -7.6888 1.488e-14
data: res.sdm
weights: col.W_cont_el_mat
El resumen de los tres modelos (SAR, SEM y SDM) se presenta en la Tabla 2.4.
56
Tabla 2.4: Resumen Modelos SAR, SEM y SDM
57
2.4. Modelo Espacio-Temporal
En la Sección 1.3.5 se presentaron varios modelos espacio-temporales. El caso de los modelos STAR-
MA y STARIMA, como lo denotan las ecuaciones 1.87 y 1.88, suponen procesos espacio-temporales
univariados. El fenómeno de desplazamiento forzado, como se explicó en la sección 2.1, debe enten-
derse como un proceso de interdepencia espacial según lo plantean Ibáñez & Vélez (2008)4 . Por lo
anterior, en esta sección se desarrollara sólo el caso especial de modelo espacio temporal descrito en
la sección 1.3.2.
Al considerarse el desplazamiento forzado como una decisión no voluntaria se entiende que existen
otras variables que pueden llegar a influir en el proceso. EL algoritmo en R del paquete SpatioTem-
poral tiene algunos requerimientos especiales: incluir variables categóricas que permitan identificar
la existencia de efecto Nugget y variables adicionales diferentes a las covariables espacio-temporales.
Se observa que las observaciones espacio-temporales del desplazamiento forzado no siguen una dis-
tribución normal y la dependencia de las mismas observaciones con el área del municipio no está
definida de manera clara.
Antes de estimar el modelo se requiere identificar el número de funciones base del mismo para lo
4 ...el desplazamiento forzado es el resultado de un ataque violento y una decisión no voluntaria: Las familias huyen
para salvar sus vidas y proteger sus bienes... (Ibáñez & Vélez, 2008
58
Figura 2.13: Locaciones Espacio-Temporales de las observaciones divididas en Zonas, gráfica de
comprobación de cuantiles y dependencia de las observaciones con el Área del Municipio
cual se empleó el Error Cuadratico Medio (MSE); el coeficiente de determinación R2 y los criterios
de información de Akaike (AIC) y bayesiano (BIC):
Los valores observados sugieren que dos (2) funciones básicas son suficientes para estimar el modelo
espacio-temporal de interdependencia. La Figura 2.14 presenta un resumen gráfico de los resultados
anteriores.
El paso siguiente consiste en calcular los coeficientes β para las locaciones para luego realizar la
estimación del modelo espacio-temporal. Los resultados obtenidos se muestran a continuación:
59
Figura 2.14: Validación Cruzada de los resultados para las posibles funciones base
Con esto, se obtienen los coeficientes espaciales del modelo. Se procede a simular la respuesta de las
observaciones en función del área del municipio. La Figura 2.15 permite evaluar las funciones base
en función de la covariable Área del Municipio. Se observa una gran dispersión en varios puntos lo
60
Figura 2.15: Estimaciones de regresión de β1 (s) y β2 (s) en cada ubicación, con intervalos de confianza
del 95 %, en función del Área del municipio
que podría implicar dificultades para el cálculo de las funciones de covarianza y el efecto nugget.
Como tal, el proceso de computo supone dificultades debido a la presencia valores cero en múltiples
puntos para la covariable espacio-temporal (Acciones Bélicas). El resultado se presenta a continua-
ción:
61
At iterate 130 f = 15319 |proj g|= 2.7983
At iterate 140 f = 15319 |proj g|= 0.26712
iterations 144
function evaluations 187
segments explored during Cauchy searches 161
BFGS updates skipped 1
active bounds at final generalized Cauchy point 1
norm of the final projected gradient 0.0519789
final function value 15319.1
F = 15319.1
l(0) > u(0). No feasible solutionfinal value 15319.149208
converged
Error in solve.default(res[[i]]$hessian) :
Lapack routine dgesv: system is exactly singular: U[1,1] = 0
Existe un problema particular con los datos que está asociado a la covariable espacio-temporal: mul-
tiplicidad de valores cero debido a que no todas las localidades registraron acciones bélicas durante
el periodo de tiempo observado. Esta situación hace que el sistema de ecuaciones no tenga solución
debido a la singularidad por lo que el modelo, debido a la características de los datos, sólo posee
componente espacial.
En la sección 1.3.5 se presentó el modelo VAR como una alternativa para analizar un proceso espacio-
temporal; sin embargo, este modelo tiene como limitante que sólo es efectivo cuando se tienen pocas
unidades espaciales.
62
Un primer paso es identificar el número de rezagos distribuidos en las variables de interes; los resul-
tados se muestran a continuacion:
$selection
AIC(n) HQ(n) SC(n) FPE(n)
1 1 1 1
$criteria
1 2 3 4 5
AIC(n) 2.912416e+01 2.916772e+01 2.917865e+01 2.923036e+01 2.927449e+01
HQ(n) 2.918229e+01 2.926460e+01 2.931429e+01 2.940475e+01 2.948764e+01
SC(n) 2.926737e+01 2.940641e+01 2.951282e+01 2.966000e+01 2.979961e+01
FPE(n) 4.451145e+12 4.649722e+12 4.701746e+12 4.952942e+12 5.179174e+12
Según se observa, todos los criterios apuntan a que el número máximo de rezagos para la ecuación es uno (1).
Con este parámetro fijado se procede a estimar el modelo. Los resultados son los siguientes:
63
Estimate Std. Error t value Pr(>|t|)
Desplazamiento.l1 6.531e-04 2.841e-03 0.230 0.819
Acciones.Belicas.l1 1.017e-03 9.284e-02 0.011 0.991
const 9.338e+01 6.866e+01 1.360 0.176
Según se observa, el desplazamiento forzado responde al estímulo inmediato de las acciones bélicas y al efecto
de la misma variable en su primer rezago. El efecto espacio-temporal de la covariable fue analizado en el
apartado anterior y la relación descrita por el modelo VAR es mejor explicado a través de los modelos de
interdependencia espacial presentados en la sección 2.3. Por lo tanto, se descarta el modelo VAR para el análisis
del desplazamiento forzado y su relación con la variable acciones bélicas.
64
Capítulo 3
Conclusiones
El principal objetivo de este trabajo ha sido modelar el fenómeno de desplazamiento forzado a la luz de los
evento de conflicto armado en Colombia registrados durante el periodo enero de 2007 - diciembre 2016, para
lo cual se recurrió a la implementación de modelos espaciales y modelos espacio-temporales.
En general se tiene:
Por definición, el fenómeno de desplazamiento forzado no puede considerarse un proceso univariado por
lo que los modelos STARMA y STARIMA no son adecuados en este caso.
Es recomendable considerar entes territoriales mayores (departamentos o distritos) para evitar la singu-
laridad del proceso.
Se requiere realizar un estudio a más profundidad que permita incorporar otras variables de evento de
conflicto armado y variables de carácter socio-económico para definir mejor el fenómeno.
Se requiere desarrollar algoritmos que permitan incorporar observaciones ausentes y múltiples covaria-
bles espacio-temporales.
65
Bibliografía
1. Agencia EFE. (17 de septiembre de 2016). Cinco líderes en cinco décadas de las Farc. Obtenido de El
Heraldo: https://www.elheraldo.co/politica/cinco-lideres-en-cinco-decadas-de-las-farc-285794
2. Arnold, J. (2017). ggthemes: Extra Themes, Scales and Geoms for ’ggplot2’. R package version 3.4.0.
https://CRAN.R-project.org/package=ggthemes
3. Bivand, R. (2017). classInt: Choose Univariate Class Intervals. R package version 0.1-24. https://CRAN.R-
project.org/package=classInt
4. Bivand, R. & Lewin-Koh, N. (2017). maptools: Tools for Reading and Handling Spatial Objects. R
package version 0.9-2. https://CRAN.R-project.org/package=maptools
5. Bivand, R. & Piras, G. (2015). Comparing Implementations of Estimation Methods for Spatial Econo-
metrics. Journal of Statistical Software, 63(18), 1-36. URL http://www.jstatsoft.org/v63/i18/.
6. Bivand, R., Hauke, J., & Kossowski, T. (2013). Computing the Jacobian in Gaussian spatial autoregres-
sive models: An illustrated comparison of available methods. Geographical Analysis, 45(2), 150-179.
7. Bivand, R., Keitt, T. & Rowlingson, B. (2017). rgdal: Bindings for the Geospatial Data Abstraction
Library. R package version 1.2-7. https://CRAN.R-project.org/package=rgdal
8. Burrough, P. McDonnell, R. & Lloyd, C. (2015). Principles of Geographical Information Systems. Ox-
ford University Press, Oxford.
9. Cantor, D. J. (2011). The colombian guerrilla, forced displacement and return. Forced Migration Review,
(37), 20-22. Recuperado de: https://search.proquest.com/docview/ 869631540?accountid=29068
10. Cheng, T., Wang, J., & Li, X. (2011). A Hybrid Framework for Space–Time Modeling of Environmental
Data. Geographical Analysis, 43, 188-2010.
11. Cheysson, F. (2016). starma: Modelling Space Time AutoRegressive Moving Average (STARMA) Pro-
cesses. R package version 1.3. https://CRAN.R-project.org/package=starma
12. Cressie, N. & Wikle, C.K. (2011). Statistics for Spatio-Temporal Data. Wiley Series in Probability and
Statistics.Wiley, New York.
13. De Oliveira, V. (2006). On Optimal Point and Block Prediction in Log-Gaussian Random Fields, Scan-
dinavian Journal of Statistics, 33, 523–540.
14. Diggle, P. (2014). Statistical Analysis of Spatial and Spatio-Temporal Points patterns. Taylor & Francis
Group. Boca Ratón.
15. Gelfand, A., Diggle, P., Fuentes, M. & Guttorp, P. (2010). Handbook of Spatial Statistics. Boca Ratón:
Taylor & Francis Group.
16. Gneiting, T., Genton, M. & Guttorp, P. (2007). Geostatistical Space-Time Models, Stationarity, Sepa-
rability and Full Symmetry. En Finkenstädt, B., Held, L. and Isham, V. (Eds.), Statistical Methods for
Spatio-Temporal Systems, Chapman & Hall, Boca Raton, FL, pp. 151–175. .
66
17. Gneiting, T. & Guttorp, P. (2010). Continuous parameter Spatio-Temporal Processes. En A. Gelfand, P.
Diggle, M. Fuentes, & P. Guttorp, Handbook of Spatial Statistics (págs. 427-436). Boca Ratón: Taylor
& Francis Group.
18. Greenberg, J. & Mattiuzzi, M (2015). gdalUtils: Wrappers for the Geospatial Data Abstraction Library
(GDAL) Utilities. R package version 2.0.1.7. https://CRAN.R-project.org/package=gdalUtils
19. Güting, R. & Schneider, M. (2005). Moving Objects Databases. Morgan Kaufmann.
20. Hijmans, R. (2016a). Introduction to the ’raster’ package (version 2.5-8). https://CRAN.R-project.org/package=raster
21. Hijmans, R. (2016b). Raster: Geographic Data Analysis and Modeling. R package version 2.5-8. https://cran.r-
project.org/web/packages/raster/vignettes/Raster.pdf
22. Huisman, O & A. de By, R. (2009). Principles of Geographic Information System. An Introductory
Textbook. The International Institute for Geo-Information Science and Earth Observation (ITC), The
Netherlands.
23. Ibañez, A. M., & Velez, C. E. (2008). Civil Conflict and Forced Migration: The Micro Determinants and
Welfare Losses of Displacement in Colombia. World Development, 36(4), 659-676.
24. Kurt, S., & Tunay, B. (2015). STARMA Models Estimation with Kalman Filter: The Case of Regional
Bank Deposits. Procedia - Social and Behavioral Sciences, 2537-2547.
25. Lee, D., Rushworth, A. & Napier, G. (2017). CARBayesST: Spatio-Temporal Generalised Linear Mi-
xed Models for Areal Unit Data. R package version 2.5. https://CRAN.R-project.org/package =CARBa-
yesST
26. Lindstrom, J. & Bergen, S. (2013a). Comprehensive Tutorial for the Spatio-Temporal R-package. R
package version 1.1.7. https://CRAN.R-project.org/package =SpatioTemporal
27. Lindstrom, J., Szpiro, A., Sampson, P., Bergen, S. & Oron, A. (2013b). SpatioTemporal: Spatio-Temporal
Model Estimation. R package version 1.1.7. https://CRAN.R-project.org/package =SpatioTemporal
28. Lindstrom, J., Szpiro, A., Sampson, P., Bergen, S. & Sheppard, L. (2013c). SpatioTemporal: An R
Package for Spatio-Temporal Modelling of Air-Pollution. R package version 1.1.7. https://CRAN.R-
project.org/package =SpatioTemporal
29. Mantilla, C. (2015). Factorial Analysis for Forced Migration in Colombia. International Statistical Insti-
tute (ISI) - 60th World Statistics Congreee - ISI2015. Recuperado de: http://www.isi2015.org
30. Moreno, R. & Vayá. E. (2000). Ténicas econométricas para el tratamiento de datos espaciales : la
econometría espacial. Universitat de Barcelona, Barcelona.
31. Paradis, E. (2017). Moran’s Autocorrelation Coefficient in Comparative Methods. Recuperado de: https://cran.r-
project.org/web/packages/ape/vignettes/
32. Pebesma, E. (2012). Spacetime: Spatio-Temporal Data in R. In: Journal of Statistical Software 51.7, pp.
1–30. ISSN: 1548-7660. http://www.jstatsoft.org/v51/i07.
33. Perpiñán, O. (2014). Displaying Time Series, Spatial, and Space-Time Data with R. Taylor & Francis
Group. Boca Ratón.
35. Pfeifer, P., & Deutsch, S. (1980). A STARIMA model-building procedure with application to description
and regional forecasting. Transactions of the Institute of British Geographers, 5(3), 330-349.
36. Rui, C & De Oliveira, V (2008). Point and Block Prediction in Log-Gaussian Random Fields: The Non-
Constant Mean case, Journal of Statistical Planning and Inference, 138, 2128-2142.
67
37. Ryan, J. & Ulrich, J. (2014). xts: eXtensible Time Series. R package version 0.9-7. https://CRAN.R-
project.org/package=xts
38. Sherman, M. (2011). Spatial Statistics ans Spatio-Temporal Data. Covariance Functions and Directional
Properties. John Wiley & Sons, Ltd. United Kingdom
39. Tennekes, M. (2017). tmap: Thematic Maps. R package version 1.10. https://CRAN.R-project.org/ pac-
kage=tmap
40. Unidad de Manejo y Análisis de Información de Colombia. (2017). Sistema Integrado de Información
Humanitaria. Obtenido de https://sidi.umaic.org
41. Ward, M. & Gleditsch, KS. (2007). An Introduction to Spatial Regression Models in the Social Sciences.
SAGE Publications, Inc. California.
42. Ward, M. & Gleditsch, KS. (2007). Spatial Regression Models. SAGE Publications, Inc. California.
43. Wickham, H. (2007). Reshaping Data with the reshape Package. Journal of Statistical Software, 21(12),
1-20. URL http://www.jstatsoft.org/v21/i12/.
44. Wickham, H. & Francois, R. (2016). dplyr: A Grammar of Data Manipulation. R package version 0.5.0.
https://CRAN.R-project.org/package=dplyr
45. Wickham, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2009.
46. Zeileis, A. & Grothendieck, G. (2005). zoo: S3 Infrastructure for Regular and Irregular Time Series.
Journal of Statistical Software, 14(6), 1-27. doi:10.18637/jss.v014.i06
47. Zimmerman, D. & Stein, M. (2010). Classical geostatistical Methods. En A. Gelfand, P. Diggle, M.
Fuentes, & P. Guttorp, Handbook of Spatial Statistics (págs. 427-436). Boca Ratón: Taylor & Francis
Group.
48. Zhou, M. & Buongiorno, J. (2006). Space-Time Modeling of Timber Prices. Journal of Agricultural and
Resource Economics, 31(1), 40-56
49. Zhou, X & Lin. H. (2008). Geary’s C. En: Shekhar, S & Xiong. H, Encyclopedia of GIS (págs. 329-330),
Springer US.
50. Zhukov, Y. (2010). Applied Spatial Statistics in R. Recuperado de: http://scholar.harvard.edu/ zhukov/classes/appliedsp
- statistics-r.
51. Zivot, E. & Wang, J. (2006). Modeling Financial Time Series With S-PLUS
.
R Springer. New York.
68
Anexos
#######################################
#### DATOS ###
#######################################
rm(list=ls(all=TRUE))
ls()
save(list=ls(all=TRUE),file="base.RData")
load("base1.RData")
#######################################
#### LIBRERIAS BASICAS ###
#######################################
install.packages("rgdal")
install.packages("spdep")
install.packages("maptools")
install.packages("classInt")
install.packages("tmap")
install.packages("dplyr")
install.packages("xts")
install.packages("ggthemes")
install.packages("rasterVis")
install.packages("spatstat")
install.packages("pgirmess")
install.packages("spgwr")
library(rgdal)
library(spdep)
library(maptools)
library(classInt)
library(dplyr)
library(tmap)
library(raster)
library(zoo)
library(rasterVis)
library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)
library(SpatioTemporal)
69
library(plotrix)
library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)
library(maps) ## Projections
library(maptools) ## Data management
library(sp) ## Data management
library(spdep) ## Spatial autocorrelation
library(gstat) ## Geostatistics
library(splancs) ## Kernel Density
library(spatstat) ## Geostatistics
library(pgirmess) ## Spatial autocorrelation
library(RColorBrewer) ## Visualization
library(classInt) ## Class intervals
library(spgwr) ## GWR
#######################################
#### MAPAS ###
#######################################
#### LIBRERIAS
library(rgdal)
library(spdep)
library(maptools)
library(classInt)
library(dplyr)
library(tmap)
#######################################
##### CAPTURA DE DATOS #####
#######################################
######## SERIE DESPLAZADOS
datos<-read.table("conflicto.txt",header = T, sep="\t",dec=",",
colClasses = c("numeric", "numeric", "character", "character", "numeric", "character", "charact
despl<-datos
summary(despl)
str(despl)
despl<-despl
despl$PERIODO<-as.Date(despl$FINAL, origin = "1899-12-30")
despl$MPIOS<-despl$CODIGO.MUNICIPIO
str(despl)
summary(despl)
70
plot(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl),type=’l’,lwd=2,cex=1.5)
library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)
plt.despl<-ggplot(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl),aes(PERIODO, DESPLAZADOS))
###############
### SERIE GENERAL
win.graph(10,6,6)
plt.despl + geom_line(size=1) +
geom_point(size=(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl)$DESPLAZADOS)/10000,col="red",shap
scale_x_date(date_labels = "%b %Y",date_breaks = "3 month")+
xlab("Mes. A~no") + ylab("Total Desplazados") + theme_light()+
theme(axis.text.x = element_text(hjust = 1,size=8,angle=90,vjust=1.5))+
ggtitle("Vı́ctimas de Desplazamiento Forzado en Colombia \n enero 2007 - diciembre 2016")
despl1$MPIOS<-as.factor(despl1$MPIOS)
despl$PERIODO<-factor(despl$PERIODO)
despl1<-despl[,c(5,7,8)]
despl1$MPIOS<-as.factor(despl1$MPIOS);str(despl1)
colb2<-col.mpios
head(left_join(colb2@data, despl1))
colb2@data <- left_join(colb2@data, despl.tot)
colb2$DESPLAZADOS[is.na(colb2$DESPLAZADOS)] <- 0
colb2$DESPLAZADOS[is.na(colb2$DESPLAZADOS)] <- 0
colb2@data<-colb2@data[,c(5:8,11,16:17)]
split(colb2@data,colb2$PERIODO)
71
col.mpios$DESPLAZADOS[is.na(col.mpios$DESPLAZADOS)] <- 0
par(mar=rep(0,4))
plot(colb2,border="gray")
plot(col.W_cont_el_mat,coords=col.map_crd,pch=19, cex=0.1, add=T)
dev.off()
dev.off()
win.graph(10,6,12)
moran.plot(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T,
xlim=c(-0.3,125000),ylim=c(-0.3,35500), pch=16, col="black",cex=.5,
quiet=F, labels=as.character(colb2$MPIOS),xlab="Desplazados",
ylab="Desplazados (Spatial Lag)", main="Moran Scatterplot")
win.graph(10,6,12)
moran.plot(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T,
xlim=c(-0.3,125000),ylim=c(-0.3,35500), pch=16, col="black",cex=1,
quiet=F, labels=as.character(colb2$NOMBRE_MPI),xlab="Desplazados",
ylab="Desplazados (Spatial Lag)", main="Moran Scatterplot")
desene2007<-despl[despl$PERIODO=="2007-01-31",]
desene2007<-desene2007[,-1];str(desene2007)
desene2007<-desene2007[,c(4,7)];str(desene2007)
desene2007<-na.omit(desene2007)
72
col.mpios$MPIOS[!col.mpios$MPIOS %in% desene2007$MPIOS]
desene2007$MPIOS[!desene2007$MPIOS %in% col.mpios$MPIOS]
head(left_join(col.mpios@data, desene2007))
colb2@data <- left_join(colb2@data, desene2007)
desplazados<-eventosconflicto;rm(eventosconflicto);head(desplazados,1)
class(desplazados)
desplazados@data
###############################
########### SERIES
###############################
serie<-read.delim("clipboard",header=T)
ts.series<-ts(serie,start=c(2007,1),freq=12)
win.graph(10,6,10)
ts.plot(ts.series,lty=c(1:length(serie[,1])))
acum<-read.delim("clipboard",header=T)
acum.ts<-ts(acum,start=c(2007,1),freq=12)
library(ggplot2)
library(ggfortify)
library(dlm)
autoplot(acum.ts)
library(plotly)
library(plyr)
install.packages("plotly")
73
# plotting reference lines across each facet:
###
indiv<-read.delim("clipboard",header=T)
indiv.ts<-ts(indiv,start=c(2007,1),freq=12)
zp2
#######################################
datos.acciones<-read.table("acciones.txt",header = T, sep="\t",dec=",",
colClasses = c("numeric", "numeric", "character", "character", "numeric", "character", "charact
acciones<-datos.acciones
summary(acciones)
str(acciones)
74
accion<-acciones
accion$PERIODO<-as.Date(accion$FINAL, origin = "1899-12-30")
accion$MPIOS<-accion$CODIGO.MUNICIPIO
str(accion)
summary(accion)
plot(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion),type=’l’,lwd=2,cex=1.5)
library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)
plt.accion<-ggplot(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion),aes(PERIODO, ACC.BELIC))
################################
win.graph(10,6,6)
plt.accion + geom_line(size=1) +
geom_point(size=(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion)$ACC.BELIC)/10000,col="red",shape=1
scale_x_date(date_labels = "%b %Y",date_breaks = "3 month")+
xlab("Mes. A~
no") + ylab("Total Desplazados") + theme_light()+
theme(axis.text.x = element_text(hjust = 1,size=8,angle=90,vjust=1.5))+
ggtitle("Acciones Bélicas en Colombia \n enero 2007 - diciembre 2016")
accion$MPIOS<-as.factor(accion$MPIOS)
accion$PERIODO<-factor(accion$PERIODO)
accion1<-accion[,c(5,7,8)]
accion1$MPIOS<-as.factor(accion1$MPIOS);str(accion1)
colb2<-col.mpios
head(left_join(colb2@data, accion.tot))
colb2@data <- left_join(colb2@data, accion.tot)
colb2$ACC.BELIC[is.na(colb2$ACC.BELIC)] <- 0
colb2$ACC.BELIC[is.na(colb2$ACC.BELIC)] <- 0
colb2@data<-colb2@data[,c(5:8,11,16:17)]
split(colb2@data,colb2$PERIODO)
75
qtm(colb2[colb2$DPTO=="05",], "ACC.BELIC", fill.title="ACCIONES BÉLICAS",
title = "DEPARTAMENTO DE ANTIOQUIA")
qtm(colb2[colb2$DPTO=="52",], "ACC.BELIC", fill.title="ACCIONES BÉLICAS",
title = "DEPARTAMENTO DE NARI~
NO")
qtm(colb2[colb2$DPTO=="76",], "ACC.BELIC", fill.title="ACCIONES BÉLICAS",
title = "DEPARTAMENTO DE VALLE DEL CAUCA")
##################################################
serie.a<-read.delim("clipboard",header=T)
ts.series.a<-ts(serie.a,start=c(2007,1),freq=12)
win.graph(10,6,10)
ts.plot(ts.series.a,lty=c(1:length(serie.a[,1])))
acum.a<-read.delim("clipboard",header=T)
acum.ts.a<-ts(acum.a,start=c(2007,1),freq=12)
library(ggplot2)
library(ggfortify)
library(dlm)
win.graph(6,10,12)
autoplot(acum.ts)+theme_light()+ ggtitle("SERIE ACUMULADA DESPLAZAMIENTO")
win.graph(6,10,12)
autoplot(acum.ts.a)+theme_light() + ggtitle("SERIE ACUMULADA ACCIONES BÉLICAS")
library(plotly)
library(plyr)
install.packages("plotly")
76
colour = "GRAY", alpha = 1/2, size = 1/2)
zp.a <- zp.a + geom_line(size = 1) # Drawing the "overlayer"
zp.a <- zp.a + facet_wrap(~ Month)
zp.a <- zp.a + theme_bw()
indiv.a<-read.delim("clipboard",header=T)
indiv.ts.a<-ts(indiv.a,start=c(2007,1),freq=12)
#######################################
#######################################
#######################################
#######MODELOS ########################
#######################################
#######################################
#######################################
########## VARIOGRAMA
#######################################
library(gstat)
library(sp)
library(nlme)
win.graph(10,6,10)
plot(variogram(ACC.BELIC~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA ACCIONES
plot(variogram(DESPLAZADOS~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA DESPLAZ
plot(variogram(res.sar~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA RESIDUALES
77
win.graph(10,6,10)
ggplot(data.frame(acciones.b=colb2@data$ACC.BELIC,
desplaz.t=colb2@data$DESPLAZADOS,munip=colb2@data$HECTARES),
aes(x=acciones.b,y=desplaz.t,col=munip))+ theme(legend.position="top")+
geom_point(aes(size=colb2@data$HECTARES))+theme_light()+
guides(col=FALSE, size = FALSE)+ scale_y_continuous(limits=c(0,150000))+
labs(x="Acciones Bélicas", y="Desplazamiento Forzado")
########
## SAR Model (WARNING: This takes a while to run)
########
win.graph(8,8,10)
par(mar=rep(0,4))
plot(colb2,col=cols, border="grey",pretty=T)
legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),tit
dev.off()
## Residual Autocorrelation
########
## SEM Model (WARNING: This takes a while to run)
########
78
classes_fx <- classIntervals(res.sem, n=5, style="fixed", fixedBreaks=c(-.2,-.1,0,.1,.2,.4), rt
cols <- findColours(classes_fx,pal)
win.graph(8,8,10)
par(mar=rep(0,4))
plot(colb2,col=cols, border="grey",pretty=T)
legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),tit
dev.off()
## Residual Autocorrelation
########
## SDM Model (WARNING: This takes a while to run)
########
par(mar=rep(0,4))
plot(colb2,col=cols, border="grey",pretty=T)
legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),tit
dev.off()
## Residual Autocorrelation
#################################################################
#######################CORRELACION###############################
#################################################################
with(colb2@data, plot(NOMBRE_DPT,DESPLAZADOS))
data.col<-colb2@data
ggplot(data.col, aes(x=NOMBRE_DPT,y=DESPLAZADOS))+geom_boxplot()+
geom_jitter()
win.graph(10,5,12)
ggplot(data.col, aes(x=ACC.BELIC,y=DESPLAZADOS))+ theme_light()+
geom_point(aes(size = HECTARES),shape=1, col = "Orange")+
79
labs(y="Volumen de Desplazados",size="Áreas de los\nMunicipios",
x="Eventos de Conflicto: Acciones Bélicas")+
scale_x_continuous(labels = scales::comma)+
scale_y_continuous(labels = scales::comma)
I <- matrix(0,nrow=nrow(colb2@data),ncol=nrow(colb2@data))
diag(I) <- 1
X0 <- cbind(colb2@data$ACC.BELIC)
X1 <- cbind(colb2@data$ACC.BELIC)
X1[c(378,827,976)] <- 2*X1[c(378,827,976)] # Medellin, Tumaco, Buenaventura
Xd <- X1-X0
par(mar=rep(0,4))
plot(colb2,col=colsEEsar, border="grey",pretty=T)
legend(x="bottomleft",cex=1,fill=attr(colsEEsar,"palette"),
bty="n",legend=names(attr(colsEEsar, "table")),
title="Equilibrium Effect over Forced Migrations",ncol=1)
80
palAccBel <- paletteAccBel(5)
classes_fxAccBel <- classIntervals(colb2@data$ACC.BELIC, n=5, style="fixed",
fixedBreaks=c(0,10,50,100,200,418), rtimes = 1)
colsAccBel <- findColours(classes_fxAccBel,palAccBel)
par(mar=rep(0,4))
plot(colb2,col=colsAccBel, border="grey",pretty=T)
legend(x="bottomleft",cex=1,fill=attr(colsAccBel,"palette"),
bty="n",legend=names(attr(colsAccBel, "table")),
title="Armed Incursions",ncol=1)
###############################################
###############################################
###############################################
#### MODELOS ESPACIO - TEMPORALES #########
###############################################
###############################################
###############################################
library(readxl)
despl2<-as.data.frame(desplazados2)
head(despl2)
row.names(despl2)<-despl2$MPIOS
despl2<-despl2[,-1]
head(despl2)
fenomObs<-as.matrix(t(despl2))
str(fenomObs)
fenomObs[is.na(fenomObs)]<-0
acc2<-as.data.frame(eventosconflicto)
head(acc2)
row.names(acc2)<-acc2$MPIOS
81
acc2<-acc2[,-1]
head(acc2)
fenomLax<-as.matrix(t(acc2))
str(fenomLax)
library(SpatioTemporal)
library(plotrix)
library(maps)
fenom.data<-createSTdata(obs=fenomObs, covars=fenomX,
SpatioTemporal=list(accx=fenomLax))
str(fenom.data)
win.graph(10,8,12)
layout(matrix(c(1,2,1,3), 2, 2))
par(mar=c(2.3,3.3,2,1), mgp=c(2,1,0))
plot(fenom.data, "loc", main="Occurrence of Observations", xlab="",
ylab="Location", col=c("black", "red"), legend.loc=NULL)
par(mar=c(3.3,3.3,2,1))
qqnorm(fenom.data, line=1)
scatterPlot(fenom.data, covar="AREA", xlab="Area",
ylab="Forced Migrations", pch=19, cex=.25,
smooth.args=list(span=4/5,degree=2))
D<-createDataMatrix(fenom.data)
SVD.cv<-SVDsmoothCV(D, 0:4)
print(SVD.cv)
plot(SVD.cv)
win.graph(10,6,10)
for(i in 1:length(fenom.data.cv)){
suppressMessages(fenom.data.cv[[i]] <- updateTrend(fenom.data,
fnc=smooth.trend$trend.fnc.cv[[i]]))
}
plot(fenom.data, main="Possible Temporal Trends",
xlab="", ylab="Forced Migrations", pch=c(19,NA), cex=.25)
for(i in 1:length(fenom.data.cv)){
plot(fenom.data.cv[[i]], add=TRUE, col=i, pch=NA, lty=c(NA,2))
}
par(mar=c(3.3,3.3,1.5,1), mgp=c(2,1,0))
layout(matrix(c(1,1,2,2,3,4), 3, 2, byrow=TRUE))
plot(fenom.data, "obs", ID="76109",
xlab="", ylab="Forced Migrations",
82
main="Temporal Trend in Buenaventura")
plot(fenom.data, "res", ID="76109",
xlab="", ylab="Forced Migrations",
main="Residuals in Buenaventura")
plot(na.omit(fenom.data), "acf", ID="76109")
plot(fenom.data, "acf", ID="76109")
fenom.data$covars$x<-fenom.data$covars$lon+1
fenom.data$covars$y<-fenom.data$covars$lat+1
#######
# mod VAR
#######
83
ls()
indiv
indiv.a<-read.delim("clipboard",header=T,)
names(indiv.a)<-"Acciones.Belicas"
names(indiv)<-"Desplazamiento"
fenom<-data.frame(indiv,indiv.a)
fenom.ts<-ts(fenom,,start=c(2007,1),freq=12)
fenom.ts
library(vars)
save(list=ls(all=TRUE),file="base1.RData")
84