Está en la página 1de 86

TRABAJO FIN DE MÁSTER

MÁSTER EN ESTADÍSTICA APLICADA

Modelamiento de Datos Espaciales y Datos


Espacio-Temporales

Análisis Espacial y Espacio-Temporal del Desplazamiento Forzado

Autor
Carlos Alfonso Mantilla Duarte (alumno)

Director
José Miguel Angulo Ibáñez (tutor)

M ÁSTER EN E STADÍSTICA A PLICADA


FACULTAD DE C IENCIAS U NIVERSIDAD DE G RANADA
Granada, septiembre de 2017
Modelamiento de Espaciales y Datos
Espacio-Temporales

Análisis Espacial y Espacio-Temporal del Desplazamiento Forzado

Autor
Carlos Alfonso Mantilla Duarte (alumno)

Directores
José Miguel Angulo Ibáñez (tutor)
Modelamiento de Datos Espaciales y Datos Espacio-Temporales: Análisis
Espacial y Espacio-Temporal del Desplazamiento Forzado
Carlos Alfonso Mantilla Duarte (alumno)

Palabras clave: Modelos Espaciales, Modelos Espacio-Temporales, Desplazamiento Forzado, Con-


flicto Armado, Colombia

Resumen

Estimaciones recientes sugieren que cerca de 4.9 millones de colombianos han sido desplazados in-
ternamente como resultado del prolongado conflicto armado y la violencia política asociada que en-
vuelve al Estado y los grupos armados al margen de la ley.

Gran parte de ese desplazamiento forzado en los últimos años es el resultado directo o indirecto de
las ofensivas militares de contraguerrilla por parte de los organismos del Estado y de la disputa por el
control de las zonas rurales, que históricamente han tenido presencia guerrillera, entre paramilitares
y guerrilla.

El presente documento busca realizar un modelamiento estadístico del desplazamiento forzado en


Colombia siempre que este fenómeno se entienda como un proceso espacial o un proceso espacio-
temporal.

La primera parte hace una revisión teórica de los elementos que permiten entender porqué se va a mo-
delar el fenómeno de desplazamiento forzado como un proceso espacial y, posteriormente, espacio-
temporal. Se comienza con una descripción de lo que son los Sistemas de Información Geográfica
que, para el estudio de caso, permiten definir los entes territoriales que son objeto de análisis.

Posteriormente, se realiza la definición de datos espaciales, sus características, tipos y formas de re-
gistro y visualización y las distintas funciones que describen un proceso espacial y se termina este
apartado con una descripción de algunos modelos de interdependencia espacial. En la siguiente sec-
ción se hace una descripción similar para el caso de los datos espacio-temporales.

En el segundo capítulo se realiza el estudio de caso: Desplazamiento Forzado en Colombia, periodo


2007 - 2016. En primera instancia se estiman los modelos de interdependencia espacial: SAR,SEM y
SDM. Posteriormente se construye un modelo espacio-temporal para un proceso Gaussiano debido a
las características del fenómeno de desplazamiento forzado; luego se estima un modelo VAR.

En el capítulo final se presentan las conclusiones: los modelos SAR, SEM Y SDM son efectivos al
momento de explicar el fenómeno de desplazamiento forzado. Los modelos espacio-temporales no
son efectivos en el caso de estudio. Finalmente, se presenta la bibliografía relacionada. Se presenta
como anexo el código empleado en R.
Índice general

1. Marco Teórico 6
1.1. Sistemas de Información Geográfica (SIG) . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1. ¿Qué son los SIG? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2. Características de los SIG . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2. Datos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1. Evaluación del Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2. Estimación Óptima (Kriging) . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3. Estimación Empírica del Variograma y la Función de Covarianza . . . . . . 18
1.2.4. Modelización del Semivariograma . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.5. Modelos de Interdependencia Espacial . . . . . . . . . . . . . . . . . . . . . 21
1.3. Datos Espacio - Temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.1. Características de los Datos Espacio-Temporales . . . . . . . . . . . . . . . 27
1.3.2. Procesos Espacio-Temporales . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.3.3. Estacionariedad y Estimadores Espacio-Temporales . . . . . . . . . . . . . . 32
1.3.4. Propiedades de la Función de Covarianza Espacio - Temporal . . . . . . . . 33
1.3.5. Modelos Espacio - Temporales . . . . . . . . . . . . . . . . . . . . . . . . . 33

2. Estudio de Caso: Desplazamiento Forzado en Colombia, Análisis Espacial y Espacio-


Temporal 39
2.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2. Análisis Exploratorio de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.3. Modelos Espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.1. Modelo SAR: Spatial Auto Regresive . . . . . . . . . . . . . . . . . . . . . 49
2.3.2. Modelo SEM: Spatial Error Model . . . . . . . . . . . . . . . . . . . . . . . 52

2
2.3.3. Modelo SDM: Spatial Durbin Model . . . . . . . . . . . . . . . . . . . . . 54
2.4. Modelo Espacio-Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.4.1. Modelo de Interdepencia Espacio-Temporal . . . . . . . . . . . . . . . . . . 58
2.4.2. Modelo VAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3. Conclusiones 65

3
Índice de figuras

1.1. Ejemplo de Capas o Coberturas (layers) con información sobre la calidad del aire en
Madrid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2. Ejemplo de Capas Tipo Raster tomado de Hijmans (2016a) . . . . . . . . . . . . . . 8
1.3. Descripción de Estacionariedad: dos vectores con idénticos rezagos (Sherman, 2011) 18
1.4. Representación Gráfica de los Modelos para Semivariograma . . . . . . . . . . . . . 22
1.5. Representación Gráfica de los Modelos para Covarianza . . . . . . . . . . . . . . . 22
1.6. Ejemplificación de los casos de objetos espacio-temporales identificados por Pebesma
(2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1. Total de Víctimas del Desplazamiento Forzado en Colombia (1 de enero de 2007 - 31


de diciembre de 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2. Mapa de Variables de Conflicto Armado: Desplazamiento Forzado y Acciones Béli-
cas. Total acumulado 2007 - 2016 . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.3. Total Mensual Víctimas de Desplazamiento Forzado en Colombia (enero 2007 - di-
ciembre 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.4. Total Acumulado Mensual Víctimas Desplazamiento Forzado en Colombia (enero
2007 - diciembre 2016) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.5. Gráfica de Dispersión - I de Morán para Desplazamiento Forzado . . . . . . . . . . . 45
2.6. Mapa de Correlación Local (Coeficiente I de Moran) . . . . . . . . . . . . . . . . . 48
2.7. Gráfica de Dispersión Acciones Bélicas y Desplazamiento Forzado . . . . . . . . . . 48
2.8. Mapa Residuos SAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.9. Histograma del Efecto Equilibrio Modelo SAR . . . . . . . . . . . . . . . . . . . . 53
2.10. Efecto Equilibrio Modelo SAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.11. Mapa Residuos SEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4
2.12. Mapa Residuos Modelo SDM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.13. Locaciones Espacio-Temporales de las observaciones divididas en Zonas, gráfica de
comprobación de cuantiles y dependencia de las observaciones con el Área del Mu-
nicipio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.14. Validación Cruzada de los resultados para las posibles funciones base . . . . . . . . 60
2.15. Estimaciones de regresión de β1 (s) y β2 (s) en cada ubicación, con intervalos de con-
fianza del 95 %, en función del Área del municipio . . . . . . . . . . . . . . . . . . 61

5
Capítulo 1

Marco Teórico

1.1. Sistemas de Información Geográfica (SIG)

1.1.1. ¿Qué son los SIG?

Tradicionalmente, el almacenamiento y el análisis de los datos espaciales se ha hecho mediante los


Sistemas de Información Geográfica - SIG (comúnmente llamados GIS por su nombre en inglés:
Geographical Information Systems). Según Burrough, McDonnell & Lloyd (2015) un GIS es: “... una
poderoso conjunto de herramientas para recolectar, almacenar, recuperar a voluntad, transformar y
mostrar datos espaciales del mundo real...”

Por su parte, Huisman & A. de By (2009) definen un SIG como “...un sistema de base computacional
que provee el siguiente conjunto de capacidades para manipular datos georreferenciados”:

1. Captura y preparación de datos

2. Manejo de datos, incluyendo almacenamiento y mantenimiento

3. Manipulación y análisis de datos

4. Presentación de datos

Lo anterior implica que los usuarios de un SIG pueden introducir datos (georreferenciados) al sistema,
analizarlos por varios métodos y generar una presentación de los mismos mediante mapas y sistemas
de coordenadas geográficas.

6
(a) Capa de Información NO2 (b) Capa Información NO2 + Capa Mapa

Figura 1.1: Ejemplo de Capas o Coberturas (layers) con información sobre la calidad del aire en
Madrid

1.1.2. Características de los SIG

Los SIG se caracterizan por contar con una amplia gama de plataformas, aplicaciones, arquitecturas,
aplicaciones, procedimientos, etc., que permiten la gestión de datos espaciales.

La información en los GIS se estructura en capas o coberturas (layers) y cada capa ofrece un tipo de
información. Por ejemplo, las Figuras 1.1a y 1.1b muestran ejemplos de capas tomados de Perpiñán
(2014) con información sobre la calidad del aire para Madrid. Una capa en el prime caso; dos capas en
el segundo. La construcción de estas capas se hace a partir de un sistema de coordenadas geográficas
(georreferenciación).

La presentación de los objetos geográficos se hace mediante dos formatos básicos: vector y raster.
El vector se representa a partir de tres elementos: puntos, líneas y polígonos. El primero se localiza
mediante un par de coordenadas (x e y), la línea mediante dos pares de coordenadas y el polígono
mediante varios pares de coordenadas. La Figura 1.1a es un ejemplo de vector representado mediante
puntos.

Un “raster” es una estructura de datos espaciales que divide una región en rectángulos llamados celdas
o pixeles que puede almacenar uno o más valores para cada una de esas celdas (Hijmans, 2016a). Las

7
(a) ’Raster’ con 100 Celdas (b) ’Raster’ Generado desde Archivo

Figura 1.2: Ejemplo de Capas Tipo Raster tomado de Hijmans (2016a)

Figuras 1.2a y 1.2b muestran dos formas de visualización de objetos tipo raster: (a) es el “esqueleto”
del raster definiendo “a mano” el número de filas, el número de columnas y la resolución; (b) un
obtejo tipo raster creado a partir de otro objeto.

Entre otros, los usos más destacados de los SIG son: arqueología, medio ambiente, prevención de
desastres, cartografía y planimetría, exploración de recursos energéticos, demografía, marketing so-
cial, transporte, epidemiología, etc.; asociándose al manejo de datos espaciales.

1.2. Datos Espaciales

Los datos espaciales (también conocidos como datos geoespaciales) están directa o indirectamente
referenciados con una localización sobre la superficie de la tierra (Perpiñán, 2014). Su referencia es-
pacial se compone de valores de coordenadas y un sistema de referencia para esas coordenadas. El
análisis de estos datos se hace a partir de la geoestadística la cuál cuenta con múltiples herramientas
para su modelamiento.

Con base en lo anterior, un proceso de interés para el análisis geoestadístico presenta una número
determinado de observaciones (n) y ese número de observaciones son denotados por Z(ss1 ), . . . Z(ssn ),
aunque algunas veces se denota como Z1 , . . . , Z2 (Sherman, 2011). Básicamente, el modelamiento

8
busca:

1. Realizar estimaciones en puntos no observados

2. Comprender la conexión entre puntos “vecinos”.

Para describir la relación entre los puntos, es necesario introducir los siguientes modelo de correla-
ción (Sherman, 2011):

Estacionariedad de Segundo Orden (SOS)

1. E[Z(ss)] − µ = 0

2. Cov[Z(ss +hh) − Z(ss)] = Cov[Z(hh), Z(00)] = C(hh) ∀ h

Que es similar a la Estacionariedad Intrínseca (IS):

1. E[Z(ss)] − µ = 0

2. Cov[Z(ss +hh) − Z(s)] =: 2γ(hh) ∀ h

El término 2γ(hh) es conocido como función de variograma y γ(hh) semivariograma. Según Sherman
(2011), las razones por las cuales se prefiere el supuesto de IS sobre el de SOS son:

1. IS es más general que SOS:


Si se asume que 2γ(hh) = 2[C(00) −C(hh)], entonces, se puede definir el variograma como el lado
derecho de la igualdad. Adicionalmente, si se considera un proceso AR(1) con ρ = 1, es decir,
Zi = Zi−1 + εi , se tiene:

Zi+ j = Zi + δ j con Var δ j = jσ 2



(1.1)

Entonces, Cov[Zi+ j , Zi ] = iσ 2 que es una función de i que SOS no tiene.

2. Los variogramas adaptan de una manera más fácil las observaciones no estacionarias.

3. Para estimar el variograma no se requiere una estimación de µ

4. La estimación del variograma es tan fácil como la estimación de la función de covarianza

9
1.2.1. Evaluación del Error

El modelo inicial para una estimación óptima parte de una estructura simple que incluye la media
subyacente; según Sherman (2011) este modelo básico es:

Z(ss) = µ + δ (ss) (1.2)

donde µ es una constante desconocida y δ (ss) es un proceso intrínsecamente estacionario; luego, es


posible asumir que Z(ss) es IS. Al considerar una locación no muestreada, s 0 , lo deseable es conocer
el valor no observado para el proceso Z(ss0 ); el objetivo es encontrar la mejor estimación para Z(ss0 )
a partir de los valores de Z(ss1 ) . . . Z(ssn ) para lo cual se minimiza MSE[Z(s b s0 ) − Z(ss0 )]2 }.
b s0 )] = E{[Z(s

La solución es:

b s0 ) = E[Z(ss0 )|Z(ss1 ) . . . Z(ssn )]


Z(s (1.3)

Se denotará el vector de n observaciones como Z n := [Z(ss1 ) . . . Z(ssn )], se tiene:

n o2 
2
b s0 ) − Z(ss0 )] } = E b s0 ) − E[Z(ss0 )|Z
E{[Z(s Z(s Z n ] − Z(ss0 )
Z n ] + E[Z(ss0 )|Z
n o2   
= E Z(ss0 ) − E[Z(ss0 )|Z
b Z n] + E {E[Z(ss0 )|Z Z n − Z(ss0 )]}2
n o 
+ 2E Z(s Z n ] {E[Z(ss0 )|Z
b s0 ) − E[Z(ss0 )|Z Z n − Z(ss0 )]} (1.4)

n o 
Como 2E Z(s Z n ] {E[Z(ss0 )|Z
b s0 ) − E[Z(ss0 )|Z Z n − Z(ss0 )]} = 0, entonces:

n o2   
b s0 )] = E
MSE[Z(s Z(ss0 ) − E[Z(ss0 )|Z
b Z n] Z n − Z(ss0 )]}2
+ E {E[Z(ss0 )|Z (1.5)

b s0 ) = E [Z(ss0 )|Z
Y 1.5 se minimiza cuando Z(s Z n ], la estimación de la varianza para este estimador es

(Sherman, 2011):

 
2
E {E [Z(s 0 )|Z n ] − Z(s 0 )}
s Z s (1.6)

b s0 ) = E[Z(ss0 )|Z
A partir de 1.6 el estimador Z(s Z n ] se hace, intuitivamente, la mejor estimación para

cualquier nueva observación basada en los valores observados y las expectativas dados los valores

10
observados. Cuando Z(ss) tiene una distribución continua las expectativas condicionales dependen de
la articulación de las distribuciones de las observaciones y el cálculo de la media condicional requie-
re del conocimiento de esta densidad articulada y el cálculo de una integral (n + 1) − dimensional
(Sherman, 2011). Dado que sólo se cuenta con n observaciones esta no sería la esperanza de las ob-
servaciones sino la esperanza de la estimación de las expectativas condicionales. Así, la mejor función
b s0 ) es:
lineal que permite la búsqueda del estimador Z(s

n
Zb (ss0 ) = ∑ λi Z (ssi ) (1.7)
i=1

Para valores constantes de λi , i = 1, . . . , n.

Con esta condición en 1.7, se cambia el problema de estimar una distribución (n + 1) − dimensional
a estimar n constantes.

b 0 )] = µ; lo que implicaría
Como la media se asume constante en 1.2, parece natural requerir que E[Z(∼
que la expectativa del estimador es la expectativa de la estimación, es decir, el estimador es insesgado.
Para esto, se requiere que ∑ni=1 λi = 1; ahora, el objetivo es minimizar:

" #2 
 n  n
E ∑ i i
λ s
Z(s ) − s
Z(s 0 ) sujeto a ∑ λi = 1 (1.8)
 i=1  i=1

Según Sherman (2011), en 1.8 puede aparecer algún λi negativo, lo que puede ser inapropiado; sin
embargo, la presencia de pesos negativos es necesaria en un conjunto grande de observaciones, incluso
en un conjunto pequeño de observaciones.

1.2.2. Estimación Óptima (Kriging)

Obtener una estimación óptima implica definir el mejor estimador lineal. Para encaminarse en este
objetivo, Sherman (2011) propone expandir el término del error:

h i2 n n n
Z(ss0 ) − Z(ss0 ) = Z 2 (ss0 ) − 2 ∑ λi Z(ss0 )Z(ssi ) + ∑
b ∑ λiλ j Z(ssi)Z(ss j ) (1.9)
i=1 i=1 j=1

11
Completando el cuadrado en los dos primeros términos de la derecha en 1.9, se tiene:

n n n
 2
h i2 Z(ssi ) − Z(ss j )
b s0 ) = ∑ λi [Z(ssi ) − Z(ss0 )]2 − ∑
Z(ss0 ) − Z(s ∑ λi λ j (1.10)
i01 i=1 j=1 2

Si se considera que γ(hh) = 12 E [Z (ss + hh) − Z (ss)]2 para todo h , se tiene que 1.10 es la varianza de la
estimación para un estimador linear usando cualquier λi , i = 1, . . . , n (Sherman, 2011).

La expresión 1.10 puede reescribirse:

H (λ1 , . . . , λn ) = F (λ1 , . . . , λn ) − mG (λ1 , . . . , λn ) (1.11)

condicionado a G (λ1 , . . . , λn ) := ∑ni=1 λi − 1 = 0 y donde m es un multiplicador de Lagrange, al


diferenciar H respecto a λi , i = 1, . . . , n, se tiene:

n
dH 
= 2γ (ss0 −ssi ) − 2 ∑ λ j γ s i −ss j − m (1.12)
dλi j=1

m
dH
= − ∑ λi + 1 (1.13)
dm i=1

igualando a 0 las n+1 derivadas que se generan, la única solución del sistema está dada por (Sherman,
2011):

n  m
∑ λ jγ s i −ss j + = γ (ss0 −ssi ) , i = 1, . . . , n (1.14)
j=1 2

n
∑ λi = 1 (1.15)
i=1
Donde 1.14 y 1.15 conforman un sistema lineal de la forma:

12
    
γ11 . . . γ1n 1 λ1  λ01 
 . .. .. ..  .  . 
 .. . . . .  . 
 .   . 
  =   (1.16)


 n1 . . . γnn 1
γ    
 λn  λ0n 
    
m
1 ... 1 0 2 1

donde γi j = γ s i −ss j

Como 1.16 puede simplificarse escribiendo Γλ = γγ; si Γ es invertible se tiene

λ = Γ−1 γ (1.17)

Los primeros n elementos de λ dan los pesos del mejor estimador lineal de Z(ss0 ). El estimador
b s0 ) = ∑n λi Z(ssi ) con esos pesos óptimos es lo que se conoce como kriging (Sherman, 2011).
Z(s i=1

Los errores asociados al estimador kriging están dados por la varianza kriging:

h i2 
σZ20 := E Z (ss0 ) − Zb (ss0 )
n n n 
= 2 ∑ λi γ (ss0 −ssi ) − ∑ ∑ λi λ j γ s i −ss j (1.18)
i=1 i=1 j=1
n
m
= ∑ λiγ (ss0 −ssi) + 2 = λ Tγ
i=1

b si ) =
El estimador kriging es un interpolador exacto en el sentido que las ecuaciones kriging dan Z(s
Z(ssi ) para todas las variables observadas y para i = 1, . . . , n (Sherman, 2011).

Intervalos de Confianza

En general, estimar un intervalo de confianza para valores predictivos de Z(ss0 ) puede presentar varias
dificultades. Sin embargo, si las observaciones se encuentran normalmente distribuidas los intervalos
de confianza pueden resultar sencillos de estimar.

Σ), entonces, ∑ni=1 λi Zi posee una distribución normal multivariada para


Si se tiene que Z ∼ N (µ,Σ

13
algún λi cuyo intervalo se puede representar:

q
Zb (ss0 ) ± Zα σz20 (1.19)

Donde Zα corresponde a la distribución normal estándar.

Distribución Log-Normal

Una de la distribuciones más populares en el campo de los datos espaciales es la distribución Log-
Normal. En particular, el problema de la estimación en los campos aleatorios log-normales tiene una
larga historia en la literatura geoestadística donde la metodología estadística asociada es llamada, ge-
neralmente, kriging log-normal (De Oliveira, 2006).

Se tiene que µ = (µ1 , . . . , µn )0 es un vector arbitrario de tamaño n × 1 y Σ es una matriz definida


positiva de tamaño n × n. El vector Z = (Z1 , . . . , Zn )0 presenta una distribución log-Gaussiana (log-
d
normal) denotada por Z ∼ Λn (µ
µ ,Σ Y }, donde Y = (Y1 , . . . ,Yn )0 tiene una distribución
Σ); si Z = exp{Y

normal multivariada con media µ y varianza Σ , para algún vector v = (v1 , . . . , vn )0 y alguna función
de una variable g (·), es posible definir g (vv) := (g (v1 ) , . . . , g (vn ))0 (Rui & De Oliveira, 2008). Las
funciones de la media y la covarianza para el vector Z vienen dadas por (De Oliveira, 2006)

σ2
 
E [Z (ss)] = exp µY + Y =: µZ
2
cov {Z (ss) , Z (uu)} = µZ2 (exp {CY (s,
s, uu)} − 1)

Que puede reescribirse según Sherman (2011) como:

σ2
 
E [Z (ss)] = exp µ(ss) +
2
    
cov Z (ssi ) , Z s j = µ(ssi )µ(ss j ) exp Σs i ,ss j − 1

Si el predictante Z(ss0 ) es definido junto con las observaciones de Z , entonces (Sherman, 2011):

14
   
2 T
C0Y
T µY0   σY0
Z T ∼ Λn+1   , 

Z (ss0 ) ,Z (1.20)


µY C0Y ΣY

Y )]n×1 ; por lo tanto, el estimador E [Z (ss0 ) |Z


donde C0Y representa el vector de covarianza Cov [Y (ss0 ,Y Z]

es dado por:


σ ∗ 
b∗ ∗ b0Y
Z (ss0 ) = exp Yb (ss0 ) + (1.21)
2

donde

Yb ∗ (ss0 ) = E [Y (ss0 |Y T −1
Y )] = µ0 +C0Y Y − µY )
ΣY (Y (1.22)

∗ T −1
σb0Y Y )] = σ 2 −C0Y
= Var [Y (ss0 |Y ΣY C0Y (1.23)

son conocidos como estimador simple kriging y la varianza simple kriging de Y0 (De Oliveira, 2006),
asumiendo que µY es conocida (Sherman, 2011).

En general, como se asume que µY es desconocida, las opciones para predecir observaciones son
(Sherman, 2011):

1. Krigning Log-Normal:

En primer lugar, es necesario encontrar el mejor estimador linear insesgado de Y (ss0 ). Enton-
ces, se exponencia este estimador usando una corrección multiplicativa de sesgo para hacer
b s0 )] = E[Z(ss0 )]. En otras palabras,
E[Z(s

Yb 0K (ss0 ) = λ0Y
T
Y (1.24)

donde λ0Y es el vector de pesos ordinarios usados para predecir Y (ss0 ) con base en Y . Así, el
kriging log-normal está dado por (Rui & De Oliveira, 2008):

15
 
bLK 0K 1 0

Z (ss0 ) = exp Yb + Cy (ss0 ,ss0 ) − λ (ss0 ) ΣY λ (ss0 )
2
 
0K 1 0K 0
b b (ss0 ) −xx (ss0 ) m (ss0 )
= exp Y (ss0 ) + σ (1.25)
2 Y

Que puede ser reescrito en términos del kriging ordinario:

h i
ZbLK (ss0 ) = exp Yb 0K (ss0 ) + σY20 − mOY (1.26)

donde, σY20 es la varianza de kriging y mOY es un multiplicador de Lagrange que representa el


tercer término del exponencial en 1.25

2. Tratar de alcanzar el estimador óptimo L2 para estimar Zb (ss0 ) y no ln [Z (ss0 )] a partir de:

Zb (ss0 ) = exp aT Y − K0 , aT 1 = 1
 
(1.27)

Con manipulación matemática de 1.27, puede mostrarse que el estimador óptimo es (Sherman,
2011):

h i
2
Z = exp Z (ss0 ) + σY0 − 2mOY
e b (1.28)

Comparando 1.26 con 1.28 se observa que con un simple remplazo en el término que multiplica
mOY se obtienen expresiones equivalentes.

Kriging Universal

Hasta el momento se ha considerado que la función de la media es constante, esto es E [Z (ss)] = µ.


En muchos, un modelo más apropiado seria:

Z (ss) = µ (ss) + δ (ss) (1.29)

Uno de los ejemplos más comunes donde la función de la media no es constante es aquel donde
la función de media del campo espacial depende de la localización espacial; en cuyo caso se tiene

16
s = (x, y); en cuyo caso, un modelo razonable para algún entero positivo r sería (Sherman,2011):

µ (ss) = ∑ βk,l xk yl (1.30)


0≤k+1≤r

Para observaciones en una cuadrícula regular, una función de media que depende de coordenadas
espaciales está dada por:

µ (ss) = a + c (x) + r (y) (1.31)

Donde c (x) describe la media en la coordenada x para todas las observaciones y r (y) la media en la
coordenada y. De manera más general se tiene (Sherman, 2011):

p
µ (ss) = ∑ fk−1,sβk−1 (1.32)
k=1

donde f j,s es una función conocida y β j es un parámetro desconocido.

Para simplificar el modelo para la media no constante se tiene:

Z = Xβ + δ (1.33)

donde X es una matriz n × p. En el caso de un Modelo Lineal Generalizado, se tiene que los erro-
res se asumen como independientes; mientras, en este caso, los errores δ (ssi ) se supone que son la
estacionariedad intrínseca. Bajo este MLG, el predictante es (Sherman, 2011):

Z (ss0 ) = x T0 β + δ (ss0 ) (1.34)

donde x0 describe las p covarianzas para la locación que se desea predecir. El estimador lineal se sigue
asumiendo de la forma Zb (ss0 ) = ∑ni=1 λi Z (ssi ) (Sherman, 2011); por lo que la imparcialidad requiere:

h i n n
E Z (s 0 ) = ∑ λi µ (s i ) = ∑ λixTi β = xT0 β
b s s (1.35)
i=1 i=1

Si se procede de manera análoga que con el estimador kriging ordinario, se tiene (Sherman, 2011):

λ = Γ −1γ (1.36)

17
Figura 1.3: Descripción de Estacionariedad: dos vectores con idénticos rezagos (Sherman, 2011)

donde λ = (λ1 , . . . , λn , m1 , . . . , m p )T , γ = γ (ss0 −ss1 ) , . . . , γ (ss0 −ssn ) , 1, f1,ss0 , . . . , f p−1,ss0 y Γ es una


 

matriz de dimensiones (n + p)×(n + p). Con esto, el estimador universal kriging y su varianza vienen
dados por (Zimmerman & Stein, 2010):

h −1 iT −1
X X T Γ −1X
Yb (ss0 ) = Γ +X X T Γ −1
x 0 −X Γ Y (1.37)

T −1
σ 2 (ss0 ) = γ T Γ −1 γ − X T Γ −1 γ −xx0 X T Γ −1X X T Γ −1 γ −xx0

(1.38)

1.2.3. Estimación Empírica del Variograma y la Función de Covarianza

En general, el variograma y las funciones de covarianza son desconocidas; hasta el momento, estas
han sido asumidas como conocidas y se requiere estimarlas a partir de los datos disponibles.

Para estimar de manera empírica el variograma y la función de covarianza se asume que la estaciona-
riedad se mantiene (bien sea la intrínseca (IS) o de Segundo Orden (SOS). La Figura 1.3 (Tomada de
Sherman, 2011) muestra un par de puntos separados por un rezago espacial h dada una estimación de
2γ (hh), a saber {[Z(ssi ) − Z(ss j )]2 } con s i −ss j = h . Lo que sugiere que el estimador intuitivo del semi-
variograma se obtiene a partir del promedio de todos los pares de puntos; por lo tanto, el estimador
empírico del semivariograma viene dado por (Zimmerman & Stein, 2010):

18
1   2
γb(hh) = ∑ eb(ssi ) − eb s j (1.39)
2N (hh) s −ss =hh
i j

donde eb(ss∗ ) = Z (ss∗ )

Y, para estimar la función empírica de covarianza se usa (Sherman, 2011):

1    
Cb (hh) = ∑ Z (ssi ) − Z n Z s j − Z n (1.40)
N (hh) s −ss =hh
i j

Como se observa en 1.40, se emplea un estimador de µ, Z n para definir la covarianza; lo que hace
b h)] 6= C(hh). Sin embargo, es claro que E[γb(hh)] = γ(hh) lo que hace preferir la estimación de
que E[C(h
la función del variograma por sobre la función de covarianza.

1.2.4. Modelización del Semivariograma

De momento, se tiene un estimador intuitivo e imparcial; sin embargo, los estimadores del semivario-
grama y la función de covarianza presentan ineficiencias.

En primera instancia, estos estimadores no satisfacen las propiedades de la covarianza definida como
no negativa y el semivariograma definido no positivo (Sherman, 2011). En segundo lugar, este esti-
mador da, de momento, estimaciones de correlación sólo a los rezagos observados y, para estimar el
kriging en un punto, s 0 , no observado se requiere estimar la correlación para los rezagos no obser-
vados. En otras palabras, se necesita un estimador de la correlación espacial para cualquier rezago
espacial.

Una solución bastante común para estas ineficiencias es ajustar un modelo paramétrico que cumpla
algunas consideraciones (conocimiento previo, simplicidad computacional, flexibilidad suficiente) y
que se base en la evaluación del semivariograma empírico. Las siguientes condiciones son necesarias
y suficientes para que un modelo para el semivariograma sea válido (siempre que se mantenga para
todo θ ∈ Θ, donde Θ es el espacio paramétrico de θ ) (Gelfand et all, 2010):

1. γ (0, θ ) = 0

19
−h
−h; θ ) = γ (hh, θ )
2. γ (−h ∀ h

3. ∑ni=1 ∑nj=1 ai a j γ s i −ss j ; θ ≤ 0 ∀ n;ss1 , . . . ,ssn y ai , . . . , a j tal que ∑ni=1 ai = 0




Existe una gran variedad de modelos que satisfacen los requerimientos anteriores (en R2 y R3 ); los
más empleados en la estimación del semivariograma γ(hh; θ ) y la función de covarianza C(hh; θ ) según
Gelfand et all (2010) y Sherman (2011) son 1

Esférico


 
θ1 3hh − h 33


2θ2 2θ
para 0 ≤ h ≤ θ2
γ (hh; θ ) = 2 (1.41)

θ1 para h > θ2

h3
 
3hh
C (hh; θ ) = θ1 1 − + para 0 < θ1 ; h ≤ θ2 (1.42)
2θ2 2θ23

Exponencial

  
h
γ (hh; θ ) = θ1 1 − exp − (1.43)
θ
  2
h
C (hh; θ ) = θ1 exp − para 0 < θ1 ; 0 < θ2 ; h ≤ θ2 (1.44)
θ2

Gaussiano

  2 
h
γ (hh; θ ) = θ1 1 − exp − 2 (1.45)
θ
 2 2
h 1
C (hh; θ ) = θ1 exp − para 0 < θ1 ; 0 < (1.46)
θ2 θ2
1 En este caso, θ1 = σ 4 ; θ2 = m (que es el rango de la correlación) y h ≡k h k y denota la longitud del vector

20
De Matérn

(h/θ2 )ν Kν (h/θ2 )
 
γ (hh; θ ) = θ1 1 − (1.47)
2ν−1 Γ (ν)
σ2
   
h h
C (hh; θ ) = Kν (1.48)
Γ (ν + 1/2) 2/θ2 θ2

donde Kν es una función de Bessel modificada del segundo tipo de orden ν

De Potencia

γ (hh; θ ) = θ1h θ2 (1.49)

En el modelo de potencia no existe o está ausente la función de covarianza (Sherman, 2011).

La Figura 1.4 corresponde a la representación gráfica para las modelos citados, tomada de Gelfand
(2011). La Figura 1.5, tomada de Sherman (2011), corresponde a la representación gráfica de los
modelos de Covarianza.

1.2.5. Modelos de Interdependencia Espacial

En los procesos espaciales es posible incorporar relaciones mutuas entre variables que definen el
fenómeno estudiado. Todo modelo espacial ha de caracterizarse por su interdependencia, es decir,
deben incorporarse relaciones mutuas entre las observaciones de las variables económicas, sociales,
demográficas, etc. (Moreno & Vayá, 2000). Como tal, son varios los modelos que permiten realizar
un análisis confirmatorio de la interdependencia espacial.

Modelo Espacial Autorregresivo (SAR)

El Modelo Espacial Autorregresivo (SAR2 ) es una variación del modelo de Mínimos Cuadrados Ordi-
narios (OLS3 ) que incorpora el rezago espacial de la variable dependiente (Zhukov, 2010). El modelo
puede expresarse como (Ward & Gleditsch, 2007):
2 Por su nombre en inglés Spatial Autoregressive Model
3 Ordinary Least Squares

21
Figura 1.4: Representación Gráfica de los Modelos para Semivariograma

Figura 1.5: Representación Gráfica de los Modelos para Covarianza

22
Wy +X
Y = ρWy Xβ +ε (1.50)

ε ∼ N 0, σ 2I

(1.51)

donde I representa una matriz diagonal inversa. Si ρ = 0 se deduce que no existe dependencia espacial
y por lo tanto el modelo especificado corresponde a un modelo OLS.

Sin embargo, usar un modelo OLS para estimar la dependencia espacial puede ser problemático por
lo que es conveniente usar estimadores de máxima verosimilitud (MLE4 ) para el rezago espacial en
cuyo caso el estimador puede escribirse (Ward & Gleditsch, 2008):

−1
β = X 0X X 0 (II − ρW
W) (1.52)

En caso que ρ sea desconocida se dificulta la estimación del parámetro siempre que la función del
logaritmo de verosimilitud envuelve el determinante de |II − ρW
W |. Sin embargo, Ord demostró en su

texto de 1975 que si W tiene valores propios (ω1 , . . . , ωn ) entonces (Ward & Gleditsch, 2008):

n
|ωII − ρW
W | = ∏ (ω − ρωi ) (1.53)
i=1

Esto, a su vez, implica que:

n
|II − ρW
W | = ∏ (1 − ρωi ) (1.54)
i=1

Si se sabe que la función de verosimilitud logarítmica para un modelo clásico de regresión es:

N N X β )0 (y −X
(y −X Xβ)
lnL(β , σ 2 ) = − − 2
− 2
(1.55)
2ln(2π) 2ln(2σ ) 2σ

Por contraste, la función del logarítmica de verosimilitud para el modelo de dependencia espacial es
(Ward & Gleditsch, 2008):
4 Maximum Likelihood Estimator

23
2 N N (y − ρW X β )0 (y − ρW
W −X W −X
Xβ)
lnL(β , σ , ρ) = ln|II − ρW
W|− − − (1.56)
2ln(2π) 2ln(2σ 2 ) 2σ 2

Según Ward & Gleditsch (2008), Ord (1975) sugiere que ωi puede ser dado como una condición a
priori a la estimación lo que facilita la estimación del modelo.

El parámetro β refleja el impacto directo de corto plazo ed xi sobre yi . Sin embargo, es necesario
determinar el impacto directo xi sobre yi a partir de la influencia que yi ejerce sobre sus vecinos y j y
que retorna a yi , lo que se conoce como Efecto Equilibrio.

Este efecto equilibrio de un cambio en xi sobre yi puede calcularse como:

W )−1 ∆X
E[∆y] = (II n − ρW X (1.57)

X es una matriz de cambios de las covariables y ∆y es el cambio asociado en la variable


donde ∆X
dependiente.

Modelo de Error Espacial (SEM)

Mientras que los modelos de variable dependiente (como el SAR) consideran la dependencia espacial
como sustancial, en el sentido que el valor de y en la localización i está influenciando el el valor de y
en la localización j (siempre que i 6= j), el Modelo de Error Espacial (SEM5 trata a la correlación es-
pacial como una molesta, al igual que muchos enfoques estadísticos trata la correlación serial espacial
como algo que debe eliminarse y, únicamente, como un problema de estimación (Ward & Gleditsch,
2007).

Este enfoque, generalmente, se concentra en la estimación del los parámetros para las variables in-
dependientes de interés en la parte sistemática del modelo y ,esencialmente, desestima la posibilidad
que la correlación observada pueda reflejar algo significativo sobre el proceso de generación de los
datos. Así, en lugar de dejar que yi afecte directamente a y j , el modelo de error espacial supone que
5 Spatial Error Model

24
los errores de un modelo están espacialmente correlacionados (Ward & Gleditsch, 2007).

Para plantear el modelo SEM se parte de la expresión presentada en la ecuación 1.50; si se considera
que wi denota el vector de W que indica que tan cercanas a las unidades i son las unidades j 6= i, el
modelo puede escribirse (Ward & Gleditshc, 2007):

yi = xi β + εi + λw
wi ξi (1.58)

donde ε representa el error espacialmente incorrelacionado que satisface la hípotesis de regresion


normal; ξ representa el término que indica el error espacial y el parámetro λ indica el grado en que el
componente espacial de los errores ξ están correlacionados entre sí para las observaciones cercanas,
tal como lo indica el vector de conectividad wi .

El modelo puede reescribirse matricialmente como (Ward & Gleditsch, 2007):

Wξ +ε
y = X β + λW (1.59)

ε ∼ N(0, σ 2I ) (1.60)

donde es más fácil visualizar que si las observaciones i y j no presentan correlación espacial el pará-
metro λ será 0 y el modelo se reduce a una regresión lineal estándar.

La función del verosimilitud logarítmica del SEM es (Zhukov, 2010):

n e0 e
lnL = − + ln |II − λW
W|− 2 (1.61)
2 2σ
e = (II − λW
W ) (y −X
Xβ) (1.62)

Como el SEM no involucra los rezagos espaciales de la variable dependiente, los parámetros β esti-
mados pueden interpretarse como derivadas parciales:

25
∂ yi
βk = ∀ i, k (1.63)
∂ xi j

donde i indica la observación y k la variable explicativa.

Modelo Espacial de Durbin (SDM)

El Modelo Espacial de Durbin (SDM6 tiene una motivación similar a la del modelo SEM: lo con-
cerniente a variables omitidas (Zhukov, 2010). Un punto de partida simple para la formulación del
modelo se observa en la ecuación 1.64:

W )−1u
y = X β + (II n − λW (1.64)

u = X γ +vv (1.65)

v ∼ N(0, σ 2I n ) (1.66)

Si se observa en detalle, es una variación del SEM donde γ y σ 2 son escalares que definen la fuerza
W )−1 .
de la relación entre X y (II n − λW

Sustituyendo u en 1.64 se tiene:

Wy + αιn +X
y = ρWy X β +W
WXXθ + ε (1.67)

que es la expresión del SDM donde se incluyen los rezagos espaciales tanto de la variable dependiente
como de las independientes. Así, la función de verosimilitud logarítmica se expresa de la forma:

n e0 e
lnL = − ln πσ 2 + ln |II n − ρW

W|− 2 (1.68)
2 2σ
e ∼ y − ρWy
Wy −Z
Zδ (1.69)

X], δ = [α β θ ] y ρ está delimitado por (min(ω)−1 ), (max(ω)−1 ) y ω es un vector


donde Z = [ι X W X
de tamaño n × 1 que representa los valores propios de W .
6 Spatial Durbin Model)

26
1.3. Datos Espacio - Temporales

Un proceso espacial describe la distribución de puntos en un espacio bidimensional. Los procesos


espacio-temporales pueden llegar a considerar al tiempo como una coordenada más y contemplar este
proceso como un caso especial de un proceso espacial de dimensión superior (Gelfand, Diggle, Fuen-
tes & Guttorp, 2010). Sin embargo, un enfoque más adecuado consiste en considerar los procesos
espacio-temporales como procesos espaciales de dimensión dos mas uno. En este contexto, dos mas
uno no es igual a tres en el sentido que el tiempo es una dimensión fundamentalmente diferente a
cada una de las otras dos dimensiones espaciales (Diggle, 2014).

En concreto, los procesos espaciales son procesos estocásticos representados como Y (ss) : s ∈ D ⊆ Rd × R


descritos dentro de un dominio Euclidiano; ahora bien, en el caso espacio-temporal debe considerarse
procesos de tipo (Gneiting & Guttorp, 2010):

n o
Y (ss,t) : (ss,t) ∈ D ⊆ Rd × R (1.70)

que varían en función de la ubicación espacial, s ∈ Rd , y el tiempo, t ∈ R.

En particular, todo resultado técnico sobre funciones de covarianza espacial y predicción por mínimos
cuadrados o kriging en espacios Euclídeos aplica para los problemas espacio-temporales aplicando el
respectivo resultado sobre el domino Rd+1 (Gneiting & Guttorp, 2010).

1.3.1. Características de los Datos Espacio-Temporales

Perpiñán (2014) plantea que los datos espacio-temporales se indexan tanto en el tiempo como en el
espacio y pueden consistir en un objeto vectorial espacial (como el caso de polígonos o puntos) o un
objeto en capas registrados en diferentes momentos.

Los datos espacio-temporales son asequibles y, relativamente, abundantes ya sea en el espacio o en


el tiempo pero no en ambas dimensiones. Las imágenes de satélite suelen ser muy abundantes en el
espacio, dando mucho detalle en una gran resolución espacial para grandes áreas, pero relativamente
escasas en el tiempo.

27
El análisis de imágenes repetidas a lo largo del tiempo puede verse obstaculizado por los cambios
en las condiciones de luz, los errores en la georreferenciación que resultan en desajuste espacial y
modificaciones en áreas oscurecidas por los cambios de nubosidad (Pebesma, 2012). Por otro lado,
los datos suministrados por sensores fijos dan a menudo señales muy detalladas a través del tiempo,
lo que facilita el modelado, pero ofrecen poco detalle en el espacio ya que depende de la limitada
disponibilidad de sensores.

Güting & Schenider (2005) distinguen 10 tipos de datos generados en las dimensiones de espacio-
tiempo definidos, particulamente, por sus características7 :

1. Eventos en el espacio y el tiempo

2. Ubicaciones válidas para un cierto periodo de tiempo

3. Conjunto de eventos con localización y secuencia tipo punto-momento, consideradas colectiva-


mente.

4. Localizaciones constantes con secuencia paso a paso

5. Entidades en movimiento - puntos en movimiento

6. Eventos regionales en espacio y tiempo

7. Regiones válidas para un periodo de tiempo

8. Conjunto de regiones de evento-secuencia

9. Regiones constantes de secuencia paso a paso

10. Entidades móviles con una región en movimiento

Con base en esta distinción, Pebesma (2012) identifica tres casos:


7 Pebesma (2012) los resume en tres grupos:
1. Conjuntos de eventos sin duración temporal: accidentes, rayos, nacimientos, muertes, etc.
2. Conjuntos de eventos con duración temporal pero no movimiento: una localización específica en una ciudad, una
dirección, etc.
3. Puntos en movimiento (en conjunto o individualmente): migraciones de animales, desplazamiento de una o más
personas, etc.

28
1. El tiempo es instantáneo y la característica no se mueve (es decir, sólo puede existir en un
instante en el tiempo).

2. El tiempo es un intervalo y los objetos no se mueven durante este intervalo

3. El tiempo es instantáneo y las características están en movimiento a lo largo de una trayectoria


(los objetos existen entre los instantes de tiempo y pueden moverse)

La Figura 1.6 muestra los casos identificados por Pebesma (2012): parte superior izquierda: el tiempo
es instantáneo; parte superior derecha: los objetos presentan movimiento; parte inferior izquierda: el
tiempo presenta intervalos consecutivos; y, parte inferior derecha: los intervalos de tiempo son alea-
torios. s1 se refiere a la primera característica/ubicación, t1 a la primera instante de tiempo o intervalo.
Las líneas continuas indican intervalos de tiempo; las flechas, movimiento. Los círculos rellenos de-
notan el momento inicial y los círculos vacíos el momento final o cierre.

Cuando el tiempo refleja intervalos significa que la característica espacial o los valores de los datos
asociados no cambian durante dicho intervalo pero refleja el valor o e lestado durante este intervalo
(Pebesma, 2012).

Los instantes de tiempo pueden reflejar momentos de cambio o eventos cero o con duración ilegible;
mientra que el movimiento refleja el hecho que existen objetos en movimiento y pueden cambiar de
ubicación durante un intervalo de tiempo. Para datos de objetos en movimiento los instantes de tiem-
po reflejan la ubicación del objeto en un momento en particular y los cambios de ubicación ocurridos
durante el registro del tiempo y las características; esto debe ocurrir simultáneamente.

Las trayectorias se refieren al caso donde el conjunto de puntos espacio-temporales forman secuencias
y representan un trayecto; su agrupación puede ser simple, anidada o compleja (Pebesma, 2012).

1.3.2. Procesos Espacio-Temporales

El interés general para el análisis de los procesos espacio- temporales se centra en la forma:

Y (s,t) = µ (s,t) + ε (s,t) (1.71)

29
Figura 1.6: Ejemplificación de los casos de objetos espacio-temporales identificados por Pebesma
(2012)

30
donde Y (s,t) denota las observaciones espacio-temporales; µ (s,t) el la media del campo estructura-
do y ε (s,t) los residuales del campo espacio-tiempo.

La media del campo estructurado puede modelarse (Lindstrom, Szpiro, sampson, Bergen & Sheppard,
2013):

L n
µ (s,t) = ∑ γl Ml (s,t) + ∑ βi (ss) fi (t) (1.72)
l=1 i=1

donde Ml (s,t) representa las covarianzas espaciales; γl los coeficientes que definen las covarianzas;
{ fi (t)}m
i=1 es el conjunto de funciones básicas temporales y βi (ss) los coeficientes de variación para

las funciones temporales.

A los coeficientes βi (s) en 1.72 se les da tratamiento de campos espaciales con una estructura de
Kriging universal permitiendo una estructura temporal que varía entre locaciones (Lindstrom et all,
2013b):


βi (s) ∈ N Xi αi , Σβi (θi ) para i = 1, . . . , m, (1.73)

donde Xi es una matriz con diseño n × pi ; αi es una matriz de coeficientes de regresión con diseño
pi × 1 y Σβi (θi ) es una matriz de covarianzas n × n.

 
  
1
 Σν (θν ) 0 0 
 
  
ν(s,t) ∈ N 0, 
 ...  (1.74)
 0 0 
  
 
 0 T
0 Σν (θν ) 
 
| {z }
Σν (θν )

donde el tamaño de cada matriz Σtν (θν ) es el número de observaciones y nt cada punto en el tiempo
(Lindstrom, 2013c). La independencia temporal en 1.74 se basa en el supuesto que la base temporal,
{ fi (t)}m
i=1 ; en 1.72 explica la correlación temporal en los datos (Lindstrom, 2013b).

31
1.3.3. Estacionariedad y Estimadores Espacio-Temporales

A partir de 1.72 se tiene que µ(ss,t) denota la media de Z(ss,t) y define la covarianza entre dos variables
espacio-temporales como:

Cov [Z(ss, u), Z(tt , v)] = E {[Z(ss, u) − µ(ss, u)] [Z(tt , v) − µ(tt , v)]} (1.75)

La Estacionariedad de Segundo Orden (SOS) require que para cada ubicación s y cada momento t, se
mantenga (Sherman, 2011):

1. E [Z(ss,t)] = µ

2. Cov [Z(ss +hh,t + u), Z(ss,t)] = Con [Z(hh, u), Z(00, 0)] =: C(hh, u), para toda variación espacial h y
variación temporal u.

Como en el caso puramente espacial, alguna forma de estacionariedad es necesaria para permitir la
estimación del la función de covarianza subyacente. Así, la función del variograma espacio-temporal
está dada por (Sherman, 2011):

γ(hh, u) := Var [Z(ss +hh,t + u) − Z(ss,t)] (1.76)

Pese a esto, la formulación de un modelo espacio-temporal está dado más en términos de la función
de covarianza (cuando existe); aunque, para propósitos de estimación puede considerarse la corres-
pondiente función de variograma espacio-temporal.

En particular, el predictor de Z(ss0 ,t0 ) para una nueva combinación espacio-temporal basada en las nT
observaciones espacio-temporales, está dado por (Sherman, 2011):

µ (ss0 ,t0 ) +νν T Σ −1 (Z


Z n,T − µn,T ) (1.77)

Z n,T ] de tamaño nT × nT y ν es el vector nT × 1 de cova-


Z n,T ]; Σ es la matriz Var [Z
donde µn,T = E [Z
riazas Cov [Z(ss0 ,t0 ),Z
Z n,T ]. Este sería el predictor óptimo para el caso del kriging simple mientras la

formulación para el kriging ordinario es (Sherman, 2011):

−1 T −1
µ (ss0 ,t0 ) = 1 T Σ −11 1 Σ Z n,T (1.78)

32
que es el estimador de Mínimos Cuadrados Generalizados de la media.

1.3.4. Propiedades de la Función de Covarianza Espacio - Temporal

La estimación de la función de covarianza para las estructuras espacio-tiempo pueden resultar compli-
cada a no ser que se empleen algunas suposiciones: estacionariedad, separabilidad y simetría absoluta.
Además, algunas veces es deseable que el proceso espacio-temporal tenga una covarianza compacta,
tal que Cov{Z(s1 ,t1 ), Z(s2 ,t2 )} = 0 cuando k s1 − s2 k y/o |t1 − t2 | son lo suficientemente grandes
(Gneiting, Genton & Guttorp, 2007).
Una función de covarianza espacio-temporal es separable si existe una función de covarianza espacial,
Cs y una función de covarianza temporal, CT tal que (Gneiting & Guttorp, 2010):

C (hh, u) = Cs (hh) ·CT (u) (1.79)

y es completamente simétrica si:

C(hh, u) = C(hh, −u) = C(−hh, u) = c(−hh, −u) (1.80)

para todo (hh, u) ∈ Rd × R. Por lo tanto, dadas dos ubicaciones espaciales, un modelo completamen-
te simétrico es incapaz de distinguir posibles efectos diferentes a medida que el tiempo avanza o
retrocede (Gneiting & Guttorp, 2010).

1.3.5. Modelos Espacio - Temporales

Algunos modelos de espacio-tiempo son considerados una estensión natural de las series de tiempo;
en otros casos, los modelos tratan explícitamente de los efectos de la dimensión espacio-tiempo y sus
interacciones (Sherman, 2011).

Modelos VAR

Una manera de ver los datos espacio-temporales es considerarlos una serie de tiempo multivariada
donde el orden de las observaciones multivariadas es el número de ubicaciones espaciales. Formal-
mente, se tiene que Z t = [Z(ss1 ,t), . . . , Z(ssn ,t)] denota el vector de n respuestas a lo largo de todos

33
los puntos espacialmente identificados en el tiempo t; entonces, un proceso ARMA(p, q) multivariado
está dado por (Sherman, 2011):

Z t −aa1Z t−1 − · · · −aa pZ t−p = εt +bb1 εt−1 + · · · +bbq εt−q (1.81)

donde a 1 , . . . ,aa p y b 1 , . . . ,bbq son matrices n × n y el proceso de ruido blanco εt es tal que Var(εt ) = Σ
y, para todo t 6= s, Cov(εt , εs ) = 0.

Un caso especial es el vector del proceso AR(1) dado por:

Z t = aZ t−1 + εt (1.82)

donde la matriz de coeficients, a determina la dependiencia entre Z t y Z t−1 (Sherman, 2011) y εt es un


vector n × 1 con características de ruido blanco (seriealmente incorrelacionado o independiente) con
matriz de covarianzas de tiempo, Σ (Zivot & Wang, 2006). Por ejemplo, un modelo VAR(2) bivariado
podría expresarse:

          
1 1 2 2
y1t  c1  a11 a12  y1t−1  a11 a12  y1t−2  ε1t 
  =  +  +  + 
y2t c2 a121 a122 y2t−1 a221 a222 y2t−2 ε2t

Donde Cov(ε1t , ε2t ) = σ12 para t = s; y 0 en otro caso. Es de notar que, en este caso (y puede gene-
ralizarse) cada ecuación tiene los mismos valores para los regresores de los retardos de y1t y y2t . Por
lo tanto, el modelo VAR(p) es sólo un modelo de regresión aparentemente no relacionado (SUR) con
variables rezagadas y términos deterministas como regresores comunes (Zivot & Wang, 2006).

La notación para el operador del rezago de un modelo VAR(p) se escribe:

a(L)Y
Y t = c + εt (1.83)

donde a (L) = I n −aa1 L − · · · −aa p L p y se vuelve estable si se cumple que la raiz8 :

det (II n −aa1 z − · · · −aa p z p ) = 0


8 Esta notación se basa en Zivot & Wang (2006)

34
Tiene un módulo mayor que 1 o, equivalentemente, si los valores propios de la matriz complementaria:

 
a 1 a 2 . . . a n 
 
I n 0 . . . 0 
F=
 
.
 0 . . 0 ..  . 
 
 
0 0 In 0

tiene módulo menor que 1. Asumiendo que el proceso ha iniciado en el pasado infinito, un proceso
VAR(p) es estacionario y ergódico cuando las medias, las varianzas y las autocovarianzas permanecen
invariables en el tiempo (Zivot & Wang, 2006).

Sin embargo, este enfoque es apropiado cuando el número de ubicaciones espaciales es relativamente
pequeño (Sherman, 2011).

Modelos STARMA

Un proceso STARMA (Space-Time Autoregressive Moveing Average9 ) combina, de manera simultá-


nea, un modelo de regresión espacial con un modelo ARMA para series de tiempo; permitiendo un
término a 0Z t al lado derecho de la equación 1.81; es decir, cada ubicación espacial depende una de
otra al mismo tiempo (Sherman, 2011).

Los modelos STARMA desarrollados por Phillip E. Pfeifer y Stuart Jay Deutsch a comienzos de la
década de 1980 no podrían haber alcanzado la estructura teórica integrada como el método de Box-
Jenkins utilizado en el análisis convencional de series de tiempo. Pero, ofrece oportunidades para el
pronóstico y la estimación exitosos de manera similar a los modelos de Box-Jenkins en términos de
modelamiento espacio-temporal (Kurt & Tunay, 2015).

Así, un modelo espacio-temporal es un caso especial de modelos para series de tiempo el cual se
usa para calcular las dependencias lineales entre las variables considerando, a la vez, los factores de
tiempo y espacio. Con base en esto, es necesario identificar dos tipos de rezagos: los rezagos tempo-
rales, como se conocen en la teoría tradicional de series de tiempo; y los rezagos espaciales donde se
considera la asociación de una variable en una región con la misma variable en otra región.
9 Media Movil Autorregresiva Espacio-Temporal

35
Se debe, entonces, definir las fronteras y vecindades para poder calcular el operador de rezago es-
pacial. El primer paso es identificar cada región vecina de acuerdo a algunos criterios de selección
previos y agruparlos en conjuntos de vecindad (Kurt & Tunay, 2015). Entonces, si yi es la observación
de la región i y Js es el s − ésimo orden del conjunto de vecindad; el rezago espacial de orden s puede
definirse como (Zhou & Buongiorno, 2006):

(s)
L(s) yi = ∑ xi j x j s = 1, 2, . . . (1.84)
j∈Js

La implementación de los rezagos espaciales se hace de manera similar a los rezagos distribuidos; pe-
ro los rezagos espaciales no están en una dirección como la estructura de retardo distribuido utilizada
(s)
en el análisis de series temporales. En 1.84, se asume que los pesos wi j son, usualmente, externos,
no estocásticos y muestran la siguiente estructura (Zhou & Buongiorno, 2006):



(0, 1] si el sitio j es el orden s de i

(s)
wi j = (1.85)

0
 en otro caso

(s)
∑ wi j =1 (1.86)
i∈Js

(s)
La matriz wi j corresponde a la matriz de pesos espaciales W (s) ; una matriz de dimensión n × n donde
(s)
cada fila de la misma suma uno. wi j puede representar propiedades físicas del área de interés (por
ejemplo, la longitud de la frontera) para hacerlas iguales para vecinos espaciales del mismo orden o
para representar las especificaciones espaciales de quien construye el modelo . Si existe poca teoría
o resultados apriori para seleccionar los pesos espaciales, se asigna el mismo peso a cada vecino del
(s) (s) (s)
mismo orden. Entonces, por cada región i, para cada vecino de orden s; wi j = 1/ni , donde ni es el
número de vecinos de orden s de i (Zhou & Buongiorno, 2006).

La notación matricial del modelo STARMA se puede escribir (Kurt & Tunay, 2015):

p kl q ml
(s)
yt = ∑ ∑ φlsW yt−l − ∑ ∑ θlsW (s)εt−l + εt (1.87)
l=1 s=0 l=1 s=0

36
donde εt está normalmente distribuido con media cero y (Zhou & Buongiorno, 2006):


σ 2I

 0 

n si s = 0
E εt εt+s =

0
 en otro caso

La representación del proceso STARMA en 1.87 sería, entonces, STARMA(p, q, k, l).

Modelos STARIMA

Según Cheng, Wang & Li (2011) el modelo STARIMA expresa cada observación en el tiempo t y
locación i como una combinación lineal ponderada de la observación previa en la locación i (rezagada
en el tiempo) y las observaciones vecinas rezagadas en el espacio; describe las variaciones estocásticas
locales del término de erros ξi,t de la siguiente forma:

p ml q nl
(s)
ξi,t = ∑ ∑ φlsW ξi,t−l − ∑ ∑ θlsW (s)εi,t−l + εi,t (1.88)
l=1 s=0 l=1 s=0

donde p es el orden AR; q el orden MA; ml el orden espacial del l − ésimo término autorregresivo;
nl es el orden espacial de la l − ésima media móvil: φls es el parámetro autorregresivo del rezago
temporal l y el rezago espacial s; W (s) es la matriz n × n de pesos espaciales y εi,t está normalmente
distribuida con las siguientes propieadades:

E [εi,t ] = 0

σ 2I , i = j, s = 0


 0 
E εt ε j,t+s =

0, i 6= j, s 6= 0

0
 
E ξi,t εi,t+s = 0 para s > 0

Pfeifer & Deutsch (1980) expresan el mismo modelo de la siguiente forma:

p ml q nl
5d zt = ∑ ∑ φlsW (s) 5d zt−l − ∑ ∑ θlsW (s)εi,t−l + εi,t (1.89)
l=1 s=0 l=1 s=0

donde 5 la matriz n × n del operador diferencia tal que:

37
5zt = zt − zt−1

52 zt = zt − 2zt−1 + zt−2

y, además, se observa la similitud entre 1.88 y 1.89 por lo que ambos presentan las mismas condicio-
nes.

En ese contexto, se tienen algunas clases especiales de modelos STARIMA: si d = 0, se tiene un


modelo STARMA; si q = 0, se tiene un modelo STAR; y si p = 0, se trata de un modelo ST MA
(Pfeifer & Deutsch, 1980).

38
Capítulo 2

Estudio de Caso: Desplazamiento Forzado en


Colombia, Análisis Espacial y
Espacio-Temporal

2.1. Antecedentes

Estimaciones recientes sugieren que cerca de 4.9 millones de colombianos han sido desplazados
internamente como resultado del prolongado conflicto armado y la violencia política asociada que
envuelve al Estado y los grupos armados de guerrilla de izquierda, así como una serie de grupos “pa-
ramilitares” de derecha altamente regionalizados y redes armadas de tráfico de drogas (Cantor, 2011).

Gran parte de ese desplazamiento forzado en los últimos años es el resultado directo o indirecto de
las ofensivas militares de contraguerrilla por parte de los organismos del Estado y de la disputa por el
control de las zonas rurales, que históricamente han tenido presencia guerrillera, entre paramilitares y
guerrilla. El gran número de grupos armados no estatales y al compleja naturaleza cambiante de sus
disputas desmienten cualquier intento de caracterización del desplazamiento forzado en Colombia
(Cantor, 2011).

En este contexto, es necesario entender que el desplazamiento forzado es el resultado de un ataque


violento y una decisión no voluntaria: Las familias huyen para salvar sus vidas y proteger sus bienes
(Ibáñez & Vélez, 2008). No obstante, se observan episodios agudos de violencia en los cuales algunas

39
personas emigran a buscar refugio mientras que otras prefieren quedarse.

El proceso migratorio involuntario va más allá de de la presencia y el actuar de los grupos armados,
tanto legales como ilegales, en las diferentes regiones. Mantilla (2015), además de los factores aso-
ciados a los eventos de violencia y conflicto armado, identifica otros Factores Comunes que incluyen
la creación de subsidios estatales, la inversión pública en salud y algunos aspectos relacionados con
la política y el desempeño fiscales como elementos determinantes en la decisión de abandonar un
territorio de manera no voluntaria. Sin embargo, el presente documento se ocupará únicamente del
fenómeno de desplazamiento forzado como resultado de las acciones bélicas registradas en el territo-
rio de desplazamiento.

La Figura 2.1 muestra la evolución histórica del total de víctimas del desplazamiento forzado en Co-
lombia, reportadas mes a mes, durante el periodo comprendido entre el 1 de enero de 2007 y el 31
de diciembre de 2016. El pico más alto observado en la serie coincide con el recrudecimiento de las
operaciones contra insurgentes del gobierno de Álvaro Uribe Vélez en contra de la guerrilla de las
FARC-EP1 .

El máximo lider de las FARC-EP, Pedro Antonio Marín, mejor conocido como Manuel Marulanda
Vélez o Tirofijo, fallece por causas naturales en marzo de 2008 y, al poco tiempo, es abatido en com-
bate Luis Edgar Devia, alias Raúl Reyes, segundo al mando después de Tirofijo (Agencia EFE, 2016),
hechos que propician el debilitamiento de este grupo armado, el repliegue de sus frentes y la reduc-
ción significativa del número de víctimas del conflicto.

El posterior inicio formal de negociaciones entre el Gobierno colombiano y la Guerrilla de las FARC-
EP tuvo como resultado, en términos de desplazamiento forzado, la reducción del reporte de víctimas
ante los organismo veedores del derecho internacional humanitario y los organismos del Estado co-
lombiano.

Si se tiene en cuenta que los grupos armados al margen de la ley establecen su territorio mediante ac-
ciones bélicas contra las fuerzas del Estado e intimidación y ataque a la población civil que lo habita
1 Fuerzas Armadas Revolucionarias de Colombia - Ejército del Pueblo

40
Figura 2.1: Total de Víctimas del Desplazamiento Forzado en Colombia (1 de enero de 2007 - 31 de
diciembre de 2016)

y que esto genera un fenómeno migratorio involuntario, surge, entonces, la pregunta: ¿es el desplaza-
miento forzado un fenómeno que pueda identificarse como un proceso espacial que puede expresarse
en términos de su registro temporal, es decir, obedece a un proceso espacio-temporal?

En un primer enfoque, se abordará el problema como un proceso espacial con el fin de determinar si
el fenómeno presenta algún tipo de relación con el territorio donde ocurre y si se relaciona con los
eventos registrados como acciones bélicas en el mismo territorio. El segundo enfoque empleado, será
el de un proceso espacio-temporal a fin de establecer si el tiempo es una dimensión determinante en
la definición del fenómeno de desplazamiento forzado para el caso particular de Colombia.

2.2. Análisis Exploratorio de los Datos

Los datos analizados en el presente documento proceden del Sistema Integrado de Información Huma-
nitaria (SIDIH) administrado la Unidad de Manejo y Análisis de Información de Colombia (UMAIC)
que recopila información suministrada por la Oficina de la ONU para la Coordinación de Asuntos
Humanitarios (OCHA).

41
(a) Mapa Distribución Espacial del Desplazamiento Forzado (b) Mapa Distribución Espacial de las Acciones Bélicas

Figura 2.2: Mapa de Variables de Conflicto Armado: Desplazamiento Forzado y Acciones Bélicas.
Total acumulado 2007 - 2016

La base de datos contiene el reporte mensual de casos registrados sobre desplazamiento forzado y
eventos asociados al conflicto armado durante el periodo comprendido entre el 1 de enero de 2007
y el 31 de diciembre de 20162 . Los mapas de la Figura 2.2 muestra la distribución espacial del total
de eventos de desplazamiento forzado y acciones bélicas: 2.2a Mapa de la distribución espacial del
desplazamiento forzado; 2.10b Mapa de la distribución espacial de las Acciones Bélicas.

La Figura 2.3 muestra el comportamiento, mes a mes, del total de víctimas de desplazamiento forzado
en el periodo 2007 - 2016. Se aprecia una tendencia global decreciente con un salto importante ob-
servado en el mes de febrero; los demás meses del conjunto de datos no muestran valores que puedan
considerarse atípicos. En la Figura 2.4 se puede apreciar la serie acumulada mes a mes de los casos
de desplazamiento forzado. Se observan leves cambios de tendencia en la mayoria de las gráficas,
particularmente, a partir del año 2009.

Como el interés de este estudio se centra el desplazamiento forzado, el análisis exploratorio se cen-
2 En realidad,el sistema recoge información desde el 1 de enero de 1995; sin embargo, este periodo de tiempo contiene
gran cantidad de datos perdidos y no están disponibles en la misma estructura periódica. La ventana de tiempo se redujo
a 10 años debido a que en este rango de fechas las variables de interés mostraban información completa.

42
Figura 2.3: Total Mensual Víctimas de Desplazamiento Forzado en Colombia (enero 2007 - diciembre
2016)

Figura 2.4: Total Acumulado Mensual Víctimas Desplazamiento Forzado en Colombia (enero 2007 -
diciembre 2016)

43
trará en la variable de desplazamiento. La variable que describe las acciones bélicas o incursiones
armadas se tomará como referencia más adelante en el capítulo dedicado a los distintos modelos.

Debido a que los casos se encuentran localizados en unidades territoriales, se hace necesario evaluar
la autocorrelación espacial para mapear adecuadamente la distribución del fenómeno. Se empleó la I
de Moran para efectos del análisis exploratorio de los datos, la cual se define como:

n n
n ∑i=1 ∑ j=1 wi j (xi − xb)(y j − b
j)
I= n (2.1)
S0 ∑i=1 (xi − xb)2

donde wi j es el peso entre la observación i y j y S0 es la suma de todos los wi j (Paradis, 2017).

Para el caso de desplazamiento forzado se obtuvo el siguiente resultado:

Moran I test under randomisation

data: colb2$DESPLAZADOS
weights: col.W_cont_el_mat

Moran I statistic standard deviate = 14.083, p-value < 2.2e-16


alternative hypothesis: greater
sample estimates:
Moran I statistic Expectation Variance
0.2274464138 -0.0008952551 0.0002628880

Con un nivel de significancia α = 0,05, la hipótesis de ausencia de autocorrelación espacial se recha-


za; por lo tanto, la evidencia sugiere que el desplazamiento forzado no es un fenómeno espacialmente
aleatorio. El Coeficiente I de Morán presentó un valor de 0,227 lo que sugiere una autocorrelación
espacial global baja3 .

La Figura 2.5 muestra la dispersión del desplazamiento forzado por municipio y su rezago espacial
(el promedio de desplazados en los centros poblados o municipios vecinos). Se observa una alta con-
centración de puntos cerca del centroide; sin embargo, la nube de datos muestra una tendencia hacia
el primer cuadrante del plano lo que sugiere la presencia de localidades con vecino de valores simi-
lares. casos excepcionales para las poblaciones de Tumaco y Buenaventura que se presentan como
valores atípicos. En el cuarto cuadrante sobresale la ciudad de Medellín cuya posición sugiere que las
3 Según Zhukov (2010), un valor cero indica un patrón espacial aleatorio, un valor −1 indica dispersión perfecta y un
valor +1 correlación perfecta.

44
Figura 2.5: Gráfica de Dispersión - I de Morán para Desplazamiento Forzado

poblaciones vecinas presentan valores distintos de casos de desplazamiento forzado.

Llama la atención que una gran proporción de los datos se ubican en la zona media superior lo que
indica que la mayoría de las poblaciones son zonas de transición de regímenes espaciales. Este as-
pecto sugiere que, pese a que en todos los municipios registraron casos de desplazamiento durante el
periodo de estudio, el fenómeno se concentra en unas zonas específicas.

Las observaciones influyentes del fenómeno de desplazamiento forzado entendido como un proceso
espacial se muestran a continuación:

Potentially influential observations of


lm(formula = wx ~ x) :

dfb.1_ dfb.x dffit cov.r cook.d hat


DIBULLA 0.04 0.12 0.15_* 0.99_* 0.01 0.00
SANTA MARTA 0.01 -0.05 -0.05 1.03_* 0.00 0.03_*
CIENAGA 0.04 0.14 0.16_* 0.99_* 0.01 0.00
TURBO 0.00 -0.02 -0.02 1.01_* 0.00 0.01_*
VALENCIA 0.05 0.09 0.13_* 0.99_* 0.01 0.00
PUERTO SANTANDER 0.07 -0.02 0.07 0.99_* 0.00 0.00
UNGUIA 0.06 0.01 0.07 0.99_* 0.00 0.00
TIERRALTA 0.00 0.07 0.07 1.01_* 0.00 0.01_*
MONTELIBANO 0.00 0.13 0.13_* 1.01_* 0.01 0.01_*

45
LA APARTADA 0.07 0.00 0.07 0.99_* 0.00 0.00
APARTADO 0.03 0.15 0.17_* 0.99_* 0.01 0.00
CAUCASIA 0.00 0.04 0.05 1.01_* 0.00 0.01
PUERTO LIBERTADOR -0.01 0.23 0.24_* 1.00 0.03 0.01_*
CAREPA 0.09 0.05 0.13_* 0.98_* 0.01 0.00
CHIGORODO 0.04 0.09 0.12 0.99_* 0.01 0.00
TARAZA 0.01 0.14 0.16_* 1.00 0.01 0.01
SAN PABLO 0.00 0.00 0.00 1.01_* 0.00 0.00
TAME 0.00 -0.10 -0.11 1.01_* 0.01 0.01_*
SAN JERONIMO 0.10 -0.03 0.10 0.99_* 0.00 0.00
COPACABANA 0.12 -0.03 0.12 0.98_* 0.01 0.00
BELLO 0.09 0.06 0.14_* 0.97_* 0.01 0.00
MEDELLIN 0.40 -1.63_* -1.64_* 1.06_* 1.32_* 0.10_*
QUIBDO 0.00 -0.04 -0.05 1.01_* 0.00 0.01_*
GUARNE 0.11 -0.03 0.11 0.98_* 0.01 0.00
HELICONIA 0.14 -0.04 0.14_* 0.97_* 0.01 0.00
RIONEGRO 0.07 -0.01 0.07 0.99_* 0.00 0.00
RETIRO 0.07 -0.02 0.07 0.99_* 0.00 0.00
ITAGUI 0.11 0.03 0.13 0.97_* 0.01 0.00
ENVIGADO 0.11 -0.03 0.11 0.98_* 0.01 0.00
ANGELOPOLIS 0.07 -0.02 0.07 0.99_* 0.00 0.00
LA ESTRELLA 0.11 -0.03 0.11 0.98_* 0.01 0.00
EL LITORAL DEL SAN JUAN 0.12 0.18 0.26_* 0.94_* 0.03 0.00
BUENAVENTURA 1.90_* -6.51_* -6.52_* 1.37_* 19.93_* 0.36_*
DARIEN 0.14 -0.03 0.14_* 0.97_* 0.01 0.00
CHAPARRAL 0.00 0.00 0.00 1.01_* 0.00 0.00
DAGUA 0.16 0.04 0.19_* 0.93_* 0.02 0.00
CALI 0.02 0.24 0.26_* 0.99_* 0.03 0.01_*
JAMUNDI 0.15 0.05 0.19_* 0.94_* 0.02 0.00
LOPEZ 0.08 0.31 0.37_* 0.93_* 0.07 0.00
VISTAHERMOSA 0.00 0.01 0.01 1.01_* 0.00 0.00
SUAREZ 0.00 0.04 0.04 1.01_* 0.00 0.01
TIMBIQUI 0.02 0.16 0.18_* 0.99_* 0.02 0.00
SAN VICENTE DEL CAGUAN 0.00 -0.03 -0.03 1.02_* 0.00 0.01_*
SAN JOSE DEL GUAVIARE 0.00 0.00 0.00 1.01_* 0.00 0.01_*
EL TAMBO 0.00 0.05 0.06 1.01_* 0.00 0.01_*
PUERTO CONCORDIA 0.06 0.01 0.07 0.99_* 0.00 0.00
GUAPI 0.03 0.21 0.24_* 0.98_* 0.03 0.00
SANTA BARBARA 0.13 0.10 0.20_* 0.94_* 0.02 0.00
LA MACARENA 0.07 0.04 0.09 0.99_* 0.00 0.00
EL CHARCO 0.00 -0.01 -0.01 1.02_* 0.00 0.02_*
LA TOLA 0.11 0.02 0.12 0.97_* 0.01 0.00
FRANCISCO PIZARRO 0.24 0.08 0.30_* 0.86_* 0.04 0.00
ARGELIA 0.00 0.19 0.20_* 1.00 0.02 0.01_*
ROBERTO PAYAN 0.08 0.19 0.24_* 0.96_* 0.03 0.00
EL DONCELLO 0.06 0.05 0.09 0.99_* 0.00 0.00
BALBOA 0.04 0.06 0.09 0.99_* 0.00 0.00
MAGUI 0.05 0.04 0.08 0.99_* 0.00 0.00
LEIVA 0.06 0.04 0.09 0.99_* 0.00 0.00
FLORENCIA 0.00 -0.02 -0.03 1.01_* 0.00 0.01_*
TUMACO 0.57 -2.10_* -2.10_* 1.19_* 2.17_* 0.18_*
CALAMAR 0.06 0.01 0.07 0.99_* 0.00 0.00
POLICARPA 0.00 -0.01 -0.01 1.01_* 0.00 0.00

46
EL PAUJIL 0.06 0.05 0.09 0.99_* 0.00 0.00
BARBACOAS 0.02 0.26 0.28_* 0.98_* 0.04 0.01_*
RICAURTE 0.11 0.11 0.19_* 0.96_* 0.02 0.00
CARTAGENA DEL CHAIRA 0.01 0.12 0.13_* 1.00 0.01 0.01_*
PUERTO GUZMAN 0.00 0.04 0.04 1.01_* 0.00 0.01_*
PUERTO CAICEDO 0.05 0.03 0.07 0.99_* 0.00 0.00
PUERTO ASIS 0.00 0.10 0.11 1.01_* 0.01 0.01_*
SAN MIGUEL 0.08 0.11 0.16_* 0.98_* 0.01 0.00
ZONA BANANERA 0.00 0.02 0.02 1.01_* 0.00 0.00
MUTATA 0.06 0.02 0.07 0.99_* 0.00 0.00

Cabe resaltar que estas poblaciones señaladas coinciden con las que Cantor (2011) e Ibañes & Vélez
(2008) señalan como ejes del desplazamiento forzado en Colombia.

La Figura 2.6 corresponde a los valores del coeficiente de correlación espacial local I de Morán para
el desplazamiento forzado. Los "puntos calientes"del mapa indican aquellas poblaciones donde el vo-
lumen de casos de desplazamiento forzado son significativamente diferentes de los centros poblados
vecinos.

Los resultados observados hasta el momento conllevan al planteamiento de modelos que permitan
explicar los factores que motivan el desplazamiento forzado. El mapa de la Figura 2.10b, presentado
anteriormente, mostraba la distribución espacial de las acciones bélicas o incursiones armadas del
periodo 2007 - 2016 y el mapa de la Figura 2.2a la distribución espacial del desplazamiento forzado.
Se observaban múltiples coincidencias de presencia de los dos sucesos en los mapas lo que sugiere
que es posible emplear la variable que describe las incursiones armadas como factor explicativo del
desplazamiento forzado.

En el apartado siguiente se analizarán varios modelos que permitan explicar el desplazamiento for-
zado como fenómeno espacial dependiente de los eventos de conflicto armado, específicamente, las
acciones bélicas o incursiones armadas registradas durante el mismo periodo.

Finalmente, la Figura 2.7 representa la posible influencia de las acciones bélicas sobre el desplaza-
miento forzado.

47
Figura 2.6: Mapa de Correlación Local (Coeficiente I de Moran)

Figura 2.7: Gráfica de Dispersión Acciones Bélicas y Desplazamiento Forzado

48
2.3. Modelos Espaciales

Un primer enfoque empelado para analizar el desplazamiento forzado en el caso Colombia corres-
ponde a modelos espaciales. Se emplearán tres modelos:

El Modelo Autorregresivo Espacial (SAR por su nombre en inglés: “Spatial Auto Regressive
Model”

El Modelo de Error Espacial (SEM: “Spatial Error Model”)

El Modelo Espacial de Durbin (SDM: “Spatial Durbin Model”)

2.3.1. Modelo SAR: Spatial Auto Regresive

Ward & Gletisch (2008) y Zhukov (2010) expresan este modelo como:

y = ρWy
Wy +X
Xβ +ε (2.2)

para el caso de estudio, y representa el volumen de casos de desplazamiento forzado por centro pobla-
do; X la variable acciones bélicas registradas en cada centro poblado, ρ describe la autocorrelación
espacial y W la matriz de pesos espaciales. Los resultados obtenidos para este modelo son:

Call:
lagsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,
zero.policy = T, tol.solve = 1e-12)

Residuals:
Min 1Q Median 3Q Max
-32798.902 -625.144 -260.921 16.111 104563.801

Type: lag
Regions with no neighbours included:
908 1119 1120 1121
Coefficients: (numerical Hessian approximate standard errors)
Estimate Std. Error z value Pr(>|z|)
(Intercept) 260.9630 174.3136 1.4971 0.1344
ACC.BELIC 121.3348 5.4784 22.1480 <2e-16

Rho: 0.23192, LR test value: 40.786, p-value: 1.6981e-10


Approximate (numerical Hessian) standard error: 0.035583
z-value: 6.5177, p-value: 7.1395e-11
Wald statistic: 42.48, p-value: 7.1395e-11

Log likelihood: -11129.66 for lag model

49
Figura 2.8: Mapa Residuos SAR

ML residual variance (sigma squared): 23953000, (sigma: 4894.1)


Number of observations: 1122
Number of parameters estimated: 4
AIC: 22267, (AIC for lm: 22306)

Según se observa, el desplazamiento forzado obedece a eventos del conflicto armado como el caso
de las acciones bélicas o incursiones armadas. Además, con base en la evidencia es posible afirmar
que existe dependencia espacial en el caso del desplazamiento forzado (ρ = 0,23192; p − value =
1,698 × 10−10 ). El mapa de la Figura 2.8 muestra los residuos espaciales del modelo.

Con base en lo anterior, es necesario evaluar si el modelo SAR tiene la capacidad de describir toda la
dependencia espacial, para lo que se va a calcular el coeficiente de correlación espacial I de Morán

50
para los residuos:

Moran I test under randomisation

data: res.sar
weights: col.W_cont_el_mat

Moran I statistic standard deviate = 4.2919, p-value = 8.856e-06


alternative hypothesis: greater
sample estimates:
Moran I statistic Expectation Variance
0.0673496289 -0.0008952551 0.0002528335

Como se observa, aunque la autocorrrelación espacial es pequeña (I = 0,0673) los residuos del mode-
lo no describen patrones espaciales aleatorios. La presencia de dependencia espacial en los residuos
sugiere la posibilidad de sesgo por variables omitidas.

El modelo SAR estimado puede resumirse como en la Tabla 2.1. Las cifras entre paréntesis corres-
ponden al p-valor asociado a las pruebas de hipótesis de los parámetros del modelo.

Tabla 2.1: Resumen del Modelo SAR

SAR
(Intercept) 260.96 (0.1344)
ACC.BELIC 121.33 (<2e-16)
ρ 0.23192 (1.6981e-10)
AIC 22267.33
I de Moran (residuales) 0.06735
S.E. I de Moran 4.2919 (8.856e-06)

En el análisis exploratorio se identificaron tres poblaciones con un volumen alto de casos de desplaza-
miento (Medellín, Buenaventura y Tumaco) por lo que se estimó el efecto de equilibrio (incremento
del volumen de desplazados) en el caso que se duplicaran las acciones bélicas en estos municipios.
La tabla 2.2 muestra los nombres de las 10 poblaciones que presentarían mayor cambio hipotético en
el desplazamiento forzado dado una duplicación hipotética de las acciones bélicas en las poblaciones
de Medellín, Buenaventura y Tumaco.

La Figura 2.9, muestra el histograma correspondiente al efecto equilibrio anteriormente descrito.

51
Tabla 2.2: “Top 10” del Efecto Equilibro para el Modelo SAR

POBLACIÓN Efeecto Equilibrio del modelo SAR


LA GLORIA 103473.04
TAMALAMEQUE 85043.14
NEIRA 84469.49
CORDOBA 83637.94
CHINU 82549.75
SINCE 81113.56
EL GUACAMAYO 80837.82
GUADALUPE 79605.64
MAGANGUE 73802.20
ANSERMA 73209.44

Los mapas de la Figura 2.10 describen el efecto equilibrio de las acciones bélicas sobre el desplaza-
miento forzado.

2.3.2. Modelo SEM: Spatial Error Model

Uno de los principales problemas del modelo SAR es la posibilidad de sesgo por variables omitidas.
Los Modelos SEM y SDM incluyen en su estructura la dependencia espacial del error, por lo que
pueden presentar un mejor ajuste.

El primer modelo a estimar es el SEM cuyos resultados se presentan a continuación:

Call:
errorsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,
zero.policy = T, tol.solve = 1e-15)

Residuals:
Min 1Q Median 3Q Max
-38626.287 -599.305 -315.093 55.915 101584.104

Type: error
Regions with no neighbours included:
908 1119 1120 1121
Coefficients: (asymptotic standard errors)
Estimate Std. Error z value Pr(>|z|)
(Intercept) 558.4053 238.9992 2.3364 0.01947
ACC.BELIC 141.5640 5.8862 24.0500 < 2e-16

Lambda: 0.38862, LR test value: 88.96, p-value: < 2.22e-16


Asymptotic standard error: 0.040633
z-value: 9.5641, p-value: < 2.22e-16
Wald statistic: 91.473, p-value: < 2.22e-16

52
Figura 2.9: Histograma del Efecto Equilibrio Modelo SAR

(a) Efecto Equilibrio (b) Acciones Bélicas

Figura 2.10: Efecto Equilibrio Modelo SAR

53
Tabla 2.3: Resumen Modelos SAR y SEM

SAR SEM
(Intercept) 260.9630 (0.1344) 558.4053 (0.01947)
ACC.BELIC 121.3348 (<2e-16) 141.5640 (<2e-16)
ρ 0.23192 (1.6981e-10)
λ 0.38862 (<2.22e-16)
AIC 22267 22219
I de Moran (Residuales) 0.06735 -0.0157
S.E. I de Moran 4.2919 (8.856e-06) -0.93427 (0.8249)

Log likelihood: -11105.58 for error model


ML residual variance (sigma squared): 22520000, (sigma: 4745.5)
Number of observations: 1122
Number of parameters estimated: 4
AIC: 22219, (AIC for lm: 22306)

Con un nivel de significancia α = 0,05 la evidencia sugiere que el modelo SEM estimado permite
explicar adecuadamente la interdependencia espacial de las variables. El coeficiente λ es positivo y
altamente significativo lo que indica dependencia espacial en los errores. El cálculo del coeficiente de
correlación I de Morán para los residuales del modelo obtuvo los siguientes resultados:

Moran I test under randomisation

data: res.sem
weights: col.W_cont_el_mat

Moran I statistic standard deviate = -0.93427, p-value = 0.8249


alternative hypothesis: greater
sample estimates:
Moran I statistic Expectation Variance
-0.0157531476 -0.0008952551 0.0002529099

Los valores observados sugieren que el modelo SEM recoge adecuadamente toda la autocorrelación
espacial de las variables. El resumen del modelo SEM, y comparado con el SAR, se aprecia en la
Tabla 2.3. El mapa para los residuales del SEM se observa en la figura

2.3.3. Modelo SDM: Spatial Durbin Model

Otro modelo a estimar para definir la interdependencia espacial de las variables es el SDM. Motivado
por lo concerniente al sesgo por variables omitidas este modelo incluye, ademas de la autocorrela-
ción espacial de la variable dependiente, los rezagos espaciales de las covariables. Los resultados de
estimación de este modelo para el caso de estudio se presentan a continuación:

54
Figura 2.11: Mapa Residuos SEM

55
Call:
lagsarlm(formula = DESPLAZADOS ~ ACC.BELIC, data = colb2, listw = col.W_cont_el_mat,
type = "mixed", zero.policy = T, tol.solve = 1e-12)

Residuals:
Min 1Q Median 3Q Max
-40541.855 -726.443 -501.743 57.329 100926.047

Type: mixed
Regions with no neighbours included:
908 1119 1120 1121
Coefficients: (numerical Hessian approximate standard errors)
Estimate Std. Error z value Pr(>|z|)
(Intercept) 581.4218 171.5297 3.3896 0.0006999
ACC.BELIC 148.6759 6.3953 23.2478 < 2.2e-16
lag.ACC.BELIC -78.3992 10.1965 -7.6888 1.488e-14

Rho: 0.38025, LR test value: 86.933, p-value: < 2.22e-16


Approximate (numerical Hessian) standard error: 0.03838
z-value: 9.9075, p-value: < 2.22e-16
Wald statistic: 98.158, p-value: < 2.22e-16

Log likelihood: -11101.66 for mixed model


ML residual variance (sigma squared): 22392000, (sigma: 4732)
Number of observations: 1122
Number of parameters estimated: 5
AIC: 22213, (AIC for lm: 22298)

Según se observa el SDM resulta significativamente mejor ajustado.

El cálculo del coeficiente de autocorrelación espacial I de Morán se presenta a continuación:

Moran I test under randomisation

data: res.sdm
weights: col.W_cont_el_mat

Moran I statistic standard deviate = -0.84742, p-value = 0.8016


alternative hypothesis: greater
sample estimates:
Moran I statistic Expectation Variance
-0.0143981787 -0.0008952551 0.0002538952

El resumen de los tres modelos (SAR, SEM y SDM) se presenta en la Tabla 2.4.

El mapa de los residuos del SDM se observa en la Figura

56
Tabla 2.4: Resumen Modelos SAR, SEM y SDM

SAR SEM SDM


(Intercept) 260.9630 (0.1344) 558.4053 (0.01947) 518.4218 (0.0007)
ACC.BELIC 121.3348 (<2e-16) 141.5640 (<2e-16) 148.6759 (<2.2e-16)
ρ 0.23192 (1.6981e-10) 0.38025 (<2.2e-16)
λ 0.38862 (<2.22e-16)
θ -78.3992 (1.488e-14)
AIC 22267 22219 22213
I de Moran (Residuales) 0.06735 -0.0157 -0.014398
S.E. I de Moran 4.2919 (8.856e-06) -0.93427 (0.8249) -0.84742 (0.8016)

Figura 2.12: Mapa Residuos Modelo SDM

57
2.4. Modelo Espacio-Temporal

En la Sección 1.3.5 se presentaron varios modelos espacio-temporales. El caso de los modelos STAR-
MA y STARIMA, como lo denotan las ecuaciones 1.87 y 1.88, suponen procesos espacio-temporales
univariados. El fenómeno de desplazamiento forzado, como se explicó en la sección 2.1, debe enten-
derse como un proceso de interdepencia espacial según lo plantean Ibáñez & Vélez (2008)4 . Por lo
anterior, en esta sección se desarrollara sólo el caso especial de modelo espacio temporal descrito en
la sección 1.3.2.

2.4.1. Modelo de Interdepencia Espacio-Temporal

Al considerarse el desplazamiento forzado como una decisión no voluntaria se entiende que existen
otras variables que pueden llegar a influir en el proceso. EL algoritmo en R del paquete SpatioTem-
poral tiene algunos requerimientos especiales: incluir variables categóricas que permitan identificar
la existencia de efecto Nugget y variables adicionales diferentes a las covariables espacio-temporales.

Para el ejemplo se incluyeron las 13 Zonas político-militares-administrativas como variable de agru-


pamiento y el área de los municipios como covariable no espacio-temporal. Para reducir el tiempo de
computo y restringir el uso de memoria se consideraron sólo las capitales de departamento (estados)
existentes en Colombia.

La Figura 2.13 muestra la localización espacio-temporal del desplazamiento forzado, la gráfica de


probabilidad normal de las observaciones y la dependencia del desplazamiento forzado con el área
que abarca el ente territorial.

Se observa que las observaciones espacio-temporales del desplazamiento forzado no siguen una dis-
tribución normal y la dependencia de las mismas observaciones con el área del municipio no está
definida de manera clara.

Antes de estimar el modelo se requiere identificar el número de funciones base del mismo para lo
4 ...el desplazamiento forzado es el resultado de un ataque violento y una decisión no voluntaria: Las familias huyen

para salvar sus vidas y proteger sus bienes... (Ibáñez & Vélez, 2008

58
Figura 2.13: Locaciones Espacio-Temporales de las observaciones divididas en Zonas, gráfica de
comprobación de cuantiles y dependencia de las observaciones con el Área del Municipio

cual se empleó el Error Cuadratico Medio (MSE); el coeficiente de determinación R2 y los criterios
de información de Akaike (AIC) y bayesiano (BIC):

Result of SVDsmoothCV, average of CV-statistics:


MSE R2 AIC BIC
n.basis.0 15575.919 0.0000000 796.8352 799.5178
n.basis.1 11678.715 0.2514713 763.7296 769.0947
n.basis.2 11006.030 0.2922089 759.7309 767.7785
n.basis.3 10686.466 0.3103862 758.4320 769.1622
n.basis.4 9765.892 0.3246857 758.2084 771.6211

Los valores observados sugieren que dos (2) funciones básicas son suficientes para estimar el modelo
espacio-temporal de interdependencia. La Figura 2.14 presenta un resumen gráfico de los resultados
anteriores.

El paso siguiente consiste en calcular los coeficientes β para las locaciones para luego realizar la
estimación del modelo espacio-temporal. Los resultados obtenidos se muestran a continuación:

beta.const beta.V1 beta.V2 beta.sd.const beta.sd.V1 beta.sd.V2


05001 438.782791 10.3685255 -124.6709694 39.8442904 40.5485737 40.0645011
08001 26.528747 -10.0443125 -1.1324179 1.3216463 1.3578392 1.3288879
11001 54.254995 -30.5973465 4.2534185 3.0816442 3.1660341 3.0985292
13001 31.200984 -12.4462614 -3.0873271 1.7306380 1.8072691 1.7381817
15001 3.085053 -0.7711746 -0.4313180 0.7137243 0.4736014 0.6010360
17001 9.613863 -5.2065053 -0.4410209 0.7514073 0.7552692 0.7238294
18001 123.492345 -81.6322675 12.3632540 6.7518449 6.9541455 6.7908446

59
Figura 2.14: Validación Cruzada de los resultados para las posibles funciones base

19001 25.629053 -5.2759055 -6.3085159 1.1255288 1.1800505 1.1314923


20001 85.926893 -112.0712772 13.9379260 7.0324696 7.3304306 7.0390126
23001 66.919710 -22.8068264 9.3896958 4.5039660 4.6273058 4.5286442
25001 3.952432 -0.3029615 -0.3742932 0.8402204 0.5462641 0.7293220
27001 130.012027 -36.5955045 -36.4234343 8.1936634 8.3384937 8.2389480
41001 66.891579 -31.0997431 8.6422907 3.4532632 3.6205427 3.4715599
44001 97.042982 -48.2027959 36.1125823 7.5051064 7.8374258 7.5378202
47001 265.908849 -318.1356109 -29.9991408 26.1361137 26.9192111 26.2870799
50001 31.119191 -6.1068561 -1.1800171 1.6508275 1.7176428 1.6602981
52001 22.599577 -7.5262933 -4.0522408 1.5009406 1.5524500 1.5112312
54001 73.810020 -18.3340427 -18.1082468 6.0514666 6.2963928 6.0861834
63001 12.159291 -4.1072495 -0.7183323 0.8446551 0.8681555 0.8414524
66001 23.514000 -11.8601884 -5.7900290 1.4410997 1.4789986 1.4516659
68001 20.408636 -18.4578101 2.9373085 1.4719485 1.5356079 1.4603571
70001 29.610695 -14.0339816 -0.8932888 2.0164183 2.0768348 2.0280654
73001 90.631216 -39.3577629 1.6907988 5.5759583 5.7842251 5.6058194
76001 113.536063 -6.2345555 -48.3815499 6.9751313 7.1841221 7.0154207
81001 45.751804 -22.0039922 2.9280695 2.7723779 2.8168998 2.7860580
85001 14.967070 -7.2970375 0.3281703 0.9876059 1.0209421 0.9885322
86001 24.522141 -7.6072885 -3.5746276 1.2495528 1.2966000 1.2539906
88001 3.402222 -0.2811495 -0.6908851 0.6930618 0.9223580 0.7264687
91001 6.592266 -2.2034818 -1.0368612 0.5622749 0.5945782 0.5493178
94001 15.634581 -5.3836598 -0.1061732 1.1369199 1.1823822 1.1402705
95001 125.457012 -57.7879032 39.1696826 8.0938828 8.4214734 8.1403168
97001 16.707169 -7.8769166 3.6197763 1.2432252 1.2986987 1.2418764
99001 8.912128 -6.2679311 0.4593658 0.7813621 0.7640424 0.7760521

Con esto, se obtienen los coeficientes espaciales del modelo. Se procede a simular la respuesta de las
observaciones en función del área del municipio. La Figura 2.15 permite evaluar las funciones base
en función de la covariable Área del Municipio. Se observa una gran dispersión en varios puntos lo

60
Figura 2.15: Estimaciones de regresión de β1 (s) y β2 (s) en cada ubicación, con intervalos de confianza
del 95 %, en función del Área del municipio

que podría implicar dificultades para el cálculo de las funciones de covarianza y el efecto nugget.

Como tal, el proceso de computo supone dificultades debido a la presencia valores cero en múltiples
puntos para la covariable espacio-temporal (Acciones Bélicas). El resultado se presenta a continua-
ción:

Optimisation using starting value 1/2


N = 21, M = 5 machine precision = 2.22045e-16
At X0, 0 variables are exactly at the bounds
At iterate 0 f= 1.2259e+06 |proj g|= 15
At iterate 10 f = 15750 |proj g|= 24.373
At iterate 20 f = 15466 |proj g|= 12.655
At iterate 30 f = 15453 |proj g|= 3.6905
At iterate 40 f = 15450 |proj g|= 4.8059
At iterate 50 f = 15450 |proj g|= 0.53253
At iterate 60 f = 15449 |proj g|= 1.4539
At iterate 70 f = 15449 |proj g|= 1.7082
At iterate 80 f = 15449 |proj g|= 0.58783
At iterate 90 f = 15449 |proj g|= 3.1424
ys=-5.118e-01 -gs= 7.545e-01, BFGS update SKIPPED
At iterate 100 f = 15446 |proj g|= 2.5051
At iterate 110 f = 15445 |proj g|= 4.6288
At iterate 120 f = 15353 |proj g|= 21.987

61
At iterate 130 f = 15319 |proj g|= 2.7983
At iterate 140 f = 15319 |proj g|= 0.26712

iterations 144
function evaluations 187
segments explored during Cauchy searches 161
BFGS updates skipped 1
active bounds at final generalized Cauchy point 1
norm of the final projected gradient 0.0519789
final function value 15319.1

F = 15319.1
l(0) > u(0). No feasible solutionfinal value 15319.149208
converged

Error in solve.default(res[[i]]$hessian) :
Lapack routine dgesv: system is exactly singular: U[1,1] = 0

Los resultados de la estimación indican que la optimización el punto de partida no converge.

Existe un problema particular con los datos que está asociado a la covariable espacio-temporal: mul-
tiplicidad de valores cero debido a que no todas las localidades registraron acciones bélicas durante
el periodo de tiempo observado. Esta situación hace que el sistema de ecuaciones no tenga solución
debido a la singularidad por lo que el modelo, debido a la características de los datos, sólo posee
componente espacial.

2.4.2. Modelo VAR

En la sección 1.3.5 se presentó el modelo VAR como una alternativa para analizar un proceso espacio-
temporal; sin embargo, este modelo tiene como limitante que sólo es efectivo cuando se tienen pocas
unidades espaciales.

El fenómeno de desplazamiento forzado en Colombia posee observaciones en 1107 unidades terri-


toriales o municipios, lo que hace que no sea un modelo adecuado para implementar. Sin embargo,
en este apartado se incluye, como parte del ejercicio el análisis del desplazamiento forzado como
consecuencia de las acciones bélicas o incursiones armadas bajo el supuesto que cualquier incursión
armada genera una respuesta sobre las personas de la misma unidades territorial y que el efecto puede
reflejarse, también, a través del comportamiento temporal de las variables para lo cual el modelo VAR
es una buena herramienta.

62
Un primer paso es identificar el número de rezagos distribuidos en las variables de interes; los resul-
tados se muestran a continuacion:

$selection
AIC(n) HQ(n) SC(n) FPE(n)
1 1 1 1

$criteria
1 2 3 4 5
AIC(n) 2.912416e+01 2.916772e+01 2.917865e+01 2.923036e+01 2.927449e+01
HQ(n) 2.918229e+01 2.926460e+01 2.931429e+01 2.940475e+01 2.948764e+01
SC(n) 2.926737e+01 2.940641e+01 2.951282e+01 2.966000e+01 2.979961e+01
FPE(n) 4.451145e+12 4.649722e+12 4.701746e+12 4.952942e+12 5.179174e+12

Según se observa, todos los criterios apuntan a que el número máximo de rezagos para la ecuación es uno (1).
Con este parámetro fijado se procede a estimar el modelo. Los resultados son los siguientes:

VAR Estimation Results:


=========================
Endogenous variables: Desplazamiento, Acciones.Belicas
Deterministic variables: const
Sample size: 119
Log Likelihood: -2066.987
Roots of the characteristic polynomial:
0.8539 0.001083
Call:
VAR(y = fenom.ts, p = 1, type = "const")

Estimation results for equation Desplazamiento:


===============================================
Desplazamiento = Desplazamiento.l1 + Acciones.Belicas.l1 + const

Estimate Std. Error t value Pr(>|t|)


Desplazamiento.l1 0.85400 0.04718 18.099 <2e-16 ***
Acciones.Belicas.l1 -0.08634 1.54170 -0.056 0.9554
const 2696.30105 1140.18457 2.365 0.0197 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5906 on 116 degrees of freedom


Multiple R-Squared: 0.7386, Adjusted R-squared: 0.734
F-statistic: 163.8 on 2 and 116 DF, p-value: < 2.2e-16

Estimation results for equation Acciones.Belicas:


=================================================
Acciones.Belicas = Desplazamiento.l1 + Acciones.Belicas.l1 + const

63
Estimate Std. Error t value Pr(>|t|)
Desplazamiento.l1 6.531e-04 2.841e-03 0.230 0.819
Acciones.Belicas.l1 1.017e-03 9.284e-02 0.011 0.991
const 9.338e+01 6.866e+01 1.360 0.176

Residual standard error: 355.6 on 116 degrees of freedom


Multiple R-Squared: 0.0004574, Adjusted R-squared: -0.01678
F-statistic: 0.02654 on 2 and 116 DF, p-value: 0.9738

Covariance matrix of residuals:


Desplazamiento Acciones.Belicas
Desplazamiento 34877258 50694
Acciones.Belicas 50694 126479

Correlation matrix of residuals:


Desplazamiento Acciones.Belicas
Desplazamiento 1.00000 0.02414
Acciones.Belicas 0.02414 1.00000

Según se observa, el desplazamiento forzado responde al estímulo inmediato de las acciones bélicas y al efecto
de la misma variable en su primer rezago. El efecto espacio-temporal de la covariable fue analizado en el
apartado anterior y la relación descrita por el modelo VAR es mejor explicado a través de los modelos de
interdependencia espacial presentados en la sección 2.3. Por lo tanto, se descarta el modelo VAR para el análisis
del desplazamiento forzado y su relación con la variable acciones bélicas.

64
Capítulo 3

Conclusiones

El principal objetivo de este trabajo ha sido modelar el fenómeno de desplazamiento forzado a la luz de los
evento de conflicto armado en Colombia registrados durante el periodo enero de 2007 - diciembre 2016, para
lo cual se recurrió a la implementación de modelos espaciales y modelos espacio-temporales.

En el caso de los modelos espaciales se encontró:

El modelo SAR no permite explicar adecuadamente la interdependencia espacial del fenómeno.


Los modelos SEM y SDM son capaces de vincular una estructura para la autocorrelación espacial lo que
les hace buenas opciones de modelamiento.
El SDM se observa como una leve ventaja sobre el modelo SEM para explicar el fenómeno de desplaza-
miento forzado en función de los eventos de conflicto armado.
En términos de la interdependencia espacial, se puede firmar que cualquier acción belica o incursion
armada en un ente territorial causa que las personas de mismo territorio y de los territorios vecinos se
desplacen de manera no voluntaria hacia otras regiones.
Los valores observados en los coeficientes de autocorrelación espacial (IdeMoran) sugieren que el des-
plazamiento forzado es un fenómeno que espacialmente autocorrelacionado.

Para los modelos espacio-temporales planteados se encontró:

El modelo de interdependencia espacial para proceso Gaussianos no permitió explicar el desplazamiento


forzado como un proceso espacio-temporal.
La alta presencia de valores cero en la variable acciones bélicas creó un sistema singular que truncó el
proceso de estimación del modelo.
El modelo VAR no fue efectivo para la estimación de un modelo que permitiera explicar el fenómeno de
desplazamiento forzado como un proceso espacio-temporal.

En general se tiene:

Por definición, el fenómeno de desplazamiento forzado no puede considerarse un proceso univariado por
lo que los modelos STARMA y STARIMA no son adecuados en este caso.
Es recomendable considerar entes territoriales mayores (departamentos o distritos) para evitar la singu-
laridad del proceso.
Se requiere realizar un estudio a más profundidad que permita incorporar otras variables de evento de
conflicto armado y variables de carácter socio-económico para definir mejor el fenómeno.
Se requiere desarrollar algoritmos que permitan incorporar observaciones ausentes y múltiples covaria-
bles espacio-temporales.

65
Bibliografía

1. Agencia EFE. (17 de septiembre de 2016). Cinco líderes en cinco décadas de las Farc. Obtenido de El
Heraldo: https://www.elheraldo.co/politica/cinco-lideres-en-cinco-decadas-de-las-farc-285794

2. Arnold, J. (2017). ggthemes: Extra Themes, Scales and Geoms for ’ggplot2’. R package version 3.4.0.
https://CRAN.R-project.org/package=ggthemes

3. Bivand, R. (2017). classInt: Choose Univariate Class Intervals. R package version 0.1-24. https://CRAN.R-
project.org/package=classInt

4. Bivand, R. & Lewin-Koh, N. (2017). maptools: Tools for Reading and Handling Spatial Objects. R
package version 0.9-2. https://CRAN.R-project.org/package=maptools

5. Bivand, R. & Piras, G. (2015). Comparing Implementations of Estimation Methods for Spatial Econo-
metrics. Journal of Statistical Software, 63(18), 1-36. URL http://www.jstatsoft.org/v63/i18/.

6. Bivand, R., Hauke, J., & Kossowski, T. (2013). Computing the Jacobian in Gaussian spatial autoregres-
sive models: An illustrated comparison of available methods. Geographical Analysis, 45(2), 150-179.

7. Bivand, R., Keitt, T. & Rowlingson, B. (2017). rgdal: Bindings for the Geospatial Data Abstraction
Library. R package version 1.2-7. https://CRAN.R-project.org/package=rgdal

8. Burrough, P. McDonnell, R. & Lloyd, C. (2015). Principles of Geographical Information Systems. Ox-
ford University Press, Oxford.

9. Cantor, D. J. (2011). The colombian guerrilla, forced displacement and return. Forced Migration Review,
(37), 20-22. Recuperado de: https://search.proquest.com/docview/ 869631540?accountid=29068

10. Cheng, T., Wang, J., & Li, X. (2011). A Hybrid Framework for Space–Time Modeling of Environmental
Data. Geographical Analysis, 43, 188-2010.

11. Cheysson, F. (2016). starma: Modelling Space Time AutoRegressive Moving Average (STARMA) Pro-
cesses. R package version 1.3. https://CRAN.R-project.org/package=starma

12. Cressie, N. & Wikle, C.K. (2011). Statistics for Spatio-Temporal Data. Wiley Series in Probability and
Statistics.Wiley, New York.

13. De Oliveira, V. (2006). On Optimal Point and Block Prediction in Log-Gaussian Random Fields, Scan-
dinavian Journal of Statistics, 33, 523–540.

14. Diggle, P. (2014). Statistical Analysis of Spatial and Spatio-Temporal Points patterns. Taylor & Francis
Group. Boca Ratón.

15. Gelfand, A., Diggle, P., Fuentes, M. & Guttorp, P. (2010). Handbook of Spatial Statistics. Boca Ratón:
Taylor & Francis Group.

16. Gneiting, T., Genton, M. & Guttorp, P. (2007). Geostatistical Space-Time Models, Stationarity, Sepa-
rability and Full Symmetry. En Finkenstädt, B., Held, L. and Isham, V. (Eds.), Statistical Methods for
Spatio-Temporal Systems, Chapman & Hall, Boca Raton, FL, pp. 151–175. .

66
17. Gneiting, T. & Guttorp, P. (2010). Continuous parameter Spatio-Temporal Processes. En A. Gelfand, P.
Diggle, M. Fuentes, & P. Guttorp, Handbook of Spatial Statistics (págs. 427-436). Boca Ratón: Taylor
& Francis Group.

18. Greenberg, J. & Mattiuzzi, M (2015). gdalUtils: Wrappers for the Geospatial Data Abstraction Library
(GDAL) Utilities. R package version 2.0.1.7. https://CRAN.R-project.org/package=gdalUtils

19. Güting, R. & Schneider, M. (2005). Moving Objects Databases. Morgan Kaufmann.

20. Hijmans, R. (2016a). Introduction to the ’raster’ package (version 2.5-8). https://CRAN.R-project.org/package=raster

21. Hijmans, R. (2016b). Raster: Geographic Data Analysis and Modeling. R package version 2.5-8. https://cran.r-
project.org/web/packages/raster/vignettes/Raster.pdf

22. Huisman, O & A. de By, R. (2009). Principles of Geographic Information System. An Introductory
Textbook. The International Institute for Geo-Information Science and Earth Observation (ITC), The
Netherlands.

23. Ibañez, A. M., & Velez, C. E. (2008). Civil Conflict and Forced Migration: The Micro Determinants and
Welfare Losses of Displacement in Colombia. World Development, 36(4), 659-676.

24. Kurt, S., & Tunay, B. (2015). STARMA Models Estimation with Kalman Filter: The Case of Regional
Bank Deposits. Procedia - Social and Behavioral Sciences, 2537-2547.

25. Lee, D., Rushworth, A. & Napier, G. (2017). CARBayesST: Spatio-Temporal Generalised Linear Mi-
xed Models for Areal Unit Data. R package version 2.5. https://CRAN.R-project.org/package =CARBa-
yesST

26. Lindstrom, J. & Bergen, S. (2013a). Comprehensive Tutorial for the Spatio-Temporal R-package. R
package version 1.1.7. https://CRAN.R-project.org/package =SpatioTemporal

27. Lindstrom, J., Szpiro, A., Sampson, P., Bergen, S. & Oron, A. (2013b). SpatioTemporal: Spatio-Temporal
Model Estimation. R package version 1.1.7. https://CRAN.R-project.org/package =SpatioTemporal

28. Lindstrom, J., Szpiro, A., Sampson, P., Bergen, S. & Sheppard, L. (2013c). SpatioTemporal: An R
Package for Spatio-Temporal Modelling of Air-Pollution. R package version 1.1.7. https://CRAN.R-
project.org/package =SpatioTemporal

29. Mantilla, C. (2015). Factorial Analysis for Forced Migration in Colombia. International Statistical Insti-
tute (ISI) - 60th World Statistics Congreee - ISI2015. Recuperado de: http://www.isi2015.org

30. Moreno, R. & Vayá. E. (2000). Ténicas econométricas para el tratamiento de datos espaciales : la
econometría espacial. Universitat de Barcelona, Barcelona.

31. Paradis, E. (2017). Moran’s Autocorrelation Coefficient in Comparative Methods. Recuperado de: https://cran.r-
project.org/web/packages/ape/vignettes/

32. Pebesma, E. (2012). Spacetime: Spatio-Temporal Data in R. In: Journal of Statistical Software 51.7, pp.
1–30. ISSN: 1548-7660. http://www.jstatsoft.org/v51/i07.

33. Perpiñán, O. (2014). Displaying Time Series, Spatial, and Space-Time Data with R. Taylor & Francis
Group. Boca Ratón.

34. Perpinán, O. & Hijmans, R. (2016), meteoForecast. R package version 0.41.

35. Pfeifer, P., & Deutsch, S. (1980). A STARIMA model-building procedure with application to description
and regional forecasting. Transactions of the Institute of British Geographers, 5(3), 330-349.

36. Rui, C & De Oliveira, V (2008). Point and Block Prediction in Log-Gaussian Random Fields: The Non-
Constant Mean case, Journal of Statistical Planning and Inference, 138, 2128-2142.

67
37. Ryan, J. & Ulrich, J. (2014). xts: eXtensible Time Series. R package version 0.9-7. https://CRAN.R-
project.org/package=xts

38. Sherman, M. (2011). Spatial Statistics ans Spatio-Temporal Data. Covariance Functions and Directional
Properties. John Wiley & Sons, Ltd. United Kingdom

39. Tennekes, M. (2017). tmap: Thematic Maps. R package version 1.10. https://CRAN.R-project.org/ pac-
kage=tmap

40. Unidad de Manejo y Análisis de Información de Colombia. (2017). Sistema Integrado de Información
Humanitaria. Obtenido de https://sidi.umaic.org

41. Ward, M. & Gleditsch, KS. (2007). An Introduction to Spatial Regression Models in the Social Sciences.
SAGE Publications, Inc. California.

42. Ward, M. & Gleditsch, KS. (2007). Spatial Regression Models. SAGE Publications, Inc. California.

43. Wickham, H. (2007). Reshaping Data with the reshape Package. Journal of Statistical Software, 21(12),
1-20. URL http://www.jstatsoft.org/v21/i12/.

44. Wickham, H. & Francois, R. (2016). dplyr: A Grammar of Data Manipulation. R package version 0.5.0.
https://CRAN.R-project.org/package=dplyr

45. Wickham, H. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2009.

46. Zeileis, A. & Grothendieck, G. (2005). zoo: S3 Infrastructure for Regular and Irregular Time Series.
Journal of Statistical Software, 14(6), 1-27. doi:10.18637/jss.v014.i06

47. Zimmerman, D. & Stein, M. (2010). Classical geostatistical Methods. En A. Gelfand, P. Diggle, M.
Fuentes, & P. Guttorp, Handbook of Spatial Statistics (págs. 427-436). Boca Ratón: Taylor & Francis
Group.

48. Zhou, M. & Buongiorno, J. (2006). Space-Time Modeling of Timber Prices. Journal of Agricultural and
Resource Economics, 31(1), 40-56

49. Zhou, X & Lin. H. (2008). Geary’s C. En: Shekhar, S & Xiong. H, Encyclopedia of GIS (págs. 329-330),
Springer US.

50. Zhukov, Y. (2010). Applied Spatial Statistics in R. Recuperado de: http://scholar.harvard.edu/ zhukov/classes/appliedsp
- statistics-r.

51. Zivot, E. & Wang, J. (2006). Modeling Financial Time Series With S-PLUS .
R Springer. New York.

68
Anexos

Sintaxis en R del Caso de estudio

#######################################
#### DATOS ###
#######################################
rm(list=ls(all=TRUE))
ls()
save(list=ls(all=TRUE),file="base.RData")
load("base1.RData")

#######################################
#### LIBRERIAS BASICAS ###
#######################################

install.packages("rgdal")
install.packages("spdep")
install.packages("maptools")
install.packages("classInt")
install.packages("tmap")
install.packages("dplyr")
install.packages("xts")
install.packages("ggthemes")
install.packages("rasterVis")
install.packages("spatstat")
install.packages("pgirmess")
install.packages("spgwr")

library(rgdal)
library(spdep)
library(maptools)
library(classInt)
library(dplyr)
library(tmap)
library(raster)
library(zoo)
library(rasterVis)
library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)
library(SpatioTemporal)

69
library(plotrix)
library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)
library(maps) ## Projections
library(maptools) ## Data management
library(sp) ## Data management
library(spdep) ## Spatial autocorrelation
library(gstat) ## Geostatistics
library(splancs) ## Kernel Density
library(spatstat) ## Geostatistics
library(pgirmess) ## Spatial autocorrelation
library(RColorBrewer) ## Visualization
library(classInt) ## Class intervals
library(spgwr) ## GWR

#######################################
#### MAPAS ###
#######################################

#### LIBRERIAS

library(rgdal)
library(spdep)
library(maptools)
library(classInt)
library(dplyr)
library(tmap)

# Crear el objeto "colb" de "Municipios" shapefile


#colmpio<-readShapePoly("mpio")
col.mpios <- readOGR(dsn = "mpio", layer = "mpio")
win.graph(10,16,12)
plot(col.mpios) # plot the lnd object (not shown)
nrow(col.mpios) # return the number of rows (not shown)

#######################################
##### CAPTURA DE DATOS #####
#######################################
######## SERIE DESPLAZADOS
datos<-read.table("conflicto.txt",header = T, sep="\t",dec=",",
colClasses = c("numeric", "numeric", "character", "character", "numeric", "character", "charact
despl<-datos
summary(despl)
str(despl)
despl<-despl
despl$PERIODO<-as.Date(despl$FINAL, origin = "1899-12-30")
despl$MPIOS<-despl$CODIGO.MUNICIPIO
str(despl)
summary(despl)

70
plot(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl),type=’l’,lwd=2,cex=1.5)

library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)

plt.despl<-ggplot(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl),aes(PERIODO, DESPLAZADOS))

###############
### SERIE GENERAL

win.graph(10,6,6)
plt.despl + geom_line(size=1) +
geom_point(size=(aggregate(DESPLAZADOS~PERIODO,FUN=sum,despl)$DESPLAZADOS)/10000,col="red",shap
scale_x_date(date_labels = "%b %Y",date_breaks = "3 month")+
xlab("Mes. A~no") + ylab("Total Desplazados") + theme_light()+
theme(axis.text.x = element_text(hjust = 1,size=8,angle=90,vjust=1.5))+
ggtitle("Vı́ctimas de Desplazamiento Forzado en Colombia \n enero 2007 - diciembre 2016")

despl1$MPIOS<-as.factor(despl1$MPIOS)
despl$PERIODO<-factor(despl$PERIODO)
despl1<-despl[,c(5,7,8)]
despl1$MPIOS<-as.factor(despl1$MPIOS);str(despl1)
colb2<-col.mpios

despl.tot<-aggregate(DESPLAZADOS ~ MPIOS, FUN = sum, data = despl)

head(left_join(colb2@data, despl1))
colb2@data <- left_join(colb2@data, despl.tot)

colb2$DESPLAZADOS[is.na(colb2$DESPLAZADOS)] <- 0

colb2$DESPLAZADOS[is.na(colb2$DESPLAZADOS)] <- 0

colb2@data<-colb2@data[,c(5:8,11,16:17)]

split(colb2@data,colb2$PERIODO)

library(tmap) # load tmap package (see Section IV)


qtm(colb2, "DESPLAZADOS") # plot the basic map
qtm(colb2[colb2$DPTO=="05",], "DESPLAZADOS")
qtm(colb2[colb2$DPTO=="08",], "DESPLAZADOS")
qtm(colb2[colb2$DPTO=="11",], "DESPLAZADOS")
qtm(colb2[colb2$DPTO=="13",], "DESPLAZADOS")
qtm(colb2[colb2$DPTO=="15",], "DESPLAZADOS")
qtm(colb2[colb2$DPTO=="17",], "DESPLAZADOS")

#theme(axis.text.x = element_text(hjust = 1,size=0.5))+


#######################################
#### limpiar: rm(datos)

71
col.mpios$DESPLAZADOS[is.na(col.mpios$DESPLAZADOS)] <- 0

col.map_crd <- coordinates(colb2)


col.W_cont_el <- poly2nb(colb2, queen=T)
col.W_cont_el_mat <- nb2listw(col.W_cont_el, style="W", zero.policy=TRUE)

par(mar=rep(0,4))
plot(colb2,border="gray")
plot(col.W_cont_el_mat,coords=col.map_crd,pch=19, cex=0.1, add=T)
dev.off()

moran.test(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T)


geary.test(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T)

dev.off()

win.graph(10,6,12)
moran.plot(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T,
xlim=c(-0.3,125000),ylim=c(-0.3,35500), pch=16, col="black",cex=.5,
quiet=F, labels=as.character(colb2$MPIOS),xlab="Desplazados",
ylab="Desplazados (Spatial Lag)", main="Moran Scatterplot")

win.graph(10,6,12)
moran.plot(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T,
xlim=c(-0.3,125000),ylim=c(-0.3,35500), pch=16, col="black",cex=1,
quiet=F, labels=as.character(colb2$NOMBRE_MPI),xlab="Desplazados",
ylab="Desplazados (Spatial Lag)", main="Moran Scatterplot")

################ AUTOCORRELACION LOCAL

lm1 <- localmoran(colb2$DESPLAZADOS, listw=col.W_cont_el_mat, zero.policy=T)

colb2@data$lm1 <- abs(lm1[,4]) ## Extract z-scores

lm.palette <- colorRampPalette(c("white","orange", "red"), space = "rgb")


spplot(colb2[colb2$DPTO=="68",], zcol="lm1", col.regions=lm.palette(20),
main="Local Moran’s I (|z| scores)", pretty=T)

desene2007<-despl[despl$PERIODO=="2007-01-31",]
desene2007<-desene2007[,-1];str(desene2007)
desene2007<-desene2007[,c(4,7)];str(desene2007)
desene2007<-na.omit(desene2007)

72
col.mpios$MPIOS[!col.mpios$MPIOS %in% desene2007$MPIOS]
desene2007$MPIOS[!desene2007$MPIOS %in% col.mpios$MPIOS]

head(left_join(col.mpios@data, desene2007))
colb2@data <- left_join(colb2@data, desene2007)

####################################### Matriz Deplazamiento


eventosconflicto <- read.table("eventosdespl.txt",header=T,sep="\t",dec=",")
View(eventosconflicto)
eventosconflicto[is.na(eventosconflicto)]<-0
head(eventosconflicto)
rownames(eventosconflicto)<-eventosconflicto[,1]
head(array(eventosconflicto))
head(data.matrix(eventosconflicto[,-1]))

desplazados<-eventosconflicto;rm(eventosconflicto);head(desplazados,1)
class(desplazados)
desplazados@data

###############################
########### SERIES
###############################

serie<-read.delim("clipboard",header=T)
ts.series<-ts(serie,start=c(2007,1),freq=12)
win.graph(10,6,10)
ts.plot(ts.series,lty=c(1:length(serie[,1])))
acum<-read.delim("clipboard",header=T)
acum.ts<-ts(acum,start=c(2007,1),freq=12)

library(ggplot2)
library(ggfortify)
library(dlm)
autoplot(acum.ts)

library(plotly)
library(plyr)
install.packages("plotly")

# data. ts converted to long matrix:


myData <- data.frame(Year = c(floor(time(acum.ts) + .01)),
Month = c(cycle(acum.ts)),
Value = c(acum.ts))
# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:


myData$Month <- factor(myData$Month)
levels(myData$Month) <- month.abb

73
# plotting reference lines across each facet:

referenceLines <- myData # \/ Rename


colnames(referenceLines)[2] <- "groupVar"
zp <- ggplot(myData,
aes(x = Year, y = Value))
zp <- zp + geom_line(data = referenceLines, # Plotting the "underlayer"
aes(x = Year, y = Value, group = groupVar),
colour = "GRAY", alpha = 1/2, size = 1/2)
zp <- zp + geom_line(size = 1) # Drawing the "overlayer"
zp <- zp + facet_wrap(~ Month)
zp <- zp + theme_bw()

###

indiv<-read.delim("clipboard",header=T)
indiv.ts<-ts(indiv,start=c(2007,1),freq=12)

# data. ts converted to long matrix:


myData2 <- data.frame(Year = c(floor(time(indiv.ts) + .01)),
Month = c(cycle(indiv.ts)),
Value = c(indiv.ts))
# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:


myData2$Month <- factor(myData2$Month)
levels(myData2$Month) <- month.abb

# plotting reference lines across each facet:

referenceLines2 <- myData2 # \/ Rename


colnames(referenceLines2)[2] <- "groupVar"
zp2 <- ggplot(myData2,
aes(x = Year, y = Value))
zp2 <- zp2 + geom_line(data = referenceLines2, # Plotting the "underlayer"
aes(x = Year, y = Value, group = groupVar),
colour = "GRAY", alpha = 1/2, size = 1/2)
zp2 <- zp2 + geom_line(size = 1) # Drawing the "overlayer"
zp2 <- zp2 + facet_wrap(~ Month)
zp2 <- zp2 + theme_bw()

zp2

#######################################

######## SERIE ACCIONES BÉLICAS

datos.acciones<-read.table("acciones.txt",header = T, sep="\t",dec=",",
colClasses = c("numeric", "numeric", "character", "character", "numeric", "character", "charact
acciones<-datos.acciones
summary(acciones)
str(acciones)

74
accion<-acciones
accion$PERIODO<-as.Date(accion$FINAL, origin = "1899-12-30")
accion$MPIOS<-accion$CODIGO.MUNICIPIO
str(accion)
summary(accion)
plot(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion),type=’l’,lwd=2,cex=1.5)

library(ggplot2)
library(xts)
library(ggthemes)
library(reshape2)

plt.accion<-ggplot(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion),aes(PERIODO, ACC.BELIC))

################################
win.graph(10,6,6)
plt.accion + geom_line(size=1) +
geom_point(size=(aggregate(ACC.BELIC~PERIODO,FUN=sum,accion)$ACC.BELIC)/10000,col="red",shape=1
scale_x_date(date_labels = "%b %Y",date_breaks = "3 month")+
xlab("Mes. A~
no") + ylab("Total Desplazados") + theme_light()+
theme(axis.text.x = element_text(hjust = 1,size=8,angle=90,vjust=1.5))+
ggtitle("Acciones Bélicas en Colombia \n enero 2007 - diciembre 2016")

accion$MPIOS<-as.factor(accion$MPIOS)
accion$PERIODO<-factor(accion$PERIODO)
accion1<-accion[,c(5,7,8)]
accion1$MPIOS<-as.factor(accion1$MPIOS);str(accion1)
colb2<-col.mpios

accion.tot<-aggregate(ACC.BELIC ~ MPIOS, FUN = sum, data = accion)

head(left_join(colb2@data, accion.tot))
colb2@data <- left_join(colb2@data, accion.tot)

colb2$ACC.BELIC[is.na(colb2$ACC.BELIC)] <- 0

colb2$ACC.BELIC[is.na(colb2$ACC.BELIC)] <- 0

colb2@data<-colb2@data[,c(5:8,11,16:17)]

split(colb2@data,colb2$PERIODO)

library(tmap) # load tmap package (see Section IV)


qtm(colb2, "ACC.BELIC") # plot the basic map
qtm(colb2[colb2$DPTO=="05",], "ACC.BELIC")
qtm(colb2[colb2$DPTO=="08",], "ACC.BELIC")
qtm(colb2[colb2$DPTO=="68",], "ACC.BELIC")
qtm(colb2[colb2$DPTO=="13",], "ACC.BELIC")
qtm(colb2[colb2$DPTO=="15",], "ACC.BELIC")
qtm(colb2[colb2$DPTO=="17",], "ACC.BELIC")
qtm(colb2[colb2$DPTO=="52",], "ACC.BELIC")
qtm(colb2[colb2$DPTO=="19",], "ACC.BELIC")

75
qtm(colb2[colb2$DPTO=="05",], "ACC.BELIC", fill.title="ACCIONES BÉLICAS",
title = "DEPARTAMENTO DE ANTIOQUIA")
qtm(colb2[colb2$DPTO=="52",], "ACC.BELIC", fill.title="ACCIONES BÉLICAS",
title = "DEPARTAMENTO DE NARI~
NO")
qtm(colb2[colb2$DPTO=="76",], "ACC.BELIC", fill.title="ACCIONES BÉLICAS",
title = "DEPARTAMENTO DE VALLE DEL CAUCA")

##################################################

serie.a<-read.delim("clipboard",header=T)
ts.series.a<-ts(serie.a,start=c(2007,1),freq=12)
win.graph(10,6,10)
ts.plot(ts.series.a,lty=c(1:length(serie.a[,1])))
acum.a<-read.delim("clipboard",header=T)
acum.ts.a<-ts(acum.a,start=c(2007,1),freq=12)

library(ggplot2)
library(ggfortify)
library(dlm)

win.graph(6,10,12)
autoplot(acum.ts)+theme_light()+ ggtitle("SERIE ACUMULADA DESPLAZAMIENTO")

win.graph(6,10,12)
autoplot(acum.ts.a)+theme_light() + ggtitle("SERIE ACUMULADA ACCIONES BÉLICAS")

library(plotly)
library(plyr)
install.packages("plotly")

# data. ts converted to long matrix:


myData.a <- data.frame(Year = c(floor(time(acum.ts.a) + .01)),
Month = c(cycle(acum.ts.a)),
Value = c(acum.ts.a))
# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:


myData.a$Month <- factor(myData.a$Month)
levels(myData.a$Month) <- month.abb

# plotting reference lines across each facet:

referenceLines.a <- myData.a # \/ Rename


colnames(referenceLines.a)[2] <- "groupVar"
zp.a <- ggplot(myData.a,
aes(x = Year, y = Value))
zp.a <- zp.a + geom_line(data = referenceLines.a, # Plotting the "underlayer"
aes(x = Year, y = Value, group = groupVar),

76
colour = "GRAY", alpha = 1/2, size = 1/2)
zp.a <- zp.a + geom_line(size = 1) # Drawing the "overlayer"
zp.a <- zp.a + facet_wrap(~ Month)
zp.a <- zp.a + theme_bw()

indiv.a<-read.delim("clipboard",header=T)
indiv.ts.a<-ts(indiv.a,start=c(2007,1),freq=12)

# data. ts converted to long matrix:


myData2.a <- data.frame(Year = c(floor(time(indiv.ts.a) + .01)),
Month = c(cycle(indiv.ts.a)),
Value = c(indiv.ts.a))
# easy conversion code from: http://stackoverflow.com/a/4973859/479554

# convert month numbers to names, using a built-in constant:


myData2.a$Month <- factor(myData2.a$Month)
levels(myData2.a$Month) <- month.abb

# plotting reference lines across each facet:

referenceLines2.a <- myData2.a # \/ Rename


colnames(referenceLines2.a)[2] <- "groupVar"
zp2.a <- ggplot(myData2.a,
aes(x = Year, y = Value))
zp2.a <- zp2.a + geom_line(data = referenceLines2.a, # Plotting the "underlayer"
aes(x = Year, y = Value, group = groupVar),
colour = "GRAY", alpha = 1/2, size = 1/2)
zp2.a <- zp2.a + geom_line(size = 1) # Drawing the "overlayer"
zp2.a <- zp2.a + facet_wrap(~ Month)
zp2.a <- zp2.a + theme_bw()
zp2.a

#######################################
#######################################
#######################################
#######MODELOS ########################
#######################################
#######################################

#######################################
########## VARIOGRAMA
#######################################

library(gstat)
library(sp)
library(nlme)

win.graph(10,6,10)
plot(variogram(ACC.BELIC~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA ACCIONES
plot(variogram(DESPLAZADOS~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA DESPLAZ
plot(variogram(res.sar~1,data=colb2,alpha=c(0,45,90,135)),type=’l’,main="VARIOGRAMA RESIDUALES

77
win.graph(10,6,10)
ggplot(data.frame(acciones.b=colb2@data$ACC.BELIC,
desplaz.t=colb2@data$DESPLAZADOS,munip=colb2@data$HECTARES),
aes(x=acciones.b,y=desplaz.t,col=munip))+ theme(legend.position="top")+
geom_point(aes(size=colb2@data$HECTARES))+theme_light()+
guides(col=FALSE, size = FALSE)+ scale_y_continuous(limits=c(0,150000))+
labs(x="Acciones Bélicas", y="Desplazamiento Forzado")

########
## SAR Model (WARNING: This takes a while to run)
########

mod.sar <- lagsarlm(DESPLAZADOS ~ ACC.BELIC, data = colb2,


listw=col.W_cont_el_mat, zero.policy=T, tol.solve=1e-12)
summary(mod.sar)

res.sar <- mod.sar$residuals

res.palette <- colorRampPalette(c("red","orange","white", "lightgreen","green"), space = "rgb")


pal <- res.palette(5)

classes_fx <- classIntervals(res.sar, n=5, style="fixed", fixedBreaks=c(-32800.00,-625.10,-260.


cols <- findColours(classes_fx,pal)

win.graph(8,8,10)
par(mar=rep(0,4))
plot(colb2,col=cols, border="grey",pretty=T)
legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),tit

dev.off()

## Residual Autocorrelation

moran.test(res.sar, listw=col.W_cont_el_mat, zero.policy=T)

########
## SEM Model (WARNING: This takes a while to run)
########

mod.sem <- errorsarlm(DESPLAZADOS ~ ACC.BELIC, data = colb2,


listw=col.W_cont_el_mat, zero.policy=T, tol.solve=1e-15)
summary(mod.sem)

res.sem <- mod.sem$residuals

78
classes_fx <- classIntervals(res.sem, n=5, style="fixed", fixedBreaks=c(-.2,-.1,0,.1,.2,.4), rt
cols <- findColours(classes_fx,pal)

win.graph(8,8,10)
par(mar=rep(0,4))
plot(colb2,col=cols, border="grey",pretty=T)
legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),tit

dev.off()

## Residual Autocorrelation

moran.test(res.sar, listw=col.W_cont_el_mat, zero.policy=T)

########
## SDM Model (WARNING: This takes a while to run)
########

mod.sdm <- lagsarlm(DESPLAZADOS ~ ACC.BELIC, data = colb2,


listw=col.W_cont_el_mat, zero.policy=T, type="mixed", tol.solve=1e-12)
summary(mod.sdm)

res.sdm <- mod.sdm$residuals

classes_fx <- classIntervals(res.sdm, n=5, style="fixed", fixedBreaks=c(-.2,-.1,0,.1,.2,.4), rt


cols <- findColours(classes_fx,pal)

par(mar=rep(0,4))
plot(colb2,col=cols, border="grey",pretty=T)
legend(x="bottom",cex=1,fill=attr(cols,"palette"),bty="n",legend=names(attr(cols, "table")),tit
dev.off()

## Residual Autocorrelation

moran.test(res.sdm, listw=col.W_cont_el_mat, zero.policy=T)

#################################################################
#######################CORRELACION###############################
#################################################################
with(colb2@data, plot(NOMBRE_DPT,DESPLAZADOS))

data.col<-colb2@data

ggplot(data.col, aes(x=NOMBRE_DPT,y=DESPLAZADOS))+geom_boxplot()+
geom_jitter()

win.graph(10,5,12)
ggplot(data.col, aes(x=ACC.BELIC,y=DESPLAZADOS))+ theme_light()+
geom_point(aes(size = HECTARES),shape=1, col = "Orange")+

79
labs(y="Volumen de Desplazados",size="Áreas de los\nMunicipios",
x="Eventos de Conflicto: Acciones Bélicas")+
scale_x_continuous(labels = scales::comma)+
scale_y_continuous(labels = scales::comma)

moran.test(colb2$ACC.BELIC, listw=col.W_cont_el_mat, zero.policy=T)


geary.test(colb2$ACC.BELIC, listw=col.W_cont_el_mat, zero.policy=T)

################## EFECTO EQULIBRIO MODELO SAR

names <- attr(col.W_cont_el,"region.id")


W <- matrix(0,nrow=length(names),ncol=length(names))
for(i in 1:length(names)){
W[i,as.vector(col.W_cont_el[[i]])] <- 1
}

I <- matrix(0,nrow=nrow(colb2@data),ncol=nrow(colb2@data))
diag(I) <- 1

X0 <- cbind(colb2@data$ACC.BELIC)
X1 <- cbind(colb2@data$ACC.BELIC)
X1[c(378,827,976)] <- 2*X1[c(378,827,976)] # Medellin, Tumaco, Buenaventura
Xd <- X1-X0

beta.sar <- mod.sar$coefficients


rho.sar <- mod.sar$rho

EE.sar <- solve(I - rho.sar*W)%*%Xd*beta.sar[2]


names(EE.sar) <- colb2@data$NOMBRE_MPI
top.sar <- EE.sar[rev(order(EE.sar))][1:10]
top.sar ## Top ten changes

colb2@data$EEsar <- EE.sar

paletteEEsar <- colorRampPalette(c("white","lightgoldenrodyellow","yellow",


"orange","red"), space = "rgb")
palEEsar <- paletteEEsar(5)
classes_fxEEsar <- classIntervals(colb2@data$EEsar, n=5, style="fixed",
fixedBreaks=c(-113250,0,5000,20000,50000,105000), rtimes = 1)
colsEEsar <- findColours(classes_fxEEsar,palEEsar)

par(mar=rep(0,4))
plot(colb2,col=colsEEsar, border="grey",pretty=T)
legend(x="bottomleft",cex=1,fill=attr(colsEEsar,"palette"),
bty="n",legend=names(attr(colsEEsar, "table")),
title="Equilibrium Effect over Forced Migrations",ncol=1)

paletteAccBel <- colorRampPalette(c("white","lightgoldenrodyellow","yellow",


"orange","red"), space = "rgb")

80
palAccBel <- paletteAccBel(5)
classes_fxAccBel <- classIntervals(colb2@data$ACC.BELIC, n=5, style="fixed",
fixedBreaks=c(0,10,50,100,200,418), rtimes = 1)
colsAccBel <- findColours(classes_fxAccBel,palAccBel)

par(mar=rep(0,4))
plot(colb2,col=colsAccBel, border="grey",pretty=T)
legend(x="bottomleft",cex=1,fill=attr(colsAccBel,"palette"),
bty="n",legend=names(attr(colsAccBel, "table")),
title="Armed Incursions",ncol=1)

###############################################
###############################################
###############################################
#### MODELOS ESPACIO - TEMPORALES #########
###############################################
###############################################
###############################################

library(readxl)

locac<- read_excel("F:/Dropbox (Personal)/DOCUMENTOS ESTADISTICA/MAESTRIA/C TRABAJO FIN DE MAST


sheet = "Hoja6")
str(locac)
locac<-as.data.frame(locac)
locac$ID<-factor(locac$ID)
fenomX<-locac
head(fenomX)
fenomX$ZONA<-factor(fenomX$ZONA)
fenomX$type<-factor(fenomX$type)
str(fenomX)

desplazados2 <- read_excel("F:/Dropbox (Personal)/DOCUMENTOS ESTADISTICA/MAESTRIA/C TRABAJO FIN


sheet = "Hoja5")

despl2<-as.data.frame(desplazados2)
head(despl2)
row.names(despl2)<-despl2$MPIOS
despl2<-despl2[,-1]
head(despl2)

fenomObs<-as.matrix(t(despl2))
str(fenomObs)

fenomObs[is.na(fenomObs)]<-0

eventosconflicto <- read_excel("F:/Dropbox (Personal)/DOCUMENTOS ESTADISTICA/MAESTRIA/C TRABAJO


sheet = "acciones")
eventosconflicto

acc2<-as.data.frame(eventosconflicto)
head(acc2)
row.names(acc2)<-acc2$MPIOS

81
acc2<-acc2[,-1]
head(acc2)
fenomLax<-as.matrix(t(acc2))
str(fenomLax)

library(SpatioTemporal)
library(plotrix)
library(maps)

fenom.data<-createSTdata(obs=fenomObs, covars=fenomX,
SpatioTemporal=list(accx=fenomLax))

str(fenom.data)

win.graph(10,8,12)
layout(matrix(c(1,2,1,3), 2, 2))
par(mar=c(2.3,3.3,2,1), mgp=c(2,1,0))
plot(fenom.data, "loc", main="Occurrence of Observations", xlab="",
ylab="Location", col=c("black", "red"), legend.loc=NULL)
par(mar=c(3.3,3.3,2,1))
qqnorm(fenom.data, line=1)
scatterPlot(fenom.data, covar="AREA", xlab="Area",
ylab="Forced Migrations", pch=19, cex=.25,
smooth.args=list(span=4/5,degree=2))

D<-createDataMatrix(fenom.data)

SVD.cv<-SVDsmoothCV(D, 0:4)

print(SVD.cv)
plot(SVD.cv)

fenom.data <- updateTrend(fenom.data, n.basis=2)


smooth.trend<-calcSmoothTrends(na.omit(fenom.data), n.basis=2, cv=TRUE)

fenom.data.cv <- vector("list", length(smooth.trend$trend.fnc.cv))

win.graph(10,6,10)
for(i in 1:length(fenom.data.cv)){
suppressMessages(fenom.data.cv[[i]] <- updateTrend(fenom.data,
fnc=smooth.trend$trend.fnc.cv[[i]]))
}
plot(fenom.data, main="Possible Temporal Trends",
xlab="", ylab="Forced Migrations", pch=c(19,NA), cex=.25)
for(i in 1:length(fenom.data.cv)){
plot(fenom.data.cv[[i]], add=TRUE, col=i, pch=NA, lty=c(NA,2))
}

par(mar=c(3.3,3.3,1.5,1), mgp=c(2,1,0))
layout(matrix(c(1,1,2,2,3,4), 3, 2, byrow=TRUE))
plot(fenom.data, "obs", ID="76109",
xlab="", ylab="Forced Migrations",

82
main="Temporal Trend in Buenaventura")
plot(fenom.data, "res", ID="76109",
xlab="", ylab="Forced Migrations",
main="Residuals in Buenaventura")
plot(na.omit(fenom.data), "acf", ID="76109")
plot(fenom.data, "acf", ID="76109")

fenom.data.fnc <- updateTrend(fenom.data, fnc=function(x){


x = x;
return( cbind(x, x, x) )})
par(mfrow=c(2,1), mar=c(2.3,3.3,1.5,1), mgp=c(2,1,0))
for(i in c("76109","76109")){
plot(fenom.data, ID=i, pch=c(19,NA), cex=.25, xlab="",
ylab="NOx (log ppb)", main=paste("AQS site",i))
plot(mesa.data.fnc, ID=i, add=TRUE, col=2, pch=NA)
}

beta.lm <- estimateBetaFields(fenom.data)


par(mfrow=c(1,2), mar=c(3.3,2.3,1.5,1), mgp=c(2,1,0))
plotCI(fenom.data$covars$AREA, beta.lm$beta[,1],
uiw=1.96*beta.lm$beta.sd[,1], ylab="", xlab="Area",
main="Beta-field for f1(t)")
plotCI(fenom.data$covars$AREA, beta.lm$beta[,2],
uiw=1.96*beta.lm$beta.sd[,2], ylab="", xlab="Area",
main="Beta-field for f2(t)")

LUR <- list(~AREA+ZONA,~AREA,~AREA)


cov.beta <- list(covf="exp", nugget=TRUE)
cov.nu <- list(covf="exp", nugget=~type, random.effect=FALSE)

fenom.data$covars$x<-fenom.data$covars$lon+1
fenom.data$covars$y<-fenom.data$covars$lat+1

locations <- list(coords=c("x","y"), long.lat=c("lon","lat"),


others="type")
fenom.model <- createSTmodel(fenom.data, ST="accx",
cov.beta=cov.beta, cov.nu=cov.nu, locations=locations)

model.dim <- loglikeSTdim(fenom.model)


str(model.dim)

x.init <- cbind(c( rep(2, model.dim$nparam.cov-1), 0),


c( rep(c(1,-3), model.dim$m+1), -3, 0))
rownames(x.init) <- loglikeSTnames(fenom.model, all=FALSE)
x.init

est.fenom.model <- estimate(fenom.model, x.init, type="p", hessian.all=TRUE)

# Singular Sistem, no solution

#######
# mod VAR
#######

83
ls()

indiv
indiv.a<-read.delim("clipboard",header=T,)

names(indiv.a)<-"Acciones.Belicas"
names(indiv)<-"Desplazamiento"
fenom<-data.frame(indiv,indiv.a)
fenom.ts<-ts(fenom,,start=c(2007,1),freq=12)
fenom.ts

library(vars)

VARselect(fenom.ts, lag.max = 5, type="const")

var.2c <- VAR(fenom.ts, p = 1, type = "const");summary(var.2c)


amat <- diag(2)
amat
diag(amat) <- NA
amat[1,2] <- NA

save(list=ls(all=TRUE),file="base1.RData")

## Estimation method scoring


SVAR(x = var.2c, estmethod = "scoring", Amat = amat, Bmat = NULL,
max.iter = 100, maxls = 1000, conv.crit = 1.0e-8)
## Estimation method direct
SVAR(x = var.2c, estmethod = "direct", Amat = amat, Bmat = NULL,
hessian = TRUE, method="BFGS")

84

También podría gustarte