Está en la página 1de 9

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

Guerrero, Camilo. Hernndez, Paola.


20081025038, 20081025047
Universidad Distrital Francisco Jos de Caldas
Facultad de Ingeniera

Desplazamiento en Antioquia, relacin con variables


socioeconmicas y demogrficas implementando un
Modelo Lineal Generalizado.

Resumen Este artculo tiene como finalidad mostrar el proceso realizado para determinar la influencia de diversos factores
en el desplazamiento forzado de los municipios del departamento de Antioquia para el ao 2009. Para esto se form una base de
datos con distintas cifras recolectadas en varias instituciones gubernamentales y se efectuaron los procesos estadsticos para
plantear un modelo de regresin lineal que permiti explicar el desplazamiento en funcin de otras variables de tipo social,
econmico, de conflicto, de capacidad de respuesta, entre otros.
ndice de Trminos Antioquia, desplazamiento, Poisson, modelo lineal generalizado.
INTRODUCCIN
La violencia en Colombia ha sido uno de los temas ms relevantes e influyentes a la vez que deplorables de
las ltimas dcadas. Este fenmeno aparentemente interminable, se viene evidenciando con el incremento
de la criminalidad organizada y el conflicto armado interno (CERAC, 2009), como resultado de varios
factores, incluyendo los malos manejos de la situacin socio econmica por parte del estado (M. Rubio,
1997), pasando por falencias en cuestin de salud, educacin, cultura y dems variables que a la postre han
venido sumando de una u otra forma a la ola de sucesos que mantienen a este pas en un estado de violencia
casi permanente. Con esta informacin, se busca plantear un modelo que explique en qu medida estas
variables influyen o no en el desplazamiento forzado de ciudadanos hacia otras regiones del pas. Se
plantea que de esta manera, conociendo los principales tems que influyen en esta dinmica se pueden
plantear soluciones de peso que puedan ayudar a disminuir en alguna medida el impacto de este fenomeno
en
el
pas.
Descripcin de la zona
El Departamento de Antioquia est situado al noreste del pas, contando con una superficie de 63.612
km2, lo que representa el 5.6 % del territorio nacional. El departamento est dividido en 125 municipios,
36 corregimientos, 423 inspecciones de polica y numerosos caseros y sitios poblados. Durante las
ltimas dcadas, el departamento ha venido sufriendo procesos de violencia que han influido en la
dinmica de este y el resto del pas (Durn, 2011), comenzando con los estragos generados por el cartel de
Medelln desde mediados de la dcada del setenta hasta el da de hoy con el fenmeno de las bandas
emergentes, bandas criminales, guerrillas y dems formas de crimen organizado que han evolucionado y
azotado al pas y en gran medida a este departamento a travs de los aos. Derivado de estos procesos, el
fenmeno del desplazamiento tambin tuvo un desarrollo y un impacto muy grande sobre el
departamento, llegando a ser reconocido como uno de los departamentos que ha registrado mayor nmero
de hogares expulsados individual y masivamente en las ltimas dcadas en todo el territorio colombiano
(DPS,
2010).
MATERIALES

Ingeniera Catastral y Geodesia. Econometra.

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

Base de datos
Se cont con una compilacin de datos obtenidos principalmente del portal Sala Humanitaria
http://www.salahumanitaria.co/ que se dedica a compilar, generar y difundir informacin sobre la situacin
humanitaria en Colombia, este portal hace parte de una iniciativa de la Oficina de las Naciones Unidas para
la coordinacin de asuntos humanitarios OCHA (http://www.unocha.org/) y contiene datos de distintos
tipos, principalmente de tipo Conflicto (Acciones Subversivas, vctimas de minas, desplazamiento
expulsin, homicidios, masacres, entre otras), de tipo Capacidad de Respuesta (Cobertura Vacunacin,
inversin accin social, nmero de alumnos matriculados en el sector oficial y privado, porcentaje
poblacin sisbenizada, ingresos, entre otras) y de tipo Social (Afiliacin Rgimen Contributivo, Afiliacin
Rgimen Subsidiado), con datos de los aos 2007, 2008 y 2009, consultados a diferentes entidades del
estado (DIJIN, United Nations Office on Drugs and Crime -SIMCI, Programa Presidencial para la Accin
Integral contra Minas Antipersonal, Accin Social, Medicina Legal, Observatorio de Derechos Humanos de
la vicepresidencia, Ministerio de Proteccin Social, Ministerio de Educacin Nacional, SISBEN,
Departamento Nacional de Planeacin)
Descripcin de las variables
Para el presente estudio, la variable respuesta fue el nivel de desplazamiento en el departamento de
Antioquia en el ao 2009, para esta variable se van a tomar los datos de la variable expulsin total 2009,
que describe el nmero de personas expulsadas del municipio para ese ao. (Fuente Sistema nico de
Registro- Accin Social)

Tabla 1. Variable respuesta.

Variables independientes

Ingeniera Catastral y Geodesia. Econometra.

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

Tabla 2. Variables Independientes

Software
En este caso se utiliz el paquete estadstico R, que es un software que cuenta con varias herramientas para
el anlisis de datos y generacin de grficas (Paquete R Commander). Este software tiene la particularidad
de ser de licencia libre y funciona bajo las plataformas Windows, MAC OS y Linux. Est comprendido por
varios paquetes o mdulos que se pueden trabajar en diferentes interfaces para realizar cualquier tipo de
anlisis de datos que sea requerido. El software se utiliz para estimar el modelo de regresin generalizado
y todas las pruebas relacionadas a l.
MTODOS
Modelo Lineal Generalizado
Un modelo lineal generalizado tiene tres componentes bsicos, una aleatoria (variable respuesta), una
sistemtica (variables explicativas), y una funcin link (funcin del valor esperado). La componente
aleatoria consiste en una variable aleatoria Y con observaciones independientes ( y 1 , , y N . En esta
ocasin las observaciones de Y son un conteo, por lo que se puede asignar a Y una distribucin Poisson. La
componente sistemtica de un modelo lineal generalizado especifica las variables explicativas, es decir, las
variables x j que se relacionan como + 1 x1 ++ k x k
Esta combinacin lineal de variables explicativas se denomina predictor lineal. En la funcin link, se
denota el valor esperado de Y como =E ( Y ) .
Los modelos de regresin lineal tpicos para respuestas continuas son un caso particular de los modelos
lineales generalizados. Estos modelos permiten la unificacin de varios mtodos estadsticos como la
regresin, los modelos ANOVA y los modelos de datos categricos. Este algoritmo es la base de la funcin
glm de R. En muchos casos las variables respuesta son conteos, en el modelo ms simple se asume que el
componente aleatorio Y sigue una distribucin de Poisson. Esta distribucin es unimodal y su propiedad
ms destacada es que la media y la varianza coinciden de modo que cuando el nmero de recuentos es
mayor en media, tambin tienden a tener mayor variabilidad. En el modelo se usa habitualmente el
logaritmo de la media para la funcin link, de modo que el modelo loglineal con una variable explicativa X
{ + x }= e (e ) x
se puede expresar como log ( )=+ x de modo que
=exp
Devianza
En un modelo de Poisson la deviance (McCullagh, 1989) se calcula como 2 log ( p ( y )) . La Null
deviance es la desviacin para el modelo que no depende de ninguna variable. La Residual deviance es la
diferencia entre la desviacin del modelo que no depende de ninguna variable menos la correspondiente al
modelo que incluye a las variables explicativas. El anlisis de la deviance es una generalizacin del anlisis
de la varianza para los Modelos Lineales Generalizados obtenido para una secuencia de modelos anidados.
Ingeniera Catastral y Geodesia. Econometra.

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

La diferencia entre la null deviance y la residual deviance se distribuye como una distribucin chi-cuadrado
con tantos grados de libertad como la diferencia entre los grados de libertad de cada una. Esto permite
contrastar si el coeficiente puede o no considerarse nulo.
P-value
El valor P o P-value es la probabilidad de obtener un estadstico de prueba igual o ms extremo que el
resultado obtenido a partir de los datos muestrales, dado que la hiptesis Ho es en realidad cierta. Es
tambin conocido como nivel exacto de significatividad del estadstico de prueba, y tambin se puede
definir como el menor nivel de significacin al que se puede rechazar la hiptesis nula. Un valor P pequeo
(menor a 0.05 para un nivel de significancia del 5%) indica que el modelo ha reducido significativamente la
desviacin y es til para predecir a Y.
Pruebas de razn de verosimilitud
Las Pruebas de Razn de Verosimilitud, son pruebas de significancia para cada efecto en el modelo
ajustado. Comparan la funcin de verosimilitud del modelo completo con la del modelo en el cul slo el
efecto indicado ha sido removido. Aqu, valores P pequeos indican que el modelo ha mejorado
significativamente por el efecto correspondiente. (Figueroa, 2005)
Intervalos de Confianza
El clculo de los intervalos de confianza para los coeficientes de regresin del modelo, o estimacin por
intervalo, nos dice que, con probabilidad de ( 1 ) se estima que el parmetro j estar dentro de ese
rango de valores. La validez de estos intervalos depende de que se satisfagan o se cumplan las hiptesis
bsicas.
AIC
Este criterio consiste en escoger el modelo que minimice la verosimilitud castigada por el nmero de
parmetros.

Donde
es la maximizacin del valor del logaritmo del modelo de mxima verosimilitud y p es el
nmero de variables explicativas en el modelo. Siempre se recomienda optar por el modelo con menor AIC.
BIC
Este criterio es ms estricto con el nmero de variables explicativas consideradas.
Donde n es el tamao de la muestra,
es la desviacin del modelo, k son los grados de libertad del
modelo. Siempre de recomienda optar con el modelo con menor BIC. (Sanchez, 2006)
PROCEDIMIENTO
Se depur la base de datos seleccionando la muestra y extrayendo los datos correspondientes a todos los
municipios del departamento de Antioquia. Se analiz el comportamiento de la distribucin de la variable
respuesta. Luego, se realiz un modelo lineal generalizado cuya familia es una distribucin Poisson, con
una funcin de enlace o link, logit o loglineal. Esta funcin se elige debido a la presencia de ceros en las
variables independientes. Con este modelo, se realiz la seleccin de modelo paso a paso con direcciones
atrs/adelante y adelante/atrs bajo el criterio BIC para calcular la significancia de las variables. Se
obtienen los estimadores, p-valores, intervalos de confianza con los que se busc verificar o rechazar la
hiptesis de nulidad de los mismos. Para evaluar la bondad del ajuste del modelo seleccionado se utilizan

Ingeniera Catastral y Geodesia. Econometra.

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

los estadisticos de devianza y de razn de verosimilitud para estimar en qu medida el modelo explica la
variable dependiente. El test de razn de verosimilitud arroja los intervalos de confianza en los que
deberan encontrarse las estimaciones de las variables y la significancia del modelo, es decir, qu tan bien
explican las variables independientes a la variable dependiente.
Basados en los residuales de Pearson se depur el modelo obtenido en la seleccin paso a paso y se calcul
la prueba F para obtener los estimadores ajustados y su nivel de significancia, aqu se evalu si era
necesario la inclusin de todas las variables inicialmente contempladas en el estudio de caso. Con el
modelo final se analizaron los datos atpicos que podan o no presentarse en la muestra y se proceden a
hacer los anlisis finales.
RESULTADOS Y ANLISIS

Figura 1. Atributos de las variables de la muestra. X=Desplazamiento por expulsin (variable respuesta)
Se asumi que la variable respuesta se comporta como una distribucin Poisson lo cual se busc evidenciar
con las grficas (Figura 1) y confirmar con el test Chi-Cuarado, siendo la Ho = EXP se comporta como una
distribucin de Poisson, vs, H1= EXP no se comporta como una distribucin de Poisson.
Con los diagramas de dispersin (Figura 2) se verific que la variable dependiente tuviera una relacin con
las variables independientes tenidas en cuenta para este estudio.

Ingeniera Catastral y Geodesia. Econometra.

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

Tabla 3. Resumen estadstico de las variables que intervienen en el modelo.

Figura 2. Diagramas de dispersin de la variable dependiente vs las variables independientes.

Ingeniera Catastral y Geodesia. Econometra.

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

Se propuso el siguiente modelo lineal generalizado cuya familia es una distribucin Poisson, con una
funcin de enlace o link, logit o loglineal. Esta funcin se elige debido a la presencia de ceros en las
variables independientes.
exp CapAd +Cult+ Hom+ InCa+ InCo+ Min+ NBI + Pob+TIAS
Se verific el p-value que debe ser menor a 0,05, con esto se rechaz la hiptesis nula que plantea la
nulidad de los coeficientes. Los coeficientes estimados para el modelo inicial se muestran a continuacin:

Variables
Independientes
(Intercept)
CapAd
Cult
Hom
InCa
InCoa
Min
NBI
Pob
TIAS

Estimacin
2.564
***
4.230e-03 ***
1.017e-03 ***
6.537e-03 ***
5.963e-06 ***
-5.111e-05 ***
3.205e-02 ***
2.074e-02 ***
9.097e-06 ***
1.113e-10 ***

Std. Error

Z value

Pr(>|z|)

5.063e-02
4.449e-04
5.913e-05
2.486e-04
9.844e-07
2.727e-06
1.402e-03
6.824e-04
5.123e-07
5.054e-12

50.643
9.507
17.198
26.296
6.057
-18.740
22.854
30.388
17.759
22.019

< 2e-16
< 2e-16
< 2e-16
< 2e-16
1.39e-09
< 2e-16
< 2e-16
< 2e-16
< 2e-16
< 2e-16

Tabla 4. Estimadores del modelo propuesto

Null deviance: 24307.5


on 123 degrees of freedom
Residual deviance: 6840.5
on 114 degrees of freedom
AIC: 7471.4
BIC: 7499.606

*** Parmetro significativo entre 0% y 0.1%.


** Parmetro significativo entre 0.1% y 1%.
* Parmetro significativo entre 1% y 5%.
. Parmetro significativo entre 5% y 10%.

Como resultado de la seleccin del modelo paso a paso se obtuvieron dos modelos (direcciones
atrs/adelante y adelante/atrs, ambos bajo el criterio BIC) con los siguientes resultados (Tabla 5):
Atrs-Adelante
Variables
Independient
es
(Intercept)
CapAd
Cult
Hom
InCa
InCo
Min
NBI
Pob
TIAS

Adelante-Atrs
Estimacin

2.564e+0
0
4.230e-03
1.017e-03
6.537e-03
5.963e-06
-5.111e-05
3.205e-02
2.074e-02
9.097e-06
1.113e-10

Variables
Independient
es
(Intercept)
TIAS
Min
InCa
NBI
Hom
InCo
Pob
Cult
CapAd

Estimacin

2.564e+00

Degrees of Freedom: 123 Total (i.e. Null)

1.113e-10
3.205e-02
5.963e-06
2.074e-02
2.074e-02
-5.111e-05
9.097e-06
1.017e-03
4.230e-03

114 Residual
Null Deviance:24310
Residual Deviance: 6841
AIC: 7471
BIC: 7499.606

Tabla 5. Comparacin seleccin de modelos paso a paso.


Dado que los valores AIC y BIC son iguales para ambos casos, no se encuentra un mejor modelo que
explique la variable dependiente, por esta razn se continu trabajando con el modelo inicial. Se analizaron
los p-valores de los coeficientes del modelo para rechazar la hiptesis nula que considera la nulidad de los
coeficientes. Se evalu la bondad del modelo con el criterio de devianza y con el estadstico de razn de
verosimilitud se estim en qu medida el modelo explica la variable dependiente. Se comprob que los
valores de los estimadores calculados se encuentran dentro de los intervalos (con una confianza del 95%) lo
que comprueba que las variables independientes explican la variable dependiente.
Ingeniera Catastral y Geodesia. Econometra.

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.

Variables
Independientes

Estimacin

(Intercept)
CapAd
Cult
Hom
InCa
InCo
Min
NBI
Pob
TIAS

2.564
4.230e-03
1.017e-03
6.537e-03
5.963e-06
-5.111e-05
3.205e-02
2.074e-02
9.097e-06
1.113e-10

2,50%

97,50%

2.464261
3.360877e-03
9.002567e-04
6.051367e-03
4.022143e-06
-5.666287e-05
2.930935e-02
1.939594e-02
8.110755e-06
1.013318e-10

2.662714
5.104966e-03
1.132069e-03
7.025961e-03
7.881276e-06
-4.595796e-05
3.480630e-02
2.207099e-02
1.012102e-05
1.211452e-10

Tabla 6. Intervalos de confianza.


Al analizar la significancia de cada una de las variables utilizando el residual de Pearson y la prueba F, se
decidi excluir a las variables Ingresos de Capital (InCa) y Capacidad Administrativa (CapAd) dada su
poca significancia en el modelo ajustado. Luego, se corri nuevamente el modelo (Tabla 7)
Dispersion parameter for poisson family taken to be 1
Variables
Independient
Estimacin
Std. Error
Z value
es
(Intercept)
Cult
Hom
InCo
Min
NBI
Pob
TIAS

3.189e-02
5.659e-05
2.467e-04
2.989e-06
1.380e-03
6.089e-04
4.007e-07
4.926e-12

2.872e+00
9.493e-04
6.442e-03
-5.431e-05
2.962e-02
2.038e-02
1.115e-05
1.174e-10

90.08
16.77
26.11
-18.17
21.46
33.47
27.82
23.83

Pr(>|z|)

<2e-16 ***
<2e-16 ***
<2e-16 ***
<2e-16 ***
<2e-16 ***
<2e-16 ***
<2e-16 ***
<2e-16 ***

Null deviance: 24307.5


on 123 degrees of freedom
Residual deviance: 6994.8
on 116 degrees of freedom
AIC: 7621.7

Tabla 7. Modelo depurado y ajustado


Nuevamente, se evalu y confirm la significancia de cada una de las variables dentro del nuevo modelo,
recurriendo al residual de Pearson (Tabla 8) y la Prueba F (Tabla 9)
Dispersion parameter for poisson family taken to be 74.74705
Variables
Independient
Estimacin
Std. Error
Z value
es
(Intercept)
Cult
Hom
InCo
Min
NBI
Pob
TIAS

2.872e+00
9.493e-04
6.442e-03
-5.431e-05
2.962e-02
2.038e-02
1.115e-05
1.174e-10

2.757e-01
4.893e-04
2.133e-03
2.585e-05
1.193e-02
5.264e-03
3.464e-06
4.259e-11

10.419
1.940
3.020
-2.101
2.482
3.871
3.218
2.757

Pr(>|z|)

<2e-16 ***
0.052361 .
0.002529 **
0.035622 *
0.013055 *
0.000108 ***
0.001290 **
0.005842 **

Null deviance: 24307.5


on 123 degrees of freedom
Residual deviance: 6994.8
on 116 degrees of freedom
AIC: 7621.7

Tabla 8. Residual de Pearson


Variables
Independientes
<none>
Cult
Hom
InCo

Df

1
1
1

Devian
ce

AIC

F Value

Pr(>F)

6994.8
7246.1
7703.9
7801.3

7621.7
7871.0
8328.8
8426.1

4.1676
11.7593
13.3733

0.0434726
0.0008390
0.0003851

Ingeniera Catastral y Geodesia. Econometra.

*
***
***

Universidad Distrital Francisco Jos de Caldas. Guerrero, Hernndez. Desplazamiento en Antioquia.


Min
NBI
Pob
TIAS

1
1
1
1

7496.7
8003.6
8289.1
7487.8

8121.5
8628.5
8913.9
8112.6

8.3219
16.7290
21.4630
8.1745

0.0046710
7.989e-05
9.501e-06
0.0050386

**
***
***
**

Tabla 9. Prueba F
Dentro del modelo ajustado, las variables Homicidios, NBI, Poblacin e Ingresos Corrientes resultaron ser
muy importantes en la determinacin del nmero de desplazados por expulsin. Especficamente hablando
de esta ltima variable, los resultados muestran un hecho interesante y es que los Ingresos Corrientes de
cada municipio tienen un efecto negativo sobre el nmero de desplazados, de esto inferimos que este tem
es de lo ms destacable del modelo dado que es el nico que al aumentar puede generar un impacto
considerable en el fenmeno de desplazamiento y podra considerarse como solucin o variable a tener en
cuenta a la hora de pensar en mitigar el fenmeno, por lo menos, para este departamento.
REFERENCIAS
[1] Mauricio Durn. (2011). Conflicto armado y crecimiento econmico municipal en Colombia. Bogot:
Universidad Nacional de Colombia.
[2] Centro de Recursos para el Anlisis de Conflictos. (2009). Guerras y violencias en Colombia,
Herramientas e Interpretaciones. Bogot: Pontificia Universidad Javeriana.
[3] Mauricio Rubio. (1997). Los Costos de la Violencia en Colombia. Bogot: Universidad de los Andes.
[4] Departamento para la prosperidad Social en Colombia. (2010). Desplazamiento forzado en Colombia,
Portal Web DPS.
[5] P. McCullagh. (1989). Generalized Linear Models. Londres: Chapman & Hall.
[6] Teresa Figueroa. (2005). La fecundidad y su relacin con variables socioeconmicas, demogrficas y
educativas aplicando el Modelo de Regresin Poisson. Lima, Per: Universidad Nacional Mayor de San
Marcos.
[7] Andrs Sachez, David Balln. (2006). Modelo de regresin lineal generalizado para el avalo de
terrenos de uso residencial, aplicado a las localidades de Suba y Usaqun. Bogot: Universidad
Distrital.
[8] Gauss Moutinho. (2010). Modelos Lineares Generalizados e Extensoes. Recrife: Departamento de
Estatstica e Informtica, UFRPE.
[9] Annette J. Dobson. (2002). An introduction to generalized linear models. New York: Chapman & Hall.

Ingeniera Catastral y Geodesia. Econometra.

También podría gustarte