Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TRABAJO I
José David Niño Muriel
Angie Rodríguez Vargas
Jesús Cristóbal Ruíz Torres
I. INTRODUCCIÓN
En términos generales, el balance de seguridad para el año 2012 no ofrece una respuesta
concluyente en cuanto a la disminución (o incremento) de los hechos violentos en el país;
de acuerdo con los informes de algunas Organizaciones no Gubernamentales, el
resultado no es optimista: durante 2012 el Centro de Seguimiento para los Desplazados
Internos (IDMC) catalogó a Colombia como el país con mayor número de desplazados en
el mundo con alrededor de 5,5 millones de personas, durante ese mismo año, el índice
Paz Global calificó al país como el más violento de América Latina. Sin embargo, el
balance de los organismos nacionales parece ser el opuesto: de acuerdo con el
Observatorio del Delito de la Policía Nacional, el 2012 fue el año menos violento de los
últimos 26 años, la organización País libre confirmó el balance de la Policía afirmando
que, salvo Cauca, algunas zonas de Antioquia y Putumayo la tendencia de reducción de
la violencia fue más o menos generalizada.
En este marco, los hechos violentos que se caracterizarán como variables en el análisis
de componentes principales serán, medidos en número de personas por departamento:
expulsión (individual y masiva), homicidios, secuestros, desaparición forzada, tortura,
reclutamiento ilegal de niños, niñas y adolescentes y homicidios socio-políticos. Las
demás variables: masacres, accidentes por minas anti persona, actos de terrorismo (en
los cuales hayan explotado aparatos explosivos), civiles y militares (muertos y heridos)
por minas anti persona, exámenes médicos realizados por delito sexual total, despojo de
tierras y amenazas, serán medidas en número de eventos por departamento.
II. METODOLOGÍA
En este mismo proceso se decide sumar la información de los hechos violentos por
departamento y no por municipio como se presentó en la versión original de la base de
datos, al observar que la información de 1,103 municipios es engorrosa e innecesaria
para el análisis ya que para muchas de las variables los valores son 0, en adelante, se
trabajará con la información por departamento para reducir el volumen de los datos sin
alterar el resultado.
2.2. ANÁLISIS ESTADÍSTICO DESCRIPTIVO: En esta parte del trabajo se realiza una
descripción básica del conjunto de datos a través de medidas de tendencia central, estas
medidas, describen el grupo de observaciones en un valor; se utilizarán como
estadísticos de referencia los valores mínimo y máximo, media, mediana, varianza,
desviación estándar y primer y tercer cuantil. En el siguiente aparte se encuentra el
resultado obtenido en este análisis.
2.3. METODOLOGÍA DE COMPONENTES PRINCIPALES: Como su nombre lo indica, el
ACP intenta encontrar los componentes principales de un conjunto de datos; es una
especie de estructura subyacente de la información. El método consiste en reducir la
dimensión del conjunto para facilitar su interpretación en un plano, a través de la
utilización de las herramientas matemáticas de vectores y valores propios.
El objetivo del análisis de componentes principales, es encontrar una nueva matriz “Y”
que sea una combinación lineal de la matriz original “X”: debe encontrarse una matriz “P”
que transforme linealmente “X” de modo que PX=Y, esta matriz Y será la proyección de X
sobre P, de modo que “P” sea un nuevo vector que represente el contenido de la matriz X.
la escogencia de este vector debe estar sujeta a un proceso de maximización de la
varianza, de modo que al escogerlo, se recoja la mayor cantidad de información. Este
vector (o vectores), serán una especie de “indicador” de su capacidad explicativa de las
variables inicialmente utilizadas. Para encontrarlo, se usa la matriz de correlaciones: al
diagonalizar esta matriz las variables “más correlacionadas” se unirán para formar un
solo indicador; los elementos de esta diagonal formarán el nuevo conjunto de vectores
propios y la correlación entre ellos será muy cercana a 0.
A cada vector propio le corresponde un valor propio, el vector propio indica la dirección
del vector de mayor varianza y el valor propio el “valor” de esa dirección. Los vectores
propios con los mayores valores propios son las componentes principales, en ellas se
recopila una cantidad de información importante, suficiente para una explicación más
sencilla del comportamiento de los datos. La escogencia de las componentes está sujeta
a un criterio de aceptabilidad que será explicado en los en los apartes siguientes, cada
una de ellas será definida y analizada gráficamente, con el fin de establecer las
relaciones existentes entre las variables originales y las escogidas mediante este método.
2.3. CONCLUSIONES: Para finalizar, se discutirán los resultados del análisis en una
breve conclusión
III. DATOS
C
Valores Propios Porcentaje de Varianza Porcentaje de Varianza Acumulada
P
1 8,20 54,63% 54,63%
2 2,25 14,99% 69,63%
3 1,19 7,94% 77,57%
4 1,05 6,98% 84,55%
5 0,60 3,97% 88,52%
6 0,57 3,78% 92,30%
7 0,35 2,35% 94,65%
8 0,27 1,83% 96,48%
9 0,18 1,21% 97,69%
10 0,17 1,11% 98,80%
11 0,10 0,64% 99,44%
12 0,07 0,46% 99,90%
13 0,01 0,07% 99,96%
14 0,00 0,03% 99,99%
15 0,00 0,01% 100,00%
2.86 1.50 1.09 1.02 0.77 0.75 0.59 0.52 0.43 0.41 0.31 0.26 0.10 0.07 0.03
Representa las ponderaciones relacionadas a cada componente (“matriz de coeficientes
para el cálculo de las puntuaciones factoriales que contiene las ponderaciones para cada
variable para poder calcular las Puntuaciones factoriales2); debido a que cada vector es
sensible a transformaciones crecientes, el vector propio generado que asigna
ponderaciones para cada variable, será para cada componente el que se muestra a
continuación:
De igual forma, para la segunda componente el análisis es similar, hay que aclarar que las
correlaciones de la componente con las variables no es igual de alta, sin embargo,
contempla buenos niveles de correlación; las variables ExamenesMdsxt y homicidios
muestran la mayores correlaciones con la componente (0,748 y 0,696 respectivamente).
CORRELACIONES Componente1 Componente2
ACMI 0,845 0,107
HOMSP 0,708 0,524
AMNZ 0,917 -0,134
CIMI 0,761 -0,193
MIMI 0,803 0,091
DESA 0,801 -0,293
DESPO 0,380 0,212
EXAM 0,241 0,748
EXPI 0,941 -0,234
EXPM 0,653 -0,307
HOM 0,638 0,696
MASC 0,778 0,497
RECL 0,835 -0,379
SEC 0,710 -0,413
TOR 0,740 -0,123
IV. RESULTADOS
Es importante hacer una distinción en este punto: todo acto o hecho violento tiene un
sujeto (quien ejecuta la acción) y un objeto (sobre el que recae la acción), en el marco del
conflicto armado que atraviesa el país y del que se derivan la mayoría de los hechos
violentos que se tienen como variables para este análisis, los sujetos y objetos son en
este caso la fuerza pública y los militantes de los grupos armados al margen de la ley; en
este sentido, los terceros o sujetos indirectos que se tienen como referencia en el párrafo
anterior son todos aquellos afectados violentamente que no participan activamente del
conflicto. Por lo tanto, se puede interpretar como un indicador de los hechos violentos
propios del conflicto armado que afectan a la población.
Para este caso, aplica la misma distinción que se hizo para la primer componente, solo
que ahora en sentido contrario, pues los que se tienen en cuenta son los objetos directos
del hecho violento; dada la naturaleza de esta componente, ha decidido nombrarse
Factor de agresiones directas; esta recoge una buena porción de la información, pues
logra explicar un 14.99% de la varianza total de los datos. En suma, los factores de
agresión directos e indirectos exponen una porción más que considerable y
suficientemente explicativa de la variabilidad del conjunto de datos.
Ahora, si proyectamos sobre el eje vertical las flechas de cada variable, y medimos la
longitud de esta proyección, se obtiene la correlación entre dicha variable y la segunda
componente. Como se observa, la variable Exámenes por agresión sexual tiene una alta
correlación con la segunda componente, pero una baja correlación con la primera.
Mientras la variable Homicidios sociopolíticos tiene una alta correlación con ambas
componentes, se identifica que la variable Despojo de tierras tiene una pequeña
correlación con las componentes uno y dos.
En esta última gráfica se relacionan los datos de los departamentos con los dos primeros
componentes, los cuáles procederemos a interpretar mediante el análisis que previamente
se realizó de la relación entre las variables y los componentes.
Antioquia (1) y Valle del Cauca (24) son los departamentos que más son afectados por los
hechos violentos tanto directos como indirectos. Bogotá (3) tiene un factor de agresiones
directas por encima del promedio nacional, pero un factor de agresiones indirectas dentro
del promedio. Nariño (17), Cauca (8) y Caquetá (7) tienen un factor de agresiones
indirectas por encima del promedio –que se puede relacionar con los hechos violentos
relacionados al conflicto armado- y un factor de agresiones directas por debajo de este.
Huila (13) y Córdoba son aquellos que se encuentran más cerca al promedio del país,
mientras que la mayoría de los departamentos parece ubicarse en el promedio en cuanto
a agresiones directas, se caracterizan por un factor de agresiones indirectas menor al
promedio.
V. CONCLUSIONES