Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Marzo 2024
Punto 1
d) Revise y reporte que las variables de homicidios (homicidios), presencia de coca
(coca) y as hectáreas cultivadas de coca (H_coca) estén definidas para el período. ¿A
qué se deben los missing?
De acuerdo al diccionario del Panel de características generales del CEDE (base maestra para
la construcción de la base consolidada: Panel_CEDE_Violencia.dta) el número total de
municipios analizados es de 1121, por lo cual partiremos de este valor para identificar los
datos faltantes para el periodo de análisis, 2005 – 2021
A través del comando “collapse (count) homicidios coca H_coca, by(ano)”, identificamos el
número de registros para cada uno de los años y las variables de interés.
Homicidios
Data Science & Analytics para AP
Marzo 2024
Como se observa en la tabla 1, hasta el año 2019, no se presentan datos perdidos. También,
al analizar los resultados generales de la variable homicidios (tabla 2), se identifica que para
el periodo completo de análisis, al tener como mínimo valor 0, este queda registrado para
los municipios en los cuales el número de homicidios es 0.
Sin embargo, al revisar el detalle para los dos años que se tienen valores perdidos, 2020 y
2021, se obtiene lo siguiente:
Dado que para estos dos años, a diferencia de los resultados generales (tabla 2), el valor
mínimo para los registros de homicidios es 1, es posible realizar la interpretación de que los
municipios en los cuales no se tiene información, es porque no se registraron homicidios,
por lo que, a partir de esta definición, se le asignaran para estos dos años el valor de 0 a los
datos perdidos.
Coca y H_coca
Al analizar las observaciones obtenidas para la variable “coca”, se observa que todos los
registros de la base de datos corresponden al valor 1, dado que su mínimo, máximo y media
es 1, y la desviación estándar es 0. A partir de esto, es posible realizar el supuesto de que
los registros de municipios que tienen un dato faltante, y en línea con la definición del
diccionario de datos, corresponden a municipios en los cuales no se presentan cultivos de
coca, por lo que se reemplazara el valor faltante por 0.
Para la variable “H_coca”, es claro que esta guarda una relación directa con la variable
“coca”, dado que si un municipio tiene presencia de cultivos de coca, la cantidad de
Data Science & Analytics para AP
Marzo 2024
hectáreas siempre será mayor a 0, razón por la que estas dos variables tienen el mismo
número de registros válidos y registros faltantes. En este caso también se observa que al ser
el número mínimo de hectáreas igual a 1, es posible realizar el supuesto de que los datos
faltantes corresponden a municipios que no tienen cultivos, es decir el número de hectáreas
es 0, razón por la que al igual que con la variable “coca”, se reemplazara el valor faltante por
0.
Punto 2
Construcción de matriz con el promedio de la tasa de homicidios por cada 100.000 personas
para las cinco regiones del DANE.
La Región Orinoquia presenta una tendencia mixta en su tasa de homicidios, con una
tendencia al alza en los primeros años seguida de una disminución en años posteriores. Sin
embargo, las fluctuaciones significativas en la tasa de homicidios en los últimos años indican
desafíos continuos en materia de seguridad.
Punto 3
Construcción de mapas y análisis de resultados
Data Science & Analytics para AP
Marzo 2024
Aunque para estos departamentos afectados por grupos armados, también se presentan
en algunos municipios tasas de hurto altas, este indicador elevado se concentra
principalmente en el centro del país y ciudades principales de los diferentes departamentos,
explicado por la delincuencia común que se presenta en estas ciudades, y debido a bandas
dedicadas al comercio ilegal de elementos robados, como lo son celulares, carros y partes
de vehículos, entre otros. Este fenómeno, debido a la mayor densidad poblacional de estas
ciudades, es más recurrente que se de en sectores urbanos que en zonas rurales del país,
como se puede evidenciar en el mapa generado.
También al contrastar los municipios con cultivos de coca para el 2021, se observa que
tienen relación directa en la mayoría de los casos, con las altas de homicidios para estos
mismos municipios. Esto se explica, ya que, la gran mayoría de estos cultivos deben estar en
control de grupos armados, generando violencia en el entorno en que se encuentran.
Tabla 7. Resultados regresión simple entre las hectareas cultivadas de coca y la tasa de homicidios
1
Fuente: Así son las rutas de la droga y la muerte en el Pacífico Colombiano (eltiempo.com). Obtenido de:
https://www.eltiempo.com/colombia/cali/asi-son-las-rutas-de-la-droga-y-la-muerte-en-el-pacifico-
colombiano-556055
Data Science & Analytics para AP
Marzo 2024
En palabras simples, ambos resultados sugieren una correlación positiva entre la presencia
de coca y la tasa de homicidios: a medida que aumenta la presencia de coca o las hectáreas
cultivadas de coca, la tasa de homicidios tiende a aumentar. Sin embargo, es importante
tener en cuenta que estas regresiones no pueden establecer una relación causal directa.
Otros factores podrían influir en la relación entre la presencia de coca y la tasa de
homicidios.