Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudio de La Accidentalidad Vial en Bogotá Usando Ciencia de Redes
Estudio de La Accidentalidad Vial en Bogotá Usando Ciencia de Redes
Tesis de grado presentado como requisito parcial para optar al tı́tulo de:
Magister en Ingenierı́a Fı́sica
Directora
PhD in Physics. Alejandra Juliette Baena Vasquez
Codirector:
PhD in Physics of Complex Systems. Johann Heinz Martinez Huartos
Lı́nea de Investigación:
Fı́sica Forense
Grupo de Investigación:
Modelación y Computación Cientı́fica (MCC)
A mi directora de tesis de maestrı́a Dra. Alejandra Juliette Baena Vasquez por su apoyo
incondicional y orientación para el alcance de los objetivos propuestos. A mi codirector de
tesis de maestrı́a Dr. Johann Heinz Martı́nez Huartos por su apoyo, paciencia, dedicación
y motivación. A ustedes mi gratitud por cada una de esas sesiones de trabajo, discuciones
académicas y por su compromiso en mi proceso de formación académica. Finalmente mi
agradecimiento, a los otros docentes de la maestrı́a porque a través de los seminarios y asig-
naturas, también contribuyeron en mi formación posgradual.
Esta tesis se realizó bajo un proyecto aprobado por la VCTI de la UAN con código 2019203,
tı́tulado estudio de la accidentalidad vial en Colombia mediante ciencia de redes y aplicación
en el mejoramiento de mecanismos, estrategias y acciones educativas para la seguridad vial.
Una colaboración interinstitucional con la Universidad de los Andes, la Agencia Nacional de
Seguridad Vial e internacional entre el grupo de investigación de Fı́sica Forense de la UAN
y el ICM Institut du Cerveau et de la Moelle épinière, Francia.
ix
Resumen
Los estudios de movilidad y seguridad vial, son fundamentales en la mitigación de los efectos
generados por los accidentes de tránsito a nivel mundial. Por lo tanto, dada la complejidad
en estos aspectos de la ciudad de Bogotá, se realiza un estudio de la accidentalidad vial
utilizando Ciencia de Redes en una ventana temporal de 7 años y a una resolución espacial
por Zonas de Análisis de Transporte (ZAT) que dividen a la ciudad en 922 polı́gonos de
acuerdo a la última encuesta de movilidad 2019. Los resultados permiten evidenciar algunas
particularidades en su dinámica, identificar las zonas que tienen comportamientos sincróni-
cos, corredores viales anómalos con bajo flujo vehicular y alta accidentalidad y cuantificar
la entropı́a espacio-temporal de los accidentes de tránsito.
Abstract
Mobility and road safety studies are essential in the mitigation of the effects generated by
traffic accidents worldwide. Therefore, given the complexity in these aspects of the Bogotá
city, a study of road accidents is carried out using Network Science in 7 years range and at a
spatial resolution by Traffic Analysis Zones (TAZ) that divide to the city into 922 polygons
according to the latest mobility survey 2019. The results show some peculiarities in its dyna-
mics, identify the areas that have synchronous behaviors, anomalous road corridors with low
vehicle flow and high accident rates and quantify the spacetime entropy of traffic accidents
Resumen IX
1. Introducción 2
2. Aspectos Teóricos 10
2.1. ¿Qué es una red? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2. Algunos conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3. Metodologı́a 14
3.1. Fase I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2. Fase II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3. Fase III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4. Resultados 20
4.1. Recolección y caracterización del conjunto de datos . . . . . . . . . . . . . . 20
4.2. Representación estadı́stica y geográfica del conjunto de datos . . . . . . . . . 22
4.2.1. Análisis temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Caracterización por gravedad y tipo de siniestro . . . . . . . . . . . . 23
Caracterización por año . . . . . . . . . . . . . . . . . . . . . . . . . 24
Caracterización por mes . . . . . . . . . . . . . . . . . . . . . . . . . 25
Caracterización por dı́a . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.2.2. Análisis espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3. Aplicación de Ciencia de Redes . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3.1. Matriz de correlación y grafos . . . . . . . . . . . . . . . . . . . . . . 33
4.3.2. Hubs y caracterı́sticas de red . . . . . . . . . . . . . . . . . . . . . . . 38
4.3.3. Ley de potencia en la accidentalidad vial . . . . . . . . . . . . . . . . 44
4.3.4. Entropı́a espacial y temporal . . . . . . . . . . . . . . . . . . . . . . . 47
4.3.5. Precursores anómalos . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5. Conclusiones y recomendaciones 55
5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2. Recomendaciones y perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . 57
Índice general 1
Bibliografı́a 71
1. Introducción
Según las últimas estadı́sticas sanitarias del Global Health Estimates de la [Organización
Mundial de la Salud, 2015], los accidentes de tránsito son una de las principales causas de
muerte en todos los grupos etarios y la primera entre personas en el rango de 15 a 29 años de
edad, dejando como resultado alrededor de 1.3 millones de fallecidos por año en el mundo.
En consecuencia de lo anterior, la accidentalidad vial es considerada como un problema de
salud pública a nivel global y por lo tanto, la Asamblea General de las Naciones Unidas
proclamó el periodo 2011-2020 como el ((Decenio de Acción para la Seguridad Vial))1 , con el
objetivo general de reducir las cifras previstas de vı́ctimas mortales en accidentes de tránsito
en todos los paı́ses. No obstante, desde el año 2015 se incluyó una meta ambiciosa en los
Objetivos de Desarrollo Sostenible (ODS) para el 2030 con respecto a la seguridad vial2 , en
donde se propone reducir el número de defunciones y lesiones por accidentes de tránsito en
todo el mundo a la mitad para el 2020 [World Health Organization, 2010], resultado que
dista aún de ser conseguido [World Health Organization, 2018].
No obstante, los métodos basados en estadı́stica clásica para el análisis de datos de acciden-
talidad, no permiten extraer información adicional de esta problemática. La accidentalidad
involucra diversas variables que se interrelacionan y por lo tanto se convierten en sistemas
complejos de análisis [Martı́n et al., 2014]. Ası́, entonces, se considera de alta importan-
cia aprovechar nuevas herramientas que desde la interdisciplinariedad permitan dar nuevas
perspectivas al fenómeno, por ejemplo, a través de la aplicación de modelos matemáticos y
la fı́sica estadı́stica que puedan ser alimentados con los datos de accidentalidad en aras de
realizar simulaciones computacionales o modelos data-driven más robustos, vigilados desde
una perspectiva cientı́fica.
La modelación de accidentes se ha utilizado desde hace varias décadas como una herramienta
para comprender cómo ocurren los incidentes de seguridad vial. Tradicionalmente, este se ha
visto limitado por el criterio de la linealidad, es decir, que los accidentes son una secuencia
lineal de eventos que finalmente resultan en un suceso que vulnera la seguridad de personas
y/o objetos [Qureshi, 2008]. Sin embargo, esta tesis de linealidad es debatible si desde la
perspectiva del triángulo de accidentalidad, se reconoce que el factor humano y su relación
con el factor vehı́culo y las vı́as no es de caracter lineal. Sobre esta base, varios modelos han
sido desarrollados a lo largo de la historia, rastreado a grandes rasgos, desde los años 40:
El primer grupo de modelos, proporciona una imagen elemental a partir de una represen-
tación vial de cómo se pensaba que ocurrı́an. El pionero de estos, conocido como la teorı́a
4 1 Introducción
Dominó, propuesto por Heinrich en la década de los 40, describe un accidente como una
cadena de eventos discretos, los cuales ocurren en un orden temporal particular [Heinrich,
1969, Shealy, 1979, Stanton and Willenbrock, 1990]. Está teorı́a fue la base de los modelos
de accidentes secuenciales o modelos de accidentes basado en eventos. Los modelos secuen-
ciales asumen que la relación causa-efecto es lineal y determinista, en donde la causa A lleva
a un efecto B, en una situación especı́fica. Se observó que estas consideraciones no tienen
la capacidad de explicar las causas en un sistema socio-técnico moderno, donde múltiples
factores combinados en una variedad de caminos conllevan a fallas en dicho sistema, y como
consecuencia, a los accidentes. Modelos predictivos preliminares se basaron en la regresión li-
neal múltiple. Posteriormente se incluyeron otros tratamientos como la regresión de Poisson,
para subsanar algunas inconsistencias, como valores predictivos que no tienen relación con
el fenómeno. Variantes del modelo lineal con regresión de Poisson se han propuesto para ex-
plorar la relación entre factores de riesgo y modelado de accidentes de tránsito [Mohammed
et al., 2018, Abdulhafedh, 2016]. Igualmente, se han explorado procedimientos más riguro-
sos como el modelo Conway-Maxwell Poisson para describir problemas en la seguridad vial,
aunque su aplicación ha sido limitada. Este último, se considera una especulación del modelo
de Poisson al manejar datos muy dispersos, pero con la afinación de muchos parámetros que
dificultan usarlos en la práctica para el estudio de accidentes [Lord, 2006].
El segundo grupo de modelos aborda una perspectiva en la que se ha comprendido que una
función lineal puede no ser suficiente para exponer la relación entre las variables depen-
dientes e independientes en la modelación de accidentes. Por tanto, aproximaciones como
la lógica difusa y redes neurales artificiales (ANN )3 , actualmente están disponibles como
herramientas computacionales que pueden ser útiles para el entendimiento de problemas de
tránsito. Las ANN tienen la capacidad de usar funciones no lineales con altos niveles de
confiabilidad usando algoritmos de aprendizaje al emular el sistema de capas neuronales del
cerebro y que tienen ventajas sobre los modelos estadı́sticos clásicos, dado que no requieren
una forma funcional entre las variables [Abdulhafedh, 2017]. Por su lado, la lógica difusa
ha sido también usada para el estudio de accidentes a través de un mapeo no lineal de un
grupo de datos de entrada, definidos en términos de conjuntos difusos y mediante ciertas
reglas, producen un grupo de datos de salida; los resultados de la aplicación de este proceso,
permiten ayudar a predecir la ocurrencia de estos eventos y por lo tanto ayudar a mejorar
la seguridad en las vı́as [Driss et al., 2015, Xiugang et al., 2008]. Los métodos no lineales
suelen no requerir métodos estadı́sticos paramétricos, disminuyendo restricciones teóricas,
con la ventaja de poder ser usados en fenómenos no lineales y acercándose un poco más a
la realidad de un accidente de tránsito.
(Complex Socio Technical Systems [Klockner and Toft, 2015]) y los resultados de eventos
son producto de esa cooperación. Las ANN y la lógica difusa, entre otras, ofrecen algunas
respuestas sobre cómo trabajar la problemática social del accidente incluyendo algunos de los
posibles factores de riesgo (humano, ambiente, vehı́culo, etc). Paralelo a esto, nuevas pers-
pectivas, e.g., cadenas de Markov o redes complejas, han ganado fuerza por su capacidad
de describir la interacción de múltiples versiones de factores de accidentalidad, generando
un engrama de estos que permite evidenciar patrones espacio-temporales de la accidentali-
dad vial. Es en este paradigma, el de la complejidad, en el que se enmarca la propuesta de
este trabajo, se propone hacer uso de nuevas perspectivas que asocien la complejidad del
fenómeno de la accidentalidad vial y realizar una caracterización de accidentes que reflejen
posibles relaciones ocultas o patrones espacio-temporales emergentes que aunen a entender
la evolución de la accidentalidad y la movilidad en una ciudad.
En el estudio de los sistemas complejos, sobresale la Ciencia de las Redes (CR)4 que ha
tenido gran auge por sus capacidad de representar la interacción de muchos agentes inter-
actuantes. Esta tiene su base en las matemáticas, en la denominada teorı́a de grafos. En
la CR, los agentes interactuantes son representados como nodos y sus interrelaciones como
enlaces [Estrada, 2016, Newman, 2013]. Respecto al fenómeno de movilidad y accidentali-
dad, la CR ofrece perspectivas novedosas, en contraste con análisis clásicos de movilidad.
Por mencionar algunos, [Klockner and Toft, 2015] propuso un análisis de cómo se pueden
interconectar factores que contribuyen a la seguridad en un sistema ferroviario. El trabajo
usó datos proporcionados por el regulador de la seguridad ferrovaria en Queensland Austra-
lia y los resultados permitieron visualizar a las redes como una herramienta para el análisis
de la gestión del riesgo y de cómo ciertos factores deben controlarse para la prevención de
los accidentes. [Wang et al., 2012] propuso una aproximación analı́tica para representar una
4
Anteriormente conocida como Teorı́a de redes complejas.
6 1 Introducción
red del sistema vial. Obtuvo cuantitativos para determinar relaciones desconocidas entre
algunos factores de la estructura de la red como el tipo de carretera, factores demográficos
y caracterı́sticas de tráfico con la cantidad de accidentes en las denominadas las zonas de
análisis transporte (ZAT). Haciendo uso de los datos del Condado de Orange (California.
EUA), obtuvo como resultado, una importante conexión entre el tipo de estructura de la red
y la cantidad de incidentes viales.
Las aproximaciones transdiciplinares para el estudio de la seguridad vial con base en CR, han
tenido una acogida importante de entidades que son autoridades en el estudio de la seguridad
vial, el sistema de transporte, su impacto social y económico. Entre estas, el NCITEC 5 , ha
realizado varios proyectos cerrando las brechas existentes entre ciencias, ingenierı́a y estudios
sociales. En uno de los estudios, se consiguió modelar, visualizar y medir las interacciones y
atributos entre los elementos de la red vial en Louisiana. Acorde a los autores, esto permitió
determinar factores claves en las decisiones de la planeación del transporte para mitigar la
congestión en las vı́as. Se incluyeron variables determinantes en el comportamiento de las
redes de transporte como la demanda de las vı́as usando encuestas de movilidad que marca-
ban el Origen-Destino de las personas en la ciudad. Las intersecciones fueron los nodos de la
red, y las vı́as sus enlaces. Las medidas de centralidad o importancia de los nodos arrojaron
resultados interesantes sobre intersecciones especificas que influyen de forma dominante en
la congestión de nodos [El-adaway, I., 2012]. Lo anterior, solo por nombrar algunos casos,
resalta la importancia de la colaboración de entidades con acceso a información vı́al para
análisis basados en nuevas perspectivas como la CR.
Este trabajo auna las metodologı́as de la ciencia de datos y la CR para arrojar luces sobre
el fenómeno de la accidentalidad vı́al. Las bases de datos oficiales de la ANSV son usadas
como insumos para el trabajo, en particular, el corpus de datos de la accidentalidad vı́al
de Bogotá a lo largo de 12 años. Teniendo en cuenta que hasta ahora no hay precedentes
de la aplicación de ciencia de redes a datos de accidentalidad vı́al en Colombia, se plantea
como Objetivo general: Obtener y procesar datos para la construcción de redes de acci-
dentalidad geoespacial a lo largo del tiempo en la ciudad de Bogotá, mediante técnicas de
CR y aprovechando perspectivas interdisciplinares de otras áreas como la neurociencia, en
particular, la creación de redes funcionales. En aras de la consecución del objetivo general,
el trabajo especifica cinco objetivos, a saber:
Recolectar bases de datos open access, y de entidades públicas del gobierno, la infor-
mación relacionada con la accidentalidad vial en Bogota.
Aplicar metodologı́as de CR para crear redes funcionales, propias del área de la neu-
rociencia teórica, para identificar parámetros topológicos de la red de accidentalidad
vial.
Obtener los precursores anómalos como corredores viales de alto correlación de acci-
dentalidad frente a bajos flujos de movilidad.
Si bien se establece que el grueso del valor de este trabajo se centra en la geocodificación de
un conjunto de datos de accidentes viales caracterizando: tiempo, espacio, tipo de acciden-
te, entre otros parámetros asociados, y que sea entregado como de libre acceso a diferentes
resoluciones espaciales y temporales; se debe reconocer también el esfuerzo de aplicar me-
todologı́as propias de un área de conocimiento muy distinta, -como la neurociencia teórica-,
al fenómeno de la accidentalidad vial. En la misma lı́nea, se genera nuevo conocimiento al
involucrar información de las redes de accidentalidad vial creadas a partir de métodos de
neurociencia, con la obtenida a partir de la redes que surgen del uso de las encuestas de
movilidad, especı́ficamente de las matrices Origen-Destino (OD).
Desde la neurociencia de redes, las redes funcionales son constructos teóricos para enten-
der cuál podrı́a ser la interdependencia entre dos regiones en la corteza cerebral [Soriano
et al., 2018, Martı́nez et al., 2018]. La conectividad funcional se define como aquella en la
que diferentes regiones cerebrales comparten propiedades funcionales. Es decir, cómo es la
correlación temporal entre eventos neurofisiológicos espacialmente remotos. Asumiendo que
la corteza cerebral se divide en diferentes regiones de interés (ROI6 ), que asocian activaciones
electromagnéticas en el tiempo, como los registros de electroencefalografı́a o magnetoence-
falografı́a, se puede reconstruir la red funcional cortical. Esta responde a cómo diversas ROI
estan sincronizadas independiente de que tengan diferentes niveles de activaciones. Ası́, los
nodos de la red resultan ser las ROI, y los pesos ponderados de sus enlaces obedecen a las
correlaciones de estadı́sticas de las señales cerebrales.
Partiendo de este constructo, este trabajo considera como ROI un parangón en el contex-
to de la movilidad y accidentalidad. Ası́, las denominadas Zonas de Análisis de Transporte
(ZAT), aparecen naturalmente como las particiones geoespacialmente definidas por las en-
cuestas de movilidad. Aunque existen diversas escalas espaciales a observar en el sistema,
la macroescala (Distritos o localidades) y la microescala (Barrios) no serı́an factibles a un
analisis en el marco de este trabajo. La primera, por la baja cantidad de elementos, o ROI
interactuantes (#ROI ≈ 20)7 . Esto limitarı́a la potencia de un análisis estadı́stico mediante
6
De sus siglas en Inglés Region of Interest (ROI)
7
# define la cardinalidad
8 1 Introducción
CR que reclama una mayor cantidad de nodos. La segunda, por la potencial ausencia de ROI
activas y que, por ende, reflejen zonas que no asocien accidentalidad vial. En ese sentido,
este trabajo centra su análisis en la observación de la mesoescala del sistema complejo de
accidentalidad vial conformado por las ZAT8
Para lograr el objetivo principal de este estudio, se preparó un plan de gestión para la reco-
lección y oficialización de las bases de datos. Posteriormente se aplicaron procesos compu-
tacionales para la caracterización fı́sica de la información en términos de geolocalización en
la mesoescala y a la menor resolución temporal factible (Horas y minutos de ocurrencia del
accidente). Luego del pre-procesamiento del cuerpo de datos de accidentalidad, se realizó el
proceso de geocodificación de los mismos, el cuál es parte central de este trabajo. Se realizó
un procedimiento de visualización cientı́fica para representar gráfica y estadı́sticamente las
variables objetivo. Consecutivamente, se creó la conectividad funcional a partir de las corre-
laciones de Pearson entre las series de tiempo de accidentes por ZAT, extraidas del corpus
de datos. Se usaron metodologı́as de CR para evidenciar la dinámica en la estructura de la
red de accidentalidad en Bogotá. En particular, se obtuvieron parámetros de red que permi-
tieron capturar nuevas relaciones sincrónicas entre las ZAT. Se obtuvo una estimación de la
entropı́a espacial y temporal de los accidentes de tránsito en Bogotá. Lo anterior, en aras de
observar cómo es la distribución espacial y temporal de los accidentes en la ciudad. Se define
y cuantifica una nueva metodologı́a para develar precursores anómalos usando la informa-
ción de las encuestas de movilidad de Bogotá y las redes funcionales de accidentalidad. Se
develan cuáles son lo denominados precursores anómalos, definidos como corredores viales
de alta correlación de accidentalidad frente a bajos flujos de movilidad. Dado que una parte
importante del trabajo es la geocodificación, se anexan para libre uso las redes y los datos
8
Orden de magnitud del #ZAT≈ 103 .
9
En vista de todo lo anterior y con el ánimo de una lectura ligera he dividido el siguiente
documento en varios capı́tulos. El segundo capı́tulo condensa, a manera de lista, conceptos
y ecuaciones relevantes que se usarán a lo largo del documento. El tercer capı́tulo equivale a
una sección de Materiales y Métodos de un artı́culo, en donde se presenta el cuerpo de datos
y su procesamiento, que es la parte central de este trabajo de fin de maestrı́a. El cuarto
capı́tulo muestra los resultados más relevantes de este trabajo, incluyendo lo relevante del
procesamiento y la geocodificación, el análisis estadı́stico, el análisis temporal y espacial, las
redes funcionales, las encuestas de movilidad y sus matrices OD, el análisis de entropı́a, de
redes, y los procursores anómalos. El quinto capı́tulo contiene las conclusiones y recomen-
daciones para un futuro trabajo y la prospectiva del mismo. Finalmente, luego del capı́tulo
de referencias, se presenta una sección de Anexos en el que se presentan las redes por CP
que serán igualmente depositadas en el github asociado a este trabajo junto con los datos
geocodificados y las redes a nivel de ZAT.
2. Aspectos Teóricos
Como definición básica, una red es la visualización de un objeto matemático llamado grafo
G = {V, E}, que tiene como representación matemática una matriz. Los elementos interre-
lacionados de un sistema son representados por los vértices o nodos del subconjunto V , y
las relaciones o interacciones entre estos corresponden a sus aristas o links que conforman el
subconjunto E. La figura 2-1 ilustra un grafo de ||N || = 6, ||E|| = 7.
Figura 2-1.: Grafo G = {V, E}. El conjunto de nodos V = {A, B, C, D, E, F } asocia el con-
junto de enlaces E = {(A, B), (A, D), (A, F ), (B, F ), (C, E), (D, E), (E, F )}.
El número máximo de conexiones que puede llegar a tener un grafo, se calcula a través de
la (ecuación 2-1)
N (N − 1)
||E||max = (2-1)
2
Dada la versatilidad del constructo grafo a ser interpretable en diferentes contextos, los
2.1 ¿Qué es una red? 11
conexiones fı́sicas tangibles como las redes de internet, vı́as, agua y electricidad, neurales
y vasculares.
proximidad geográfica como las conexiones entre paı́ses, células conectadas entre sı́ en los
tejidos.
conexiones sociales como las redes de colaboración entre grupos, amistades, lazos familia-
res.
enlaces conceptuales en donde los nodos pueden estar conceptualmente conectados entre
sı́ como en diccionarios.
enlaces funcionales tal que de acuerdo a su relación, un nodo puede activar otro como
sucede en el caso de las máquinas.
Los grafos son representados por medio de una matriz que se conoce como matriz de adya-
cencia A = (aij ), en donde los elementos que la componen, pueden tomar valores de 0 o 1
dependiendo si el nodo i está o no conectado con el nodo j.
1, (i, j) ∈ E,
ai,j = (2-2)
0, (i, j) 6∈ E.
Este tipo de matrices, también llamadas binarias, por su naturaleza simétrica, definida po-
sitiva y cuadrada, asocian un grafo también llamado grafo binario2 . Esta matriz facilita el
estudio formal de las redes a través de la aplicación de técnicas o algorı́tmos de álgebra y
teorı́a espectral, los cuales permiten extraer información relevante de un sistema complejo.
En la misma lı́nea, cuando la relación entre dos nodos i y j es ponderada, su link asocia un
peso ωij que puede tomar valores en los reales.
ωij , (i, j) ∈ E,
ai,j = (2-3)
0, (i, j) 6∈ E.
Este tipo de matrices no binarias, denominadas también como matrices pesadas, que cuan-
tifican, además, la conexión entre sus nodos, es un ejemplo de las matrices que se asocian
1
Se usará el anglisismo link y enlace de igual manera en el manuscrito.
2
Se usará el concepto de grafo y red de igual manera en el manuscrito.
12 2 Aspectos Teóricos
a una red funcional o a una matriz OD. Si bien la clasificación de redes es muy amplia y
existen diversos parámetros de redes que se pueden calcular, una caracterización total de
los parámetros de red y su clasificación está fuera de nuestra actual lı́nea de trabajo. No
obstante, se deja a continuación las definiciones básicas de los parámetros de red usados
en este trabajo de fin de maestrı́a Newman [2013], Estrada [2016]. Se recomienda al lector
interesado en profundizar en estos temas, el ahondar en estas referencias.
X
si = ωi,j (2-4)
j
Entropı́a de Shannon Es una medida del desorden del sistema. De la misma manera,
cuantifica cómo se distribuye la variable x en sus n grados de libertad, ası́, una distribución
uniforme se considera de entropı́a máxima, mientras que altos niveles de heterogeneidad en la
variable aleatoria x, asocian niveles de entropı́a menores. En este trabajo se usa una versión
modificada de la entropı́a de Shannon denominada entropı́a normalizada y con un dominio
3
Se usará el anglisismo strength y fuerza de igual manera en el manuscrito.
4
Se usará el anglisismo weighted clustering y agrupamiento ponderado de igual manera en el manuscrito.
5
Se usará el anglisismo eigenvector centrality y centralidad de vector propio de igual manera en el manus-
crito.
2.2 Algunos conceptos básicos 13
en [0,1]. Esta se calcula como el radio de la entropı́a de Shannon a la entropı́a máxima dada
por una distribución homogenea, donde P es la distribución de probabilidad de una variable
aleatoria x.
P
− i P (xi )log2 P (xi )
H(x) = (2-6)
log2 (n)
6
Por sus siglas en Inglés Probability Density Function
3. Metodologı́a
En este capı́tulo se describe la ruta metodológica por fases para el alcance de los objetivos
propuestos de la tesis. En el contexto nacional, los siniestros viales son catalogados como
eventos que involucran por lo menos un vehı́culo en movimiento, que ocurren en vı́a pública
o privada y como consecuencia de lo anterior, pueden causar daños materiales, lesiones leves
o graves a personas e incluso a animales. Bajo esta concepción, se aplican algunos conceptos
de fı́sica y CR para arrojar luces, desde una nueva perspectiva, al fenómeno de la dinámica
vial en la ciudad de Bogotá.
3.1. Fase I
Al inicio de esta investigación, se encontraron diferentes bases de datos que contenı́an in-
formación parcializada o incompleta en cuanto a la accidentalidad vial en Bogotá desde el
año 201112 . En otras palabras, la información presentada no contenı́a los datos suficientes
para la geolocalización (coordenadas latitud-longitud) de los accidentes. La nomenclatura
de las direcciones reportadas tienen diferentes formatos para etiquetar las calles, carreras,
transversales, diagonales y algunas presentaban inconsistencias que en principio podrı́an ser
asociados a posibles errores humanos en el levantamiento y manejo de la información. Por
lo tanto, para el análisis de los datos, se toma todos los accidentes que tengan los siguientes
elementos:
Tipo de Clima:
Lluvia, normal, viento y niebla.
Tipo de accidente:
Atropello, autolesión, caı́da de ocupante, choque objeto fijo, otro tipo de choque, cho-
que objeto semoviente, choque tren, choque vehı́culo, incendio, otro (aprisionamiento
y sumersión) y volcamiento.
1
https://datosabiertos.bogota.gov.co/dataset?q=accidentes+de+transito,
2
https://www.datos.gov.co/
3.2 Fase II 15
3.2. Fase II
Siguiendo los mismos criterios descritos en la sección anterior, se utiliza el software PSPP 3
de uso libre (Figura 3-1) para el filtro y análisis estadı́stico de los datos a nivel temporal y
a diferentes resoluciones espaciales por:
Localidad o Distrito4 .
Sin embargo, estas divisiones en muchos casos deben ser filtradas para visualizar únicamente
lo que el usuario desea a través de software especializados en sistemas de información geográfi-
ca (SIG). Por tanto, se utiliza QGIS, una herramienta muy reconocida a nivel mundial de
uso libre y código abierto12 para este proceso, tal y como se puede observar en la (Figura
3-2) en donde se presenta las diferentes escalas espaciales haciendo uso de la herramienta.
Figura 3-2.: Diferentes escalas espaciales para el estudio. De izquierda (macroescala) a de-
recha (mesoescala de mejor resolución espacial). Se omite la presentación de
la microescala (barrios).
12
https://www.qgis.org/es/site/
3.2 Fase II 17
Para los objetivos del trabajo, las escalas mas adecuadas para este tipo de análisis, corres-
ponden precisamente a las divisiones por UTAM y ZAT. Adicionalmente, aprovechando que
para el año 2019 se publica la última encuesta de movilidad, en donde se realiza una caracte-
rización en términos de la movilidad de las personas residentes del área urbana de Bogotá y
18 municipios vecinos de su área de influencia: Bojacá, Cajicá, Chı́a, Cota, El Rosal, Facata-
tivá, Funza, Gachancipá, La Calera, Madrid, Mosquera, Sibaté, Soacha, Sopó, Tabio, Tenjo,
Tocancipá y Zipaquirá, se anexan los Shapefiles con las últimas modificaciones y una matriz
que contiene la información de los desplazamientos OD de las personas en el área de estudio
por ZAT. Se inicia el análisis a nivel ZAT por ser esta la que mejor resolución espacial tiene,
sin perder ROI que no contengan información de accidentalidad. Los siguientes pasos en Qgis
permiten poner a punto los datos y generar un nuevo Shapefile con la información necesaria
para los posteriores análisis de redes.
Teniendo en cuenta que en las bases de datos de accidentalidad solo aparece los ac-
cidentes en el perı́metro urbano, se excluyen las ZAT que pertenecen a zonas rurales
haciendo uso de la tabla de atributos (Figura 3-3).
Figura 3-3.: Filtro de los ZAT en QGIS. (Izq) Tabla de atributos de los polı́gonos ZAT.
(Cent) Mapa del departamento o comunidad de Cundinamarca que contiene a
Bogotá, (Der) Ciudad de Bogotá.
Posteriormente se divide la base de datos por dı́a de la semana y se cargan los ar-
chivos en formato CSV. Estos contienen toda la información de los accidentes con las
coordenadas latitud-longitud. Para realizar este proceso, se descarga un complemento
adicional en QGIS llamado MMQGIS y se ejecuta su algoritmo (Figura 3-4).
18 3 Metodologı́a
Figura 3-4.: Importar los accidentes en QGIS. (Izq) Instalación de plugins, (Cent) Importar
datos y acoplarlos a las coordenadas de los polı́gonos ya establecidos, (Der)
Visualización de los datos importados en el mapa.
Se realiza un conteo del número de accidentes por ZAT siguiendo la ruta (Vectorial +
Herramientas de análisis + Contar puntos en polı́gono). Adicionalmente, se detectan
los centroides de cada ZAT siguiendo la ruta (Vectorial + Herramientas de análisis +
Centroides) y se generan dos nuevos shapefiles descargando otro complemento en QGIS
llamado QConsolidate3 (Figura 3-5). Parte del proceso de análisis espacio temporal
y de redes, es realizado bajo el lenguaje de programación MATLAB13 , por su interfaz
gráfica y robustez.
Figura 3-5.: Conteo de puntos por polı́gonos y sus centroides en QGIS. (Izq) Conteo de
eventos por ZAT, (Cent) Detección de centroides de los polı́gonos de las ZAT,
(Der) Generación de de nuevos shapefiles con información de eventos por ZAT.
13
https://www.mathworks.com/products/matlab.html
3.3 Fase III 19
1. Abrir y copiar las direcciones en una hoja de cálculo de Google Drive, preferiblemente
con la siguiente notación
Dirección, Localidad, Ciudad
⇓
1
https://datos-abiertos-sdm-movilidadbogota.hub.arcgis.com/
4.1 Recolección y caracterización del conjunto de datos 21
Figura 4-1.: API de Google para la geocodificación. Se entregará un archivo *.txt con este
código para reproducir la geocodificación de diferentes tipos de direcciones.
⇓
4. Finalmente, abrir la pestaña Ejecutar + Ejecutar Función
⇓
5. El tiempo de ejecución varı́a entre uno a dos minutos dependiendo de la velocidad de
conexión a internet, equipo de computo y la cantidad de datos de entrada. El resultado del
proceso si la sintaxis de las direcciones es la correcta, es una tabla con las coordenadas
[Latitud - Longitud] como se indica a continuación:
Dirección Coordenada
Carrera 14L 68B S 20, Usme, Bogota [4,5264263] [-74,1204377]
Calle 100 11 2, Usaquen, Bogota [4,682809] [-74,0433265]
Transversal 57 104b 2, Suba, Bogota [4,6929721] [-74,0649107]
22 4 Resultados
Cabe resaltar que para el caso de Colombia, las direcciones pueden ser de particular y gran
variabilidad debido a la estructuración de las direcciones y su complicada nomenclatura. Se
entregará también una muestra de direcciones que ya han sido verificadas y bien procesadas.
La idea es que nuevas direcciones tengan el formato prescrito para evitar errores en la
compilación.
Figura 4-2.: Accidentes viales reportados por año en Bogotá, donde N (t) representa el
número de eventos por año.
Dado que no se evidencian cambios relevantes, es necesario realizar análisis más detallados
que permitan identificar patrones caracterı́sticos de la dinámica vial de la ciudad. En este
sentido, utilizando el software para análisis estadı́stico PSPP a través de la opción Datos +
Dividir archivo, se fragmenta la sábana de datos y se realizan diferentes conteos del número
de accidentes por: año, mes, dı́a de la semana, tipo de accidente y gravedad. Todos los
anteriores en función del tiempo y a lo largo de las 24 horas del dı́a. Los resultados de este
proceso son presentados a continuación.
4.2 Representación estadı́stica y geográfica del conjunto de datos 23
En esta sección se resaltan algunas caracterı́sticas de los accidentes viales con muertos,
heridos y daños en cuanto a orden de magnitud (Figura 4-3) y los diferentes tipos de siniestro
reportados en la sabana de datos (Figura 4-4).
Figura 4-3.: Comportamiento de accidentalidad vial por gravedad, donde N (t) representa
el número de eventos por hora y Ng la totalidad de eventos de acuerdo a la
gravedad.
Note que en la (Figura 4-4) los patrones de atropello tienen una tendencia al aumento a lo
largo del dı́a, mientras que autolesión y volcamiento tienen un comportamiento similar con
un pico en común a las 06:00 horas, los accidentes con caı́da de ocupantes principalmente en
el transporte público tiene un pico sobresaliente a las 18:00 horas y una estable meseta entre
las 05:00 y las 15:00 horas del dı́a, incendio no presenta un patrón definido y finalmente los
accidentes con daños materiales y otro tipo de colisiones con trenes, semovientes y objetos
fijos tienen un comportamiento muy similar a la mayor cantidad de accidentes con daños y
heridos (Figura 4-3).
24 4 Resultados
Figura 4-4.: Comportamiento de accidentalidad vial por tipo de siniestro, donde N (t) re-
presenta el número de eventos por hora y Ns la totalidad de eventos de acuerdo
al siniestro.
En la (Figura 4-5) se puede evidenciar un pico de accidentalidad sobre las 07:00 horas que
es coherente con el horario previo al inicio de la jornada laboral y de algunas instituciones
de educación. Sobre las 14:00 horas después del año 2013 aparece otro pico, que pudo ser
generado después de la entrada en vigencia de la restricción de movilidad impuesta por la
Alcaldı́a Mayor de Bogotá bajo el Decreto Distrital 271 de 2012 y que aún se mantiene
vigente. Esta ley restringe la libre circulación por las vı́as de la ciudad entre las 06:00 y las
08:30 horas y entre las 15:00 y las 19:30 horas para placas terminadas con dı́gito par o impar
y que coincidan con esta caracterı́stica en los dı́as hábiles de acuerdo al calendario.
4.2 Representación estadı́stica y geográfica del conjunto de datos 25
Figura 4-5.: Comportamiento anual de accidentalidad vial. El eje vertical izquierdo de las
figuras N (t), es el número de eventos por hora. Na es la totalidad de eventos
por año. El eje derecho de las figuras representa el porcentaje de accidentalidad
anual a cada hora del dı́a.
En la (Figura 4-6) se visualiza un comportamiento muy similar al de la (Figura 4-5) pero por
mes a lo largo del mismo periodo. No obstante, aquı́ aparece un tercer pico sobre las 19:00
horas que no era muy predominante en la (Figura 4-5). Finalmente, el mes de diciembre tiene
un comportamiento atı́pico en el pico de las 07:00 horas ya que disminuye considerablemente
respecto a los otros meses del año, probablemente porque coincide con las vacaciones de la
mayorı́a de instituciones educativas y empresas..
26 4 Resultados
Figura 4-6.: Comportamiento de accidentalidad vial por mes, donde N (t) representa el
número de eventos por hora y Nm la totalidad de eventos por mes.
En la (Figura 4-7) el comportamiento es similar a las (Figuras 4-5 y 4-6) como era de
esperarse para los dı́as hábiles, pero el comportamiento cambia considerablemente para el
fin de semana ya que no hay restricción de movilidad. No obstante, el pico de las 14:00 se
corre para las 13:00 horas en dı́as no hábiles y aparece un pico adicional sobre las 03:00
horas y que coincide con el horario de cierre de los bares y discotecas de la ciudad, en donde
posiblemente el alcohol y el bajo flujo vehicular en las vı́as, contribuyen al incremento en la
accidentalidad.
4.2 Representación estadı́stica y geográfica del conjunto de datos 27
Figura 4-7.: Comportamiento de accidentalidad vial por dı́a, tal que N (t) representa el
número de eventos por hora y Nd la totalidad de eventos por dı́a.
Otro aspecto a tener en cuenta, es que la distribución de las ZAT son modificadas en periodos
de tiempo relativamente cortos ya que el incremento de la población y las modificaciones en
los Planes de Ordenamiento Territorial (POT), juegan un papel muy importante. Por esta
2
Polı́gonos, asociados a ZAT, en adelante también llamados nodos de la red.
28 4 Resultados
razón, se toma la decisión de reducir la ventana temporal y tomar solo los datos de los últimos
7 años teniendo en cuenta que a partir del año 2013, el patrón de accidentalidad temporal
se mantuvo en el tiempo (Figura 4-5). Justamente, a partir de este año, las condiciones de
movilidad en cuanto a la restrición de pico y placa se han mantenido a la fecha actual. Como
consecuencia de la reducción de las ZAT y de los datos, se pasó de tener 405348 a 218620
eventos para los subsiguientes análisis espaciales y de redes (Figura 4-8).
Figura 4-8.: (Izq.) Capa con los 792 ZAT de interés para el estudio. (Der) Distribución
geográfica de la totalidad de accidentes reportados en Bogotá (2013-2019).
Para el estudio espacial en Matlab, la capa de la (Figura 4-8) debe ser almacenada en un
nuevo shapefile que contenga en su tabla de atributos, el número de accidentes en cada
polı́gono. Este procedimiento es muy importante, ya que Matlab reconoce este tipo de for-
matos y es el insumo básico para el estudio de redes. Una vez cargado el shapefile en Matlab,
las matrices asociadas a la accidentalidad en función del tiempo por cada dı́a tienen un ta-
maño de (792 × 24), (#ZAT, Horas del dı́a), respectivamente.
En las (Figuras 4-9, 4-10, 4-11, 4-12, 4-13, 4-14 y 4-15) se puede evidenciar las ZAT que
presentan mayor accidentalidad por hora en el mapa de calor. Las gráficas superior y lateral
de este mapa, ayudan a identificar algunas particularidades temporales (patrón temporal en
la subfigura superior) y espaciales (patrón espacial en la subfigura lateral). Adicionalmente,
se ubica un Choropleth3 como mapa geográfico en donde las áreas de las regiones sombreadas
están directamente relacionadas con el número total de accidentes para cada dı́a de la semana.
Esta forma de visualizar cualquier variable estadı́stica, permite identificar de una manera
mas sencilla, los patrones espaciales de las ZAT.
3
Es un tipo de mapa temático en el que las áreas se sombrean de distintos colores de acuerdo a una escala
definida, que representa diferentes valores de una variable estadı́stica
4.2 Representación estadı́stica y geográfica del conjunto de datos 29
Figura 4-9.: (A.) Matriz de accidentalidad para los 792 ZAT. Y , < X > y < Y > re-
presentan el número de accidentes, su promedio de eventos normalizados por
ZAT, y por hora, respectivamente. (B.) Choropleth map con el número total
de eventos para el dı́a lunes N1 .
Figura 4-10.: (A.) Matriz de accidentalidad para los 792 ZAT. Y , < X > y < Y > re-
presentan el número de accidentes, su promedio de eventos normalizados por
ZAT, y por hora, respectivamente. (B.) Choropleth map con el número total
de eventos para el dı́a martes N2 .
30 4 Resultados
Figura 4-11.: (A.) Matriz de accidentalidad para los 792 ZAT. Y , < X > y < Y > re-
presentan el número de accidentes, su promedio de eventos normalizados por
ZAT, y por hora, respectivamente. (B.) Choropleth map con el número total
de eventos para el dı́a miércoles N3 .
Figura 4-12.: (A.) Matriz de accidentalidad para los 792 ZAT. Y , < X > y < Y > re-
presentan el número de accidentes, su promedio de eventos normalizados por
ZAT, y por hora, respectivamente. (B.) Choropleth map con el número total
de eventos para el dı́a jueves N4 .
4.2 Representación estadı́stica y geográfica del conjunto de datos 31
Figura 4-13.: (A.) Matriz de accidentalidad para los 792 ZAT. Y , < X > y < Y > re-
presentan el número de accidentes, su promedio de eventos normalizados por
ZAT, y por hora, respectivamente. (B.) Choropleth map con el número total
de eventos para el dı́a viernes N5 .
Figura 4-14.: (A.) Matriz de accidentalidad para los 792 ZAT. Y , < X > y < Y > re-
presentan el número de accidentes, su promedio de eventos normalizados por
ZAT, y por hora, respectivamente. (B.) Choropleth map con el número total
de eventos para el dı́a sábado N6 .
32 4 Resultados
Figura 4-15.: (A.) Matriz de accidentalidad para los 792 ZAT. Y , < X > y < Y > re-
presentan el número de accidentes, su promedio de eventos normalizados por
ZAT, y por hora, respectivamente. (B.) Choropleth map con el número total
de eventos para el dı́a domingo N7 .
De este análisis espacial aparecen unas zonas que son resaltadas en el mapa de calor y que
son apreciables en los Choropleth de cada dı́a. Por lo tanto, en la siguiente tabla se presenta
un listado de los cinco primeros lugares de ZAT con mayor accidentalidad para cada dı́a.
Nótese que algunos de los ZAT’s (372 y 305) se encuentran presentes todos los dı́as y corres-
ponden a los picos de las (Figuras 4-9, 4-10, 4-11, 4-12, 4-13, 4-14 y 4-15). A pesar que
el ZAT 307 no está presente el dı́a domingo, es el más relevante en dı́as hábiles.
4.3 Aplicación de Ciencia de Redes 33
A continuación se muestran las matrices de correlación con todos los elementos conectados,
sus equivalentes matrices filtradas tomando solamente las correlaciones más fuertes entre
ZAT y sus grafos asociados para cada dı́a de la semana. Es importante mencionar, que los
nodos resultan siendo los centroides de las ZAT y los links el peso estadı́stico de Pearson
entre las series temporales de las ZAT; por lo tanto, los nodos conectados corresponden en
este caso al 1 % de las correlaciones que tienen valores cercanos a 1 y los nodos totalmente
desconectados, son los que no cumplen esta condición (Figuras 4-16,4-17,4-18,4-19,4-20,4-
21,4-22).
34 4 Resultados
Figura 4-16.: (A.) y (B.) Matriz de correlación con el 100 % y 1 % de los nodos conectados.
(C.) Grafo asociado a (B.) para el lunes.
Figura 4-17.: (A.) y (B.) Matriz de correlación con el 100 % y 1 % de los nodos conectados.
(C.) Grafo asociado a (B.) para el martes.
4.3 Aplicación de Ciencia de Redes 35
Figura 4-18.: (A.) y (B.) Matriz de correlación con el 100 % y 1 % de los nodos conectados.
(C.) Grafo asociado a (B.) para el miércoles.
Figura 4-19.: (A.) y (B.) Matriz de correlación con el 100 % y 1 % de los nodos conectados.
(C.) Grafo asociado a (B.) para el jueves.
36 4 Resultados
Figura 4-20.: (A.) y (B.) Matriz de correlación con el 100 % y 1 % de los nodos conectados.
(C.) Grafo asociado a (B.) para el viernes.
Figura 4-21.: (A.) y (B.) Matriz de correlación con el 100 % y 1 % de los nodos conectados.
(C.) Grafo asociado a (B.) para el sábado.
4.3 Aplicación de Ciencia de Redes 37
Figura 4-22.: (A.) y (B.) Matriz de correlación con el 100 % y 1 % de los nodos conectados.
(C.) Grafo asociado a (B.) para el domingo.
38 4 Resultados
Figura 4-23.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 1 % de los pesos más
fuertes. (D., E. y F.) Caracterı́sticas de la red para el dı́a lunes.
4.3 Aplicación de Ciencia de Redes 39
En este caso particular, las zonas de activación o de mayor accidentalidad, son muy diferentes
al HUB, ya que de acuerdo a la barra de color, el HUB indica que los accidentes de tránsito
en estos ZAT ocurren de manera simultanea o sincrónica, por lo tanto se consideran casos
importantes de análisis para las entidades encargadas de la movilidad.
Figura 4-24.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 1 % de los pesos más
fuertes. (D., E. y F.) Caracterı́sticas de la red para el dı́a martes.
40 4 Resultados
Figura 4-25.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 1 % de los pesos más
fuertes. (D., E. y F.) Caracterı́sticas de la red para el dı́a miércoles.
4.3 Aplicación de Ciencia de Redes 41
Figura 4-26.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 1 % de los pesos más
fuertes. (D., E. y F.) Caracterı́sticas de la red para el dı́a jueves.
42 4 Resultados
Figura 4-27.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 1 % de los pesos más
fuertes. (D., E. y F.) Caracterı́sticas de la red para el dı́a viernes.
4.3 Aplicación de Ciencia de Redes 43
Figura 4-28.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 1 % de los pesos más
fuertes. (D., E. y F.) Caracterı́sticas de la red para el dı́a sábado.
44 4 Resultados
Figura 4-29.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 1 % de los pesos más
fuertes. (D., E. y F.) Caracterı́sticas de la red para el dı́a domingo.
Figura 4-30.: Columna (A.) PDF con el 1 % de los nodos más conectados. Columna (B.)
Log-Log con los picos de la función densidad de probabilidad, Columna (C.)
Ajuste de la curva a una ley de potencia. Lunes a miercoles.
46 4 Resultados
Figura 4-31.: Columna (A.) PDF con el 1 % de los nodos más conectados. Columna (B.)
Log-Log con los picos de la función densidad de probabilidad, Columna (C.)
Ajuste de la curva a una ley de potencia. Jueves a domingo.
4.3 Aplicación de Ciencia de Redes 47
Se realiza el ajuste de la curva y se encuentran los siguientes valores de α que son dispuestos
en la tabla 4-2. De acuerdo a la literatura, las redes que presentan valores de α en el rango
2 ≤ α ≤ 3 , sugieren que las redes podrı́an tener un comportamiento libre de escala. Sin
embargo, de acuerdo a los valores encontrados, se debe realizar un estudio más detallado en
este sentido probablemente con otras resoluciones, los cuales sobrepasan los objeticos de este
trabajo.El comportamiento encontrado en las (figuras 4-32 y 4-33) y los valores encontrados
de α, sugieren que las redes podrı́an tener un comportamiento libre de escala, dado algunos
de sus valores cercanos al rango [2,3]
Para el cálculo de la entropı́a espacial Hs y temporal Ht (ecuación 2-6), se toman los datos de
los niveles de accidentalidad por ZAT de todos los años. De acuerdo al dı́a de la semana en el
que ocurrieron los eventos, se encuentra un único valor de H asociado (Figuras 4-32,4-33)
para la entropı́a temporal y espacial, respectivamente. Para la entropı́a temporal, se toman
todos los acidentes de los años del conjunto de datos de trabajo para un mismo dı́a. Se hace
el conteo de cuántos accidentes hay por hora. Se normaliza este conteo por el número de
accidentes totales en aras de contruir una distribución de probabilidad de #ZAT grados
de libertad. Se calcula la entropı́a de Shannon y la comparamos con la probabilidad de que
todos los siniestros se distribuyan uniformemente a lo largo de las horas del dı́a. De esta for-
ma, obtenemos un cuantitativo, entre cero y uno, de qué tan heterogenea fue la ocurrencia
temporal de accidentes para un dı́a en particular. Se repite el mismo proceso para los demás
dı́as y se visualiza su comportamiento en los demás dı́as la semana.
Los bajos valores en la entropı́a temporal son consistentes con los promedios de accidentalidad
por hora. La entropı́a baja muestra un comportamiento más odernado o heterogeneo en dı́as
hábiles, respecto al fin de semana; en el que es más desordenado y la ocurrencia de siniestros
tiene una probabilidad alta de que ocurra en casi cualquier hora del dı́a, en particular el
sabado.
48 4 Resultados
Respecto a la entropia espacial. Esta se calcula de tal forma que los accidentes ahora se
distribuyen en las ZAT, para un dı́a especı́fico y se compara con la probabilidad de que estos
se distribuyan uniformemente en todas las ZAT de la ciudad. Ocurre una meseta de valores
de entropı́a espacial cercana a 0,68 con una desviación estandar apróximada a 0,01 de lunes
4.3 Aplicación de Ciencia de Redes 49
ωij ↑
Cij∗ = (4-2)
φij ↓
A partir de esta concepción, se dividen los pesos de las matrices de correlación, entre los
flujos de movilidad de las matrices OD. Se contruye la distribución empı́rica de los corredores
viales Cij y se toman como precursores viales anómalos aquellos que esten fuera del umbral
estadı́stico de una prueba z-score tal que:
Cij − Cij
Z= (4-3)
σCij
Donde Cij es el promedio y σCij la desviación estándar de los Cij∗ . Posteriormente, estos
valores se capturan bajo una prueba de hipótesis para valores de Z ≥ 3, lo que implica una
cantidad cercana al 0,13 % de los corredores viales. En la (tabla 4-3) y (figuras 4-35 y 4-36)
se presentan los corredores que cumplen esta condición.
50 4 Resultados
Figura 4-34.: Histograma de los corredores viales Cij = ωij /φij para cada dı́a. El p-valor
asociado a la prueba de hipótesis es de p = 0,001 correspondiente a un
Z = 3,0903 para los Cij∗ .
4.3 Aplicación de Ciencia de Redes 51
Tabla 4-3.: Precursores anómalos Cij∗ entre pares de ZAT i y j de bajo flujo vehı́cular y alta
accidentalidad
normal flujo de movilidad. Las figuras 4-35 y 4-36 muestran los corredores anómalos detec-
tados para cada dı́a. Cabe resaltar que gran parte de las ZAT involucradas en los corredores
anómalos recaen en dos distritos particulares de la ciudad, uno al suroeste (Ciudad Bolivar)
y otro al noreste (Usaquén). Estos distritos se caracterizan por conglomerar estratos sociales
vulnerables, como Ciudad Bolivar, en contraste con Usaquén que asocia poblaciones de estra-
tos socio-económicos altos. Lo anterior sugiere una posible relación en la accidentalidad para
ambos sectores de la ciudad, quizá reforzando la hipótesis de movilidad en la que sectores de
clases populares viajan a sectores de la ciudad de clase alta, tal y como fue evidenciado en
trabajos anteriores por [Barbosa et al., 2018],[Lotero et al., 2016]. Ası́ mismo, en la dinámica
propia de la ciudad de Bogotá, es de resaltar también que Usaquén es por tradición un sector
importante en la vida social nocturna. Por otro lado, el domingo tiene como particularidad
el aparecimiento de otro nodo relevante ubicado en la zona este de Bogotá, especı́ficamente
en una zona rural de Bogotá llamada Choachı́, muy conocida por ser turı́stica.
Figura 4-36.: Corredores viales anómalos para el viernes, sábado y domingo para Z ≥ 3.
54 4 Resultados
5.1. Conclusiones
En el análisis temporal se encuentra un patrón de accidentalidad predominante en el
tiempo para los dı́as hábiles en donde aparecen dos picos justo una hora antes de iniciar
la medida restrictiva de pico y placa. Adicionalmente, el patrón de accidentalidad se
modifica para los fines de semana en donde aparece un pico sobre las 03:00 horas que
coincide con el horario de cierre de los bares y discotecas de la ciudad (Figura 4-7). Por
tanto, es claro que las medidas que se adoptan en materia de restricción de movilidad,
deben ser permanentemente revisadas y monitoriadas ya que en efecto influyen en la
dinámica de accidentes en la ciudad.
Los bajos valores en la entropı́a temporal son consistentes con los promedios de ac-
cidentalidad por hora. La entropı́a baja muestra un comportamiento más odernado o
heterogeneo en dı́as hábiles, respecto al fin de semana; en el que es más desordenado y
la ocurrencia de siniestros tiene una probabilidad alta de que ocurra en casi cualquier
hora del dı́a, en particular el sabado. De manera general, la distribución espacial de
siniestros es menor que la distribución temporal de los mismos, los cuales tienden a ser
más desordenados.
En la (tabla 4-3) y (figuras 4-35 y 4-36) se presentan los corredores viales anóma-
los en donde solo se toma el 0,13 % de los corredores que tienen alta accidentalidad
respecto a bajos flujos de movilidad. Este resultado en particular, muestra un compor-
tamiento para los dı́as martes y miércoles que bajo la prueba de hipótesis, no arrojó
ningún corredor anómalo y para el dı́a jueves apenas se encontraron 3. No obstante, los
corredores encontrados de viernes a lunes, muestran un comportamiento de movilidad
totalmente diferente, en donde pueden influir factores adicionales de conducta humana.
56 5 Conclusiones y recomendaciones
de las vı́as. Parámetros que se suponen deben considerarse, pero que los reportes nunca
terminan de completar, o al menso no se evidencian.
Serı́a conveniente replicar la metodologı́a utilizada para los ZAT y aplicarla en los otras
divisiones geográficas con el fin de comparar los resultados a diferentes escalas.
Figura A-1.: (A.) Matriz de accidentalidad para los 72 CP’s. Y , < X > y < Y > número y
promedio de eventos normalizados por CP y hora. (B.) Choropleth map con
el número total de eventos para el dı́a lunes N1 .
60 A Anexo: Análisis espacial por Códigos Postales CP
Figura A-2.: (A.) Matriz de accidentalidad para los 72 CP’s. Y , < X > y < Y > número y
promedio de eventos normalizados por CP y hora. (B.) Choropleth map con
el número total de eventos para el dı́a martes N2 .
Figura A-3.: (A.) Matriz de accidentalidad para los 72 CP’s. Y , < X > y < Y > número y
promedio de eventos normalizados por CP y hora. (B.) Choropleth map con
el número total de eventos para el dı́a miércoles N3 .
A.1 Anexo: Matriz de calor y Choropleth por CP 61
Figura A-4.: (A.) Matriz de accidentalidad para los 72 CP’s. Y , < X > y < Y > número y
promedio de eventos normalizados por CP y hora. (B.) Choropleth map con
el número total de eventos para el dı́a jueves N4 .
Figura A-5.: (A.) Matriz de accidentalidad para los 72 CP’s. Y , < X > y < Y > número y
promedio de eventos normalizados por CP y hora. (B.) Choropleth map con
el número total de eventos para el dı́a viernes N5 .
62 A Anexo: Análisis espacial por Códigos Postales CP
Figura A-6.: (A.) Matriz de accidentalidad para los 72 CP’s. Y , < X > y < Y > número y
promedio de eventos normalizados por CP y hora. (B.) Choropleth map con
el número total de eventos para el dı́a sábado N6 .
Figura A-7.: (A.) Matriz de accidentalidad para los 72 CP’s. Y , < X > y < Y > número y
promedio de eventos normalizados por CP y hora. (B.) Choropleth map con
el número total de eventos para el dı́a domingo N7 .
A.2 Matriz de correlación y grafos por CP 63
Siguiendo el mismo proceso con los ZAT, se encuentra la matriz de correlación cuando todos
los nodos se conectan y a diferencia del caso anterior, se escoge el 5 % de los nodos que
tienen un comportamiento sincronizado, teniendo en cuenta que aquı́ el número de polı́gonos
es más reducido y tanto el grafo y la red, pueden ser relativamente más sencillos de trabajar
y analizar.
Figura A-8.: (A.) y (B.) Matriz de correlación de CP con el 100 % y 1 % de los nodos
conectados. (C.) Grafo asociado a (B.) para el lunes.
64 A Anexo: Análisis espacial por Códigos Postales CP
Figura A-9.: (A.) y (B.) Matriz de correlación de CP con el 100 % y 1 % de los nodos
conectados. (C.) Grafo asociado a (B.) para el martes.
Figura A-10.: (A.) y (B.) Matriz de correlación de CP con el 100 % y 1 % de los nodos
conectados. (C.) Grafo asociado a (B.) para el miércoles.
A.2 Matriz de correlación y grafos por CP 65
Figura A-11.: (A.) y (B.) Matriz de correlación de CP con el 100 % y 1 % de los nodos
conectados. (C.) Grafo asociado a (B.) para el jueves.
Figura A-12.: (A.) y (B.) Matriz de correlación de CP con el 100 % y 1 % de los nodos
conectados. (C.) Grafo asociado a (B.) para el viernes.
66 A Anexo: Análisis espacial por Códigos Postales CP
Figura A-13.: (A.) y (B.) Matriz de correlación de CP con el 100 % y 1 % de los nodos
conectados. (C.) Grafo asociado a (B.) para el sábado.
Figura A-14.: (A.) y (B.) Matriz de correlación de CP con el 100 % y 1 % de los nodos
conectados. (C.) Grafo asociado a (B.) para el domingo.
A.3 Hub’s y caracterı́sticas de red por CP 67
Figura A-15.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 5 % de los nodos más
conectados. (D., E. y F.) Caracterı́sticas de la red para el dı́a lunes.
Figura A-16.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 5 % de los nodos más
conectados. (D., E. y F.) Caracterı́sticas de la red para el dı́a martes.
68 A Anexo: Análisis espacial por Códigos Postales CP
Figura A-17.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 5 % de los nodos más
conectados. (D., E. y F.) Caracterı́sticas de la red para el dı́a miércoles.
Figura A-18.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 5 % de los nodos más
conectados. (D., E. y F.) Caracterı́sticas de la red para el dı́a jueves.
A.3 Hub’s y caracterı́sticas de red por CP 69
Figura A-19.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 5 % de los nodos más
conectados. (D., E. y F.) Caracterı́sticas de la red para el dı́a viernes.
Figura A-20.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 5 % de los nodos más
conectados. (D., E. y F.) Caracterı́sticas de la red para el dı́a sábado.
70 A Anexo: Análisis espacial por Códigos Postales CP
Figura A-21.: (A.) Zonas de activación, (B.) Hub y (C.) red con el 5 % de los nodos más
conectados. (D., E. y F.) Caracterı́sticas de la red para el dı́a domingo.
Bibliografı́a
Abdulhafedh, A. (2016). Crash frequency analysis. Journal of Transportation Technologies,
06(04):169–180.
Abdulhafedh, A. (2017). Road crash prediction models: different statistical modeling ap-
proaches. Journal of Transportation Technologies, 07(02):190–205.
Amézquita, L., Durán, D., and Fajardo, D. (2016). Matriz origen-destino y eficiencia en
modos de transporte urbano: Un análisis de la movilidad de bogotá. Semestre Económico,
19(39):91–112.
Barbosa, H., Barthelemy, M., Ghoshal, G., R.J., C., Lenormand, M., Louail, T., Menezes,
R., Ramasco, J., and Simini, F., T. M. (2018). Human mobility: Models and applications.
Physics Reports, 734:1 – 74.
Buchanan, M. (2008). Laws, power laws and statistics. Nature Physics, 40:339.
Clauset, A., Shalizi, C. R., and Newman, M. E. J. (2009). Power-law distributions in empi-
rical data. SIAM review, 51(4):661–703.
Driss, M., Benabdeli, K., Saint-Gerand, T., and Hamadouche, M. (2015). Traffic safety
prediction model for identifying spatial degrees of exposure to the risk of road accidents
based on fuzzy logic approach. Geocarto International, 30(3).
El-adaway, I. (2012). Analyzing traffic layout using dynamic social network analysis.
http://www.ncitec.msstate.edu/wp-content/uploads/2012-07FR.pdf. [Online; últi-
mo acceso 5-mayo-2020].
Estrada, E. (2016). The structure of complex networks: Theory and applications. Oxford
University Press.
72 Bibliografı́a
Estrada, E. and Knight, P. (2015). A first course in network theory. Oxford University Press.
Klockner, K. and Toft, Y. (2015). Accident modelling of railway safety occurrences: The
safety and failure event network (safe-net) method. Procedia Manufacturing, 3:1734–1741.
Lin, L., Wang, Q., and Sadek, A. W. (2014). Data mining and complex network algorithms
for traffic accident analysis. Transportation Research Record: Journal of the Transportation
Research Board, 2460(1):128–136.
Lord, D. (2006). Modeling motor vehicle crashes using poisson-gamma models: Examining
the effects of low sample mean values and small sample size on the estimation of the fixed
dispersion parameter. Accident Analysis and Prevention, 38(4):751–766.
Lotero, L., Hurtado, R. G., Florı́a, L. M., and Gómez, J. (2016). Rich do not rise early:
spatio-temporal patterns in the mobility networks of different socio-economic classes. R
Soc Open Sci, 3:1–12.
Martı́n, L., Baena, L., Garach, L., López, G., and Oña, J. (2014). Using data mining tech-
niques to road safety improvement in spanish roads. Procedia - Social and Behavioral
Sciences, 160:607–614.
Martı́nez, J. H. (2015). Analysing brain dynamics by means of networks science. PhD thesis,
Universidad Politécnica de Madrid, Spain. Tesis de Doctorado.
Martı́nez, J. H., López, M. E., Ariza, P., Chavez, M., Pineda, J. A., López, D., Gil, P.,
Maestú, F., and Buldú, J. M. (2018). Functional brain networks reveal the existence of
cognitive reserve and the interplay between network topology and dynamics. Scientific
Reports, 8(1):1–11.
Martı́nez, L., Viegas, J., and Silva, E. (2009). A traffic analysis zone definition: A new
methodology and algorithm. Transportation, 36:581–599.
Mohammed, A., Ambak, K., Mosa, A., and D., S. (2018). Classification of traffic accident
prediction models: A review paper. pages 7–9.
Norza, E., Romero, M., Moreno, J., Dı́az, R., Useche, S., and Gómez, I. (2013). Caracteri-
zación de la accidentalidad en Colombia: Análisis del fenómeno desde el estudio del factor
humano.
Qureshi, Z. H. (2008). A review of accident modelling approaches for complex critical socio-
technical systems.
Secretarı́a de Educación del Distrito (2020). Guı́as para la elaboración de planes de movilidad
escolar. https://www.educacionbogota.edu.co. [Online; último acceso 7-mayo-2020].
Soriano, D., Lotero, L., Arenas, A., and Gómez, J. (2018). Spreading processes in multiplex
metapopulations containing different mobility networks. Physical Review X, 8(3).
Wang, X., Jin, Y., M., A., Tremont, P. J., and Xiaohong, C. (2012). Macrolevel model
development for safety assessment of road network structures. Transportation Research
Record: Journal of the Transportation Research Board, 2280(1):100–109.
World Health Organization (2010). A decade of action for road and safety: A brief planning
document. https://www.who.int/roadsafety/Decade_of_action.pdf. [Online; último
acceso 9-abril-2020].
Xiugang, L., Lord, D., Zhang, Y., and Xie, Y. (2008). Predicting motor vehicle crashes using
support vector machine models. Accident Analysis and Prevention, 40:1611–8.