Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de CrimeStrat
Manual de CrimeStrat
1.1.
Introduccin
CrimeStat es un programa de estadsticas espaciales diseado especficamente para el anlisis de la ocurrencia de incidentes criminales, desarrollado
por Ned Levine bajo el auspicio del Instituto Nacional de Justicia de Estados Unidos de Amrica. Su propsito es brindar un conjunto de herramientas
estadsticas complementarias para ayudar a investigadores y agencias encargadas de hacer cumplir la ley.
El programa utiliza la ubicacin de incidentes criminales como datos de
entrada en formato de archivo dBase (.dbf, III, IV, o V), que es un formato
de archivo comn para programas de Sistema de informacin geografico de
escritorio (SIG), como ArcView (shp), MapInfo (dat), y archivos compatibles
con el estndar ODBC, como Excel, Lotus 1-2-3, Microsoft Access, y Paradox
(Borland.Com, 1998; ESRI, 1998a; Microsoft, 1999). Adems, para muchos
otros SIG, como Maptitude, y puede leer archivos como dbf, shp, bna
or mif.
A partir de estos datos, permite aplicar los mtodos de estadstica espacial, produciendo resultados en archivos formato cartogrfico que pueden ser
R
utilizados directamente por diferentes programas de SIG como ArcView,
R Atlas*GIS, y Spatial Analyst.
c
MapInfo,
Los mtodos de estadstica espacial instrumentados en CrimeStat son:
Distribucin Espacial: conjunto de mtodos para la descripcin de la
distribucin espacial de incidentes, tales como el media central, centro
de mnima distancia, la elipse de desviacin estandarizada, y el ndice
de autocorrelacin espacial I de Moran.
Anlisis de Distancia: conjunto de tcnicas estadsticas para describir
las propiedades de las distancias entre los incidentes, incluyendo anlisis
de vecinos ms cercanos, anlisis lineal del vecino ms cercano, y el
estadstico K de Ripley.
Anlisis de Zona o Puntos Calientes: ("Hot Spot") incluye las rutinas para realizar el anlisis de Punto Calientes, incluyendo la moda,
la moda difusa, deteccin de conglomerados de vecinos ms cercanos
1
1.2.
Configuracin de datos
Archivo Primario
CrimeStas requiere de un archivo primario. Sin embargo, se pueden seleccionar ms de un archivo si es necesario. Este es un archivo de puntos con
coordendas X e Y. Por ejemplo; un archivo primario puede ser la ubicacin
de los robos callejero con algn tipo de arma, cada uno referenciado con sus
respectivas coordenadas X e Y. Adems, en este archivo los incidentes pueden
estar asociados con alguna ponderacin o intensidad de las variables, aunque
estos son opcionales. Por ejemplo, si los puntos corresponden a los puestos o
estaciones de polica, la variable intensidad podra ser el nmero de llamadas
solicitando el servicio en cada estacin de polica, mientras que la variable
de ponderacin puede ser zonas de servicio. En este archivo se referencia el
tiempo en que sucede el evento criminal, y las unidades para el mismo son:
horas, das, semanas, meses o aos. Esta variable es necesaria por las rutinas
del anlisis espacio-tiempo.
intensidades van a ser usados, debe definirse el archivo que contiene estas
variables. Algunos estadsticos requieren valores de intensidad (por ejemplo,
autocorrelacin espacial, Moran local). La mayora de los dems estadsticos pueden utilizar ponderaciones. Es posible tener ambas variables (pesos
e intensidad ), aunque el usuario debe ser prudente en ello para evitar la
doble ponderacin. Las Unidades de tiempo no se utilizan en este archivo
secundario.
Columna
Seleccione las variables para las coordenadas X e Y, respectivamente (por
ejemplo, Longitud, Latitud, Xcoord, Ycoord). Si hay pesos o intensidades que
se est usando, debe seleccionarse nombres apropiadas para estas variables.
Unidades de tiempo no se utilizan en el archivo de secundaria.
Valores faltantes
Procedimiento semejante al archivo primario. Ver archivo primario.
Tipo de sistema de coordenadas y unidades
La data del archivo secundario debe tener el mismo sistema de coordenadas y las mismas unidades del archivo principal. Esta seleccin ser bloqueada o neutralizada, indicando que el archivo secundario debe lleva la misma
definicin que el archivo primario. El archivo secundario no se permite coordenadas direccional (ngulos).
Archivo de referencia
Para referenciar el rea de estudio, existe una grilla o cuadrcula de referencia y un origen de referencia. El archivo de referencia es utilizado por las
rutinas: cluster jerrquicos del vecinos ms cercanos (agrupacin), viaje de
la delincuencia y por estimacin de densidad o kernel, simple o doble. Es por
lo general, aunque no siempre, una cuadrcula es sobrepuesto en la zona de
estudio. El origen de referencia es utilizado en la ruptina media direccinal.
Este archivo puede ser externo como archivo de entrada, o puede ser creados
por CrimeStat.
Origen de referencia
Un origen de referencia puede ser definido por la rutina de media direccional. El origen de referencia pueden ser asignados a:
1. Uso de la esquina inferior izquierda, definida por el mnimo de los valores X e Y. Este valor es por defecto.
2. Uso de la esquina superior derecha, define por los valores mximos X
e Y.
3. Un punto de origen diferente. Con este ltimo, el usuario debe definir
el origen.
Medida de parmetros
En la pestaa medida de parmetros (Measurement Parameters), se define las unidades y el la cobertura del rea en estudio, y el tipo de distancia
a utilizar. En esta ventana hay tres componentes que se definen:
Area
En primer lugar, debe definirse el rea geogrfica de la zona de estudio, y
la unidades de superficie en kilmetros cuadrados, millas nuticas cuadradas,
pies cuadrados o metros cuadrados. Independientemente de las unidades en
que se han definido los datos en el archivo principal, CrimeStat puede convertir diversas unidades de rea. Estas unidades se utilizan en la rutinas del
vecino ms cercano, Ripleys K, cluster jerrquica, STAC, y clustering de
K-means. En caso de que las unidades de superficie no esten definidas, CrimeStat define un rectngulo por el mnimo y el mximo de las coordenadas
X e Y.
Longitud de la red de calle
En segundo lugar, se define la Longitud total de la red de calle (Length
of street network) del rea de estudio o una comparacin adecuada de red,
como por ejemplo, un sistema de autopista; y se define tambien las unidades
de distancia (kilmetros, millas nuticas, pies, kilmetros, metros). La longitud de la red de calle es utilizada por la rutina anlisis lineal del vecino ms
10
11
Distancia en Red
Si se utiliza distancias en red, cada distancia es calculada como el camino
ms corto entre dos puntos en la red. Alternativamente la distancia puede
utilizarse incluyendo velocidad, tiempo de viaje o recorrido, o costo de viaje.
Haciendo clic en la casilla parmetros de la red (Network parameters), aparece una ventana con los parmetros de red, donde debe identificar el archivo
de red, Tipo de red, Entrada del Archivo de red, Ponderacin sobre la Red,
From one-way flag and To one-way flag, Identificando nodo partida (FromNode ID) y terminal (ToNode ID Sistema de coordenadas Unidades de medida
y Lmite grfico de Red:
Tipo de red
Los archivos de Red pueden ser bi-direccional (por ejemplo, un archivo TIGER) o uni-direccional (por ejemplo, un archivo para modelacin del
trnsito). En un archivo bi-direccional, se puede viajar en cualquier direccin; mientras que en un archivo uni-direccional, slo se puede viajar en una
direccin. Debe especificar el tipo de Red que se utilizar.
Tipo de Archivo de entrada
Los archivos de red pueden ser archivo tipo shape (.shp) o archivo tipo
dBase IV dbf, Microsoft Access mdb , Ascii dat , o un archivo compatible con ODBC. Por defecto el archivo es tipo shape. Si el archivo es de tipo
shape, la rutina debe conocer la localizacin de los nodos.
Para un archivo dBase IV u otro tipo, las coordenadas X e Y de los nodos
deben ser definidas; estos son Llamados "Partida"(From) del nodo y "Terminal"(End) del nodo. Una variable peso opcional es permitida para los archivos
tipos file0073. La rutina identifica nodos, segmentos, y calcula la trayectoria
ms corta. Si hay un camino uni-direccional en un archivo bidireccional, los
campos para nodos de "Partida terminal deben ser definidos.
Ponderacin sobre la Red
Normalmente, cada segmento en de la red no es ponderado. En este caso,
la rutina calcula la distancia ms corta entre dos puntos, utilizando la distancia de cada segmento. Sin embargo, cada segmento puede ser ponderado
12
Sistema de coordenadas
El archivo de red usa el mismo sistema de coordenadas que que el archivo
primario.
Unidades de medida
Por defecto, la trayectoria ms corta es en trminos de distancia. Sin embargo, cada segmento puede ser ponderado por el tiempo de viaje, velocidad
de viaje, o costo de viaje.
1. Para el tiempo de viaje, las unidades son minutos, horas o unidades de
costo sin especificar.
2. Para la velocidad, las unidades son millas por hora y kilmetros por hora. En el caso de velocidad como una variable de ponderacin, automticamente es convertido el tiempo de viajes, por dividiendo la distancia
del segmento por la velocidad, manteniendo las unidades constantes.
3. Para costo de viaje las unidades no estn definidas, la rutina identifica
aquellas rutas con el menor costo total.
Lmite grfico de Red
Finalmente, el nmero de segmentos grficos a ser calculados es definido
como el lmite de red. Por defecto, el valor es 50.000 segmentos. Debe asegurarse que este nmero es ligeramente mayor que el nmero de segmentos en su
red. Observacion: Usando la distancia red (network distance), los clculos de
distancia puede ser un proceso lento, por ejemplo, puede tomar varias horas
para clcular toda una matriz. Utilice mayor precisin slo si es necesario, o
para la rutina de asignacin de red en el mdulo de demanda recorrido del
crimen.
Salvar parmetros
Hay un botn o pestaa Guardar parmetros (Save parameters) en la
seccin Opciones. donde todos los parmetros de entrada pueden ser guardados. Un archivo de parmetros guardados tiene una extensin param. Un
14
Descripcin espacial
15
16
central sale como un punto con nombre del archivo (MdnCntr <root name>).
Centro de mnima distancia (Mcmd)
El centro de mnima distancia define el punto para el cual la distancia
a todos los dems puntos es mnima. Esta rutina (Mcmd) proporciona 5
estadsticos:
1. El tamao de la muestra.
2. Las medias de las coordenadas X e Y.
3. El nmero de iteraciones requeridas para identificar el centro.
4. El grado de error (tolerancia) para detener las iteraciones.
5. Las coordenadas X e Y que definen el centro de mnima distancia.
La salida tabular puede imprimirse, y el centro de mnima distancia puede salir como objeto grfico o archivo para ArcView .shp, MapInfo .mif
o Atlas*GIS .bna, proporcionndole un nombre de raz (origen). El centro
de mnima distancia sale como un punto y con nombre (Mdn<root name>).
Media Direccional y Varianza (Mcmd)
La media direccional o angular y la varianza, son propiedades de la medida angular. La media angular es un ngulo definido a partir del Norte: 0
grados. La varianza direccional es un indicador relativo, que vara de 0 (sin
variacin) a 1 (mxima variacin). Tanto la media angular como la varianza
direccional pueden calcularse a travs de las coordenadas direccionales (angulares) o a travs de coordenadas X e Y.
Si el archivo principal presenta coordenadas direccionales (ngulos de 0 a
360 grados),la media angular se calcula directamente a partir de los ngulos.
Una variable distancia opcional puede ser incluida. En este caso, la rutina
media direccional proporciona la salida de cinco estadsticos:
1. El tamao de la muestra.
2. La media angular sin ponderacion.
18
1. El tamao de la muestra.
2. El nmero de puntos en la capsula convexa.
3. Las coordenadas X e Y para cada uno de los puntos en la capsula
convexa.
La capsula convexa se pueden guardar como archivo para ArcView shp,
MapInfo mif, o Atlas*GIS bna con el prefijo Chull.
Autocorrelacin espacial
En esta seccin de Autocorrelacin espacial (Spatial autocorrelation) se
presentan dos indices de autocorrelacin espacial, ndice de Moran y el ndice de Gearys; adems se presenta tambin el correlograma de Moran. Los
ndices de autocorrelacin espacial permiten identificar si los puntos de localizacion estan o no relacionados espacialmente (es decir, en cluster o dispersos).
Ambos rutinas requieren la variable intensidad en el archivo principal.
Estadstico I de Moran
(MoranI)
El ndice o estadstico I de Moran, es el indicador clsico de autocorrelacin espacial. Se trata de un ndice de covarianza entre los diferentes puntos
de localizacin, similar al coeficiente de correlacin (producto momento), su
valor se encuentra entre -1 y 1. Esta rutina calcula seis estadsticos:
1. El tamao de la muestra.
2. El ndice de Morans "I".
3. El valor esperado del ndice "I" (valor aleatorizado espacialmente).
4. La desviacin estndar del ndice "I".
5. Una prueba de significacin para "I", bajo el supuesto de normalidad
(Z-test)
6. Una prueba de significacin para "I", bajo el supuesto de la aleatorizacin (Z-test).
20
Los valores del ndice superiores al valor esperado "I", indican cluster,
mientras que los valores inferiores al valor esperado, indican dispersin. La
significancia de la prueba indica si esas diferencias son mayores a las esperadas por azar. Los resultados se pueden imprimir.
Ajuste para las pequeas distancias
Si se selecciona esta pestaa (Adjust for small distances), las pequeas
distancias son ajustados de manera que la distancia mxima ponderada es
1. De esta forma se garantiza que el ndice "I", no sea excesivamente grande
para puntos que se encuentran muy prximos entre s. Por defecto la configuracin no es ajustada.
El C de Geary
El estadstico C Geary, es un indicador alternativo de autocorrelacin
espacial. Se trata de un ndice de comparacin entre los diferentes pares de
localizaciones. Vara de 0 a 2, cero para valores similares y dos para valores
dismiles. La rutina Geary calcula 5 las estadsticos:
1. El tamao de la muestra.
2. El ndice C de Geary.
3. El valor esperado C (valor espacialmente aleatorizado).
4. La desviacin estndar de C.
5. Una prueba de significacin para C, bajo el supuesto de normalidad
(Z-test).
Los valores de C inferior al valor esperado indicar cluster, mientras que
los valores de C mayor al valor esperado indican la dispersin. La significancia de la prueba indica si esas diferencias son mayores al valor esperado por
azar. Los resultado se pueden imprimir.
Ajuste para las pequeas distancias
Si se selecciona esta pestaa (Adjust for small distances), las pequeas
distancias son ajustados de manera que la distancia mxima ponderada es 1.
21
Esto asegura que el ndice C, no sea excesivamente grande para puntos que
se encuentran muy prximos. Por defecto la configuracin es no ajustada.
Correlograma de Moran
El Correlogram de Moran calcula el ndice de Morans "I"(no ajustado para las pequeas distancias), para diferentes intervalos de distancia. El
usuario puede seleccionar cualquier nmero de intervalos de distancia. Por
defecto son 10 intervalos de distancia.
Ajuste para las pequeas distancias
Si se selecciona esta pestaa (Adjust for small distances), las pequeas
distancias son ajustados de manera que la distancia mxima ponderada sea
igual a 1. Esto asegura el ndice de Morans "I" no, sea excesivamente grande o demasiado pequeo para puntos que se encuentran muy prximos. Por
defecto la configuracin es no ajustada.
Simulacin de intervalos de confianza
Mediante una simulacin de Monte Carlo se puede obtener una estimacin
aproximada de intervalos de confianza alrededor del indice "I". Seleccionando un nmero especfico de simulaciones a ejecutar (por ejemplo, 100, 1000,
10000).
La salida incluye:
1. El tamao de la muestra.
2. La distancia mxima.
3. El nmero de intervalos (bins).
4. El punto medio de la distancia bin.
5. El valor "I"de la distancia bin (I[B]).
Si la simulacin es ejecuta, la salida incluye:
22
23
Los resultados pueden imprimirse, salvarse como archivo de texto o archivo dbf.
Nmero de vecinos ms cercanos
El K-simo ndice del vecino mas cercano compara la distancia promedio
del K-simo punto ms cercano con la distancia esperada espacialmente aleatorizada. Si ms de una vecindad cercana sera calculada, el usuario puede
indicar el nmero K de vecindades cercanas a calcular. CrimeStat calcular
3 estadsticos para cada orden especificado:
1. La distancia media del vecinos ms cercano en metros para el orden.
2. La distancia esperada del vecino ms cercano en metros para el orden.
3. El ndice del vecinos ms cercanos para orden.
La rutina Nna usar el rea definida por usuario, a menos que esta no
se proporcione, en cuyo caso se usar el rectngulo acotado. Los resultados
tabulares se pueden imprimir, salvarlo como un archivo de texto o como archivo .dbf.
Anlisis del vecino lineal ms cercano
El ndice lineal del vecino ms cercano proporciona una aproximacin en
cuanto a si los puntos estn mas cercanos o dispersado a lo largo caminos de
segmentos, de lo que se esperara en condiciones aleatorias. Seleccionando la
distancia indirecta (Manhattan) e introduciendo la longitud total de la red de
camino, en la ventana parmetros de medida (Measurement Parameters), la
rutina Nna calcular el vecino lineal ms cercano calcular (cuando la casilla
est marcada). El ndice del vecino lineal ms cercano es la relacin emprica
del promedio de distancia del vecino lineal ms cercanos con la distancia
lineal esperada al azar. La rutina Nna calcula 9 estadsticos para los ndice
del vecinos lineales ms cercanos:
1. El tamao de la muestra.
2. La distancia media lineal del vecinos ms cercanos en metros, pies y
millas.
25
3. La distancia mnima entre los puntos a lo largo de una red grill (red de
rejilla).
4. La distancia mxima entre los puntos a lo largo de una red grill (red
de rejilla).
5. La distancia media lineal aleatoria.
6. El ndice del vecino lineal ms cercano.
7. La desviacin estndar de la distancia del vecino lineal ms cercanos
en metros, pies y millas.
8. El error estndar del ndice del vecinos lineal ms cercano.
9. Una prueba "t" de la diferencia entre la distancia emprica y la esperada
del vecino lineal ms cercanos.
Nmero de vecino lineal ms cercano
La rutina Nna puede calcular el K-simo vecino lineal ms cercanos, y
comparar esta distancia con el promedio de la distancia lineal del K-simo
punto ms cercano con la distancia esperada espacialmente aleatorizada.
Si es necesario ms de un vecino lineal ms cercano a calcular, el usuario
puede indicar el nmero de K de vecinos lineal ms cercanos. CrimeStat
calcular 3 de estadsticas para cada orden especifico:
1. La distancia media del vecinos lineal ms cercano en metros para el
orden.
2. La esperanza del vecinos lineal ms cercano en metros para el orden.
3. El ndice del vecino lineal ms cercano para el orden.
Correccin de borde del vecino ms cercano
La rutina del anlisis del vecino ms cercano (rea o lineal) no se ajusta
para subestimar incidentes cerca de la frontera en la zona de estudio. Es
posible que haya vecinos cercanos fuera de los lmites que estn ms cerca
que la medida o valor del vecino cercano. El anlisis del vecino ms cercano
tiene tres opciones para correccin borde:
26
28
29
Esta rutina asigna a cada punto primarios los puntos secundarios que
estn ms cerca. Si hay dos o ms puntos secundarios que son exactamente
iguales, la asignacin va al primero en la lista.
Asignacin de Puntos - en - polgono
Esta rutina asigna a cada punto primario el punto secundario que cae
dentro de su polgono (zona). Deben proporcionarse un archivo shape (polgono) de la zona y la rutina comprueba dentro qu zona secundaria cae
dentro cada punto primario.
Archivo de zona
Un archivo de zona debe ser proporcionado. Esto es un archivo polgono
que define la zona en que los puntos primarios son asignados. El archivo de
zona debe ser como el archivo de secundaria (ver en archivo de secundaria).
Para cada punto en el archivo primario, la rutina identifica a cual polgono
pertenece y luego suma el nmero de puntos por polgono.
Nombre asignado a la variable
Debe especificar el nombre de la variable suma. Por defecto el nombre es
FREQ.
Uso de un archivo de ponderacin
Los registros del archivo primario pueden ser ponderados por otro archivo. Esto ser til para corregir los totales del archivo primario. Por ejemplo,
si suponemos que en el archivo primario los incidentes de robo corresponden
a un registro de detencin o arresto, la suma de esta variable (por ejemplo, el
nmero total de robos) puede producir un sesgo en la distribucin sobre las
zonas del archivo secundario, debido a que el archivo principal no proviene
de una muestra tomada al azar de todos los incidentes (por ejemplo, si esta
informacin proviene de un registro de detencin donde la distribucin de
detenciones de robo, no es igual a la distribucin de todos los incidentes de
robo).
El segundo archivo o cualquier otro archivo puede ser usado para ajustar
30
32
Esta rutina ofrece seis resultados para cada clusters que se calcula:
1. El orden jerrquico y el nmero de clusters.
2. La media central del clusters (media X, media Y).
3. El elipse de desviacin estndar del cluster (la rotacin y longitud de
los ejes X e Y).
4. El nmero de puntos en el cluster.
5. El rea del cluster.
6. La densidad del cluster (puntos divididos por rea).
Distancia umbral del Nnh
La distancia umbral es el radio de bsqueda alrededor de un par de puntos. Para cada par de puntos, la rutina determina si ellos estn ms cercanos
que el radio de bsqueda. Hay dos formas para determinar el radio de bsqueda o distancia (Nnh threshold distance):
La distancia aleatoria del vecino ms cercana
En primer lugar, la distancia de bsqueda es elegida al azar de la distancia del vecinos ms cercano. Por defecto el valor es igual a 0,1 (es decir,
menos del 10 % de los pares se puede esperar que se encuentren ms cerca por
casualidad). Los Pares de puntos que estn ms cerca que la distancia umbral
se agrupan, mientras que los pares de puntos que estn a mayor distancia
que la distancia umbral se ignoran. Cuanto menor sea el nivel de significacin
que se ha seleccionado, menor es el umbral de la distancia y, por lo general, el
menor es nmero de pares que sern seleccionados. Por otra parte, la eleccin
de un nivel mayor de significacin, ms grande es distancia umbral y, por lo
general, ms parejas de puntos sern seleccionados. Sin embargo, cuanto ms
alto es el nivel de significacin elegido, mayor ser la probabilidad de que los
clusters sean agrupados al azar.
La barra deslizante se utiliza para ajustar el nivel de significacin. Moviendo la barra deslizante hacia la izquierda se elige una distancia umbral
35
38
mayor. El probabilidad umbral por defecto es de 0,1 (es decir, menos del
10 % de los pares que se espera se encuentren muy cerca bajo). Los Pares
de puntos que estn ms cerca que la distancia umbral se agrupan, mientras
que los pares de puntos que estn a mayor distancia que la distancia umbral
se ignoran. Cuanto menor sea el nivel de significacin que se ha seleccionado,
menor ser la distancia umbral y, por lo general, menor nmero de pares
sern seleccionados. Por otra parte, la eleccin de un nivel mayor de significacin, mayor ser la distancia umbral y, por en general, ms pares sern
seleccionados. Sin embargo, cuanto ms alto sea el nivel significacin elegido,
mayor sera la probabilidad que los clusters sean agrupaciones alzar.
La barra deslizante se utiliza para ajustar el nivel de significacin. Para
elegir una menor distancia umbral mueva la barra deslizante hacia la izquierda y hacia la derecho para escoger una mayor distancia umbral.
Parmetros de riesgo Rnnh
Una estimacin de densidad de la variable secundaria debe ser calculada
para ajustar la distancia de umbral de la variable primaria. Esto se hace a
travs de la estimacin de densidad del kernel. En la pestaa parmetros de
riesgo (risk parameters) se define este modelo. La segunda variable automticamente se asume que debe ser la variable riesgo variable . Si se debe usar
la variable ponderada o intensidad en el archivo secundario, esta debe seleccionarse. El usuario debe especificar el mtodo de interpolation de kernel
(normal, uniforme, quartic, triangular o exponencial negativo), y seleccionar
el ancho de banda (intervalo fijo o adaptable). Si el intervalo de adaptacin es utilizado, el tamao muestra mnimo para el ancho de banda (radio
de bsqueda) debe ser especificado. Si se usa un intervalo fijo, el tamao
del intervalo (radio) debe ser especificado junto con las unidades de medida
(kilmetros, millas nuticas, pies, kilmetros, metros). Por ltimo, las unidades de la densidad para la salida debe ser especificado (millas al cuadrado,
cuadrado millas nuticas, pies cuadrados, kilmetro cuadrado, metros cuadrados).
La rutina superpone una rejilla de 50 x 50 grillas en el rea de estudio y
calcula una estimacin de densidad de kernel de la variable secundaria. La
densidad es entonces re-escalada para igualar el tamao de muestra de la variable primaria. Para cada celda, una distancia umbral especfica es calculada
40
44
Los lmites del rea de estudio pueden ser definidas a partir del conjunto
de datos o de la red de referencia.
El nmero mnimo de puntos en STAC
El usuario debe especificar el nmero mnimo de puntos necesarios para
cada cluster (minimum points for clusters). Por defecto son 5 puntos. Si se
elige muy pocos puntos, habr muchos clusters pequeos; sin embargo, aumentar el nmero de puntos requeridos, el nmero de clusters se reducir. En
la pestaa STAC Parmetros, escriba el nmero mnimo de puntos requeridos para cada cluster.
Tamao de salida de elipses para el STAC
El tamao de salida del cluster como elipse puede ser ajustado por la
barra deslizante. La rutina de salida del elipses puede ser una desviacin estndar (1X), desviacin estndar y media (1.5X), y dos deviational estndar
(2X). Generalmente, si los datos tienen distribucion normal, una desviacin
estndar cubrir aproximadamente el 50 % de los casos, mientras que dos
desviaciones estndar cubrir ms de un 99 % de los casos, sin embargo, el
porcentaje real puede diferin.
En la parte inferior de la ventana STAC Parmetros, deslice la barra para
seleccionar el nmero de desviaciones estndar del elipse. El archivo de salida
es guardado como ST<nombre raz>. El nombre raz debe ser proporcionado
por el usuario.
Salida de cluster como Convexo casco
Los cluster tambin pueden salir como objetos grficos tipo cpsulas convexas en formato de archivo para ArcView .shp, MapInfo .mif o Atlas*GIS
.bna. Debe especificar un nombre para el archivo, que saldr con un prefijo
CST.
Ejecutar una simulacin STAC
Una simulacin de Monte Carlo se puede correr para estimar un intervalo
de confianza alrededor del cluster del STAC. El usuario especifica el nmero
45
1.2.3.
48
Interpolacin
La pestaa interpolacin (interpolation) permite estimar la densidad de
punto usando el mtodo suavizado densidad kernel. Hay dos tipos de suavizado de densidad del kernel: el simple, aplicado a una sola distribucin de los
puntos; y el dual, aplicado a dos distribuciones diferentes. Cada tipo tiene
variaciones sobre el mtodo que se pueden seleccionar. Ambos tipos requieren de un archivo de referencia, que es superpuesto sobre la zona de estudio
(ver archivo de referencia). Las variables intensidad y ponderacin pueden
ser usadas en la estimacin de kernel. Las densidades pueden convertirse en
probabilidades.
La interpolacin es una tcnica para generalizar localizaciones del incidente en todo el rea de estudio. Mientras las tcnicas de distribucin espacial
y puntos caliente proporciona los resmenes estadsticos para los incidentes
de los datos en s mismos, la tcnica de la interpolacin generalizan esos
incidentes de los datos a toda la regin. Particularmente, proporcionan las
estimaciones de densidad para todas las zonas de la regin (es decir, en cualquier localizacin).
La estimacin de la densidad es una variable de la intensidad, un valor
Z(), que se estima una localizacin particular. Por lo tanto, puede ser visualizada en los mapas de la superficie o en mapas de contorno que demuestran
la intensidad en todos los lugares o localizaciones.
Estimacin de densidad de kernel simple (KernelDensity)
La rutina densidad de kernel simple (kernel density estimates single) estima la densidad de punto para una distribucin simple, colocando una superficie simtrica sobre cada punto (superposicin), evaluando la distancia
del punto a cada celda de referencia por la funcin kernel, y sumando las
evaluaciones en cada celda de referencia.
Archivo ha interpolar
La estimacin puede aplicarse a cualquier archivo tanto al principal como
al secundario. Debe seleccione el archivo a ser interpolado. Por defecto es el
archivo primario
49
Mtodo de interpolacin
Hay cinco tipos de kernels que pueden ser utilizados para estimar la distribucin de densidad de los puntos. Cuatro de las cinco distribuciones superponen un crculo alrededor de cada celda o cuadrcula y asigna ponderaciones
a los puntos dentro de las celdas o cuadrcula. Los cinco tipos varan en las
ponderaciones que asignan a los puntos cercanos:
Kernel que asigna ponderaciones a todo el rea en estudio
1. El kernel normal superpone una distribucin normal en cada punto, que
luego se extiende sobre toda el rea en estudio definida por el archivo
de referencia. Esta es la funcin kernel por defecto. La distribucin se
extiende en todas direcciones y es limitado nicamente por el rea en
estudio.
Kernels que asignar ponderaciones en un crculo especfico
2. El kernel uniforme asigna igual ponderacin a todos los puntos dentro
del crculo.
3. El kernel quartic superpone una superficie en forma de campana invertida que se extiende slo para una distancia limitada en cada punto;
las ponderaciones para los puntos dentro del crculo disminuyen con la
distancia gradualmente (poco a poco).
4. El kernel triangulado (o cnico) superpone un cono en cada celda de la
cuadrcula; Los pesos para puntos dentro del crculo disminuyen constantemente con la distancia (coherentemente).
5. El kernel exponencial negativo superpone una funcin disminuyendo
drsticamente sobre cada celda de la cuadrcula; las ponderaciones de
los puntos dentro del crculo disminucin muy rpidamente con la distancia.
Los cinco mtodos producen resultados similares, aunque el kernel normal
es generalmente ms suave para cualquier ancho de banda.
Eleccin del ancho de banda
50
Los kernels son aplicados a una distancia de bsqueda limitada, denominado ancho de banda. Para el kernel normal, el ancho de banda es la
desviacin estndar de la distribucin normal. Para el kernel uniforme, quartic, triangular y exponencial negativo, la amplitud o ancho de banda es el
radio de un crculo para la distancia de bsqueda. Para todos los tipos de
kernels, un ancho de banda grande produce estimaciones de densidad ms
suave. Tanto el ancho de banda adaptable como el fijo pueden ser seleccionados.
Ancho de banda Adaptable
La distancia ancho de banda adaptable es identificada por el nmero mnimo de puntos encontrados dentro del crculo dibujado alrededor de un slo
punto. Un crculo es colocado alrededor del punto, a su vez, y el radio se
aumenta hasta que se alcanza el tamao de muestra mnimo; de esta forma
cada punto tiene un intervalo de ancho de banda diferente.
El ancho de banda es la configuracin por defecto. El usuario puede modificar
el tamao de muestra mnimo, que por defecto es igual a 100 puntos.
Ancho de banda fijo
La distancia ancho de banda fija es un intervalo fijo para cada uno de los
puntos. El usuario puede definir el intervalo y las unidades distancia en que
se calcula (millas, millas, pies, kilmetros, metros).
Unidades de rea
Debe especificar las unidades de densidad como puntos por milla cuadrada, por millas nuticas cuadradas, por pies cuadrados, por kilmetros
cuadrados, o por metros cuadrados. Las unidades por defecto son puntos por
milla cuadrada.
Uso de una variable intensidad
Debe marcarse la variable intensidad, si ha de ser interpolada.
Uso una variable ponderacin
Debe marcarse la variable ponderacin, si ha de ser interpolada.
51
archivo y el segundo.
Archivo ha interpolar
Debe identificarse los archivos que ocupan la categora de principal y secundario en la interpolacin. Por defecto el principal es el archivo primario
y secundario es el archivo secundario.
Mtodo de interpolacin
Hay cinco tipos de distribuciones de kernels que pueden ser utilizados para estimar la densidad de puntos. Cuatro de los cinco superponen un crculo
alrededor de cada celda y asigna ponderaciones a los puntos dentro de la celda. Los cinco tipos varan en las ponderaciones que asignan puntos cercanos:
Kernel que asigna ponderaciones a todo el rea en estudio
1. El kernel normal superpone una distribucin normal en cada punto, que
luego se extiende sobre toda el rea en estudio definida por el archivo
de referencia. Esta es la funcin kernel por defecto. La distribucin se
extiende en todas direcciones y es limitado nicamente por el rea en
estudio.
Kernels que asignar ponderaciones en un crculo especfico
2. El kernel uniforme asigna igual ponderacin a todos los puntos dentro
del crculo.
3. El kernel quartic superpone una superficie en forma de campana invertida que se extiende slo para una distancia limitada en cada punto;
las ponderaciones para los puntos dentro del crculo disminuyen con la
distancia gradualmente (poco a poco).
4. El kernel triangulado (o cnico) superpone un cono en cada celda de la
cuadrcula; Los pesos para puntos dentro del crculo disminuyen constantemente con la distancia (coherentemente).
5. El kernel exponencial negativo superpone una funcin disminuyendo
drsticamente sobre cada celda de la cuadrcula; las ponderaciones de
los puntos dentro del crculo disminucin muy rpidamente con la distancia.
53
los kilometers, los metros). Por defecto es una milla para los primeros y segundos archivos.
Unidades de rea
Debe especificar las unidades de densidad como puntos por milla cuadrada, por millas cuadriculadas nuticas, por pies cuadrados, por kilmetros
cuadrados, o por metros cuadrados. Por defecto es puntos por milla cuadrada.
Uso de la variable intensidad
Los archivos (primario y secundario) se tratan por separado, y se marcar
la casilla correspondiente a la variable intensidad, en caso de que esta se
utilice en interpolacin.
Uso de la variable ponderacin
Los archivos (primario y secundario) se tratan por separado, y se marca
la casilla correspondiente a la variable ponderacin, en caso de que esta se
utilice en interpolacin.
Clculo de densidad de probabilidades o densidad
La estimacin de densidad para cada celda se puede calcular de seis maneras:
1. Rata de densidades. Es el cociente (rata) de la densidad para el primer
archivo dividido por la densidad del segundo archivo.
2. Logaritmo de rata de densidad. Es el logaritmo natural del cociente
(rata) de la densidad del primer archivo dividido por la densidad del
segundo archivo.
3. Diferencia en densidad absoluta. Es la diferencia entre la densidad absoluta del primer archivo y el segundo, diferencia neta. La densidad de
cada archivo es escalada de modo que la suma de las celdas iguale el
tamao de la muestra.
4. Diferencia en densidad relativa. Esta es la diferencia entre la densidad
relativa del primer archivo y la densidad relativa del segundo archivo. Es
55
56
1.2.4.
La pestaa anlisis espacio tiempo (space-time analysis) abre una ventanea que permite analizar la interaccin entre el espacio y tiempo. En esta
ventana, se muestran cuatro rutinas. En primer lugar, el ndice Knox que
muestra relacin binomial simple entre los eventos ocurridos en el espacio y
en el tiempo. En segundo lugar, el ndice Mantel que muestra la correlacin
entre la proximidad en el espacio y la proximidad en el tiempo. En tercer
lugar, la media mvil espacio-temporales (spatial-temporal moving average)
que calcula la media central para un span temporal. En cuarto lugar, el Anlisis de caminos correlacionado (Correlated Walk Analysis ) que diagnostica
la secuencia espacial y temporal de los incidentes cometidos por un delincuente en serie.
Para cada una de estas rutinas, el tiempo debe ser definido como un
nmero entero o real, y no en formato de fecha; por ejemplo son valores elegibles: 3 das, 2.1 semanas, 4.3 meses, o el nmero de das desde 1 de enero
de 1900, (por ejemplo, 37.174); mientras que en formato de fecha no son
elegibles, por ejemplo, 1 de noviembre de 2001 07/30/01. Debe convertirse
los formato de fechas en nmero real. Las unidades de tiempo debe ser coherente en todas las observaciones, (es decir, deben tener una nica unidad,
como horas, das, semanas, meses o aos). Si una de estas condiciones es viola, CrimeStat ejecuta los calcular y da los resultados, pero no sern correctos.
ndice de Knox
El estadstico de Knox es un ndice que muestra la relacin entre la cercana el tiempo y cercana la distancia. Se comparan los pares de eventos
en distancia y tiempo, y luego son representados en una tabla de 2x2. Existen
tres mtodos que definen cercana en tiempo o distancia:
1. Media. Esto es; eventos que estn ms cercanos (en tiempo) que el
intervalo de tiempo medio, o que estn ms cerca (en distancia) que la
distancia media, se definen como cercano, mientras que los eventos
que estn ms lejos en tiempo, que el intervalo de tiempo medio, o
estn ms lejos en distancia que la distancia media, se define como no
cercano.
2. Mediana. Esto es; eventos que estn ms cercanos (en tiempo) que la
57
3. El nmero span.
4. Las coordenadas X e Y para cada span de ventana.
Los resultados tabulares salen como un archivo dBase .dbf, Microsoft
Access .mdb, Ascii .dat o ODBC-compatible. Un resultado grfico que muestra una lnea secuencia en archivo para ArcView .shp, para Mapifo .mif o
Atlas*gis .bna.
Anlisis de caminos correlacionado (CWA)
El Anlisis de caminos correlacionados (Correlated Walk Analysis, CWA)
analiza la secuencia de movimientos de un delincuente en serie y hace predicciones acerca del tiempo y la localizacin de un prximo evento. Los movimientos secuenciales son analizados en trminos de tres parmetros: diferencia de tiempo entre eventos (por ejemplo, el nmero de das entre dos
eventos consecutivos); distancia entre eventos (por ejemplo, la distancia entre dos eventos consecutivos); y ngulo entre eventos, direccin angular entre
dos eventos consecutivos medidos en grados (de 0 a 360). Hay tres rutinas
para analizar la secuencia de eventos:
1. Correlograma.
2. Diagnstico de Regresin.
3. Prediccin.
Correlograma de CWA
El correlogram presenta las correlaciones rezagadas entre eventos por diferencia de tiempo, distancia, y ngulo (direccin). Los retardos son comparaciones de secuencias. Un retardo de cero es la secuencia comparada con ella
misma; por definicin, la correlacin es igual a 1. Un retardo de 1 es la
comparacin de la secuencia con la anterior secuencia. Un retardo
de 2, es la secuencia en comparacin con dos secuencias anteriores.
Un retardo de 3 es la secuencia en comparacin con tres secuencias
anteriores, y as sucesivamente. En total, las comparaciones se hacen
hasta siete secuencias anteriores (un retardo de 7).
61
Opciones
En esta ventana de opciones, CrimeStat permite salvar parmetros, cambiar los colores de las pestaas en las cuatro secciones, y ver la data simulada
por la rutina de Monte Carlo.
Salvando Parmetros
Todos los parmetros de entrada pueden ser salvados. En la ventana Opciones, hay un botn para Salvar parmetros (Save parameters). Los archivos de parmetros salen con la extensin param. Un archivo de parmetros
salvado puede ser recargado con el botn parmetros de Carga (Load parameters).
64
Colores
Los colores de cada las cuatro pestaas o secciones de CrimeStat pueden ser cambiados seleccionando la pestaa correspondiente y escogiendo un
color del espectro.
Salida de la Data simulada
Cuando se corre una simulacin de Monte Carlo con la rutina de Ripleys K, Cluster Jerrquico del vecino ms cercano, Cluster Jerrquico del
vecino ms cercano de ajuste de riesgo, el STAC, Mantel o Knox, la data pueden salida como archivo .dbf. Cada corrida de simulacin sale con el
nombre de Sim_data<I>.dbf, donde <I>es el nmero de corridas, por ejemplo, Sim_data4.dbf.
VI Intercambio dinmico de datos (DDE)
CrimeStat apoya el Intercambio de datos Dinmico (DDE). Ver en Apndice A, en documentacin, o en ayuda online para mayor formacin.
65