Está en la página 1de 65

1.

Descripcin del programa CrimeStat

1.1.

Introduccin

CrimeStat es un programa de estadsticas espaciales diseado especficamente para el anlisis de la ocurrencia de incidentes criminales, desarrollado
por Ned Levine bajo el auspicio del Instituto Nacional de Justicia de Estados Unidos de Amrica. Su propsito es brindar un conjunto de herramientas
estadsticas complementarias para ayudar a investigadores y agencias encargadas de hacer cumplir la ley.
El programa utiliza la ubicacin de incidentes criminales como datos de
entrada en formato de archivo dBase (.dbf, III, IV, o V), que es un formato
de archivo comn para programas de Sistema de informacin geografico de
escritorio (SIG), como ArcView (shp), MapInfo (dat), y archivos compatibles
con el estndar ODBC, como Excel, Lotus 1-2-3, Microsoft Access, y Paradox
(Borland.Com, 1998; ESRI, 1998a; Microsoft, 1999). Adems, para muchos
otros SIG, como Maptitude, y puede leer archivos como dbf, shp, bna
or mif.
A partir de estos datos, permite aplicar los mtodos de estadstica espacial, produciendo resultados en archivos formato cartogrfico que pueden ser
R
utilizados directamente por diferentes programas de SIG como ArcView,
R Atlas*GIS, y Spatial Analyst.
c
MapInfo,
Los mtodos de estadstica espacial instrumentados en CrimeStat son:
Distribucin Espacial: conjunto de mtodos para la descripcin de la
distribucin espacial de incidentes, tales como el media central, centro
de mnima distancia, la elipse de desviacin estandarizada, y el ndice
de autocorrelacin espacial I de Moran.
Anlisis de Distancia: conjunto de tcnicas estadsticas para describir
las propiedades de las distancias entre los incidentes, incluyendo anlisis
de vecinos ms cercanos, anlisis lineal del vecino ms cercano, y el
estadstico K de Ripley.
Anlisis de Zona o Puntos Calientes: ("Hot Spot") incluye las rutinas para realizar el anlisis de Punto Calientes, incluyendo la moda,
la moda difusa, deteccin de conglomerados de vecinos ms cercanos
1

jerrquicos y de vecinos ms cercanos jerrquicos ajustados por niveles


de riesgo, as como otras rutinas para el Anlisis Espacial y Temporal
de Crmenes (STAC por sus siglas en ingls), que incluyen el mtodo
de deteccin de conglomerados K-means y los ndices Locales de Autocorrelacin Espacial (LISA por sus siglas en ingls) propuestos por
Anselin.
Modelacin Espacial: incluye mtodos de interpolacin, utilizando el
mtodo de estimacin de densidad de kernel de una variable simple,
para producir un estimado de superficie o contorno de la densidad de incidentes, tambin incluye el mtodo de estimacin de densidad de kernel
dual, utilizando dos variables en la estimacin, para comparar la densidad de incidentes con la densidad de un segundo archivo DDDDDDD,
adems de otras tcnicas de anlisis espacio-temporal, como los ndices
de Knox y Mantel, que permiten detectar la asociacin de incidentes
en tiempo y espacio (estos indices son los que desarrollaremos en este
trabajo), entre otros mtodos con mayor aplicacin en el anlisis de
criminalidad.
CrimeStat utiliza varios tipos de archivos de datos de entrada, un archivo primario y uno secundario, ambos contienen la ubicacin de incidentes en
forma de pares de coordenadas, as como la fecha de ocurrencia del incidente.
El archivo secundario contiene datos asociados con el primario y puede ser
utilizados con fines de comparacin en los mtodos de deteccin de conglomerados o cluster. Utiliza adems un archivo que define una rejilla (grid) de
polgonos regular irregular que se superpone sobre el rea de estudio. Dicha
rejilla puede ser creada por CrimeStat por un SIG.
CrimeStat no tiene capacidad para la visualizacin de mapas ni funciones
de SIG, su diseo se ha centrado en los mtodos de anlisis de datos espaciales; sin embargo, una caracterstica importante desde el punto de vista
programtico, es la disponibilidad de una Interfase de Programacin de Aplicacin (API) que permite que otros programas invoquen sus procedimientos
y funciones, permitiendo el uso de SIG gratuitos o de bajo costo. Esta es
una ventaja relativa para su uso respecto a aquellos que requieren de SIG
comerciales.

1.2.

Manual de corto de CrimeStat o gua rpida

En esta seccin se presenta una introduccin a las funciones del programa


CrimeStat que se utilizan en este trabajo; las mismas se exponen en forma
de manual, de tal manera que pueda servir de guia a los usuarios del mismo.
Descripcin breve de la organizacin de las rutinas del programa
CrimeStat cuenta con diecisiete pestaas (rutinas) organizados en cinco
grupos base, presentados en ventanas, y una ficha opcin, como se describe
acontinuacion:
Configuracin de los datos
1. Archivo primario
2. Archivo secundario
3. Archivo de referencia
4. Medicin de parmetros
Descripcin espacial
5. Distribucin espacial
6. Anlisis de distancia I
7. Anlisis de distancia anlisis II
8. Anlisis Zonas calientes I (Hot Spot)
9. Anlisis Zonas calientes II (Hot Spot)
Modelado espacial
10. Interpolacin
11. Anlisis Espacio-tiempo

12. Estimacin del viaje a la delincuencia


Demanda del recorrido del crimen
13. Generacin de viaje
14. Distribucin de viaje
15. Modelo Split
16. Asignacin de Red
17. Archivo de hojas de calculo
Opciones
18. Guardando parmetros, colores y opciones.
En la Figura tal 1.1-2.18 se presenta la ventana principal de Crimestat,
donde se muestra las cinco pestaa correspondientes a los cinco grupos base.
1.2.1.

Configuracin de datos

Archivo Primario
CrimeStas requiere de un archivo primario. Sin embargo, se pueden seleccionar ms de un archivo si es necesario. Este es un archivo de puntos con
coordendas X e Y. Por ejemplo; un archivo primario puede ser la ubicacin
de los robos callejero con algn tipo de arma, cada uno referenciado con sus
respectivas coordenadas X e Y. Adems, en este archivo los incidentes pueden
estar asociados con alguna ponderacin o intensidad de las variables, aunque
estos son opcionales. Por ejemplo, si los puntos corresponden a los puestos o
estaciones de polica, la variable intensidad podra ser el nmero de llamadas
solicitando el servicio en cada estacin de polica, mientras que la variable
de ponderacin puede ser zonas de servicio. En este archivo se referencia el
tiempo en que sucede el evento criminal, y las unidades para el mismo son:
horas, das, semanas, meses o aos. Esta variable es necesaria por las rutinas
del anlisis espacio-tiempo.

Seleccin del tipo de archivo primario


CrimeStat puede leer archivos ASCII, dBase dbf( III / IV / V) , ArcView shp, MapInfo dat, Microsoft Access bdb, y formatos de archivos
que corresponden a la interfaz estndar ODBC.
Para seleccione el tipo de archivo a ser usado, utilice el botn Browse para
buscar el nombre del archivo. Si el tipo de archivo es ASCII, seleccione el
tipo de datos separador (coma, punto y coma, espacio, ficha) y el nmero
de columnas. Los archivos ODBC deben que ser definidos para el particular
equipo en el que se ejecuta.
Variables
Debe definir el archivo que contiene las coordenadas X e Y. CrimeStat
acepta valores asociados a las coordenadas X e Y; estos valores son los llamados pesos o intensidades. Si estas ponderaciones var a ser usadas, debe
definirse el archivo que las contiene. En esencia, se trata de dos tipos de ponderaciones diferentes, que son requeridas por algunas rutinas, (por ejemplo,
el indice local de Moran, la autocorrelacin espacial). Es posible usar las dos
ponderaciones (intensidad y un peso), aunque debe ser prudente en ello, para evitar la doble ponderacin. CrimeStat utiliza la variable tiempo como
un nmero entero o nmero real (por ejemplo, 1, 36892); no usa el formato
fechas (por ejemplo, 01/01/2001, 1 de octubre de 2001). Debe convertir el
formato fechas a nmeros reales antes de utilizar cualquier rutina de anlisis
de espacio-tiempo.
Columna
Seleccione las variables para las coordenadas X e Y, respectivamente (por
ejemplo, Longitud, Latitud, Xcoord, Ycoord). Si los pesos o intensidades sern utilizados, debe seleccionarse nombres apropiada para estas variables; de
igual manera si la variable tiempo se utiliza, debe seleccionase un nombre
apropiado.
Valores faltantes
CrimeStat por defecto ignora los registros con valores en blanco en cualquiera de los campos elegibles o no con valores no numricos (por ejemplo,
5

caracteres alfanumricos, #, ). Los registros con valores en blanco siempre


ser excluido a menos que el usuario seleccione en la casilla <none>, alguna
otra opcin. Hay 8 opciones posibles:
1. <blank>los campos son automticamente excluidos. Este valor es por
por defecto
2. <none>indica que los registros no sern excluidas. Si hay un campo en
blanco, CrimeStat tratar como un 0
3. 0 Est excluido
4. -1 Est excluido
5. 0 y -1 indica que ambos 0 y -1 se excluirn
6. 0, -1 y 9999 indica que los tres valores (0, -1, 9999) sern excluidas
7. Cualquier otro valor numrico puede ser tratado como un valor faltante
tipiando este (por ejemplo, 99)
8. Valores numricos mltiples pueden ser tratados como valores que faltan por tipear, separando cada uno por comas (por ejemplo, 0, -1, 99,
9999, -99)
Direccional
Si el archivo contiene coordenadas direccionales (ngulos), debe definirse el nombre del archivo y el nombre de la variable (columna) que contiene
la medida direccional. Si coordenadas direccionales son usadas, puede haber
una variable de distancia opcional para la medida. Defina el nombre del archivo y el nombre de la variable (columna) que contiene la variable de distancia.
Tipo de sistema de coordenadas y unidades de datos
Seleccione el tipo de sistema de coordenadas. Si las coordenadas estn
en longitudes y latitudes, un sistema esfrico es usado, y las unidades de los
datos automticamente son grados decimales. Si el sistema de coordenadas es
proyeccin (por ejemplo, Sistema de Coordenadas Planas o Universal Transversal de Mercator-UTM), las unidades de los datos puede ser en pies, metros
6

(por ejemplo, UTM), millas, kilmetros o millas nuticas. Si el sistema de


coordenadas es direccional, las coordenadas debe estar en ngulos y la casilla
de unidad de datos queda en blanco. Para el sistemas de direccional, hay una
variable additional distancia, que puede ser usado. Esta mide la distancia del
incidente desde la posicin origen (ubicacin); observe que en este caso las
unidades son indefinidas.
Unidades de tiempo
Definir las unidades de la variable tiempo. El tiempo es definido en trminos de horas, das, semanas, meses o aos. El valor por defecto es das.
CrimeStat utiliza la variable tiempo como un nmero entero o nmero real
(por ejemplo, 1, 36892); no usa el formato fechas (por ejemplo, 01/01/2001, 1
de octubre de 2001). Debe convertir el formato fechas a nmeros reales antes
de utilizar cualquier rutina de anlisis de espacio-tiempo.
Archivo Secundario
CrimeStat usa un segundo archivo de datos que puede ser opcional, llamado Archivo Secundario. Este archivo tambin es un archivo de puntos con
coordenadas X e Y. Generalmente se usa para comparar con el archivo primario. El archivo secundario puede usar las variables ponderadas (pesos o
intensidades) asociadas a las coordenadas X e Y, aunque estas son opcionales.
Por ejemplo, si el archivo principal corresponde a la ubicacin de robos de
automviles, en el archivo secundario la variable como la intensidad (o peso)
podra ser el centroide de los bloques de los grupos que tienen la poblacin
censada. En este caso, se podra comparar la distribucin de robos de automvil con la distribucin de poblacin; por ejemplo, en la rutina de Ripleys
K o la estimacin de densidad dual. La variable tiempo no es utilizada en
este archivo. Puede seleccionarse ms de un archivo a usar.
Seleccin del tipo de Archivo Secundario
Procedimiento semejante al archivo primario. Ver archivo primario.
Variables
Definir el archivo que contiene las coordenadas X e Y. Si los pesos o
7

intensidades van a ser usados, debe definirse el archivo que contiene estas
variables. Algunos estadsticos requieren valores de intensidad (por ejemplo,
autocorrelacin espacial, Moran local). La mayora de los dems estadsticos pueden utilizar ponderaciones. Es posible tener ambas variables (pesos
e intensidad ), aunque el usuario debe ser prudente en ello para evitar la
doble ponderacin. Las Unidades de tiempo no se utilizan en este archivo
secundario.
Columna
Seleccione las variables para las coordenadas X e Y, respectivamente (por
ejemplo, Longitud, Latitud, Xcoord, Ycoord). Si hay pesos o intensidades que
se est usando, debe seleccionarse nombres apropiadas para estas variables.
Unidades de tiempo no se utilizan en el archivo de secundaria.
Valores faltantes
Procedimiento semejante al archivo primario. Ver archivo primario.
Tipo de sistema de coordenadas y unidades
La data del archivo secundario debe tener el mismo sistema de coordenadas y las mismas unidades del archivo principal. Esta seleccin ser bloqueada o neutralizada, indicando que el archivo secundario debe lleva la misma
definicin que el archivo primario. El archivo secundario no se permite coordenadas direccional (ngulos).
Archivo de referencia
Para referenciar el rea de estudio, existe una grilla o cuadrcula de referencia y un origen de referencia. El archivo de referencia es utilizado por las
rutinas: cluster jerrquicos del vecinos ms cercanos (agrupacin), viaje de
la delincuencia y por estimacin de densidad o kernel, simple o doble. Es por
lo general, aunque no siempre, una cuadrcula es sobrepuesto en la zona de
estudio. El origen de referencia es utilizado en la ruptina media direccinal.
Este archivo puede ser externo como archivo de entrada, o puede ser creados
por CrimeStat.

Crear una grilla o cuadrcula de referencia


CrimeStat permite generar una verdadera cuadrcula, haciendo clic en
reate Grid y luego ingresando en la parte inferior izquierda y superior derecha las coordenadas X e Y de un rectngulo, colocado sobre el rea de estudio.
Las celdas se pueden definir por tamao de celda, en las mismas coordenadas y los datos de unidades como el principal archivo, o por el nmero de
columnas en la red (por defecto). Adems, un origen de referencia puede ser
definido por la rutina media direccional. La grilla de referencia puede ser
guardardo para volver a utilizar. Haciendo clic en la casilla Guardar (Save)
y dando un nombre al archivo. Para utilizar un archivo guardado, haga clic
en la casilla cargar (Load) y colocar directorio y nombre del archivo. Las
coordenadas se guardan en el registro, pero pueden guardarse en cualquier
directorio. Para guardar en un directorio particular, con la ventana abierta
de la pestaa Cargar (Load), haga clic en Guardar en archivo (Save to file),
a continuacin, introduzca el directorio y nombre del archivo. La extensin
de archivo por defecto es ref.
Entrada de un archivo externo de referencia
Para usar un archivo externo que almacena las coordenadas de rejilla o
cuadrcula, debe seleccionar el nombre del archivo de referencia. CrimeStat
puede leer archivo ASCII, dBase dbf, ArcView shp, MapInfo dat, Microsoft Access mdb, y formatos de archivos que corresponden a la interfaz
estndar ODBC. Seleccione el tipo de archivo a usar. Use el botn buscar
(browse) para ubicar el archivo. Si el tipo de archivo es el ASCII, seleccione
el tipo de separador de datos (la coma, el punto y coma, el espacio, pestaa)
y el nmero de columnas. Los archivos ODBC tienen que ser definido para el
computador sobre el cual se ejecutara. Use el botn de wrouse para buscar
el nombre del archivo.
Un archivo de referencia ledo en Crimestat no tiene que ser necesariamente una rejilla verdadera (matriz con k columnas y l filas). Sin embargo,
un achivo exernal de referncia que es ledo en Crimestat, slo puede ser salida
Surfer para Windows ya que otros formatos de salida - ArcView, MapInfo,
Atlas*GIS, Spatial Analyst, y rejilla ASCII requieren que el archivo de referencia sea una rejilla verdadera.

Origen de referencia
Un origen de referencia puede ser definido por la rutina de media direccional. El origen de referencia pueden ser asignados a:
1. Uso de la esquina inferior izquierda, definida por el mnimo de los valores X e Y. Este valor es por defecto.
2. Uso de la esquina superior derecha, define por los valores mximos X
e Y.
3. Un punto de origen diferente. Con este ltimo, el usuario debe definir
el origen.
Medida de parmetros
En la pestaa medida de parmetros (Measurement Parameters), se define las unidades y el la cobertura del rea en estudio, y el tipo de distancia
a utilizar. En esta ventana hay tres componentes que se definen:
Area
En primer lugar, debe definirse el rea geogrfica de la zona de estudio, y
la unidades de superficie en kilmetros cuadrados, millas nuticas cuadradas,
pies cuadrados o metros cuadrados. Independientemente de las unidades en
que se han definido los datos en el archivo principal, CrimeStat puede convertir diversas unidades de rea. Estas unidades se utilizan en la rutinas del
vecino ms cercano, Ripleys K, cluster jerrquica, STAC, y clustering de
K-means. En caso de que las unidades de superficie no esten definidas, CrimeStat define un rectngulo por el mnimo y el mximo de las coordenadas
X e Y.
Longitud de la red de calle
En segundo lugar, se define la Longitud total de la red de calle (Length
of street network) del rea de estudio o una comparacin adecuada de red,
como por ejemplo, un sistema de autopista; y se define tambien las unidades
de distancia (kilmetros, millas nuticas, pies, kilmetros, metros). La longitud de la red de calle es utilizada por la rutina anlisis lineal del vecino ms
10

cercano. Independientemente de las unidades que se ha utizado en la data


del archivo principal, CrimeStat puede convertir las unidades de medicin a
distancia. La distancia deber estar en la misma mtrica como la unidades
de superficie (por ejemplo, millas y millas cuadradas, metros y metros cuadrados.)
Tipo de distancia
En tercer lugar, se define las distancias a usar en los calculos (Type of
distance measurement). Hay tres opciones:
1. Distancia directa
2. Distancia indirecta (Manhattan)
3. Distancia de Red
Grfico 2,11
Distancia directa
Si se usa distancia directa, cada distancia es calcula como la distancia ms
corta entre dos puntos. Si se las coordenadas son esfricas (es decir, latitud,
longitud), entonces la distancia directa ms corta es un arco de circulo sobre
una esfera. Si las coordenadas son proyecciones, entonces, la distancia ms
corta directa es una lnea recta en un plano euclidiano.
Distancia Indirecta
Si se usa la distancia indirecto, cada distancia se calcula como la distancia ms corta entre dos puntos en una cuadrcula, esto es, la distancia est
limitada a la direcciones horizontal o vertical (es decir, no en diagonal). Esta
distancia es llamada mtrica de Manhattan. Si son coordenadas esfricas
(es decir, latitud, longitud),entonces la distancia indirecta ms corta es un
ngulo recto modificado sobre un tringulo rectngulo esfrico; escribir ms
detalles. Si las coordenadas son proyecciones, entonces la distancia indirecta
ms corta es el ngulo recto de un tringulo rectangulo sobre un plano de
dos dimensiones.

11

Distancia en Red
Si se utiliza distancias en red, cada distancia es calculada como el camino
ms corto entre dos puntos en la red. Alternativamente la distancia puede
utilizarse incluyendo velocidad, tiempo de viaje o recorrido, o costo de viaje.
Haciendo clic en la casilla parmetros de la red (Network parameters), aparece una ventana con los parmetros de red, donde debe identificar el archivo
de red, Tipo de red, Entrada del Archivo de red, Ponderacin sobre la Red,
From one-way flag and To one-way flag, Identificando nodo partida (FromNode ID) y terminal (ToNode ID Sistema de coordenadas Unidades de medida
y Lmite grfico de Red:
Tipo de red
Los archivos de Red pueden ser bi-direccional (por ejemplo, un archivo TIGER) o uni-direccional (por ejemplo, un archivo para modelacin del
trnsito). En un archivo bi-direccional, se puede viajar en cualquier direccin; mientras que en un archivo uni-direccional, slo se puede viajar en una
direccin. Debe especificar el tipo de Red que se utilizar.
Tipo de Archivo de entrada
Los archivos de red pueden ser archivo tipo shape (.shp) o archivo tipo
dBase IV dbf, Microsoft Access mdb , Ascii dat , o un archivo compatible con ODBC. Por defecto el archivo es tipo shape. Si el archivo es de tipo
shape, la rutina debe conocer la localizacin de los nodos.
Para un archivo dBase IV u otro tipo, las coordenadas X e Y de los nodos
deben ser definidas; estos son Llamados "Partida"(From) del nodo y "Terminal"(End) del nodo. Una variable peso opcional es permitida para los archivos
tipos file0073. La rutina identifica nodos, segmentos, y calcula la trayectoria
ms corta. Si hay un camino uni-direccional en un archivo bidireccional, los
campos para nodos de "Partida terminal deben ser definidos.
Ponderacin sobre la Red
Normalmente, cada segmento en de la red no es ponderado. En este caso,
la rutina calcula la distancia ms corta entre dos puntos, utilizando la distancia de cada segmento. Sin embargo, cada segmento puede ser ponderado
12

por el tiempo de viaje, velocidad o costo de viaje. Si el tiempo de viaje es


utilizado para ponderar el segmento, la rutina calcula el menor tiempo para
cualquier ruta entre dos puntos. Si la velocidad se utiliza como ponderacin
del segmento, la rutina convierte esto en el tiempo de viajes, dividiendo la
distancia por la velocidad. Por ltimo, si los costos de viaje se utiliza como
ponderacin, la rutina calcula la ruta con el menor costo total de viaje.
Especifique la ponderacin que utilizar (weight column) y asegrese de
indicar las unidades de medida (distancia, velocidad, tiempo de viaje, costo
de viaje) en la parte inferior de la ventana. Si no se asigna ponderacin, entonces la rutina se ejecuta utilizando la distancia.
From one-way flag y To one-way flag
Un segmento uni-direccional pueden ser identificado en un archivo bidireccional por el campo (from one-way flag), es decir, no es necesario un
archivo uni-direccional. El flag es un campo para los nodos finales del segmento con valores 0 y 1. Un 0 indica que los viajes pueden pasar a travs
de ese nodo en cualquier direccin, mientras que un 1 indica que el viaje
slo puede pasar del nodo del mismo segmento (por ejemplo, los viajes no
puede ocurrir de otro segmento que est conectada al nodo). Por defecto se
asume que los viajes pueden pasar travs de cada nodo,(es decir, se supone
un0 para cada nodo). Para cada calle de direccin nica, debe especificar las
flags para cada nodo terminal. Un 0 permite viajar desde cualquier conexin
de segmentos, mientras que un 1 slo permite viajar desde el otro nodo del
mismo segmento. Flag Marcar los campos que estn en blanco se supone que
permiten viajar a pasar en cualquier direccin.
Identificando nodo partida (FromNode ID) y nodo terminal (ToNode ID)
Si la red es uni-direccional, hay un segmento individual para cada direccin. Normalmente, dos calles tienen dos segmentos, uno para cada direccin.
Por otra parte, calles con un solo sentido, tienen slo un segmento. Las casillas FromNode ID y ToNode ID, identifican el inicio y el final del segmento de
los viajes debera ocurrir, respectivamente. Si no se definen los FromNode ID
y ToNode ID, la rutina elige el primer segmento de un par que encuentre, en
direccin equivocada o correcta. Para determinar correctamente la direccin
de viaje, debe definirse los campos FromNode ID y ToNode ID.
13

Sistema de coordenadas
El archivo de red usa el mismo sistema de coordenadas que que el archivo
primario.
Unidades de medida
Por defecto, la trayectoria ms corta es en trminos de distancia. Sin embargo, cada segmento puede ser ponderado por el tiempo de viaje, velocidad
de viaje, o costo de viaje.
1. Para el tiempo de viaje, las unidades son minutos, horas o unidades de
costo sin especificar.
2. Para la velocidad, las unidades son millas por hora y kilmetros por hora. En el caso de velocidad como una variable de ponderacin, automticamente es convertido el tiempo de viajes, por dividiendo la distancia
del segmento por la velocidad, manteniendo las unidades constantes.
3. Para costo de viaje las unidades no estn definidas, la rutina identifica
aquellas rutas con el menor costo total.
Lmite grfico de Red
Finalmente, el nmero de segmentos grficos a ser calculados es definido
como el lmite de red. Por defecto, el valor es 50.000 segmentos. Debe asegurarse que este nmero es ligeramente mayor que el nmero de segmentos en su
red. Observacion: Usando la distancia red (network distance), los clculos de
distancia puede ser un proceso lento, por ejemplo, puede tomar varias horas
para clcular toda una matriz. Utilice mayor precisin slo si es necesario, o
para la rutina de asignacin de red en el mdulo de demanda recorrido del
crimen.
Salvar parmetros
Hay un botn o pestaa Guardar parmetros (Save parameters) en la
seccin Opciones. donde todos los parmetros de entrada pueden ser guardados. Un archivo de parmetros guardados tiene una extensin param. Un
14

archivo de parmetros guardados puede ser recargado con el botn cargar


parmetros (Load parameters).
1.2.2.

Descripcin espacial

En esta seccin se estudia las estadsticas descriptivas de la distribucin


espacial; haciendo clip en la pestaa spatial description, se abre la ventana
que muestra las pestaas para la descripcin espacial (spatial description),
anlisis de distancia I y II (distance analysis), y anlisis de puntos calientes I
y II (Hot Spot). A continuacin describimos brebemente cada una de estas
rutinas:
Descripcin espacial
Esta pestaa descripcin espacial (spatial description) nos proporciona
las estadstica que describe la distribucin espacial total. Los estadsticos
que estudiamos en esta seccin a veces son llamados estadsticos espaciales
de primer-orden, globales. Hay cuatro rutinas que describen la distribucin
espacial, y dos rutinas para describir autocorrelacin espacial. Las variable
intensidad y ponderacin puede ser utilizada por las primeras tres rutinas.
La variable intensidad es necesaria para las rutinas de autocorrelacin espacial; la variable ponderacin tambin puede ser usada por las rutiunas de
ndice autocorrelacin espacial. Todo los resultados pueden guardarse como
archivos de texto. Algunos salidas o resultados se pueden guardar como objetos grficos, para ser importardos por programas de Sistemas de informacin
geografica SIG.
Media Central y Distancia Estndar (Mcsd)
La media central y la distancia estndar definen la ubicacin de la media
aritmtica y el grado de dispersin de la distribucin. La rutina Mcsd calcula
9 estadsticos:
1. El tamao de la muestra.
2. Los valores mnimos de X e Y.
3. Los valores mximo de X e Y.

15

4. Las coordenadas de la media central (X e Y).


5. La desviacin estndar de las coordenadas X e Y.
6. Las coordenadas X e Y de la media geomtrica.
7. Las coordenadas X e Y de la media armnica.
8. La desviacin de la distancia estndar, en metros, pies y millas. Esta es
la desviacin de la distancia estndar de media central a cada punto.
9. El crculo de rea (area circular) definida por la desviacin de distancia
estndar, en metros cuadrados, pies cuadrados y millas cuadradas.
La salida tabular y la media central (media de X, media de Y) pueden imprimirse. La media geomtrica, la media armnica, las desviaciones estndar
de las coordenadas X e Y, y la desviacin de la distancia estndar se pueden
obtener en archivo u objetos grficos en formatos para ArcView Shp, MapInfo mif, Atlas*GIS bna; pero debe darle un nombre de raz a cada uno.
La media central, la media geomtrica y la media armnica salen como un
punto con nombre del archivo (MC <root name>), (GM <root name>) y
(HM <root name>) respectivamente. La desviacin estndar de las coordenadas X e Y salen como un rectngulo (XYD <root name>). La desviacin
de distancia estndar sale como un crculo (SDD<root name>).
Elipses de desvo estndar (Standard Deviational Ellipse) (Sde)
El Elipse de desvo estndar define la dispersin y la direccin (orientacin) de la distribucin. Esta rutina calcula 9 estadsticos:
1. El tamao de la muestra.
2. El ngulo de rotacin del Y-eje, medido en grado en sentido de las
agujas del reloj.
3. La proporcin de largo a corto despus de los ejes, despus de rotacin.
4. La desviacin estndar a lo largo de los nuevos ejes X e Y.
5. La longitud de los ejes X e Y.

16

6. El rea de la elipse definida por los ejes X e Y.


7. La desviacin estndar a lo largo de los ejes X e Y.
8. La longitud de los ejes X e Y, para dos desviacin estndar elipsoidal
2X.
9. El rea para dos desviacin estndar elipsoidal (2X) definido por estos
ejes
Las salida tabular se puede ser impresa, y los resultados de 1X y 2X desviaciones estndar elipsoidal o Elipse de desvo estndar, se puede obtener
como como archivos u objetos grficos en formatos para ArcView Shp, MapInfo mif, Atlas*GIS bna; proporcionandole un nombre de raz (origen).
La desviacin estndar eclipse de 1X es una salida como un elipse (SDE <root
name>). La desviacin estndar elipse de 2X es una salida como un elipse
con ejes dos veces mas grande que la desviacin estndar elipse 1X (2SDE
<root name>). Si la data est distribuida normalmente, entonces una desviacin estndar elipse (1X) captura aproximadamente el 68 % de los casos,
y dos desviacin estndar elipse (2X) captura aproximadamente el 95 % de
los casos, sin embargo, cualquier distribucin puede desviarse de considerablemente de la forma normal y los porcentajes reales pueden variar.
La mediana Central (MdnCntr)
La mediana central es la interseccin de las medianas de las coordenadas
X e Y, esta aproximadamente en el medio de la distribucin. Sin embargo,
la mediana central depende de la orientacin de los ejes, por lo que debe
utilizarse con precaucin. Esta rutina (MdnCntr) proporciona 3 estadsticos:
1. El tamao de la muestra.
2. La mediana de X.
3. La mediana de Y.
Los resultados tabulares pueden imprimirse, y la mediana central puede salir como objeto grfico o archivo para ArcView shp, MapInfo mif o
Atlas*GIS bna, proporcionandole un nombre de raz (origen). La mediana
17

central sale como un punto con nombre del archivo (MdnCntr <root name>).
Centro de mnima distancia (Mcmd)
El centro de mnima distancia define el punto para el cual la distancia
a todos los dems puntos es mnima. Esta rutina (Mcmd) proporciona 5
estadsticos:
1. El tamao de la muestra.
2. Las medias de las coordenadas X e Y.
3. El nmero de iteraciones requeridas para identificar el centro.
4. El grado de error (tolerancia) para detener las iteraciones.
5. Las coordenadas X e Y que definen el centro de mnima distancia.
La salida tabular puede imprimirse, y el centro de mnima distancia puede salir como objeto grfico o archivo para ArcView .shp, MapInfo .mif
o Atlas*GIS .bna, proporcionndole un nombre de raz (origen). El centro
de mnima distancia sale como un punto y con nombre (Mdn<root name>).
Media Direccional y Varianza (Mcmd)
La media direccional o angular y la varianza, son propiedades de la medida angular. La media angular es un ngulo definido a partir del Norte: 0
grados. La varianza direccional es un indicador relativo, que vara de 0 (sin
variacin) a 1 (mxima variacin). Tanto la media angular como la varianza
direccional pueden calcularse a travs de las coordenadas direccionales (angulares) o a travs de coordenadas X e Y.
Si el archivo principal presenta coordenadas direccionales (ngulos de 0 a
360 grados),la media angular se calcula directamente a partir de los ngulos.
Una variable distancia opcional puede ser incluida. En este caso, la rutina
media direccional proporciona la salida de cinco estadsticos:
1. El tamao de la muestra.
2. La media angular sin ponderacion.
18

3. La media angular ponderada.


4. La varianza circular sin ponderacin.
5. La varianza circular ponderada.
Por otro lado, si en el archivo primario los incidentes se definen en coordenadas X e Y, los ngulos son definen en relacin con el origen de referencia
(ver archivo referencia), y ngulo medio se convierte en una ecuacin. En
este caso, la rutina media direccional ofrece nueve estadsticos:
1. El tamao de la muestra;
2. La media angular no ponderada
3. La media angular ponderada
4. La variancia circular no ponderada
5. La variancia circular ponderada
6. la distancia media
7. La interseccin de la media angular y la distancia media (media direccional).
8. Las coordenadas X e Y de la media triangular.
9. Las coordenadas X e Y de la media triangulados ponderada.
La media direccional y media triangulada se pueden guardar como archivos ArcView .shp, MapInfo .mif, o Atlas*GIS .bna. La media direccional
no ponderada, la interseccin de media angular y la distancia media sale con
el prefijo Dm, mientras que la posicin (ubicacin) de la media triangular
no ponderada sale con el prefijo Tm. La media triangulada ponderada sale
con prefijo TmWt. Los resultados tabulares se pueden imprimir.
Capsula Convexa (Chull)
La Capsula Convexa dibuja un polgono en torno a los puntos exteriores
de la distribucin. Es til para ver la forma de la distribucin. Esta rutina
proporciona tres estadsticos:
19

1. El tamao de la muestra.
2. El nmero de puntos en la capsula convexa.
3. Las coordenadas X e Y para cada uno de los puntos en la capsula
convexa.
La capsula convexa se pueden guardar como archivo para ArcView shp,
MapInfo mif, o Atlas*GIS bna con el prefijo Chull.
Autocorrelacin espacial
En esta seccin de Autocorrelacin espacial (Spatial autocorrelation) se
presentan dos indices de autocorrelacin espacial, ndice de Moran y el ndice de Gearys; adems se presenta tambin el correlograma de Moran. Los
ndices de autocorrelacin espacial permiten identificar si los puntos de localizacion estan o no relacionados espacialmente (es decir, en cluster o dispersos).
Ambos rutinas requieren la variable intensidad en el archivo principal.
Estadstico I de Moran

(MoranI)

El ndice o estadstico I de Moran, es el indicador clsico de autocorrelacin espacial. Se trata de un ndice de covarianza entre los diferentes puntos
de localizacin, similar al coeficiente de correlacin (producto momento), su
valor se encuentra entre -1 y 1. Esta rutina calcula seis estadsticos:
1. El tamao de la muestra.
2. El ndice de Morans "I".
3. El valor esperado del ndice "I" (valor aleatorizado espacialmente).
4. La desviacin estndar del ndice "I".
5. Una prueba de significacin para "I", bajo el supuesto de normalidad
(Z-test)
6. Una prueba de significacin para "I", bajo el supuesto de la aleatorizacin (Z-test).

20

Los valores del ndice superiores al valor esperado "I", indican cluster,
mientras que los valores inferiores al valor esperado, indican dispersin. La
significancia de la prueba indica si esas diferencias son mayores a las esperadas por azar. Los resultados se pueden imprimir.
Ajuste para las pequeas distancias
Si se selecciona esta pestaa (Adjust for small distances), las pequeas
distancias son ajustados de manera que la distancia mxima ponderada es
1. De esta forma se garantiza que el ndice "I", no sea excesivamente grande
para puntos que se encuentran muy prximos entre s. Por defecto la configuracin no es ajustada.
El C de Geary
El estadstico C Geary, es un indicador alternativo de autocorrelacin
espacial. Se trata de un ndice de comparacin entre los diferentes pares de
localizaciones. Vara de 0 a 2, cero para valores similares y dos para valores
dismiles. La rutina Geary calcula 5 las estadsticos:
1. El tamao de la muestra.
2. El ndice C de Geary.
3. El valor esperado C (valor espacialmente aleatorizado).
4. La desviacin estndar de C.
5. Una prueba de significacin para C, bajo el supuesto de normalidad
(Z-test).
Los valores de C inferior al valor esperado indicar cluster, mientras que
los valores de C mayor al valor esperado indican la dispersin. La significancia de la prueba indica si esas diferencias son mayores al valor esperado por
azar. Los resultado se pueden imprimir.
Ajuste para las pequeas distancias
Si se selecciona esta pestaa (Adjust for small distances), las pequeas
distancias son ajustados de manera que la distancia mxima ponderada es 1.
21

Esto asegura que el ndice C, no sea excesivamente grande para puntos que
se encuentran muy prximos. Por defecto la configuracin es no ajustada.
Correlograma de Moran
El Correlogram de Moran calcula el ndice de Morans "I"(no ajustado para las pequeas distancias), para diferentes intervalos de distancia. El
usuario puede seleccionar cualquier nmero de intervalos de distancia. Por
defecto son 10 intervalos de distancia.
Ajuste para las pequeas distancias
Si se selecciona esta pestaa (Adjust for small distances), las pequeas
distancias son ajustados de manera que la distancia mxima ponderada sea
igual a 1. Esto asegura el ndice de Morans "I" no, sea excesivamente grande o demasiado pequeo para puntos que se encuentran muy prximos. Por
defecto la configuracin es no ajustada.
Simulacin de intervalos de confianza
Mediante una simulacin de Monte Carlo se puede obtener una estimacin
aproximada de intervalos de confianza alrededor del indice "I". Seleccionando un nmero especfico de simulaciones a ejecutar (por ejemplo, 100, 1000,
10000).
La salida incluye:
1. El tamao de la muestra.
2. La distancia mxima.
3. El nmero de intervalos (bins).
4. El punto medio de la distancia bin.
5. El valor "I"de la distancia bin (I[B]).
Si la simulacin es ejecuta, la salida incluye:

22

6. El valor mnimo de "I" para la distancia bin.


7. El valor mxima "I"para la distancia bin.
8. El percentil 0,5 para la distancia bin.
9. El percentil 2,5 para la distancia bin.
10. El percentil 97,5 para la distancia bin.
11. El percentil 99,5 para la distancia bin.
Los dos pares de percentiles (2.5 y 97.5; 0.5 y 99.5) crean un intervalo
de confianza aproximadamente de 5 % y 1 %, respectivamente. Los valores
mnimo y mximo de "Irean un intervalo.
Los resultados tabulares se pueden imprimir, salvar como archivo de texto o salvados como archivo .dbf. Para Salvar los resultados haga clic en la
casilla Save result to, y especifique el nombre del archivo.
Representacin grfica del ndice "I": valores por distancia
Un grfico que muestra los valores "I" sobre el eje Y, y por distancia bin
sobre el eje X; haciendo clic en el botn "Graph", se muestra el grfico. El
grfico muestra la reduccin de la autocorrelacin espacial con la distancia.
El grfico es til para seleccionar el tipo rutina de interpolacin de kernel
simple o Dual, cuando la variable principal es ponderada (ver interpolacin).
Anlisis Distancia
El anlisis de distancia proporciona estadsticos acerca de las distancias
entre los puntos o localizaciones. Esta tcnica es til para identificar el grado
de cluster de puntos. Algunas veces es llamado anlisis de segundo orden.
El anlisis de distancia se presenta en dos pestaas o ventanas diferentes,
anlisis de distancia I y anlisis de distancia II. En la primera ventana hay
dos rutinas para describir las propiedades de las distancias. Y la segunda hay
cuatro rutinas para calcular distancia de matrices.
Anlisis de distancia I

23

En esta seccin se calculan las rutinas de anlisis de vecinos ms cercanos


(Nearest Neighbor Analysis) y el estadstico K de Ripley "K" (Ripleys "K"
Statistic).
Anlisis de vecinos ms cercanos (Nna)
El ndice del vecino ms cercano ofrece una aproximacin acerca de si los
puntos estn ms agrupados o dispersos de acuerdo a lo que puede esperarse
basado en la aleatoriedad. Se compara la distancia promedio de otros puntos
ms cercanos (vecino ms cercano), con la distancia esperada espacialmente
aleatorizada dividiendo el promedio emprico de la distancia del vecino ms
cercano por la distancia esperada (ndice de vecino mas cercano).
La rutina del vecino ms cercano requiere que el rea geogrfica y la distancia
directa ingresen o se indiquen en la ventana "Measurement Parameters". La
rutina Nna calcula 10 estadsticos:
1. El tamao de la muestra.
2. La distancia media del vecino ms cercano.
3. La desviacin estndar de la distancia del vecinos ms cercanos.
4. La distancia mnima.
5. La distancia mxima.
6. La distancia media aleatorizada (tanto el rectngulo acotado, como
para el rea introducida por el usuario, si es proporcionada).
7. La distancia media dispersa (tanto el rectngulo acotado, como para el
rea introducida por el usuario, si es proporcionada).
8. El ndice del vecinos ms cercanos (tanto el rectngulo acotado, como
para el rea introducida por el usuario, si es proporcionada).
9. El error estndar del ndice del vecino ms cercanos (tanto el rectngulo
acotado, como para el rea introducida por el usuario, si es proporcionada).
10. Una prueba de significacin para el ndice de los vecinos ms cercanos
(Z-test).
24

Los resultados pueden imprimirse, salvarse como archivo de texto o archivo dbf.
Nmero de vecinos ms cercanos
El K-simo ndice del vecino mas cercano compara la distancia promedio
del K-simo punto ms cercano con la distancia esperada espacialmente aleatorizada. Si ms de una vecindad cercana sera calculada, el usuario puede
indicar el nmero K de vecindades cercanas a calcular. CrimeStat calcular
3 estadsticos para cada orden especificado:
1. La distancia media del vecinos ms cercano en metros para el orden.
2. La distancia esperada del vecino ms cercano en metros para el orden.
3. El ndice del vecinos ms cercanos para orden.
La rutina Nna usar el rea definida por usuario, a menos que esta no
se proporcione, en cuyo caso se usar el rectngulo acotado. Los resultados
tabulares se pueden imprimir, salvarlo como un archivo de texto o como archivo .dbf.
Anlisis del vecino lineal ms cercano
El ndice lineal del vecino ms cercano proporciona una aproximacin en
cuanto a si los puntos estn mas cercanos o dispersado a lo largo caminos de
segmentos, de lo que se esperara en condiciones aleatorias. Seleccionando la
distancia indirecta (Manhattan) e introduciendo la longitud total de la red de
camino, en la ventana parmetros de medida (Measurement Parameters), la
rutina Nna calcular el vecino lineal ms cercano calcular (cuando la casilla
est marcada). El ndice del vecino lineal ms cercano es la relacin emprica
del promedio de distancia del vecino lineal ms cercanos con la distancia
lineal esperada al azar. La rutina Nna calcula 9 estadsticos para los ndice
del vecinos lineales ms cercanos:
1. El tamao de la muestra.
2. La distancia media lineal del vecinos ms cercanos en metros, pies y
millas.
25

3. La distancia mnima entre los puntos a lo largo de una red grill (red de
rejilla).
4. La distancia mxima entre los puntos a lo largo de una red grill (red
de rejilla).
5. La distancia media lineal aleatoria.
6. El ndice del vecino lineal ms cercano.
7. La desviacin estndar de la distancia del vecino lineal ms cercanos
en metros, pies y millas.
8. El error estndar del ndice del vecinos lineal ms cercano.
9. Una prueba "t" de la diferencia entre la distancia emprica y la esperada
del vecino lineal ms cercanos.
Nmero de vecino lineal ms cercano
La rutina Nna puede calcular el K-simo vecino lineal ms cercanos, y
comparar esta distancia con el promedio de la distancia lineal del K-simo
punto ms cercano con la distancia esperada espacialmente aleatorizada.
Si es necesario ms de un vecino lineal ms cercano a calcular, el usuario
puede indicar el nmero de K de vecinos lineal ms cercanos. CrimeStat
calcular 3 de estadsticas para cada orden especifico:
1. La distancia media del vecinos lineal ms cercano en metros para el
orden.
2. La esperanza del vecinos lineal ms cercano en metros para el orden.
3. El ndice del vecino lineal ms cercano para el orden.
Correccin de borde del vecino ms cercano
La rutina del anlisis del vecino ms cercano (rea o lineal) no se ajusta
para subestimar incidentes cerca de la frontera en la zona de estudio. Es
posible que haya vecinos cercanos fuera de los lmites que estn ms cerca
que la medida o valor del vecino cercano. El anlisis del vecino ms cercano
tiene tres opciones para correccin borde:
26

1. No ajustado - Por defecto.


2. Ajuste por rea de estudio como rectngulo.
3. Ajuste por rea de estudio como crculo.
La correccion de borde rectangular o circular ajustan la distancia del vecino ms cercano a puntos cerca de la frontera. Si un punto est ms cerca
del borde (en rectngulo o crculo) que a la distancia medida del vecino ms
cercano, entonces la distancia de borde es tomada como la distancia ajustada
del vecina ms cercano.
Estadstico K de Ripley
El estadstico de Ripleys compara el nmero de puntos en cualquier distancia con nmero esperado espacialmente aleatorio. La cuenta emprica es
transformada en funcin de raz cuadrada, llamada L, y es ajustada a la orientacin. Los valores L mayores al lmite superior de las simulaciones indican
concentracin, mientras que valores menores al lmite inferior de las simulaciones indican dispersin. El valor L es calculado para cada 100 intervalos de
distancia (bins). Esta rutina calcula es 6 estadsticos:
1. El tamao de la muestra.
2. La distancia mxima.
3. 100 distancia bins.
4. La distancia para cada bin.
5. El estadstico transformado, L(t), para cada distancia bin.
6. La esperanza aleatorizada L, bajo completa aleatoriedad espacial, L(csr).
Adems, CrimeStat puede estimar la distribucin de muestreo ejecutando
simulaciones de Monte Carlo espacialmente aleatoriazada sobre el rea en
estudio. Si se especfica una o ms simulaciones, la rutina calcula seis
estadsticos adicionales:
7. El valor mnimo de L para las simulaciones espacialmente aleatoria.
27

8. El mximo valor de L para las simulaciones espacialmente aleatoria.


9. El percentil 0.5 para el valor L de las simulaciones espacialmente aleatoria.
10. El percentil 2,5 para el valor L de las simulaciones espacialmente aleatoria.
11. El percentil 97,5 para el valor L de las simulaciones espacialmente aleatoria.
12. El percentil 99,5 para el valor L de las simulaciones espacialmente aleatoria.
Los resultados tabulares pueden imprimirse, salvarse como archivo texto
o como archivo .dbf.
Correccin borde del estadstico Ripleys K
La configuracin predeterminada (por defecto) para el estadstico Ripleys
K es no ajusta a casos cerca de la frontera en zona de estudio. Sin embargo,
es posible que haya puntos fuera del rea de estudio que estn ms cerca
que el radio de bsqueda que se utiliza para enumerar el K estadstico. El
estadstico K Ripley tiene tres opciones de correccin borde:
1. Sin ajuste - Por defecto
2. Un ajuste que asume el rea de estudio como un rectngulo.
3. Un ajuste que asume el rea de estudio como un crculo.
La correccion de borde rectangular o circular, para ajustar del estadstico
K Ripley en puntos cerca de la frontera. Si la distancia de un punto a la frontera (de un rectngulo o un crculo) es ms pequea que el radio del crculo
usado para enumerar los K estadsticos, entonces el punto es ponderado inversamente proporcional al rea del radio de bsqueda que est dentro de la
frontera.
Salida de resultados intermedios

28

Hay una casilla denominada salida de resultados intermedios (Output


intermediate results). Al seleccionada esta casilla, la salida muestra como un
archivo ".dbf"que enlista los clculos intermedios. El archivo recibe el nombre
de RipleyTempOutput.dbf"; y la salida ofrece cinco resultados:
1. El nmero de puntos (POINT), comenzando en 0 (para el primer punto)
y hasta a el N-1 (para el N-sima punto).
2. El radio de bsqueda en metros (SEARCHRADI)
3. La cuenta o nmero de otros puntos que se encuentran dentro del radio
de bsqueda (COUNT)
4. El peso asignado, calculando las ecuaciones 5,24 5,28 (WEIGHT).
5. The count times the weight (CTIMESW)
Asignar puntos primarios a puntos secundarios
Esta rutina asigna a cada punto primario un punto secundario, luego suma el nmero de puntos primarios asignados a cada punto secundario. Es til
para aadir el nmero de los puntos primarios que estn cerca de cada punto
secundario. For example, in the crime travel demand module, this routine
can assign incidents to zones as the module uses zonal totals. El resultado es
una cuenta de puntos primarios asociado con cada punto secundario. Tambin es posible sumar diferentes variables secuencialmente. Por ejemplo, en el
mdulo demanda viajes de crimen, tanto el nmero de delitos originarios en
cada zona, como el nmero de crmenes que ocurren, son necesarios. Esto se
puede lograr de dos maneras. Primero, sumando los incidentes por coordenadas de origen en cada zona (secundaria archivo), y en segundo lugar, sumar
de los incidentes por coordenadas de destino de cada zona (tambin archivo
de secundaria). El resultado sern dos columnas, una muestra el nmero de
orgenes en cada zona del archivo secundaria y el segundo muestra el nmero
de destinos en cada zona del archivo secundaria.
Mtodos de asignacin: Hay dos mtodos para asignar puntos primarios
a los puntos secundarios.
Asignacin del vecino ms cercano

29

Esta rutina asigna a cada punto primarios los puntos secundarios que
estn ms cerca. Si hay dos o ms puntos secundarios que son exactamente
iguales, la asignacin va al primero en la lista.
Asignacin de Puntos - en - polgono
Esta rutina asigna a cada punto primario el punto secundario que cae
dentro de su polgono (zona). Deben proporcionarse un archivo shape (polgono) de la zona y la rutina comprueba dentro qu zona secundaria cae
dentro cada punto primario.
Archivo de zona
Un archivo de zona debe ser proporcionado. Esto es un archivo polgono
que define la zona en que los puntos primarios son asignados. El archivo de
zona debe ser como el archivo de secundaria (ver en archivo de secundaria).
Para cada punto en el archivo primario, la rutina identifica a cual polgono
pertenece y luego suma el nmero de puntos por polgono.
Nombre asignado a la variable
Debe especificar el nombre de la variable suma. Por defecto el nombre es
FREQ.
Uso de un archivo de ponderacin
Los registros del archivo primario pueden ser ponderados por otro archivo. Esto ser til para corregir los totales del archivo primario. Por ejemplo,
si suponemos que en el archivo primario los incidentes de robo corresponden
a un registro de detencin o arresto, la suma de esta variable (por ejemplo, el
nmero total de robos) puede producir un sesgo en la distribucin sobre las
zonas del archivo secundario, debido a que el archivo principal no proviene
de una muestra tomada al azar de todos los incidentes (por ejemplo, si esta
informacin proviene de un registro de detencin donde la distribucin de
detenciones de robo, no es igual a la distribucin de todos los incidentes de
robo).
El segundo archivo o cualquier otro archivo puede ser usado para ajustar
30

la suma total. La variable ponderacin debe tener un campo que identifique


la proporcin o cociente de la verdadera cuenta medida para cada zona. Un
valor de 1 indica que el valor suma para cada zona es igual al valor real, por lo
que no es necesario un ajuste. Un valor superior a 1 indica que el valor suma
debe ser ajustado hacia arriba igualar el verdadero valor. Un valor inferior a
1 indica que el valor suma necesita ser ajustardo hacia abajo para igualar el
verdadero valor.
Si se utiliza otro archivo para ponderacin, debe indicar el nombre del
archivo, ya sea el secundario cualquier otro archivo.
Nombre asignado a la variable ponderada
Para una suma ponderada, especifique el nombre de la variable. Por defecto ser FREQADJ.
Almacenar el resultado
Para ambas rutinas, la salida es un archivo .dbf. Debe definir el nombre del archivo. Nota: Debe tener cuidado con el uso del mismo nombre del
archivo secundario, como el archivo salvado ya que tendr la nueva variable.
Lo mejor es darle un nuevo nombre.
Una nueva variable ser aadida a este archivo que da el nmero de
puntos primarios en cada zona de archivo secundario y, si la ponderacin se
utiliza, una segunda variable ser aadida la cual tiene la frecuencia ajustada.
Distancia Anlisis II
La pestaa del Anlisis de Distancia II (Distance Analysis II), abre una
ventana que presenta cuatro rutinas para calcular la matrices distancia:
1. De cada punto primario a cualquier otro punto primario.
2. de cada punto primario a cada punto secundario.
3. De cada punto primario al centroide de cada clula de rejilla del archivo
de referencia. Esta requiere definir un archivo de referencia.
31

4. De cada punto secundario al centroide de cada clula de rejilla del


archivo de referencia. Esta requiere definir un archivo de referencia.
CrimeStat puede calcular las distancias entre los puntos de un solo archivo o las distancias entre los puntos de dos archivos diferentes. Estas matrices
pueden ser tiles para examinar la frecuencia de diferentes distancias o para
proveer la matriz distancia a otro programa.
Matriz distancia: Dentro de un mismo archivo, punto a punto (Matrix)
Esta rutina da como resultado la matriz distancia entre los puntos del archivo primario, en unidades de distancia especificas (kilmetros, millas nuticas, pies, kilmetros o metros). La Matiz salida puede guardarse como un
archivo distancia de CrimeStat, que puede ser usado para acelerar los clculos
en bruto. La matriz de salida tambin puede ser guardado como archivo texto.
Matriz distancia: De los puntos del archivo primario a los puntos del archivo secundaria (IMatrix)
Esta rutina muestra la distancia entre cada punto del archivo primario a
cada uno de los puntos del archivo secundario, con unidad de distancia especificas (kilmetros, millas nuticas, los pies,kilmetros o metros). La salida
IMatrix se puede guardar como un archivo distancia de CrimeStat, que puede
ser usado para acelerar los clculos en bruto. La salida IMatrix tambin se
pueden guardar como archivo texto.
Matriz distancia: De los puntos del archivo primarios a la rejilla (PGMatrix)
Esta rutina muestra la distancia entre cada punto del archivo principal al
centroide de cada celda de rejilla o cuadrcula del archivo referencia. El archivo de referencia debe proporcionarse como externo o definirse en la ventana
correspondiente al archivo referencia en CrimeStat. Las unidades de distancia debe ser e especificadas (kilmetros, millas nuticas, pies, kilmetros o
metros). La salida puede guardarse como un archivo distancia de CrimeStat;
puede ser usado para acelerar el clculo en bruto. La salida tambin se pueden guardar como un archivo texto.

32

Matriz distancia: De los puntos del archivo secundarios a la rejilla (SGMatrix)


Esta rutina muestra la distancia entre cada punto del archivo secundaria
al centroide de cada celda de la cuadrcula del archivo referencia. El archivo de referencia debe proporcionarse como externo o definirse en la ventana
correspondiente al archivo referencia en CrimeStat. Igualmente las unidades
de distancia deben ser especificadas (kilmetros, millas nuticas, pies, kilmetros o metros). La salida tambin se pueden guardar como un archivo
texto.
Anlisis de puntos o zonas calientes I (Hot Spot)
El anlisis de puntos o zonas calientes (Hot Spot o clusters) identifica los
grupos con incidentes semejantes. Este es un mtodo de anlisis de segundo
orden que identifica el grupo a que pertenecen los puntos. Hay una serie de
rutinas diferentes para analizar zonas calientes en CrimeStat, organizadas en
dos pestaas diferentes: Anlisis de zonas calientes I (Hot Spot I) y Anlisis
de zonas calientes II (Hot Spot anlisis II)
Anlisis de zonas calientes I (Hot Spot I)
El anlisis de zonas calientes I incluye cuatro rutinas diferentes:
1. El modo (modo).
2. El modo difuso (Fmode).
3. Cluster jerrquica del vecino ms cercano (Nnd).
4. Ajuste del riesgo del cluster jerrquica del vecino ms cercano (Rnnh),
El Modo
La rutina del Modo (Mode) calcula la frecuencia de incidentes para cada
localizacin, definida por las coordenadas X e Y. La salida ser una lista de
las localizaciones con sus coordenadas X e Y, y el nmero de incidentes ocurridos en cada una de ellas, clasificadas en orden decreciente, de la frecuencia
mas alta a la frecuencia mas baja. Tambin enlista su orden de rango de 1
33

hasta la ltima localizacin. La data puede salir como un archivo dbf.


Modo Fuzzy
El modo difuso (Fuzzy Mode) calcula la frecuencia de incidentes para cada localizacin dentro de la distancia especificada por el usuario. El usuario
debe especificar el radio de bsqueda y las unidades del mismo (kilmetros,
millas nuticas, pies, kilmetros, metros). La rutina identifica la unicidad de
cada localizacin, definida por sus coordenadas X e Y, y calcular el nmero
de incidentes que caen dentro del radio de bsqueda. La salida es una lista
de las localizaciones con sus coordenadas X e Y, y el nmero de incidentes
ocurridos a dentro de cada radio de bsqueda, adems las clasifica en orden
decreciente desde le ms frecuente a menos frecuente. Asimismo, enlista su
rango ordenado de 1 a la ltima localizacin. Los resultados pueden salir
como un archivo .dbf.
Cluster jerrquico espacial del vecino ms cercanos (Nnh)
El clustering jerrquico espacial del vecino ms cercanos (neighbor hierarchical spatial clustering) es una rutina que usa una distancia constante para
formar los clusters de puntos, basado en la proximidad espacial. El usuario
debe definir la distancia y el nmero mnimo de puntos que se requieren para
cada grupo, y una salida para mostrar el tamao de los grupos con elipses.
La rutina identifica las agrupaciones de primer orden, que representan grupos de puntos que estn mas cerca, y en el que hay por lo menos el nmero
mnimo de puntos especificados por el usuario. El clustering es jerrquica en
sentido de que las agrupaciones de primer orden son tratados como puntos
separados, para ser agrupados en un segundo orden de clusters, y el segundo
orden de agrupaciones son tratadas igualmente como puntos separados, que
se agrupan en un tercer orden de clusters, y as sucesivamente. Los clusters
de orden superior sern identificados slo si la distancia entre sus centros esta
ms cerca que la nueva de distancia.
Los resultados tabulares pueden imprimirse, salvarse como archivo texto,
o como archivo dbf. Adems, los resultados pueden salir como objetos grficos tipo elipses o cpsulas convexas (o ambos) para ArcView .shp, MapInfo
.mif o Atlas*GIS .bna. Debe seleccionar los nombres por separado para
los archivos de elipse y casco convexo.
34

Esta rutina ofrece seis resultados para cada clusters que se calcula:
1. El orden jerrquico y el nmero de clusters.
2. La media central del clusters (media X, media Y).
3. El elipse de desviacin estndar del cluster (la rotacin y longitud de
los ejes X e Y).
4. El nmero de puntos en el cluster.
5. El rea del cluster.
6. La densidad del cluster (puntos divididos por rea).
Distancia umbral del Nnh
La distancia umbral es el radio de bsqueda alrededor de un par de puntos. Para cada par de puntos, la rutina determina si ellos estn ms cercanos
que el radio de bsqueda. Hay dos formas para determinar el radio de bsqueda o distancia (Nnh threshold distance):
La distancia aleatoria del vecino ms cercana
En primer lugar, la distancia de bsqueda es elegida al azar de la distancia del vecinos ms cercano. Por defecto el valor es igual a 0,1 (es decir,
menos del 10 % de los pares se puede esperar que se encuentren ms cerca por
casualidad). Los Pares de puntos que estn ms cerca que la distancia umbral
se agrupan, mientras que los pares de puntos que estn a mayor distancia
que la distancia umbral se ignoran. Cuanto menor sea el nivel de significacin
que se ha seleccionado, menor es el umbral de la distancia y, por lo general, el
menor es nmero de pares que sern seleccionados. Por otra parte, la eleccin
de un nivel mayor de significacin, ms grande es distancia umbral y, por lo
general, ms parejas de puntos sern seleccionados. Sin embargo, cuanto ms
alto es el nivel de significacin elegido, mayor ser la probabilidad de que los
clusters sean agrupados al azar.
La barra deslizante se utiliza para ajustar el nivel de significacin. Moviendo la barra deslizante hacia la izquierda se elige una distancia umbral
35

menor, y hacia la derecha para elegir una distancia umbral mayor.


Distancia fija
En segundo lugar, se puede usar una distancia fija. Por defecto es de una
milla. En este caso, el radio de bsqueda utiliza la distancia fija y la barra
deslizante es inoperante.
Nmero mnimo de puntos Nnh
Esta pestaa permite al usuario especificar el nmero mnimo de puntos
para cada grupo. El valor por defecto es 10 puntos. Las restricciones sobre el
nmero de clusters puede ser colocado mediante la definicin de un nmero
mnimo de puntos que son requeridos. Si hay muy pocos puntos permitidos,
entonces habr muchos grupos pequeos, y al aumentar el nmero de puntos
requeridos, el nmero de clusters se reduce.
Salida de Elipse
Los resultados pueden salir como objetos grficos en forma de elipse, en
formato de archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna.
El prefijo ser NNH1 para la elipse de primer orden, NNH2 para las elipses
de segundo orden elipses, y "NNH3 para la elipse tercer orden. Para elipses
de orden mayor incluirn slo el nmero ndice.
El tamao de elipse Nnh
El tamao del cluster puede ser ajustado con la barra deslizante en la parte inferior de la ventana, especificando el nmero de desviaciones estndar del
elipse: una desviacin estndard (1X), desviacin estndar y media (1.5xy), o
dos desviaciones estndar (2X). Por defecto el valor es igual a una desviacin
estndar. Generalmente, una desviacin estndar cubrir ms de la mitad
de los casos, mientras que dos desviaciones estndar cubrir ms del 99 %
de los casos, aunque el porcentaje exacto depender de la distribucin. Para
seleccionar el nmero de desviaciones estndar para las elipses, use la barra
deslizadora. Los archivo de salida se guarda como NND<nmero><root name>; el nmero es el orden del clustering (es decir, 1, 2), el nombre debe ser
proporcionado por el usuario.
36

Las restricciones sobre el nmero de clusters puede ser definidos por el


nmero de puntos requeridos. El valor por defecto es 10. Si se elige un nmero
muy pequeo de puntos, entonces habr muchos grupos pequeos; si embargo, al aumentar el nmero de puntos por requeridos, el nmero de clusters
se reducir.
Salida de cluster como capsula convexa
Tambin los clusters pueden mostrarse como objeto grafico en forma de
capsula convexa en archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS
.bna. El nombre del archivo de salida debe especificarse, este saldr con un
prefijo CNNH1 para el primer orden de agrupacin, un CNNH2 para el
segundo orden, CNNH3 para la agrupacin de tercer orden. Para clusters de
mayor orden slo incluirn el nmero ndice. Debe especificarse un nombre
para el archivo.
Ejecutando la simulacin Nnh
Mediante una simulacin de Monte Carlo se puede estimar una aproximacin por intervalo de confianza alrededor del clusters de primer orden de
Nnh; para el cluster de segundo orden y los orden superior no son simuladas,
ya que su estructura depende del cluster de primer orden. El usuario debe
especifica el nmero de corridas para simulacin y Cluster Nnh es calculado
para datos asignados en forma aleatoriamente. La salida aleatoria es ordenada y se calculan los percentiles. La salida incluye los clusters de primer orden,
el rea, el nmero de puntos, y la densidad. Doce percentiles son identificados
para estas estadsticas:
1. El Mnimo para las simulaciones espacialmente aleatorias
2. El mximo para las simulaciones espacialmente aleatorias
3. El percentil 0.5 para las simulaciones espacialmente aleatorias
4. El percentil 1 para las simulaciones espacialmente aleatorias
5. El percentil 2.5 para las simulaciones espacialmente aleatorias
6. El percentil 5 para las simulaciones espacialmente aleatorias
37

7. El percentil 10 para las simulaciones espacialmente aleatorias


8. El percentil 90 para las simulaciones espacialmente aleatorias
9. El percentil 95 para las simulaciones espacialmente aleatorias
10. El percentil 97,5 para las simulaciones espacialmente aleatorias
11. El percentil 99 para las simulaciones espacialmente aleatorias
12. El percentil 99,5 para las simulaciones espacialmente aleatorias
Estos percentiles permiten una prueba de significancia de una cola o dos
colas. Por ejemplo, para un 5 % la prueba de una cola utiliza el percentil 95,
mientras que para el 5 % una prueba de dos colas utiliza los percentiles 2.5
y 97.5. La data simulada utilizada pueden ser vista marcando en ventana
Opciones, la casilla Dump simulation data.
Ajuste del Riesgo de clusters espacial jerrquico del vecino ms cercano
(Rnnh)
El ajuste del Riesgo del clusters espacial jerrquico del vecino ms cercano (Rnnh) es una rutina que agrupas los puntos muy cercanos basandose
en la proximidad espacial, pero la agrupacin es ajusta de acuerdo a la distribucin de una variable de referencia. La rutina requiere los dos archivos
primario y secundario,(por ejemplo, robos a mano y el segundo archivo,la
poblacin). En el segundo archivo en caso de usar la variable intensidad o
peso debe ser especificada.
El usuario selecciona una probabilidad umbral para agrupar al azar, un
par de puntos muy cercanos, el mnimo nmero de puntos que se requieren
para cada grupo, y el tamao de salida para mostrar los clusters con elipses.
Adems, un modelo de densidad de kernel para la variable secundaria debe ser especificado. La distancia umbral es determinada por la probabilidad
umbral, y la densidad de celda en la grilla es producida por la estimacin
de densidad del ncleo de la variable secundaria. As, en zonas o reas con
alta densidad de la variable secundaria, la distancia umbral es menor que en
reas con baja densidad en la variable secundaria.

38

La rutina identifica clusters de primer orden, que representa grupos de


puntos que estn muy cercanos con la distancia umbral y en el que se encuentra por lo menos el mnimo nmero de puntos especificados por el usuario. El
clustering es jerrquica en sentido en que las agrupaciones de primer orden
son tratados como puntos separados, para ser agrupados en un segundo orden de clusters, y el segundo orden de agrupaciones son tratadas igualmente
como puntos separados, que se agrupan en un tercer orden de clusters, y as
sucesivamente. El clusters de orden superior es identificado slo si la distancia entre sus centros es menor que la nueva distancia umbral.
Los resultados se pueden imprimir, salvar como archivo texto, o como un
archivo .dbf. Los resultados grficos como elipses o cascos convexo (o ambos)
pueden salir como archivos para ArcView .shp, MapInfo .mif o Atlas*GIS
.bna. Los archivos de salida tanto para elipse como para casco convexo deben tener nombres diferentes.
La rutina muestra seis resultados para cada cluster que calcula:
1. El orden jerrquico y el nmero de agrupacin.
2. La media central del clusters (media X y media Y).
3. El elipse de desviacin estndar del cluster (la rotacin y longitud de
los ejes X e Y).
4. El nmero de puntos en el cluster.
5. El rea del cluster
6. La densidad del cluster (puntos dividido por rea).
Distancia umbral Nnh
La distancia umbral es el intervalo de confianza alrededor de la distancia
esperada (aleatoria) para un par de puntos. Sin embargo, a diferencia de la
rutina Nnh dnde la distancia umbral es constante a lo largo del rea en estudio, en rutina Rnnh la distancia umbral se ajusta inversamente proporcional
a la distribucin de la secunda variable. En las zonas con una alta densidad
en la variable secundaria, la distancia umbral ser pequea, mientras que en
reas con baja densidad en la variable secundaria, la distancia umbral ser
39

mayor. El probabilidad umbral por defecto es de 0,1 (es decir, menos del
10 % de los pares que se espera se encuentren muy cerca bajo). Los Pares
de puntos que estn ms cerca que la distancia umbral se agrupan, mientras
que los pares de puntos que estn a mayor distancia que la distancia umbral
se ignoran. Cuanto menor sea el nivel de significacin que se ha seleccionado,
menor ser la distancia umbral y, por lo general, menor nmero de pares
sern seleccionados. Por otra parte, la eleccin de un nivel mayor de significacin, mayor ser la distancia umbral y, por en general, ms pares sern
seleccionados. Sin embargo, cuanto ms alto sea el nivel significacin elegido,
mayor sera la probabilidad que los clusters sean agrupaciones alzar.
La barra deslizante se utiliza para ajustar el nivel de significacin. Para
elegir una menor distancia umbral mueva la barra deslizante hacia la izquierda y hacia la derecho para escoger una mayor distancia umbral.
Parmetros de riesgo Rnnh
Una estimacin de densidad de la variable secundaria debe ser calculada
para ajustar la distancia de umbral de la variable primaria. Esto se hace a
travs de la estimacin de densidad del kernel. En la pestaa parmetros de
riesgo (risk parameters) se define este modelo. La segunda variable automticamente se asume que debe ser la variable riesgo variable . Si se debe usar
la variable ponderada o intensidad en el archivo secundario, esta debe seleccionarse. El usuario debe especificar el mtodo de interpolation de kernel
(normal, uniforme, quartic, triangular o exponencial negativo), y seleccionar
el ancho de banda (intervalo fijo o adaptable). Si el intervalo de adaptacin es utilizado, el tamao muestra mnimo para el ancho de banda (radio
de bsqueda) debe ser especificado. Si se usa un intervalo fijo, el tamao
del intervalo (radio) debe ser especificado junto con las unidades de medida
(kilmetros, millas nuticas, pies, kilmetros, metros). Por ltimo, las unidades de la densidad para la salida debe ser especificado (millas al cuadrado,
cuadrado millas nuticas, pies cuadrados, kilmetro cuadrado, metros cuadrados).
La rutina superpone una rejilla de 50 x 50 grillas en el rea de estudio y
calcula una estimacin de densidad de kernel de la variable secundaria. La
densidad es entonces re-escalada para igualar el tamao de muestra de la variable primaria. Para cada celda, una distancia umbral especfica es calculada
40

para agrupar en pares de puntos al azar. La probabilidad umbral seleccionada


por el usuario se aplica a esta distancia umbral especfica de cada celda para
producir una distancia umbral que corresponde al intervalo de confianza. Los
pares de puntos que estn ms cercanos que la distancia umbral especfica
de cada celda son seleccionados para el cluster de primer orden.
Nmero mnimo de puntos Rnnh
La casilla mnimo de puntos por clusters (minimum points for clusters)
permite al usuario especificar un nmero mnimo de puntos para cada grupo.
El valor por defecto es 10 puntos. El tamao de salida para los clusters puede
ser ajustado por la segunda barra deslizante, mediante nmero de desviaciones estndar definidas para los elipse; de una desviacin estndar (el valor
predeterminado) a tres desviaciones estndar. Generalmente, una desviacin
estndar cubre aproximadamente el 65 % de los casos, mientras tres desviaciones estndar cubrir ms del 99 % de los casos.
Salida como Elipse
Los resultados se pueden salir como objeto grfico tipo elipse como archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. El prefijo ser
RNNH1 para la elipse de primer orden, RNNH2 para la elipses de segundo
orden, y RNNH3 para la elipse de tercer orden. Para elipse de orden superior
slo cambia el nmero ndice.
Tamao de salida de elipse para Rnnh
La salida del tamao del cluster se puede ajustar en la parte inferior
de la ventana con la barra deslizante. Con la barra deslizadora (number of
standard deviations for the ellipses) se especifica el nmero de desviaciones
estndar del elipse que se calcula para cada cluster: una desviacin estndar,
una desviaciones estndar y media (1.5xy), o dos desviaciones estndar (2X).
Por defecto es una desviacin estndar. Generalmente, una desviacin estndar servirn para cubrir los ms de la mitad de los casos, mientras que dos
desviaciones estndar se cubrir ms del 99 % de los casos, aunque el porcentaje exacto depender de la distribucin. El archivo de salida se guarda
como Rnnh <nmero><root name>. El nmero es el orden del cluster (es
decir, 1, 2), mientras que el nombre raz es proporcionado por el usuario.
41

La restricciones sobre el nmero de clusters puede ser colocado mediante


la definicin del nmero mnimo de puntos necesarios. Por defecto el valor es
10. Si se permiten muy pocos puntos, entonces habr muchos grupos pequeos, y al aumentar el nmero de puntos necesarios, el nmero de clusters se
reducir.
Cluster de salida como capsula convexo
Los cluster tambin pueden salir como objeto grfico tipo cpsula convexa en archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. Debe
especificarse el nombre del archivo, este sale con un prefijo CRNNH1, para
el cluster de primer orden, con CRNNH2 para el cluster de segundo orden, y
CRNNH3 para el cluster de tercer orden; y para clusters de orden superior
slo se cambia el nmero ndice.
Ejecutar una simulacin Rnnh
Una simulacin de Monte Carlo puede ser ejecutar para obtener una estimacin del confianza intervalos de alrededor del cluster de primer orden;
para el cluster de segundo orden y de orden superior no se puede simularse,
ya que su estructura depende del cluster de primer orden. El usuario especifica el nmero de simulaciones a ejecutar y el cluster Rnnh es calculado para
datos asignados al azar. La salida aleatoria es ordenada y los percentiles son
calculaddos. La salida incluye el nmero de cluster de primer orden, el rea,
el nmero de puntos, y la densidad.
Doce percentiles se identifican para estas estadsticas:
1. El mnimo para la simulacin Rnnh
2. El mximo para la simulacin Rnnh
3. El percentil 0,5 para la simulacin Rnnh
4. El percentil 1 para la simulacin Rnnh
5. El percentil 2,5 para la simulacin Rnnh
6. El percentil 5 para la simulacin Rnnh
42

7. El percentil 10 para la simulacin Rnnh


8. El percentil 90 para la simulacin Rnnh
9. El percentil 95 ppara la simulacin Rnnh
10. El 97,5 percentil para la simulacin Rnnh
11. El percentil 99 para la simulacin Rnnh
12. El 99,5 percentil para la simulacin Rnnh
La data simulada que se usa se puede ver marcando la casilla Salida de
la Data simulada Dump Simulation Data en la ventana Optiones.
Anlisis de puntos o zonas calientes II (Hot Spot II)
La pestaa Anlisis puntos calientes II (Hot Spot Analysis II) incluye tres
rutinas diferentes:
1. Anlisis espacio temporal del Crimen (STAC)
2. Cluster de K-Medias
3. Estadstico local de Moran como el de Anselin.
Anlisis espacio temporal del Crimen (STAC)
El anlisis espacio y tiempo del Crimen (Spatial and Temporal Analysis of
Crime) es una rutina de cluster de distancia-variable. Inicialmente los grupos
de puntos cercanos son agrupados sobre la base de un radio de bsqueda
constante, pero luego se combina grupos que se superponen. En la pestaa
"STAC Parameters", se define un radio de bsqueda, el nmero mnimo de
puntos que se requieren para cada grupo, y el tamao de los clusters para
mostrar con elipses. Los resultados pueden ser impresos, guardado en archivo
de texto, como un archivo .dbf, o como objeto grfico tipo elipses o capsula
convexa en formato de archivo para Review .Shp, MapInfo .mif o Atlas*GIS
.bna.
La rutina de seis productos los resultados de cada grupo se calcula que:
1. El orden jerrquico y el nmero de cluster.
43

2. La media central del grupo (media de X y Media de Y).


3. La deviational estndard de elipse del cluster (la rotacin y la longitud
de las X e Y ejes).
4. El nmero de puntos en el cluster.
5. El rea de la elipse.
6. La densidad de la elipse (puntos en elipse dividido por rea).
Parmetros STAC
La pestaa parmetros de STAC (STAC parameters) permite seleccionar
un radio de bsqueda, el nmero mnimo de puntos por clusters, el tipo de
bsqueda, definicin de la frontera, el nmero simulaciones ha ejecutar, y el
tamao de elipses de STAC.
Radio de bsqueda de STAC
El radio de bsqueda es la distancia dentro de la rutina de bsquedas de
STAC. El valor por defecto es de 0,5 millas. Una rejilla de 20x20 cubre el
rea de estudio. En cada interseccin entre fila y columna, la rutina cuenta
todos los puntos que se encuentra a menor distancia que el radio de bsqueda. La superposicin de crculos se combinan para formar cluster de tamao
variables. En Cuanto ms pequeo sea radio de bsqueda seleccionado, menos puntos por clusters sern seleccionados. Por otra parte, la eleccin de
un radio mayor de bsqueda, ms puntos sern seleccionados. Sin embargo,
cuanto mayor sea el radio de bsqueda, mayor ser la probabilidad de que
los cluster puedan ser agrupados al azar. En la pestaa parmetros de STAC
(STAC Parameters), introduzca el radio de bsqueda en la casilla e indique
las unidades de medida (millas, millas, pies, kilmetros, metros).
Tipo de busqueda del STAC
El tipo de busqueda (scan type) es un tipo de rejilla que cubre el rea en
estudio. Hay dos opciones: rectangular (por defecto) y triangular.
Lmite de rea en STAC

44

Los lmites del rea de estudio pueden ser definidas a partir del conjunto
de datos o de la red de referencia.
El nmero mnimo de puntos en STAC
El usuario debe especificar el nmero mnimo de puntos necesarios para
cada cluster (minimum points for clusters). Por defecto son 5 puntos. Si se
elige muy pocos puntos, habr muchos clusters pequeos; sin embargo, aumentar el nmero de puntos requeridos, el nmero de clusters se reducir. En
la pestaa STAC Parmetros, escriba el nmero mnimo de puntos requeridos para cada cluster.
Tamao de salida de elipses para el STAC
El tamao de salida del cluster como elipse puede ser ajustado por la
barra deslizante. La rutina de salida del elipses puede ser una desviacin estndar (1X), desviacin estndar y media (1.5X), y dos deviational estndar
(2X). Generalmente, si los datos tienen distribucion normal, una desviacin
estndar cubrir aproximadamente el 50 % de los casos, mientras que dos
desviaciones estndar cubrir ms de un 99 % de los casos, sin embargo, el
porcentaje real puede diferin.
En la parte inferior de la ventana STAC Parmetros, deslice la barra para
seleccionar el nmero de desviaciones estndar del elipse. El archivo de salida
es guardado como ST<nombre raz>. El nombre raz debe ser proporcionado
por el usuario.
Salida de cluster como Convexo casco
Los cluster tambin pueden salir como objetos grficos tipo cpsulas convexas en formato de archivo para ArcView .shp, MapInfo .mif o Atlas*GIS
.bna. Debe especificar un nombre para el archivo, que saldr con un prefijo
CST.
Ejecutar una simulacin STAC
Una simulacin de Monte Carlo se puede correr para estimar un intervalo
de confianza alrededor del cluster del STAC. El usuario especifica el nmero
45

de simulaciones ha ejecutar y el clustering del STAC es calculado para datos


asignados al azar. La salida es ordenada y los percentiles son calculados. El
resultado incluye el nmero de clusters, el rea, el nmero de puntos, y la
densidad. Doce estadsticos muestra esta rutina:
1. El mnimo de simulaciones.
(The minimum for the spatially random simulations)
2. El mximo de simulaciones.
3. El percentil 0.5 para la simulacin.
4. El percentil 1 para la simulacin.
5. El percentil 2.5 para la simulacin.
6. El percentil 5 para la simulacin.
7. El percentil 10 para la simulacin.
8. El percentil 90 para la simulacin.
9. El percentil 95 para la simulacin.
10. El percentil 97.5 para la simulacin.
11. El percentil 99 para la simulacin.
12. El percentil 99.5 para la simulacin.
Los diez estadsticos permiten una prueba de una o dos colas. Por ejemplo, para un 5 % una prueba de una cola usa el percentil 95, mientras el 5 %
que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. Los datos simulados que se usan pueden ser vistos en la ventana Opciones seleccionando
la casilla Dump simulation data.
Clusters de K-means (KMeans)
La rutina clusters de K-means es un procedimiento para agrupar los puntos en K grupos, donde K es un nmero asignado por el usuario. La rutina
encuentra K lugares, en los que asignan los puntos al lugar ms cercano. Por
defecto el valor es igual a 5. Si K es pequeo, los grupos se suelen cubrir
46

areas muy grandes.


El los resultados tabutares pueden ser impresos, guardados en un archivo
de texto, o salir como archivo dbf. Los resultados grficos puede salir como
elipses o casuplas convexas (o ambos) en formatos de archivos para ArcView
.Shp, MapInfo .mif, Atlas*GIS bna. Los nombres para la elipse y la capsula
convexa deben ser proporcionados por el usuario, de manera separada.
Localizaciones de clusters inicial
La rutina comienza con un supuesto inicial (la semilla) para los K lugares,
y luego lleva a cabo la optimizacin local. El usuario puede modificar la
ubicacin de los clusters iniciales de dos maneras:
1. La separacin entre los clusters iniciales pueden disminucin o incrementarse. Hay una escala de separacin con valores predefinidos de 1
a 10; por defecto el valor es 4; sin embargo, el usuario puede seleccionar cualquier nmero; no obstante, al aumentar el nmero, aumenta
la separacin entre las posiciones de los cluster iniciales, mientras que
disminuyendo el nmero, disminuye la separacin.
2. El usuario tambin puede definir las localizaciones iniciales y el nmero
k de clusters, con el archivo de secundario. La rutina toma el nmero
de puntos del archivo secundario y las coordenadas X/Y de los puntos
como las posiciones iniciales de los k clusters iniciales.
Tamao de salida de los clusters de K-means como elipses
Para ambos mtodos, el tamao de salida del cluster como elipses puede
ser ajustado por la barra deslizante. El resultado de la rutina puede salir como
elipses con una desviacin estndar (1X), con desviacin y media (1.5X), y
con dos deviational estndar (2X). Generalmente, si los datos estn distribuidos aleatoriamente, una desviacin estndar cubrir aproximadamente el
50 % de los casos, mientras que dos desviaciones estndar cubrir del 99 %
de los casos, sin embargo, los porcentajes reales pueden variar.
Deslice la barra para seleccionar el nmero de desviaciones estndar de la
elipse. El archivo de salida es guardado como KM<root name>. El nombre
47

raz debe ser proporcionado por el usuario.


Salida de los clusters como casco Convexo
Los clusters tambin pueden salir como casco convexo en archivo para
ArcView shp, MapInfo mif o ATLAs*SIG bna. Debe especifique el nombre
del archivo, el cual saldr con un prefijo CKM.
Estadstico Local de Anselin
El estadstico local de Moran Anselin (Anselins local Moran) aplica el
estadstico I de Moran a puntos individuales (o zonas), para evaluar si puntos
(o zonas) estn espacialmente relacionados con puntos cercanos (o zonas vecinas). El estadstico requiere de una variable intensidad en el archivo principal.
A diferencia del estadstico global de Moran I, el estadstico local Moran es
aplicado a cada punto en forma individual (o zona). El ndice indica clustering o dispersin en relacin con la vecindad local. Los puntos (o zonas) con
valores altos del ndice I, tienen intensidad ms alto que sus vecinos, mientras
que los puntos con valores bajos tienen intensidad ms abajo que sus vecinos.
La salida puede se impresa o salir como archivo .dbf.
Ajuste para pequeas distancias
Las pequeas distancias se ajustan de manera que la mxima ponderacin no sea superior a 1. Esto asegura que el ndice local I, no se haga
excesivamente grande para los puntos muy cercanos. Esta es la configuracin
predeterminada.

1.2.3.

Modelado Espacial III

Crimestat en la ventana modelado espacial presenta cuatro pestaas, de


las cuales dos exponemos: estimacin de densidad de kernel y anlisis de
espacio-tiempo, las dems no se trataran en este trabajo, pero puede obtener
informacin en, si desea investigar puede revisar la la notas (se tratara muy
elemental de manera simple, en la calibracin y la estimacin del viaje a la
delincuencia).

48

Interpolacin
La pestaa interpolacin (interpolation) permite estimar la densidad de
punto usando el mtodo suavizado densidad kernel. Hay dos tipos de suavizado de densidad del kernel: el simple, aplicado a una sola distribucin de los
puntos; y el dual, aplicado a dos distribuciones diferentes. Cada tipo tiene
variaciones sobre el mtodo que se pueden seleccionar. Ambos tipos requieren de un archivo de referencia, que es superpuesto sobre la zona de estudio
(ver archivo de referencia). Las variables intensidad y ponderacin pueden
ser usadas en la estimacin de kernel. Las densidades pueden convertirse en
probabilidades.
La interpolacin es una tcnica para generalizar localizaciones del incidente en todo el rea de estudio. Mientras las tcnicas de distribucin espacial
y puntos caliente proporciona los resmenes estadsticos para los incidentes
de los datos en s mismos, la tcnica de la interpolacin generalizan esos
incidentes de los datos a toda la regin. Particularmente, proporcionan las
estimaciones de densidad para todas las zonas de la regin (es decir, en cualquier localizacin).
La estimacin de la densidad es una variable de la intensidad, un valor
Z(), que se estima una localizacin particular. Por lo tanto, puede ser visualizada en los mapas de la superficie o en mapas de contorno que demuestran
la intensidad en todos los lugares o localizaciones.
Estimacin de densidad de kernel simple (KernelDensity)
La rutina densidad de kernel simple (kernel density estimates single) estima la densidad de punto para una distribucin simple, colocando una superficie simtrica sobre cada punto (superposicin), evaluando la distancia
del punto a cada celda de referencia por la funcin kernel, y sumando las
evaluaciones en cada celda de referencia.
Archivo ha interpolar
La estimacin puede aplicarse a cualquier archivo tanto al principal como
al secundario. Debe seleccione el archivo a ser interpolado. Por defecto es el
archivo primario
49

Mtodo de interpolacin
Hay cinco tipos de kernels que pueden ser utilizados para estimar la distribucin de densidad de los puntos. Cuatro de las cinco distribuciones superponen un crculo alrededor de cada celda o cuadrcula y asigna ponderaciones
a los puntos dentro de las celdas o cuadrcula. Los cinco tipos varan en las
ponderaciones que asignan a los puntos cercanos:
Kernel que asigna ponderaciones a todo el rea en estudio
1. El kernel normal superpone una distribucin normal en cada punto, que
luego se extiende sobre toda el rea en estudio definida por el archivo
de referencia. Esta es la funcin kernel por defecto. La distribucin se
extiende en todas direcciones y es limitado nicamente por el rea en
estudio.
Kernels que asignar ponderaciones en un crculo especfico
2. El kernel uniforme asigna igual ponderacin a todos los puntos dentro
del crculo.
3. El kernel quartic superpone una superficie en forma de campana invertida que se extiende slo para una distancia limitada en cada punto;
las ponderaciones para los puntos dentro del crculo disminuyen con la
distancia gradualmente (poco a poco).
4. El kernel triangulado (o cnico) superpone un cono en cada celda de la
cuadrcula; Los pesos para puntos dentro del crculo disminuyen constantemente con la distancia (coherentemente).
5. El kernel exponencial negativo superpone una funcin disminuyendo
drsticamente sobre cada celda de la cuadrcula; las ponderaciones de
los puntos dentro del crculo disminucin muy rpidamente con la distancia.
Los cinco mtodos producen resultados similares, aunque el kernel normal
es generalmente ms suave para cualquier ancho de banda.
Eleccin del ancho de banda

50

Los kernels son aplicados a una distancia de bsqueda limitada, denominado ancho de banda. Para el kernel normal, el ancho de banda es la
desviacin estndar de la distribucin normal. Para el kernel uniforme, quartic, triangular y exponencial negativo, la amplitud o ancho de banda es el
radio de un crculo para la distancia de bsqueda. Para todos los tipos de
kernels, un ancho de banda grande produce estimaciones de densidad ms
suave. Tanto el ancho de banda adaptable como el fijo pueden ser seleccionados.
Ancho de banda Adaptable
La distancia ancho de banda adaptable es identificada por el nmero mnimo de puntos encontrados dentro del crculo dibujado alrededor de un slo
punto. Un crculo es colocado alrededor del punto, a su vez, y el radio se
aumenta hasta que se alcanza el tamao de muestra mnimo; de esta forma
cada punto tiene un intervalo de ancho de banda diferente.
El ancho de banda es la configuracin por defecto. El usuario puede modificar
el tamao de muestra mnimo, que por defecto es igual a 100 puntos.
Ancho de banda fijo
La distancia ancho de banda fija es un intervalo fijo para cada uno de los
puntos. El usuario puede definir el intervalo y las unidades distancia en que
se calcula (millas, millas, pies, kilmetros, metros).
Unidades de rea
Debe especificar las unidades de densidad como puntos por milla cuadrada, por millas nuticas cuadradas, por pies cuadrados, por kilmetros
cuadrados, o por metros cuadrados. Las unidades por defecto son puntos por
milla cuadrada.
Uso de una variable intensidad
Debe marcarse la variable intensidad, si ha de ser interpolada.
Uso una variable ponderacin
Debe marcarse la variable ponderacin, si ha de ser interpolada.

51

Clculo de densidad de probabilidades o densidad


La densidad estimada para cada celda se puede calcular de tres maneras:
1. Densidad absoluta. Este es el nmero de puntos por celda de la cuadrcula y se escala de tal forma que la suma de todas las celdas sea igual
al tamao de la muestra.
2. Densidad relativa. La densidad absoluta de cada celda en la cuadrcula
es dividida por el rea de la celda; y la salida se expresa en unidades
cuadradas (por ejemplo, puntos por millas cuadradas).
3. Probabilidades. Esta es la proporcin de todos los incidentes que ocurren en la celda. La suma de todas las cedas es igual a 1, equivale a la
probabilidad.
Debe seleccione el tipo de estimacin de la densidad: densidad absoluta,
densidad relativa, o probabilidades, la salida es para cada celda. Por defecto
es densidad absoluta.
Salida
Si el archivo de referencia es externo o creado por Crimestat, los resultados pueden salir como archivo para Surfer for Windows o como archivo
para ArcView .Shp, MapInfo .mif, Atlas*Gis .bna; y para ArcView Spatial Analyst slo si el archivo de referencia es creado por CrimeStat.
Estimacin de la densidad de kernel dual (DuelKernel)
La rutina de estimacin de densidad de kernel dual (Dual kernel density
estimate) compara dos distribuciones diferentes que involucran los archivos
primario y secundario. As, es necesario definir los archivos primario y secundario.
La comparacin permite la relacin entre el primer archivo dividido por
el segundo archivo, el logaritmo de la relacin (cociente) entre el primer archivo dividido por el segundo archivo, la diferencia entre el primer archivo y
segundo (es decir, el primer archivo - segundo archivo), o la suma del primer
52

archivo y el segundo.
Archivo ha interpolar
Debe identificarse los archivos que ocupan la categora de principal y secundario en la interpolacin. Por defecto el principal es el archivo primario
y secundario es el archivo secundario.
Mtodo de interpolacin
Hay cinco tipos de distribuciones de kernels que pueden ser utilizados para estimar la densidad de puntos. Cuatro de los cinco superponen un crculo
alrededor de cada celda y asigna ponderaciones a los puntos dentro de la celda. Los cinco tipos varan en las ponderaciones que asignan puntos cercanos:
Kernel que asigna ponderaciones a todo el rea en estudio
1. El kernel normal superpone una distribucin normal en cada punto, que
luego se extiende sobre toda el rea en estudio definida por el archivo
de referencia. Esta es la funcin kernel por defecto. La distribucin se
extiende en todas direcciones y es limitado nicamente por el rea en
estudio.
Kernels que asignar ponderaciones en un crculo especfico
2. El kernel uniforme asigna igual ponderacin a todos los puntos dentro
del crculo.
3. El kernel quartic superpone una superficie en forma de campana invertida que se extiende slo para una distancia limitada en cada punto;
las ponderaciones para los puntos dentro del crculo disminuyen con la
distancia gradualmente (poco a poco).
4. El kernel triangulado (o cnico) superpone un cono en cada celda de la
cuadrcula; Los pesos para puntos dentro del crculo disminuyen constantemente con la distancia (coherentemente).
5. El kernel exponencial negativo superpone una funcin disminuyendo
drsticamente sobre cada celda de la cuadrcula; las ponderaciones de
los puntos dentro del crculo disminucin muy rpidamente con la distancia.
53

Los cinco mtodos producen resultados similares, aunque el kernel normal


es generalmente ms
Eleccin del ancho de banda
Los kernels son aplicados a una distancia de bsqueda limitada, denominado ancho de banda. Para el kernel normal, el ancho de banda es la
desviacin estndar de la distribucin normal. Para el kernel uniforme, quartic, triangular y exponencial negativo, la amplitud o ancho de banda es el
radio de un crculo para la distancia de bsqueda. Para todos los tipos de
kernels, un ancho de banda grande produce estimaciones de densidad ms
suave. Tanto el ancho de banda adaptable como el fijo pueden ser seleccionados.
Ancho de banda Adaptable
La distancia ancho de banda adaptable es identificada por el nmero mnimo de puntos encontrados dentro del crculo dibujado alrededor de un slo
punto. Un crculo es colocado alrededor del punto, a su vez, y el radio se
aumenta hasta que se alcanza el tamao de muestra mnimo; de esta forma
cada punto tiene un intervalo de ancho de banda diferente.
El ancho de banda es la configuracin por defecto. El usuario puede modificar
el tamao de muestra mnimo, que por defecto es igual a 100 puntos.
Ancho de banda fijo
La distancia ancho de banda fija es un intervalo fijo para cada uno de los
puntos. El usuario puede definir el intervalo y las unidades distancia en que
se calcula la misma (millas, millas, pies, kilmetros, metros).
Ancho de banda variable
El ancho de banda variable permite separar intervalos fijos para el primero y el segundo archivo. El usuario debe definir el intervalo y las unidades
(millas, millas, pies, kilmetros, metros), para cada uno de los archivos. Por
defecto la unidad es una milla para ambos (primero y segundo archivo).
Para cada uno, el usuario debe definir el intervalo y las unidades de la
distancia por los cuales es calculada (las millas, las millas nuticas, los pies,
54

los kilometers, los metros). Por defecto es una milla para los primeros y segundos archivos.
Unidades de rea
Debe especificar las unidades de densidad como puntos por milla cuadrada, por millas cuadriculadas nuticas, por pies cuadrados, por kilmetros
cuadrados, o por metros cuadrados. Por defecto es puntos por milla cuadrada.
Uso de la variable intensidad
Los archivos (primario y secundario) se tratan por separado, y se marcar
la casilla correspondiente a la variable intensidad, en caso de que esta se
utilice en interpolacin.
Uso de la variable ponderacin
Los archivos (primario y secundario) se tratan por separado, y se marca
la casilla correspondiente a la variable ponderacin, en caso de que esta se
utilice en interpolacin.
Clculo de densidad de probabilidades o densidad
La estimacin de densidad para cada celda se puede calcular de seis maneras:
1. Rata de densidades. Es el cociente (rata) de la densidad para el primer
archivo dividido por la densidad del segundo archivo.
2. Logaritmo de rata de densidad. Es el logaritmo natural del cociente
(rata) de la densidad del primer archivo dividido por la densidad del
segundo archivo.
3. Diferencia en densidad absoluta. Es la diferencia entre la densidad absoluta del primer archivo y el segundo, diferencia neta. La densidad de
cada archivo es escalada de modo que la suma de las celdas iguale el
tamao de la muestra.
4. Diferencia en densidad relativa. Esta es la diferencia entre la densidad
relativa del primer archivo y la densidad relativa del segundo archivo. Es
55

la diferencia relativa neta. La densidad celda de cada archivo es dividen


por el rea de celda para producir una medida de densidad relativa en
unidades especficas (por ejemplo, puntos por milla cuadrada). A la
densidad relativa del primer archivo se le resta la densidad relativa del
segundo archivo.
5. Suma de densidad absoluta. Es la suma de la densidad absoluta del
primero y el segundo archivo. La densidad de cada archivo es escalada
de modo que la suma de las celdas sea igual al tamao de la muestra.
6. Suma de densidad relativa. Es la suma de la densidad relativa de la
primer archivo y del segundo. Es la suma relativa de la densidad celda
de cada uno de los archivos dividida por el rea de cada celda para
producir una medida de densidad relativa en unidades especficas,(por
ejemplo, puntos por milla cuadrada). La densidad relativa del segundo
archivo se suma a la densidad relativa del primer archivo.
Debe seleccionar el tipo de estimacin de densidad de probabilidad que
calculara la rutina: la rata de densidades (o proporcin de densidades), el logaritmo de rata de densidad, la diferencia en densidad absoluta, la diferencia
de densidad relativa, la suma de densidades absoluta, o la suma de densidad
relativa. Por defecto es la rata de densidad.
Salida
Si el archivo de referencia es externo o creado por Crimestat, los resultados pueden salir como archivo para Surfer for Windows o como archivo
para ArcView .Shp, MapInfo .mif, Atlas*Gis .bna; y para ArcView Spatial
Analyst slo si el archivo de referencia es creado por CrimeStat.
Salida
Los resultados pueden salir como archivo para Surfer for Windows (para
ambos un archivo de referencia externo o creado) o como archivo para ArcView .Shp, MapInfo .mif, Atlas*Gis .bna, or ArcView Spatial Analyst (slo
si el archivo de referencia es creado por CrimeStat).

56

1.2.4.

Anlisis de espacio tiempo

La pestaa anlisis espacio tiempo (space-time analysis) abre una ventanea que permite analizar la interaccin entre el espacio y tiempo. En esta
ventana, se muestran cuatro rutinas. En primer lugar, el ndice Knox que
muestra relacin binomial simple entre los eventos ocurridos en el espacio y
en el tiempo. En segundo lugar, el ndice Mantel que muestra la correlacin
entre la proximidad en el espacio y la proximidad en el tiempo. En tercer
lugar, la media mvil espacio-temporales (spatial-temporal moving average)
que calcula la media central para un span temporal. En cuarto lugar, el Anlisis de caminos correlacionado (Correlated Walk Analysis ) que diagnostica
la secuencia espacial y temporal de los incidentes cometidos por un delincuente en serie.
Para cada una de estas rutinas, el tiempo debe ser definido como un
nmero entero o real, y no en formato de fecha; por ejemplo son valores elegibles: 3 das, 2.1 semanas, 4.3 meses, o el nmero de das desde 1 de enero
de 1900, (por ejemplo, 37.174); mientras que en formato de fecha no son
elegibles, por ejemplo, 1 de noviembre de 2001 07/30/01. Debe convertirse
los formato de fechas en nmero real. Las unidades de tiempo debe ser coherente en todas las observaciones, (es decir, deben tener una nica unidad,
como horas, das, semanas, meses o aos). Si una de estas condiciones es viola, CrimeStat ejecuta los calcular y da los resultados, pero no sern correctos.
ndice de Knox
El estadstico de Knox es un ndice que muestra la relacin entre la cercana el tiempo y cercana la distancia. Se comparan los pares de eventos
en distancia y tiempo, y luego son representados en una tabla de 2x2. Existen
tres mtodos que definen cercana en tiempo o distancia:
1. Media. Esto es; eventos que estn ms cercanos (en tiempo) que el
intervalo de tiempo medio, o que estn ms cerca (en distancia) que la
distancia media, se definen como cercano, mientras que los eventos
que estn ms lejos en tiempo, que el intervalo de tiempo medio, o
estn ms lejos en distancia que la distancia media, se define como no
cercano.
2. Mediana. Esto es; eventos que estn ms cercanos (en tiempo) que la
57

mediana del intervalo de tiempo, o ms cerca (distancia) que la mediana


de la distancia, se definen como cercano; mientras que los eventos que
estn mas lejos que la mediana del (intervalo) tiempo, o mas lejos que
mediana de la distancia se definen como no cercano.
3. Definida por el usuario. El usuario puede especificar cualquier valor
para distinguir cercano y no cercano, para cualquier tiempo o distancia.
La salida incluye una tabla de 2x2 de la distribucin de los pares en categora cercano o no cercano en tiempo y en distancia. Como se comparan
pares de eventos, resulta N (N 1)/2 pares en el conjunto de datos, donde
N es el nmero de eventos. La salida tambin incluye una tabla con esperanza
de la distribucin de pares en el supuesto de que eventos en el tiempo y en
el espacio son independientes uno de otro. La salida incluye un estadstico
Chi-cuadrado. Sin embargo, como las observaciones no son independientes,
el p-valor asociado con la prueba Chi-cuadrado no en aplicado en este caso.
Corrida de simulacin de Knox
Una simulacin de MonteCarlo puede ser ejecutada para estimar aproximadamente los niveles de probabilidad del error tipo I, del ndice de Knox.
El usuario debe especificar el nmero de simulacines ha ejecutar. La data
es asignada al azar y el valor de la chi-cuadrado para el ndice de Knox es
calculado en cada corrida. La salida aleatoria es ordenada y se calculan los
percentiles. Doce resultados presenta esta rutina:
1. El mnimo de simulaciones espaciales
2. El mximo de simulaciones espaciales
3. El percentil 0.5 para la simulacin espacial
4. El percentil 1 para la simulacin espacial
5. El percentil 2.5 para la simulacin espacial
6. El percentil 5 para la simulacin espacial
7. El percentil 10 para la simulacin espacial
58

8. El percentil 90 para la simulacin espacial


9. El percentil 95 para la simulacin espacial
10. El percentil 97.5 para la simulacin espacial
11. El percentil 99 para la simulacin espacial
12. El percentil 99.5 para la simulacin espacial
Los percentiles permiten una prueba de significancia de una o dos colas.
Por ejemplo, para un 5 %, una prueba de una cola usa el percentil 95, mientras que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. Los
datos simulados que se usan pueden ser visualizados en la ventana Opciones
marcando la casilla Dump simulation data.
ndice de Mantel
El ndice de Mantel es la correlacin entre la cercana en tiempo y la cercana en distancia a travs de pares. Cada par de eventos es comparado por
intervalo de tiempo y distancia entre ellos. Si hay una relacin positiva entre la cercana en tiempo y la cercana en espacio (distancia), entonces debe
haber una importante correlacin positiva entre las dos medidas. Observe,
como se comparan pares de eventos, hay N (N 1)/2 pares en el conjunto
de datos, donde N es el nmero de eventos.
Corrida de simulacin para Mantel
Una simulacin de MonteCarlo puede ser ejecutada para estimar aproximadamente los intervalos de confianza alrededor de la correlacin de Mantel.
El usuario debe especificar el nmero de simulacin ha ejecutar, y usando la
data asignada (al azar) el ndice es calculado. La salida aleatoria es ordenada,
y los percentiles son calculados. La salida ofrece dose resultados:
1. El mnimo de simulaciones espaciales
2. El mximo de simulaciones espaciales
3. El percentil 0.5 para la simulacin espacial
4. El percentil 1 para la simulacin espacial
59

5. El percentil 2.5 para la simulacin espacial


6. El percentil 5 para la simulacin espacial
7. El percentil 10 para la simulacin espacial
8. El percentil 90 para la simulacin espacial
9. El percentil 95 para la simulacin espacial
10. El percentil 97.5 para la simulacin espacial
11. El percentil 99 para la simulacin espacial
12. El percentil 99.5 para la simulacin espacial
Los percentiles permiten pruebas de significancia de una o dos colas. Por
ejemplo, para un 5 %, una prueba de una cola usa el percentil 95, mientras
que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. La data simulada que se usan pueden ser vistos usando la ventana de Opciones en la
casilla Dump simulation data.
Promedio mvil de Espacio-tiempo
Esta rutina calcula la media central como un cambio en la secuencia de los
eventos. La rutina ordena los incidentes en el orden en que ocurren. El usario
define un span de incidentes secuencial. Por defecto el span de incidentes
secuencial es igual a cinco observaciones. La rutina coloca una ventana
que cubre el span sobre los incidentes y calcula la media central (la
coordenada X de la media, coordenada Y de la media). Entonces
mueve la ventana una observacin. Las aproximaciones se hacen al
principio y al final de la observaciones secuencial. El resultado es un
conjunto de medias centrales ordenadas a partir de la primera hasta la ltima
observacin. Este estadstico til para determinar la localizacin central de
un conjunto de incidentes (tal vez cometido por un delincuente en serie) que
se ha desplazado en el tiempo.
Esta rutina presenta cuatro de salidas:
1. El tamao de la muestra.
2. El nmero de observaciones que componen el span.
60

3. El nmero span.
4. Las coordenadas X e Y para cada span de ventana.
Los resultados tabulares salen como un archivo dBase .dbf, Microsoft
Access .mdb, Ascii .dat o ODBC-compatible. Un resultado grfico que muestra una lnea secuencia en archivo para ArcView .shp, para Mapifo .mif o
Atlas*gis .bna.
Anlisis de caminos correlacionado (CWA)
El Anlisis de caminos correlacionados (Correlated Walk Analysis, CWA)
analiza la secuencia de movimientos de un delincuente en serie y hace predicciones acerca del tiempo y la localizacin de un prximo evento. Los movimientos secuenciales son analizados en trminos de tres parmetros: diferencia de tiempo entre eventos (por ejemplo, el nmero de das entre dos
eventos consecutivos); distancia entre eventos (por ejemplo, la distancia entre dos eventos consecutivos); y ngulo entre eventos, direccin angular entre
dos eventos consecutivos medidos en grados (de 0 a 360). Hay tres rutinas
para analizar la secuencia de eventos:
1. Correlograma.
2. Diagnstico de Regresin.
3. Prediccin.
Correlograma de CWA
El correlogram presenta las correlaciones rezagadas entre eventos por diferencia de tiempo, distancia, y ngulo (direccin). Los retardos son comparaciones de secuencias. Un retardo de cero es la secuencia comparada con ella
misma; por definicin, la correlacin es igual a 1. Un retardo de 1 es la
comparacin de la secuencia con la anterior secuencia. Un retardo
de 2, es la secuencia en comparacin con dos secuencias anteriores.
Un retardo de 3 es la secuencia en comparacin con tres secuencias
anteriores, y as sucesivamente. En total, las comparaciones se hacen
hasta siete secuencias anteriores (un retardo de 7).

61

Generalmente, tratando por separado la diferencia de tiempo, distancia


y localizacin, un retardo con la ms alta correlacin es el ms fuerte. Sin
embargo, con cada retardo consecutivo, el tamao de la muestra disminuye
en uno. Si el tamao de la muestra es pequeo, una correlacin alta asociado
con un retardo alto puede ser poco fiable. Por consiguiente, correlograma
ajustado (adjusted correlogram) descuenta las correlaciones por el nmero
de retrasos.
Diagnstico de regresin del CWA
El diagnstico de regresin (regression diagnostics) presenta la regresin
estadstica para los diferentes modelos de retados. El retardo debe especificarse. Por defecto el retardo es igual a 1 (secuencia de eventos comparados
con el anterior). Tres modelos de regresin pueden ser ejecutados para la
diferencia de tiempo, direccin y ngulo. La salida muestra los siguientes
estadsticos:
1. El tamao de la muestra.
2. Las unidades de distancia y tiempo.
3. El retardo del modelo (de 1 a 7).
4. El R multiple (correlacin) entre los retardos.
5. El R cuadrado multiple (es decir, R-cuadrado).
6. El error estndar de estimacin para la regresin.
7. El coeficiente, el error estndar, el t-valor, el valor del probabilidad
para la constante (dos colas).
8. El coeficiente, el error estndar, el t-valor, el valor del probabilidad
para la para el coeficiente (dos colas).
9. El anlisis de varianza para el modelo de regresin, incluyendo la suma
de los cuadrados y la media cuadrtica de error para el modelo de
regresin y el residual (error), el valor del F-test de regresin de error
media cuadrtica de dividido por el residual cuadrado del error medio,
y el nivel de probabilidad para la F-test.
62

En general, el modelo con el menor error estndar de estimacin es el


mejor, y por consiguiente, con mayor ndice de correlacin multiple R. Sin
embargo, con un tamao de muestra pequeo, el modelo puede ser poco
fiables. Adems, con cada retardo consecutivo, el tamao de la muestra disminuye en uno; si el tamao de la muestra es pequeo, un R mltiple alto
asociado con un retardo alto de comparacin puede ser poco fiable.
Prediccin del CWA
La rutina de prediccin (prediction) permite predecir un prximo evento
en tiempo, distancia y direccin. Para cada parmetro (diferencia de tiempo,
distancia, y ngulo) hay tres modelos que pueden ser usados:
1. La diferencia de media (es decir, diferencia en tiempo medio, en distancia media y en ngulo medio)
2. La diferencia de medianas (es decir, diferencia en medianas de tiempo,
en distancias medianas y ngulo mediano)
3. El modelo de regresin (es decir, el coeficiente de regresin estimado e
intercepto)
Cada uno de ellos puede utilizar retardos de 1 a 7 para comparar. Se debe
definir el retardo de la secuencia para el cual se hace la prediccin. As, para
un retardo de 1, el intervalo del penltimo al ltimo evento se utiliza como
referencia (es decir, entre el evento N-1 y N); para un retardo de 2, el intervalo del antepenltimo al penltimo evento se utiliza como referencia (es decir,
entre los eventos N -2 y N-1), y as sucesivamente. Nota: Si el modelo de regresin es utilizado, el retardo para la distancia y el ngulo debe ser el mismo.
Ejemplo 1: con un retardo de 1 y usando la diferencia de medias, la diferencia de tiempo medio se aadir al tiempo del ltimo evento, la distancia
media se agrega a la localizacin del ltimo evento, y el ngulo medio se
aade a la localizacin del ltimo evento.
Ejemplo 2: con un retardo de 2 y el uso del modelo de regresin, la diferencia del tiempo de prediccin es aadida al tiempo del penltimo evento,
la prediccin de la distancia se aade la localizacin del penltimo evento y
63

prediccin angular se aade a la localizacin ltimo evento.


Ejemplo 3: con un retardo de 1 para el tiempo y el uso del modelo de
regresin, con un retardo de 2 para la distancia y el uso de la distancia media, y con un retardo de 3 para el ngulo y el uso de la mediana angular, la
diferencia del tiempo de prediccin es aadida al ultimo evento, la distancia
media es agregada al penltimo evento, y la mediana angular es aadida a
la localizacin del antepenltimo evento.
La salida incluye:
1. El mtodo utilizado para el tiempo, distancia, y ngulo
2. El retardo usado para el tiempo, distancia, y ngulo
3. La prediccin de la diferencia de tiempo.
4. La prediccin de la distancia.
5. La prediccin ngular.
6. La prediccin del tiempo final.
7. La prediccin de la coordenada X de la ubicacin final.
8. La prediccin de la coordenada Y de la ubicacin final.
1.2.5.

Opciones

En esta ventana de opciones, CrimeStat permite salvar parmetros, cambiar los colores de las pestaas en las cuatro secciones, y ver la data simulada
por la rutina de Monte Carlo.
Salvando Parmetros
Todos los parmetros de entrada pueden ser salvados. En la ventana Opciones, hay un botn para Salvar parmetros (Save parameters). Los archivos de parmetros salen con la extensin param. Un archivo de parmetros
salvado puede ser recargado con el botn parmetros de Carga (Load parameters).

64

Colores
Los colores de cada las cuatro pestaas o secciones de CrimeStat pueden ser cambiados seleccionando la pestaa correspondiente y escogiendo un
color del espectro.
Salida de la Data simulada
Cuando se corre una simulacin de Monte Carlo con la rutina de Ripleys K, Cluster Jerrquico del vecino ms cercano, Cluster Jerrquico del
vecino ms cercano de ajuste de riesgo, el STAC, Mantel o Knox, la data pueden salida como archivo .dbf. Cada corrida de simulacin sale con el
nombre de Sim_data<I>.dbf, donde <I>es el nmero de corridas, por ejemplo, Sim_data4.dbf.
VI Intercambio dinmico de datos (DDE)
CrimeStat apoya el Intercambio de datos Dinmico (DDE). Ver en Apndice A, en documentacin, o en ayuda online para mayor formacin.

65

También podría gustarte