Manual Rapido de CrimeStrat

1.
1.1.
Descripcin del programa CrimeStat

Introduccin
CrimeStat es un programa de estadsticas espaciales diseado especcamente para el anlisis de la ocurrencia de incidentes criminales, desarrollado por Ned Levine bajo el auspicio del Instituto Nacional de Justicia de Estados Unidos de Amrica. Su propsito es brindar un conjunto de herramientas estadsticas complementarias para ayudar a investigadores y agencias encargadas de hacer cumplir la ley. El programa utiliza la ubicacin de incidentes criminales como datos de entrada en formato de archivo dBase (.dbf, III, IV, o V), que es un formato de archivo comn para programas de Sistema de informacin geograco de escritorio (SIG), como ArcView (shp), MapInfo (dat), y archivos compatibles con el estndar ODBC, como Excel, Lotus 1-2-3, Microsoft Access, y Paradox (Borland.Com, 1998; ESRI, 1998a; Microsoft, 1999). Adems, para muchos otros SIG, como Maptitude, y puede leer archivos como dbf, shp, bna or mif. A partir de estos datos, permite aplicar los mtodos de estadstica espacial, produciendo resultados en archivos formato cartogrco que pueden ser utilizados directamente por diferentes programas de SIG como ArcView R , MapInfo R , Atlas*GIS, y Spatial Analyst c . Los mtodos de estadstica espacial instrumentados en CrimeStat son: Distribucin Espacial: conjunto de mtodos para la descripcin de la distribucin espacial de incidentes, tales como el media central, centro de mnima distancia, la elipse de desviacin estandarizada, y el ndice de autocorrelacin espacial I de Moran. Anlisis de Distancia: conjunto de tcnicas estadsticas para describir las propiedades de las distancias entre los incidentes, incluyendo anlisis de vecinos ms cercanos, anlisis lineal del vecino ms cercano, y el estadstico K de Ripley. Anlisis de Zona o Puntos Calientes: ("Hot Spot") incluye las rutinas para realizar el anlisis de Punto Calientes, incluyendo la moda, la moda difusa, deteccin de conglomerados de vecinos ms cercanos 1
jerrquicos y de vecinos ms cercanos jerrquicos ajustados por niveles de riesgo, as como otras rutinas para el Anlisis Espacial y Temporal de Crmenes (STAC por sus siglas en ingls), que incluyen el mtodo de deteccin de conglomerados K-means y los ndices Locales de Autocorrelacin Espacial (LISA por sus siglas en ingls) propuestos por Anselin. Modelacin Espacial: incluye mtodos de interpolacin, utilizando el mtodo de estimacin de densidad de kernel de una variable simple, para producir un estimado de supercie o contorno de la densidad de incidentes, tambin incluye el mtodo de estimacin de densidad de kernel dual, utilizando dos variables en la estimacin, para comparar la densidad de incidentes con la densidad de un segundo archivo DDDDDDD, adems de otras tcnicas de anlisis espacio-temporal, como los ndices de Knox y Mantel, que permiten detectar la asociacin de incidentes en tiempo y espacio (estos indices son los que desarrollaremos en este trabajo), entre otros mtodos con mayor aplicacin en el anlisis de criminalidad. CrimeStat utiliza varios tipos de archivos de datos de entrada, un archivo primario y uno secundario, ambos contienen la ubicacin de incidentes en forma de pares de coordenadas, as como la fecha de ocurrencia del incidente. El archivo secundario contiene datos asociados con el primario y puede ser utilizados con nes de comparacin en los mtodos de deteccin de conglomerados o cluster. Utiliza adems un archivo que dene una rejilla (grid) de polgonos regular irregular que se superpone sobre el rea de estudio. Dicha rejilla puede ser creada por CrimeStat por un SIG. CrimeStat no tiene capacidad para la visualizacin de mapas ni funciones de SIG, su diseo se ha centrado en los mtodos de anlisis de datos espaciales; sin embargo, una caracterstica importante desde el punto de vista programtico, es la disponibilidad de una Interfase de Programacin de Aplicacin (API) que permite que otros programas invoquen sus procedimientos y funciones, permitiendo el uso de SIG gratuitos o de bajo costo. Esta es una ventaja relativa para su uso respecto a aquellos que requieren de SIG comerciales.
1.2.
Manual de corto de CrimeStat o gua rpida
En esta seccin se presenta una introduccin a las funciones del programa CrimeStat que se utilizan en este trabajo; las mismas se exponen en forma de manual, de tal manera que pueda servir de guia a los usuarios del mismo. Descripcin breve de la organizacin de las rutinas del programa CrimeStat cuenta con diecisiete pestaas (rutinas) organizados en cinco grupos base, presentados en ventanas, y una cha opcin, como se describe acontinuacion: Conguracin de los datos 1. Archivo primario 2. Archivo secundario 3. Archivo de referencia 4. Medicin de parmetros Descripcin espacial 5. Distribucin espacial 6. Anlisis de distancia I 7. Anlisis de distancia anlisis II 8. Anlisis Zonas calientes I (Hot Spot) 9. Anlisis Zonas calientes II (Hot Spot) Modelado espacial 10. Interpolacin 11. Anlisis Espacio-tiempo
12. Estimacin del viaje a la delincuencia Demanda del recorrido del crimen 13. Generacin de viaje 14. Distribucin de viaje 15. Modelo Split 16. Asignacin de Red 17. Archivo de hojas de calculo Opciones 18. Guardando parmetros, colores y opciones. En la Figura tal 1.1-2.18 se presenta la ventana principal de Crimestat, donde se muestra las cinco pestaa correspondientes a los cinco grupos base. 1.2.1. Conguracin de datos
Archivo Primario CrimeStas requiere de un archivo primario. Sin embargo, se pueden seleccionar ms de un archivo si es necesario. Este es un archivo de puntos con coordendas X e Y. Por ejemplo; un archivo primario puede ser la ubicacin de los robos callejero con algn tipo de arma, cada uno referenciado con sus respectivas coordenadas X e Y. Adems, en este archivo los incidentes pueden estar asociados con alguna ponderacin o intensidad de las variables, aunque estos son opcionales. Por ejemplo, si los puntos corresponden a los puestos o estaciones de polica, la variable intensidad podra ser el nmero de llamadas solicitando el servicio en cada estacin de polica, mientras que la variable de ponderacin puede ser zonas de servicio. En este archivo se referencia el tiempo en que sucede el evento criminal, y las unidades para el mismo son: horas, das, semanas, meses o aos. Esta variable es necesaria por las rutinas del anlisis espacio-tiempo.
Seleccin del tipo de archivo primario CrimeStat puede leer archivos ASCII, dBase dbf( III / IV / V) , ArcView shp, MapInfo dat, Microsoft Access bdb, y formatos de archivos que corresponden a la interfaz estndar ODBC. Para seleccione el tipo de archivo a ser usado, utilice el botn Browse para buscar el nombre del archivo. Si el tipo de archivo es ASCII, seleccione el tipo de datos separador (coma, punto y coma, espacio, cha) y el nmero de columnas. Los archivos ODBC deben que ser denidos para el particular equipo en el que se ejecuta. Variables Debe denir el archivo que contiene las coordenadas X e Y. CrimeStat acepta valores asociados a las coordenadas X e Y; estos valores son los llamados pesos o intensidades. Si estas ponderaciones var a ser usadas, debe denirse el archivo que las contiene. En esencia, se trata de dos tipos de ponderaciones diferentes, que son requeridas por algunas rutinas, (por ejemplo, el indice local de Moran, la autocorrelacin espacial). Es posible usar las dos ponderaciones (intensidad y un peso), aunque debe ser prudente en ello, para evitar la doble ponderacin. CrimeStat utiliza la variable tiempo como un nmero entero o nmero real (por ejemplo, 1, 36892); no usa el formato fechas (por ejemplo, 01/01/2001, 1 de octubre de 2001). Debe convertir el formato fechas a nmeros reales antes de utilizar cualquier rutina de anlisis de espacio-tiempo. Columna Seleccione las variables para las coordenadas X e Y, respectivamente (por ejemplo, Longitud, Latitud, Xcoord, Ycoord). Si los pesos o intensidades sern utilizados, debe seleccionarse nombres apropiada para estas variables; de igual manera si la variable tiempo se utiliza, debe seleccionase un nombre apropiado. Valores faltantes CrimeStat por defecto ignora los registros con valores en blanco en cualquiera de los campos elegibles o no con valores no numricos (por ejemplo, 5
caracteres alfanumricos, #, ). Los registros con valores en blanco siempre ser excluido a menos que el usuario seleccione en la casilla <none>, alguna otra opcin. Hay 8 opciones posibles: 1. <blank>los campos son automticamente excluidos. Este valor es por por defecto 2. <none>indica que los registros no sern excluidas. Si hay un campo en blanco, CrimeStat tratar como un 0 3. 0 Est excluido 4. -1 Est excluido 5. 0 y -1 indica que ambos 0 y -1 se excluirn 6. 0, -1 y 9999 indica que los tres valores (0, -1, 9999) sern excluidas 7. Cualquier otro valor numrico puede ser tratado como un valor faltante tipiando este (por ejemplo, 99) 8. Valores numricos mltiples pueden ser tratados como valores que faltan por tipear, separando cada uno por comas (por ejemplo, 0, -1, 99, 9999, -99) Direccional Si el archivo contiene coordenadas direccionales (ngulos), debe denirse el nombre del archivo y el nombre de la variable (columna) que contiene la medida direccional. Si coordenadas direccionales son usadas, puede haber una variable de distancia opcional para la medida. Dena el nombre del archivo y el nombre de la variable (columna) que contiene la variable de distancia. Tipo de sistema de coordenadas y unidades de datos Seleccione el tipo de sistema de coordenadas. Si las coordenadas estn en longitudes y latitudes, un sistema esfrico es usado, y las unidades de los datos automticamente son grados decimales. Si el sistema de coordenadas es proyeccin (por ejemplo, Sistema de Coordenadas Planas o Universal Transversal de Mercator-UTM), las unidades de los datos puede ser en pies, metros 6
(por ejemplo, UTM), millas, kilmetros o millas nuticas. Si el sistema de coordenadas es direccional, las coordenadas debe estar en ngulos y la casilla de unidad de datos queda en blanco. Para el sistemas de direccional, hay una variable additional distancia, que puede ser usado. Esta mide la distancia del incidente desde la posicin origen (ubicacin); observe que en este caso las unidades son indenidas. Unidades de tiempo Denir las unidades de la variable tiempo. El tiempo es denido en trminos de horas, das, semanas, meses o aos. El valor por defecto es das. CrimeStat utiliza la variable tiempo como un nmero entero o nmero real (por ejemplo, 1, 36892); no usa el formato fechas (por ejemplo, 01/01/2001, 1 de octubre de 2001). Debe convertir el formato fechas a nmeros reales antes de utilizar cualquier rutina de anlisis de espacio-tiempo. Archivo Secundario CrimeStat usa un segundo archivo de datos que puede ser opcional, llamado Archivo Secundario. Este archivo tambin es un archivo de puntos con coordenadas X e Y. Generalmente se usa para comparar con el archivo primario. El archivo secundario puede usar las variables ponderadas (pesos o intensidades) asociadas a las coordenadas X e Y, aunque estas son opcionales. Por ejemplo, si el archivo principal corresponde a la ubicacin de robos de automviles, en el archivo secundario la variable como la intensidad (o peso) podra ser el centroide de los bloques de los grupos que tienen la poblacin censada. En este caso, se podra comparar la distribucin de robos de automvil con la distribucin de poblacin; por ejemplo, en la rutina de Ripleys K o la estimacin de densidad dual. La variable tiempo no es utilizada en este archivo. Puede seleccionarse ms de un archivo a usar. Seleccin del tipo de Archivo Secundario Procedimiento semejante al archivo primario. Ver archivo primario. Variables Denir el archivo que contiene las coordenadas X e Y. Si los pesos o 7
intensidades van a ser usados, debe denirse el archivo que contiene estas variables. Algunos estadsticos requieren valores de intensidad (por ejemplo, autocorrelacin espacial, Moran local). La mayora de los dems estadsticos pueden utilizar ponderaciones. Es posible tener ambas variables (pesos e intensidad ), aunque el usuario debe ser prudente en ello para evitar la doble ponderacin. Las Unidades de tiempo no se utilizan en este archivo secundario. Columna Seleccione las variables para las coordenadas X e Y, respectivamente (por ejemplo, Longitud, Latitud, Xcoord, Ycoord). Si hay pesos o intensidades que se est usando, debe seleccionarse nombres apropiadas para estas variables. Unidades de tiempo no se utilizan en el archivo de secundaria. Valores faltantes Procedimiento semejante al archivo primario. Ver archivo primario. Tipo de sistema de coordenadas y unidades La data del archivo secundario debe tener el mismo sistema de coordenadas y las mismas unidades del archivo principal. Esta seleccin ser bloqueada o neutralizada, indicando que el archivo secundario debe lleva la misma denicin que el archivo primario. El archivo secundario no se permite coordenadas direccional (ngulos). Archivo de referencia Para referenciar el rea de estudio, existe una grilla o cuadrcula de referencia y un origen de referencia. El archivo de referencia es utilizado por las rutinas: cluster jerrquicos del vecinos ms cercanos (agrupacin), viaje de la delincuencia y por estimacin de densidad o kernel, simple o doble. Es por lo general, aunque no siempre, una cuadrcula es sobrepuesto en la zona de estudio. El origen de referencia es utilizado en la ruptina media direccinal. Este archivo puede ser externo como archivo de entrada, o puede ser creados por CrimeStat.
Crear una grilla o cuadrcula de referencia CrimeStat permite generar una verdadera cuadrcula, haciendo clic en reate Grid y luego ingresando en la parte inferior izquierda y superior derecha las coordenadas X e Y de un rectngulo, colocado sobre el rea de estudio. Las celdas se pueden denir por tamao de celda, en las mismas coordenadas y los datos de unidades como el principal archivo, o por el nmero de columnas en la red (por defecto). Adems, un origen de referencia puede ser denido por la rutina media direccional. La grilla de referencia puede ser guardardo para volver a utilizar. Haciendo clic en la casilla Guardar (Save) y dando un nombre al archivo. Para utilizar un archivo guardado, haga clic en la casilla cargar (Load) y colocar directorio y nombre del archivo. Las coordenadas se guardan en el registro, pero pueden guardarse en cualquier directorio. Para guardar en un directorio particular, con la ventana abierta de la pestaa Cargar (Load), haga clic en Guardar en archivo (Save to le), a continuacin, introduzca el directorio y nombre del archivo. La extensin de archivo por defecto es ref. Entrada de un archivo externo de referencia Para usar un archivo externo que almacena las coordenadas de rejilla o cuadrcula, debe seleccionar el nombre del archivo de referencia. CrimeStat puede leer archivo ASCII, dBase dbf, ArcView shp, MapInfo dat, Microsoft Access mdb, y formatos de archivos que corresponden a la interfaz estndar ODBC. Seleccione el tipo de archivo a usar. Use el botn buscar (browse) para ubicar el archivo. Si el tipo de archivo es el ASCII, seleccione el tipo de separador de datos (la coma, el punto y coma, el espacio, pestaa) y el nmero de columnas. Los archivos ODBC tienen que ser denido para el computador sobre el cual se ejecutara. Use el botn de wrouse para buscar el nombre del archivo. Un archivo de referencia ledo en Crimestat no tiene que ser necesariamente una rejilla verdadera (matriz con k columnas y l las). Sin embargo, un achivo exernal de referncia que es ledo en Crimestat, slo puede ser salida Surfer para Windows ya que otros formatos de salida - ArcView, MapInfo, Atlas*GIS, Spatial Analyst, y rejilla ASCII requieren que el archivo de referencia sea una rejilla verdadera.
Origen de referencia Un origen de referencia puede ser denido por la rutina de media direccional. El origen de referencia pueden ser asignados a: 1. Uso de la esquina inferior izquierda, denida por el mnimo de los valores X e Y. Este valor es por defecto. 2. Uso de la esquina superior derecha, dene por los valores mximos X e Y. 3. Un punto de origen diferente. Con este ltimo, el usuario debe denir el origen. Medida de parmetros En la pestaa medida de parmetros (Measurement Parameters), se dene las unidades y el la cobertura del rea en estudio, y el tipo de distancia a utilizar. En esta ventana hay tres componentes que se denen: Area En primer lugar, debe denirse el rea geogrca de la zona de estudio, y la unidades de supercie en kilmetros cuadrados, millas nuticas cuadradas, pies cuadrados o metros cuadrados. Independientemente de las unidades en que se han denido los datos en el archivo principal, CrimeStat puede convertir diversas unidades de rea. Estas unidades se utilizan en la rutinas del vecino ms cercano, Ripleys K, cluster jerrquica, STAC, y clustering de K-means. En caso de que las unidades de supercie no esten denidas, CrimeStat dene un rectngulo por el mnimo y el mximo de las coordenadas X e Y. Longitud de la red de calle En segundo lugar, se dene la Longitud total de la red de calle (Length of street network) del rea de estudio o una comparacin adecuada de red, como por ejemplo, un sistema de autopista; y se dene tambien las unidades de distancia (kilmetros, millas nuticas, pies, kilmetros, metros). La longitud de la red de calle es utilizada por la rutina anlisis lineal del vecino ms 10
cercano. Independientemente de las unidades que se ha utizado en la data del archivo principal, CrimeStat puede convertir las unidades de medicin a distancia. La distancia deber estar en la misma mtrica como la unidades de supercie (por ejemplo, millas y millas cuadradas, metros y metros cuadrados.) Tipo de distancia En tercer lugar, se dene las distancias a usar en los calculos (Type of distance measurement). Hay tres opciones: 1. Distancia directa 2. Distancia indirecta (Manhattan) 3. Distancia de Red Grco 2,11 Distancia directa Si se usa distancia directa, cada distancia es calcula como la distancia ms corta entre dos puntos. Si se las coordenadas son esfricas (es decir, latitud, longitud), entonces la distancia directa ms corta es un arco de circulo sobre una esfera. Si las coordenadas son proyecciones, entonces, la distancia ms corta directa es una lnea recta en un plano euclidiano. Distancia Indirecta Si se usa la distancia indirecto, cada distancia se calcula como la distancia ms corta entre dos puntos en una cuadrcula, esto es, la distancia est limitada a la direcciones horizontal o vertical (es decir, no en diagonal). Esta distancia es llamada mtrica de Manhattan. Si son coordenadas esfricas (es decir, latitud, longitud),entonces la distancia indirecta ms corta es un ngulo recto modicado sobre un tringulo rectngulo esfrico; escribir ms detalles. Si las coordenadas son proyecciones, entonces la distancia indirecta ms corta es el ngulo recto de un tringulo rectangulo sobre un plano de dos dimensiones.
11
Distancia en Red Si se utiliza distancias en red, cada distancia es calculada como el camino ms corto entre dos puntos en la red. Alternativamente la distancia puede utilizarse incluyendo velocidad, tiempo de viaje o recorrido, o costo de viaje. Haciendo clic en la casilla parmetros de la red (Network parameters), aparece una ventana con los parmetros de red, donde debe identicar el archivo de red, Tipo de red, Entrada del Archivo de red, Ponderacin sobre la Red, From one-way ag and To one-way ag, Identicando nodo partida (FromNode ID) y terminal (ToNode ID Sistema de coordenadas Unidades de medida y Lmite grco de Red: Tipo de red Los archivos de Red pueden ser bi-direccional (por ejemplo, un archivo TIGER) o uni-direccional (por ejemplo, un archivo para modelacin del trnsito). En un archivo bi-direccional, se puede viajar en cualquier direccin; mientras que en un archivo uni-direccional, slo se puede viajar en una direccin. Debe especicar el tipo de Red que se utilizar. Tipo de Archivo de entrada Los archivos de red pueden ser archivo tipo shape (.shp) o archivo tipo dBase IV dbf, Microsoft Access mdb , Ascii dat , o un archivo compatible con ODBC. Por defecto el archivo es tipo shape. Si el archivo es de tipo shape, la rutina debe conocer la localizacin de los nodos. Para un archivo dBase IV u otro tipo, las coordenadas X e Y de los nodos deben ser denidas; estos son Llamados "Partida"(From) del nodo y "Terminal"(End) del nodo. Una variable peso opcional es permitida para los archivos tipos le0073. La rutina identica nodos, segmentos, y calcula la trayectoria ms corta. Si hay un camino uni-direccional en un archivo bidireccional, los campos para nodos de "Partida terminal deben ser denidos. Ponderacin sobre la Red Normalmente, cada segmento en de la red no es ponderado. En este caso, la rutina calcula la distancia ms corta entre dos puntos, utilizando la distancia de cada segmento. Sin embargo, cada segmento puede ser ponderado 12
por el tiempo de viaje, velocidad o costo de viaje. Si el tiempo de viaje es utilizado para ponderar el segmento, la rutina calcula el menor tiempo para cualquier ruta entre dos puntos. Si la velocidad se utiliza como ponderacin del segmento, la rutina convierte esto en el tiempo de viajes, dividiendo la distancia por la velocidad. Por ltimo, si los costos de viaje se utiliza como ponderacin, la rutina calcula la ruta con el menor costo total de viaje. Especique la ponderacin que utilizar (weight column) y asegrese de indicar las unidades de medida (distancia, velocidad, tiempo de viaje, costo de viaje) en la parte inferior de la ventana. Si no se asigna ponderacin, entonces la rutina se ejecuta utilizando la distancia. From one-way ag y To one-way ag Un segmento uni-direccional pueden ser identicado en un archivo bidireccional por el campo (from one-way ag), es decir, no es necesario un archivo uni-direccional. El ag es un campo para los nodos nales del segmento con valores 0 y 1. Un 0 indica que los viajes pueden pasar a travs de ese nodo en cualquier direccin, mientras que un 1 indica que el viaje slo puede pasar del nodo del mismo segmento (por ejemplo, los viajes no puede ocurrir de otro segmento que est conectada al nodo). Por defecto se asume que los viajes pueden pasar travs de cada nodo,(es decir, se supone un0 para cada nodo). Para cada calle de direccin nica, debe especicar las ags para cada nodo terminal. Un 0 permite viajar desde cualquier conexin de segmentos, mientras que un 1 slo permite viajar desde el otro nodo del mismo segmento. Flag Marcar los campos que estn en blanco se supone que permiten viajar a pasar en cualquier direccin. Identicando nodo partida (FromNode ID) y nodo terminal (ToNode ID) Si la red es uni-direccional, hay un segmento individual para cada direccin. Normalmente, dos calles tienen dos segmentos, uno para cada direccin. Por otra parte, calles con un solo sentido, tienen slo un segmento. Las casillas FromNode ID y ToNode ID, identican el inicio y el nal del segmento de los viajes debera ocurrir, respectivamente. Si no se denen los FromNode ID y ToNode ID, la rutina elige el primer segmento de un par que encuentre, en direccin equivocada o correcta. Para determinar correctamente la direccin de viaje, debe denirse los campos FromNode ID y ToNode ID. 13
Sistema de coordenadas El archivo de red usa el mismo sistema de coordenadas que que el archivo primario. Unidades de medida Por defecto, la trayectoria ms corta es en trminos de distancia. Sin embargo, cada segmento puede ser ponderado por el tiempo de viaje, velocidad de viaje, o costo de viaje. 1. Para el tiempo de viaje, las unidades son minutos, horas o unidades de costo sin especicar. 2. Para la velocidad, las unidades son millas por hora y kilmetros por hora. En el caso de velocidad como una variable de ponderacin, automticamente es convertido el tiempo de viajes, por dividiendo la distancia del segmento por la velocidad, manteniendo las unidades constantes. 3. Para costo de viaje las unidades no estn denidas, la rutina identica aquellas rutas con el menor costo total. Lmite grco de Red Finalmente, el nmero de segmentos grcos a ser calculados es denido como el lmite de red. Por defecto, el valor es 50.000 segmentos. Debe asegurarse que este nmero es ligeramente mayor que el nmero de segmentos en su red. Observacion: Usando la distancia red (network distance), los clculos de distancia puede ser un proceso lento, por ejemplo, puede tomar varias horas para clcular toda una matriz. Utilice mayor precisin slo si es necesario, o para la rutina de asignacin de red en el mdulo de demanda recorrido del crimen. Salvar parmetros Hay un botn o pestaa Guardar parmetros (Save parameters) en la seccin Opciones. donde todos los parmetros de entrada pueden ser guardados. Un archivo de parmetros guardados tiene una extensin param. Un 14
archivo de parmetros guardados puede ser recargado con el botn cargar parmetros (Load parameters). 1.2.2. Descripcin espacial
En esta seccin se estudia las estadsticas descriptivas de la distribucin espacial; haciendo clip en la pestaa spatial description, se abre la ventana que muestra las pestaas para la descripcin espacial (spatial description), anlisis de distancia I y II (distance analysis), y anlisis de puntos calientes I y II (Hot Spot). A continuacin describimos brebemente cada una de estas rutinas: Descripcin espacial Esta pestaa descripcin espacial (spatial description) nos proporciona las estadstica que describe la distribucin espacial total. Los estadsticos que estudiamos en esta seccin a veces son llamados estadsticos espaciales de primer-orden, globales. Hay cuatro rutinas que describen la distribucin espacial, y dos rutinas para describir autocorrelacin espacial. Las variable intensidad y ponderacin puede ser utilizada por las primeras tres rutinas. La variable intensidad es necesaria para las rutinas de autocorrelacin espacial; la variable ponderacin tambin puede ser usada por las rutiunas de ndice autocorrelacin espacial. Todo los resultados pueden guardarse como archivos de texto. Algunos salidas o resultados se pueden guardar como objetos grcos, para ser importardos por programas de Sistemas de informacin geograca SIG. Media Central y Distancia Estndar (Mcsd) La media central y la distancia estndar denen la ubicacin de la media aritmtica y el grado de dispersin de la distribucin. La rutina Mcsd calcula 9 estadsticos: 1. El tamao de la muestra. 2. Los valores mnimos de X e Y. 3. Los valores mximo de X e Y.
15
4. Las coordenadas de la media central (X e Y). 5. La desviacin estndar de las coordenadas X e Y. 6. Las coordenadas X e Y de la media geomtrica. 7. Las coordenadas X e Y de la media armnica. 8. La desviacin de la distancia estndar, en metros, pies y millas. Esta es la desviacin de la distancia estndar de media central a cada punto. 9. El crculo de rea (area circular) denida por la desviacin de distancia estndar, en metros cuadrados, pies cuadrados y millas cuadradas. La salida tabular y la media central (media de X, media de Y) pueden imprimirse. La media geomtrica, la media armnica, las desviaciones estndar de las coordenadas X e Y, y la desviacin de la distancia estndar se pueden obtener en archivo u objetos grcos en formatos para ArcView Shp, MapInfo mif, Atlas*GIS bna; pero debe darle un nombre de raz a cada uno. La media central, la media geomtrica y la media armnica salen como un punto con nombre del archivo (MC <root name>), (GM <root name>) y (HM <root name>) respectivamente. La desviacin estndar de las coordenadas X e Y salen como un rectngulo (XYD <root name>). La desviacin de distancia estndar sale como un crculo (SDD<root name>). Elipses de desvo estndar (Standard Deviational Ellipse) (Sde) El Elipse de desvo estndar dene la dispersin y la direccin (orientacin) de la distribucin. Esta rutina calcula 9 estadsticos: 1. El tamao de la muestra. 2. El ngulo de rotacin del Y-eje, medido en grado en sentido de las agujas del reloj. 3. La proporcin de largo a corto despus de los ejes, despus de rotacin. 4. La desviacin estndar a lo largo de los nuevos ejes X e Y. 5. La longitud de los ejes X e Y.
16
6. El rea de la elipse denida por los ejes X e Y. 7. La desviacin estndar a lo largo de los ejes X e Y. 8. La longitud de los ejes X e Y, para dos desviacin estndar elipsoidal 2X. 9. El rea para dos desviacin estndar elipsoidal (2X) denido por estos ejes Las salida tabular se puede ser impresa, y los resultados de 1X y 2X desviaciones estndar elipsoidal o Elipse de desvo estndar, se puede obtener como como archivos u objetos grcos en formatos para ArcView Shp, MapInfo mif, Atlas*GIS bna; proporcionandole un nombre de raz (origen). La desviacin estndar eclipse de 1X es una salida como un elipse (SDE <root name>). La desviacin estndar elipse de 2X es una salida como un elipse con ejes dos veces mas grande que la desviacin estndar elipse 1X (2SDE <root name>). Si la data est distribuida normalmente, entonces una desviacin estndar elipse (1X) captura aproximadamente el 68 % de los casos, y dos desviacin estndar elipse (2X) captura aproximadamente el 95 % de los casos, sin embargo, cualquier distribucin puede desviarse de considerablemente de la forma normal y los porcentajes reales pueden variar. La mediana Central (MdnCntr) La mediana central es la interseccin de las medianas de las coordenadas X e Y, esta aproximadamente en el medio de la distribucin. Sin embargo, la mediana central depende de la orientacin de los ejes, por lo que debe utilizarse con precaucin. Esta rutina (MdnCntr) proporciona 3 estadsticos: 1. El tamao de la muestra. 2. La mediana de X. 3. La mediana de Y. Los resultados tabulares pueden imprimirse, y la mediana central puede salir como objeto grco o archivo para ArcView shp, MapInfo mif o Atlas*GIS bna, proporcionandole un nombre de raz (origen). La mediana 17
central sale como un punto con nombre del archivo (MdnCntr <root name>). Centro de mnima distancia (Mcmd) El centro de mnima distancia dene el punto para el cual la distancia a todos los dems puntos es mnima. Esta rutina (Mcmd) proporciona 5 estadsticos: 1. El tamao de la muestra. 2. Las medias de las coordenadas X e Y. 3. El nmero de iteraciones requeridas para identicar el centro. 4. El grado de error (tolerancia) para detener las iteraciones. 5. Las coordenadas X e Y que denen el centro de mnima distancia. La salida tabular puede imprimirse, y el centro de mnima distancia puede salir como objeto grco o archivo para ArcView .shp, MapInfo .mif o Atlas*GIS .bna, proporcionndole un nombre de raz (origen). El centro de mnima distancia sale como un punto y con nombre (Mdn<root name>). Media Direccional y Varianza (Mcmd) La media direccional o angular y la varianza, son propiedades de la medida angular. La media angular es un ngulo denido a partir del Norte: 0 grados. La varianza direccional es un indicador relativo, que vara de 0 (sin variacin) a 1 (mxima variacin). Tanto la media angular como la varianza direccional pueden calcularse a travs de las coordenadas direccionales (angulares) o a travs de coordenadas X e Y. Si el archivo principal presenta coordenadas direccionales (ngulos de 0 a 360 grados),la media angular se calcula directamente a partir de los ngulos. Una variable distancia opcional puede ser incluida. En este caso, la rutina media direccional proporciona la salida de cinco estadsticos: 1. El tamao de la muestra. 2. La media angular sin ponderacion. 18
3. La media angular ponderada. 4. La varianza circular sin ponderacin. 5. La varianza circular ponderada. Por otro lado, si en el archivo primario los incidentes se denen en coordenadas X e Y, los ngulos son denen en relacin con el origen de referencia (ver archivo referencia), y ngulo medio se convierte en una ecuacin. En este caso, la rutina media direccional ofrece nueve estadsticos: 1. El tamao de la muestra; 2. La media angular no ponderada 3. La media angular ponderada 4. La variancia circular no ponderada 5. La variancia circular ponderada 6. la distancia media 7. La interseccin de la media angular y la distancia media (media direccional). 8. Las coordenadas X e Y de la media triangular. 9. Las coordenadas X e Y de la media triangulados ponderada. La media direccional y media triangulada se pueden guardar como archivos ArcView .shp, MapInfo .mif, o Atlas*GIS .bna. La media direccional no ponderada, la interseccin de media angular y la distancia media sale con el prejo Dm, mientras que la posicin (ubicacin) de la media triangular no ponderada sale con el prejo Tm. La media triangulada ponderada sale con prejo TmWt. Los resultados tabulares se pueden imprimir. Capsula Convexa (Chull) La Capsula Convexa dibuja un polgono en torno a los puntos exteriores de la distribucin. Es til para ver la forma de la distribucin. Esta rutina proporciona tres estadsticos: 19
1. El tamao de la muestra. 2. El nmero de puntos en la capsula convexa. 3. Las coordenadas X e Y para cada uno de los puntos en la capsula convexa. La capsula convexa se pueden guardar como archivo para ArcView shp, MapInfo mif, o Atlas*GIS bna con el prejo Chull. Autocorrelacin espacial En esta seccin de Autocorrelacin espacial (Spatial autocorrelation) se presentan dos indices de autocorrelacin espacial, ndice de Moran y el ndice de Gearys; adems se presenta tambin el correlograma de Moran. Los ndices de autocorrelacin espacial permiten identicar si los puntos de localizacion estan o no relacionados espacialmente (es decir, en cluster o dispersos). Ambos rutinas requieren la variable intensidad en el archivo principal. Estadstico I de Moran (MoranI)
El ndice o estadstico I de Moran, es el indicador clsico de autocorrelacin espacial. Se trata de un ndice de covarianza entre los diferentes puntos de localizacin, similar al coeciente de correlacin (producto momento), su valor se encuentra entre -1 y 1. Esta rutina calcula seis estadsticos: 1. El tamao de la muestra. 2. El ndice de Morans "I". 3. El valor esperado del ndice "I" (valor aleatorizado espacialmente). 4. La desviacin estndar del ndice "I". 5. Una prueba de signicacin para "I", bajo el supuesto de normalidad (Z-test) 6. Una prueba de signicacin para "I", bajo el supuesto de la aleatorizacin (Z-test).
20
Los valores del ndice superiores al valor esperado "I", indican cluster, mientras que los valores inferiores al valor esperado, indican dispersin. La signicancia de la prueba indica si esas diferencias son mayores a las esperadas por azar. Los resultados se pueden imprimir. Ajuste para las pequeas distancias Si se selecciona esta pestaa (Adjust for small distances), las pequeas distancias son ajustados de manera que la distancia mxima ponderada es 1. De esta forma se garantiza que el ndice "I", no sea excesivamente grande para puntos que se encuentran muy prximos entre s. Por defecto la conguracin no es ajustada. El C de Geary El estadstico C Geary, es un indicador alternativo de autocorrelacin espacial. Se trata de un ndice de comparacin entre los diferentes pares de localizaciones. Vara de 0 a 2, cero para valores similares y dos para valores dismiles. La rutina Geary calcula 5 las estadsticos: 1. El tamao de la muestra. 2. El ndice C de Geary. 3. El valor esperado C (valor espacialmente aleatorizado). 4. La desviacin estndar de C. 5. Una prueba de signicacin para C, bajo el supuesto de normalidad (Z-test). Los valores de C inferior al valor esperado indicar cluster, mientras que los valores de C mayor al valor esperado indican la dispersin. La signicancia de la prueba indica si esas diferencias son mayores al valor esperado por azar. Los resultado se pueden imprimir. Ajuste para las pequeas distancias Si se selecciona esta pestaa (Adjust for small distances), las pequeas distancias son ajustados de manera que la distancia mxima ponderada es 1. 21
Esto asegura que el ndice C, no sea excesivamente grande para puntos que se encuentran muy prximos. Por defecto la conguracin es no ajustada. Correlograma de Moran El Correlogram de Moran calcula el ndice de Morans "I"(no ajustado para las pequeas distancias), para diferentes intervalos de distancia. El usuario puede seleccionar cualquier nmero de intervalos de distancia. Por defecto son 10 intervalos de distancia. Ajuste para las pequeas distancias Si se selecciona esta pestaa (Adjust for small distances), las pequeas distancias son ajustados de manera que la distancia mxima ponderada sea igual a 1. Esto asegura el ndice de Morans "I" no, sea excesivamente grande o demasiado pequeo para puntos que se encuentran muy prximos. Por defecto la conguracin es no ajustada. Simulacin de intervalos de conanza Mediante una simulacin de Monte Carlo se puede obtener una estimacin aproximada de intervalos de conanza alrededor del indice "I". Seleccionando un nmero especco de simulaciones a ejecutar (por ejemplo, 100, 1000, 10000). La salida incluye: 1. El tamao de la muestra. 2. La distancia mxima. 3. El nmero de intervalos (bins). 4. El punto medio de la distancia bin. 5. El valor "I"de la distancia bin (I[B]). Si la simulacin es ejecuta, la salida incluye:
22
6. El valor mnimo de "I" para la distancia bin. 7. El valor mxima "I"para la distancia bin. 8. El percentil 0,5 para la distancia bin. 9. El percentil 2,5 para la distancia bin. 10. El percentil 97,5 para la distancia bin. 11. El percentil 99,5 para la distancia bin. Los dos pares de percentiles (2.5 y 97.5; 0.5 y 99.5) crean un intervalo de conanza aproximadamente de 5 % y 1 %, respectivamente. Los valores mnimo y mximo de "Irean un intervalo. Los resultados tabulares se pueden imprimir, salvar como archivo de texto o salvados como archivo .dbf. Para Salvar los resultados haga clic en la casilla Save result to, y especique el nombre del archivo. Representacin grca del ndice "I": valores por distancia Un grco que muestra los valores "I" sobre el eje Y, y por distancia bin sobre el eje X; haciendo clic en el botn "Graph", se muestra el grco. El grco muestra la reduccin de la autocorrelacin espacial con la distancia. El grco es til para seleccionar el tipo rutina de interpolacin de kernel simple o Dual, cuando la variable principal es ponderada (ver interpolacin). Anlisis Distancia El anlisis de distancia proporciona estadsticos acerca de las distancias entre los puntos o localizaciones. Esta tcnica es til para identicar el grado de cluster de puntos. Algunas veces es llamado anlisis de segundo orden. El anlisis de distancia se presenta en dos pestaas o ventanas diferentes, anlisis de distancia I y anlisis de distancia II. En la primera ventana hay dos rutinas para describir las propiedades de las distancias. Y la segunda hay cuatro rutinas para calcular distancia de matrices. Anlisis de distancia I
23
En esta seccin se calculan las rutinas de anlisis de vecinos ms cercanos (Nearest Neighbor Analysis) y el estadstico K de Ripley "K" (Ripleys "K" Statistic). Anlisis de vecinos ms cercanos (Nna) El ndice del vecino ms cercano ofrece una aproximacin acerca de si los puntos estn ms agrupados o dispersos de acuerdo a lo que puede esperarse basado en la aleatoriedad. Se compara la distancia promedio de otros puntos ms cercanos (vecino ms cercano), con la distancia esperada espacialmente aleatorizada dividiendo el promedio emprico de la distancia del vecino ms cercano por la distancia esperada (ndice de vecino mas cercano). La rutina del vecino ms cercano requiere que el rea geogrca y la distancia directa ingresen o se indiquen en la ventana "Measurement Parameters". La rutina Nna calcula 10 estadsticos: 1. El tamao de la muestra. 2. La distancia media del vecino ms cercano. 3. La desviacin estndar de la distancia del vecinos ms cercanos. 4. La distancia mnima. 5. La distancia mxima. 6. La distancia media aleatorizada (tanto el rectngulo acotado, como para el rea introducida por el usuario, si es proporcionada). 7. La distancia media dispersa (tanto el rectngulo acotado, como para el rea introducida por el usuario, si es proporcionada). 8. El ndice del vecinos ms cercanos (tanto el rectngulo acotado, como para el rea introducida por el usuario, si es proporcionada). 9. El error estndar del ndice del vecino ms cercanos (tanto el rectngulo acotado, como para el rea introducida por el usuario, si es proporcionada). 10. Una prueba de signicacin para el ndice de los vecinos ms cercanos (Z-test). 24
Los resultados pueden imprimirse, salvarse como archivo de texto o archivo dbf. Nmero de vecinos ms cercanos El K-simo ndice del vecino mas cercano compara la distancia promedio del K-simo punto ms cercano con la distancia esperada espacialmente aleatorizada. Si ms de una vecindad cercana sera calculada, el usuario puede indicar el nmero K de vecindades cercanas a calcular. CrimeStat calcular 3 estadsticos para cada orden especicado: 1. La distancia media del vecinos ms cercano en metros para el orden. 2. La distancia esperada del vecino ms cercano en metros para el orden. 3. El ndice del vecinos ms cercanos para orden. La rutina Nna usar el rea denida por usuario, a menos que esta no se proporcione, en cuyo caso se usar el rectngulo acotado. Los resultados tabulares se pueden imprimir, salvarlo como un archivo de texto o como archivo .dbf. Anlisis del vecino lineal ms cercano El ndice lineal del vecino ms cercano proporciona una aproximacin en cuanto a si los puntos estn mas cercanos o dispersado a lo largo caminos de segmentos, de lo que se esperara en condiciones aleatorias. Seleccionando la distancia indirecta (Manhattan) e introduciendo la longitud total de la red de camino, en la ventana parmetros de medida (Measurement Parameters), la rutina Nna calcular el vecino lineal ms cercano calcular (cuando la casilla est marcada). El ndice del vecino lineal ms cercano es la relacin emprica del promedio de distancia del vecino lineal ms cercanos con la distancia lineal esperada al azar. La rutina Nna calcula 9 estadsticos para los ndice del vecinos lineales ms cercanos: 1. El tamao de la muestra. 2. La distancia media lineal del vecinos ms cercanos en metros, pies y millas. 25
3. La distancia mnima entre los puntos a lo largo de una red grill (red de rejilla). 4. La distancia mxima entre los puntos a lo largo de una red grill (red de rejilla). 5. La distancia media lineal aleatoria. 6. El ndice del vecino lineal ms cercano. 7. La desviacin estndar de la distancia del vecino lineal ms cercanos en metros, pies y millas. 8. El error estndar del ndice del vecinos lineal ms cercano. 9. Una prueba "t" de la diferencia entre la distancia emprica y la esperada del vecino lineal ms cercanos. Nmero de vecino lineal ms cercano La rutina Nna puede calcular el K-simo vecino lineal ms cercanos, y comparar esta distancia con el promedio de la distancia lineal del K-simo punto ms cercano con la distancia esperada espacialmente aleatorizada. Si es necesario ms de un vecino lineal ms cercano a calcular, el usuario puede indicar el nmero de K de vecinos lineal ms cercanos. CrimeStat calcular 3 de estadsticas para cada orden especico: 1. La distancia media del vecinos lineal ms cercano en metros para el orden. 2. La esperanza del vecinos lineal ms cercano en metros para el orden. 3. El ndice del vecino lineal ms cercano para el orden. Correccin de borde del vecino ms cercano La rutina del anlisis del vecino ms cercano (rea o lineal) no se ajusta para subestimar incidentes cerca de la frontera en la zona de estudio. Es posible que haya vecinos cercanos fuera de los lmites que estn ms cerca que la medida o valor del vecino cercano. El anlisis del vecino ms cercano tiene tres opciones para correccin borde: 26
1. No ajustado - Por defecto. 2. Ajuste por rea de estudio como rectngulo. 3. Ajuste por rea de estudio como crculo. La correccion de borde rectangular o circular ajustan la distancia del vecino ms cercano a puntos cerca de la frontera. Si un punto est ms cerca del borde (en rectngulo o crculo) que a la distancia medida del vecino ms cercano, entonces la distancia de borde es tomada como la distancia ajustada del vecina ms cercano. Estadstico K de Ripley El estadstico de Ripleys compara el nmero de puntos en cualquier distancia con nmero esperado espacialmente aleatorio. La cuenta emprica es transformada en funcin de raz cuadrada, llamada L, y es ajustada a la orientacin. Los valores L mayores al lmite superior de las simulaciones indican concentracin, mientras que valores menores al lmite inferior de las simulaciones indican dispersin. El valor L es calculado para cada 100 intervalos de distancia (bins). Esta rutina calcula es 6 estadsticos: 1. El tamao de la muestra. 2. La distancia mxima. 3. 100 distancia bins. 4. La distancia para cada bin. 5. El estadstico transformado, L(t), para cada distancia bin. 6. La esperanza aleatorizada L, bajo completa aleatoriedad espacial, L(csr). Adems, CrimeStat puede estimar la distribucin de muestreo ejecutando simulaciones de Monte Carlo espacialmente aleatoriazada sobre el rea en estudio. Si se especca una o ms simulaciones, la rutina calcula seis estadsticos adicionales: 7. El valor mnimo de L para las simulaciones espacialmente aleatoria. 27
8. El mximo valor de L para las simulaciones espacialmente aleatoria. 9. El percentil 0.5 para el valor L de las simulaciones espacialmente aleatoria. 10. El percentil 2,5 para el valor L de las simulaciones espacialmente aleatoria. 11. El percentil 97,5 para el valor L de las simulaciones espacialmente aleatoria. 12. El percentil 99,5 para el valor L de las simulaciones espacialmente aleatoria. Los resultados tabulares pueden imprimirse, salvarse como archivo texto o como archivo .dbf. Correccin borde del estadstico Ripleys K La conguracin predeterminada (por defecto) para el estadstico Ripleys K es no ajusta a casos cerca de la frontera en zona de estudio. Sin embargo, es posible que haya puntos fuera del rea de estudio que estn ms cerca que el radio de bsqueda que se utiliza para enumerar el K estadstico. El estadstico K Ripley tiene tres opciones de correccin borde: 1. Sin ajuste - Por defecto 2. Un ajuste que asume el rea de estudio como un rectngulo. 3. Un ajuste que asume el rea de estudio como un crculo. La correccion de borde rectangular o circular, para ajustar del estadstico K Ripley en puntos cerca de la frontera. Si la distancia de un punto a la frontera (de un rectngulo o un crculo) es ms pequea que el radio del crculo usado para enumerar los K estadsticos, entonces el punto es ponderado inversamente proporcional al rea del radio de bsqueda que est dentro de la frontera. Salida de resultados intermedios
28
Hay una casilla denominada salida de resultados intermedios (Output intermediate results). Al seleccionada esta casilla, la salida muestra como un archivo ".dbf"que enlista los clculos intermedios. El archivo recibe el nombre de RipleyTempOutput.dbf"; y la salida ofrece cinco resultados: 1. El nmero de puntos (POINT), comenzando en 0 (para el primer punto) y hasta a el N-1 (para el N-sima punto). 2. El radio de bsqueda en metros (SEARCHRADI) 3. La cuenta o nmero de otros puntos que se encuentran dentro del radio de bsqueda (COUNT) 4. El peso asignado, calculando las ecuaciones 5,24 5,28 (WEIGHT). 5. The count times the weight (CTIMESW) Asignar puntos primarios a puntos secundarios Esta rutina asigna a cada punto primario un punto secundario, luego suma el nmero de puntos primarios asignados a cada punto secundario. Es til para aadir el nmero de los puntos primarios que estn cerca de cada punto secundario. For example, in the crime travel demand module, this routine can assign incidents to zones as the module uses zonal totals. El resultado es una cuenta de puntos primarios asociado con cada punto secundario. Tambin es posible sumar diferentes variables secuencialmente. Por ejemplo, en el mdulo demanda viajes de crimen, tanto el nmero de delitos originarios en cada zona, como el nmero de crmenes que ocurren, son necesarios. Esto se puede lograr de dos maneras. Primero, sumando los incidentes por coordenadas de origen en cada zona (secundaria archivo), y en segundo lugar, sumar de los incidentes por coordenadas de destino de cada zona (tambin archivo de secundaria). El resultado sern dos columnas, una muestra el nmero de orgenes en cada zona del archivo secundaria y el segundo muestra el nmero de destinos en cada zona del archivo secundaria. Mtodos de asignacin: Hay dos mtodos para asignar puntos primarios a los puntos secundarios. Asignacin del vecino ms cercano
29
Esta rutina asigna a cada punto primarios los puntos secundarios que estn ms cerca. Si hay dos o ms puntos secundarios que son exactamente iguales, la asignacin va al primero en la lista. Asignacin de Puntos - en - polgono Esta rutina asigna a cada punto primario el punto secundario que cae dentro de su polgono (zona). Deben proporcionarse un archivo shape (polgono) de la zona y la rutina comprueba dentro qu zona secundaria cae dentro cada punto primario. Archivo de zona Un archivo de zona debe ser proporcionado. Esto es un archivo polgono que dene la zona en que los puntos primarios son asignados. El archivo de zona debe ser como el archivo de secundaria (ver en archivo de secundaria). Para cada punto en el archivo primario, la rutina identica a cual polgono pertenece y luego suma el nmero de puntos por polgono. Nombre asignado a la variable Debe especicar el nombre de la variable suma. Por defecto el nombre es FREQ. Uso de un archivo de ponderacin Los registros del archivo primario pueden ser ponderados por otro archivo. Esto ser til para corregir los totales del archivo primario. Por ejemplo, si suponemos que en el archivo primario los incidentes de robo corresponden a un registro de detencin o arresto, la suma de esta variable (por ejemplo, el nmero total de robos) puede producir un sesgo en la distribucin sobre las zonas del archivo secundario, debido a que el archivo principal no proviene de una muestra tomada al azar de todos los incidentes (por ejemplo, si esta informacin proviene de un registro de detencin donde la distribucin de detenciones de robo, no es igual a la distribucin de todos los incidentes de robo). El segundo archivo o cualquier otro archivo puede ser usado para ajustar 30
la suma total. La variable ponderacin debe tener un campo que identique la proporcin o cociente de la verdadera cuenta medida para cada zona. Un valor de 1 indica que el valor suma para cada zona es igual al valor real, por lo que no es necesario un ajuste. Un valor superior a 1 indica que el valor suma debe ser ajustado hacia arriba igualar el verdadero valor. Un valor inferior a 1 indica que el valor suma necesita ser ajustardo hacia abajo para igualar el verdadero valor. Si se utiliza otro archivo para ponderacin, debe indicar el nombre del archivo, ya sea el secundario cualquier otro archivo. Nombre asignado a la variable ponderada Para una suma ponderada, especique el nombre de la variable. Por defecto ser FREQADJ. Almacenar el resultado Para ambas rutinas, la salida es un archivo .dbf. Debe denir el nombre del archivo. Nota: Debe tener cuidado con el uso del mismo nombre del archivo secundario, como el archivo salvado ya que tendr la nueva variable. Lo mejor es darle un nuevo nombre. Una nueva variable ser aadida a este archivo que da el nmero de puntos primarios en cada zona de archivo secundario y, si la ponderacin se utiliza, una segunda variable ser aadida la cual tiene la frecuencia ajustada. Distancia Anlisis II La pestaa del Anlisis de Distancia II (Distance Analysis II), abre una ventana que presenta cuatro rutinas para calcular la matrices distancia: 1. De cada punto primario a cualquier otro punto primario. 2. de cada punto primario a cada punto secundario. 3. De cada punto primario al centroide de cada clula de rejilla del archivo de referencia. Esta requiere denir un archivo de referencia. 31
4. De cada punto secundario al centroide de cada clula de rejilla del archivo de referencia. Esta requiere denir un archivo de referencia. CrimeStat puede calcular las distancias entre los puntos de un solo archivo o las distancias entre los puntos de dos archivos diferentes. Estas matrices pueden ser tiles para examinar la frecuencia de diferentes distancias o para proveer la matriz distancia a otro programa. Matriz distancia: Dentro de un mismo archivo, punto a punto (Matrix) Esta rutina da como resultado la matriz distancia entre los puntos del archivo primario, en unidades de distancia especicas (kilmetros, millas nuticas, pies, kilmetros o metros). La Matiz salida puede guardarse como un archivo distancia de CrimeStat, que puede ser usado para acelerar los clculos en bruto. La matriz de salida tambin puede ser guardado como archivo texto. Matriz distancia: De los puntos del archivo primario a los puntos del archivo secundaria (IMatrix) Esta rutina muestra la distancia entre cada punto del archivo primario a cada uno de los puntos del archivo secundario, con unidad de distancia especicas (kilmetros, millas nuticas, los pies,kilmetros o metros). La salida IMatrix se puede guardar como un archivo distancia de CrimeStat, que puede ser usado para acelerar los clculos en bruto. La salida IMatrix tambin se pueden guardar como archivo texto. Matriz distancia: De los puntos del archivo primarios a la rejilla (PGMatrix) Esta rutina muestra la distancia entre cada punto del archivo principal al centroide de cada celda de rejilla o cuadrcula del archivo referencia. El archivo de referencia debe proporcionarse como externo o denirse en la ventana correspondiente al archivo referencia en CrimeStat. Las unidades de distancia debe ser e especicadas (kilmetros, millas nuticas, pies, kilmetros o metros). La salida puede guardarse como un archivo distancia de CrimeStat; puede ser usado para acelerar el clculo en bruto. La salida tambin se pueden guardar como un archivo texto.
32
Matriz distancia: De los puntos del archivo secundarios a la rejilla (SGMatrix) Esta rutina muestra la distancia entre cada punto del archivo secundaria al centroide de cada celda de la cuadrcula del archivo referencia. El archivo de referencia debe proporcionarse como externo o denirse en la ventana correspondiente al archivo referencia en CrimeStat. Igualmente las unidades de distancia deben ser especicadas (kilmetros, millas nuticas, pies, kilmetros o metros). La salida tambin se pueden guardar como un archivo texto. Anlisis de puntos o zonas calientes I (Hot Spot) El anlisis de puntos o zonas calientes (Hot Spot o clusters) identica los grupos con incidentes semejantes. Este es un mtodo de anlisis de segundo orden que identica el grupo a que pertenecen los puntos. Hay una serie de rutinas diferentes para analizar zonas calientes en CrimeStat, organizadas en dos pestaas diferentes: Anlisis de zonas calientes I (Hot Spot I) y Anlisis de zonas calientes II (Hot Spot anlisis II) Anlisis de zonas calientes I (Hot Spot I) El anlisis de zonas calientes I incluye cuatro rutinas diferentes: 1. El modo (modo). 2. El modo difuso (Fmode). 3. Cluster jerrquica del vecino ms cercano (Nnd). 4. Ajuste del riesgo del cluster jerrquica del vecino ms cercano (Rnnh), El Modo La rutina del Modo (Mode) calcula la frecuencia de incidentes para cada localizacin, denida por las coordenadas X e Y. La salida ser una lista de las localizaciones con sus coordenadas X e Y, y el nmero de incidentes ocurridos en cada una de ellas, clasicadas en orden decreciente, de la frecuencia mas alta a la frecuencia mas baja. Tambin enlista su orden de rango de 1 33
hasta la ltima localizacin. La data puede salir como un archivo dbf. Modo Fuzzy El modo difuso (Fuzzy Mode) calcula la frecuencia de incidentes para cada localizacin dentro de la distancia especicada por el usuario. El usuario debe especicar el radio de bsqueda y las unidades del mismo (kilmetros, millas nuticas, pies, kilmetros, metros). La rutina identica la unicidad de cada localizacin, denida por sus coordenadas X e Y, y calcular el nmero de incidentes que caen dentro del radio de bsqueda. La salida es una lista de las localizaciones con sus coordenadas X e Y, y el nmero de incidentes ocurridos a dentro de cada radio de bsqueda, adems las clasica en orden decreciente desde le ms frecuente a menos frecuente. Asimismo, enlista su rango ordenado de 1 a la ltima localizacin. Los resultados pueden salir como un archivo .dbf. Cluster jerrquico espacial del vecino ms cercanos (Nnh) El clustering jerrquico espacial del vecino ms cercanos (neighbor hierarchical spatial clustering) es una rutina que usa una distancia constante para formar los clusters de puntos, basado en la proximidad espacial. El usuario debe denir la distancia y el nmero mnimo de puntos que se requieren para cada grupo, y una salida para mostrar el tamao de los grupos con elipses. La rutina identica las agrupaciones de primer orden, que representan grupos de puntos que estn mas cerca, y en el que hay por lo menos el nmero mnimo de puntos especicados por el usuario. El clustering es jerrquica en sentido de que las agrupaciones de primer orden son tratados como puntos separados, para ser agrupados en un segundo orden de clusters, y el segundo orden de agrupaciones son tratadas igualmente como puntos separados, que se agrupan en un tercer orden de clusters, y as sucesivamente. Los clusters de orden superior sern identicados slo si la distancia entre sus centros esta ms cerca que la nueva de distancia. Los resultados tabulares pueden imprimirse, salvarse como archivo texto, o como archivo dbf. Adems, los resultados pueden salir como objetos grcos tipo elipses o cpsulas convexas (o ambos) para ArcView .shp, MapInfo .mif o Atlas*GIS .bna. Debe seleccionar los nombres por separado para los archivos de elipse y casco convexo. 34
Esta rutina ofrece seis resultados para cada clusters que se calcula: 1. El orden jerrquico y el nmero de clusters. 2. La media central del clusters (media X, media Y). 3. El elipse de desviacin estndar del cluster (la rotacin y longitud de los ejes X e Y). 4. El nmero de puntos en el cluster. 5. El rea del cluster. 6. La densidad del cluster (puntos divididos por rea). Distancia umbral del Nnh La distancia umbral es el radio de bsqueda alrededor de un par de puntos. Para cada par de puntos, la rutina determina si ellos estn ms cercanos que el radio de bsqueda. Hay dos formas para determinar el radio de bsqueda o distancia (Nnh threshold distance): La distancia aleatoria del vecino ms cercana En primer lugar, la distancia de bsqueda es elegida al azar de la distancia del vecinos ms cercano. Por defecto el valor es igual a 0,1 (es decir, menos del 10 % de los pares se puede esperar que se encuentren ms cerca por casualidad). Los Pares de puntos que estn ms cerca que la distancia umbral se agrupan, mientras que los pares de puntos que estn a mayor distancia que la distancia umbral se ignoran. Cuanto menor sea el nivel de signicacin que se ha seleccionado, menor es el umbral de la distancia y, por lo general, el menor es nmero de pares que sern seleccionados. Por otra parte, la eleccin de un nivel mayor de signicacin, ms grande es distancia umbral y, por lo general, ms parejas de puntos sern seleccionados. Sin embargo, cuanto ms alto es el nivel de signicacin elegido, mayor ser la probabilidad de que los clusters sean agrupados al azar. La barra deslizante se utiliza para ajustar el nivel de signicacin. Moviendo la barra deslizante hacia la izquierda se elige una distancia umbral 35
menor, y hacia la derecha para elegir una distancia umbral mayor. Distancia ja En segundo lugar, se puede usar una distancia ja. Por defecto es de una milla. En este caso, el radio de bsqueda utiliza la distancia ja y la barra deslizante es inoperante. Nmero mnimo de puntos Nnh Esta pestaa permite al usuario especicar el nmero mnimo de puntos para cada grupo. El valor por defecto es 10 puntos. Las restricciones sobre el nmero de clusters puede ser colocado mediante la denicin de un nmero mnimo de puntos que son requeridos. Si hay muy pocos puntos permitidos, entonces habr muchos grupos pequeos, y al aumentar el nmero de puntos requeridos, el nmero de clusters se reduce. Salida de Elipse Los resultados pueden salir como objetos grcos en forma de elipse, en formato de archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. El prejo ser NNH1 para la elipse de primer orden, NNH2 para las elipses de segundo orden elipses, y "NNH3 para la elipse tercer orden. Para elipses de orden mayor incluirn slo el nmero ndice. El tamao de elipse Nnh El tamao del cluster puede ser ajustado con la barra deslizante en la parte inferior de la ventana, especicando el nmero de desviaciones estndar del elipse: una desviacin estndard (1X), desviacin estndar y media (1.5xy), o dos desviaciones estndar (2X). Por defecto el valor es igual a una desviacin estndar. Generalmente, una desviacin estndar cubrir ms de la mitad de los casos, mientras que dos desviaciones estndar cubrir ms del 99 % de los casos, aunque el porcentaje exacto depender de la distribucin. Para seleccionar el nmero de desviaciones estndar para las elipses, use la barra deslizadora. Los archivo de salida se guarda como NND<nmero><root name>; el nmero es el orden del clustering (es decir, 1, 2), el nombre debe ser proporcionado por el usuario. 36
Las restricciones sobre el nmero de clusters puede ser denidos por el nmero de puntos requeridos. El valor por defecto es 10. Si se elige un nmero muy pequeo de puntos, entonces habr muchos grupos pequeos; si embargo, al aumentar el nmero de puntos por requeridos, el nmero de clusters se reducir. Salida de cluster como capsula convexa Tambin los clusters pueden mostrarse como objeto graco en forma de capsula convexa en archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. El nombre del archivo de salida debe especicarse, este saldr con un prejo CNNH1 para el primer orden de agrupacin, un CNNH2 para el segundo orden, CNNH3 para la agrupacin de tercer orden. Para clusters de mayor orden slo incluirn el nmero ndice. Debe especicarse un nombre para el archivo. Ejecutando la simulacin Nnh Mediante una simulacin de Monte Carlo se puede estimar una aproximacin por intervalo de conanza alrededor del clusters de primer orden de Nnh; para el cluster de segundo orden y los orden superior no son simuladas, ya que su estructura depende del cluster de primer orden. El usuario debe especica el nmero de corridas para simulacin y Cluster Nnh es calculado para datos asignados en forma aleatoriamente. La salida aleatoria es ordenada y se calculan los percentiles. La salida incluye los clusters de primer orden, el rea, el nmero de puntos, y la densidad. Doce percentiles son identicados para estas estadsticas: 1. El Mnimo para las simulaciones espacialmente aleatorias 2. El mximo para las simulaciones espacialmente aleatorias 3. El percentil 0.5 para las simulaciones espacialmente aleatorias 4. El percentil 1 para las simulaciones espacialmente aleatorias 5. El percentil 2.5 para las simulaciones espacialmente aleatorias 6. El percentil 5 para las simulaciones espacialmente aleatorias 37
7. El percentil 10 para las simulaciones espacialmente aleatorias 8. El percentil 90 para las simulaciones espacialmente aleatorias 9. El percentil 95 para las simulaciones espacialmente aleatorias 10. El percentil 97,5 para las simulaciones espacialmente aleatorias 11. El percentil 99 para las simulaciones espacialmente aleatorias 12. El percentil 99,5 para las simulaciones espacialmente aleatorias Estos percentiles permiten una prueba de signicancia de una cola o dos colas. Por ejemplo, para un 5 % la prueba de una cola utiliza el percentil 95, mientras que para el 5 % una prueba de dos colas utiliza los percentiles 2.5 y 97.5. La data simulada utilizada pueden ser vista marcando en ventana Opciones, la casilla Dump simulation data. Ajuste del Riesgo de clusters espacial jerrquico del vecino ms cercano (Rnnh) El ajuste del Riesgo del clusters espacial jerrquico del vecino ms cercano (Rnnh) es una rutina que agrupas los puntos muy cercanos basandose en la proximidad espacial, pero la agrupacin es ajusta de acuerdo a la distribucin de una variable de referencia. La rutina requiere los dos archivos primario y secundario,(por ejemplo, robos a mano y el segundo archivo,la poblacin). En el segundo archivo en caso de usar la variable intensidad o peso debe ser especicada. El usuario selecciona una probabilidad umbral para agrupar al azar, un par de puntos muy cercanos, el mnimo nmero de puntos que se requieren para cada grupo, y el tamao de salida para mostrar los clusters con elipses. Adems, un modelo de densidad de kernel para la variable secundaria debe ser especicado. La distancia umbral es determinada por la probabilidad umbral, y la densidad de celda en la grilla es producida por la estimacin de densidad del ncleo de la variable secundaria. As, en zonas o reas con alta densidad de la variable secundaria, la distancia umbral es menor que en reas con baja densidad en la variable secundaria.
38
La rutina identica clusters de primer orden, que representa grupos de puntos que estn muy cercanos con la distancia umbral y en el que se encuentra por lo menos el mnimo nmero de puntos especicados por el usuario. El clustering es jerrquica en sentido en que las agrupaciones de primer orden son tratados como puntos separados, para ser agrupados en un segundo orden de clusters, y el segundo orden de agrupaciones son tratadas igualmente como puntos separados, que se agrupan en un tercer orden de clusters, y as sucesivamente. El clusters de orden superior es identicado slo si la distancia entre sus centros es menor que la nueva distancia umbral. Los resultados se pueden imprimir, salvar como archivo texto, o como un archivo .dbf. Los resultados grcos como elipses o cascos convexo (o ambos) pueden salir como archivos para ArcView .shp, MapInfo .mif o Atlas*GIS .bna. Los archivos de salida tanto para elipse como para casco convexo deben tener nombres diferentes. La rutina muestra seis resultados para cada cluster que calcula: 1. El orden jerrquico y el nmero de agrupacin. 2. La media central del clusters (media X y media Y). 3. El elipse de desviacin estndar del cluster (la rotacin y longitud de los ejes X e Y). 4. El nmero de puntos en el cluster. 5. El rea del cluster 6. La densidad del cluster (puntos dividido por rea). Distancia umbral Nnh La distancia umbral es el intervalo de conanza alrededor de la distancia esperada (aleatoria) para un par de puntos. Sin embargo, a diferencia de la rutina Nnh dnde la distancia umbral es constante a lo largo del rea en estudio, en rutina Rnnh la distancia umbral se ajusta inversamente proporcional a la distribucin de la secunda variable. En las zonas con una alta densidad en la variable secundaria, la distancia umbral ser pequea, mientras que en reas con baja densidad en la variable secundaria, la distancia umbral ser 39
mayor. El probabilidad umbral por defecto es de 0,1 (es decir, menos del 10 % de los pares que se espera se encuentren muy cerca bajo). Los Pares de puntos que estn ms cerca que la distancia umbral se agrupan, mientras que los pares de puntos que estn a mayor distancia que la distancia umbral se ignoran. Cuanto menor sea el nivel de signicacin que se ha seleccionado, menor ser la distancia umbral y, por lo general, menor nmero de pares sern seleccionados. Por otra parte, la eleccin de un nivel mayor de signicacin, mayor ser la distancia umbral y, por en general, ms pares sern seleccionados. Sin embargo, cuanto ms alto sea el nivel signicacin elegido, mayor sera la probabilidad que los clusters sean agrupaciones alzar. La barra deslizante se utiliza para ajustar el nivel de signicacin. Para elegir una menor distancia umbral mueva la barra deslizante hacia la izquierda y hacia la derecho para escoger una mayor distancia umbral. Parmetros de riesgo Rnnh Una estimacin de densidad de la variable secundaria debe ser calculada para ajustar la distancia de umbral de la variable primaria. Esto se hace a travs de la estimacin de densidad del kernel. En la pestaa parmetros de riesgo (risk parameters) se dene este modelo. La segunda variable automticamente se asume que debe ser la variable riesgo variable . Si se debe usar la variable ponderada o intensidad en el archivo secundario, esta debe seleccionarse. El usuario debe especicar el mtodo de interpolation de kernel (normal, uniforme, quartic, triangular o exponencial negativo), y seleccionar el ancho de banda (intervalo jo o adaptable). Si el intervalo de adaptacin es utilizado, el tamao muestra mnimo para el ancho de banda (radio de bsqueda) debe ser especicado. Si se usa un intervalo jo, el tamao del intervalo (radio) debe ser especicado junto con las unidades de medida (kilmetros, millas nuticas, pies, kilmetros, metros). Por ltimo, las unidades de la densidad para la salida debe ser especicado (millas al cuadrado, cuadrado millas nuticas, pies cuadrados, kilmetro cuadrado, metros cuadrados). La rutina superpone una rejilla de 50 x 50 grillas en el rea de estudio y calcula una estimacin de densidad de kernel de la variable secundaria. La densidad es entonces re-escalada para igualar el tamao de muestra de la variable primaria. Para cada celda, una distancia umbral especca es calculada 40
para agrupar en pares de puntos al azar. La probabilidad umbral seleccionada por el usuario se aplica a esta distancia umbral especca de cada celda para producir una distancia umbral que corresponde al intervalo de conanza. Los pares de puntos que estn ms cercanos que la distancia umbral especca de cada celda son seleccionados para el cluster de primer orden. Nmero mnimo de puntos Rnnh La casilla mnimo de puntos por clusters (minimum points for clusters) permite al usuario especicar un nmero mnimo de puntos para cada grupo. El valor por defecto es 10 puntos. El tamao de salida para los clusters puede ser ajustado por la segunda barra deslizante, mediante nmero de desviaciones estndar denidas para los elipse; de una desviacin estndar (el valor predeterminado) a tres desviaciones estndar. Generalmente, una desviacin estndar cubre aproximadamente el 65 % de los casos, mientras tres desviaciones estndar cubrir ms del 99 % de los casos. Salida como Elipse Los resultados se pueden salir como objeto grco tipo elipse como archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. El prejo ser RNNH1 para la elipse de primer orden, RNNH2 para la elipses de segundo orden, y RNNH3 para la elipse de tercer orden. Para elipse de orden superior slo cambia el nmero ndice. Tamao de salida de elipse para Rnnh La salida del tamao del cluster se puede ajustar en la parte inferior de la ventana con la barra deslizante. Con la barra deslizadora (number of standard deviations for the ellipses) se especica el nmero de desviaciones estndar del elipse que se calcula para cada cluster: una desviacin estndar, una desviaciones estndar y media (1.5xy), o dos desviaciones estndar (2X). Por defecto es una desviacin estndar. Generalmente, una desviacin estndar servirn para cubrir los ms de la mitad de los casos, mientras que dos desviaciones estndar se cubrir ms del 99 % de los casos, aunque el porcentaje exacto depender de la distribucin. El archivo de salida se guarda como Rnnh <nmero><root name>. El nmero es el orden del cluster (es decir, 1, 2), mientras que el nombre raz es proporcionado por el usuario. 41
La restricciones sobre el nmero de clusters puede ser colocado mediante la denicin del nmero mnimo de puntos necesarios. Por defecto el valor es 10. Si se permiten muy pocos puntos, entonces habr muchos grupos pequeos, y al aumentar el nmero de puntos necesarios, el nmero de clusters se reducir. Cluster de salida como capsula convexo Los cluster tambin pueden salir como objeto grco tipo cpsula convexa en archivos para ArcView .Shp, MapInfo .mif o Atlas*GIS .bna. Debe especicarse el nombre del archivo, este sale con un prejo CRNNH1, para el cluster de primer orden, con CRNNH2 para el cluster de segundo orden, y CRNNH3 para el cluster de tercer orden; y para clusters de orden superior slo se cambia el nmero ndice. Ejecutar una simulacin Rnnh Una simulacin de Monte Carlo puede ser ejecutar para obtener una estimacin del conanza intervalos de alrededor del cluster de primer orden; para el cluster de segundo orden y de orden superior no se puede simularse, ya que su estructura depende del cluster de primer orden. El usuario especica el nmero de simulaciones a ejecutar y el cluster Rnnh es calculado para datos asignados al azar. La salida aleatoria es ordenada y los percentiles son calculaddos. La salida incluye el nmero de cluster de primer orden, el rea, el nmero de puntos, y la densidad. Doce percentiles se identican para estas estadsticas: 1. El mnimo para la simulacin Rnnh 2. El mximo para la simulacin Rnnh 3. El percentil 0,5 para la simulacin Rnnh 4. El percentil 1 para la simulacin Rnnh 5. El percentil 2,5 para la simulacin Rnnh 6. El percentil 5 para la simulacin Rnnh 42
7. El percentil 10 para la simulacin Rnnh 8. El percentil 90 para la simulacin Rnnh 9. El percentil 95 ppara la simulacin Rnnh 10. El 97,5 percentil para la simulacin Rnnh 11. El percentil 99 para la simulacin Rnnh 12. El 99,5 percentil para la simulacin Rnnh La data simulada que se usa se puede ver marcando la casilla Salida de la Data simulada Dump Simulation Data en la ventana Optiones. Anlisis de puntos o zonas calientes II (Hot Spot II) La pestaa Anlisis puntos calientes II (Hot Spot Analysis II) incluye tres rutinas diferentes: 1. Anlisis espacio temporal del Crimen (STAC) 2. Cluster de K-Medias 3. Estadstico local de Moran como el de Anselin. Anlisis espacio temporal del Crimen (STAC) El anlisis espacio y tiempo del Crimen (Spatial and Temporal Analysis of Crime) es una rutina de cluster de distancia-variable. Inicialmente los grupos de puntos cercanos son agrupados sobre la base de un radio de bsqueda constante, pero luego se combina grupos que se superponen. En la pestaa "STAC Parameters", se dene un radio de bsqueda, el nmero mnimo de puntos que se requieren para cada grupo, y el tamao de los clusters para mostrar con elipses. Los resultados pueden ser impresos, guardado en archivo de texto, como un archivo .dbf, o como objeto grco tipo elipses o capsula convexa en formato de archivo para Review .Shp, MapInfo .mif o Atlas*GIS .bna. La rutina de seis productos los resultados de cada grupo se calcula que: 1. El orden jerrquico y el nmero de cluster. 43
2. La media central del grupo (media de X y Media de Y). 3. La deviational estndard de elipse del cluster (la rotacin y la longitud de las X e Y ejes). 4. El nmero de puntos en el cluster. 5. El rea de la elipse. 6. La densidad de la elipse (puntos en elipse dividido por rea). Parmetros STAC La pestaa parmetros de STAC (STAC parameters) permite seleccionar un radio de bsqueda, el nmero mnimo de puntos por clusters, el tipo de bsqueda, denicin de la frontera, el nmero simulaciones ha ejecutar, y el tamao de elipses de STAC. Radio de bsqueda de STAC El radio de bsqueda es la distancia dentro de la rutina de bsquedas de STAC. El valor por defecto es de 0,5 millas. Una rejilla de 20x20 cubre el rea de estudio. En cada interseccin entre la y columna, la rutina cuenta todos los puntos que se encuentra a menor distancia que el radio de bsqueda. La superposicin de crculos se combinan para formar cluster de tamao variables. En Cuanto ms pequeo sea radio de bsqueda seleccionado, menos puntos por clusters sern seleccionados. Por otra parte, la eleccin de un radio mayor de bsqueda, ms puntos sern seleccionados. Sin embargo, cuanto mayor sea el radio de bsqueda, mayor ser la probabilidad de que los cluster puedan ser agrupados al azar. En la pestaa parmetros de STAC (STAC Parameters), introduzca el radio de bsqueda en la casilla e indique las unidades de medida (millas, millas, pies, kilmetros, metros). Tipo de busqueda del STAC El tipo de busqueda (scan type) es un tipo de rejilla que cubre el rea en estudio. Hay dos opciones: rectangular (por defecto) y triangular. Lmite de rea en STAC
44
Los lmites del rea de estudio pueden ser denidas a partir del conjunto de datos o de la red de referencia. El nmero mnimo de puntos en STAC El usuario debe especicar el nmero mnimo de puntos necesarios para cada cluster (minimum points for clusters). Por defecto son 5 puntos. Si se elige muy pocos puntos, habr muchos clusters pequeos; sin embargo, aumentar el nmero de puntos requeridos, el nmero de clusters se reducir. En la pestaa STAC Parmetros, escriba el nmero mnimo de puntos requeridos para cada cluster. Tamao de salida de elipses para el STAC El tamao de salida del cluster como elipse puede ser ajustado por la barra deslizante. La rutina de salida del elipses puede ser una desviacin estndar (1X), desviacin estndar y media (1.5X), y dos deviational estndar (2X). Generalmente, si los datos tienen distribucion normal, una desviacin estndar cubrir aproximadamente el 50 % de los casos, mientras que dos desviaciones estndar cubrir ms de un 99 % de los casos, sin embargo, el porcentaje real puede diferin. En la parte inferior de la ventana STAC Parmetros, deslice la barra para seleccionar el nmero de desviaciones estndar del elipse. El archivo de salida es guardado como ST<nombre raz>. El nombre raz debe ser proporcionado por el usuario. Salida de cluster como Convexo casco Los cluster tambin pueden salir como objetos grcos tipo cpsulas convexas en formato de archivo para ArcView .shp, MapInfo .mif o Atlas*GIS .bna. Debe especicar un nombre para el archivo, que saldr con un prejo CST. Ejecutar una simulacin STAC Una simulacin de Monte Carlo se puede correr para estimar un intervalo de conanza alrededor del cluster del STAC. El usuario especica el nmero 45
de simulaciones ha ejecutar y el clustering del STAC es calculado para datos asignados al azar. La salida es ordenada y los percentiles son calculados. El resultado incluye el nmero de clusters, el rea, el nmero de puntos, y la densidad. Doce estadsticos muestra esta rutina: 1. El mnimo de simulaciones. (The minimum for the spatially random simulations) 2. El mximo de simulaciones. 3. El percentil 0.5 para la simulacin. 4. El percentil 1 para la simulacin. 5. El percentil 2.5 para la simulacin. 6. El percentil 5 para la simulacin. 7. El percentil 10 para la simulacin. 8. El percentil 90 para la simulacin. 9. El percentil 95 para la simulacin. 10. El percentil 97.5 para la simulacin. 11. El percentil 99 para la simulacin. 12. El percentil 99.5 para la simulacin. Los diez estadsticos permiten una prueba de una o dos colas. Por ejemplo, para un 5 % una prueba de una cola usa el percentil 95, mientras el 5 % que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. Los datos simulados que se usan pueden ser vistos en la ventana Opciones seleccionando la casilla Dump simulation data. Clusters de K-means (KMeans) La rutina clusters de K-means es un procedimiento para agrupar los puntos en K grupos, donde K es un nmero asignado por el usuario. La rutina encuentra K lugares, en los que asignan los puntos al lugar ms cercano. Por defecto el valor es igual a 5. Si K es pequeo, los grupos se suelen cubrir 46
areas muy grandes. El los resultados tabutares pueden ser impresos, guardados en un archivo de texto, o salir como archivo dbf. Los resultados grcos puede salir como elipses o casuplas convexas (o ambos) en formatos de archivos para ArcView .Shp, MapInfo .mif, Atlas*GIS bna. Los nombres para la elipse y la capsula convexa deben ser proporcionados por el usuario, de manera separada. Localizaciones de clusters inicial La rutina comienza con un supuesto inicial (la semilla) para los K lugares, y luego lleva a cabo la optimizacin local. El usuario puede modicar la ubicacin de los clusters iniciales de dos maneras: 1. La separacin entre los clusters iniciales pueden disminucin o incrementarse. Hay una escala de separacin con valores predenidos de 1 a 10; por defecto el valor es 4; sin embargo, el usuario puede seleccionar cualquier nmero; no obstante, al aumentar el nmero, aumenta la separacin entre las posiciones de los cluster iniciales, mientras que disminuyendo el nmero, disminuye la separacin. 2. El usuario tambin puede denir las localizaciones iniciales y el nmero k de clusters, con el archivo de secundario. La rutina toma el nmero de puntos del archivo secundario y las coordenadas X/Y de los puntos como las posiciones iniciales de los k clusters iniciales. Tamao de salida de los clusters de K-means como elipses Para ambos mtodos, el tamao de salida del cluster como elipses puede ser ajustado por la barra deslizante. El resultado de la rutina puede salir como elipses con una desviacin estndar (1X), con desviacin y media (1.5X), y con dos deviational estndar (2X). Generalmente, si los datos estn distribuidos aleatoriamente, una desviacin estndar cubrir aproximadamente el 50 % de los casos, mientras que dos desviaciones estndar cubrir del 99 % de los casos, sin embargo, los porcentajes reales pueden variar. Deslice la barra para seleccionar el nmero de desviaciones estndar de la elipse. El archivo de salida es guardado como KM<root name>. El nombre 47
raz debe ser proporcionado por el usuario. Salida de los clusters como casco Convexo Los clusters tambin pueden salir como casco convexo en archivo para ArcView shp, MapInfo mif o ATLAs*SIG bna. Debe especique el nombre del archivo, el cual saldr con un prejo CKM. Estadstico Local de Anselin El estadstico local de Moran Anselin (Anselins local Moran) aplica el estadstico I de Moran a puntos individuales (o zonas), para evaluar si puntos (o zonas) estn espacialmente relacionados con puntos cercanos (o zonas vecinas). El estadstico requiere de una variable intensidad en el archivo principal. A diferencia del estadstico global de Moran I, el estadstico local Moran es aplicado a cada punto en forma individual (o zona). El ndice indica clustering o dispersin en relacin con la vecindad local. Los puntos (o zonas) con valores altos del ndice I, tienen intensidad ms alto que sus vecinos, mientras que los puntos con valores bajos tienen intensidad ms abajo que sus vecinos. La salida puede se impresa o salir como archivo .dbf. Ajuste para pequeas distancias Las pequeas distancias se ajustan de manera que la mxima ponderacin no sea superior a 1. Esto asegura que el ndice local I, no se haga excesivamente grande para los puntos muy cercanos. Esta es la conguracin predeterminada.
1.2.3.
Modelado Espacial III
Crimestat en la ventana modelado espacial presenta cuatro pestaas, de las cuales dos exponemos: estimacin de densidad de kernel y anlisis de espacio-tiempo, las dems no se trataran en este trabajo, pero puede obtener informacin en, si desea investigar puede revisar la la notas (se tratara muy elemental de manera simple, en la calibracin y la estimacin del viaje a la delincuencia).
48
Interpolacin La pestaa interpolacin (interpolation) permite estimar la densidad de punto usando el mtodo suavizado densidad kernel. Hay dos tipos de suavizado de densidad del kernel: el simple, aplicado a una sola distribucin de los puntos; y el dual, aplicado a dos distribuciones diferentes. Cada tipo tiene variaciones sobre el mtodo que se pueden seleccionar. Ambos tipos requieren de un archivo de referencia, que es superpuesto sobre la zona de estudio (ver archivo de referencia). Las variables intensidad y ponderacin pueden ser usadas en la estimacin de kernel. Las densidades pueden convertirse en probabilidades. La interpolacin es una tcnica para generalizar localizaciones del incidente en todo el rea de estudio. Mientras las tcnicas de distribucin espacial y puntos caliente proporciona los resmenes estadsticos para los incidentes de los datos en s mismos, la tcnica de la interpolacin generalizan esos incidentes de los datos a toda la regin. Particularmente, proporcionan las estimaciones de densidad para todas las zonas de la regin (es decir, en cualquier localizacin). La estimacin de la densidad es una variable de la intensidad, un valor Z(), que se estima una localizacin particular. Por lo tanto, puede ser visualizada en los mapas de la supercie o en mapas de contorno que demuestran la intensidad en todos los lugares o localizaciones. Estimacin de densidad de kernel simple (KernelDensity) La rutina densidad de kernel simple (kernel density estimates single) estima la densidad de punto para una distribucin simple, colocando una supercie simtrica sobre cada punto (superposicin), evaluando la distancia del punto a cada celda de referencia por la funcin kernel, y sumando las evaluaciones en cada celda de referencia. Archivo ha interpolar La estimacin puede aplicarse a cualquier archivo tanto al principal como al secundario. Debe seleccione el archivo a ser interpolado. Por defecto es el archivo primario 49
Mtodo de interpolacin Hay cinco tipos de kernels que pueden ser utilizados para estimar la distribucin de densidad de los puntos. Cuatro de las cinco distribuciones superponen un crculo alrededor de cada celda o cuadrcula y asigna ponderaciones a los puntos dentro de las celdas o cuadrcula. Los cinco tipos varan en las ponderaciones que asignan a los puntos cercanos: Kernel que asigna ponderaciones a todo el rea en estudio 1. El kernel normal superpone una distribucin normal en cada punto, que luego se extiende sobre toda el rea en estudio denida por el archivo de referencia. Esta es la funcin kernel por defecto. La distribucin se extiende en todas direcciones y es limitado nicamente por el rea en estudio. Kernels que asignar ponderaciones en un crculo especco 2. El kernel uniforme asigna igual ponderacin a todos los puntos dentro del crculo. 3. El kernel quartic superpone una supercie en forma de campana invertida que se extiende slo para una distancia limitada en cada punto; las ponderaciones para los puntos dentro del crculo disminuyen con la distancia gradualmente (poco a poco). 4. El kernel triangulado (o cnico) superpone un cono en cada celda de la cuadrcula; Los pesos para puntos dentro del crculo disminuyen constantemente con la distancia (coherentemente). 5. El kernel exponencial negativo superpone una funcin disminuyendo drsticamente sobre cada celda de la cuadrcula; las ponderaciones de los puntos dentro del crculo disminucin muy rpidamente con la distancia. Los cinco mtodos producen resultados similares, aunque el kernel normal es generalmente ms suave para cualquier ancho de banda. Eleccin del ancho de banda
50
Los kernels son aplicados a una distancia de bsqueda limitada, denominado ancho de banda. Para el kernel normal, el ancho de banda es la desviacin estndar de la distribucin normal. Para el kernel uniforme, quartic, triangular y exponencial negativo, la amplitud o ancho de banda es el radio de un crculo para la distancia de bsqueda. Para todos los tipos de kernels, un ancho de banda grande produce estimaciones de densidad ms suave. Tanto el ancho de banda adaptable como el jo pueden ser seleccionados. Ancho de banda Adaptable La distancia ancho de banda adaptable es identicada por el nmero mnimo de puntos encontrados dentro del crculo dibujado alrededor de un slo punto. Un crculo es colocado alrededor del punto, a su vez, y el radio se aumenta hasta que se alcanza el tamao de muestra mnimo; de esta forma cada punto tiene un intervalo de ancho de banda diferente. El ancho de banda es la conguracin por defecto. El usuario puede modicar el tamao de muestra mnimo, que por defecto es igual a 100 puntos. Ancho de banda jo La distancia ancho de banda ja es un intervalo jo para cada uno de los puntos. El usuario puede denir el intervalo y las unidades distancia en que se calcula (millas, millas, pies, kilmetros, metros). Unidades de rea Debe especicar las unidades de densidad como puntos por milla cuadrada, por millas nuticas cuadradas, por pies cuadrados, por kilmetros cuadrados, o por metros cuadrados. Las unidades por defecto son puntos por milla cuadrada. Uso de una variable intensidad Debe marcarse la variable intensidad, si ha de ser interpolada. Uso una variable ponderacin Debe marcarse la variable ponderacin, si ha de ser interpolada.
51
Clculo de densidad de probabilidades o densidad La densidad estimada para cada celda se puede calcular de tres maneras: 1. Densidad absoluta. Este es el nmero de puntos por celda de la cuadrcula y se escala de tal forma que la suma de todas las celdas sea igual al tamao de la muestra. 2. Densidad relativa. La densidad absoluta de cada celda en la cuadrcula es dividida por el rea de la celda; y la salida se expresa en unidades cuadradas (por ejemplo, puntos por millas cuadradas). 3. Probabilidades. Esta es la proporcin de todos los incidentes que ocurren en la celda. La suma de todas las cedas es igual a 1, equivale a la probabilidad. Debe seleccione el tipo de estimacin de la densidad: densidad absoluta, densidad relativa, o probabilidades, la salida es para cada celda. Por defecto es densidad absoluta. Salida Si el archivo de referencia es externo o creado por Crimestat, los resultados pueden salir como archivo para Surfer for Windows o como archivo para ArcView .Shp, MapInfo .mif, Atlas*Gis .bna; y para ArcView Spatial Analyst slo si el archivo de referencia es creado por CrimeStat. Estimacin de la densidad de kernel dual (DuelKernel) La rutina de estimacin de densidad de kernel dual (Dual kernel density estimate) compara dos distribuciones diferentes que involucran los archivos primario y secundario. As, es necesario denir los archivos primario y secundario. La comparacin permite la relacin entre el primer archivo dividido por el segundo archivo, el logaritmo de la relacin (cociente) entre el primer archivo dividido por el segundo archivo, la diferencia entre el primer archivo y segundo (es decir, el primer archivo - segundo archivo), o la suma del primer 52
archivo y el segundo. Archivo ha interpolar Debe identicarse los archivos que ocupan la categora de principal y secundario en la interpolacin. Por defecto el principal es el archivo primario y secundario es el archivo secundario. Mtodo de interpolacin Hay cinco tipos de distribuciones de kernels que pueden ser utilizados para estimar la densidad de puntos. Cuatro de los cinco superponen un crculo alrededor de cada celda y asigna ponderaciones a los puntos dentro de la celda. Los cinco tipos varan en las ponderaciones que asignan puntos cercanos: Kernel que asigna ponderaciones a todo el rea en estudio 1. El kernel normal superpone una distribucin normal en cada punto, que luego se extiende sobre toda el rea en estudio denida por el archivo de referencia. Esta es la funcin kernel por defecto. La distribucin se extiende en todas direcciones y es limitado nicamente por el rea en estudio. Kernels que asignar ponderaciones en un crculo especco 2. El kernel uniforme asigna igual ponderacin a todos los puntos dentro del crculo. 3. El kernel quartic superpone una supercie en forma de campana invertida que se extiende slo para una distancia limitada en cada punto; las ponderaciones para los puntos dentro del crculo disminuyen con la distancia gradualmente (poco a poco). 4. El kernel triangulado (o cnico) superpone un cono en cada celda de la cuadrcula; Los pesos para puntos dentro del crculo disminuyen constantemente con la distancia (coherentemente). 5. El kernel exponencial negativo superpone una funcin disminuyendo drsticamente sobre cada celda de la cuadrcula; las ponderaciones de los puntos dentro del crculo disminucin muy rpidamente con la distancia. 53
Los cinco mtodos producen resultados similares, aunque el kernel normal es generalmente ms Eleccin del ancho de banda Los kernels son aplicados a una distancia de bsqueda limitada, denominado ancho de banda. Para el kernel normal, el ancho de banda es la desviacin estndar de la distribucin normal. Para el kernel uniforme, quartic, triangular y exponencial negativo, la amplitud o ancho de banda es el radio de un crculo para la distancia de bsqueda. Para todos los tipos de kernels, un ancho de banda grande produce estimaciones de densidad ms suave. Tanto el ancho de banda adaptable como el jo pueden ser seleccionados. Ancho de banda Adaptable La distancia ancho de banda adaptable es identicada por el nmero mnimo de puntos encontrados dentro del crculo dibujado alrededor de un slo punto. Un crculo es colocado alrededor del punto, a su vez, y el radio se aumenta hasta que se alcanza el tamao de muestra mnimo; de esta forma cada punto tiene un intervalo de ancho de banda diferente. El ancho de banda es la conguracin por defecto. El usuario puede modicar el tamao de muestra mnimo, que por defecto es igual a 100 puntos. Ancho de banda jo La distancia ancho de banda ja es un intervalo jo para cada uno de los puntos. El usuario puede denir el intervalo y las unidades distancia en que se calcula la misma (millas, millas, pies, kilmetros, metros). Ancho de banda variable El ancho de banda variable permite separar intervalos jos para el primero y el segundo archivo. El usuario debe denir el intervalo y las unidades (millas, millas, pies, kilmetros, metros), para cada uno de los archivos. Por defecto la unidad es una milla para ambos (primero y segundo archivo). Para cada uno, el usuario debe denir el intervalo y las unidades de la distancia por los cuales es calculada (las millas, las millas nuticas, los pies, 54
los kilometers, los metros). Por defecto es una milla para los primeros y segundos archivos. Unidades de rea Debe especicar las unidades de densidad como puntos por milla cuadrada, por millas cuadriculadas nuticas, por pies cuadrados, por kilmetros cuadrados, o por metros cuadrados. Por defecto es puntos por milla cuadrada. Uso de la variable intensidad Los archivos (primario y secundario) se tratan por separado, y se marcar la casilla correspondiente a la variable intensidad, en caso de que esta se utilice en interpolacin. Uso de la variable ponderacin Los archivos (primario y secundario) se tratan por separado, y se marca la casilla correspondiente a la variable ponderacin, en caso de que esta se utilice en interpolacin. Clculo de densidad de probabilidades o densidad La estimacin de densidad para cada celda se puede calcular de seis maneras: 1. Rata de densidades. Es el cociente (rata) de la densidad para el primer archivo dividido por la densidad del segundo archivo. 2. Logaritmo de rata de densidad. Es el logaritmo natural del cociente (rata) de la densidad del primer archivo dividido por la densidad del segundo archivo. 3. Diferencia en densidad absoluta. Es la diferencia entre la densidad absoluta del primer archivo y el segundo, diferencia neta. La densidad de cada archivo es escalada de modo que la suma de las celdas iguale el tamao de la muestra. 4. Diferencia en densidad relativa. Esta es la diferencia entre la densidad relativa del primer archivo y la densidad relativa del segundo archivo. Es 55
la diferencia relativa neta. La densidad celda de cada archivo es dividen por el rea de celda para producir una medida de densidad relativa en unidades especcas (por ejemplo, puntos por milla cuadrada). A la densidad relativa del primer archivo se le resta la densidad relativa del segundo archivo. 5. Suma de densidad absoluta. Es la suma de la densidad absoluta del primero y el segundo archivo. La densidad de cada archivo es escalada de modo que la suma de las celdas sea igual al tamao de la muestra. 6. Suma de densidad relativa. Es la suma de la densidad relativa de la primer archivo y del segundo. Es la suma relativa de la densidad celda de cada uno de los archivos dividida por el rea de cada celda para producir una medida de densidad relativa en unidades especcas,(por ejemplo, puntos por milla cuadrada). La densidad relativa del segundo archivo se suma a la densidad relativa del primer archivo. Debe seleccionar el tipo de estimacin de densidad de probabilidad que calculara la rutina: la rata de densidades (o proporcin de densidades), el logaritmo de rata de densidad, la diferencia en densidad absoluta, la diferencia de densidad relativa, la suma de densidades absoluta, o la suma de densidad relativa. Por defecto es la rata de densidad. Salida Si el archivo de referencia es externo o creado por Crimestat, los resultados pueden salir como archivo para Surfer for Windows o como archivo para ArcView .Shp, MapInfo .mif, Atlas*Gis .bna; y para ArcView Spatial Analyst slo si el archivo de referencia es creado por CrimeStat. Salida Los resultados pueden salir como archivo para Surfer for Windows (para ambos un archivo de referencia externo o creado) o como archivo para ArcView .Shp, MapInfo .mif, Atlas*Gis .bna, or ArcView Spatial Analyst (slo si el archivo de referencia es creado por CrimeStat).
56
1.2.4.
Anlisis de espacio tiempo
La pestaa anlisis espacio tiempo (space-time analysis) abre una ventanea que permite analizar la interaccin entre el espacio y tiempo. En esta ventana, se muestran cuatro rutinas. En primer lugar, el ndice Knox que muestra relacin binomial simple entre los eventos ocurridos en el espacio y en el tiempo. En segundo lugar, el ndice Mantel que muestra la correlacin entre la proximidad en el espacio y la proximidad en el tiempo. En tercer lugar, la media mvil espacio-temporales (spatial-temporal moving average) que calcula la media central para un span temporal. En cuarto lugar, el Anlisis de caminos correlacionado (Correlated Walk Analysis ) que diagnostica la secuencia espacial y temporal de los incidentes cometidos por un delincuente en serie. Para cada una de estas rutinas, el tiempo debe ser denido como un nmero entero o real, y no en formato de fecha; por ejemplo son valores elegibles: 3 das, 2.1 semanas, 4.3 meses, o el nmero de das desde 1 de enero de 1900, (por ejemplo, 37.174); mientras que en formato de fecha no son elegibles, por ejemplo, 1 de noviembre de 2001 07/30/01. Debe convertirse los formato de fechas en nmero real. Las unidades de tiempo debe ser coherente en todas las observaciones, (es decir, deben tener una nica unidad, como horas, das, semanas, meses o aos). Si una de estas condiciones es viola, CrimeStat ejecuta los calcular y da los resultados, pero no sern correctos. ndice de Knox El estadstico de Knox es un ndice que muestra la relacin entre la cercana el tiempo y cercana la distancia. Se comparan los pares de eventos en distancia y tiempo, y luego son representados en una tabla de 2x2. Existen tres mtodos que denen cercana en tiempo o distancia: 1. Media. Esto es; eventos que estn ms cercanos (en tiempo) que el intervalo de tiempo medio, o que estn ms cerca (en distancia) que la distancia media, se denen como cercano, mientras que los eventos que estn ms lejos en tiempo, que el intervalo de tiempo medio, o estn ms lejos en distancia que la distancia media, se dene como no cercano. 2. Mediana. Esto es; eventos que estn ms cercanos (en tiempo) que la 57
mediana del intervalo de tiempo, o ms cerca (distancia) que la mediana de la distancia, se denen como cercano; mientras que los eventos que estn mas lejos que la mediana del (intervalo) tiempo, o mas lejos que mediana de la distancia se denen como no cercano. 3. Denida por el usuario. El usuario puede especicar cualquier valor para distinguir cercano y no cercano, para cualquier tiempo o distancia. La salida incluye una tabla de 2x2 de la distribucin de los pares en categora cercano o no cercano en tiempo y en distancia. Como se comparan pares de eventos, resulta N (N 1)/2 pares en el conjunto de datos, donde N es el nmero de eventos. La salida tambin incluye una tabla con esperanza de la distribucin de pares en el supuesto de que eventos en el tiempo y en el espacio son independientes uno de otro. La salida incluye un estadstico Chi-cuadrado. Sin embargo, como las observaciones no son independientes, el p-valor asociado con la prueba Chi-cuadrado no en aplicado en este caso. Corrida de simulacin de Knox Una simulacin de MonteCarlo puede ser ejecutada para estimar aproximadamente los niveles de probabilidad del error tipo I, del ndice de Knox. El usuario debe especicar el nmero de simulacines ha ejecutar. La data es asignada al azar y el valor de la chi-cuadrado para el ndice de Knox es calculado en cada corrida. La salida aleatoria es ordenada y se calculan los percentiles. Doce resultados presenta esta rutina: 1. El mnimo de simulaciones espaciales 2. El mximo de simulaciones espaciales 3. El percentil 0.5 para la simulacin espacial 4. El percentil 1 para la simulacin espacial 5. El percentil 2.5 para la simulacin espacial 6. El percentil 5 para la simulacin espacial 7. El percentil 10 para la simulacin espacial 58
8. El percentil 90 para la simulacin espacial 9. El percentil 95 para la simulacin espacial 10. El percentil 97.5 para la simulacin espacial 11. El percentil 99 para la simulacin espacial 12. El percentil 99.5 para la simulacin espacial Los percentiles permiten una prueba de signicancia de una o dos colas. Por ejemplo, para un 5 %, una prueba de una cola usa el percentil 95, mientras que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. Los datos simulados que se usan pueden ser visualizados en la ventana Opciones marcando la casilla Dump simulation data. ndice de Mantel El ndice de Mantel es la correlacin entre la cercana en tiempo y la cercana en distancia a travs de pares. Cada par de eventos es comparado por intervalo de tiempo y distancia entre ellos. Si hay una relacin positiva entre la cercana en tiempo y la cercana en espacio (distancia), entonces debe haber una importante correlacin positiva entre las dos medidas. Observe, como se comparan pares de eventos, hay N (N 1)/2 pares en el conjunto de datos, donde N es el nmero de eventos. Corrida de simulacin para Mantel Una simulacin de MonteCarlo puede ser ejecutada para estimar aproximadamente los intervalos de conanza alrededor de la correlacin de Mantel. El usuario debe especicar el nmero de simulacin ha ejecutar, y usando la data asignada (al azar) el ndice es calculado. La salida aleatoria es ordenada, y los percentiles son calculados. La salida ofrece dose resultados: 1. El mnimo de simulaciones espaciales 2. El mximo de simulaciones espaciales 3. El percentil 0.5 para la simulacin espacial 4. El percentil 1 para la simulacin espacial 59
5. El percentil 2.5 para la simulacin espacial 6. El percentil 5 para la simulacin espacial 7. El percentil 10 para la simulacin espacial 8. El percentil 90 para la simulacin espacial 9. El percentil 95 para la simulacin espacial 10. El percentil 97.5 para la simulacin espacial 11. El percentil 99 para la simulacin espacial 12. El percentil 99.5 para la simulacin espacial Los percentiles permiten pruebas de signicancia de una o dos colas. Por ejemplo, para un 5 %, una prueba de una cola usa el percentil 95, mientras que para una prueba de dos cola, usa los percentiles 2.5 y 97.5. La data simulada que se usan pueden ser vistos usando la ventana de Opciones en la casilla Dump simulation data. Promedio mvil de Espacio-tiempo Esta rutina calcula la media central como un cambio en la secuencia de los eventos. La rutina ordena los incidentes en el orden en que ocurren. El usario dene un span de incidentes secuencial. Por defecto el span de incidentes secuencial es igual a cinco observaciones. La rutina coloca una ventana que cubre el span sobre los incidentes y calcula la media central (la coordenada X de la media, coordenada Y de la media). Entonces mueve la ventana una observacin. Las aproximaciones se hacen al principio y al nal de la observaciones secuencial. El resultado es un conjunto de medias centrales ordenadas a partir de la primera hasta la ltima observacin. Este estadstico til para determinar la localizacin central de un conjunto de incidentes (tal vez cometido por un delincuente en serie) que se ha desplazado en el tiempo. Esta rutina presenta cuatro de salidas: 1. El tamao de la muestra. 2. El nmero de observaciones que componen el span. 60
3. El nmero span. 4. Las coordenadas X e Y para cada span de ventana. Los resultados tabulares salen como un archivo dBase .dbf, Microsoft Access .mdb, Ascii .dat o ODBC-compatible. Un resultado grco que muestra una lnea secuencia en archivo para ArcView .shp, para Mapifo .mif o Atlas*gis .bna. Anlisis de caminos correlacionado (CWA) El Anlisis de caminos correlacionados (Correlated Walk Analysis, CWA) analiza la secuencia de movimientos de un delincuente en serie y hace predicciones acerca del tiempo y la localizacin de un prximo evento. Los movimientos secuenciales son analizados en trminos de tres parmetros: diferencia de tiempo entre eventos (por ejemplo, el nmero de das entre dos eventos consecutivos); distancia entre eventos (por ejemplo, la distancia entre dos eventos consecutivos); y ngulo entre eventos, direccin angular entre dos eventos consecutivos medidos en grados (de 0 a 360). Hay tres rutinas para analizar la secuencia de eventos: 1. Correlograma. 2. Diagnstico de Regresin. 3. Prediccin. Correlograma de CWA El correlogram presenta las correlaciones rezagadas entre eventos por diferencia de tiempo, distancia, y ngulo (direccin). Los retardos son comparaciones de secuencias. Un retardo de cero es la secuencia comparada con ella misma; por denicin, la correlacin es igual a 1. Un retardo de 1 es la comparacin de la secuencia con la anterior secuencia. Un retardo de 2, es la secuencia en comparacin con dos secuencias anteriores. Un retardo de 3 es la secuencia en comparacin con tres secuencias anteriores, y as sucesivamente. En total, las comparaciones se hacen hasta siete secuencias anteriores (un retardo de 7).
61
Generalmente, tratando por separado la diferencia de tiempo, distancia y localizacin, un retardo con la ms alta correlacin es el ms fuerte. Sin embargo, con cada retardo consecutivo, el tamao de la muestra disminuye en uno. Si el tamao de la muestra es pequeo, una correlacin alta asociado con un retardo alto puede ser poco able. Por consiguiente, correlograma ajustado (adjusted correlogram) descuenta las correlaciones por el nmero de retrasos. Diagnstico de regresin del CWA El diagnstico de regresin (regression diagnostics) presenta la regresin estadstica para los diferentes modelos de retados. El retardo debe especicarse. Por defecto el retardo es igual a 1 (secuencia de eventos comparados con el anterior). Tres modelos de regresin pueden ser ejecutados para la diferencia de tiempo, direccin y ngulo. La salida muestra los siguientes estadsticos: 1. El tamao de la muestra. 2. Las unidades de distancia y tiempo. 3. El retardo del modelo (de 1 a 7). 4. El R multiple (correlacin) entre los retardos. 5. El R cuadrado multiple (es decir, R-cuadrado). 6. El error estndar de estimacin para la regresin. 7. El coeciente, el error estndar, el t-valor, el valor del probabilidad para la constante (dos colas). 8. El coeciente, el error estndar, el t-valor, el valor del probabilidad para la para el coeciente (dos colas). 9. El anlisis de varianza para el modelo de regresin, incluyendo la suma de los cuadrados y la media cuadrtica de error para el modelo de regresin y el residual (error), el valor del F-test de regresin de error media cuadrtica de dividido por el residual cuadrado del error medio, y el nivel de probabilidad para la F-test. 62
En general, el modelo con el menor error estndar de estimacin es el mejor, y por consiguiente, con mayor ndice de correlacin multiple R. Sin embargo, con un tamao de muestra pequeo, el modelo puede ser poco ables. Adems, con cada retardo consecutivo, el tamao de la muestra disminuye en uno; si el tamao de la muestra es pequeo, un R mltiple alto asociado con un retardo alto de comparacin puede ser poco able. Prediccin del CWA La rutina de prediccin (prediction) permite predecir un prximo evento en tiempo, distancia y direccin. Para cada parmetro (diferencia de tiempo, distancia, y ngulo) hay tres modelos que pueden ser usados: 1. La diferencia de media (es decir, diferencia en tiempo medio, en distancia media y en ngulo medio) 2. La diferencia de medianas (es decir, diferencia en medianas de tiempo, en distancias medianas y ngulo mediano) 3. El modelo de regresin (es decir, el coeciente de regresin estimado e intercepto) Cada uno de ellos puede utilizar retardos de 1 a 7 para comparar. Se debe denir el retardo de la secuencia para el cual se hace la prediccin. As, para un retardo de 1, el intervalo del penltimo al ltimo evento se utiliza como referencia (es decir, entre el evento N-1 y N); para un retardo de 2, el intervalo del antepenltimo al penltimo evento se utiliza como referencia (es decir, entre los eventos N -2 y N-1), y as sucesivamente. Nota: Si el modelo de regresin es utilizado, el retardo para la distancia y el ngulo debe ser el mismo. Ejemplo 1: con un retardo de 1 y usando la diferencia de medias, la diferencia de tiempo medio se aadir al tiempo del ltimo evento, la distancia media se agrega a la localizacin del ltimo evento, y el ngulo medio se aade a la localizacin del ltimo evento. Ejemplo 2: con un retardo de 2 y el uso del modelo de regresin, la diferencia del tiempo de prediccin es aadida al tiempo del penltimo evento, la prediccin de la distancia se aade la localizacin del penltimo evento y 63
prediccin angular se aade a la localizacin ltimo evento. Ejemplo 3: con un retardo de 1 para el tiempo y el uso del modelo de regresin, con un retardo de 2 para la distancia y el uso de la distancia media, y con un retardo de 3 para el ngulo y el uso de la mediana angular, la diferencia del tiempo de prediccin es aadida al ultimo evento, la distancia media es agregada al penltimo evento, y la mediana angular es aadida a la localizacin del antepenltimo evento. La salida incluye: 1. El mtodo utilizado para el tiempo, distancia, y ngulo 2. El retardo usado para el tiempo, distancia, y ngulo 3. La prediccin de la diferencia de tiempo. 4. La prediccin de la distancia. 5. La prediccin ngular. 6. La prediccin del tiempo nal. 7. La prediccin de la coordenada X de la ubicacin nal. 8. La prediccin de la coordenada Y de la ubicacin nal. 1.2.5. Opciones
En esta ventana de opciones, CrimeStat permite salvar parmetros, cambiar los colores de las pestaas en las cuatro secciones, y ver la data simulada por la rutina de Monte Carlo. Salvando Parmetros Todos los parmetros de entrada pueden ser salvados. En la ventana Opciones, hay un botn para Salvar parmetros (Save parameters). Los archivos de parmetros salen con la extensin param. Un archivo de parmetros salvado puede ser recargado con el botn parmetros de Carga (Load parameters).
64
Colores Los colores de cada las cuatro pestaas o secciones de CrimeStat pueden ser cambiados seleccionando la pestaa correspondiente y escogiendo un color del espectro. Salida de la Data simulada Cuando se corre una simulacin de Monte Carlo con la rutina de Ripleys K, Cluster Jerrquico del vecino ms cercano, Cluster Jerrquico del vecino ms cercano de ajuste de riesgo, el STAC, Mantel o Knox, la data pueden salida como archivo .dbf. Cada corrida de simulacin sale con el nombre de Sim_data<I>.dbf, donde <I>es el nmero de corridas, por ejemplo, Sim_data4.dbf. VI Intercambio dinmico de datos (DDE) CrimeStat apoya el Intercambio de datos Dinmico (DDE). Ver en Apndice A, en documentacin, o en ayuda online para mayor formacin.
65

Manual Rapido de CrimeStrat

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual Rapido de CrimeStrat

Cargado por

Copyright:

Formatos disponibles

1.

Descripcin del programa CrimeStat

Manual de corto de CrimeStat o gua rpida

Modelado Espacial III

Anlisis de espacio tiempo

También podría gustarte