Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Geoespacial Modeler
Geoespacial Modeler
ANEXO
Nodo de reproyección. Elementos tales como las funciones espaciales del creador
de expresiones, el nodo STP (Spatio-Temporal Prediction) y el nodo de
visualización de mapa utilizan un sistema de coordenadas proyectadas. Por tanto,
cualquier dato importado que se registre con un sistema de coordenadas geográficas
se debe reproyectar.
Modelado geoespacial
Las técnicas de modelado geoespacial están diseñadas para descubrir patrones de datos que incluyen
un componente geoespacial (mapa). El sistema de modelado geoespacial proporciona métodos para
analizar datos geoespaciales con y sin un componente de tiempo.
Por ejemplo, "Si un cliente compra una cuchilla y una loción para después del afeitado, hay un 80% de
probabilidad de que el cliente compre también crema de afeitado". El nodo Reglas de asociación
extrae un conjunto de reglas a partir de los datos, extrayendo las reglas con el contenido de
información más alto. El nodo Reglas de asociación es muy similar al nodo Apriori, pero existen
algunas diferencias importantes:
Soporte de regla: La proporción de elementos para los que toda la regla, las condiciones y las
predicciones son verdaderas. Para todos los elementos del conjunto de datos, el porcentaje que
la regla contabiliza correctamente y predice. Esta medida da una importancia general para la
regla. Crea una tabla que contiene las mejores reglas de asociación N basadas en el soporte de
reglas que se van a incluir en la salida (donde N es el valor Reglas para mostrar).
Ejemplo:
Se desea identificar patrones delictivos en 51 zonas dentro de la ciudad de Dallas (Texas, EE.UU.),
según sus atributos y/o caracterisiticas, para finalmente obtener un mapa del delito.
Para ello utilizaremos los nodos correspondientes del análisis geoespacial y del modelo de reglas de
asociación.
Figura 1.1
En la figura 1.1, se observan las diversas variables como: ID de la localidad, longitud y latitud, tamaño
en metros, cantidad de población, cantidad de hogares, personas por residencia, densidad de población,
ratio de probreza, valor de la propiedad,…, finalmente el tipo de crimen.
Figura 1.2
Al nodo Origen CrimeTracts.sav conectamos un nodo Derivar donde colocamos el nombre point y en
tipo de campo damos click a Especificar…:
Figura 1.3
Figura 1.4
Dentro del nodo Fusionar, en la pestaña Fundir, seleccionamos el método de fusión Condición
clasificada y en Conjunto de datos primario seleccionamos CrimeTracts.sav
Figura 1.5
Al nodo Fusionar conectamos el nodo de modelado Reglas de asociación y realizamos las siguientes
especificaciones:
Generación de reglas:
- Generación de reglas: Numero máximo de reglas: 12
- Criterio de regla: Habilitamos el criterio de reglas
Confianza (%): 5
Soporte de reglas (%): 1
Soporte de condiciones (%): 1
Elevación: 1
Transformaciones:
- Intervalos: Número de intervalos: 2
Resultado:
- Nube de palabras de reglas clasificables: Crear una nube de palabras clasificables
Configuración de creacióna
Número máximo de reglas 12
Soporte de condición mínima 0,01
Confianza mínima 0,05
Soporte de reglas mínimo 0,01
Elevación mínima 1,00
Número máximo de elementos en una regla 10
Número máximo de elementos en una condición 5
Número máximo de elementos en una predicción 1
Utilizar sólo valor True para campos de distintivo Verdadero
Permitir reglas sin condiciones Falso
Medición de evaluación ordenando las reglas Confianza
a. El número de elementos máximo especificado en una regla no se ha alcanzado debido a un
número insuficiente de conjuntos de elementos frecuentes en niveles anteriores.
Evaluación
Estadísticas de reglasa,b
En la parte de Evaluación, observamos las estadísticas de las reglas donde observamos que el
promedio de confianza es del 64.21% y promedio de elevación mayor a 1, lo cual indica que las
predicciones están relacionadas con las condiciones.
Interpretación
Tabla de reglas
Debido que en el nodo de Reglas de asociacion se considero el criterio de regla de Solo puntuar
reglas cuando no haya predicciones en la entrada, la primera variable de predicción, que tiene las
mayores confianzas, considera las reglas 7, 8, 9 y 10.
Colocamos el nodo visualizacion de mapa, y lo conectamos primero desde el nodo muestra y luego
del nodo geoespacial. Dentro del nodo de visualización de mapa personalizamos:
Grafico: editamos la primera capa
Detalles de entrada: En color seleccionamos Superposicion y escogemos la variable
$A-CrimeType-1
Observamos en el mapa las predicciones de los tipos de crimen AutoTheft (8.94%), MajorTheft
(26.48%), MinorTheft (39.81%) y Violent (24.77%)
El análisis de STP utiliza datos de ubicación, campos de entrada para predicciones (predictores), un
campo de tiempo y un campo objetivo. Cada ubicación tiene muchas filas de datos que representan los
valores de cada predictor para cada tiempo de medición. Después de analizar los datos, se pueden utilizar
para predecir valores en cualquier ubicación dentro de los datos shape utilizados en el análisis. El análisis
de STP también puede realizar previsiones cuando se conocen los datos de entrada para puntos
específicos en el tiempo.
Ejemplo:
El alcalde de la ciudad de Dallas requiere disminuir el índice de pobreza en todas sus localidades. Se
tiene data histórica de 6 meses del índice de pobreza, valor de propiedad y población, por cada zona
geográfica. Con ello se quiere predecir en nivel de pobreza en los próximos 3 meses.
Para desarrollar el modelo espacio-temporal se utilizará la data poverty_train.sav y luego se hará la
predicción en la data poverty_test.sav.
En Opciones de creación:
Intervalo de tiempo: Meses
Información básica/Covarianza espacial/Metodo de
estimación: Parametrico, modelo Gaussiano.
H0 : Modelo no parametrico
H1 : Modelo parametrico
La prueba de la covarianza espacial es uno de los criterios que se utilizan para determinar si un modelo
paramétrico basado en variograma es apropiado. Si el nivel de significación de esta estadística de
prueba es mayor que 0,05, se utiliza un modelo empírico no paramétrico. En este ejemplo, el valor de
significación ("Sig.") es mayor a 0,05.
Observamos el mapa de calor de correlaciones por cada región. En el mapa puede seleccionar
cualquier punto de coordenadas y automáticamente observará las 5 regiones con mayor correlación
espacial, asi como su coviaranza espacial.
En la pestaña de series temporales observamos las tendencias del indice de pobreza de las regione más
correlacionadas.
Ahora queremos ver el contraste de las tendencias del índice de probreza de fecha 2013-09-01 con el
índice de pobreza pronosticado de fecha 2014-05-01, en un grafico de mapa geoespacial.
2013-09-01 2014-05-01
El color rojo más intenso indica mayores valores del índice de pobreza, y se observa que en algunas
zonas el pronóstico de dicho índice es mayor.