Está en la página 1de 6

Resumen lectura complementaria 1, capitulo 5, pág. 155-171.

Análisis de similaridad cartográfica y generación de mapas predictivos mediante


sistemas de información geográfica
Un sencillo ejemplo de nuestra vida cotidiana como lo es ver a un expositor señalando
con un puntero laser sobre la presentación intentando hacer una comparación o
mostrando parecidos entre dos mapas situados uno al lado del otro, deja interrogantes
sobre la similaridad que hay entre estos dos. Realmente qué parecido tiene, son
totalmente igual o en qué son similares.
Mientras que un simple análisis visual y subjetivo solo da características generales, es
necesaria la cartografía para un análisis más profundo y detallado, para extraer mayor
información de ambos mapas.
Tener la imagen de varios mapas e intentar identificar las zonas en común en
verdaderamente complicado, con un análisis visual e incluso con paquetes de cartografía
sencillos. Sin importar el tipo de mapa con el que se esté trabajando o el origen de los
datos el procedimiento 'map-temático' para analizar la similaridad cartográfica (Map
Similarity) es el mismo.
Con análisis visual y subjetivo movemos los ojos de un mapa a otro con el fin de
relacionar colores, pero es difícil recordar cada tramo de color o las diferencias, estas se
pueden confundir. Por otro lado, en el análisis cartográfico en vez de comparar colores lo
hacemos con valores cartográficos y todo esto se hace desde un ordenador, donde es
posible completar la comparación rápidamente. Los datos cartográficos pueden ser
expresados tanto en forma de espacio geográfico como en espacio de datos.
El espacio geográfico usa coordenadas para ubicar los elementos. Por el contrario, el
espacio de datos es un poco más desconocido, pensamos en este como si fuera una caja
de cristal tridimensional, por lo tanto, nos daría tres valores. Si los tres valores en la trama
de datos son bajo, bajo, bajo, en objeto que aparecerá en la esquina inferior izquierda del
fondo del cubo (que es el origen de los tres ejes) y si los tres valores son alto, alto, alto
aparecerá en la esquina superior derecha del frente del cubo (la más cercana a nuestro
punto de vista en el ejemplo). Si entendemos esto no nos será difícil comprender que
aquellos puntos que estén más cercanos entre sí dentro de este espacio tridimensional
serán más similares que aquellos que tienen posiciones relativas más alejadas.
Los mapas de similaridad son una aproximación mucho más acertado que el puntero láser
que comentábamos al inicio. Con estos mapas damos mediciones objetivas y
cuantitativas para cada punto de nuestro espacio de análisis.
IDENTIFICACIÓN DE ZONAS DE DATOS: Partimos del concepto de distancia de datos
como herramienta para medir la similaridad en un mapa. Con el software adecuado y un
simple click en una celda podemos saber en cualquier momento la similaridad del resto de
las celdas con respecto a la primera, en un rango entre 0 (cero por cien similar) y 100.
No obstante, podemos extender la técnica anteriormente descrita mediante la aplicación
de un círculo que establezca un área sobre el que computar la similaridad cartográfica, a
partir de las tramas de datos contenidas en su interior. En este caso, el ordenador
calcularía el valor medio de cada parámetro (capa cartográfica) para toda el área del
círculo. Dicho valor medio sería tomado como base para establecer la comparación, y
posteriormente para el cálculo del conjunto de distancias normalizadas en el espacio de
datos con respecto al resto de las celdas del mapa. El resultado sería un mapa que
mostraría la similaridad en cada punto con respecto a un área de interés, en vez de como
hacíamos antes (con respecto a un solo punto).
La clave para entender todo esto es la relación existente entre el espacio de datos y el
espacio geográfico propiamente dicho.
CARTOGRAFÍA DE CÚMULOS DE DATOS Y AGRUPACIÓN (CLUSTERING):
Retomando un poco sobre cómo analizar el parecido entre datos a partir de mapas;
tenemos la primera técnica, similaridad cartográfica, que se denomina Map Similarity, que
consiste en generar un nuevo mapa mostrando el parecido de todos los puntos. El
resultado se expresa en una escala relativa de porcentajes.
La otra técnica es corte por niveles, level slicing, permite especificar un rango de datos de
interés para capa mapa y luego generar mapas con las combinaciones de criterios.
Ambas técnicas son muy útiles a la hora de examinar las relaciones espaciales
subyacentes en los datos, pero exigen al usuario tener que especificar los parámetros que
desea para el análisis.
El principio siempre es el mismo: el agrupamiento 'mira' la trama numérica de cada
ubicación (el valor de cada celda y en cada mapa) y 'ordena' todas las ubicaciones en
grupos discretos. La trama de datos para cada ubicación cartográfica es usada para
zonificar la explotación de maíz en dos grupos o clusters separados que cumplan las
siguientes condiciones: 1. Que los grupos sean tan diferentes como sea posible entre sí
(diferencia entre grupos). 2. Que estos grupos internamente estén formados por celdas
con tramas cartográficas lo más similares posibles entre sí (similitud en el seno de cada
grupo).
El mecanismo para generar estos cúmulos de datos o clusters es bastante sencillo.
Simplemente especificamos los mapas de entrada para el análisis y el número de clusters
que queremos; luego, como por arte de magia, nos aparece un nuevo mapa con nuevos
agrupamientos discretos de los datos. Sin embargo, identificar estos grupos de datos
cercanos entre sí en el espacio de datos puede ser una tarea ardua. La mejor opción es
encontrar una estructura de 'nubes' en el espacio de datos para facilitar la identificación
de los clusters, pero no siempre ocurre así que toca aplicar ciertas reglas de decisión que
nos permitan partir los datos por contornos que se tienen que corresponder con
respuestas similares en los datos.
MAPAS DE PREDICCIÓN: Hablar del futuro de los Sistemas de Información Geográfica
es hablar de mapas que puedan describir cosas que aún no han sucedido. Suena un poco
a ciencia ficción, pero lo cierto es que las técnicas de Data Mining espacial no paran de
progresar e inexorablemente nos llevan en esa dirección. Durante décadas, la estadística
convencional (no espacial) ha estado prediciendo cosas mediante el análisis exhaustivo
de muestras de datos en busca de relaciones numéricas (ecuaciones) que luego pueden
ser aplicadas a otros conjuntos de datos. Claro que cuando se realiza una aproximación
basada en la estadística tradicional sobre datos con una componente espacial, estamos
pasando por alto las relaciones geográficas y el resultado al final es sólo una tabla de
números, precisamente por no tener en cuenta dicha componente espacial.
La simbiosis existente entre el análisis estadístico predictivo y la cartografía parece
evidente. Después de todo, los mapas no son más que un conjunto organizado de
números... y los Sistemas de Información Geográfica nos permiten precisamente unir
estos números con su distribución espacial. Llevamos vistas en este artículo varias
técnicas ‘descriptivas’ para el análisis de la similaridad, el agrupamiento de datos, etc.
Ahora nos toca el siguiente paso lógico que es aplicar técnicas ‘predictivas’ para generar
mapas de extrapolación.

file:///C:/Users/Emerson%20Saldarriaga/Downloads/SIG_Modulo.pdf
Sistema de información geográfica
“[…] 5. 4. FUNCIONES DE UN SIG
- Mantenimiento y análisis de datos espaciales: Transformación de formatos, geometrías,
proyecciones, edición de elementos gráficos, generalización de coordenadas.
- Mantenimiento y análisis de datos no espaciales: Funciones de edición de atributos,
funciones de consulta.
- Análisis integrado de datos: Recuperación, clasificación, medición, superposición,
búsqueda, funciones topográficas, polígonos de Thiessen, interpolación, medición de
contigüidad, proximidad, redes, dispersión, Inter visibilidad, iluminación, vista en
perspectiva.
- Formatos de salida: ilustración de mapas, rótulos, textos, patrones texturales, símbolos
gráficos.
En general, un SIG permite responder a ciertas preguntas necesarias para determinar o
tomar alguna decisión o conocer el comportamiento de algún evento en especial.
Con respecto a la localización de los objetos se puede cuestionar sobre “¿Qué hay en X
sitio?”, con respecto a causa-efecto se pueden hacer consultas de tipo “Si sucede esto,
¿entonces?”. En los análisis multitemporales, los cuales analizan un evento en diferentes
épocas, se puede consultar o identificar “¿Que ha cambiado en X tiempo? ¿Cuánto ha
disminuido X cobertura?”. En Rutas, la consulta general y más importante es “Cual es la
ruta optima, más corta, para llegar al punto Y”, y las consultas sobre modelos: “Que
ocurriría si se asume que…” Estas son unas de las más frecuentes consultas que se
hacen en un SIG, sin embargo, no son todas. En un SIG pueden hacerse tantas consultas
como información disponible y relación entre la misma.
5.5. ESTRUCTURAS DE LOS DATOS EN UN SIG
Hace referencia a como se muestran y organizan las variables y objetos para lograr una
representación lo más adecuada posible. En un SIG existen dos estructuras de datos:
formato ráster y formato vectorial y estas a su vez, dan lugar a los dos grandes tipos de
capas de información especial.
5.5.1 Formato vector
En esta estructura de almacenamiento, se utilizan para la descripción de los objetos
geográficos, vectores, líneas o puntos, definidos por duplas de coordenadas con
referencia a algún sistema de coordenadas, los cuales son expresados en función de
algún tipo de proyección cartográfica. Parte de la definición de vector con respecto a
magnitud y sentido.
5.5.2 Formato ráster
Basa su funcionalidad en una concepción implícita de las relaciones de vecindad entre los
objetos geográficos. Su forma de proceder es dividir la zona correspondiente en una malla
regular de pequeñas celdas denominadas píxeles y asignarle un valor numérico a cada
celda como representación de su valor temático. Dado que la malla es regular, el tamaño
del píxel es constante y se conoce la posición en coordenadas del centro de una de las
celdas, se puede decir entonces que todos los píxeles están georreferenciados.
5. 6. TOPOLOGÍAS
La topología es el conjunto de relaciones que describen la posición relativa de los
componentes de un mapa u objeto en el espacio. La concepción de estas relaciones varía
entre los sistemas ráster o vectoriales. En los sistemas ráster, las relaciones se producen
entre celdas como análisis, generalmente, de vecindad, conformándose las entidades
espaciales a partir de la proximidad física y de atributos entre los píxeles, mientras que los
sistemas vectoriales se basan en una topología arco-nodo que viene definida por la
direccionalidad, la conectividad y la proximidad entre vectores, de forma tal que a partir de
éstos y otros valores se definen las diferentes entidades espaciales. La topología tiene
una gran importancia en el desarrollo y evolución de Los SIG’s. Es determinante en sus
capacidades de análisis y define en gran manera el desarrollo de los formatos de la
información geográfica. Las funciones de análisis se basan en las topologías como:
5. 6. 1. Análisis Espacial con SIG
El análisis espacial es uno de los factores esenciales de la existencia de Los SIG’s, y es
parte integrante su propia definición, y es determinada por la existencia de relaciones
topológicas entre los elementos constituyentes, que permite realizar cálculos entre
variables y obtener así nuevos datos.
Son varias las herramientas asociadas al principio de análisis espacial en un SIG, entre
las cuales se destacan la superposición, la determinación de áreas de influencia, los
análisis de vecindad, el análisis de redes y los modelos del terreno, lo que visto en
conjunto permite apreciar la verdadera fortaleza de Los SIG’s en términos de
modelamiento.
Recuperación
Herramienta de Los SIG’s que permite realizar recuperación de información filtrada,
consulta e interrogación de la base de datos, reclasificación de mapas, mediciones y
estadística espacial.
Superposición
Está considerada como la herramienta básica del análisis espacial y, por ende, de Los
SIG’s. Permite realizar, tanto con métodos ráster o vectoriales) el traslape o superposición
propiamente dicha, de capas de información para así obtener otras capas con datos
derivados del cálculo de las capas previas. Es por tanto una importante fuente de
producción de cartografía analítica y sintética que permite el análisis complejo de los
resultados. ¿La superposición debe responder a preguntas claves como qué hay común?,
¿qué es diferente? Y ¿qué está perteneciente a uno o a otro?
Vecindad
Los análisis de vecindad son habituales en los sistemas ráster. Permiten, mediante la
aplicación de diferentes algoritmos, conocer cómo se relaciona un objeto geográfico con
su entorno y viceversa, como, por ejemplo, conocer a qué distancia se encuentra
cualquier punto de nuestra zona de estudio respecto de una red eléctrica o un foco de
contaminación, o cuantas fuentes de contaminación existen alrededor de un núcleo
urbano a una distancia dada.
Áreas de Influencia
Se entiende como áreas de influencia aquellas que a partir de una entidad espacial y de
acuerdo a una variable o conjunto de variables definen una nueva entidad en el espacio.
Estas nuevas entidades suelen ser del estilo de corredores (buffers), círculos o coronas
(donuts) o figuras irregulares o regulares en función del polígono de origen. Otra
posibilidad es la denominada segmentación dinámica (de gran utilidad en el análisis de
redes), que permite dividir una línea en relación a los diferentes valores que posea en
cada segmento (caudales, volumen de tráfico, índice de contaminantes, etc.) pudiendo
dar de este modo diferentes valores de amplitud a un mismo corredor en función del valor
de la variable en cada segmento.
Análisis de Redes
Otra fortaleza del análisis espacial a partir de la topología es la de construir sistemas de
redes. Estas pueden ser de cualquier tipo (hidrográficas, carreteras, transportes,
eléctricas...) siempre que mantengan su característica de sistema (dirección, conexión,
etc.). Los análisis más frecuentes en este ámbito son aquéllos que buscan rutas óptimas y
los que sirven para asignar recursos a lugares contribuyendo así a la localización de los
mismos.
Modelos Digitales de Elevaciones
Una herramienta clásica y fundamental son los Modelos Digitales de Elevaciones
(M.D.E.), los cuales tienen nombres diferentes en virtud de la técnica utilizada para su
generación, o de la variable a representar. Las técnicas utilizadas varían desde la
utilización de modelos de triangulación (comunes en geodesia) a la realización de
matrices cuadrangulares aportando un valor de Z a cada celda. Una de las ventajas de
estos modelos es la posibilidad de obtener perfiles o cortes, así como efectuar análisis de
visibilidad, como en estudios de impacto ambiental), de insolación (planificación
agronómica...), etc. Sin embargo, no hay que olvidar que primero, la variable Z no tiene
que ser necesariamente la altura (son comunes las representaciones de población,
accesibilidad, caudales, contaminación...) y, segundo, que la representación obtenida no
deja de ser un modelo interpolado a partir de datos reales y que por tanto los datos
obtenidos deben responder a criterios y parámetros de calidad.
Modelamiento y Simulación
Las herramientas de análisis espacial proporcionan a Los SIG’s de una enorme capacidad
para realizar modelamiento del territorio; por tanto, un SIG puede alcanzar la condición de
herramienta de modelamiento y simulación. Esta posibilidad no descarta el uso, por otro
lado, bastante frecuente, de Los SIG’s como sistema de almacenamiento o banco de
información geográfica. En cualquier de los dos casos: modelamiento del territorio o
simple descripción del mismo, uno de los principales objetivos de análisis será generar
mapas que reflejen los resultados del mismo.
5. 7. BASES DE DATOS
Los SMBD se especializan en el almacenamiento y manejo de todo tipo de información,
incluyendo datos geográficos. Los SMBD están perfeccionados para almacenar y retirar
datos, y muchos SIG se apoyan en ellos para este propósito. No tienen las herramientas
comunes de análisis y de visualización de Los SIG’s.
En esencia, el SIG es un sistema de gestión de base de datos (DBMS), específicamente
diseñado para el tratamiento simultáneo de datos espaciales e información descriptiva
relacionada. Un DBMS proporciona un lenguaje para análisis de datos que permite al
usuario describir los mecanismos o métodos utilizados por aquel. También debe contar
con procedimientos adecuados para comprobar la coherencia de los datos y mantener su
integridad.
Para realizar dichos procedimientos o enlazar información, es necesario contar con una
base de datos. En una base de datos relacional, los datos se almacenan en tablas en las
que las filas se refieren a los objetos o entidades, y las columnas a los atributos temáticos
o variables asociados. Normalmente una base de datos se compone de muchas tablas
cuya interrelación es posible a través de un identificador común, que es único para cada
entidad. La mayoría de las bases de datos de Los SIG’s tienen dos variables con
identificadores, uno de ellos es único y correlativo, y puede ser numérico o alfanumérico, y
el segundo puede repetirse y ayuda a organizar la tabla de atributos.
En un modelo Entidad-Relación (base de datos relacional), se consideran tres elementos:
las entidades, que son los objetos relevantes para la base de datos a elaborar, y
corresponden a cualquier rasgo que pueda ser localizado espacialmente; los atributos o
características asociadas a cada entidad, en que cada atributo tiene un dominio de
valores posibles, como por ejemplo, el estado de conservación de una carretera puede
ser malo, regular, bueno, o muy bueno; las relaciones o mecanismos que permiten
relacionar unas entidades con otras, como por ejemplo “localizado en”, “incluido en”,
“cruzado con”, etc.
Existe otro tipo de modelos como el jerárquico, modelo de redes y el más reciente es el
modelo orientado a objetos. En las bases de datos orientadas a objetos, éstos se pueden
definir como entidades que tienen una situación representada por los valores de las
variables y por un conjunto de operaciones que actúan sobre ellas. Así, la diferencia, que
para algunos es ventaja respecto al modelo relacional, es la posibilidad de incluir, en la
definición de un objeto concreto, no sólo sus variables temáticas sino además los
métodos u operadores que la afectan. Por otra parte, los objetos pertenecen a clases que
pueden tener sus propias variables y estas clases pueden pertenecer a su vez a una
superclase.
[…]”

Reseñas adicionales
http://www.pps.k12.or.us/district/depts/edmedia/videoteca/curso1/htmlb/SEC_71.HTM
(hace referencia a el espacio geográfico)
https://unstats.un.org/unsd/publication/SeriesF/SeriesF_79S.pdf (Manual de sistemas de
información geográfica y cartografía digital)

También podría gustarte