Documentos de Académico
Documentos de Profesional
Documentos de Cultura
en el nivel semntico
Towards Raster Spatial Analysis Methods at the Semantic Level
Eydel Jaime, Rainer Larn y Eduardo Garea
Centro de Aplicaciones de Tecnologas de Avanzada,
La Habana, Cuba
{ejaime, rlarin, egarea}@cenatav.co.cu
Resumen. Los Sistemas de Informacin Geogrfica Keywords. Retrieval and analysis, ontologies and raster
(SIG), debido a sus aplicaciones en el anlisis y data.
recuperacin de la informacin geo-grfica, se han
convertido en una necesaria herramienta para la ayuda
a la toma de decisiones. 1 Introduccin
Con el surgimiento de la Geosemntica, un nuevo
enfoque en la recuperacin y anlisis de informacin
Desde el surgimiento de los Sistemas de
espacial se impone, recuperar y analizar la informacin
por su significado semntico. El presente trabajo Informacin Geogrfica (SIG) hasta la actualidad,
pretende hacer una sntesis de las diferentes tcnicas y estos sistemas han ido cobrando paulatinamente
mtodos a travs de los cuales los SIG han venido cada vez ms importancia y se han convertido en
recuperando la informacin espacial, llegando hasta las una necesaria herramienta de anlisis y
nuevas pro-puestas que incluyen la semntica, recuperacin de la informacin geogrfica en el
enfocndose en el modelo de datos raster, proceso de toma de decisiones a todos los
especficamente en la tcnica de superposicin de niveles.
mapas y la problemtica de la naturaleza heterognea Con el acelerado crecimiento del volumen de
de los datos geogrficos. Por lo que se plantea la
necesidad de encontrar mtodos que tomen en cuenta
datos almacenados en las bases de datos
esta limitante y permitan trabajar con los datos espaciales, cada vez se hace ms difcil y
mezclados de manera simultnea. complejas las operaciones de recuperacin y
Palabras clave. Recuperacin y anlisis, ontologas y anlisis de la informacin de forma rpida y
datos raster. precisa.
Los mtodos y algoritmos convencionales se
Abstract. Geographic Information Systems (GIS), due to centran slo en las coordenadas o proyecciones
their applications in analysis and geographic geogrficas, adems de que se necesita de un
information retrieval, have become a necessary tool to
buen dominio de la informacin geogrfica por
aid decision making.
After the emergence of Geosemantic a new approach parte de los usuarios que operan estos sistemas.
in the retrieval and analysis of spatial information is Por lo tanto no cuentan con un nivel de
imposed, retrieve and analyze information by its abstraccin que les permita asemejarse al
semantic meaning. This paper aims to summarize the razonamiento que un humano realizara a la hora
different techniques and methods by which GIS has de extraer una determinada informacin de entre
been recovering spatial information reaching new un gran volumen de datos. Las tendencias
proposals that include semantics, focusing on the raster actuales para el tratamiento de la informacin
data model specifically the map overlay technique and
geoespacial estn enfocadas en el desarrollo de
the problem of the heterogeneous nature of
geographic data. As there is a need to find methods tcnicas basadas en la representacin y
that takes into account this limitation and allows recuperacin de estos datos desde un punto de
working with mixed data simultaneously. vista semntico.
Fig. 3a. Localizacin de un pxel. 3b Localizacin vecindad de un pxel. 3c Localizacin regiones o zonas
Anlisis local pxel a pxel: Se realiza Esta operacin posibilita convertir los datos en
teniendo en cuenta de forma aislada pxel a escala de intervalos y de razn a una
pxel de una o varias capas de un mapa clasificacin ordinal, para el modelado de la
raster. idoneidad de usos del suelo, utilizando el lgebra
Anlisis en zonas o regiones: Se realiza de mapas. Tiene el beneficio adicional de reducir
teniendo en cuenta un conjunto de pxeles el tamao del archivo de las capas raster. La Fig.
que se encuentren de forma contigua en 6 muestra un ejemplo de un mapa que contiene n
una o varias capas de un mapa raster. tipos de suelos y al que se le realiza una
reclasificacin binaria donde el nuevo mapa de
3.2 Reclasificacin de mapas salida contendr slo dos tipos de valores de
suelos, valor 0 para las suelos no aptos y valor 1
Esta operacin se realiza sobre un solo mapa. Al para los suelos aptos. En este caso se buscan los
igual que las operaciones de superposicin, suelos aptos para el Cultivo del Caf en Cuba.
constituye una de las tcnicas ms usadas en el
anlisis de los datos espaciales raster debido a
que posibilitan la bsqueda y recuperacin de
forma selectiva de los datos raster almacenados
en las bases de datos espaciales. La
reclasificacin es una tcnica de generalizacin
utilizada para reasignar valores en una capa de
entrada raster como pueden ser la posicin, el
valor, la forma, el tamao, la medida de los pxel,
el grado de contigidad y as crear una nueva
capa de datos. La reclasificacin cambia el valor
de las celdas de entrada trabajando con una base
"celda-a-celda" dentro del rea de anlisis. La
Fig. 5 muestra un ejemplo de reclasificacin de
mapas en un Modelo Digital de Elevacin (DEM
por sus siglas en ingls) donde a partir de un
Fig. 6. Reclasificacin de mapas. Mapa de suelos
mapa que contiene inicialmente 9 intervalos de aptos para el cultivo del Caf, se reclasifican con
alturas del terreno, se realiza una generalizacin valores binarios
de los intervalos con lo cual se reclasifican en 5
nuevos intervalos. Los valores generalmente son nmeros
(enteros, flotantes) o expresiones Booleanas, o
sea realizar la codificacin de rasgos no
numricos es un procedimiento que puede
considerarse inadecuado.
Por ejemplo: Un mapa raster de tipos de
suelos que codifique el tipo Ferraltico Rojo = 1,
Pardo = 2, Esqueltico = 3. Se sabe que la
media entre 1 y 3 es 2, pero para los edaflogos,
pudiera ser difcil aceptar que en un rea donde
hay suelos ferralticos y pardos que son muy
frtiles, pueda catalogarse como un rea,
medianamente apta para cultivos varios. De este
modo, los operadores para comparar atributos
Fig. 5. Reclasificacin de mapas. Reclasificacin de un con valores son los mismos usados en la
DEM en 5 intervalos de altura del terreno Matemtica. Esta es la principal limitante tanto de
la recuperacin como del anlisis de mapas
El NRD puede ser representado por la 5tupla ubic: Define la ubicacin espacial de la entidad
(id, rel, ctemp, ctemat, cespac) donde: geogrfica representada en el plano
(coordenadas).
id: Es el identificador del NRD.
repres: Define el tipo de objeto geomtrico en
rel: Es el conjunto finito de relaciones.
el que est representado la entidad (conjunto
ctemp: Representa las caractersticas
de celdas). Esta pro-piedad de la tupla es la
temporales de la entidad geogrfica
que se tomar para saber sobre que NDR en la
representada.
ORD se realiza la operacin de superposicin
ctemat: Representa las caractersticas
esca: Define el tipo de escala de
temticas de la entidad geogrfica
representacin de la entidad geogrfica a partir
representada.
de la resolucin de las celdas que conforman el
cespac: Representa las caractersticas
mapa raster.
espaciales de la entidad geogrfica
representada.
5.2 Estructura interna de los NRD para la
La estructura ctemp puede representarse por la representacin de variables continuas de
2tupla (eventos, rel) donde: distribucin espacial en el modelo raster
eventos: Se define como un conjunto de
acciones o hechos que afectan a una o varias Para la estructura de los NRD correspondientes a
propiedades de la misma entidad geogrfica en los datos raster en el caso de la representacin
el tiempo. (p.e: cambios de posicin, forma de variables continuas, como puede ser un mapa
etc.). de valores de altura del terreno (vase Fig. 9),
rel: Es el conjunto finito de relaciones estara basada en la representacin de las
temporales que puede tener la entidad caractersticas temticas, espaciales y
geogrfica con otra(s) entidad(es) temporales de las celdas presentes en el mapa
geogrfica(s). raster, a travs de tres subestructuras ya
descritas (ctemat, cespac y ctemp) en el espacio
La estructura eventos de la componente ctemp semntico.
puede representarse por la 5tupla (id, nombre,
descrip, tiporeg, granul) donde:
id: Es el identificador del evento.
nombre: Nombre del evento.
descrip: Representa la descripcin del evento.
tiporeg: Define el registro del tiempo de
existencia del evento.
granul: Define el tipo de granularidad en el
tiempo (Ao, Mes, Da, etc.).
La estructura ctemat puede representarse por la Fig. 9. Ejemplo de un mapa raster representando
2tupla (nombre, ()) donde: regiones de aptitud para el cultivo del caf
nombre: Nombre de la entidad geogrfica
representada. En este caso la estructura cespac estar
(): Propiedad Temtica de la entidad representada por la 3tupla (ubic, repres, esca)
geogrfica representada que la definen donde:
semnticamente. Aqu es donde se realizar ubic: Define la ubicacin espacial de la celda
las operaciones de anlisis lgico combinatorio representada en el plano, (coordenadas).
de los datos de diferente naturaleza. repres: Define el tipo de objeto geomtrico en
La estructura cespac puede representarse por la el que est representado la entidad (celda).
3tupla (ubic, repres, esca) donde: Esta propiedad de la tupla es la que se tomar
contigua, por lo que tienen relaciones de de los datos geogrficos puede ser heterognea,
adyacencia. con variables tanto cualitativas como cuantitativas
Luego de la ejecucin de estos pasos se utilizadas para describir los fenmenos u objetos
tendr generada la ORD. Seguidamente se que se estn representando. Por lo que se
puede proseguir con la ejecucin de los necesita encontrar mtodos para que tomen en
mtodos que permiten realizar una cuenta esta limitante y permitan trabajar con las
superposicin de datos raster, ya que como se descripciones mezcladas e incompletas de
ha mencionado anteriormente. manera simultnea. El campo del
5. Ejecucin de los mtodos de SSDR entre los Reconocimiento Lgico Combinatorio de
NRD-O: Patrones puede ofrecer una serie de mtodos y
En estos mtodos entran a jugar las algoritmos en este sentido.
componentes espaciales y temticas. La En este trabajo se ha realizado el esbozo de
componente espacial posibilitar seleccionar una estrategia de representacin y anlisis de
cules sern los NRD necesarios para datos geogrficos raster, la misma se basa en su
ejecutar este mtodo. Esto estar representacin semntica mediante las ORD y a
condicionado por las demandas de los travs de la combinacin de los NRD extrados
resultados que se quieran obtener. Por otro de los objetos espaciales representados en el
lado la componente temtica es la que modelo raster en la ORD. Para el caso de los
contendr los datos necesarios para poder objetos geogrficos discretos el NRD define el
realizar las operaciones de superposicin. Aun tipo de objeto geomtrico en el que est
cuando se han encontrado 4 estrategias para representada la entidad, (conjunto de celdas) y
tratar el tema de los datos mezclados, todava para el caso de variables continuas de
seguimos trabajando en buscar una mejor distribucin espacial se toma como tipo de objeto
solucin que garantice mejores resultados. geomtrico la propia celda.
Como trabajos futuros nos proponemos
continuar desarrollando esta estrategia de forma
detallada, determinar, implementar y
experimentar mtodos de anlisis de los datos a
partir de sus descripciones mezcladas sobre la
base de los mtodos desarrollados en el campo
del LCPR.
Referencias
1. Bosque, J. (1994). Sistemas de Informacin
Geogrfica: prcticas con PC ARC/INFO e IDRISI.
Fig. 11. Relaciones de adyacencia entre los objetos Madrid: RA-MA.
geogrficos raster 2. Dougherty, J., Kohavi R. & Sahami M. (1995).
Supervised and unsupervised discretization of
continuous features. 12th International Conference on
6 Conclusiones y Trabajos Futuros Machine Learning, San Francisco, CA, USA, 194-202.
3. Geographic information systems in sustainable
development. (June, 2004,). Retrieved from
Una de las principales limitantes de las http://www.fao.org/SD/eidirect/gis/eigis000.htm.
operaciones de recuperacin y anlisis raster 4. Graeff, B. (2001). Querying Raster Data Structures
radica en que los valores de las celdas son Probabilistic and non-probabilistic approaches on
nmeros (enteros, flotantes) o expresiones knowledge based template matching methods. Vistas
Booleanas, o sea realizan la codificacin de for Geodesy in the new Millennium, IAG 2001 Scientific
Assembly, Budapest, Hungary. 371-376.
rasgos no numricos por lo que los operadores 5. Graeff, B. & Carosio A. (2002). Automatic
para comparar atributos con valores son los interpretation of raster-based topographic maps by
mismos usados en la matemtica. La naturaleza means of queries. Spatial Information in Mapping and