Está en la página 1de 26

d

Introducción a los
Metadatos en Ecología

Antonio Jesús Pérez Luque


ajperez@ugr.es

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática
Universidad de Granada
Nov. 2010
Introducción a los Metadatos en Ecología.

1 Concepto e Importancia de los Metadatos.


Cuando hablamos de metadatos nos estamos refiriendo a la “información sobre
los datos”. Más formalmente, se trata de la información de nivel superior que
describe el contenido, calidad, estructura y accesibilidad de un conjunto específico
de datos (Michener et al. 1997). De una forma sencilla, si tenemos un conjunto de
datos, los metadatos son la información que nos describe quien, que, cuando,
donde y porque de ese conjunto de datos. Es decir, nos informan sobre el
contexto en el que se tomaron los datos, los protocolos utilizados, la estructura y el
formato que presentan; proporcionando de esta forma lo necesario para una
correcta interpretación de los datos.
Con un simple ejemplo entenderemos mejor a que se refiere el concepto de
metadatos. Supongamos que tenemos la siguiente tabla de datos:

Tabla de datos procedente de Mendoza (2008)


En ella podemos intuir una posible estructura en la que existen varios
registros que presentan valores para una serie de variables. Entre las variables
intuimos que la primera columna se refiere a la fecha; la tercera puede ser la
especie y quizás la segunda pueda ser algún tipo de tratamiento o localidad. Sin
embargo en las tres últimas columnas no sabemos nada de esos valores. Pero en
definitiva estamos asignando unos valores a una serie de variables de forma
intuitiva, sin un criterio. Solo quien tomó los datos sabe a que se refiere cada
columna.
Si esa misma tabla la presentamos de la siguiente forma:
Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”
Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Ahora vemos claramente en cada registro que valor corresponde a que tipo de
variable. En este caso, los metadatos se refieren a cada una de las variables.
Además sobre esa tabla de datos podemos aportar documentación que nos aporta
información necesaria para una mejor compresión de los datos, en el ejemplo:
área de estudio, como se calculan las variables, que significan los códigos y en
base a que criterios se han establecido, etc.

La importancia de los metadatos radica en la propia naturaleza de los datos. Los


datos ecológicos presentan, de forma genérica, una serie de características que
han de ser consideradas a la de la implementación de un sistema de metadatado.
Entre ellas encontramos siguientes:
1. Heterogeneidad. Los datos ecológicos exhiben un rango heterogéneo de
formatos, reflejando los diferentes motivos subyacentes a la colección de
datos (Fegraus et al. 2005). Es fácil entender la variedad de datos
ecológicos existentes existiendo variables muy diversas. Tenemos datos de
biomasa de fitoplancton, porcentaje de semillas germinadas, patrones de
precipitación en comunidades semiáridas, estudios de biodiversidad marina,

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

consumo de CO2 por la vegetación, y un inimaginable conjunto de datos


diferentes.
2. Diferentes escalas. Dentro de los estudios ecológicos se atiende a
diferentes escalas temporales (desde datos puntuales a series temporales),
geográficas (experimentos en parcelas pequeñas hasta análisis de
vegetación regional) y taxonómicas (estudios en un taxón hasta patrones de
floración de una familia).
3. Dispersión de los datos. Datos sobre la misma temática no están
centralizados ni existen catálogos de los mismos, sino que se presentan en
las diferentes estaciones o centros de investigación.
Por otro lado, hemos de considerar que existe una tendencia natural en la que los
datos se degradan con el tiempo respecto al contenido de información (Michener
et al. 2006). Es decir, existen una serie de procesos de pérdida del contenido de la
información original con el tiempo (es lo que se conoce como entropía de la
información) (Michener et al. 1997). En la siguiente figura se muestra como
evoluciona la información contenida en los datos en un sistema que no utiliza
metadatos.

Entropía de la Información contenida en los datos.

La tasa de perdida aumenta tras la publicación de los datos o la finalización de un


proyecto. Además primero se pierden los detalles específicos (notas olvidadas en

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

el cuaderno de campo; archivos digitales que no sabemos donde están; nuestra


memoria es corta, etc.) de los datos; mientras que los detalles generales se
pierden con el tiempo debido a la degradación de los medios de almacenamiento,
la perdida de memoria, etc., ya que estos detalles generalmente no se cubren en
las publicaciones.

2 Beneficios de la utilización de metadatos


Existen varios autores que apuntan detalladamente los beneficios de la utilización
de los metadatos en la documentación de datos de recursos naturales (Michener
et al. 1997, 2006; Servilla, 2004). De forma resumida, las principales razones que
fundamentan su uso son:
- Los humanos tenemos una memoria corta.
- Se reduce la entropía de la información. Muchos científicos preservan
solamente una parte de los datos originales sintetizados en forma de
publicaciones. De tal forma si se utilizan metadatos esos detalles no se
perderían con el tiempo.
- Se aumenta la longevidad de los datos, ampliando la escala temporal de los
mismos. Los datos colectados originalmente para un proyecto específico se
pueden integrar posteriormente en proyectos con escalas de largo plazo.
- Reutilización de los datos. Unos datos adecuadamente documentados (con
unos buenos metadatos) en los que se incluyan los procedimientos de
muestreo y de análisis, la estructura del conjunto de datos, las anomalías
observadas en los valores (ej.: valores extremos) nos ayudan a asegurar
que los datos originales puedan ser reutilizados y/o reinterpretados con
posterioridad.
- Se facilita el intercambio de datos entre científicos, sin necesidad de ser de
la misma disciplina.
- Se pueden llevar a cabo metanálisis y realizar síntesis basadas en amplios
datos. Cualquier científico que haya intentado hacer o haya hecho algún
trabajo de metanálisis comentará que uno de los aspectos mas laboriosos

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

ha sido el de recopilación y comprensión de los datos fuente usados para la


ejecución del metanálisis.
- Interoperabilidad de sistemas. Los datos ecológicos son muy complejos, por
lo que han de estar dotados de una buena documentación para que
diferentes sistemas puedan utilizarlos.
- Capacitación para aplicaciones analíticas avanzadas (flujos de trabajo,
integración de datos, etc). A la hora de integración de datos por diferentes
software unos datos acompañados de unos metadatos facilitaran la
ingestión y tratamiento de los mismos.
- Se pueden generar repositorios de información ecológica. Estos benefician
por un lado a la institución o grupo de investigación que los implemente (se
reduce el tiempo invertido por los investigadores en la documentación
previa a cualquier estudio, etc.), pero también benefician a la comunidad
científica, entre otras cosas porque se facilita el uso secundario de los
datos: metanálisis, flujos de trabajo y otras tantas aplicaciones analíticas
avanzadas.
- Expansión de la escala ecológica.

3 Cantidad de metadatos
Una vez comprendida la necesidad de implementar metadatos para la
documentación de datos dentro de un sistema de información (Bonet & San Gil,
2010; Bonet et al. 2010), la siguiente pregunta se refiere a la cantidad de
información que han de contener los metadatos. La respuesta es sencilla,
“cuanto mas mejor”, aunque se debe buscar un equilibrio entre el esfuerzo que
nos supone la documentación de nuestros datos con el objetivo de la operación de
documentado que aportará un valor añadido (derivado) a los datos (reutilización
de los datos, metanálisis, etc.). Algunos autores han comprobado que al principio
la documentación de los datos es costosa en cuanto a tiempo, aunque los
investigadores una vez familiarizados con los procedimientos de creación de
metadatos no suelen tardar mas de 30 minutos en documentar sus datos (Fegraus

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

et al., 2005). La cantidad de información que podemos aportar cuando estamos


documentando nuestros datos va a depender de nuestro criterio y del tipo
(formato) de datos a documentar. Es importante introducir aquí el concepto de los
niveles de completitud. Se trata de una escala jerárquica que nos indica la
completitud de nuestros metadatos y que se relaciona con la utilización de los
datos. Algunos autores han propuesto diferentes niveles (Hook et al, 2007) pero
de forma genérica podemos establecer tres niveles de completitud: nivel
descriptivo-bibliográfico; nivel de descubrimiento; y nivel de integración (San Gil,
2010). La diferencia entre ellos radica en la cantidad de información que
documentamos y su potencialidad de utilización. Llegando a completar el primer
nivel tendremos la documentación mínima para que el conjunto de datos se
integre en un catalogo o repositorio de datos y puede ser adecuadamente
identificado o ubicado. En el segundo de los niveles, además de incluir el primero,
contienen información sobre la cobertura de los datos (geográfica, temporal y
taxonómica), permitiéndonos unas búsquedas de datos más avanzadas (i.e.: por
taxón, por zona geográfica). En el tercer nivel se dan detalles completos de los
datos: métodos, entidades-atributos de las tablas, formato de los datos, control de
calidad de los datos, etc., con lo que se permite una integración semi o automática
de los datos.

Cantidad de metadatos necesarios

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

En la figura anterior se resume la cantidad y estructuración de los metadatos


necesarios respecto de la funcionalidad de los datos. Unos metadatos con bajo
contenido y baja estructura podrán ser usados a nivel personal, aunque hemos de
recordar que la memoria humana es corta. Podemos ver que existen tres
tendencias claras:
ƒ Aumento de la estructura. Podremos llegar a conocer todos los datos que
tenemos porque se podrán integrar en un catálogo.
ƒ Aumento del contenido. Aportar mucha documentación sobre nuestros datos
permitirán tanto su reutilización en otros proyectos o investigaciones
(metanálisis, etc.) como la realización de re-muestreos para ver el si el proceso
observado ha sufrido cambios (cambio de uso de los datos: de investigación
puntual a series de largo plazo –cambio climático, patrones temporales–).
ƒ Aumento del contenido y de la estructura. Esta permitirá diferentes
funcionalidades de los datos: intercambio con otros científicos (colegas o de
otros ámbitos del proyecto). También permitirá la publicación de los datos y la
interoperabilidad (flujos de trabajo).

4 Estándares de Metadatos
Supongamos que tenemos unos datos publicados en un artículo científico. Dichos
datos presentan algunos de sus metadatos de forma asociada en los apartados de
metodologías de dicho artículo. Aunque no contiene todos los metadatos
necesarios sobre dicha tabla de datos, la información incluida en los métodos se
pueden considerar metadatos de la tabla, aunque estos metadatos no presentan
una estructura común y clara.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Los estándares proporcionan un conjunto común de términos comprensibles para


describir los datos, es decir, son como unos contenedores en los cuales
introducimos algunos de los metadatos, de tal forma que cuando nos referimos al
contenedor A, todos sabemos que tipo de información podemos obtener al
analizar dicho contenedor. De esa forma estamos facilitando la entrada y
recuperación de datos y metadatos; y con el uso de estándares se está dando
soporte para que sean usados en operaciones automáticas de entrada, búsqueda,
integración y síntesis. Se permiten operaciones crosswalk, etc. Cuando utilizamos
estándares estamos expresando los metadatos de forma estructurada.

Existen diferentes esquemas o estándares de metadatos que establecen una serie


de criterios fijos para la descripción de los datos. Estos estándares o modelos de
metadatos varían en función del propósito y de la disciplina científica:
biodiversidad (TDWG, Biodiversity Information Standart), información geográfica
(Content Standards for Digital Geospatial Metadata, U.S. Federal Geographic Data
Committee; normas ISO 19115), Ecological Metadata Languague (EML), entre
otros.

A continuación se describen brevemente algunas características de algunos de


ellos.

ISO19115
ISO19115 es una norma internacional de metadatos que define los elementos de
los metadatos, proporciona un modelo de metadatos y establece un conjunto
común de terminología, definiciones y procedimientos de ampliación para

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

metadatos (Dobarro et al 2007). Su principal objetivo es proporcionar una


estructura definitiva y única para describir datos geográficos digitales. Las ventajas
de su implementación son (Clerigué et al 2005):
• proporciona a los productores de los datos la información necesaria para
describir correctamente sus datos.
• facilita la organización y el mantenimiento de los metadatos de datos
geográficos.
• Permite a los usuarios utilizar los datos geográficos de una forma más
eficiente, porque conocerán sus características básicas.
• Facilita el descubrimiento, la recuperación y la reutilización de los datos. A
los usuarios les será más fácil localizar, acceder, evaluar, adquirir y utilizar
los datos.
• Permite a los usuarios determinar si los datos geográficos son útiles para
ellos.
Es una norma de referencia obligada para todo aquel que quiera tratar con
metadatos, y define con detalle todos los aspectos relacionados con los
metadatos. Para su correcta implementación es necesario el estándar ISO19139
que define cómo se deben codificar los metadatos ISO19115 sobre formato xml.
En cuanto a los inconvenientes algunos autores apuntan que se trata de una
norma muy extensa (401 ítems), compleja, poco acotada (Dobarro et al. 2007).
Por ello dentro de este estándar existe el llamado ISO Core, que comprende un
conjunto de metadatos del estándar ISO19115 considerados como más
fundamentales o importantes en la documentación de los datos espaciales. Se
trata con ello de permitir la posibilidad de acortar la tarea de catalogación de
metadatos, que sería muy extensa si se atiende a los mas de 400 ítems del
estándar, muchos de los cuales son demasiado específicos o difíciles de conocer
(Clerigué et al 2005).

EML
Basado en los trabajos pioneros de Michener et al. (1997) y de la Ecological
Society of America se desarrolló un estándar para los datos ecológicos conocido

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

como EML (Ecological Metadata Language). Este estándar, mantenido por la red
KBN (Knowledge Network for Biocomplexity), consiste en un lenguaje común
implementado en XML que permite describir, archivar y transportar datos.
Presenta una estructura modular, donde cada uno de los módulos esta diseñado
para describir una parte lógica del total de los metadatos que deben ser incluidos
en un conjunto de datos ecológicos. Entre sus características destacan:
• Cada modulo esta diseñado para describir una parte lógica del total de
metadatos que deben ser incluidos en un conjunto de datos ecológicos
• Flexibilidad: La estructura modular que presenta le confiere flexibilidad y
múltiples opciones de reutilización.
• Es extensible: puede ser utilizado para describir distintos tipos de datos.
• Permite el análisis de los datos en aplicaciones informáticas.

Estructura modular de EML.

EML es un estándar comprehensivo de metadatos que es particularmente


aplicable para un amplio rango de datos ecológicos y esta suficientemente
estructurado para soportar varios tipos de funciones automatizadas. Su
organización en módulos aumenta la granularidad y la flexibilidad. Es un estándar
que se adapta bien a distintas aplicaciones de la investigación, desde el simple
descubrimiento de datos hasta avanzados procesamientos de datos; de esta
forma proporciona un marco de trabajo para que los científicos narren de forma
resumida descripciones ricas en semántica de sus metadatos y datos, incluyendo
por ejemplo unidades de medidas, área de muestreo, etc. (Fegraus et al. 2005).

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Pretende reducir la ambigüedad e incertidumbre mediante la formalización de los


metadatos en un conjunto, comprensivo y estandarizado, de términos y
definiciones proyectadas específicamente para datos ecológicos.
Es importante destacar que incorpora diferentes elementos de otros estándares,
tales como: Dublin Core; Perfil de Datos Biológicos (BDP) del FGDC; ISO
19115; Darwin Core; Geography Markup Language (GML), lo cual le permite cierta
interoperabilidad con estos estándares.
Este estándar está siendo utilizado dentro de la Red Internacional de Seguimiento
Ecológico a largo plazo ILTER (International Long-Term Ecological Research) y
tiene un gran desarrollo y continuas actualizaciones. En la red LTER-US los datos
están documentados con este estándar. De igual modo se ha incorporado dentro
de la implementación de los metadatos en la iniciativa GBIF (Global Biooiversity
Information Facility).
Existen diversas herramientas para la creación de metadatos siguiendo el
estándar EML, destacando los editores de metadatos Morpho, MetadataEditor y el
paquete de herramientas desarrollado por GBIF para la documentación de los
datos.

Núcleo Español de Metadatos (NEM) y Directiva INSPIRE


INSPIRE es el nombre de la Directiva 2007/2/CE, de 14 de marzo de 2007, por la
que se establece una infraestructura de información espacial en la Comunidad
Europea. Esta Directiva es de aplicación para datos y servicios espaciales
referentes al territorio de la UE, en poder de las Administraciones Públicas de los
estados miembros, comprendidos en los temas especificados en sus Anexos I, II y
III. Uno de sus elementos clave es la generación de metadatos conformes a unos
requerimientos fijados por las reglas de implementación (IR) de la misma Directiva.
INSPIRE, mediante sus Reglas de Implementación, viene a solventar el problema
de una base legal y técnica común para todos los estados miembros de la unión
Europea, para poner orden y concierto en cuanto a la estandarización de los
metadatos (Ortíz et al, 2008).

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

El Nucleo Español de Metadatos (NEM) se define como un conjunto mínimo de


metadatos entendidos como un perfil de ISO 19115:2003 de acuerdo con el
concepto de perfil definido en la Norma ISO 19106 “Geographic Information-
Profiles”, es decir, es un modo particular y concreto de aplicar y utilizar una
Norma, seleccionando un conjunto de items y un conjunto de parámetros
opcionales. Para ello este perfil va a tener en cuenta otras iniciativas y acciones
relevantes que en la actualidad se están desarrollando en materia de metadatos.
Este perfil constituye por lo tanto un núcleo “Core”, conjunto de metadatos
“mínimo” aconsejable por su utilidad y relevancia que va a permitir realizar
(búsquedas, comparaciones,..) a partir de metadatos que proceden de diferentes
fuentes, sobre distintos conjuntos de datos, de una manera rápida, práctica, fácil y
fiable. Se define, para ser utilizado por todos los catálogos generados en las
diferentes organizaciones relacionadas con la información geográfica de manera
que se consiga la interoperabilidad de metadatos en toda España. No es, por lo
tanto, un perfil normativo o restrictivo, no se pretende que se implemente
directamente sino que se aconseja su utilización, cada institución u organismo
debe estudiar cuales son los metadatos que considera adecuados para satisfacer
sus necesidades, y una vez establecidos se recomienda incluir al menos los ítems
que establece el perfil NEM, garantizando así la compatibilidad con el resto de
iniciativas (Sánchez-Maganto et al. 2005; Ballarí et al. 2008).
Se caracteriza por ser un perfil:
• Consolidado: aprobado por el Consejo Superior Geográfico.
• Consensuado: resultado de un amplio consenso, a partir de opiniones,
comentarios y aportaciones de un grupo abierto de expertos en la materia
pertenecientes a diferentes organizaciones e instituciones en el ámbito
nacional, autonómico y local.
• Estable: no va a ir incorporando nuevos ítems conforme vayan surgiendo
iniciativas en el mundo de los metadatos, sino que se mantendrá
razonablemente invariable.
• No restrictivo: no pretende que se implemente directamente tal y como se
define, sino que cada organismo o institución en función de sus

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

necesidades y la finalidad que persiga, establezca los metadatos que


necesita y se recomienda que se incluya al menos los items definidos por
NEM.
Existen algunas herramientas para la creación de metadatos conforme a NEM,
como por ejemplo el editor de metadatpos CatMDEdit, que está desarrollada como
proyecto Open Source (código abierto), multilingüe, multiplataforma y compatible
con otros estándares o normas de metadatos.

5 Algunas aproximaciones actuales de metadatado


dentro de Sistemas de Información.
Cuando se piensa en un sistema de información ambiental es necesario atender a
mecanismos de normalización, integración y procesado de datos brutos (Bonet &
San Gil, 2010; Bonet et al. 2010, 2010b). Uno de los aspectos más importantes a
la hora de gestionar la información es la documentación de los datos brutos, lo que
se conoce como metadatado de la información.
Algunas aproximaciones en este sentido consideran importante seguir una filosofía
en la cual, primero se documentan los datos con el mayor detalle posible mediante
algun sistema propio de metadatado, el cual puede tener en cuenta o no algunos
estándares de metadatos. Con este metadatado se es capaz de generar catálogos
con toda la información y realizar análisis complejos (ej. Bonet, 2010; Bonet &
Pérez-Luque, 2010). Posteriormente, una vez bien documentados los datos para
uso interno, se pueden realizar procesos de mapeo y validación con estándares
internacionales de metadatos, lo cual permitirá comunicarse con otras redes o
iniciativas nacionales o internacionales que usen un estándar de metadatos
específico (San Gil, 2010).
Algunos ejemplos se están llevando a cabo desde la iniciativa GBIF o en el
Observatorio de Cambio Global de Sierra Nevada (Bonet et al. 2010; Pérez-Luque
et al. –datos sin publicar-)

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Sistema de Metadatos del Observatorio de Cambio Global de Sierra Nevada


(SiMetOb)
Dentro del Sistema de Información del Observatorio de Cambio Global en Sierra
Nevada (Bonet, 2010; Bonet et al. 2010b) se ha desarrollado una aproximación
para el metadatado de la información capaz de documentar los datos a diferentes
niveles de completitud. Nuestro objetivo fundamental en esta tarea ha sido diseñar
e implementar un sistema de "metadatado" que permita documentar toda la
información existente en el sistema. Con toda esta "metainformación" se ha
elaborado un catálogo o repositorio de metadatos, que nos permite la consulta de
manera ágil toda la documentación asociada a los distintos elementos del sistema.
Este sistema de metadatado, llamado SiMetOb (SIstema de METadatos del
Observatorio de Cambio Global en Sierra Nevada) (Pérez-Luque et al., -datos sin
publicar-) tiene su fundamento en la necesidad de tener bien documentada toda la
información que se maneja y que se genera dentro del proyecto, con el objetivo de
su utilización a nivel interno y su replicación a nivel externo del proyecto. Este
sistema de metadatos contempla, por un lado la documentación semiautomática
de datos brutos almacenados en bases de datos relacionales normalizadas, así
como la documentación de otro tipo de información (textos, diapositivas,
protocolos, etc.). Por otro lado el sistema de metadatos se ha diseñado atendiendo
a varios estándares internacionales de metadatos, lo que hace que nuestro

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

catalogo de metadatos sea replicable en otros catálogos regionales, nacionales e


internacionales.
La edición de metadatos, tras revisar los editores de metadatos existentes, se
realiza mediante un sistema propio. En este sentido, la aproximación consistió en:
i) documentar toda la información con un formato interno que permitiera su
utilización dentro del sistema de información, ii) almacenar los metadatos en un
catálogo consultable, iii) exportar los archivos de metadatos en diferentes
estándares internacionales previa validación del cumplimiento de éstos, y iv)
replicación de los metadatos en diferentes catálogos de administraciones públicas
y de iniciativas internacionales. En la siguiente figura se muestra un esquema del
diseño y funcionamiento del Sistema de Metadatos SiMetOb. De esta forma se
documenta la información adecuándola a las necesidades locales y luego se
comunica con otros estándares mediante diferentes herramientas (San Gil, 2010).

Esquema de funcionamiento de SiMetOb


Los diferentes tipos de información entran al sistema y son documentados de
forma semiautomática (algunos datos mediante formularios y otros
automáticamente). Esto se realiza vía web mediante el Sistema de Información del

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Observatorio de Cambio Global dentro del apartado de metadatos. En la siguiente


imagen se muestra un ejemplo de formulario de metadatado de la información.

Formulario de metadatos

Para la elección de los campos de metadatos a rellenar se realizó previamente un


análisis de los diferentes estándares de metadatos. Los campos implementados
en SiMetOb han considerado principalmente dos estándares: EML (Ecological
Metadata Languague) y NEM (Nucleo Español de Metadatos). De esta forma el
sistema de metadatos que hemos diseñado presenta una doble vertiente en
cuanto a su compatibilidad, esto es: científica y de gestión. Es decir, nuestros
datos se puede comunicar con la comunidad científica al tener los datos
documentados de acuerdo al estándar de metadatos que tienen establecido; y al
mismo tiempo son fácilmente integrables con las administraciones ambientales
(REDIAM, a nivel regional) encargadas de la gestión de los recursos naturales, ya
que utilizamos el mismo lenguaje de metadatos.
Una vez documentada la información con los metadatos propios estos se
almacenan en un catálogo implementado dentro del Sistema de Información. Este
catálogo está basado en el estándar de metadatos EML, con lo que los metadatos
de SiMetOb han de ser convertidos a dicho estándar. Así, se realiza una
validación de los metadatos mediante un parser desarrollado por la KBN
(Knowledge Network for Biocomplexity). El catálogo de metadatos está construido
con el software MetaCat, también desarrollado por la KNB. De tal modo dentro del
Observatorio de Cambio Global tenemos implementado un Metacat que actúa de

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

catálogo interno, aunque también, como veremos mas adelante es el medio para
replicarnos en otras iniciativas internacionales.

Catálogo de Metadatos

Desde este catálogo los usuarios pueden consultar la información gracias a los
metadatos. Se pueden realizar consultas mediante búsquedas de texto, o
mediante búsquedas espaciales a través de un visor de mapas implementado en
el propio catálogo.
Los resultados que obtienen los usuarios al realizar las búsquedas ya presentan
una estructura de acuerdo al estandar EML (un archivo xml), aunque se muestran
mediante plantillas HTML. En ellos se pueden ver los datos referentes al
responsable de los datos, el título del conjunto de datos, abstract, palabras claves,
quien proporciona los datos, responsable de metadatos, etc. Estos resultados
además contienen archivos con los metadatos de la estructura de las tablas de
datos contenidas en la información documentada. De tal modo que se puede
consultar características como: atributos de las tablas, relaciones entre los
atributos, atributos claves, tipo de atributos, etc.
También se permite la descarga del archivo de metadatos en formato EML (xml)
con lo que se posibilita la integración de la información en diferentes aplicaciones,
como por ejemplo en flujos de trabajo automatizadaos (ej.: Kepler), en repositorios
de modelos, etc.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

En la siguiente imagen se muestra el HTML que se obtiene al realizar una


búsqueda. Como se puede ver existen diferentes archivos de metadatos
asociados dentro del propio archivo original de metadatos.

Ejemplo de resultados de la búsqueda en el Catálogo de Metadatos.


El archivo que se muestra ya presenta formato EML.

Interoperabilidad del Sistema con otros estándares


SiMetOb presenta una característica clave: flexibilidad. Es un sistema de
metadatos flexible que permite su conversión a otros estándares de metadatos.
Hasta ahora tenemos implementado tres conversiones:
• Formato EML. Se exportan los datos de acuerdo al estándar internacional
EML. Cuando se ha realizado esta conversión, el archivo de metadatos es
validado con una herramienta (parser) gestionada por los desarrolladores
del EML. De esta forma se realiza un control de calidad de los metadatos,
para ver si éstos cumplen los requisitos exigidos por el estándar. El archivo
en formato EML, ya validado, se ofrece dentro de la web Sistema de
Información Linaria en el apartado de metadatos. Con esta conversión se
atiende a la necesidad de comunicación mediante metadatos dentro de la
comunidad científica internacional.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Vista de la estructura del archivo de metadatos en formato EML


• Formato INSPIRE. En este caso los metadatos son validados de acuerdo a
la Directiva INSPIRE. Para ello se utiliza la herramienta INSPIRE Metadata
Validator. De esta forma, los metadatos están capacitados para utilizarse
dentro de cualquier Infraestructura de Datos Espaciales dentro de las
Administraciones Públicas de la Unión Europea.
• Formato Rediam. Se trata de una aplicación específica del Núcleo Español
de Metadatos (NEM). La Red de Información Ambiental de Andalucía utiliza
el NEM para documentar sus metadatos. Para facilitar la tarea de
documentación de la información elaboró unas directrices de catalogación
de la Información Ambiental (Marquez-Arroyo, 2009), que son las que se
han tenido en cuenta para exportar nuestros metadatos en el formato que
hemos llamado Rediam. Para ello se utiliza una hoja de estilos que
convierte los archivos xml de los metadatos y los exporta en el formato que
acepta la Red de Información Ambiental de Andalucía.

Vista de un archivo de metadatos de SiMetOb de acuerdo al estilo de la Rediam

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Replicación de los Metadatos de SiMetOb en otros catálogos.


Debido a las características mencionadas del Sistema de Metadatos que hemos
diseñado e implementado, los metadatos del Observatorio de Cambio Global de
Sierra Nevada son capaces de replicarse en otros catálogos internacionales.
Actualmente se está en proceso de integración en los siguientes catálogos:
• Red LTER-US. Se trata de la red americana de seguimiento ecológico a
largo plazo. Tienen un catálogo de metadatos que aglutina miles de
archivos de metadatos procedentes de los diferentes sitios de seguimiento
que tienen distribuidos por todo el continente americano. El estándar con el
que trabaja es EML. Para su inclusión de nuestros metadatos se ha tenido
que realizar una validación de los mismos y la asignación de un
identificador del sitio proveedor. En este caso, al Observatorio de Cambio
Global en Sierra Nevada se le ha asignado el identificador lter-spain-
sierranevada.
• NBII (National Biological Information Infraestructure). La iniciativa NBII ha
puesto en marcha un clearinhouse, que es un agregador de registros de
metadatos de diferentes organizaciones científicas que deseen
proporcionar sus metadatos allí para ser buscados. Se trata de un potente
buscador para científicos que les permite compartir y acceder a gran
cantidad de información referente a la investigación científica en recursos
naturales. Actualmente estamos en proceso de replicación de nuestros
metadatos en dicho repositorio.
• Rediam. Nuestros metadatos están capacitados según el perfil NEM, lo que
les permite incorporarse al catálogo de metadatos de la Rediam, previa
aplicación del estilo que dicha red tiene acotado dentro de su catalogo de
metadatos. Actualmente estamos en proceso de replicación de nuestros
metadatos en dicho repositorio
• Otros. Al ser flexible nuestro sistema de metadatos se puede replicar en
otros catálogos que utilicen estándares internacionales. Entre ellos

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

podemos destacar: Infraestructuras de datos Espaciales, Portal de


Metadatos de GBIF, etc.

Como citar este documento:


Pérez-Luque, A.J. (2010). Introducción a los Metadatos en Ecología. In: “Ecoinformática”. Master Oficial
“Conservación, Gestión y Restauración de la Biodiversidad”. Universidad de Granada. Nov. 2010. Disponible
en http://sl.ugr.es/ajpelu_metadatos_master2010texto

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

6 Bibliografía.

Aguilar, R.; Pan, J.; Gries, C.; San Gil, I. & Palanisamy, G. (2010). A flexible online
metadata editing and management system. Ecological Informatics, 5 (1):26-31.
Alonso, B. & Valladares, F. (2006). Bases de datos y metadatos en ecología:
compartir para investigar en cambio global. Ecosistemas, 15 (2): 83–88.
Ballari, D.; Sánchez-Maganto, A.; Nogueras-Iso, J.; Rodríguez-Pascual, A. &
Bernabé, M.A. (2006). Medidas para impulsar la utilización del Núcleo Español
de Metadatos (NEM). In C. Granell-Canut & M. Gould Carlson, (Eds.) Avances
en las Infraestructuras de Datos Espaciales. Treballs d’Informàtica i
Tecnología, 26. Castellón, España, 61–72.
Bonet-García, F.J. (2010). Converting field data into knowledge: towards
adaptative management in Sierra Nevada LTER site. In 2ª International GMBA-
DIVERSITAS Conference “Functional significance of mountain biodiversity”.
Chandolin, Switzerland. 27 - 30 Julio. Conference abstracts, p. 42
Bonet, F.J. & Pérez-Luque, A.J. (2010). Relationship of snow cover and vegetation
structure in Sierra Nevada (Spain), a Mediterranean mountain. In Global
Change and the World's Mountains. Perth, Scotland. 26-30 Sep. 2010.
Bonet-García, F.J. & San Gil, I. (2010). Gestión de la información ambiental en los
espacios protegidos y en las redes de seguimiento del cambio
global. Ecosistemas, 19 (2): 89 – 96. Disponible en
http://www.revistaecosistemas.net/pdfs/638.pdf
Bonet, F.J.; Pérez-Luque, A.J.; Moreno, R. & Zamora, R. (2010). Observatorio de
Cambio Global en Sierra Nevada. Estructura y contenidos básicos. Consejería
de Medio Ambiente, Junta de Andalucía - Universidad de Granada. [Online].
Disponible en: http://www.scribd.com/doc/32239398/Observatorio-Sierra-
Nevada-Datos-basicos
Bonet, F.J.; Pérez-Luque, A.J. & Pérez-Pérez, R. (2010b). Linaria: an information
system to implement GLOCHAMORE project and promote conversion of
information into knowledge in Sierra Nevada Biosphere Reserve.. In Global
Change and the World's Mountains. Perth, Scotland. 26-30 Sep. 2010.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Clerigué, R.; Echamendi, P.; Fontano, S. & Sabando, C. (2005). Integración de


metadatos en un sistema de información corporativo: La IDE de Navarra. In 6th
Semana Geoinformática. 8 a 11 de febrero de 2005. Barcelona.
Cook, R.B.; Olson, R.J.; Kanciruk, P. & Hook, L.A. (2001). Best Practices for
Preparing Ecological Data Sets to Share and Archive. Bulletin of the Ecological
Society of America, 82 (2): 138–141.
Dobarro, A.; Luaces, M. R. & Paramá, J. R. (2007). Componentes para la gestión
del catálogo y los metadatos de un sistema de información geográfica. In La
Infraestructura de Datos Espaciales de España en 2007. Proyectos, servicios y
nodos (JIDEE 2007), Grupo76, Santiago de Compostela (España), 2007, pp.
60-72.
Fegraus, E.H., Andelman, S., Jones, M.B. & Schildhauer, M., (2005). Maximizing
the Value of Ecological Data with Structured Metadata: An Introduction to
Ecological Metadata Language (EML) and Principles for Metadata
Creation. Bulletin of the Ecological Society of America, 86 (3): 158–168
Garg, S. (2005). Ecological Metadat Language modules and their uses. Second
KNB Data Management Tools Workshop. University of New Mexico.
Albuquerque.
Hook, L.A.; Beaty, T.W.; Santhana-Vannan, S.; Baskaran, L.; Cook & R. B. (2007).
Best Practices for Preparing Environmental Data Sets to Share and Archive.
[Online]. Disponible en: http://daac.ornl.gov/PI/bestprac.html
Jones, M.B., Berkley, C., Bojilova, J. & Schildhauer, M. (2001). Managing scientific
metadata. Internet Computing IEEE, 5 (5): 59–68.
Jones, M.B., Schildhauer, M.P., Reichman, O.J. & Bowers, S. (2006). The New
Bioinformatics: Integrating Ecological Data from the Gene to the
Biosphere. Annual Review of Ecology, Evolution, and Systematics, 37 (1): 519–
544
Leinfelder, B.; Tao, J.; Costa, D.; Jones, M.B.; Servilla, M.; O'Brien, M. & Burt, C.
(2010) A metadata-driven approach to loading and querying heterogeneous
scientific data. Ecological Informatics, 5 (1):3 – 8

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Márquez-Arroyo, M. (2009). Directrices para la catalogación de información


ambiental. Red de Información Ambiental de Andalucía. Documento inédito
(EGMASA).
Michener, W.K., Brunt, J.W., Helly, J.J., Kirchner, T.B. & Stafford, S.G. (1997).
Nongeospatial metadata for the ecological sciences. Ecological Applications, 7
(1):330-342.
Michener, W.K. & Brunt, J.W. (Eds.) (2000). Ecological Data: Design, Management
and Processing. Oxford: The seminal paper Blackwell. 180 pp.
Michener, W.K. (2006). Meta-information concepts for ecological data
management. Ecological Informatics, 1 (1): 3–7.
Ortíz, L.; Zabala, A. & Casanovas, P. (2008). Generación de metadatos según las
Reglas de Implementación de metadatos de la directiva INSPIRE en el marco
del Departament de Medi Ambient i Habitatge (DMAH) de la Generalitat de
Catalunya. Algunas consideraciones. In Jornadas Técnicas de la
Infraestructura de Datos Espaciales de España (JIDEE 2008), 5 – 7
Noviembre. Tenerife.
Pérez-Luque, A.J.; Pérez-Pérez, R.; Bonet-García, F. (unpublished). Sistema de
Metadatos del Observatorio de Cambio Global en Sierra Nevada.
San Gil, I. (2010). EML (Ecological Metadata Languague): El lenguaje de
metadatos ecológicos. Curso organizado por Red LTER-Spain y ICTS-Doñana.
Sevilla, 16 – 18 Junio.
Sánchez-Maganto, A.; Nogueras-Iso, J. & Ballari, D. (2008). Normas sobre
metadatos (ISO19115, ISO19115-2, ISO19139, ISO 15836). Mapping, 123: 48–
57.
Sánchez-Maganto, A.; Rodríguez-Pascual, A.; Abad-Power, P. & López-Romero,
E. (2005). El Núcleo Español de Metadatos, perfil mínimo recomendado de
metadatos para España. In Jornadas Técnicas de la IDE de España. Madrid.
Servilla, M. (2004). An Introduction to Metadata. KNB Data Management Tools
Workshop. University of New Mexico. Albuquerque.
Subgrupo de Trabajo del Núcleo Español de Metadatos (2005). Núcleo Español de
Metadatos (NEM v1.0).

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada
Introducción a los Metadatos en Ecología.

Yang, Z. & Henshaw, D. (2007). Generating EML from a Relational Database


Management System (RDBMS). LTER DataBits, Spring: 13–18.

Master Oficial “Conservación, Gestión y Restauración de la Biodiversidad”


Asignatura: Ecoinformática - Universidad de Granada

También podría gustarte