Documentos de Académico
Documentos de Profesional
Documentos de Cultura
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/267811352
CITATIONS READS
0 69
1 author:
Eduardo E Zattara
Indiana University Bloomington
50 PUBLICATIONS 124 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
#SciArt: Exploring the Aesthetics and Feelings of Scientific Research View project
All content following this page was uploaded by Eduardo E Zattara on 06 November 2014.
The user has requested enhancement of the downloaded file. All in-text references underlined in blue are added to the original document
and are linked to publications on ResearchGate, letting you access and read them immediately.
Desarrollo de un Sistema Integral de
Información para el análisis
estructural de comunidades de peces
LIC. EDUARDO ENRIQUE ZATTARA
INFORME FINAL
Beca de Iniciación “Dr. Gregorio Alvarez”,
Universidad Nacional del Comahue
Tabla de Contenidos
Tabla de Contenidos ......................................................................................................... 3
Prefacio............................................................................................................................. 5
1-Introducción .................................................................................................................. 7
1.1-Patagonia, sus cuerpos de agua y su ictiofauna...................................................... 7
1.2- El Grupo de Evaluación y Manejo de Recursos Icticos ........................................ 8
1.3- Sistema Integral de Información: una base de datos relacional ............................ 9
2 - Introducción a las bases de datos .............................................................................. 12
2.1 - Definiendo qué es una base de datos.................................................................. 12
2.2- Modelos de bases de datos .................................................................................. 13
2.2.1- Bases de datos de archivo plano................................................................... 14
2.2.2- Bases de datos jerárquicas............................................................................ 14
2.2.3- Bases de datos reticulares............................................................................. 15
2.2.4- Bases de datos relacionales .......................................................................... 15
2.2.5- Bases de datos orientadas a objetos.............................................................. 16
2.3- Características de las bases de datos relacionales ............................................... 17
2.3.1- Términos básicos y definiciones .................................................................. 17
2.3.2- Las reglas de Codd ....................................................................................... 19
2.4- Relaciones ........................................................................................................... 23
2.4.1- Características básicas.................................................................................. 23
2.4.2- Uno-a-varios (1-N o 1→∞) .......................................................................... 25
2.4.3- Varios-a-varios (N-N o ∞→∞) .................................................................... 25
2.4.4- Uno-a-uno (1-1 o 1→1 ) .............................................................................. 25
2.4.5- Recursivas .................................................................................................... 26
2.5- Integridad de datos .............................................................................................. 26
2.6- Las formas normales: optimizando el diseño...................................................... 27
2.6.1- Fundamentos ................................................................................................ 27
2.6.2- Primera Forma Normal (1FN)...................................................................... 29
2.6.3- Segunda forma normal (2FN) ...................................................................... 29
2.6.4- Tercera forma normal (3FN) ........................................................................ 30
2.6.5- Forma normal de Boyce-Codd (BCFN) ....................................................... 30
2.6.6- Cuarta forma normal (4FN) ......................................................................... 30
2.6.7- Quinta forma normal (5FN) ......................................................................... 31
2.6.8- Ventajas y desventajas de conformar la base a las formas normales ........... 31
3- El punto de partida: material preexistente.................................................................. 32
3.1- Saber de dónde venimos...................................................................................... 32
3.2- Estructura de muestreo del GEMaRI .................................................................. 33
3.3- Las planillas de campo ........................................................................................ 36
3.4- Almacenamiento digital ...................................................................................... 38
3.5 - Otros tipos de datos ............................................................................................ 40
4- De bases planas al modelo relacional......................................................................... 41
4.1- Tablas centrales y accesorias............................................................................... 41
4.1.1- La tabla de capturas...................................................................................... 41
4.1.2- La tabla de lagos........................................................................................... 43
5- Sistema Integral de Información: Definiciones de Formato y Estructura.................. 48
5.1- Convenciones ...................................................................................................... 48
5.2- Tablas .................................................................................................................. 48
5.3- Relaciones ........................................................................................................... 57
6 - Expandiendo la base de datos ................................................................................... 59
6.1 - Un sistema preparado para crecer ...................................................................... 59
6.1.1- Añadiendo registros ..................................................................................... 59
PREFACIO
El presente texto constituye el Informe Final del proyecto “Desarrollo de un
sistema integral de información para el análisis estructural de comunidades de peces”,
financiado mediante una Beca de Iniciación en Investigación de la Universidad
Nacional del Comahue. El proyecto original, y su desarrollo y modificaciones han sido
explicitados previamente. El presente informe, por tanto, pretende servir no sólo para
evaluar el desarrollo del Sistema Integral de Información (SII) que fue objeto del trabajo
de los últimos dos años, sino además para documentar los principios y fundamentos que
lo sustentan, los pasos lógicos que llevaron al diseño de su estructura, instrucciones
generales y específicas para su uso por parte de los integrantes del GEMaRI, directivas
para su expansión posterior, y ejemplos e ideas para aprovechar al máximo las
potencialidades del sistema.
1-INTRODUCCIÓN
1.1-PATAGONIA, SUS CUERPOS DE AGUA Y SU ICTIOFAUNA
Los sistemas dulceacuícolas cubren aproximadamente el 1% de la superficie de la
Tierra, pero, como en su mayoría se componen de cuerpos de agua someros
(comparados con las profundidades oceánicas), no comprenden más del 0,01% del total
del volumen de los recursos acuáticos. Sin embargo, cerca del 40% del total de especies
de peces del mundo son normalmente encontradas viviendo en ríos y lagos (Jobling
1995).
Los cuerpos de agua de Patagonia presentan una situación de particular interés,
puesto que se ubican en un amplio rango latitudinal, abarcando regímenes notablemente
distintos, lo que genera una gran diversidad de variantes ambientales. Albergan una
ictiofauna que reviste una considerable importancia por sus valores biogeográficos y
cómo recurso turístico (Vigliano 1997). Estos ecosistemas acuáticos se han mantenido
libres de la influencia humana hasta épocas relativamente recientes, por lo que además
comprenden focos para la conservación de la biodiversidad. Las actividades económicas
que han acompañado al aumento demográfico de las últimas décadas están cambiando
esta situación, puesto que la mayoría tiene un impacto directo o indirecto en el medio
ambiente en el que se desarrollan.
Los cuerpos de agua patagónicos, en especial los lagos andinos, son un importante
recurso natural, no sólo como reservorios de agua dulce y para la generación de energía
hidroeléctrica, sino por su valor paisajístico, que los convierte en motivo de interés
turístico. Como recurso, está fuertemente expuesto a la degradación derivada de la
sobreexplotación y el manejo incorrecto, que a su vez son consecuencia de políticas
ambientales que, incluso cuando estén bien intencionadas, suelen sufrir falencias a
causa de la falta de conocimientos adecuados acerca de la estructura de los ambientes a
manejar (Parker et al, 1999).
La ictiofauna de los lagos y ríos patagónicos es un claro ejemplo de las
complejidades implícitas en el manejo sustentable de un recurso natural. Aunque la
riqueza específica de los peces patagónicos es baja, si se la compara con la de los
ecosistemas tropicales (Ringuelet 1975), la ictiofauna comprende un ensamble muy
particular, de interés biogeográfico no sólo por sus componentes endémicos, sino por la
presencia de especies compartidas con Oceanía (como es el caso del puyen chico, G.
comparables.
Estandarización
Lograr que los tipos de datos disponibles sean comparables es un punto
fundamental para el análisis de la información. Dos conjuntos de datos pueden ser no
comparables por dos motivos básicos: 1) los datos se refieren a la misma entidad, pero
se han anotado de forma distinta (por ejemplo, una tabla de pesos en kilogramos y otra
en libras); 2) los datos refieren a mediciones distintas de un fenómeno similar (p.e., dos
tablas de tamaño, una refiriendo la longitud y otra al peso), o a fenómenos distintos
(como ser una tabla de peces capturados con redes agalleras y otra de capturas con red
de arrastre). En el primer caso, la no-comparabilidad es soluble, y requiere elegir una
misma unidad y convertir todos los datos a esa unidad. En el segundo caso, la
incompatibilidad es intrínseca, y la comparación de los datos sólo es parcialmente
posible. La estructura de la base de datos obliga a reconocer las entidades naturales de
la información y permite eliminar los problemas del tipo 1 mientras que deja explícitas
las incompatibilidades del tipo 2.
Al acomodar la información disponible para que se ajuste a la estructura de la
base de datos, se obtiene como resultado un formato estándar de almacenamiento de la
información. Este estándar asegura que datos de una misma entidad son directa e
intrínsecamente comparables entre sí. La forma estándar además influye en la toma
posterior de datos, porque permite la generación de planillas de campo con la misma
estructura de la base de datos. De este modo, se asegura la comparabilidad de la
información preexistente con los nuevos datos.
Recuperación de la información
La base de datos permite una recuperación rápida y precisa de la información
almacenada. Las salidas de la base pueden hacerse en pantalla, en forma de informes, o
como exportaciones hacia otros sistemas de procesamiento. Por ejemplo, puede
visualizarse un listado de peces capturados en un ambiente determinado, puede
imprimirse un informe que detalla las capturas por unidad de esfuerzo (CPUE) por
especie y lago, o puede exportarse un listado de peces y el tamaño de malla de los paños
en los que fueron capturados a un programa de análisis estadístico.
El relato hipotético es una analogía adecuada para describir los distintos tipos de
base de datos, y de su valor relativo a la capacidad de recuperar información. Muestra
que hay más de una manera de almacenar la información, y más de una manera de
acceder a ella. Por último, da un ejemplo bastante simple del empleo de índices para
acelerar la recuperación de los datos.
contenedor de datos (algo en donde se guarda la información), así como de los métodos
para almacenar y recuperar información de esos contenedores. Los modelos de datos no
son entidades físicas, sino abstracciones que permiten la implementación de un sistema
eficiente de base de datos; por lo general se refieren a algoritmos, y conceptos
matemáticos.
Los modelos de bases de datos han ido evolucionando con el tiempo, y su
desarrollo ha sido un área activa de investigación desde el inicio de la era informática.
Un breve repaso por los principales modelos permite ver las ventajas y desventajas de
cada uno.
En su forma más simple, una base de datos de archivo plano no es más que una
enorme tabla única (por ejemplo, una planilla de cálculo). Existe una única estructura de
registros, y no hay vínculos entre registros separados. El acceso a los datos se hace de
modo secuencial (se lee la información en su orden de almacenamiento); el acceso
aleatorio no tiene soporte. Esto implica que los tiempos de acceso son lentos, porque
debe repasarse el archivo completo para encontrar los datos localizados. Esto se
soluciona parcialmente si se hacen ordenamientos de los datos, pero una reordenación
mal hecha puede causar errores graves (como la mezcla de campos y registros).
Este modelo de base de datos es el más primitivo de los formatos digitales, y
además de los inconvenientes mencionados, también adolece de problemas relacionados
con la redundancia de los datos, su mantenimiento y su integridad. Aunque se lo supone
obsoleto para la mayoría de los bancos de datos modernos, es un formato muy popular
para el almacenamiento de información por parte de personas sin conocimientos sobre
otros tipos de modelos. De hecho, la mayoría de la información de campañas de campo
y laboratorio del GEMaRI se encontraba en ese formato al inicio de este trabajo
(CAPÍTULO 3).
Son bases de datos que, como su nombre indica, almacenan su información en una
estructura jerárquica. En este modelo los datos se organizan en una forma similar a un
árbol (visto al revés), en donde un nodo padre de información puede tener varios hijos.
El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen hijos se los
tabla), que representarían las tuplas, y campos (las columnas de una tabla). Las tablas se
relacionan entre sí a través de relaciones establecidas entre elementos de los campos de
cada tabla. Durante su diseño, una base de datos relacional pasa por un proceso al que
se le conoce como normalización de una base de datos, que intenta eliminar por
completo la redundancia de datos y acelerar los procesos de recuperación de la
información.
En este modelo, el lugar y la forma en que se almacenen los datos no tienen
relevancia (a diferencia de otros modelos como el jerárquico y el de red). Esto tiene la
considerable ventaja de que es más fácil de entender y de utilizar para un usuario
esporádico de la base de datos. La información puede ser recuperada o almacenada
mediante "consultas" que ofrecen una amplia flexibilidad y poder para administrar la
información.
El modelo relacional se discute en detalle más abajo, puesto que es el modelo
elegido para estructurar el Sistema Integral de Información que es el núcleo de este
trabajo.
fila representa un registro (o tupla) con una serie de datos acerca de un elemento. Una
columna (denominada campo o atributo) representa una característica particular de los
elementos de la tabla. Una relación es un vínculo lógico entre dos tablas. Un sistema
relacional de administración de bases de datos (RDBMS) emplea valores coincidentes
en múltiples tablas para relacionar la información de una tabla con la información en
otra.
Típicamente, las tablas reflejan entidades reales y naturales; es decir, contienen
información sobre un conjunto de elementos existentes, por ejemplo, personas, peces
capturados, lagos, o campañas de muestreo. Del mismo modo, muchos los campos
reflejan atributos reales de esos elementos. Sin embargo, existen también campos cuya
función es proveer una identificación unívoca a cada elemento de la tabla, o establecer
FIGURA 2.1: Elementos básicos de la tabla de una base de datos relacional. Un ejemplo de la tabla
CAPTURAS que muestra cómo se almacena y como se busca el largo total (LT) del pez capturado nº 7
(ID_Pez). LT es un campo o atributo, en forma de columna, mientras que el pez conforma un registro
que se muestra como fila. La intersección entre la fila y la columna conforma el valor de dato.
relaciones con otras tablas. En algunos casos, una tabla completa puede estar
conformada sólo por esos campos relacionales, como es en el caso de las relaciones
varios-a-varios (ver más abajo). Cabe aclarar que la presentación de la información en
tablas es una construcción lógica, independiente del modo en que los datos son
almacenados físicamente en un soporte magnético o digital.
Como ejemplo, usaremos una de las tablas centrales del SII que es la tabla de
peces capturados (CAPTURAS; FIGURA 2.1). Esta entidad almacena la información básica
acerca de los ejemplares capturados usando redes agalleras desde el año 1995 a la fecha.
Cada pescado tiene un registro, es decir, está representado por una fila de la tabla. Una
serie de atributos refieren a datos observados sobre cada uno de los peces: su especie,
largo, peso, sexo, etcétera. Estos campos, presentes en las planillas de campo,
conforman un conjunto natural: se refieren a la información que se toma de cada pez
inmediatamente tras su captura. Otras columnas de la tabla contienen los identificadores
de campo y el identificador de la base de datos. Un campo identifica el paño de red (que
indica tren y tamaño de malla) en que fue capturado el pez, y otro hace referencia al
calado de ese paño. Este calado es un elemento (registro) de otra tabla, la tabla de
calados (CALADOS), que conforma una entidad natural distinta. La referencia en la tabla
de capturas a la tabla de calados es el vínculo que permite recuperar información de
ambas tablas, y es la relación que define el modelo de base de datos.
un único elemento en la tabla. Cada columna describe una única característica acerca de
un elemento. Cada valor, o dato, está definido por la intersección de una fila y una
columna. Los datos son atómicos; no hay más de un valor asociado con la intersección
de una fila y una columna. Las tablas no tienen un ordenamiento jerárquico, y las
relaciones entre ellas son lógicas: no existen relaciones físicas entre tablas.
Regla de Codd nº3: los datos nulos son tratados uniformemente como
desconocidos
Un dato nulo (null) siempre debe interpretarse como valor desconocido. Null
significa que no se ha ingresado ningún valor; el valor no es conocido. Null no es lo
mismo que cero o una cadena vacía (“”). Como analogía, la ausencia del dato de edad
por otolitos de un pez capturado sin cabeza no implica ni que el pez carecía de otolitos
cuando estaba vivo, ni que su edad sea 0. Si no son manejados adecuadamente, los
valores nulos pueden causar confusión en la base de datos. Estos valores se propagan a
través de las expresiones aritméticas (p.e., Null +2 = Null). La comparación de un valor
nulo contra cualquier otro valor, incluyendo a él mismo, devuelve un valor nulo.
denomina catálogo del sistema o diccionario de datos. Las tablas del sistema pueden
accederse del mismo modo que las tablas de usuario.
2.4- RELACIONES
En una BDR, todos los datos están organizados en tablas, las cuales se vinculan
entre sí mediante relaciones. Una relación es un vínculo lógico entre dos entidades
(tablas) que describen de qué modo se asocia cada una con la otra. Las relaciones se
usan para implementar la integridad de los datos, y para facilitar las junciones al proveer
acceso a múltiples tablas al mismo tiempo.
Una relación se representa por valores de datos comunes almacenados en dos
tablas distintas. Por ejemplo, es posible saber las características de la red en la que se
capturó un pez dado porque tanto en la tabla CAPTURAS como en la tabla REDES hay un
campo común ID_Red. Por otro lado, el campo ID_Calado de la tabla CAPTURAS se
comparte con la tabla CALADOS, permitiendo asociar a cada pez un sitio, fecha y
esfuerzo de captura.
Típicamente, una relación se establece entre un campo con atributos codificables
de una tabla y un campo de identificadores de la otra. El campo Sexo de la tabla
CAPTURAS contiene valores de 0, 1, 2 o -99. Este campo se relaciona al campo ID_Sexo
de la tabla SEXOS_DESC, que contiene la siguiente información:
ID_Sexo Descripción
0 Indefinido
1 Hembra
2 Macho
-99 Valor nulo/Sin datos
Los campos comunes que relacionan dos tablas son denominados claves. A veces,
la clave puede consistir en más de un campo, en cuyo caso se la conoce como clave
compuesta. El campo que identifica unívocamente cada registro de la tabla madre se
denomina clave primaria o principal. La clave primaria no solo evita que existan
columnas duplicadas, sino que además provee un mecanismo que permite referirse a
todos los atributos de un registro específico simplemente referenciando un único valor
numérico. Esta clave típicamente consta de valores numéricos pequeños, de modo que
sea fácil de ordenar, almacenar y buscar. El campo de la tabla hija que contiene los
valores relacionados a la clave primaria de la tabla madre se denomina clave externa;
esta clave hereda la clave principal materna, y la combinación de claves primaria y
externa establece la relación entre ambas tablas.
La cardinalidad de una relación define cuantas instancias de cada entidad pueden
interrelacionarse. Existen tres tipos primarios de cardinalidad: uno-a-uno, uno-a-varios
y varios-a varios. Además, es posible establecer relaciones recursivas o reflexivas, en
las que una tabla se vincula consigo misma a través de dos de sus campos. Las
relaciones entre tablas suelen representarse gráficamente usando diagramas de
relaciones de entidades (DREs; FIGURA 2.2).
FIGURA 2.2: Diagrama de Relaciones de Entidades (DRE) del Sistema Integral de Información. Las
relaciones se señalan como líneas que unen las claves externa y principal. En los casos en los que se
ha impuesto la integridad referencial, puede verse la cardinalidad de la relación mediante los símbolos
1 y ∞.
términos de datos accesibles. Las relaciones entre estas entidades son lógicas y no
físicas, y se definen como el vínculo entre la clave principal de la tabla madre con la
clave externa de la tabla hija. Por tanto, la relación se crea almacenando el valor de la
clave primaria materna en el campo de clave externa de la hija. Una clave externa debe
hacer referencia a un campo de otra tabla, y dicho campo debe o bien ser la clave
principal de esa tabla, o ser unívoca (es decir, no puede tener el mismo valor asignado a
más de un registro). Por lo tanto, una clave externa puede implementar una relación
uno-a-uno o varios-a-uno, pero no uno-a-varios.
En este tipo de relación, varias instancias de una entidad se asocian con varias
instancias de otra entidad. Un ejemplo sería la relación entre especies y lagos: una
especie puede estar en más de un lago, y a su vez, cada lago puede tener más de una
especie. Este tipo de relación no puede establecerse directamente entre las dos tablas,
sino que requiere una tabla de junción que se usa como intermediaria. Esta tabla
contiene una clave primaria compuesta que consiste en dos o más campos, que también
funcionan como claves externas, y en la que cada registro representa una de las
combinaciones posibles (por ejemplo, un par ei;lj representando la presencia de la
especie i en el lago j). Es decir que la relación varios-a-varios se logra mediante la
combinación de dos relaciones uno-a-varios vinculadas mediante la tabla de junción.
instancia de otra entidad. Este tipo de relación no es muy común, y para su uso debería
evaluarse por qué no resulta más conveniente usar una tabla más grande. En algunos
casos, se trata de una cuestión de seguridad: la información más delicada es dejada en
otra tabla sobre la cual pueden pesar mayores controles de seguridad. Otras veces, se
intenta mejorar el desempeño del DBMS separando campos que contienen tipos de
datos grandes y son infrecuentemente consultados. También puede usarse cuando
existen numerosos valores nulos, o cuando se trata de datos que se obtienen mucho más
tarde (por ejemplo, la edad estimada de un pez a partir de otolitos o escamas, o su
secuencia de ADNm).
2.4.5- Recursivas
Cuando un campo de una tabla hace referencia a otro campo de esa misma tabla,
se considera que esta relación de la tabla consigo misma es recursiva. La creación de
una relación recursiva se logra mediante una auto-junción. Un ejemplo sería una tabla
que refleja las relaciones hidrográficas de los lagos, indicando por ejemplo que el lago i
drena sus aguas en el lago j.
Un buen diseño de una base de datos implica, entre otras cosas, un mejor
almacenamiento y uso de la información (Prague and Irwin 2001). El proceso de
optimización de una BDR es conocido como normalización, y fue propuesto por Codd
(1972). Este autor propuso que una persona debería tomar el esquema relacional (el
sistema de tablas que se interrelacionan) y hacerlo pasar a través de una serie de pruebas
para “certificar” su concordancia con una determinada forma normal. Codd propuso tres
formas normales, que denominó primera, segunda y tercera forma normal.
Posteriormente, y junto con M. Boyce, creó una definición más fuerte conocida como
forma normal de Boyce-Codd o BCNF (Date & Fagin 1992). Más adelante, ambos
añadieron dos formas normales más (cuarta y quinta).
Estas formas normales se basan en las dependencias funcionales de los campos
dentro de una tabla, y como se interrelacionan con las otras tablas del esquema
relacional. Una dependencia funcional es una conexión entre uno o más atributos. Por
ejemplo, si conocemos la FechaMuestreo de un muestreo podemos determinar el
AñoCampaña al que pertenece. En este caso, FechaMuestreo es denominado
determinante, y se puede decir o bien que FechaMuestreo determina a AñoCampaña o
que AñoCampaña es funcionalmente dependiente de FechaMuestreo. Dicho de un
modo más general, un campo Y es funcionalmente dependiente de un campo (o campos)
X si un valor dado de X siempre debe aparecer con el mismo valor de Y. Si X es una
clave de la tabla, entonces todos los demás campos son funcionalmente independientes
de X por definición de un modo trivial, puesto que no puede haber dos registros que
tengan el mismo valor de una clave. Una extensión es la dependencia funcional
transitiva, que ocurre cuando un atributo Y que depende funcionalmente de otro X es a
su vez determinante de un tercero Z. Las dependencias funcionales sólo existen cuando
los elementos involucrados tienen valores únicos e identificadores singulares; p.e., una
tabla con nombres de personas y direcciones no cumple necesariamente con esta
condición, ya que un nombre puede representar a más de una persona (tocayos).
Los motivos para realizar la normalización de la base de datos son principalmente
dos:
Eliminar la información redundante: la repetición de los datos ingresados (en
general, nombres, descripciones y otras cadenas de texto) genera dos inconvenientes.
Por un lado, consume más espacio de almacenamiento y recursos. Por el otro, el ingreso
repetitivo de la información es un proceso sensible a errores tipográficos.
Problemas de escalabilidad imprevistos: la base de datos tiende a crecer y
cobrar vida propia tras su creación. Si las tablas no están normalizadas, se corre el
riesgo de generar estructuras rígidas que no admiten fácilmente un cambio en la forma
de ingreso de la información. Por ejemplo, supongamos que para determinar la edad de
un pez se leen solamente dos escamas, así que se colocan dos campos en la tabla de
peces, uno para cada escama; si más adelante se decide emplear más o menos escamas
(o ambas cosas, para especies distintas), es necesario modificar toda la tabla, y
posiblemente los procedimientos almacenados que dependen de ella.
que los dos atributos que se están separando sean independientes. En el ejemplo,
Predador y Presa son independientes entre sí.
Figura 3.1: Información de base. Las planillas de campo y laboratorio originales, así como mapas y
perfiles térmicos, conforman el nivel más básico de registros. A partir de estos, se generaron las
planillas de cálculo en formato digital que alimentaron al SII.
tablas del SII. A lo largo de la descripción, se resaltan ciertos términos que conforman
elementos básicos reflejados como registros en la base de datos. En este aspecto, el
análisis de cuáles son los elementos básicos e indivisibles relacionados con los
muestreos y la información resultante es muy útil a la hora de determinar unidades
muestrales para pruebas estadísticas.
FIGURA 3.2: Estaciones de muestreo. Mapa general (centro) del lago Nahuel Huapi, y detalle de los
sectores en los que se establecieron estaciones de pesca. Cada uno de los puntos señala la posición de
calado de un tren de redes, y el color señala el estrato de profundidad. Los sitios de muestreo se
observan como un conjunto de puntos cercanos entre sí.
Durante el levantado de
las redes, se tiene la precaución
de asociar cada uno de los peces
capturados con el código del
paño del cual fueron
desenmallados (Figura 3.4a). La
captura es procesada en tierra,
anotándose para cada pez su
especie, talla, peso, sexo y
estadio gonadal (Figura 3.4b).
FIGURA 3.3: Esquema del diseño de muestreo estratificado.
PEL: redes pelágicas; EPIB: redes epibentónicas; EPC: redes Además, se toman muestras de
perpendiculares a la costa (modificado de Vigliano et al.
1999).
escamas y otolitos para análisis
de edad y crecimiento, y se
conservan los estómagos para estudios de dieta.
Además de las capturas con redes agalleras, a veces se realizan muestreos
complementarios usando redes de arrastre, pesca eléctrica o nasas. Esto permite obtener
información sobre los peces de tallas pequeñas (juveniles y alevinos o especies de
pequeña talla), que no son capturados por las redes agalleras. También se miden
variables ambientales, tales como los perfiles térmicos de los lagos, el pH y
conductividad del agua, la transparencia por disco de Secchi, etc.
total, largo fork y largo estándar. Aunque casi siempre se registró el largo
estándar, las otras medidas pueden o no estar presentes según la campaña.
• Peso total: el peso total en fresco del pez, medido en gramos.
• Sexo: el sexo del pez se detemina mediante la disección del mismo, a través de la
identificación de sus gónadas. Cuando el desarrollo gonadal es insuficiente
para determinar el sexo, se lo anota como indeterminado.
• Estadio Gonadal: se anota el estado de madurez de las gónadas ubicándolo en una
tabla de 6 puntos: I-Virginal; II-Desarrollo temprano; III-Desarrollo medio;
IV-Prefreza; V-Freza; y VI: Postfreza (Nikolsky, 1963).
• Paño: indica el código del paño en el que fue capturado el pez. Permite identificar
el estrato al que se realizó la captura, y el tamaño de malla.
• Estrato: Identifica el estrato de muestreo en el que fue capturado el pez.
• Estación: Señala el sitio de muestreo general en que se localizaba la red.
• Observaciones: notas particulares, tales como presencia de parásitos o manchas
parr, códigos de etiquetas (resultado de la recaptura de un individuo
marcado).
Una vez guardadas como planillas de cálculo, los archivos quedaban almacenados
en un disco rígido para su posterior análisis. Esto causaba un problema de control de la
integridad de los datos: puesto que los análisis que se hacían sobre las planillas de
cálculo muchas veces se efectuaban sin hacer una copia previa de los datos de base, fue
común encontrar datos alterados o incompletos en las planillas base. La
descentralización de la información causaba además un movimiento de archivos, así
como la aparición de múltiples copias actualizadas sin sincronía, que a la larga genera
una gran ambigüedad respecto a cuáles son las versiones originales, y cuales están
actualizadas correctamente.
Otro inconveniente de este formato es que los mismos análisis, hechos por
personas diferentes, podían arrojar conclusiones distintas. La causa de este problema es
la falta de criterios comunes estandarizados.
También vale la pena mencionar que muchas de las planillas de base estaban
modificadas con codificaciones hechas con el fin de exportar los datos a un programa de
análisis estadístico. Estas codificaciones, típicamente determinadas por la persona que
estaba haciendo el análisis, no quedaron siempre correctamente documentadas. Eso no
era un problema grave cuando los valores originales de la planilla se mantenían, pero sí
podía causar pérdida de información si se habían reemplazado los datos por los códigos.
Pese a los problemas mencionados antes, la recuperación de la información de las
planillas de capturas no tuvo grandes inconvenientes. Las planillas de calado, sin
embargo, fueron más problemáticas, básicamente porque nunca fueron ingresadas
electrónicamente como tales. En vez de eso, era posible encontrar datos derivados, tales
como las horas de captura, en hojas de cálculo adyacentes a los datos de captura, como
parte del cálculo de la captura por unidad de esfuerzo (CPUE). Así que se optó por
Figura 3.7: Almacenamiento digital original. Planilla de cálculo de capturas, correspondiente a las
campañas al lago Moreno en el año 1999. Sobre la derecha, pueden verse rangos de celdas con
información en un formato inadmisible para la tabla de una base de datos relacional.
Tras decidir que la unidad de registro era un pez capturado con redes agalleras,
cada uno de los cuales se encontraba reflejado en una fila de las planillas de cálculo de
capturas, se comenzó por la base de datos referidas al Lago Moreno. Este cuerpo de
agua fue muestreado de forma intensiva, con campañas estacionales entre los años 1999
y 2001, y era una buena opción para comenzar. Las planillas de base consignaban en
general los siguientes campos: Nº de ejemplar, fecha, especie, LT, LF, LS, PT, sexo,
paño, estación y estrato. Con ciertas variaciones menores, esta lista de campos es la
presente en la mayoría de las planillas de base. A partir de estos datos, algunas planillas
de cálculo tenían hojas adicionales que, usando tablas dinámicas, recuperaban el total de
peces capturados por estrato, y con el dato extra de las superficies de red y el tiempo de
muestreo, permitían calcular la CPUE total y por especies.
Salta a la vista la existencia de ciertos valores repetidos, tales como la fecha de
captura, las estaciones y los estratos. El primer paso en la normalización de la tabla fue
determinar cuál sería la clave principal. El nº de ejemplar era un campo candidato. Sin
embargo, los conteos de nº de ejemplar se reinician al cambiar de lago, o incluso en un
mismo lago, para distintas campañas; dado que la tabla final incluiría registros de
múltiples lagos y campañas, iba a haber duplicados en el campo. En conjunto con un
identificador de campaña y/o de lago, podría generarse una clave principal compuesta.
Pero esta no resultaba una opción práctica, debido a que implicaba generar un campo
para un código de lago o campaña, que no existía en la tabla. Así que se decidió agregar
un nuevo campo ad hoc que funcionara como clave principal, una vez que el resto de la
FIGURA 4.1: CAPTURAS y tablas relacionadas. El DRE muestra la tabla central de capturas
(remarcada en línea sólida) y las tablas relacionadas. Se observa la tabla CPOSAGUA (remarcada en
línea puntueada) y el camino lógico entre cada pez capturado y el cuerpo de agua al que pertenece.
vinculación entre los Sistemas de Información Geográfica y el SII. Se optó por una capa
temática vectorial de polígonos, almacenada en coordenadas geográficas
(latitud/longitud), en donde el identificador de polígono coincidiera con los
identificadores de cuerpo de agua del SII. A tal fin, se podía usar una capa vectorial
preexistente o generar la información de novo a partir de mapas o imágenes satelitales.
Lógicamente, usar la información existente era un atajo obvio; sin embargo, la precisión
de las fuentes no siempre era conocida y confiable. Así que se evaluaron las fuentes
disponibles, que en principio eran las siguientes:
- SIG250: Base de datos generada por el Instituto Geográfico Militar argentino
a partir de cartografía topográfica en escala 1:250 000. Abarca todo el país.
- Atlas Digital de Recursos Hídricos Superficiales: Base de datos generada por
la Subsecretaría de Recursos Hídricos (Giraut et al. 2000). Generada a partir
de cartografía del IGM e imágenes satelitales. Abarca todo el país.
- Mapa de la Ecorregión Valdiviana (Lara et al. 1999): Mapa de tipos de
vegetación del norte de Patagonia, basado en imágenes satelitales.
- Mapas diversos, en general sueltos, generados a partir de cartografía o
imágenes satelitales.
Para determinar qué nivel de precisión y detalle tenían los mapas de las distintas
FIGURA 4.2: CPOSAGUA y tablas relacionadas. La tabla central que lista los cuerpos de agua de
Patagonia, y tablas relacionadas. A partir de este diseño básico, es posible agregar tablas con
información sobre diversas variables referidas a los cuerpos de agua.
FIGURA 4.3: Comparación de las capas de lagos del SIG250 y el ANRH. Puede verse que los
polígonos del SIG250 ajustan mucho mejor a la imagen LandSat 7 que los polígonos del ANRH.
fuentes, fue necesario buscar un mapa de referencia que pudiera considerarse el más
“geográficamente correcto”, específicamente, el de georreferenciación más precisa. A
tal fin, se compararon los mapas con puntos tomados con un GPS Garmin Geko 301,
que determina la posición con 2-15 metros de precisión. Esto permitió definir un
conjunto de imágenes Landsat 72 adecuadamente ortorrectificadas, y sobre las cuales se
compararon los demás mapas.
De este análisis, se observó que, en términos generales, la base que mejor ajustaba
a las imágenes Landsat 7 era la del SIG250. Los polígonos del Atlas Digital de
Recursos Hídricos tenían un desplazamiento sistemático que sugiere o bien el uso de
imágenes satelitales inadecuadamente georreferenciadas, o algún error en los
parámetros geográficos de proyección (FIGURA 4.3). Los polígonos del Mapa de la
Ecorregión Valdiviana, aunque mejor ubicados, tenían bordes escaleriformes (aliasing)
muy notables, fruto de su derivación a partir de clasificación de imágenes. Del resto de
2
U.S. Geological Survey. Fechas diversas. Landsat ETM+ Scenes, Level 1G. Sioux Falls, South Dakota:
USGS. Datos obtenidos mediante el Global Land Cover Facility, http://www.landcover.org.
Resuelta de este modo la expresión espacial más evidente del SII, es posible
generar mapas temáticos levantando el mapa de polígonos de los lagos de interés, y
recuperar a través de consultas a la base de datos los valores de interés. Otros tipos de
datos espaciales, en particular aquellos que contienen información continua (por
ejemplo, imágenes raster), son un poco más complicados de relacionar implícitamente
en la base. Sin embargo, la vinculación puede realizarse usando sistemas de
almacenamiento externo que empleen códigos similares a los códigos del SII,
facilitando la asociación intuitiva de la información. Por ejemplo, los archivos con
imágenes se pueden almacenar en carpetas anidadas por cuenca y lago, cuyos nombres
estén en formato “ID_NombreLago”.
Este mismo enfoque es aplicable a otros tipos de datos u objetos relacionables
pero no directamente incorporables a la base de datos del SII, tales como fotos,
cartografía o bibliografía relacionada, etc. El empleo de punteros (enlaces blandos e
hipervínculos) en una estructura de directorios estandarizada puede complementar a la
base de datos e integrar los objetos al sistema.
Durante el diseño, se intentó que las claves primaria y externa que forman parte
de una relación tuvieran el mismo nombre en distintas tablas, pero esto no siempre se
cumplió en aras de una presentación más simple.
5.2- TABLAS
CAPTURAS
Nombre del campo Tipo de datos Descripción
אID_Pez Autonumérico Identificador Único de Captura
ID_Capt Número entero Identificador de Captura de la Campaña
Calado Número entero Identificador de calado
Especie Texto Código de especie de tres letras
LT Número entero Largo total medido en milímetros
LF Número entero Largo fork medido en milímetros
LS Número entero Largo estándar medido en milímetros
PT Número entero Peso húmedo total medido en gramos
Sexo Número entero Código de sexo
EG Número real Código de estadio gonadal
Panio Número entero Denominador del paño en que fue capturado
Como se mencionó más arriba, ID_Capt podría funcionar como clave principal si
no fuera porque la numeración se reinicia entre campaña y campaña de pesca. Para
usarlo, sería necesario agregar un campo extra que permite diferenciar, por ejemplo, el
ejemplar 10 pescado en Moreno del ejemplar 10 pescado en Mascardi o en Fagnano. Es
más simple y más seguro añadir un campo extra, ID_Pez, que obre como clave principal
(substituta).
El Calado se refiere al momento y red desplegados en un sitio de captura, y es una
clave externa de la tabla CALADOS.
Se optó por mantener el código alfabético de tres letras en lugar de sustituirlo por
un código numérico, puesto que resulta simple de recordar y estandarizar, y es la
manera en que el GEMaRI está acostumbrado a ingresarlo en las planillas y referenciar
en los análisis de los datos.
En la mayoría de las planillas se consignan solo dos medidas de longitud: el largo
estándar y, o bien el largo total o el largo fork. Se optó por incluir las tres medidas para
no perder datos, y dejando en blanco las celdas sin datos3.
Aunque la escala de estadios gonadales es una tabla categórica, representada por
valores ordinales enteros, se observó que en numerosos ejemplares se había anotado en
la planilla más de un valor, refiriéndose a ejemplares que presentaban un estadio
intermedio entre dos categorías. En lugar de intentar elegir uno u otro estadio para
conformar a la 1FN, se optó por transformar el tipo de datos a número real para poder
poner valores intermedios.
CALADOS
Nombre del campo Tipo de datos Descripción
אID_Calado Autonumérico Identificador Único de Calado
ID_Estacion Número entero Código de estación de muestreo
ID_Red Número entero Denominador del tren de redes empleado
Estrato Texto Código del estrato de profundidad
Fcalado Fecha/hora Fecha de calado del tren
Flevantado Fecha/Hora Fecha de levantado del tren
Hcalado Fecha/Hora Hora y minutos a los que se caló el tren
Hlevantado Fecha/Hora Hora y minutos en los que se levantó el tren
Tiempo Número real Tiempo de operación de las redes, en horas
identificar cada uno de estos calados, se creó un campo ID_calado que oficie de clave
principal. El siguiente campo de la tabla era el que ubicaba el área geográfica (estación)
dentro del cual se incluye el calado. Así, ID_Estacion es un campo relacional que
referencia a las estaciones de muestreo. El denominador de red es el mismo que se usa
en las planillas de calado y en los paños.
Estrato, al igual que el campo Especie:CAPTURAS, usa los mismos códigos de
texto que se emplean habitualmente en las planillas de campo (ver la tabla ESTRATOS).
Las fechas y horas de calado y levantado, cuando están presentes, determinan
automáticamente el valor de Tiempo. Como la ausencia de uno sólo de estos valores
impide este cálculo, se incluyó el campo Tiempo para dar la opción a ingresarlo
independientemente. En los formularios de ingreso de datos (ver más abajo) se incluye
una función que muestra al usuario cuál es el resultado del cálculo una vez que están los
cuatro valores ingresados, de modo que solo halla que copiarlo al campo Tiempo.
ESTACIONES
Nombre del campo Tipo de datos Descripción
אID_Estación Autonumérico Identificador Único de Estación de
Muestreo
Campania Número entero Código de campaña de muestreo
Sitio Número entero Código del área geográfica de la estación
Ntrenes Número entero Cantidad de trenes de redes calados
SupTotal Número real Suma de las superficies de red operativas
TiempoMedio Número real Promedio de los tiempos de operación
CAMPAIGN
Nombre del campo Tipo de datos Descripción
אID_Camp Autonumérico Identificador Único de Campaña de
Muestreo
Nombre Texto Nombre descriptivo de la campaña
Lugar Texto Nombre del área (opcional)
Anho Número entero Año en que se hizo la campaña
Epoca Número entero Código de estación del año de la campaña
Proyecto Texto (temp) Proyecto
SITIOS_MUESTREOS
Nombre del campo Tipo de datos Descripción
אID_Sitio Autonumérico Identificador Único de Sitio
Nombre Texto Denominador del área de muestreo
Long Número real Longitud en grados decimales
Lat Número real Latitud en grados decimales
ID_CpoAgua Número entero Código del cuerpo de agua donde se ubica
Descripcion Memo (texto) Descripción ambiental del área
Los sitios de muestreo reflejan las coordenadas geográficas aproximadas del área
donde se montaba una estación de muestreo. En cuerpos de agua pequeños, un único
sitio suele representar redes dispersas en todo el lago. Pero en cuerpos más
intensamente estudiados, suele haber varios sitios. El Nombre del sitio generalmente es
un nombre de campaña, asociado a algún elemento de la costa que resulta característico.
No necesariamente está asociado a los toponímicos cercanos (por ejemplo, un sitio
denominado Tábanos puede deber su nombre a que hay un arroyo o laguna cercano con
ese nombre, o a que había suficientes tábanos en el área como para quedar plasmados en
la planilla de campo).
Las coordenadas geográficas, expresados en grados decimales (HH.hhhhº)
siempre están referidas a un datum/elipsoide WGS84.
El ID_CpoAgua es el campo que relaciona al sitio de muestreo, y por lo tanto a
los peces capturados, con los lagos, lagunas, ríos y arroyos.
ESTRATOS
Nombre del campo Tipo de datos Descripción
אIDEstrato Autonumérico Identificador Único de Estrato
α Estrato Texto Código alfanumérico de estrato
Ambiente Número entero Código de ambiente
Profundidad Número entero Profundidad en metros del piso del estrato
Descripción Texto Nombre descriptivo del estrato
HABITATS
Nombre del campo Tipo de datos Descripción
אID_Habitat Autonumérico Identificador Único de Hábitat
Habitat Texto Nombre del hábitat
Descripción Texto Descripción y definición del hábitat
REDES
Nombre del campo Tipo de datos Descripción
אRed Número entero Identificador de tren de redes
Sup Número real Superficie de la red en metros cuadrados
Status Texto Situación del tren de redes
Observaciones Texto Notas sobre las redes
Este es un ejemplo de entidad con una clave principal inteligente: el número que
identifica a cada tren de redes es un atributo real y no un agregado como en los casos
anteriores4. La superficie de la red se calculó como la suma de la superficie de los paños
4
Aquí corresponde aclarar que en al menos un caso, se detectó un uso duplicado de la denominación
2000 en un tren de redes. Se denominó 2000 a una red distinta a una 2000 anterior. También puede pasar
eso cuando de un tren de redes se quita uno o más paños para reemplazarlos por otros nuevos. A menos
que los paños nuevos tengan exactamente la misma superficie que los sustituidos, es necesario cambiar la
denominación de la red e ingresar un nuevo registro en la tabla REDES. Si el cambio es sólo de algunos
paños, se puede denominar sumándole 1 (por ejemplo, la red 2000 duplicada pasó a denominarse 2001).
Esto también es útil en circunstancias en las que no todo el tren estuvo operando. Sin embargo, en el caso
que la componen, y a partir del alto de la red cuando está armada en el agua (no el largo
estirado, que puede ser casi el doble). Status y Observaciones hacen referencia a si el
tren está o no en uso en la actualidad, y mencionan eventuales cambios de
denominación.
PANIOS
Nombre del campo Tipo de datos Descripción
אID_Pan Número entero Identificador de paño
Malla Número entero Tamaño de malla bar en milímetros
Sup Número real Superficie de la red en metros cuadrados
Status Texto Situación del tren de redes
EnRed Número entero Tren de redes del que forma parte
Observaciones Texto Notas sobre las redes
La tabla de paños es muy similar a la de redes, con el agregado del campo Malla
que permite discriminar adecuadamente los distintos tipos de paños, permitiendo hacer
análisis sobre la selectividad del arte de acuerdo al tamaño de malla. Aquí también la
clave principal es inteligente.
EnRed permite asignar cada paño a un tren de redes. Históricamente, permite
asociar un paño determinado con la red en la que fue usada. También puede usarse con
paños nuevos para armar “redes virtuales” a fin de calcular superficies de trenes a
armar. La relación entre este campo y las redes es de tipo varios-a-uno, de modo que un
paño puede estar en sólo una red (aquella en la que está, o en la que estuvo hasta su
retirada del uso). Es posible cambiar esta restricción a una relación varios-a-varios, de
modo de registrar todas las redes en las que estuvo el paño, pero se consideró
innecesario ya que no existe registro histórico de esos detalles. En cualquier caso, vale
la pena remarcar que Sup:REDES no es un campo dinámicamente vinculado a campos de
PANIOS, y que por lo tanto cambios en las asociaciones marcadas por EnRed no
afectaran los valores de superficie del tren.
EPOCAS
Nombre del campo Tipo de datos Descripción
אID_Epoca Número entero Identificador de estación del año
Epoca Texto Estación del año
de redes nuevas, se recomienda seguir empleando múltiplos de 100 a partir de la denominación más alta
existente.
SEXOS_DESC
Nombre del campo Tipo de datos Descripción
אCOD_SEX Número entero Identificador de sexo
Sexo Texto Descripción
ESPECIES
Nombre del campo Tipo de datos Descripción
אID Autonumérico Identificador de especie
α Codigo Texto Código alfabético de tres letras de especie
Familia Número entero Código de familia
Especie Texto Nombre científico de la especie
Autor Texto Autor(es) de la descripción
Year_desc Número real Año de la descripción de la especie
Nom_vulg Texto Nombre vulgar principal
Nativa Booleano Especie nativa de Patagonia (sí/no)
Ilustración Objeto Contenedor para una imagen
TAX_FAMILIA
Nombre del campo Tipo de datos Descripción
אID_familia Autonumérico Identificador de familia
Orden Número entero Código de orden
Familia Texto Nombre de la familia
Autor_anio Texto Autor(es) y año de la descripción
Etimología Texto Etimología del nombre del taxón
TAX_ORDEN
Nombre del campo Tipo de datos Descripción
אID_Orden Autonumérico Identificador de orden
Subclase Número entero Código de subclase
Orden Texto Nombre del orden
Autor_anio Texto Autor(es) y año de la descripción
Etimología Texto Etimología del nombre del taxón
TAX_SUBCLASE
Nombre del campo Tipo de datos Descripción
אID_Subclase Autonumérico Identificador de subclase
Clase Número entero Código de clase
Subclase Texto Nombre de la subclase
Autor_anio Texto Autor(es) y año de la descripción
Etimología Texto Etimología del nombre del taxón
TAX_CLASES
Nombre del campo Tipo de datos Descripción
אID_Clases Autonumérico Identificador de clase
Clase Texto Nombre de la clase
Autor_anio Texto Autor(es) y año de la descripción
Etimología Texto Etimología del nombre del taxón
CPOSAGUA
Nombre del campo Tipo de datos Descripción
אID_CpoAgua Numérico Identificador de cuerpo de agua
Nombre Texto Nombre del cuerpo de agua
Navegable Booleano Indica si el cuerpo es navegable con
embarcaciones
Hoja Texto Refiere a la carta topográfica IGM que
incluye al cuerpo de agua
Tipo_CpoAguaId_ Número entero Código de tipo de cuerpo de agua
ProvinciasId_ Número entero Código de provincia(s) en que se ubica
Regimen_CpoAguaId_ Número entero Código de régimen hídrico
PaisesId_ Número entero Código de país (o países) en el que se
ubica
todos los cuerpos de agua identificados como “lagos”, y se los numeró en orden
alfabético. La casi totalidad de los cuerpos de agua clasificados como “lagos” se
encuentran en Patagonia. Luego se incluyeron los embalses, continuando la numeración
de los lagos. Para el caso de las lagunas, se optó incluir sólo las lagunas de las que se
tenían datos de capturas, puesto que el número de lagunas es mucho más grande y
existen numerosos polígonos “sin nombre”.
La clave principal de esta tabla es crucial para poder relacionar las características
ícticas de cada lago (a partir de la sección de capturas) con sus características
morfológicas, geográficas y biogeoquímicas.
Varios registros tienen valores nulos representados como cadenas vacías (“”) en
Navegable. La hoja topográfica es la que contiene a todo el cuerpo de agua, o a su
mayor parte.
TIPO_CPOAGUA
Nombre del campo Tipo de datos Descripción
אID Numérico Identificador de tipo de cuerpo de agua
Tipo Texto Tipo de cuerpo de agua
PROVINCIAS
Nombre del campo Tipo de datos Descripción
אID Numérico Identificador de provincia (s)
Provincia Texto Nombre de la(s) provincia(s)
A diferencia de otras tablas, esta no se ajusta a la 1FN, debido a que hay campos
con más de un valor. Se optó por no normalizar la tabla porque son pocos los casos que
un lago está entre dos provincias. Sin embargo, si en el futuro esta tabla no normalizada
causara inconvenientes, no es muy difícil trasladar las relaciones a la 1FN creando una
relación varios-a-varios.
REGIMEN_CPOAGUA
Nombre del campo Tipo de datos Descripción
אID Numérico Identificador de régimen hídrico
Regimen Texto Tipo de regimen
Esta tabla define los regímenes hídricos (si el cuerpo de agua es temporario o
permantente). Todos los cuerpos actualmente presentes en el SII son permanentes.
CUENCAS
Nombre del campo Tipo de datos Descripción
אID_Cuenca Numérico Identificador de cuenca hídrica
Nombre_Cuenca Texto Nombre de la cuenca
Provincia Número entero Código de provincia(s)
Sistema Número entero Sistema hídrico al que se integra
SISTEMAS_HIDRICOS
Nombre del campo Tipo de datos Descripción
אID_Sistema Numérico Identificador de cuenca hídrica
Sistema Texto Nombre del sistema
CPOSAGUA_CUENCA
Nombre del campo Tipo de datos Descripción
אID_CPOAGUA Numérico Identificador de cuerpo de agua
CUENC_COD Texto Código de cuenca hídrica
5.3- RELACIONES
La tabla a continuación describe las relaciones creadas entre las distintas tablas
descritas en el punto anterior, y su cardinalidad. El diagrama de relación entre
entidades se ilustra en la Figura 5.1.
correspondientes.
Esto ocurre porque, si bien la estructura relacional no implica relaciones
jerárquicas, la naturaleza de los datos sí mantiene jerarquías, en la que el cuerpo de agua
(CPOSAGUA) tiene un nivel superior, y las CAPTURAS tiene el nivel inferior. Por lo tanto,
el orden lógico de ingreso de datos es:
CPOSAGUA→SITIOS_MUESTREO→CAMPAIGN→ESTACIONES→CALADOS→CAPTURAS
FIGURA 6.1: Formularios de ingreso de datos. La implementación bajo MS Access del SII cuenta
con algunos formularios prediseñados para facilitar el ingreso ordenado de datos. Los formularios,
accesibles mediante un panel (arriba), hacen uso de las relaciones existentes para presentar al usuario
la opción de elegir valores de otras tablas en lugar de trabajar directamente con los códigos de las
claves.
Aunque es poco probable que se expandan los atributos de las tablas principales,
tales como CAPTURAS o CALADOS, es posible agregar nuevos campos a otras tablas, en
especial, a tablas que contienen información de referencia. Por ejemplo, actualmente la
tabla PROVINCIAS solo tiene dos campos: su clave principal y el nombre de la/s
provincia/s. Podrían agregarse nuevos atributos, tales como la superficie, la cantidad de
habitantes, la densidad demográfica, etc. Agregar un campo nuevo es un proceso
sencillo y no genera problemas con las relaciones preexistentes o con la estructura de
datos. Cada campo nuevo en una tabla permite la generación de consultas que realicen
combinaciones novedosas con los atributos preexistentes.
adicionales de los peces capturados, como puede ser la medición de escamas, el análisis
de dietas, o la tipificación genética, pueden ser vinculados directamente con otros datos
del ejemplar mediante el identificador único de captura ID_Pez:CAPTURAS. A su vez,
una vez creada la relación, es posible hacer una consulta a la base que devuelva las
variables ambientales asociadas al sitio de muestreo donde se capturó ese pez, o datos
relacionados con la fecha de captura o el tipo de arte de captura. Otra entidad que ofrece
un punto de conexión es el sitio de muestreo (ID_Sitio:SITIOS_MUESTREO): variables
ambientales específicas de ese sitio (morfología litoral, vegetación acuática, temperatura
y variables químicas locales, etc.) pueden permitir un estudio de mayor resolución que
un análisis que tome el cuerpo de agua como unidad. Por otra parte, los cuerpos de agua
(ID_CpoAgua:CPOSAGUA) son también puntos ideales para realizar conexiones a la
base de datos. Existe mucha información limnológica que es rápidamente incorporable
al SII simplemente agregando como atributo vinculante el identificador único de lago
empleado en el SII.
Resumiendo, se sugiere tener en cuenta tres puntos principales de conexión para
la incorporación de nuevos datos al SII:
• ID_Pez:CAPTURAS: para incorporar información referida a los peces capturados
mediante redes agalleras (análisis de escamas y
otolitos, dieta, etc.).
• ID_Sitio:SITIOS_MUESTREO: para incorporar información relativa a los ambientes
de muestreo, orientada a un análisis local de las
relaciones entre variables ambientales y los peces que
allí se capturaron (como opuesto a un análisis que
adopte a cada cuerpo de agua como unidad de
estudio).
• ID_CpoAgua:CPOSAGUA: para incorporar información relacionada con los
cuerpos de agua como unidad, como pueden ser
mediciones de calidad de agua, temperaturas medias,
perfiles térmicos, etc.
5
Además, funciona como reaseguro en caso de problemas con las planillas de calado. A veces sucede que
accidentalmente se pierde el dato del estrato en el que se caló un tren; si se cuenta con un mapa
batimétrico y una localización geográfica precisa, es posible averiguar la profundidad en ese punto, y
deducir el estrato correspondiente.
FIGURA 6.2: Relacionando las capturas con los puntos GPS. A) Tras incorporar la tabla
Calados_GPS al SII, una consulta devuelve valores de latitud y longitud de captura para cada trucha
marrón (Salmo trutta) capturada en el Nahuel Huapi, así como sus tallas. B) Gráfico de dispersión
de largo total en función de la latitud. C) Diagrama de cajas (agrupado por estación de muestreo) de
las variables de B).
clave externa, y en el cual se consigna para cada localización el código de calado que
está en ID_Calado:CALADOS. Además, es conveniente agregar a la tabla su propia clave
principal, en caso de que querramos luego asignar variables precisas a esos sitios
particulares (lo que implicaría un análisis en una escala aún más detallada que las
variables asignadas a sitios de muestreo).
Una vez que cada registro de la tabla de localizaciones geográficas de calado tiene
un valor asignado en la clave externa, simplemente es necesario importarla al SII; en
este caso, al importarla se le dio el nombre de CALADOS_GPS a la entidad . Luego, solo
queda generar una relación ID_Calado: CALADOS_GPS 1→1 ID_Calado: CALADOS, y
ya queda la nueva tabla incorporada a la base de datos. Ahora, es posible asignar un
punto geográfico de captura para cada ejemplar pescado en una red georreferenciada
con GPS con una precisión de 30 a 6 metros (FIGURA 6.2).
FIGURA 6.3: Importando bases de datos externas. Mapa preliminar de lagos del Parque Nacional Los
Alerces ilustrando la variación en la concentración media de clorofila a (Chl-a). Los datos se recuperaron
desde la base de datos ArLaRe (Quirós, op. cit.).
La tabla CPOSAGUA del SII tiene a su par espacial en la capa temática vectorial de
polígonos de cuerpos de agua de Patagonia, Igm_patagonia_cposagua.shp6 (FIGURA
4.4). Esta capa vectorial fue extraída del SIG250, como se explicó más arriba. Para que
no existan ambivalencias en la denominación de los cuerpos de agua, se adoptó la
información contenida en la tabla de atributos original para generar la tabla CPOSAGUA
del SII. Se tuvo especial atención en que los códigos de identificación (ID_CpoAgua) se
correspondieran.
Contando con esta información espacial, es posible usar las herramientas de
acceso a bases de datos del SIG para asignar información almacenada en el SII a los
elementos de la capa temática. Por ejemplo, se puede recuperarse la información de la
temperatura media superficial del agua en verano para cada cuerpo de agua, y generar
un mapa que emplee una leyenda de gradiente de colores para visualizar estos valores
dentro de un área geográfica.
6
Toda la información vectorial digital se presenta en formato ESRI Shapefile (.SHP), el cual se ha
convertido en un estándar de facto por su amplio uso por parte de numerosos paquetes SIG. Cada capa
temática Shapefile consiste en al menos dos archivos que contienen la definición espacial de los
elementos (.shp y .shx), y un archivo en formato dBase (.dbf) que contiene la tabla de identificadores y
atributos.
FIGURA 7.1: Del SII al SIG. Ilustración de los pasos necesarios para llevar los resultados de una
consulta al SII a un mapa, empleando la implementación bajo MS Access del SII y el SIG ESRI
ArcView v.3.3.
Aún más simple que en el caso anterior es usar la información del SII que cuenta
con coordenadas puntuales. Tal es el caso de la tabla SITIOS_MUESTREO, o la tabla
CALADOS_GPS, o cualquier consulta que devuelva valores con pares de coordenadas.
Para generar mapas de puntos, es necesario crear una consulta que devuelva, entre
otros atributos, pares de coordenadas geográficas (por ejemplo, los pares de
coordenadas que figuran en SITIOS_MUESTREO o CALADOS_GPS). En este caso, no es
indispensable que exista una clave principal o código de identificación, ya que no es
necesario vincular tablas. La consulta se guarda y se exporta como archivo dBase.
Desde el ArcView, se importa la tabla usando “Add Table”. A partir de ahí, el
archivo de puntos se genera automáticamente usando el comando “Add event
theme…” y seleccionando los campos correspondientes a las coordenadas X e Y
(FIGURA 7.2). ArcView genera automáticamente una capa temática de puntos que usa el
archivo dBase como tabla de atributos, y que puede guardarse para su posterior análisis.
FIGURA 7.2: Importando mapas de puntos. Comandos usados en ESRI ArcView 3.3 para crear una
capa temática de puntos a partir de una tabla .dbf exportada desde el SII.
La cuenca superior del río Manso tiene su cabecera en los hielos de la porción
sudeste del Volcán Tronador (41º10´S 71º53´W), y vuelca sus aguas a un conjunto de
lagos concatenados por el río Manso, el cual serpentea hasta dirigirse hacia el sur y
luego al este para confluir con los ríos Villegas y Puelo. Hay 6 lagos de dimensiones
considerables en la cuenca: Guillermo, Mascardi, Fonck, Julio A. Roca, Martin y Hess.
Además, existen varios lagos más pequeños, entre los que se pueden mencionar Los
Moscos, Fonck Chico y Hess.
Durante los años 1998 y 1999, el GEMaRI realizó tareas de investigación en los
lagos mencionados, que incluyeron capturas de ictiofauna, mapeos ambientales de las
costas (granulometría, vegetación y características litorales), y la elaboración de mapas
batimétricos mediante hidroacústica.
FIGURA 7.3: DEM “seco” de la cuenca del río Manso. Modelo de relieve generado a partir de la
combinación del DEM SRTM y los DDM generados a partir de las batimetrías hidroacústicas. Se
agregó una capa con los ríos y arroyos y el contorno de los lagos para mejor referencia.
modelos se exportaron como archivos USGS DEM y se importaron en el paquete de
SIG ArcView usando la extensión Spatial Analyst que permite el trabajo combinado
entre grillas raster y capas vectoriales. La información topográfica se obtuvo a partir de
grillas raster derivadas del programa SRTM (Shuttle Radar Topography Mission7),
como un Modelo de Elevación Digital, (Digital Elevation Model, DEM). Además del
mapa de batimetrías, se realizó una combinación entre el DDM y el DEM de modo de
integrar ambos modelos en un modelo topográfico que incorpora los datos batimétricos.
El resultado es un mapa de relieve en el que el agua de los lagos parece haber sido
drenada (FIGURA 7.3).
7
La Misión Topográfica de Radar del Transbordador Endeavour (Shuttle Radar Topography Misión,
SRTM) fue un proyecto internacional encabezado por la Agencia Nacional de Inteligencia Espacial
(NGA) y la Administración Nacional Espacial y Aeronáutica (NASA) del gobierno de los Estados
Unidos. La SRTM obtuvo datos de elevación en una escala cuasi global a fin de generar una base de datos
topográfica de alta resolución del planeta. La misión se basó en un sistema de radar modificado para tal
fin que sobrevoló el planeta durante 11 días a bordo del Transbordador Espacial Endeavour en Febrero
del 2000. Los datos resultantes se volcaron a una grilla de 3 segundos de arco, equivalentes a un tamaño
de celda aproximado de 90×90 metros. (USGS. Reprocessing by the GLCF. 2004. 3 Arc Second SRTM
Elevation, Reprocessed to GeoTIFF. College Park, Maryland: The Global Land Cover Facility,
http://www.landcover.org. Version 1.0. ).
FIGURA 7.4: Estructura hídrica de la cuenca del río Manso. Mapa que ilustra las subcuencas
exclusivas de cada lago (es decir, las áreas de drenaje exclusivo hacia el lago), y las microcuencas
que la componen.
MORFOLOGIA_LAGOS_DDM
Nombre del campo Tipo de datos Descripción
אID_Lago Número entero Identificador de lago
Z_MAX Número entero Profundidad Máxima
Z_MED Número real Profundidad Media
Z_MEDIANA Número entero Mediana de la profundidad
VOL_HM3 Número entero Volumen de agua contenida en el lago
AREA_KM2 Número real Área del espejo de agua
PERIMETRO Número real Perímetro de la costa
Número entero Altura sobre el nivel del mar (según el
ALTURA_DEM DEM)
AreaSomera_km2 Número real Área con profundidad menor a 10 metros
Area_fondo_km2 Número real Superficie real del lecho lacustre
CUENCAS_LACUSTRES_DEM
Nombre del campo Tipo de datos Descripción
אID_Lago Número entero Identificador de lago al que drena la
subcuenca
Area_Km2 Número real Área de la subcuenca de drenaje exclusivo
Número real Perímetro de la subcuenca de drenaje
Perimetro_Km exclusivo
MeanFlowDist Número real Distancia media al punto de descarga
Número real Altitud media sobre el nivel del mar de la
AltitudMedia subcuenca de drenaje exclusivo
Número real Pendiente media de la subcuenca de drenaje
PendienteCuenca exclusivo
Area_km2_total Número real Área de la subcuenca completa
Perimetro_km_total Número entero Perímetro de la subcuenca completa
Como ejemplo adicional de aplicación de SIGs para obtener información sobre los
cuerpos de agua para su integración al SII, emplearemos el uso de imágenes obtenidas
mediante sensores remotos satelitales para obtener mapas de temperatura superficial de
los lagos de la cuenca del Manso. El mismo procedimiento que se describe es válido
para otros lagos.
La imagen base que se empleó corresponde a datos obtenidos por el sensor ETM+
(Enhanced Thematic Mapper Plus) del satélite LandSat 7 para la banda 6.2 (10.40 µm-
12.5µm) el día 8/12/20018. Esta banda detecta las emisiones al espacio de infrarrojo
térmico, es decir, el calor emitido por los cuerpos en tierra, y está compuesto por celdas
(pixels) de datos de 60x60 metros. Las características físicas de emisión de los cuerpos
de agua los hacen ideales como objeto de análisis mediante teledetección (citar papers
de Schott y otros).
Cada píxel de la imagen satelital tiene un valor que se encuentra entre 0 y 255.
Estos valores deben convertirse a valores de radiancia usando la siguiente ecuación
(Landsat Project Science Office 2005):
8
U.S. Geological Survey. 12-08-2000. Landsat ETM+ Scene, WRS-2 Path 232, Row 89, Level 1G.
Sioux Falls, South Dakota: USGS. Datos obtenidos mediante el Global Land Cover Facility,
http://www.landcover.org.
archivo de texto anexo al set de datos satelitales, y varían con cada set.
Aplicando esta fórmula a todos los pixels de la imagen para el área de interés, se
obtiene una imagen con valores de radiancia reales (medidos en watts/(m2 × ster × µm)).
A partir de los valores de radiancia, la temperatura al satélite puede calcularse (Landsat
Project Science Office 2005) usando la ecuación
K2
T=
⎛K ⎞
ln⎜⎜ 1 + 1⎟⎟
⎝ Lλ ⎠
Donde:
FIGURA 7.5: Temperatura superficial de los lagos de la cuenca del Manso. Valores obtenidos
mediante teledetección para fines de la primavera de 2001.Tm representa la temperatura media
obtenida de promediar los valores de todas las celdas de cada lago.
partir de esta imagen, y usando los polígonos de los lagos como máscara de análisis, es
posible recortar los datos referidos a los cuerpos de agua, obteniendo un mapa de la
distribución espacial de temperaturas superficiales del agua en todos los lagos de la
cuenca (FIGURA 7.5).
Al igual que en los casos anteriores, esta tabla se integra al SII mediante la
relación
ID_Lago: TEMP_LAGOS_L7B6_20011208 1→1 ID_CpoAgua: CPOSAGUA
Esta tabla representa valores de temperatura para una única fecha. Contando con
información de otras fechas, sería posible realizar un seguimiento de la evolución
térmica superficial de los lagos. Para tal caso, convendría generar una clave principal en
la tabla, y agregar un campo Fecha a fin de poder incluir en la tabla múltiples registros
para cada cuerpo de agua.
8- CONCLUSIONES
A lo largo de los dos años que duró este proyecto, se cumplió su objetivo general
y muchos de los objetivos parciales. El SII es una realidad, actualmente implementado
como una base de datos Microsoft Access, pero planteado en una estructura
independiente de la plataforma. Su uso permite obtener datos estandarizados y
comparables entre distintos puntos geográficos y temporales. Conjuntamente a su
desarrollo, se llevaron a cabo tareas de formación y entrenamiento en los fundamentos
de su uso, a fin de maximizar su empleo y su aprovechamiento.
relacionales permiten usar el SII como medio para realizar consultas novedosas e
indagar nuevos enfoques y relaciones entre las numerosas variables bióticas y abióticas
que conforman las distintas escalas de los ecosistemas de agua dulce.
Como toda herramienta, su utilidad depende siempre de la habilidad de quien la
usa. Buena parte del uso adecuado de una herramienta está dado por el conocimiento de
sus principios de funcionamiento: este aspecto intenta ser cubierto por el presente
informe. El texto también intenta resaltar las potencialidades de expansión del SII:
efectivizar tal expansión es una tarea a futuro encomendable a quienes deseen hacer
crecer y sacar el máximo provecho a este desarrollo.
9- REFERENCIAS BIBLIOGRÁFICAS
BAIGUN, C.R., Y R.O. ANDERSON. 1993. Structural indices for stock assessment of
and management recomendations for pejerrey (Odontesthes bonariensis) in Argentina.
North Amer. J. Fish. Manag.: 600-608.
BAIGUN, C., Y R.L. DELFINO. 1994. Relación entre factores ambientales y biomasa
relativa de pejerrey en lagos y embalses templado-calidos de la Argentina. Acta Biol.
Venez. 15: 47-57.
BAIGUN, C., Y M.C. MARINONE. 1995. Cold-temperate lakes of South America: do they
fit northern hemisphere models? Arch. Hydrobiol. 135:23-51.
CODD, E.F. 1970. A relational model of data for large shared data banks.
Communications of the ACM 13(6): 377-387.
CODD, E. F.1972. Further Normalization of the Data Base Relational Model. En Data
Base Systems, Courant Computer Science Symposia 6. Prentice-Hall.
DATE, C.J. Y R. FAGIN. 1992. Simple conditions for guaranteeing higher normal forms
in relational databases. ACM Transactions on Database Systems 17(3):465-476.
LANDSAT PROJECT SCIENCE OFFICE. 2005. Landsat-7 Science Data User's Handbook.
Landsat Project Science Office, Goddard Space Flight Center, National AeroSpatial
Agency. Greenbelt, Maryland.
http://ltpwww.gsfc.nasa.gov/IAS/handbook/handbook_toc.html
PASCUAL, M.A., J.M. ORESANZ, A.M. PARMA Y S.L. Saba. 1998. The patagonian
challenge: melding conservation with development. En: Fiedler, P.L., and P.M. Kareiva
(eds) Conservation Biology for the Coming Decade, 2nd edition, pp. 410-425.
Chapman & Hall, New York/London.
PRAGUE, C.N. Y M.R. IRWIN. 2001. Access 2002 Bible. Hungry Minds, New York.
zooplankton, and relative fish biomass in lakes and reservoirs of Argentina. Verh.
Internat. Verein. Limnol. 24: 1198-1206.
QUIROS, R. 1995. The effects of fish assemblage composition on lake water quality.
Lake and Reservoir Management 11: 291-298.
QUIROS, R. 1998a. Classification and state of the environment of the Argentinean lakes.
In ILEC Study Report for the the Lake Environment Conservation in Developing
Countries. Argentina. Chapter 2. Lakes of Argentina. Section 1. Papers presented
at ILEC Workshop on Better Management of the Lakes of Argentina. San Martin
de los Andes, Argentina, 24-25 October, 1997. pp 29-50. International Lake
Environment Committee Foundation (ILEC). Japan. 229p.
QUIROS, R. 1998b. Fish effects on trophic relationships in the pelagic zone of lakes.
Hydrobiologia 361: 101-111.
QUIROS, R. 2004. Cianobacterias en lagos y embalses de Argentina: década del 80. Serie
de Documentos de Trabajo del Área de Sistemas de Producción Acuática. Documento
No 2, 23 p. Departamento de Producción Animal, Facultad de Agronomía, Universidad
de Buenos Aires, Buenos Aires.
QUIROS, R., Y M.B. BOVERI. 1999. Fish effects on reservoir trophic relationships (p:
529-546). In J.G. Tundisi and M.Straskraba (eds.) Theoretical Reservoir Ecology and
Its Applications. 585 pp. International Institute of Ecology, Brazilian Academy of
Sciences, Backhuys Publishers, Leiden, Netherlands.
QUIROS, R., S. CUCH, Y C.R.M. BAIGUN. 1986. Relación entre abundancia de peces y
ciertas propiedades fisicas, químicas y biológicas, en lagos y embalses patagónicos
QUIROS, R., Y E. DRAGO. 1999. The environmental state of the Argentinean Lakes: An
overview. Lakes and Reservoirs: Research & Management 4: 55-64.
RINGUELET. R.A. 1975. Zoogeografía y ecología de los peces de las aguas continentales
de la Argentina, y consideraciones sobre las áreas ictiológicas de América del Sur.
Ecosur 2(3), pp. 1-122.
TEMPORETTI, P.F., M.F. ALONSO, G. BAFFICO, M.M. DIAZ, W. LÓPEZ, F.L. PEDROZO Y
P.H. VIGLIANO. 2001. Trophic state, fish community and intensive production of
salmonids in Alicura Reservoir (Patagonia, Argentina). Lakes & Reservoirs: Research
and management 6: 259-267.
VIGLIANO, P.H. 1997. Pesca deportiva y recreacional, un recurso poco conocido. Actas I
Jornadas Regionales Sobre Medio Ambiente, La Plata 1: 53-60.