Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EN
POBLACIONES MEDIOAMBIENTALES
Introduccin..................................................................................4
Captulo 1. El muestreo en poblaciones medioambientales.....8
1.1 Muestreo de poblaciones en el espacio...........................................................8
1.2 Definicin de marcos muestrales para poblaciones medioambientales.....8
1.3 Diseos para muestras medioambientales....................................................11
1.3.1 Diseos multietapa.....................................................................................11
1.3.1.1 Diseos espacialmente limitados.............................................................11
1.3.1.2 Diseos espacialmente equilibrados o balanceados................................12
1.3.2 Diseos estratificados................................................................................13
1.3.2.1 Muestreo sistemtico...............................................................................13
1.3.2.2 Diseos espacialmente estratificados......................................................14
1.3.2.3 Diseos estratificados aleatorios de teselas.............................................15
1.3.2.4 Tcnicas de direccin/orientacin espacial.............................................15
1.3.3 Otros diseos muestrales..........................................................................17
1.3.3.1 Muestreo adaptativo................................................................................17
1.3.3.2 Diseos muestrales para la estimacin de la abundancia animal............18
1.3.3.3 Diseos para la evaluacin de la tendencia o del estado y la tendencia..19
Anexo...........................................................................................75
1. Modelos de estado y de observacin para mtodos simples.......................75
1.1 Modelos de estado.........................................................................................75
1.2 Modelos de observacin...............................................................................76
2. Modelos de estado y de observacin para mtodos complejos..................78
2.1 Modelos de estado.........................................................................................78
2.3 Modelos de observacin...............................................................................81
3. Tcnica de remuestreo bootstrap......................................................................81
4. Ancho de banda efectivo...................................................................................84
Bibliografa.................................................................................86
2
Introduccin
La preocupacin por el medio ambiente se ha convertido en un tema de gran inters que afecta
tanto a instituciones como a ciudadanos. Esta preocupacin no solo se centra en los problemas
medioambientales producidos por la degradacin del entorno natural, tales como la conservacin de
recursos naturales, la reduccin de la capa de ozono, el calentamiento global, el cambio climtico,
etc., sino tambin en aquellos que estn relacionados con el mbito de vida de cada ciudadano,
como por ejemplo, la contaminacin debida al trfico, al ruido, la calidad del agua y de otros
productos alimentarios, los daos ocasionados al paisaje, etc.
En este sentido evaluar el estado, condicin o alcance de recursos ambientales, tales como aire,
agua, sol y el conjunto de especies de plantas, animales y otros organismos que ocupan un rea
dada, y que sustentan nuestro medio ambiente, puede resultar bastante interesante. Para llevar a
cabo esta evaluacin haremos uso de encuestas dirigidas a este tipo de recursos.
La poblacin objetivo de una encuesta medioambiental puede ser discreta y finita, como por
ejemplo, pequeos lagos o humedales, con unidades de poblacin bien definidas, o puede ser
continua de una, dos o tres dimensiones, como por ejemplo, una red de arroyos, un bosque o el
volumen de agua de un gran lago. Cada una de ellas requiere diferentes tipos de marcos y diseos
muestrales.
La encuesta medioambiental puede consistir en evaluar alguna caracterstica del recurso una sola
vez o puede incluir un objetivo de seguimiento o supervisin a largo plazo que evale el cambio o
tendencia del mismo. Abordar ambos objetivos requiere de un equilibrio entre volver a visitar los
lugares para evaluar la tendencia e incorporar nuevos lugares para evaluar la situacin o estado del
recurso.
Tradicionalmente, el enfoque del muestreo en ciencias medioambientales ha sido en sistemas
relativamente pequeos y bien delimitados, por ejemplo, a escala de un lago, o una cuenca de un ro
o masa forestal. No obstante, algunos problemas medioambientales actuales, tales como el
calentamiento global, la contaminacin de aguas superficiales y subterrneas por pesticidas y otros
contaminantes y la extensa alteracin del paisaje no estn localizados. Cuantificar la magnitud de
los sntomas de preocupacin generalizada requiere de esfuerzos de estudio a gran escala, lo que a
su vez necesita de tcnicas de muestreo y metodologas que sean formuladas para abordar los
problemas medioambientales regionales, continentales y a escala mundial.
Como ya sabemos, el diseo de una encuesta es un rea bien desarrollada y establecida en la
literatura estadstica. Disponemos de muchos libros de texto que proporcionan excelentes
explicaciones de los atributos esenciales de un buen diseo de encuesta, tales como, la necesidad
de una clara definicin de la poblacin de inters, las unidades muestrales, el marco muestral, y la
forma en la que la muestra es seleccionada (Cassel et al., 1993b; Cochran, 1977; Kish, 1987; Lohr,
1999; Sarndal et al., 1992; Thompson, 2002; Yates, 1981).
pasar un ao o ms desde que los datos de campo son recogidos hasta que los anlisis del
laboratorio estn disponibles. Estos pueden estar sujetos a un error de medida ms sustancial que
el encontrado rutinariamente en otros tipos de encuestas. La falta de respuesta en el muestreo
medioambiental puede ser sustancial por razones como facilidad de acceso fsico, seguridad o
permisos.
Una complicacin prctica con la que frecuentemente nos encontramos en el muestreo
medioambiental es la dificultad para obtener un marco muestral preciso. En muchas ocasiones, los
marcos de muestreo disponibles incluyen una parte sustancial de elementos que no son objeto de
estudio o que no llegan a cubrir la poblacin por completo. El problema del marco se agrava por la
pura dificultad de recoger y analizar las muestras.
El muestreo medioambiental casi siempre se encuentra con un teln de fondo de consideraciones
polticas, econmicas y sociales de modo que las consideraciones estadsticas solo representan un
aspecto de un diseo muestral. Adems, debido a que los problemas medioambientales pueden
impactar en las poblaciones humanas, con frecuencia hay mltiples grupos, agencias y
organizaciones que tienen un inters en los productos de la encuesta. Los intereses de las mltiples
partes interesadas no siempre estn en la misma lnea. La confluencia de los intereses de las
mltiples partes interesadas, mientras se mantiene un diseo riguroso cientfica y estadsticamente,
puede ser un desafo.
En muchos casos, la necesidad de una muestra medioambiental estar motivada por la necesidad
de evaluar el estado de un recurso medioambiental a causa de la preocupacin por la potencial
degradacin. El diseo necesita abordar los problemas medioambientales actuales, pero eso no es
suficiente, ya que los problemas actuales finalmente sern resueltos, pero surgirn nuevos, en estos
momentos no identificados. Estos problemas se manifestarn de modos imprevisibles, y afectarn a
recursos que no pueden ser identificados ahora. Un programa de evaluacin medioambiental con los
dobles objetivos de estado y tendencia debe ser capaz de tener en cuenta la reagrupacin, la
recombinacin, la expansin y contraccin de la muestra para permitir que tales problemas que
surjan y los objetivos que se desarrollen sean abordados. Los problemas de marcos inadecuados, la
no respuesta y los datos perdidos, y la evolucin de los objetivos fuerzan una necesidad de diseos
muestrales con la flexibilidad de aadir, eliminar o redistribuir muestras.
En este trabajo nos centraremos como hemos indicado con anterioridad en las encuestas
medioambientales enfocadas a evaluar el estado, condicin o alcance de los recursos ambientales,
haciendo especial hincapi en los diseos muestrales utilizados para abordar el problema de la
estimacin del tamao de la poblacin en aquellos casos en los que se trabaja con poblaciones de
animales salvajes cerradas, problema que en ecologa se conoce con el nombre de estimacin de la
abundancia animal.
El basado en el modelo.
Estos dos enfoques surgen de diferentes bases tericas pero ambos pueden abordar el objetivo de
trabajo comn. En el muestreo basado en la probabilidad, a partir de una regla probabilstica que
permite seleccionar las unidades de la muestra, vamos a poder calcular la respuesta, la cual se ve
como fija pero desconocida, mientras que un enfoque basado en el modelo considera la respuesta
como una realizacin de un proceso aleatorio. En el muestreo medioambiental, usualmente estamos
interesados en un atributo de un recurso ambiental y un objetivo del diseo basado en la
probabilidad es estimar ese atributo. Paralelamente, un objetivo del diseo basado en el modelo es
predecir la salida del proceso y calcular el atributo a partir del resultado predicho.
Dado que el espacio juega un papel fundamental en el muestreo medioambiental, mucha de la
teora y de la prctica relevante se han ocupado de resolver el tema del muestreo espacial (la
unidad muestral no es un individuo sino un espacio). As, una serie de autores han investigado
diseos de muestreo en el espacio, de forma que los documentos que tienen una orientacin terica
del muestreo tienden a considerar solo poblaciones finitas, mientras que otros de ellos con una
orientacin estadstica espacial basada en el modelo consideran poblaciones continuas. Entre los
resultados obtenidos tenemos, por ejemplo, los de Overton y Stehman (1993) que compararon tres
diseos muestrales, el sistemtico, el aleatorio simple y el estratificado aleatorio de teselas,
contrastndolos en trminos de su precisin y propiedades de la varianza y llegando a la conclusin
de que la varianza en un muestreo estratificado aleatorio de teselas era inferior a la de un muestreo
sistemtico y a su vez sta es inferior a la de un muestreo aleatorio simple.
Para la elaboracin de los marcos tambin se pueden utilizar bases de datos con informacin
auxiliar. Por ejemplo, los Estados Unidos disponen de bases de datos de uso y cobertura del suelo
que cubren todo el territorio por completo. Estas bases de datos pueden proporcionar informacin
auxiliar, tal y como el uso del suelo, forma del terreno, clasificacin del suelo, cubierta vegetal,
hidrologa y modificaciones inducidas por el hombre, que pueden ser usadas para estructurar un
diseo muestral. Tambin se dispone de informacin adicional a partir de las bases de datos
meteorolgicas existentes.
As, la Base de Datos Hidrogrfica Nacional (National Hydrography Database (NHD; USGS,
2000)) podra decirse que es la mejor fuente de informacin disponible sobre masas de agua en los
Estados Unidos, pero sin embargo no es un marco ideal. Aunque los atributos de los que dispone la
base de datos pueden utilizarse para identificar un subconjunto de la misma que ms se acerque al
objetivo de estudio, el subconjunto todava puede incluir muchas entradas no objetivo. Por ejemplo,
supongamos que el objetivo original fuera describir la poblacin de los lagos en California que
sustentan poblaciones de peces. La base de datos NHD tiene sobre 9.000 entradas identificadas
como lagos en California. Muchas de estas son muy pequeas (sobre 1.000 son menores a 1
hectrea y sobre 5.000 son menores a 5 hectreas). De hecho, muchas de las entradas ms
pequeas identificadas como lagos no lo son, son estanques de granjas, estanques de contencin
para el tratamiento de aguas residuales, o cuencas de filtracin intermitentes que estn secas la
mayor parte del ao.
Otra forma de construir un marco consiste en utilizar una rejilla para enmarcar a la poblacin que se
distribuye sobre alguna extensin espacial. La idea sera superponer la rejilla sobre una
representacin de la extensin espacial y luego muestrear en o alrededor de cada punto de la rejilla.
En este sentido, las rejillas sistemticas aleatorizadas tienen una larga historia de aplicacin en el
muestreo medioambiental.
Por el contrario, tambin puede darse el caso de que el mejor marco disponible pueda no incluir
alguno de los recursos objetivo. Por ejemplo, en sistemas de informacin geogrfica (SIG), la
cobertura de la poblacin objetivo es ms segura partiendo de fotos areas. El hecho de que la
cobertura sea til como marco poblacional depende de la habilidad del intrprete de la foto y del
cartgrafo. Por ejemplo, la mejor fuente de informacin del marco de humedales en los Estados
Unidos es el Inventario Nacional de Humedales (National Wetland Inventory (NWI; USFWS,
2002; http://www.fws.gov/nwi/)). No obstante, con este sistema puede ser muy difcil identificar
humedales en reas boscosas debido a que los rboles cubren a los humedales como si fueran un
toldo. De hecho, hasta el 50% de los humedales podran no estar incluidos en el inventario.
Con la disponibilidad de los SIG, las representaciones de mapas electrnicos son cada vez ms
comunes en poblaciones medioambientales. Si representamos un marco mediante un SIG, la
poblacin puede verse como una poblacin finita o continua de puntos. Por ejemplo, una lista de
coordenadas de los lagos se puede obtener a partir de la Base de Datos Hidrogrfica Nacional. Por
el contrario, un bosque, un gran estuario, o una red de arroyos pueden ser tratados como continuos.
10
11
poblaciones medioambientales siempre presentan una estructura espacial y un patrn. Luego esta
informacin se podra tener en cuenta para realizar un control espacial de elementos de la
poblacin. La ventaja del mismo deriva de la tendencia que tienen los elementos de una poblacin
medioambiental de ser ms similares a medida que estn ms cerca unos de otros y de ser ms
distintos a medida que estn ms lejos. Las observaciones de elementos que se encuentran cerca
unos de otros contienen informacin redundante. As, las muestras que estn bien dispersas en el
dominio de la poblacin tienden a dar lugar a estimaciones ms precisas de los atributos de la
poblacin que las muestras sin control espacial. Para lograr esa dispersin hay muchas tcnicas
entre las que se incluye el muestreo de reas, la estratificacin espacial, el muestreo sistemtico y el
basado en la rejilla, los marcos de listas estructurados espacialmente y los diseos espacialmente
equilibrados o balanceados.
1.3.1.2 Diseos espacialmente equilibrados o balanceados
La nocin de muestra equilibrada o balanceada fue introducida por Yates (1946). Una muestra de la
variable respuesta Z es equilibrada sobre una variable auxiliar X si los x-valores (que se conocen de
antemano) son elegidos de forma que la media muestral de los mismos es exactamente igual a la
media poblacional de X. Una versin ms estricta de equilibrio fue sugerida por Royall y Herson
(1973). sta requiere que varios de los primeros momentos muestrales de la x-muestra coincidan
con los momentos poblacionales. Lo que se intuye detrs de esta situacin de equilibrio es que la
variable auxiliar est correlacionada con la variable respuesta desconocida, que es la que vamos a
evaluar. Al mantener el equilibrio sobre la variable auxiliar, esperamos obtener un equilibrio
aproximado sobre la variable respuesta desconocida, y por tanto, obtener una estimacin ms
precisa que la que dara el muestreo aleatorio simple. Kott (1986) seal que una opcin intermedia
entre muestreo aleatorio y el equilibrio estricto se puede obtener dividiendo el rango de X en n
cuantiles y eligiendo un elemento de la muestra en cada cuantil. Aunque esta opcin no
logra el equilibrio en el sentido estricto de tener momentos muestrales coincidentes con momentos
poblacionales, da garantas de que la funcin de distribucin muestral de X se acercar a la
verdadera funcin de distribucin para cada muestra seleccionada. Esta es la idea subyacente de
todos los diseos muestrales estratificados. Debido a la correlacin entre X y Z, la esperanza es que
la muestra de Z ser ms precisa.
Si la variable auxiliar X es la localizacin, entonces decimos que una muestra ser espacialmente
equilibrada o balanceada si los momentos espaciales de las localizaciones de la muestra coinciden
con los momentos espaciales de la poblacin. Los dos primeros momentos espaciales son el centro
de gravedad y la inercia de una regin R.
El segundo momento espacial es anlogo a la matriz de covarianzas y mide la regularidad de la
forma de la regin R o del patrn de puntos formados por los puntos de muestrales.
En general, una muestra cuyo diseo est basado en la probabilidad no alcanzar el equilibrio
espacial exacto, pero el equilibrio espacial aproximado es una meta que vale la pena. Adems, la
12
discrepancia entre los momentos muestrales y los momentos poblacionales puede usarse como una
medida del equilibrio espacial de una muestra.
A todas las tcnicas que se describen a continuacin para lograr el control espacial les va mejor
en la consecucin del equilibrio espacial que al muestreo aleatorio simple.
el
mismo.
Si
esas
caractersticas
tambin
influyen
en
la
respuesta,
entonces pueden dar lugar a una alta variabilidad de los estimadores. Este fenmeno suele darse en
relacin con variables respuesta peridicas o casi peridicas, pero tambin puede ocurre en
variables respuesta con una estructura de mosaico. Otra de las carencias de una muestra
13
sistemtica es su inflexibilidad. Errores del marco o sitios inaccesibles, no tienen cabida fcilmente
en estos diseos, ni son diseos de probabilidad variable. Finalmente, indicar que las muestras
sistemticas no dan lugar a frmulas de estimacin de la varianza insesgadas.
1.3.2.2 Diseos espacialmente estratificados
Uno de las formas ms populares de conseguir una muestra espacialmente dispersa es usar la
estratificacin espacial. Los estratos se definen como polgonos disjuntos que cubren el dominio.
Los estratos pueden ser figuras geomtricas regulares, tales como las celdas de la rejilla; polgonos
arbitrarios tales como regiones ecolgicas; fronteras polticas, tales como fronteras del estado o del
condado; o lmites naturales, tales como cuencas hidrogrficas. El mximo equilibrio espacial
generalmente ser alcanzado por dispersin mxima sobre el dominio, que a su vez se obtendr
eligiendo los estratos con pocas muestras por estrato. El objetivo de definir los estratos debera ser
tener una cantidad igual de recursos (nmero, longitud y rea) e igual nmero de muestras en cada
estrato, dando lugar a un diseo equiprobable Comnmente, las muestras son seleccionadas dentro
de los estratos usando un muestreo aleatorio simple, pero se podran haber utilizado otras tcnicas.
Si
el
diseo
no
es
equiprobable, entonces el objetivo debe seguir siendo tener un nmero constante de muestras por
estrato, aunque la cantidad de recursos por estrato puede variar.
La estratificacin mxima logra un buen control espacial, pero tener slo unas pocas muestras por
estrato limita la flexibilidad. Dadas las dificultades de muestreo medioambiental, sera muy posible
que se perdieran todas las muestras de un estrato debido a la inaccesibilidad. En caso de que las
muestras perdidas fueran reemplazadas, como podra hacerse si el muestreo aleatorio simple se
usara dentro de la seleccin de cada estrato, entonces la probabilidad de inclusin podra ser
sustancialmente diferente para ese estrato.
La formacin de los estratos con igual tamao e igual nmero de muestras suele ser sencilla para
diseos equiprobables y recursos objetivo bidimensionales pero puede ser problemtica para
recursos finitos de desigual tamao. Por ejemplo, los lagos a menudo son tratados como
poblaciones finitas para fines de muestreo. La distribucin del tamao de los lagos est fuertemente
sesgada hacia pequeos lagos (Larsen et al, 1994; Stevens, 1994). Una muestra equiprobable se
traducira en lagos en su mayora muy pequeos, que probablemente no sern los lagos de mayor
inters (es decir, los que son accesibles, los que apoyan la pesca recreativa o comercial, los que
apoyan otro uso recreativo, los que han desarrollado lneas de costa, o los que estn sujetos a
impactos del desarrollo). Adems, el patrn espacial de los lagos tiende a ser agrupado en lugar de
uniforme. Para obtener un beneficio de la estratificacin espacial, los estratos deben abarcar un rea
de influencia ms o menos homognea, por ejemplo, el uso/cobertura del suelo, el terreno, regiones
ecolgicas, y los impactos que son resultado de actuaciones humanas. Esto sugiere que los estratos
son espacialmente compactos, con pequeo permetro a razn del rea. La formacin de tales
estratos (espacialmente compactos con igual nmero de muestras) puede ser difcil. Stevens (1994)
describe un algoritmo usado por EMAP para formar los estratos espaciales de los lagos.
14
15
entonces el lmite es una funcin medible, 1-1, del cuadrado unidad al intervalo unidad (Stevens y
Olsen, 2004).
Figura 1
16
La recursividad contina hasta que cada celda tiene una probabilidad de inclusin total menor que
uno y posteriormente se aplica una aleatorizacin jerrquica. El proceso se ilustra en la Figura 2.
Figura 2
La parte (a) de la figura muestra las q-r direcciones de las primeras 16 celdas, con una lnea de
conexin de las celdas siguiendo el orden q-r. En la parte (b), la ruta conecta las celdas siguiendo un
orden aleatorio jerrquico. A cada celda se le asigna una longitud igual a su probabilidad de inclusin
y a continuacin, las longitudes se conectan entre s formando una lnea con una longitud igual al
tamao de la muestra total. A lo largo de la lnea se ha seleccionado se muestra sistemtica. Debido
a la naturaleza 1-1 de un mapa cuadrante recursivo, cada punto de la lnea se corresponde con
algn elemento de la poblacin, por lo que los puntos seleccionados en la lnea se pueden asignar a
determinados elementos de la poblacin.
17
grupos tienden a ser de un tamao que abarca varias celdas de la rejilla de modo que el rea de la
celda de la rejilla es sustancialmente menor que el tamao medio del grupo. Una muestra inicial de
celdas de la rejilla se selecciona y se visitan, y la respuesta (por ejemplo, el nmero de individuos de
las especies objetivo en la celda de la rejilla) se registra para cada celda. Si la respuesta satisface
algunos criterios (por ejemplo, el nmero de individuos observados es positivo, o mayor que un
nmero), entonces las celdas adyacentes se aaden a la muestra. Esta secuencia de
observacin/aumento contina hasta que no se observa nuevamente una celda que cumpla los
criterios de activacin del aumento.
La muestra resultante presenta algunas dificultades de anlisis, porque la probabilidad de inclusin
de una celda es imposible calcularla sin el conocimiento completo de la estructura de la poblacin,
que no est disponible. Thompson (1990) muestra cmo obtener algunos pesos modificados que
permiten estimaciones insesgadas del total utilizando un estimador similar al estimador de HorvitzThompson. Christman (1997) compara la eficiencia de varios diseos para muestrear poblaciones
agrupadas y concluye que el muestreo adaptativo es un esquema de muestreo eficiente para
poblaciones raras agrupadas, cercanas entre s (Chao y Thompson, 2001).
Tambin hay algunas dificultades en la aplicacin del muestreo adaptativo en el campo. La regla
para aadir celdas a la muestra debe ser formulada antes de que comience el muestreo y debe
continuar en el campo. En particular, los nuevos lugares vecinos deben ser aadidos tan pronto
como el lugar que se acaba de observar cumpla con los criterios. Algunos investigadores han
informado de que ha llegado a tamaos de muestra incontrolables (Hanselman et al, 2003; Kimura y
Somerton, 2006). Thompson (2006) ha ampliado recientemente los criterios de parada permisibles
para un mayor control sobre la evolucin de la muestra. En particular, la nueva metodologa permite
al investigador asegurar un tamao de muestra fijo. Sin embargo, el procedimiento puede ser
computacionalmente intenso.
1.3.3.2 Diseos muestrales para la estimacin de la abundancia animal
Estos diseos pretenden estimar el nmero de individuos cuando se trabaja con poblaciones de
animales salvajes cerradas, es decir, no se producen incorporaciones o traslados de la poblacin
durante el perodo de observacin. Entre ellos tenemos:
-
Mtodos de marca/recaptura
18
Cambio promedio durante varios perodos de tiempo: puede hacer referencia a la tasa de
cambio o tendencia en un lugar (en oposicin al cambio o tendencia regional).
19
20
en la regin inspeccionada, teniendo en cuenta que en este tipo de muestreo se asume que los
animales se distribuyen uniforme e independientemente en la regin de estudio.
a
A
(2.1)
Si las localizaciones de los grupos son independientes y se piensa en el suceso grupo que est en
la regin inspeccionada como un xito, entonces el nmero de grupos en la regin inspeccionada,
n, es una variable aleatoria binomial con parmetros N y c , cuya funcin masa de probabilidad
viene dada por:
N n
c (1 c ) N n
f n, N, c
n
(2.2)
N n
c (1 c ) N n
L N
n
(2.3)
n
nA
N
c
a
(2.4)
21
N 1,96 se N , N 1,96 se N
Sin asumir normalidad tambin se pueden calcular intervalos de confianza al 95% para N utilizando
que n sigue una distribucin binomial de parmetros N y p. En esta situacin se pueden construir
intervalos de confianza exactos, intervalos de confianza de la verosimilitud maximizada (profile
likelihood) o intervalos de confianza obtenidos a partir de un bootstrap paramtrico (ver apartado 3
del Anexo para ms informacin sobre la tcnica de remuestreo bootstrap). Todos ellos se basan en
el modelo de estado de ecuacin (2.3) con c =
a
.
A
Estimacin no paramtrica
Si se aplica un bootstrap no paramtrico para remuestrear las unidades del diseo (bandas en este
caso), no es necesario asumir que las localizaciones de los animales son independientes. Esta
tcnica se puede utilizar de formas distintas. Por ejemplo, podemos asegurarnos que cada muestra
bootstrap muestree aproximadamente la misma proporcin de la regin de estudio que la muestra
original o alternativamente, podemos asegurarnos que todas las muestras tengan el mismo nmero
de bandas que la muestra original. Este ltimo procedimiento es ms simple e involucra los
siguientes pasos:
1.
2.
ni
Se calcula el EMV para la muestra i: N i
, donde ni es el nmero total de grupos de
ci
ai
.
y se almacena N
i
A
3.
Los pasos 1 y 2 se repiten B veces, donde normalmente B podra estar entre 400 y 2000.
4.
como sigue:
Se calcula la media y la varianza de los B N
i
B
N b
N i
i 1
N
B
Va r b
i 1
N b
(2.5); (2.6)
B 1
22
5.
( j ) , N(k )
donde
, respectivamente.
k-simo mayores N
i
, usualmente se utiliza ms que la media
La estimacin puntual basada en los datos originales, N
) se estima por Va
. La Var (N
).
r b (N
bootstrap, N
b
b
23
Todos los animales tienen la misma probabilidad de ser capturados o detectados. Esta
probabilidad vale p y es desconocida.
2.
A partir del primer estudio la nica parte de los datos til es el nmero de detecciones, n, pero no
hay forma de saber si este nmero representa una gran proporcin de una baja abundancia ( p
grande y N pequeo) o una pequea proporcin de una gran abundancia (p pequeo y N grande).
Lo que s est claro es que no se pueden estimar los dos parmetros desconocidos N y p con una
sola parte de los datos (n).
Las hiptesis sobre el modelo de estado anteriores llevan a una funcin de verosimilitud binomial de
dos parmetros N y p. Por tanto, para poder utilizar el mtodo de mxima verosimilitud y encontrar
los nicos N y p ms probables, dado un nmero de detecciones, n, se van a necesitar datos
adicionales que pueden proceder de algn estudio adicional y/o hiptesis adicionales.
24
Este mtodo implica examinar la regin de estudio completa y eliminar un nmero conocido de
animales en despus del primer estudio. A continuacin, la regin es estudiada por segunda vez,
manteniendo constante la probabilidad de deteccin. El tamao de la reduccin del nmero de
detecciones entre la primera y la segunda vez que se realiza el estudio contiene informacin sobre
N (y la probabilidad de deteccin). Por ejemplo, si el nmero de detecciones es prcticamente el
mismo en las dos ocasiones en las que se examina la regin, a pesar de haber eliminado un gran
nmero de animales cada vez, esto sugiere que el nmero de animales eliminado era una
proporcin insignificante del nmero total. Por tanto, el tamao de la poblacin total debe de ser
grande.
Para ilustrar este hecho se van a usar los datos de la poblacin de St. Andrews. Supongamos
entonces que un primer observador elimina los 64 animales que detecta. De los animales restantes,
33 fueron detectados por un segundo observador. Ahora la informacin que se tiene sobre los datos
es n1 = R2 = 64 y n2 = 33, donde R2 denota el nmero total de eliminaciones al inicio del segundo
estudio.
La nueva informacin sobre los datos n2 = 33 nos dice que si los dos observadores vieran
exactamente la misma proporcin de la poblacin presente en el momento de sus estudios,
entonces el nmero de animales presentes en el momento en el que se realiza el segundo estudio,
N2, debe ser
33
64
primer estudio (el cual se denota por N1 slo N). Esto es:
N2 =
33
N
64
Tambin se sabe que al comienzo del segundo estudio hay 64 animales menos, luego se tiene que:
33
N = N-64
64
=
Resolviendo esta ecuacin para N se obtiene la estimacin N
(64) 2
= 132 (por el entero ms
64 33
=
N
n12
n 1 n 2
(2.7)
25
Figura 3
2.
Asumir que ambos observadores vieron exactamente la misma proporcin de los animales
presentes.
Aunque (2) no asume que se conoce la proporcin, esta hiptesis es todava fuerte y difcil de creer.
Una hiptesis ligeramente ms creble es que los dos observadores son igual de buenos en media.
Esto es, se asume que para los dos observadores la probabilidad de deteccin, p, es la misma
aunque en algn estudio particular, el primero podra detectar una proporcin ms alta que el
segundo, o viceversa. Esta hiptesis es la base del mtodo de eliminacin simple con dos muestras.
2.2.1.2 Estimacin mximo verosmil mediante el mtodo de eliminacin simple
Supongamos que para un estudio dado se asume que:
1.
2.
Entonces, a partir de un solo estudio la verosimilitud para N y p viene dada por la ecuacin:
N n
p (1 p ) N n
L N n, p
n
(2.8)
26
Las detecciones (capturas) son independientes cada vez que se realiza un estudio.
4.
L(N, p n, R )
L(N, p n s , R s )
s 1
N s ns
p (1 p ) Ns ns
ns
s 1
(2.9)
p
n
1
(1 p )S y
N
n
S
(N R
(2.10)
s 1
donde n es el nmero total de detecciones en las S veces que se realiza el estudio. Es fcil
comprobar que el EMV de N del mtodo de eliminacin simple con dos muestras es idntico al
estimador construido de forma intuitiva de la ecuacin (2.7) y que el correspondiente EMV de p es:
n1 n2
n1
(2.11)
Es evidente que el estimador del mtodo de eliminacin con dos muestras falla cuando n2 n1 ya
que la probabilidad p no puede ser negativa; tampoco puede ser cero (lo cual ocurre cuando
n2 n1 ). Este fallo puede ocurrir incluso verificndose todas las hiptesis del modelo y constituye
una limitacin del mtodo. Otra consideracin a tener en cuenta es que es probable que no
produzca buenas estimaciones cuando la probabilidad de deteccin p es pequea. Adems en el
caso de que la poblacin sea heterognea las estimaciones tendern a ser negativamente sesgadas
ya que los animales que tienen ms posibilidad de ser capturados tendern a ser eliminados primero
y las probabilidades de deteccin de los animales no eliminados tienden a hacerse ms pequeas
despus de cada proceso de eliminacin.
2.2.1.3 Estimacin por intervalos
Intervalo de confianza por aproximacin normal
27
En la situacin en la que nos encontramos se sabe que toda la incertidumbre surge del proceso de
observacin, por lo que las estimaciones de la varianza y las estimaciones por intervalos de
confianza solo estn basadas en el modelo de observacin, que se define como el producto de
funciones de densidad binomiales (ecuacin 2.9). Seber (1982, pg. 312) da las siguientes
:
y p
expresiones para las varianzas asintticas de N
Var N
Var p
N (1 q S )q S
(2.12)
(1 q S ) 2 ( pS ) 2 q S 1
(qp ) 2 (1 q S )
N q(1 q S ) 2 ( pS ) 2 q S
(2.13)
donde q = 1-p.
Como ni N ni p se conocen las varianzas pueden ser estimadas sustituyendo en estas ecuaciones N
y los intervalos de confianza se pueden construir asumiendo que tanto N
y p
como
y p por N
se distribuyen normalmente, luego se definen por:
p
N 1,96 se N , N 1,96 se N
p 1,96 se N , p 1,96 se N
Intervalo de confianza de la verosimilitud maximizada (profile likelihood)
Hasta ahora se han estudiado los intervalos de confianza de la verosimilitud maximizada con un
parmetro desconocido. En este caso la verosimilitud maximizada coincide con la verosimilitud. La
verosimilitud del mtodo de eliminacin simple implica dos parmetros desconocidos N y p.
La verosimilitud maximizada para N es la funcin de verosimilitud evaluada en N y en un valor
particular de p que se puede calcular a partir de N. As pues, para un N dado, el valor de p se denota
N y va a ser el que maximice la verosimilitud para N.
por p
p N
n1 n 2
2N n1
(2.14)
28
diseo muestral de este mtodo consiste en investigar la regin de estudio por completo, as que
hay una nica unidad muestral, la regin completa. En consecuencia, un bootstrap no paramtrico
simple que utiliza a esta como unidad de remuestreo no se debe usar ya que reproducir los datos
originales todo el tiempo. Por tanto, la nica fuente de variacin se debe a la aleatoriedad en el
proceso de observacin y para capturarla se puede usar un procedimiento bootstrap que obtiene
muestras a partir de una muestra original utilizando el modelo ajustado al proceso de observacin.
As pues, si se conocen N y p, entonces se podra simular un gran nmero de ensayos en el
ordenador (generando muchos pares de valores n1 y n2) y luego calcular las correspondientes
estimaciones de N. Sin embargo, ni N ni p se conocen, por lo que para calcular un intervalo de
confianza para N al 95% se va a utilizar el mismo procedimiento que se ha descrito antes, slo que
, en lugar de N y p. Las estimaciones bootstrap de N se ordenan y se
y p
se considerarn N
. La nica diferencia
estimaciones generando B muestras a partir de una poblacin de tamao N
es que ahora se usa un mtodo distinto para generar las muestras.
29
Supongamos por tanto que se van a llevar a cabo tres estudios de forma que el primero lo realiza un
nico observador (observador 1), el segundo lo realiza un equipo de dos observadores
(observadores 2 y 3) y el tercero lo realiza un equipo formado por 5 observadores (observadores 4,
5, 6, 7 y 8). Sea l s el nmero de personas que forman un equipo en el estudio s, luego l1 = 1, l2 = 2
y l3 = 5. En esta situacin se espera que el nmero de animales capturado por los dos observadores
sea mayor que el capturado por uno solo, pero inferior al capturado por los cinco. Esto se puede
comprobar en la Figura 4, que muestra los animales detectados por cada uno de los tres equipos
frente al tamao del equipo ( l s ).Tngase en cuenta que no se han eliminado animales por ningn
equipo.
Figura 4
p l s = 1- exp l s
(2.15)
30
La Figura 4 muestra la funcin de deteccin ajustada (la que est ms prxima a los puntos) junto
con otros dos ejemplos de funciones de deteccin con la misma frmula funcional pero diferentes
valores de los parmetros.
Hasta este momento no se han llevado a cabo eliminaciones de animales. En la prctica esta
situacin no se da y lo comn es que el mtodo involucre la eliminacin de todos los animales
detectados (por ejemplo, pesca para el consumo, caza, etc.). As pues, si hacemos que los tres
equipos de observadores del ejemplo eliminen los animales que detectan, el nmero de detecciones
de los animales restantes es muy distinto al de la Figura 4 (ver Figura 5).
Figura 5
A pesar de que se doble el esfuerzo cada ocasin que se realiza el estudio, el nmero de
detecciones cae de una ocasin a la siguiente. La captura por unidad de esfuerzo (ns/ls) (CPUE) cae
drsticamente entre ocasiones como muestra la Figura 6. Esto nos indica que el tamao de la
poblacin va disminuyendo sustancialmente de una ocasin a otra ya que una proporcin sustancial
de la poblacin restante se ha eliminado en cada ocasin.
Figura 6
31
L(N, n, R )
Ns
p( l s ) ns (1 p(l s ))Ns ns
n
s
s 1
(2.16)
p l s .
p l s = 1 (1 ) ls puede
ser apropiada. En aplicaciones de pesca, donde ls podra ser el tiempo empleado en pescar, se usa
a menudo
aproximacin lineal
p l s l
32
1.
Las variables relevantes relativas a los animales toman un nmero finito de valores
conocidos (muy a menudo slo toman uno de dos valores).
2.
Aunque este mtodo involucra variables relativas a los animales, no incorpora heterogeneidad en las
probabilidades de deteccin debida a estas, es decir asume que estas diferencias no le afectan a la
probabilidad de deteccin.
Para este mtodo, un estimador de la abundancia con dos muestras se construye como sigue:
Sea x la variable sexo del animal, sea Ns(x) el nmero de animales de sexo x en la poblacin al
inicio del estudio s, y sea Ns el tamao de la poblacin al inicio del estudio s. Similarmente, sea R2(x)
el nmero de animales de sexo x que fueron eliminados al comienzo del segundo estudio y sea R2 el
total de animales eliminados al comienzo del segundo estudio. Entonces la proporcin de machos
en la poblacin en el segundo estudio ( 2 (1) N 2 (1) N 2 ) se puede expresar como:
2 (1)
1(1)N1 R 2 (1)
N1 R 2
(2.17)
R 2 (1) R 2 2 (1)
1(1) 2 (1)
(2.18)
1(1) y 2 (1) no se conocen pero si los machos y las hembras son igualmente captables, se
pueden estimar razonablemente utilizando la proporcin de machos en la muestra cada vez que se
realiza el estudio, esto es:
1(1)
n1(1)
;
n1
2 (1)
n 2 (1)
n2
(2.19)
R (1) R 2 2 (1)
N 2
1(1) 2 (1)
(2.20)
Ntese que en este caso no se ha hecho ninguna hiptesis sobre las probabilidades de deteccin en
las distintas ocasiones en las que se realiza el estudio ni tampoco se requiere medir o conocer el
33
esfuerzo realizado en cada estudio. Lo nico que se ha asumido es que los dos tipos de animales
(machos y hembras) eran igualmente captables.
Para ilustrar el mtodo vamos a considerar los datos del ejemplo de St. Andrews, teniendo en
cuenta que en el primer estudio va a llevar a cabo la inspeccin un nico observador (el observador
1) y en el segundo van a ser dos (los observadores 2 y 3). Asumiendo que todos los animales son
igualmente captables, en el primer estudio se detectan n1(0) = 16 hembras y n1(1) = 48 machos.
Supongamos ahora que los 48 machos fuesen eliminados (R2(0) = 0; R2(1) = 48). En el segundo
estudio se detectaron n2(0) = 26 hembras y n2(1) = 38 machos previamente no detectados. Con
estos datos se estima que la proporcin inicial de machos en la poblacin y la proporcin de machos
en el segundo estudio son:
1(1) =
48
0.75 ;
64
2 (1) =
38
0 .6
64
48 48 38
=
N
48 38
64 64
64 125
Va r N
donde Va r s (1)
2
s Var
s (1)
s 1
( 1 (1) 2 (1)) 2
1086.5060 1087
ns
1 (1)(1 1 (1))
1
para s = 1, 2.
( n s 1)
N s
(2.21)
(2.22)
34
estudio s viene dado por el vector R s , mientras que el nmero de animales de cada tipo que
permanece en la poblacin en ese mismo estudio viene dado por el vector N s .
Se verifica que N s = N 1 - R s , o lo que es lo mismo:
N s ( x 1 ) N1( x 1 ) Rs ( x 1 )
N ( x ) N ( x ) R ( x )
s K 1 K s K
(2.23)
ns ( x 1 )
ns ( x 2 )
ns =
(2.24)
n ( x )
s K
Con esta notacin, la verosimilitud total para el mtodo change-in-ratio se puede escribir como:
L(N, n, R )
L(N, p n
s 1
s ,R s
(2.25)
donde
L(N, p n s , R s ) =
Ns ( x )
p(l s ) ns ( x ) (1 p(l s )) Ns ( x )ns ( x )
n s ( x )
(2.26)
por algn medio desconocido o el nmero detectado en cada estudio se especifica por adelantado.
En ambos casos, los ns no contienen informacin til sobre N y resulta apropiado tratarlos como fijos
(no como variables aleatorias) y trabajar con la verosimilitud condicionada dado ns, con s = 1,, S.
As pues, la ecuacin (2.25) puede factorizarse como sigue:
35
Ns
L
n
s 1 s
ns
Ns ns
p(l s ) (1 p(l s ))
P (n s N s )
s 1
donde ns =
El trmino
P (n
n s ( x ) y Ns =
P (n
s 1
s 1
Ns (x )
x n (x)
s
Ns
n s , N s )
(2.27)
Ns (x ) .
s 1
Cuando x es un escalar que solamente toma dos valores (por ejemplo, x = 0 para hembras y x = 1
para machos), esta probabilidad es el producto de densidades hipergeomtricas pero cuando toma
ms de dos valores, la apropiada distribucin hipergeomtrica multivariante sustituye a la
distribucin hipergeomtrica. Si se considera como una funcin de N, esta es la verosimilitud
condicionada de N, dado ns (s = 1,, S).
Ntese que cuando S = 2, la ecuacin (2.20) es el estimador mximo verosmil condicionado.
36
37
Si se tienen datos de un nico estudio, la abundancia no se puede estimar sin establecer fuertes
hiptesis sobre la probabilidad de captura. Por ejemplo, en el caso del muestreo por parcelas se
asumi que la probabilidad de captura era conocida. Estas hiptesis pueden ser bastante
razonables o no dependiendo de la aplicacin, de manera que cuando no se establecen los mtodos
de eliminacin o los de marca-recaptura pueden ser tiles.
En el caso de los mtodos de marca-recaptura los animales continan en la poblacin despus de
haber sido capturados inicialmente, proporcionando as informacin sobre la probabilidad de
captura. La base de estos mtodos es realmente simple. Si los animales que se capturan en un
estudio son los animales tpicos de la poblacin, estos constituyen una subpoblacin representativa
de tamao conocido. La proporcin de animales de esta subpoblacin marcada que se captura en
un estudio posterior es un estimador obvio de la probabilidad de captura de un animal, p. As pues,
aplicando esta estimacin a la poblacin entera se puede estimar la abundancia, N. Todos los
mtodos de marca-recaptura confan fuertemente en que la subpoblacin capturada es
representativa de toda la poblacin, lo cual puede ser un problema.
Los animales pueden ser capturados y marcados segn una amplia variedad de formas, de hecho,
la captura podra ser una captura fsica o simplemente una deteccin (visual, por satlite, radio u
otros medios), mientras que el marcado podra involucrar realizar una marca fsica al animal,
registrar una marca natural, por ejemplo, las rayas de los tigres o las colas de las ballenas
jorobadas, o una marca subjetiva al observador segn la colocacin del animal en un momento dado
(como en el ejemplo de la poblacin de St. Andrews).
Los diferentes tipos de marca contienen distintos tipos de informacin:
1.
Algunas marcas no contienen informacin sobre la historia de la captura previa, sino que
simplemente indican que el animal ha sido capturado por lo menos una vez. Este sera el
caso en el que los animales que se capturan inicialmente se marcan con un punto rojo.
2.
Algunas marcas informan sobre cuando fue capturado el animal. Este sera el caso en el
que se usan distintos colores para marcar a los animales cada vez que se lleva a cabo un
estudio.
3.
Otras permiten que los individuos sean reconocidos. Este es el caso en el que se usa un
color diferente junto con un nico nmero para marcar cada animal capturado cada vez que
se realiza el estudio.
Idealmente todas las marcas deberan ser del tipo (3) ya que son las que contienen informacin ms
til para estimar la abundancia y permiten realizar anlisis ms sofisticados aunque en este captulo
nicamente nos vamos a fijar en el anlisis de las marcas de tipo (1).
Antes de analizar este mtodo es necesario establecer la notacin que se indica a continuacin.
38
2.3.1 Notacin
Sea xs la variable que indica si el animal es marcado o no en el estudio s. Esta toma el valor 1 si es
marcado y 0 si no lo es. Sea Ns el nmero de animales al comienzo del estudio s. De estos, Ns(1)
estn marcados (es decir, se tiene que xs = 1) y Ns(0) no. Para simplificar se denota al nmero de
animales marcados al inicio del estudio s, Ns(1), por Ms y al nmero no marcado por Us, de donde se
tiene que Ms + Us = Ns.
Por otro lado, el nmero de animales marcados que son detectados (capturados) en el estudio s es
ns(1) y el nmero de animales detectados que no estn marcados es ns(0). De igual forma que antes
para simplificar denotamos ns(1) y ns(0) por ms y us respectivamente. De esta forma, ms + us = ns.
La notacin general utilizada para denotar la probabilidad de capturar un animal del tipo x en el
estudio s es p(x, s), pero en este captulo se va a usar una notacin abreviada de forma que cuando
la probabilidad de captura solo dependa del estudio que se realiza y no del tipo de animal se
denotar por ps, cuando solo dependa de si el animal ha sido marcado o no, se denotar por pm y pu
respectivamente y cuando no dependa ni del tipo de animal ni del estudio realizado se denotar por
p.
p 2
m2 34
=
0,53125
M 2 64
Como el segundo observador captur en total n2 = 67 animales, entonces se espera que los 67 sean
39
=
N
n2
n
n n
2 1 2
p 2 m2
m2
n1
(2.28)
n n (n m2 )(n 2 m 2 )
Va r (N ) 1 2 1
m 23
(2.29)
Similarmente, se puede estimar la probabilidad de que el primer observador capture un animal por
p 1
m 2 34
=
0,507 . Por tanto, con dos estudios y los datos que describen qu animales se
n 2 67
capturaron en cada uno, se pueden estimar las probabilidades de captura (p1 y p2) y la abundancia
N. Debido a que el marcado de los animales la primera vez que se capturan genera una
subpoblacin de n1 = u1 = M2 animales marcados, la segunda ocasin en la que se lleva a cabo la
captura se estudia una subpoblacin de tamao conocido (M2) para la cual slo hay un parmetro
desconocido (p2). Adems, acerca de esta subpoblacin se tiene una parte relevante de los datos
que es el nmero de animales recapturados, m2, lo cual es suficiente para estimar un parmetro
p 2
m2
. Ahora si los animales marcados y los no marcados son igualmente detectables,
M2
entonces la estimacin de p2 se puede aplicar a toda la poblacin, y usndola con todos los datos de
la segunda ocasin de captura (n2), se puede estimar N.
Como el nmero de animales marcados en la segunda ocasin de captura (m2) puede ser cero, el
no tiene una varianza finita. Es por esta razn por lo que Chapman (1951) propuso el
estimador N
siguiente estimador modificado:
=
N
(n1 1) (n 2 1)
1
m2 1
(2.30)
Ny
un estimador aproximadamente insesgado de su varianza (Seber, 1970 y Wittes, 1972) viene dado
por:
Va r (N )
(2.31)
40
Todos los animales son igualmente capturables en cualquier estudio, aunque la probabilidad
de captura puede cambiar de un estudio a otro, por ejemplo, puede ser p1 en el estudio 1 y
p2 en el siguiente.
2.
Las detecciones de los animales son sucesos independientes, tanto dentro de un estudio
como entre ellos. Es decir, el hecho de que un animal sea capturado en un estudio no
afecta a la probabilidad de que cualquier otro sea capturado en el mismo y el hecho de que
un animal sea capturado en un estudio no afecta a la probabilidad de que sea capturado en
otro.
A continuacin derivamos una verosimilitud para N, p1 y p2, dado el nmero de animales marcados
en la poblacin.
Primera ocasin de captura
Como en el primer estudio los animales son capturados independientemente con igual probabilidad
p1,
la
probabilidad
de
capturar
N n
p (1 p ) N n
L N n, p
n
n1
animales
viene
dada
por
la
ecuacin
Es decir, la probabilidad de capturar n1 = u1 animales no marcados la primera vez dado que hay U1 =
N animales en la poblacin, es:
U
P1 1 p1u1 (1 p1 )U1u1
u1
(2.32)
41
Si se considera esta expresin como una funcin de N = U1 y p1, esta es la funcin de verosimilitud
para la primera ocasin de captura.
M
P2m 2 p2m2 (1 p2 )M2 m2
m2
(2.33)
Dado m2, esta es una funcin de verosimilitud con un solo parmetro desconocido, p2 (recordemos
que M2 se conoce por ser el nmero de animales marcados en el primer estudio). Luego, a partir de
m2
.
M2
U
P2u 2 p2u2 (1 p2 )U2 u2
u2
(2.34)
Dado u2, esta es una funcin de verosimilitud con dos parmetros desconocidos, p2 y U2. Por tanto,
utilizando los datos de animales no marcados, u2, no se pueden estimar los dos parmetros. En este
caso lo que se puede hacer es utilizar la estimacin de p2 obtenida anteriormente y estimar U2 a
partir de la verosimilitud para animales no marcados. De esta forma se puede estimar tanto p2 y N =
M2 + U2.
Alternativamente, se pueden combinar las ecuaciones (2.33) y (2.34), y estimar p2 y N de un solo
golpe a partir de la verosimilitud:
U2
M2
p2 2 (1 p2 )U2 u2
p2 2 (1 p2 ) M2 m2
L2 nica = P2u P2m =
u
m
2
2
u
(2.35)
42
Por otro lado, se puede estimar N, p1 y p2 simultneamente a partir de la verosimilitud total para
ambas ocasiones de captura, dados los datos observados u1, m2 y u2. La verosimilitud total se puede
expresar como:
2
L2
Psu Psm
s 1
donde P1m
Us
u
s 1
M s ms
ps (1 ps ) Ms ms
m
s
p sus (1 ps )Us us
(2.36)
1 por conveniencia.
La ecuacin (2.36) es la verosimilitud de una multinomial con cuatro elementos donde el estimador
mximo verosmil es el estimador de Petersen.
Hasta ahora, las ecuaciones de verosimilitud desarrolladas y el estimador de Petersen asumen que
en cualquier estudio todos los animales son igualmente capturables. Sin embargo, la poblacin de
St. Andrews que se est utilizando a lo largo del trabajo como ejemplo se sabe que es heterognea,
con lo cual esta suposicin no parece muy razonable. Al igual que en el mtodo de eliminacin, el no
considerar la heterogeneidad cuando realmente est presente provoca que la estimacin de la
abundancia mediante el mtodo de marca-recaptura simple sea negativamente sesgada. Ntese
que si los animales marcados y los no marcados son igualmente capturables, entonces es razonable
usar la proporcin de animales marcados que son recapturados en el segundo estudio como un
estimador de la probabilidad de captura de animales no marcados. Pero si la poblacin es
heterognea, los animales ms capturables tendern a ser capturados y marcados primero y las
probabilidades de captura de los animales no marcados tendern a hacerse cada vez ms
pequeas despus de cada ocasin de captura (exactamente el mismo fenmeno que caus el
sesgo en el mtodo de eliminacin). No obstante, segn se deduce de estudios de simulacin, el
hecho de disponer de informacin sobre las recapturas hace que la varianza del estimador sea ms
pequea y los intervalos de confianza sean mejores.
p2(N)
n n2
p(N) = 1
2N
(2.37)
43
Va r (N )
N z Va r (N ) , N z Va r (N )
1(1 p 2 ) , (1 p
1 ) p
2 , p
1p
2 y
, p
igual a p2, se tiene una multinomial con parmetros N
1 (1 p1 )(1 p 2 ) .
As pues, si se generan B muestras bootstrap y para cada una de ellas se calcula una estimacin del
*
*
( j ) , N(k )
donde
j (B 1) 0,025 y
* (i =
indican los j-simo y k-simo mayores N
i
1, , B ) respectivamente.
El procedimiento bootstrap no paramtrico es muy similar en cuanto a que tambin se calculan B
. La nica
estimaciones usando estudios generados a partir de una poblacin de tamao N
diferencia es que ahora se remuestrean las historias de captura con reemplazamiento. Una historia
de captura es un vector fila de ceros y unos con un cero en la posicin s si el animal no fue
capturado en el estudio s, y un uno si s lo fue. En nuestro ejemplo con dos muestras, los u1 m2
animales capturados en el primer estudio tienen una historia de captura (1,0), los u2 animales
capturados en el segundo estudio tienen una historia de captura (0,1), los m2 capturados en ambos
44
Para generar un estudio se toma una muestra aleatoria simple, con reemplazamiento, a partir de
animales y se anotan sus historias de captura. A partir de estas se pueden calcular n1* , u 2* y
N
* . De esta forma, el intervalo de confianza al 95% para N se
m 2* para cada estudio y por tanto, N
construye de la misma forma que en el caso paramtrico.
El estimador mximo verosmil (EMV) para un estudio con dos procesos de captura ( S = 2) se
formula de forma sencilla (vase ecuacin (2.28)). Cuando S = 3, tambin se puede expresar
explcitamente (Seber, 1982, pg. 132), pero para S > 3 no se tiene ninguna expresin explcita del
EMV y se tiene que maximizar la verosimilitud.
La funcin de verosimilitud para estudios de captura mltiples no es ms que una extensin de la
funcin de verosimilitud de la ecuacin (2.36), solo que ahora se tienen en cuenta ms de dos
procesos de captura, concretamente S procesos. Esto es:
S
LS
Ls
s 1
Psu Psm
s 1
Us
u
s 1
M s ms
ps (1 ps ) Ms ms
m
s
psus (1 ps )Us us
(2.38)
Estas verosimilitudes sirven para ver si un animal capturado ha sido capturado y marcado antes o
no, pero no sirven para ver en qu estudio fue capturado el animal o para conocer su identidad. Por
ejemplo, si al ser capturado el animal se marcase con un punto rojo, al verlo de nuevo slo se puede
decir que ya ha sido capturado antes, pero no se sabe nada sobre el estudio en el que se captur ni
sobre su identidad. En estos casos las verosimilitudes difieren un poco de la de la ecuacin (2.38)
pero de una forma bastante sencilla.
Supongamos por ejemplo, que las marcas podran ser tales que a partir de ellas se pudiese conocer
el estudio(s) en el que el animal fue previamente capturado. Este sera el caso en el que al animal
se le va marcando con un punto de diferente color cada vez que es recapturado. De esta forma se
puede conocer la historia de captura del animal y la verosimilitud (2.38) pasara a ser:
Ls
N s (w s ) n2 ( x 2 )
N (w ) n ( w )
p
(1 ps ) s s w w
n s (w s ) s
ws
(2.39)
donde ws es una de las 2s-1 historias de captura posibles de animales marcados en la poblacin al
inicio del estudio s y
ws
nmero de animales con historia de captura ws, y n s (w s ) es el nmero de estos que son
capturados.
45
Por otro lado, el proceso de marcado tambin podra ayudar a reconocer individualmente a animales
capturados anteriormente en estudios posteriores. Para conseguir esto se podra pegar un nmero
concreto a cada animal capturado. En este caso la ecuacin (2.38) pasara a ser:
Ls
Ms
w si
s
(1 ps )1w si
(2.40)
i 1
donde wsi es una variable indicadora de la captura, la cual toma el valor 1 si el animal i fue capturado
en el estudio s y cero en otro caso.
Pollock (1974) y Otis et al. (1978) desarrollaron un til esquema de clasificacin para modelos de
marca-recaptura en poblaciones cerradas, que incorpora tres fuentes bsicas de heterogeneidad en
las probabilidades de captura. Los modelos se van a denotar por Mm, donde m indica el tipo de
heterogeneidad. As pues, incluyendo un modelo sin heterogeneidad, los modelos bsicos son los
siguientes:
Mh : Este modelo solo permite que haya heterogeneidad entre los animales, es decir, los
animales se asume que tienen diferentes probabilidades de captura, pero estas
permanecen constantes a lo largo de todos los procesos de captura. El subndice h indica
heterogeneidad.
Ntese que si se combinan las tres fuentes de heterogeneidad de varias formas se pueden construir
otros cuatro modelos ms complicados: Mth, Mtb, Mbh y Mtbh.
As por ejemplo, si consideramos los modelos M0, Mt, Mb y Mtb la nica diferencia entre ellos est en
cmo modelizar la funcin de deteccin o captura, p. La probabilidad de capturar un animal i en el
momento de captura s depende tanto de variables relativas al animal, xs, como de las variables
relativas al estudio, ls. La nica variable relativa a los animales que se considera aqu es la historia
de captura del animal i en el momento s, wsi. Por tanto, la funcin de captura ms general que se
46
considera en este captulo para el animal i en el momento s puede escribirse como p(wsi, ls). Las
funciones de captura para cada modelo vienen dadas por:
M0 : p(wsi, ls) =
estimado.
Mb : p(wsi, ls) = p(wsi) = p(csi) tal que csi = 1 si al inicio del proceso de captura s el animal i ha
sido marcado , y csi = 0 si no. Una frmula de dependencia obvia de la probabilidad de
captura de wsi es p(wsi) = csi , en cuyo caso ( 0 , 1 ) ' es el vector de parmetros a
estimar pero dependiendo de la aplicacin otras frmulas tambin pueden ser apropiadas.
Mtb : p(wsi, ls) = p(csi, ls) depende tanto de la variable relativa al animal (csi) como de la
variable relativa al estudio (ls = s ). Una frmula til para la dependencia de la
probabilidad de captura de estas dos variables es la logstica:
p(wsi, ls) =
e (c csi )s
1 e (c csi )s
(2.41)
Las hiptesis que se han establecido en este mtodo para obtener la estimacin de la abundancia
animal son:
Hiptesis 1.- La probabilidad de captura en el modelo M0 es constante, en el modelo Mt depende
solo del momento de la captura, en el modelo Mb es constante excepto que los animales marcados
47
sean ms/menos capturables que los no marcados y en el modelo Mtb depende del momento de la
captura y de si un animal ha sido capturado o no.
La violacin de esta hiptesis hace que todos los estimadores sean sesgados. La probabilidad de
captura se puede ver afectada por la presencia de heterogeneidad entre los animales. Esta
heterogeneidad no ha sido modelizada y puede hacer que los estimadores sean muy sesgados, no
obstante incluso si la heterogeneidad no es un problema, los estimadores pueden ser
sustancialmente sesgados.
Hiptesis 2.- Los animales son capturados independientemente unos de otros.
Si se viola esta hiptesis los intervalos de confianza basados en ella tienden a ser sesgados, cuando
usualmente son muy estrechos, y las estimaciones puntuales pueden ser sesgadas.
Hiptesis 3.- Las marcas no se pierden.
El efecto producido al violar esta hiptesis provoca un sesgo positivo en la estimacin de la
abundancia. Frecuencias de recaptura ms bajas que las causas por las que se pierden las marcas
se interpretan por los estimadores como si una fraccin de la poblacin ms pequea de la que
realmente era hubiera sido marcada. El mismo efecto ocurre cuando las marcas no son registradas
para algunos animales capturados incluso aunque estn todava en los animales.
48
Los mtodos relacionados con el muestreo de distancia involucran medir o estimar las distancias de
los animales detectados a partir de una lnea un punto. Los principales mtodos son el muestreo
de transectos de lnea y el muestreo de transectos de punto (algunas veces llamado Variable
Circular Plots). Ambos son extensiones del muestreo por parcelas, en los cuales slo se hacen
recuentos incompletos de animales dentro de la regin inspeccionada. La estimacin de la
abundancia a partir de estos mtodos no precisa de ms de un estudio, ya que se considera una
fuerte hiptesis sobre la probabilidad de deteccin: todos los animales que son localizados en la
lnea en el punto son detectados con certeza y a medida que la distancia a partir de la lnea el
punto es mayor a x = w, la probabilidad de deteccin, p(x), disminuye de una forma suave.
El muestreo de transectos de lnea es una extensin del muestreo de bandas. Supongamos que hay
u bandas, de forma que cada una tiene una anchura de 2w unidades (por tanto, a cada lado de su
u
lnea central hay una distancia w). Supongamos que la banda j tiene una longitud lj, con
= L.
j 1
Entonces la regin inspeccionada es de tamao a = 2wL. En el caso del muestreo por bandas si se
cuentan n animales en ellas, una estimacin de la abundancia animal viene dada por
n
N
a , sin
A
(Figura
49
Figura 7
Generalmente, el diseo muestral para este muestreo est formado por lneas o por una rejilla de
lneas sistemticas, colocadas aleatoriamente en la regin de estudio. Esta colocacin asegura que
los animales estn uniformemente distribuidos con respecto a sus distancias a la lnea. Adems, se
asume que todos los animales en muy cerca de la lnea son detectados, de modo que la
probabilidad de deteccin va a disminuir a medida que la distancia a partir de la lnea es superior a
w. Siempre que las principales hiptesis del mtodo se cumplan, los mtodos de transectos de lnea
son capaces de compensar la prdida de animales en la regin inspeccionada y dar estimaciones de
la abundancia insesgadas incluso cuando se pierde una gran proporcin de los animales de la
regin inspeccionada.
2.4.1.1 Estimacin mximo verosmil
Los mtodos de muestreo de distancia involucran tanto a modelos de estado como de observacin,
ya que la regin inspeccionada es bastante inferior a la regin de estudio y no todos los animales de
la regin inspeccionada son detectados. El motivo se debe a que la probabilidad de deteccin
depende de la distancia a la lnea y las posiciones de todos los animales respecto a sta no son
conocidas.
Por tanto, para establecer el muestreo de transectos de lnea en un marco de trabajo de
verosimilitud total, se necesita especificar un modelo de estado que modelice las localizaciones de
todos los animales o grupos de animales en el momento del estudio y un modelo de observacin
para el proceso de deteccin dentro de la regin inspeccionada.
Como en el muestreo por parcelas, si un grupo tiene la misma probabilidad de estar en cualquier
lugar de la regin de estudio de tamao A, entonces la probabilidad de que est dentro de la regin
inspeccionada de rea a, es
50
(x)
1
w
(2.42)
a 1
dx
A w
(2.43)
Esta ecuacin es la que modeliza el modelo de estado para un solo grupo de animales.
Por otro lado, la probabilidad de que un grupo sea detectado, dado que est situado en x es p(x),
siendo esta la base del modelo de observacin.
Supongamos que la probabilidad de deteccin de los animales dentro de la regin inspeccionada es
algn valor conocido, el cual se denota por E[p]. La probabilidad de que un animal est en la regin
inspeccionada es c
a
, as que la probabilidad de que un animal est en la regin
A
unos de otros, entonces la probabilidad de que n grupos sean detectados es una variable aleatoria
binomial de parmetros N y
N
( c E p ) n 1 c E p N n
n
L(N E p )
(2.44)
n
c E p
(2.45)
Esta verosimilitud y el EMV es idntico al del muestreo por parcelas cuando E[p] = 1. Sin embargo,
en realidad E[p] no se conoce, luego la verosimilitud tiene dos parmetros (N y E[p]) desconocidos
que no pueden estimar a partir del nico dato que se conoce, n. Se necesitan por tanto nuevas
hiptesis y/o nuevos datos para estimar N razonablemente.
La clave para estimar N a partir de los datos del transecto de lnea es estimar E[p], lo cual se
consigue a partir de las distancias perpendiculares a las detecciones. Para usar los datos contenidos
en las distancias perpendiculares observadas, necesitamos un modelo estadstico que muestre
cmo se generaron estas, aunque en primer lugar vamos a expresar E[p] en trminos del ancho de
banda efectivo o ms concretamente medio-ancho de banda efectivo (ver apartado 4 del Anexo).
Este ltimo se denota por
51
es igual al nmero
De este modo, la E[p] se puede definir como la proporcin de la regin inspeccionada que
efectivamente se estudia, esto es:
2 L
2 wL w
E p
(2.46)
Tanto E[p] como p(x) dependen de un vector de parmetros desconocidos que por abreviar no
se muestra explcitamente. Este vector est formado por parmetros asociados a variables relativas
al animal y al estudio.
Si se conociera el parmetro(s) de la funcin de deteccin se tendra la verosimilitud de la ecuacin
(2.44) y el EMV para N de la ecuacin (2.45). Claramente los datos de las distancias
perpendiculares contienen informacin sobre la funcin de deteccin: si el histograma de las
distancias detectadas baja rpidamente, la probabilidad de deteccin media es baja, mientras que si
permanece alto, la probabilidad de deteccin media tambin es alta. Es necesario por tanto,
considerar una verosimilitud que introduzca esta informacin, permitindose as estimar la funcin
de deteccin ( equivalentemente ). Nos referiremos a ella con el nombre de verosimilitud
condicionada, ya que est condicionada al nmero de animales detectados, n.
La probabilidad de que un grupo sea detectado en una banda concreta, dado que est en la
posicin x, es p(x). La funcin de densidad de las distancias perpendiculares, x, de los grupos de
animales en la banda es (x ) . Por tanto:
Pr x visto
0 Pr x visto ( x )dx
Pr x visto ( x )
p( x ) ( x )
w
p( x ) ( x )dx
p( x ) ( x )
E p
(2.47)
Esta es la funcin de densidad de x, dado que un grupo ha sido detectado y se denota por f(x). Si
los grupos son detectados independientemente, la funcin de densidad de las x distancias
f (x
i 1
E
p
f ( x i )
p( x ) ( x )
i
(2.48)
i 1
52
Cuando ( x ) =
1
, entonces:
w
L( ) =
p( x
(2.49)
i 1
Resumiendo se puede estimar , y por tanto la E[p] a partir de la ecuacin (2.48). Esta ltima
estimacin se puede usar en la ecuacin (2.44) y de este modo se estima N. Alternativamente, se
pueden combinar las ecuaciones (2.44) y (2.48) para obtener una verosimilitud total, y estimar N y
L(N )
N
1 c E p N n ( c ) n
n
L( ) =
p( x
) ( x i )
(2.50)
i 1
Esta es la verosimilitud total para los mtodos de muestreo de distancia en general. Cuando ( x )
1
, se tiene la verosimilitud total para los mtodos de transectos de lnea.
w
Para maximizar la verosimilitud con respecto a N y , se necesita usar una rutina de maximizacin
numrica. Si se pueden obtener las derivadas de ln(L) con respecto a N y , entonces el mtodo
de Newton-Raphson junto con un procedimiento de Marquardt pueden utilizarse.
EMV condicionado
. Se sabe que E p
E p
w
53
Por tanto, usando esta estimacin en lugar de E[p] en la ecuacin (2.44) y maximizando respecto a
N se obtiene:
n
n
nA
2
wL
2L
c E p
A w
(2.51)
N n
D
A
2L
(2.52)
c E[p].
E p
j 1
(2.53)
, as que utilizar el
w
estimador E p
proporciona el estimador de la abundancia Horvitz-Thompson-like:
w
n
a
Aw
(2.54)
el cual se reduce al estimador convencional del muestreo de transectos de lnea cuando la anchura
media del transecto es w y la longitud total es L (Buckland et al., 2001):
54
nA
N
2 L
donde
(2.55)
A
N
a
p x
(2.56)
i 1
Las probabilidades p(xi) se estiman a partir del modelo fijado para la funcin de deteccin, por lo que
el estimador Horvitz-Thompson-like viene dado por:
A
N
a
p x
i 1
(2.57)
estimador que es inestable si muchas de las probabilidades de deteccin estimadas son cercanas a
cero. Para evitar esto se puede truncar la distancia w, tal que
55
a tener en cuenta es que para obtener intervalos de confianza fiables, sera necesario tener un
diseo con al menos 15-20 lneas.
Este tipo de muestreo es una extensin de los conteos de puntos, los cuales son un caso especial
de muestreo por parcelas, en el cual las J parcelas son crculos de radio w. La regin inspeccionada
tiene un rea a = J w2. Si se asume que el nmero de todos los animales detectado en la regin
inspeccionada es n, entonces la estimacin de N viene definida como en el muestreo por parcelas
por:
nA
nA
N
a
Jw 2
En el muestreo de transectos de punto algunos de los animales que estn en la regin
inspeccionada se pierden y las distancias de los animales detectados a partir del punto se utilizan
para modelizar este elemento aadido.
As, el estudio de transectos de punto ms simple est formado por J puntos aleatoriamente
posicionados en la regin de estudio, o ms usualmente una rejilla sistemtica de J puntos
aleatoriamente superpuestos en la regin. El observador visita cada punto y registra la distancia de
deteccin, x, de cada animal detectado al punto. Todos los animales en muy cerca del punto se
asumen que son detectados y la probabilidad de deteccin se asume que disminuye a una distancia
a partir del punto superior a w.
2.4.2.1 Estimacin mximo verosmil
Al igual que en el muestreo de transectos de lnea, para definir un marco de trabajo para la
verosimilitud total se necesita especificar un modelo de estado para las posiciones de todos los
animales o grupos de animales en el momento del estudio y un modelo de observacin. La
diferencia esencial entre el muestreo de transectos de lnea y el de punto est en la funcin de
densidad de las posiciones de los animales que estn en la regin inspeccionada. En el caso de los
transectos de lnea, es razonable asumir que el nmero esperado de animales es el mismo para
todas las distancias a partir de la lnea en la regin inspeccionada. En el caso de los estudios de
transectos de puntos, el nmero esperado de animales aumenta a medida que aumenta la distancia
a partir del punto. Esto se debe a que el rea de la superficie del anillo o corona con centro en el
punto aumenta cuando nos alejamos de ste.
Los modelos de observacin para el muestreo de transectos de punto son los mismos que para el
muestreo de transectos de lnea. Si se asume un modelo de estado uniforme, en el cual un animal o
grupo de animales es igualmente probable que est en cualquier lugar de la regin de estudio de
56
. Por
tanto, el nmero esperado de grupos en una corona o anillo, que comprende el rea entre las
distancias (x, x + dx) y el punto, es proporcional al rea de la superficie de la corona. Para dx
pequeo este nmero es 2 xdx y de ah que la funcin de densidad de las distancias radiales del
animal o grupos de animales dentro de un crculo de radio w con centro el punto sea:
(x)
2x
2x
(2.58)
w2
La derivacin de una verosimilitud total para el muestreo de transectos de punto es idntica a la del
muestreo de transectos de lnea, excepto por el hecho de que ( x )
ecuacin E p
p( x ) ( x )dx
w 2
. Su sustitucin en la
da lugar a:
E p
donde 2
2x
p( x )
2x
dx
w 2
(2.59)
xp( x ) . Ntese que como en el muestreo de transecto de lnea p(x) y E[p] son
N
1 c E p N n ( c ) n
n
L(N; ) =
p( x
i 1
2x i
w2
(2.60)
de modo que para estimar N, se pueden emplear los mismos mtodos de maximizacin numrica
usados en el muestreo de transectos de lnea.
EMV condicionado
Se puede adoptar una estrategia similar a la del muestreo de transectos de lnea y condicionar la
verosimilitud al tamao muestral n. Considerando las ecuaciones (2.58) y (2.59) y sustituyendo en la
ecuacin (2.48) se tiene la verosimilitud condicionada:
57
L( ) =
( )
x p( x
i
(2.61)
i 1
Al igual que en el muestreo de transectos de lnea, esta verosimilitud se puede maximizar con
respecto a , obteniendo as las estimaciones mximo verosmiles condicionadas de los
parmetros de la funcin de deteccin. Esto nos da el EMV de
( ) , o
ms abreviadamente por .
Ahora se necesita estimar N. Si w es finito, la regin inspeccionada tiene rea J w2, donde J es el
nmero de puntos. Si dentro de ste rea se detectaron n animales podemos estimar N usando la
p de los estudios de transectos de punto, de modo que se
ecuacin (2.51) y la correspondiente E
tiene:
N c
(2.62)
w
y por tanto
n
n
nA
J
a
Jw
A w 2
A w 2
(2.63)
n
D
J
(2.64)
Esta es la aproximacin estndar para el muestreo de transectos de punto dada por Buckland et al.
(2001). Si se define
= 2 , entonces
es igual al nmero
. El rea efectiva
inspeccionada es J = J 2 .
58
nA
N
J
(2.65)
estimador que coincide con el estimador convencional del muestreo de transectos de punto.
Anlogamente, el estimador de la abundancia Horvitz-Thompson-like que utiliza las probabilidades
p se puede escribir como:
de deteccin estimadas de cada animal en lugar de la E
A
N
a
p x
i 1
(2.66)
2.4.3 Heterogeneidad
Las poblaciones de animales casi siempre son heterogneas y modelizar la heterogeneidad puede
ser difcil. Los mtodos de muestreo de distancia se basan en cambios en la probabilidad de
deteccin debidos a una variable relativa al animal. Dicha variable es la distancia que existe entre el
animal y la lnea el punto. Estos mtodos tratan y modelizan la heterogeneidad incorporando un
modelo de probabilidad (un modelo de estado) para la distribucin de la distancia en la poblacin, el
59
cual viene dado por la ecuacin (5.1) en el caso de estudios de transectos de lnea y por la ecuacin
(5.17) en el caso de estudios de transectos de punto.
En presencia de heterogeneidad la importancia del modelo es evidente en los estudios de transectos
de lnea. La nica razn por la que somos capaces de interpretar la bajada de la frecuencia de
deteccin a medida que la distancia a partir de la lnea aumenta, es que el modelo de estado implica
que, en media, hay el mismo nmero de animales (detectados o no) a cualquier distancia. Luego, sin
el modelo de estado no habra forma de distinguir una bajada en la frecuencia de deteccin causada
por la presencia de pocos animales lejos de la lnea, de una bajada debida a una pequea
probabilidad de deteccin lejos de la lnea.
No obstante, una de las caractersticas ms interesantes de los mtodos de muestreo de distancia
es que proporcionan estimaciones de la abundancia que son robustas frente a la heterogeneidad no
modelizada. Esta propiedad que se denomina pooling robutness es muy deseable ya que como se
ha empezado diciendo en este apartado las poblaciones de animales casi siempre son
heterogneas.
Figura 8
60
del
w 2
dividida por el rea de la regin de estudio
2
w 2
(2.67)
2
w
A
2A
el espacio, ya que las seales son instantneas. Las unidades del rea inspeccionada son en
realidad rea-tiempo. Por tanto, se estima el nmero de seales por unidad de rea y por unidad de
tiempo mediante la expresin:
D c
Tw
2
2n
T
(2.68)
la cual se puede convertir en una estimacin de la abundancia animal, dividiendo por una estimacin
de la razn de seales media de la poblacin,
estudio A:
61
2nA
N
T
(2.69)
Figura 9
De esta manera, la densidad de ser atrapado por una trampa va a ser ms alta cuanto ms cerca
del centro de la red se est. Los animales atrapados nos van a proporcionar las detecciones, y la
distancia de deteccin es la distancia que hay desde la trampa que captur al animal al centro de la
red.
La filosofa de este mtodo es que el espacio de la trampa debera de ser suficientemente pequeo
para asegurar que todos los animales cerca del centro de la red sean atrapados. Los datos de las
distancias que se registran son las del centro de la red a las trampas en las que los animales
detectados son cogidos. Este mtodo es por tanto similar al del muestreo de transectos de punto,
por lo que se consideran las mismas verosimilitudes y estimadores.
Un inconveniente de este mtodo es que depende del movimiento de los animales para atraparlos.
Como la densidad de atrapar los animales es ms alta cerca del centro de la red, los animales que
se mueven sobre un gran rea son ms probables que sean atrapados cerca del centro de la red,
causando un sesgo ascendente en las estimaciones de la densidad.
2.4.4.3 Muestreo de distancia indirecto
En este caso el muestreo de transectos de lnea o de punto no se lleva a cabo con los animales de
inters sino con los signos o marcas que stos producen. Ejemplos de estos signos son los
montones de estircol (elefantes), las agrupaciones de bolitas de estircol (ciervos) o los nidos
(monos).
62
Supongamos pues que se van a estudiar los montones de estircol. Si se aplica el mtodo de
transectos de lnea o el de transectos de punto estndar al estudio de los montones de estircol, las
verosimilitudes y los estimadores que se consideran son los mismos que los de los apartados de los
muestreos de transectos de linea y de puntos, dependiendo de qu tcnica se emplee. Una vez
estimada la densidad de los montones de estircol, se debe dividir por una estimacin del tiempo
medio de putrefaccin (en das) de los montones de estircol en el periodo precedente al estudio.
Esto nos da una estimacin del nmero de montones de estircol depositados por da, de modo que
para convertirla en una estimacin de la densidad animal se necesita dividir de nuevo por una
estimacin del nmero de montones de estircol producidos por da y por animal.
63
En el muestreo del vecino ms cercano, los objetos dentro de la regin de estudio se muestrean
aleatoriamente, y se miden las distancias a sus vecinos ms cercanos. En el muestreo del punto al
objeto ms cercano, se muestrean aleatoriamente los puntos que hay dentro de la regin de estudio
y se mide la distancia de cada punto al objeto ms cercano. Si se asume que los objetos estn
distribuidos uniforme e independientemente a lo largo de la regin de estudio, entonces la
distribucin de distancias al objeto ms cercano es la misma bajo ambas aproximaciones.
Estos mtodos se pueden extender al caso en el que se mide la distancia a los K objetos ms
cercanos con K 1 (Diggle, 1983). De este modo en reas de alta densidad animal, el hecho de
que K>1 proporciona una estimacin de la densidad ms eficiente.
No obstante, en la prctica rara vez se usan estos mtodos cuando se llevan a cabo estudios de
vida salvaje. Las razones son varias:
Los mtodos son ineficientes porque pueden localizarse muchos otros objetos mientras
intentamos identificar al objeto ms cercano.
Si los objetos son mviles, la medicin de la distancia al objeto ms cercano puede ser
propensa a sesgo. Es por esta razn por la que este mtodo es mejor aplicarlo en estudios
donde los objetos sean inmviles, tales como las plantas.
Para el mtodo del vecino ms cercano, es difcil seleccionar una muestra aleatoria de
objetos a partir de la poblacin entera.
El modelo de estado, el cual especifica que los objetos estn uniformemente distribuidos a
travs de la regin de estudio, no es realista en muchas aplicaciones, y la estimacin de la
densidad es muy sensible a esta hiptesis.
El ltimo problema lleva mucho tiempo siendo reconocido, y se han llevado a cabo varios intentos
para ajustar la no uniformidad. De hecho, estos mtodos se han usado ms comnmente para medir
la no uniformidad que para estimar la abundancia. Si la distribucin de los animales tiende a ser ms
agrupada o agregada que un patrn aleatorio, la abundancia es subestimada si las distancias se
miden a partir de un punto aleatorio y sobreestimada si se miden a partir de un objeto aleatorio. Es
por esta razn por la que algunos estimadores ad hoc estn basados en una media de las dos
estimaciones (Diggle, 1983).
64
Superficialmente, los estudios del punto al objeto ms cercano parecen similares a los del muestreo
por parcelas. Conceptualmente, las parcelas se muestrean a partir de la regin de estudio, donde
cada una de ellas es un crculo con centro el punto muestreado y con radio igual a la distancia al
objeto ms cercano. Ahora el problema est en que el tamao de la parcela es una variable aleatoria
y no una constante conocida.
Es necesario por tanto encontrar una funcin de verosimilitud, dado el modelo de estado asumido,
es decir, dado que los animales se distribuyen uniforme e independientemente en la regin de
estudio. Para ello se deriva la funcin de densidad de la distancia x al objeto ms cercano (o
equivalentemente la del rea de la parcela, si la parcela se define como arriba). Este procedimiento
se puede aplicar a ambos mtodos.
Por tanto, sea X la variable aleatoria distancia al objeto ms cercano y sea x un valor concreto que
toma dicha variable aleatoria. La probabilidad de que la variable aleatoria X sea mayor que el valor
x, Pr(X > x), es la probabilidad de que ningn objeto est dentro de un rea x 2 . Dado que los
objetos estn uniforme e independientemente distribuidos a lo largo de la regin de estudio (esto es,
el modelo de estado que determina la posicin de un animal, la cual viene dada por las coordenadas
cartesianas (u, v), es (u,v )
1
), el nmero de ellos en un rea de tamao unidad sigue una
A
N
. As, el nmero de objetos en un rea de tamao x 2 sigue
A
x 2 N . Luego:
A
x 2 N
A
Pr(X > x) =
x 2 N
exp
0!
x 2 N
exp
(2.70)
x 2 N
F(x) = Pr(X x) = 1- exp
(2.71)
65
(x)
2xN
x 2 N
exp
A
A
(2.72)
Para obtener la funcin de verosimilitud evaluamos esta expresin en cada una de las J distancias al
objeto ms cercano y se multiplican las evaluaciones conjuntamente, de forma que se tiene:
J
L(N) =
j 1
2N
(x j )
j 1
x 2j N
x j exp
(2.73)
JA
(2.74)
2
j
j 1
JAK
2
jk
(2.75)
j 1 k 1
donde xjk es la distancia del k-simo objeto al j-simo objeto o punto muestreado.
66
En el caso del muestreo del punto al objeto ms cercano el efecto que se produce al violar dicha
hiptesis es que las distancias de los puntos a los animales ms cercanos en media son mucho
mayores que las que habra en el caso de que la poblacin se distribuyese uniformemente en la
Figura 10
Hasta ahora los modelos de estado han estado prcticamente ausentes en los mtodos de
estimacin de la abundancia anteriores. El muestreo por parcelas y el de distancia han sido los
nicos en los que se ha asumido una distribucin uniforme de los animales pero no se ha
considerado ningn otro modelo de estado a parte de ste. En el siguiente apartado, los modelos de
estado juegan un papel mucho ms importante siendo los modelos de estado espaciales un tipo de
los muchos modelos posibles. A partir de este momento, se van a tener en cuenta poblaciones de
animales que van a ser heterogneas no slo en lo que respecta a su distribucin espacial, y es por
esta razn por la que se van a considerar modelos de estado para todas las fuentes de
heterogeneidad. Como indicamos al inicio de este captulo para ms informacin sobre los nuevos
modelos de estado y observacin ver el apartado 2 del Anexo.
67
En este apartado, se trabaja con modelos que permiten la estimacin de la distribucin espacial y/o
temporal de los animales cuando la deteccin de todos ellos es segura dentro de la regin
inspeccionada. Concretamente se va a estudiar la estimacin de la abundancia mediante:
Los estudios por parcelas y los recuentos migratorios conceptualmente son muy similares. Mientras
un estudio por parcelas comprende una muestra de stas en las que se contabiliza el nmero de
animales en un instante de tiempo dado, un recuento migratorio comprende una muestra de
periodos de vigilancia u observacin en los que se contabiliza el nmero de animales que se
observan durante dichos periodos.
De igual forma que en el muestreo por parcelas se asuma que todos los animales que se
encontraban en la regin inspeccionada podan ser detectados, en el caso de los recuentos
migratorios se asume que todos los animales que pasan durante un periodo de observacin van a
ser contados. Ntese que aunque en el apartado 2.1 tambin se asumi que la distribucin espacial
de los animales era uniforme (hecho que con frecuencia era violado), considerar la hiptesis de que
la distribucin temporal de un proceso migratorio es uniforme no es admisible dada la naturaleza de
dicho proceso. De hecho, se sabe que la distribucin temporal de los animales migratorios tiene una
formulacin bastante simple. Es unidimensional (el tiempo es la dimensin) y con frecuencia suave;
el nmero de animales que pasan desde el inicio del periodo de vigilancia crece de forma suave
hasta algn mximo para luego disminuir suavemente al final de la estacin de migracin. Esta
situacin contrasta con el caso del muestreo por parcelas, en donde la distribucin espacial de los
animales en la regin de estudio tiene dos dimensiones y raramente tiene una formulacin sencilla.
Hasta la fecha, los recuentos migratorios han sido utilizados exclusivamente para estimar el tamao
de las poblaciones de ballenas que anualmente emigran pasando por puntos de vigilancia costera.
Potencialmente estos recuentos son relevantes para cualquier otra poblacin de animales
migratorios siempre y cuando exista un rea de estudio desde la que se los pueda observar
regularmente y por la que deba pasar la poblacin entera.
La poblacin de ballenas grises de California (Eschrichtius robustus) se estudi desde Monterrey
(Reilly et al., 1980, 1983), mediante este mtodo durante el periodo de emigracin que transcurre
68
desde su zona de alimentacin en los Mares de Bering y Chukchi a su zona de cra en Baja
California.
2.6.1.1 Estimacin mximo verosmil
Datos agrupados
Para poder usar los mtodos basados en el modelo del apartado 2.1 estaramos forzados a asumir
que los animales pasan por el punto de vigilancia independientemente a una velocidad uniforme
durante todo el periodo de migracin, hiptesis que es insostenible (Figura 11).
Figura 11
El nmero de animales que pasan por unidad de tiempo cambia durante el periodo de migracin.
Por tanto, es necesario especificar un modelo de estado temporal para el proceso migratorio
definiendo una razn de migracin de (t ) animales por unidad de tiempo en el instante t, donde t
= 0 corresponde al inicio de la migracin y t = T corresponde al final de esta. As pues, (t ) es la
base del modelo de estado temporal y tiene asociado un vector de parmetros desconocidos ,
los cuales se van a estimar por mxima verosimilitud.
Por tanto, es necesario formular una verosimilitud y para ello se precisa obtener una expresin que
nos proporcione la probabilidad de que un animal dado pase por el punto de vigilancia durante el
periodo de observacin j. Dicha probabilidad la vamos a denotar por j .
La probabilidad de que un animal pase por el punto de vigilancia en el pequeo intervalo de tiempo
(t, t + dt) es:
69
dt
(t )
(2.75)
(t )dt
0
y el correspondiente modelo de estado que modeliza el tiempo en el que el animal pasa por el punto
de vigilancia viene dado por:
(t )
(t )
(2.76)
(t )dt
0
Luego, la probabilidad de que el animal pase por el punto de vigilancia en el periodo de observacin
j el cual se inicia en el instante tsj y finaliza en el instante tfj se expresa por:
t fj
t sj
(t )dt
(2.77)
Ya que un animal dado solo puede pasar durante un periodo, la probabilidad de que un animal pase
durante uno de los J periodos de vigilancia (que conforman el periodo de cobertura) es justamente la
suma de los j :
c c ( )
( )
(2.78)
j 1
Si se asume que el instante en el que pasa cualquier animal es independiente de los instantes en los
que pasan otros animales, y se considera el suceso pasar en un periodo de vigilancia como un
xito, entonces la verosimilitud para N y es la multinomial siguiente:
Lb ( N ; )
N!
1 c
N n ! n j !
j 1
N n nj
(2.79)
j 1
Luego, como se puede comprobar la verosimilitud se determina por el modelo de estado de la razn
de migracin, (t ) . Ntese que al igual que en el muestreo por parcelas, no hay aleatoriedad en
el modelo de observacin ya que la deteccin es segura dentro de los periodos de vigilancia. La
70
c
c
n
~
N ~
c
(2.80)
Sanathanan (1972) demostr que las distribuciones asintticas de los estimadores mximo
~
~ y
verosmiles condicionados N
son idnticas a las de los estimadores mximo verosmiles no
condicionados N
respecto a N y a .
Datos no agrupados
Lu ( n )
nj
j 1 i 1
(t ij )
j
(2.81)
71
N
1 c N n
n
Lu (N; )
(t
(2.82)
k 1
j 1
seleccionan N
2.
72
Figura 11
Cada localizacin de la muestra (redada de pescado) se puede ver como una unidad muestral del
muestreo por parcelas y las redes son tales que todos los huevos que estn dentro de la parcela son
observados. La densidad de huevos de caballa en la regin de estudio se sabe que no es muy
uniforme (ver Figura 12).
73
Figura 12
Observando la Figura 12 se ve que hay un considerable cambio en la densidad que va desde cero
en el este hasta una cima usualmente cercana a la curva de profundidad de 200m volviendo a ser
muy baja en el borde oeste de la regin de estudio. Tambin hay un cambio sistemtico
considerable en la densidad de norte a sur, de manera que la densidad es ms baja en el sur, ms
alta en latitudes medias y de nuevo es muy baja en el norte. El agua que hay alrededor del banco
de puerco espines , una regin de agua poco profunda situada a 14 Oeste, 53,5 Norte,
usualmente tambin es una regin con una densidad de huevos relativamente alta.
La superficie de la densidad es una funcin de la localizacin, de la profundidad y de otras posibles
variables, aunque en principio slo se va a considerar que es una funcin de la localizacin. Nos
referimos a la superficie de la densidad como ( x ) , donde x = (u, v) y u y v son la longitud y la
latitud. Ya que la forma de la superficie no es muy predecible, se debe utilizar una formulacin
funcional no paramtrica para ( x ) . En este ejemplo concreto, ( x ) se ha modelizado usando
splines de suavizamiento (ver Hastie y Tibshirani, 1990). Con esta formulacin, el modelo de estado
para la localizacin de huevos es:
(x)
( x )
( x )dudv
(2.83)
( x )dudv
(2.84)
74
En algunas situaciones tiene sentido modelizar tanto la distribucin espacial de una poblacin
nominalmente cerrada, como la forma en la que cambia con el tiempo. De nuevo el ejemplo de la
estimacin de la abundancia de caballa nos va a servir para ilustrar esta situacin. En este caso, el
modelo de estado que se considera es uno de los llamados Population-level drift (Ver apartado 2
del Anexo). Rutinariamente para calcular las existencias de caballa se utiliza el Mtodo de
Produccin de Huevos Anual (AEPM; ver Gunderson, 1993). Este mtodo estima la abundancia de
huevos diaria as como la produccin total de huevos en una estacin de desove. Los datos se
recogen a partir de un nmero de estudios realizados sobre la cantidad de huevos depositados
durante dicha estacin, considerndose cada uno de ellos como una pequea versin del estudio
DEPM descrito en el apartado anterior.
En 1995 se llev a cabo un estudio para estimar la produccin de huevos de caballa y los resultados
obtenidos se resumen brevemente a continuacin (ver Augustin et al., 1998b para ms detalles). La
densidad se modeliz como una funcin de cuatro variables: la distancia desde la curva de
profundidad de 200m, la distancia norte a lo largo de esta curva, la profundidad del fondo y la fecha.
Al igual que en el caso anterior la formulacin de la dependencia de las variables espaciales y
temporales no se conoce bien y puede ser complicada, as que ( x ) se modeliz utilizando
splines suavizados y la estimacin se obtuvo usando los mtodos GAM.
75
La Figura 13 muestra la produccin de huevos estimada a lo largo del ao 1995, que como se puede
observar es anloga a la curva de suavizamiento representada para la migracin de las ballenas en
la Figura 11.
Figura 13
76
Anexo
Si se llevasen a cabo otras realizaciones del mismo modelo de estado se obtendran diferentes
localizaciones de los animales. De hecho los modelos de estado rara vez son tan simples ya que la
77
mayora de las veces los animales se distribuyen atendiendo a las localizaciones de otros animales.
De este modo, podran tender a estar cerca de otros animales o si son muy territoriales podran
tender a estar cerca de otros animales de la misma especie.
Los modelos de estado espaciales no son los nicos relevantes. Conceptualmente en una poblacin
podemos encontrarnos modelos bajo la distribucin de la edad, el sexo, el tamao, etc. Adems, son
modelos que van a depender del tiempo ya que las poblaciones de animales son dinmicas. Tal
dependencia existir a menos que se trabaje con fotos instantneas de la poblacin, es decir, con
la poblacin en un solo instante de tiempo.
La realizacin del modelo de estado divide a los N animales de la poblacin en subpoblaciones
homogneas, de forma que hay N( x ) animales, donde x es el vector de variables relativas a
caractersticas de ellos. As por ejemplo, si el sexo fuese la nica variable relativa a los animales
relevante, x sera la variable sexo ( x = 0 para machos y x = 1 para hembras) y la poblacin
estara dividida en dos subpoblaciones formadas por N(0) animales machos y N(1) animales
hembras.
78
Nc n
p (1 p ) Nc n
n
p(n) =
(1.1)
= n
N
c
p
(1.2)
1 p
Var (N c ) N c
p
(1.3)
) n(1 p )
Va r (N
c
p2
(1.4)
N
A
(1.5)
79
N n ;
D
A
pA
Var (D )
N 1 p
A2 p
(1.6)
En general N no se suele conocer, por lo que un estimador de la varianza va a venir dado por:
) n 1 p
Va r (D
A 2 p 2
(1.7)
Por otro lado, si la regin inspeccionada fuese menor que la regin de estudio, entonces tambin
habra incertidumbre sobre qu fraccin de la poblacin estaba en la regin inspeccionada. Si
suponemos que en media una fraccin c de la poblacin est en la regin inspeccionada
podemos estimar N mediante:
=
N
n
N c
=
c p c
(1.8)
80
La diferencia entre estos modelos y los usados en los mtodos de estimacin de la abundancia
animal ms simples es que introducen una dimensin temporal al modelo de estado. De esta forma
se puede conocer si las variables asociadas a la poblacin de estudio, es decir, a los animales,
pueden cambiar a lo largo del periodo de realizacin del estudio y si lo hacen, ver cmo se produce
ese cambio.
Supongamos pues que se quiere estimar la abundancia de una poblacin en donde la probabilidad
de captura depende slo de si un animal vive en el bosque o en la pradera. Sea xsi = 0 si el animal i
vive en la pradera en el momento del estudio s y xsi = 1 si el animal i vive en el bosque. Si los N
animales de la poblacin se comportaran idntica e independientemente, un modelo de estado
apropiado para el estudio s sera:
N
( x s 1 ,..., x sN ) 1 s
1 xsi
sxsi
i 1
donde
(2.1)
Cuando un animal se mueve entre dos hbitats a medida que se van realizando estudios, se genera
una historia de localizaciones, que se denota por H . En general, cada vez que se realiza un estudio,
a parte de la localizacin, habr variables relativas a los animales relevantes que se van a ir
registrando en una historia. Se define por tanto H
si
momento s:
H si = (x1i, , xsi)
(2.2)
Y se define la historia de la poblacin, denotada por H s, como la matriz cuyas filas son las historias
de los individuos de la poblacin, esto es:
H s = (H s1, , H sN) T
En funcin de los cambios que sufren las variables relativas a los animales de un estudio a otro se
tienen distintos tipos de modelos de estado. Estos se van a formular en trminos de un escalar x
para abreviar, pero se podran generalizar al caso en el que x es un vector (x).
81
partir de ese momento xsi est fijo (xsi = x1i = xi para todo s). El modelo de estado esttico para el
animal i se puede escribir como sigue:
( H si) = (x1i)
(2.3)
( H si) =
( x
s* 1
s* i
)
(2.4)
( H si) =
donde
( x1i x0 i ) ( x1i )
( x
s* 1
s* i
x( s* 1 )i )
(2.5)
Population-level drift
Las localizaciones de los animales en cada estudio se determinan independientemente de sus
posiciones previas, pero hay drift en la distribucin de animales, es decir, la distribucin de la
poblacin cambia cuando el tiempo avanza. Conceptualmente, el modelo de estado determina de
nuevo la localizacin en cada estudio, pero la forma de este cambia cuando el tiempo avanza
(algunos de sus parmetros dependen del tiempo). Para ilustrar este modelo utilizando el escenario
bosque-pradera, se tiene:
82
1 ( t )
s
( H si) =
donde
t s*
1 x si
s*
s* 1
( t s* ) xsi
( t )
(2.6)
1
1 e 0 t t
t ).
wsi es el indicador de captura del i-simo animal en el momento de captura s y toma los
valores uno si el animal i es capturado en el momento s y cero en otro caso.
wsi es la historia de captura del i-simo animal inmediatamente antes del momento de
captura s y se define como wsi = (w1i,, w(s-1)i).
La historia de captura de los animales que no han sido capturados al inicio del estudio s es un vector
de (s-1) ceros, denotado por 0s = (0,..., 0).
Para terminar decir que aunque existen muchas frmulas que definen la funcin de deteccin o
captura a menudo se utiliza la frmula logstica funcional:
p( x ,l )
0 x x l l
1 e
0 x x l l
83
2.
A partir de ella se extrae una muestra aleatoria simple de tamao n con reemplazamiento.
Esta es una remuestra, x b* .
3.
84
4.
5.
se define como:
B
*
b
b 1
Por ltimo, decir que en algunas ocasiones se tiene algn conocimiento ms que el estrictamente
aportado por la muestra, por ejemplo se conoce la funcin de distribucin de la variable objeto de
estudio pero se desconocen los parmetros, que deben ser estimados. En estos casos se
estimaran los parmetros a partir de la muestra y el remuestreo se realizara a partir de la funcin
terica conocida, con los parmetros estimados, en lugar de a partir de la funcin de distribucin
emprica construida a partir de la muestra. En este caso se habla de Bootstrap Paramtrico.
En la prctica la magnitud de B depende de las pruebas que se van a aplicar a los datos. En general, B debera estar entre 50
y 200 para estimar el error tpico de un estadstico de inters y debera ser al menos 1000 para estimar intervalos de confianza
para dicho estadstico.
85
es decir tenemos una poblacin con N valores de la cual se seleccionan mediante muestreo
aleatorio simple tantas muestras bootstrap s* como queramos. Evidentemente en cada una de estas
muestras bootstrap pueden aparecer valores repetidos, habiendo como mximo n valores distintos.
A partir de cada muestra bootstrap obtenida, se calcula el estimador del parmetro deseado y se
puede estimar la varianza de dicho parmetro como se ha explicado con anterioridad.
Mtodo de Bickel y Freedman
Este mtodo generaliza el mtodo anterior para el caso de que N/n no sea entero.
Supongamos que N=kn+l con 0<l<n. Se construyen dos poblaciones artificiales U1* y U 2* en la
que la primera est compuesta por k copias de s mientras que la segunda est compuesta por k+1
copias de s igual que en el mtodo anterior.
La seleccin de cada muestra bootstrap s* se realiza de la poblacin primera U1* , con probabilidad
utilizado es
l
l
1 1
. As pues se obtienen un conjunto de muestras bootstrap, todas del
n
N 1
mismo tamao, pero unas se han seleccionado de una poblacin de tamao kn y otras de una
poblacin de tamao (k+1)n.
Una vez obtenidas las muestras bootstrap, se evala el estimador en dichas muestras y se procede
a estimar su varianza.
Mtodo de Booth, Butler y Hall
Se construye una poblacin emprica, U*, de tamao N=kn+l, agrupando k copias de la muestra
primitiva s, con una muestra aleatoria simple de l unidades de s. De esta forma la poblacin U* est
formada por exactamente N unidades, a partir de ella se procede a extraer las muestras bootstrap y
se continua el proceso de estimacin como en los mtodos anteriores.
Otros mtodos de remuestreo bootstrap
En los ltimos aos han aparecido diversos mtodos de remuestreo, que suponen la poblacin finita
como realizacin de una superpoblacin con funcin de distribucin F. En este caso las poblaciones
bootstrap se obtienen a partir Fn de la misma forma que la poblacin U fue obtenida de F. Ejemplos
de estos mtodos son los de Presnell y Booth, Helmers y Wegkamp,... Un estudio ms amplio de
mtodos bootstrap en poblaciones finitas puede verse en Lombarda y et al. (2003).
86
a
( x )dx
A
p( x )
La probabilidad de detectar un grupo, dado que est en una banda a una distancia perpendicular
desconocida, es la probabilidad de deteccin media de animales dentro de la banda; esto es, es el
valor esperado de la funcin de deteccin en la banda con respecto al modelo de estado:
E p
p( x ) ( x )dx
E p
donde
p( x )
1
, por lo que se tiene que:
w
1
1
dx
w
w
87
Bibliografa
Agresti, A. 1994. Simple capture-recapture models permitting unequal catchability and variable
sampling effort. Biometrics, 50, 494-500.
Alho, J. M. 1990. Logistic regression in capture-recapture models. Biometrics, 46, 623-635.
Augustin, N. H., Borchers, D.L., Clarke, E.D., Buckland, S.T., y Walsh, M. 1998b. Spatiotemporal
modelling for the annual egg production method of stock assessment using generalized additive
models. Canadian Journal of Fisheries and Aquatic Sciences, 55, 2608-2621.
Borchers, D.L., Buckand, S.T. y Zucchini, W. 2002. Estimating Animal Abundance: Closed
populations.
Buckland, S.T., Anderson, D.R., Burnham, K.P., Laake, J.L., Borchers, D.L., y Thomas, L.J. 2001.
Introduction to distance sampling. Oxford: Oxford University Press.
Burnham, K. P. 1972. Estimation of population size in multinomial capture-recapture studies when
capture probabilities vary among animals. PhD Thesis, Oregon State University, Oregon.
Cassel, C.-M., Srndal, C.-E., Wretman, J.H. (1993b). Foundations of Inference in Survey Sampling.
Wiley, New York.
Chao, C.-T., Thompson, S.K. (2001). Optimal adaptive selection of sampling sites. Environmetrics
12, 517538.
Chapman, D.G., 1951. Some properties of the hypergeometric distribution with applications to
zoological censuses. University of California Publications in Statistics, 1, 131-160.
Chapman, D.G., y Junge, C.O. 1956. The estimation of the size of a stratified animal population.
Annals of Mathematical Statistics, 27, 375-389.
Christman, M.C. (1997). Efficiency of adaptive sampling designs for spatially clustered populations.
Environmetrics 8, 145166.
Cochran,W.G. (1977). Sampling Techniques, 3rd ed. JohnWiley & Sons, New York.
Cormack, R.M. 1989. Log-linear models for capture-recapture. Biometrics, 45, 395-413.
Cuesta, M. y Herrero, F.J. Introduccin al bootstrap: Inferencia estadstica mediante bootstrap,
Intervalos
confidenciales.
Dpto.Psicologa
Universidad
de
Oviedo.
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.9/boot1.html
David A. Marker and Don L. Stevens Jr., 2009. Sampling and Inference in Environmental Surveys.
Sample Surveys: Design, Methods and Applications, Vol. 29A, 487-512.
Diaconis, P., y Efron, B. (1983). Computer intensive methods in statistics. Scientific American,
248(5), 116-13.
Diggle, P.J. 1983. Statistical analysis of spatial point patterns. London: Academic Press.
Duncan, G.J., Kalton, G. (1987). Issues of design and analysis of surveys across time. International
Statistical Review 55, 97117.
Efron, B. (1979). Bootstrap methods. Annals of statistics, 7, 1-26.
Efron, B. (1981). Nonparametric estimates of standard error: the jacknife, the bootstrap, and other
resampling methods. Biometrika, 68, 589-599.
88
Efron, B., y Tibshirani, R.J. 1993. An introduction to the bootstrap. New York: Chapman & Hall.
El Khorazaty, M.N., Imrey, P.B., Koch, G.O., y Wells, H.B. 1977. A review of methodological
stratiegies for estimating the total number of events with data from multiple-record systems.
International Statistical Review, 45, 129-157.
Evans, M.A., Bonnet, D.G., y McDonald, L.L. 1994. A general theory for modeling capture-recapture
data from a closed population. Biometrics, 50, 396-405.
Feinberg, S.E. 1972. The multiple-recapture census for closed populations and incomplete 2 k
contingency tables. Biometrika, 59, 591-603.
Gunderson, D.R. 1993. Surveys of fisheries resources. New York: Wiley.
Grtler, Ricardo, 2002. Estimacin de la abundancia: Introduccin al muestreo de poblaciones.
Trabajo prctico 3. http://biolo.bg.fcen.uba.ar/ecologia/TP3.pdf
Hanselman, D.H., Quinn, T.J., Lunsford, C., Heifetz, J., Clausen, D. (2003). Applications in adaptive
cluster sampling of Gulf of Alaska rockfish. Fishery Bulletin 101, 501513.
Hastie, T.J., y Tibshirani, R.J. 1990. Generalized additive models. London: Chapman & Hall.
Hinckley, D.W. (1988). Bootstrap Methods. Journal of the Royal Statistical Society, Series B, 50, 321337.
Huggins, R.M. 1989. On the statistical analysis of capture experiments. Biometrika, 76, 133-140.
Huggins, R.M., and Yip, P.S.F. 1997. Statistical analysis of removal experiments with the use of
auxiliary variables. Statistica Sinica, 7, 705-712.
Hunter, J.R., y Lo, N.C.H. 1993. Ichthyoplankton methods for estimating fish biomass: introduction
and terminology. Bulletin of Marine Science, 53, 723-727.
Kimura, D.K., Somerton, D.A. (2006). Review of statistical aspects of survey sampling for marine
fisheries. Reviews in Fisheries Science 14, 245283.
Kish, L. (1987). Statistical Design for Research. JohnWiley & Sons, New York.
Kott, P.S. (1986). Some asymptotic results for the systematic and stratified sampling of a finite
population. Biometrika 73, 485491.
Landers, D.H., Eilers, J.M., Brakke, D.F., Overton, W.S., Kellar, P.E., Silverstein, M.E., Schonbrod,
R.D., Crowe, R.E., Linthurst, R.A., Omernik, J.M., Teague, S.A., Meier, E.P. (1987). Characteristics of
lakes in the Western United States. Volume I: Population Descriptions and Physico-Chemical
Relationships. EPA-600/3-86/054a. US Environmental Protection Agency, Washington, DC.
Larsen, D.P., Thornton, K.W., Urquhart, N.S., Paulsen, S.G. (1994). The role of sample surveys for
monitoring the condition of the Nations lakes. Environmental Monitoring and Assessment 32, 101
134.
Linthurst, R.A., Landers, D.H., Eilers, J.M., Brakke, D.F., Overton, W.S., Meier, E.P., Crowe, R.E.
(1986).
Lohr, S. (1999). Sampling: Design and Analysis. Duxbury Press, Brooks/Cole Publishing, Pacific
Grove, CA.
Lpez Juregui, A. y Elosua Oliden, P. 2004. Estimaciones bootstrap para el coeficiente de
determinacin: un estudio de simulacin. Revista Electrnica de Metodologa Aplicada 2004, Vol. 9
n 2, pp. 1-14. http://www.psico.uniovi.es/REMA/v9n2/a1/n9v2a1_1.htm
89
Lunneborg, C. E. (1987). Bootstrap applications for the behavioral sciences. Educational and
Psychological Measurement, 47, 627-629.
Mark, D.M. (1990). Neighbor-based properties of some orderings of two-dimensional space.
Geographical Analysis 2, 145157.
Mooney, C.Z. y Duval, R.D. (1993). Bootstrapping: A Nonparametric Approach to Statistical
Inference. Newbury Park, CA: Sage.
Norris, J.L., y Pollock, K.H. 1995. A capture-recapture model with heterogeneity and behavioural
response. Envioronmental and Ecological Statistics, 2, 305-313.
Norris, J.L., y Pollock, K.H. 1996. Nonparametric MLE under two closed capture-recapture models
with heterogeneity. Biometrics, 52, 639-649.
Otis, D.L., Burnham, K.P., White, G.C., y Anderson, D.R. 1978. Statistical inference from capture
data on closed animal populations. Wildlife Monographs, 62, 1-135.
Overton,W.S., Stehman, S.V. (1993). Properties of designs for sampling continuous spatial resources
from a triangular grid. Communications in Statistics, Part A Theory and Methods 22, 26412660.
Paulsen, S.G., Hughes, R.M., Larsen, D.P. (1998). Critical elements in describing and understanding
our nations aquatic resources. Journal of The American Water Resources Association 34, 9951005.
Peano, G. (1890). Sur Une Courbe, Qui Remplit Toute Une Aire Plane. Mathematische Annalen 36,
157160.
Peterson, S.A., Urquhart, N.S., Welch, E.B. (1999). Sample representativeness: a must for reliable
regional lake condition estimates. Environmental Science and Technology 33(10), 15591565.
Pledger, S. 2000. Unified maximum likelihood estimates for closed capture-recapture models using
mixtures. Biometrics, 56, 434-442.
Pollock, K.H. 1974. The assumption of equal catchability of animals in tag-recapture experiments.
PhD Thesis, Cornell University, New York.
Reilly, S.B., Rice, D.W. y Wolman, A.A. 1980. Preliminary population estimate for the California gray
whale based upon Monterey shore censuses. Report of the International Whaling Commission, 30,
359-368.
Reilly, S.B., Rice, D.W. y Wolman, A.A. 1983. Population assessment of the gray whale, Eschrichtius
robustus, from California shore censuses, 1967-80. Fishery Bulletin, 81, 267-281.
Royall, R.M., Herson, J. (1973). Robust estimation infinite populations I. Journal of the American
Statistical Association 68, 880889.
Sanathanan, L. 1972. Estimating the size of a multinomial population. Annals of Mathematical
Statistics, 43, 142-152.
Srndal, C.-E., Swensson, B., Wretman, J. (1992). Model Assisted Survey Sampling. SpringerVerlag, New York.
Schwarz, D.J., y Seber, G.A.F. 1999. Estimating animal abundance: Review III. Statistical Science,
14, 427-456.
Seber, G.A.F. 1970. The effects of trap response on tag-recapture estimates. Biometrika, 26 (57), 1322.
Seber, G.A.F. 1982. The estimation of animal abundance and related parameters. 2nd edn. London:
Charles Griffin.
90
Simon, J. L. (Ed.). (1969). Basic Research Methods in Social Science. (Vol. acceso en Marzo 2003).
New York: Random House.
Stevens, D.L. Jr. (1994). Implementation of a national environmental monitoring program. Journal of
Environmental Management 42, 129.
Stevens, D.L. Jr., Olsen, A.R. (1999). Spatially restricted surveys over time for aquatic resources.
Journal of Agricultural, Biological, and Environmental Statistics 4, 415428.
Stevens, D.L. Jr., Olsen,A.R. (2004). Spatially balanced sampling of natural resources. Journal of the
American Statistical Association 99, 262278.
Thompson, S.K. (1990). Adaptive cluster sampling. Journal of American Statistical Association 85,
10501059.
Thompson, S.K. (1991b). Stratified adaptive cluster sampling. Biometrika 78, 389397.
Thompson, S.K. 1992. Sampling. New York: Wiley.
Thompson, S.K. (2002). Sampling, 2nd ed. JohnWiley & Sons, New York.
Thompson, S.K. (2006). Adaptive web sampling. Biometrics 62, 12241234.
Wittes, J.T. 1972. On the bias and estimated variance of Chapmans two-sample capture-recapture
population estimate. Biometrics, 28, 592-597.
Wolter, K.M., Harter, R.M. (1990). Sample maintenance based on Peano keys. Proceedings of the
1989 International Symposium: Analysis of Data in Time. Statistics Canada, Ottawa, ON, Canada,
2131.
Yates, F. (1946). A review of recent statistical developments in sampling and sample surveys.
Journal of the Royal Statistical Society 109(1), 1243.
Yates, F. (1981). Sampling Methods for Censuses and Surveys, 4th ed. Griffin, London.
91