Está en la página 1de 92

MUESTREO

EN
POBLACIONES MEDIOAMBIENTALES

Departamento de Estadstica e Investigacin Operativa


Universidad de Granada
Trabajo Fin de Mster Oficial en Estadstica Aplicada
Lnea de Investigacin:
Mtodos de Muestreo y Tcnicas de estimacin especiales

Autora: Elisa Isabel Caballero Ruiz


Tutores: Mara del Mar Rueda Garca
Antonio Arcos Cebrin

Introduccin..................................................................................4
Captulo 1. El muestreo en poblaciones medioambientales.....8
1.1 Muestreo de poblaciones en el espacio...........................................................8
1.2 Definicin de marcos muestrales para poblaciones medioambientales.....8
1.3 Diseos para muestras medioambientales....................................................11
1.3.1 Diseos multietapa.....................................................................................11
1.3.1.1 Diseos espacialmente limitados.............................................................11
1.3.1.2 Diseos espacialmente equilibrados o balanceados................................12
1.3.2 Diseos estratificados................................................................................13
1.3.2.1 Muestreo sistemtico...............................................................................13
1.3.2.2 Diseos espacialmente estratificados......................................................14
1.3.2.3 Diseos estratificados aleatorios de teselas.............................................15
1.3.2.4 Tcnicas de direccin/orientacin espacial.............................................15
1.3.3 Otros diseos muestrales..........................................................................17
1.3.3.1 Muestreo adaptativo................................................................................17
1.3.3.2 Diseos muestrales para la estimacin de la abundancia animal............18
1.3.3.3 Diseos para la evaluacin de la tendencia o del estado y la tendencia..19

Captulo 2. El problema de la estimacin de la abundancia


animal..........................................................................................20
2.1 Muestreo por parcelas......................................................................................20
2.1.1 Estimacin mximo verosmil...................................................................21
2.1.1.1 Estimacin puntual..................................................................................21
2.1.1.2 Estimacin por intervalos........................................................................21
2.1.2 Efectos producidos al violar las hiptesis...............................................23
2.2 Mtodos de eliminacin, captura-esfuerzo y change-in-ratio.....................24
2.2.1 Mtodo de eliminacin...............................................................................24
2.2.1.1 Estimacin puntual..................................................................................24
2.2.1.2 Estimacin mximo verosmil mediante el mtodo de eliminacin simple
.............................................................................................................................26
2.2.1.3 Estimacin por intervalos........................................................................27
2.2.2 Mtodo de captura-esfuerzo.....................................................................29
2.2.3 Mtodo change-in-ratio..............................................................................32
2.2.3.1 Verosimilitud total...................................................................................34
2.2.3.2 Verosimilitud condicionada.....................................................................35
2.2.4 Efectos producidos al violar las hiptesis...............................................36
2.3 Mtodo de marca-recaptura simple................................................................37
2.3.1 Notacin.......................................................................................................38
2.3.2 Ilustracin del mtodo de marca-recaptura............................................38
2.3.3 Verosimilitud del mtodo de marca-recaptura con dos muestras.......39
2.3.4 Estimacin por intervalos..........................................................................42
2.3.4.1 Intervalo de confianza de la verosimilitud maximizada (profile
likelihood)............................................................................................................42

2.3.4.2 Intervalo de confianza basado en la normal............................................42


2.3.4.3 Intervalo de confianza del mtodo percentil...........................................42
2.3.5 Mltiples estudios: El censo de Schabel.................................................43
2.3.6 Tipos de modelos de marca-recaptura....................................................44
2.3.7 Efectos producidos al violar las hiptesis...............................................46
2.4 Muestreo de distancia.......................................................................................47
2.4.1 Muestreo de transectos de lnea..............................................................47
2.4.1.1 Estimacin mximo verosmil.................................................................48
2.4.1.2 Estimacin basada en el diseo: estimador Horvitz-Thompson..............51
2.4.1.3 Estimacin por intervalos........................................................................53
2.4.2 Muestreo de transectos de punto.............................................................53
2.4.2.1 Estimacin mximo verosmil.................................................................54
2.4.2.2 Estimacin basada en el diseo: estimador Horvitz-Thompson..............56
2.4.2.3 Estimacin por intervalos........................................................................56
2.4.3 Heterogeneidad...........................................................................................57
2.4.4 Otros mtodos de muestreo de distancia...............................................57
2.4.4.1 Recuento de seales.................................................................................57
2.4.4.2 Redes de trampas.....................................................................................59
2.4.4.3 Muestreo de distancia indirecto...............................................................60
2.4.5 Efectos producidos al violar las hiptesis...............................................60
2.5 Mtodo del vecino ms cercano y mtodo del punto al objeto ms
cercano......................................................................................................................62
2.5.1 Estimacin mximo verosmil...................................................................62
2.5.2 Estimacin por intervalos..........................................................................64
2.5.3 Efectos producidos al violar las hiptesis...............................................64
2.6 Modelos espacio/temporales con deteccin segura....................................66
2.6.1 Modelizacin temporal: recuentos migratorios......................................66
2.6.1.1 Estimacin mximo verosmil.................................................................67
2.6.1.2 Estimacin por intervalos........................................................................70
2.6.2 Modelizacin espacial: muestreo por parcelas......................................70
2.6.2.1 Aplicacin de ejemplo.............................................................................70
2.6.2.2 Estimacin por intervalos........................................................................73
2.6.3 Modelizacin espacio-temporal................................................................73

Anexo...........................................................................................75
1. Modelos de estado y de observacin para mtodos simples.......................75
1.1 Modelos de estado.........................................................................................75
1.2 Modelos de observacin...............................................................................76
2. Modelos de estado y de observacin para mtodos complejos..................78
2.1 Modelos de estado.........................................................................................78
2.3 Modelos de observacin...............................................................................81
3. Tcnica de remuestreo bootstrap......................................................................81
4. Ancho de banda efectivo...................................................................................84

Bibliografa.................................................................................86
2

Introduccin
La preocupacin por el medio ambiente se ha convertido en un tema de gran inters que afecta
tanto a instituciones como a ciudadanos. Esta preocupacin no solo se centra en los problemas
medioambientales producidos por la degradacin del entorno natural, tales como la conservacin de
recursos naturales, la reduccin de la capa de ozono, el calentamiento global, el cambio climtico,
etc., sino tambin en aquellos que estn relacionados con el mbito de vida de cada ciudadano,
como por ejemplo, la contaminacin debida al trfico, al ruido, la calidad del agua y de otros
productos alimentarios, los daos ocasionados al paisaje, etc.
En este sentido evaluar el estado, condicin o alcance de recursos ambientales, tales como aire,
agua, sol y el conjunto de especies de plantas, animales y otros organismos que ocupan un rea
dada, y que sustentan nuestro medio ambiente, puede resultar bastante interesante. Para llevar a
cabo esta evaluacin haremos uso de encuestas dirigidas a este tipo de recursos.
La poblacin objetivo de una encuesta medioambiental puede ser discreta y finita, como por
ejemplo, pequeos lagos o humedales, con unidades de poblacin bien definidas, o puede ser
continua de una, dos o tres dimensiones, como por ejemplo, una red de arroyos, un bosque o el
volumen de agua de un gran lago. Cada una de ellas requiere diferentes tipos de marcos y diseos
muestrales.
La encuesta medioambiental puede consistir en evaluar alguna caracterstica del recurso una sola
vez o puede incluir un objetivo de seguimiento o supervisin a largo plazo que evale el cambio o
tendencia del mismo. Abordar ambos objetivos requiere de un equilibrio entre volver a visitar los
lugares para evaluar la tendencia e incorporar nuevos lugares para evaluar la situacin o estado del
recurso.
Tradicionalmente, el enfoque del muestreo en ciencias medioambientales ha sido en sistemas
relativamente pequeos y bien delimitados, por ejemplo, a escala de un lago, o una cuenca de un ro
o masa forestal. No obstante, algunos problemas medioambientales actuales, tales como el
calentamiento global, la contaminacin de aguas superficiales y subterrneas por pesticidas y otros
contaminantes y la extensa alteracin del paisaje no estn localizados. Cuantificar la magnitud de
los sntomas de preocupacin generalizada requiere de esfuerzos de estudio a gran escala, lo que a
su vez necesita de tcnicas de muestreo y metodologas que sean formuladas para abordar los
problemas medioambientales regionales, continentales y a escala mundial.
Como ya sabemos, el diseo de una encuesta es un rea bien desarrollada y establecida en la
literatura estadstica. Disponemos de muchos libros de texto que proporcionan excelentes
explicaciones de los atributos esenciales de un buen diseo de encuesta, tales como, la necesidad
de una clara definicin de la poblacin de inters, las unidades muestrales, el marco muestral, y la
forma en la que la muestra es seleccionada (Cassel et al., 1993b; Cochran, 1977; Kish, 1987; Lohr,
1999; Sarndal et al., 1992; Thompson, 2002; Yates, 1981).

No obstante, los diseos de muestreo medioambiental a menudo presentan desafos adicionales


que se identifican a continuacin. Estos incluyen la necesidad de una descripcin amplia de la
poblacin, el contexto espacial de la misma, la disponibilidad de informacin auxiliar, el uso de
marcos inadecuados, la dificultad de acceso a la poblacin, la existencia de mltiples objetivos a
analizar, incluyendo estado y tendencia del recurso, la evolucin de los objetivos y la necesidad de
satisfacer a mltiples interesados.
El enfoque de la mayor parte de la metodologa de encuestas es estimar el valor medio o total de la
poblacin. En contraste, una encuesta medioambiental a menudo tiene un objetivo ms general, tal
y como estimar la funcin de distribucin o la proporcin de poblacin en varias clases, por ejemplo,
la proporcin de lagos que cumplen con unos criterios de uso designados. Puede haber muchas
respuestas medioambientales de inters que son interdependientes.
Un objetivo comn de las encuestas medioambientales es la caracterizacin del estado de algn
recurso as como el cambio o la tendencia en ese estado. Estos dos objetivos tienen criterios de
diseo un tanto contradictorios: el estado generalmente se evala mejor mediante el muestreo de
tantos recursos como sea posible mientras que las tendencias generalmente estn afectadas por la
observacin de los mismos lugares en donde se encuentran los recursos a lo largo del tiempo. Con
frecuencia un segundo objetivo es la evaluacin de las relaciones entre atributos, tanto las medidas
en el lugar como las disponibles en el marco.
Una caracterstica de relevante importancia para las poblaciones medioambientales es que existen
en un contexto espacial. Por tanto, la variable respuesta tendr un patrn y estructura espacial. As
pues, lugares cercanos a otros tendern a tener sustratos fsicos similares y estarn sujetos a
situaciones de estrs similares, tanto naturales como producidas por actividades humanas. Es decir,
la variable respuesta puede estar influida por la topografa, la hidrologa y la meteorologa,
influencias que como hemos indicado con anterioridad tendern a inducir patrones espaciales en la
misma.
Otra importante caracterstica de las poblaciones medioambientales es que casi siempre se dispone
de alguna informacin auxiliar (adems de la localizacin). Actualmente, hay abundante informacin
detectada de forma remota, la cual est disponible a travs de satlites o fotografas areas, que
puede ser usada para estructurar el diseo muestral o en el anlisis.
Los recursos medioambientales son a menudo costosos y requieren de mucho tiempo para realizar
un muestreo. La logstica puede ser complicada, a menudo la poblacin de inters se encuentra
situada en lugares remotos, por ejemplo, lagos en zonas selvticas. Puede haber un tiempo y un
gasto de dinero considerable en viajar a esos lugares. Por otro lado, los costes de laboratorio para
analizar muestras de individuos pueden ser importantes. Algunas medidas medioambientales
pueden requerir mucho tiempo para evaluar, por ejemplo, la cuantificacin de la riqueza de las
especies y la estimacin del total poblacional (abundancia) de una muestra de macroinvertebrados
requiere de los servicios de un habilidoso taxonomista bentnico. Para un amplio programa, puede

pasar un ao o ms desde que los datos de campo son recogidos hasta que los anlisis del
laboratorio estn disponibles. Estos pueden estar sujetos a un error de medida ms sustancial que
el encontrado rutinariamente en otros tipos de encuestas. La falta de respuesta en el muestreo
medioambiental puede ser sustancial por razones como facilidad de acceso fsico, seguridad o
permisos.
Una complicacin prctica con la que frecuentemente nos encontramos en el muestreo
medioambiental es la dificultad para obtener un marco muestral preciso. En muchas ocasiones, los
marcos de muestreo disponibles incluyen una parte sustancial de elementos que no son objeto de
estudio o que no llegan a cubrir la poblacin por completo. El problema del marco se agrava por la
pura dificultad de recoger y analizar las muestras.
El muestreo medioambiental casi siempre se encuentra con un teln de fondo de consideraciones
polticas, econmicas y sociales de modo que las consideraciones estadsticas solo representan un
aspecto de un diseo muestral. Adems, debido a que los problemas medioambientales pueden
impactar en las poblaciones humanas, con frecuencia hay mltiples grupos, agencias y
organizaciones que tienen un inters en los productos de la encuesta. Los intereses de las mltiples
partes interesadas no siempre estn en la misma lnea. La confluencia de los intereses de las
mltiples partes interesadas, mientras se mantiene un diseo riguroso cientfica y estadsticamente,
puede ser un desafo.
En muchos casos, la necesidad de una muestra medioambiental estar motivada por la necesidad
de evaluar el estado de un recurso medioambiental a causa de la preocupacin por la potencial
degradacin. El diseo necesita abordar los problemas medioambientales actuales, pero eso no es
suficiente, ya que los problemas actuales finalmente sern resueltos, pero surgirn nuevos, en estos
momentos no identificados. Estos problemas se manifestarn de modos imprevisibles, y afectarn a
recursos que no pueden ser identificados ahora. Un programa de evaluacin medioambiental con los
dobles objetivos de estado y tendencia debe ser capaz de tener en cuenta la reagrupacin, la
recombinacin, la expansin y contraccin de la muestra para permitir que tales problemas que
surjan y los objetivos que se desarrollen sean abordados. Los problemas de marcos inadecuados, la
no respuesta y los datos perdidos, y la evolucin de los objetivos fuerzan una necesidad de diseos
muestrales con la flexibilidad de aadir, eliminar o redistribuir muestras.

En este trabajo nos centraremos como hemos indicado con anterioridad en las encuestas
medioambientales enfocadas a evaluar el estado, condicin o alcance de los recursos ambientales,
haciendo especial hincapi en los diseos muestrales utilizados para abordar el problema de la
estimacin del tamao de la poblacin en aquellos casos en los que se trabaja con poblaciones de
animales salvajes cerradas, problema que en ecologa se conoce con el nombre de estimacin de la
abundancia animal.

En concreto, el trabajo se estructura en dos grandes captulos:


Captulo 1.- En l se muestra la importancia del espacio en las encuestas medioambientales, la
necesidad de disponer de un buen marco muestral para seleccionar la muestra, los distintos tipos de
marcos y los problemas que presentan, as como algunos de los diseos muestrales desarrollados
para satisfacer los desafos que supone realizar un muestreo de poblaciones medioambientales.
Captulo 2.- El segundo captulo se centra en el problema de la estimacin de la abundancia animal,
tratando de ofrecer una visin unificada de los distintos mtodos de muestreo desarrollados para
ello. Entre ellos tenemos los mtodos de muestreo por parcelas, que son los ms simples ya que
involucran probabilidades de deteccin de los animales conocidas, los mtodos de eliminacin y
marca-recaptura, que requieren tanto la estimacin de la probabilidad de deteccin ( captura) como
de la abundancia pero sin presencia de heterogeneidad, los mtodos de muestreo de distancia, que
requieren de la estimacin de la probabilidad de deteccin y de la abundancia, as como de una
formulacin especfica simple de la heterogeneidad, los mtodos del vecino ms cercano y del
punto al objeto ms cercano, que esencialmente son mtodos de muestreo por parcelas en los que
el tamao de la parcela es una funcin de la densidad y por ltimo, se trata la modelizacin espacial
y temporal de la abundancia animal analizando modelos que permiten la estimacin de la
distribucin espacial y/o temporal cuando la deteccin de los animales es segura dentro de aquellas
zonas de la regin de estudio que son investigadas.

Captulo 1. El muestreo en poblaciones medioambientales.


En la seleccin de una muestra medioambiental juegan un papel importante conceptos como el
espacio, el marco muestral y el diseo muestral que analizaremos a continuacin.

1.1 Muestreo de poblaciones en el espacio


Histricamente, muchas muestras medioambientales han sido elegidas por conveniencia o
subjetivamente para ser representativas: ambos mtodos de seleccin tienen graves defectos
(Paulsen et al., 1998; Peterson et al., 1999). Para la seleccin de una muestra medioambiental
existen dos enfoques estadstica y cientficamente rigurosos ampliamente aceptados:
-

El basado en la probabilidad o en el diseo.

El basado en el modelo.

Estos dos enfoques surgen de diferentes bases tericas pero ambos pueden abordar el objetivo de
trabajo comn. En el muestreo basado en la probabilidad, a partir de una regla probabilstica que
permite seleccionar las unidades de la muestra, vamos a poder calcular la respuesta, la cual se ve
como fija pero desconocida, mientras que un enfoque basado en el modelo considera la respuesta
como una realizacin de un proceso aleatorio. En el muestreo medioambiental, usualmente estamos
interesados en un atributo de un recurso ambiental y un objetivo del diseo basado en la
probabilidad es estimar ese atributo. Paralelamente, un objetivo del diseo basado en el modelo es
predecir la salida del proceso y calcular el atributo a partir del resultado predicho.
Dado que el espacio juega un papel fundamental en el muestreo medioambiental, mucha de la
teora y de la prctica relevante se han ocupado de resolver el tema del muestreo espacial (la
unidad muestral no es un individuo sino un espacio). As, una serie de autores han investigado
diseos de muestreo en el espacio, de forma que los documentos que tienen una orientacin terica
del muestreo tienden a considerar solo poblaciones finitas, mientras que otros de ellos con una
orientacin estadstica espacial basada en el modelo consideran poblaciones continuas. Entre los
resultados obtenidos tenemos, por ejemplo, los de Overton y Stehman (1993) que compararon tres
diseos muestrales, el sistemtico, el aleatorio simple y el estratificado aleatorio de teselas,
contrastndolos en trminos de su precisin y propiedades de la varianza y llegando a la conclusin
de que la varianza en un muestreo estratificado aleatorio de teselas era inferior a la de un muestreo
sistemtico y a su vez sta es inferior a la de un muestreo aleatorio simple.

1.2 Definicin de marcos muestrales para poblaciones medioambientales


Tal y como hemos comentado con anterioridad otro aspecto importante a la hora de seleccionar una
muestra medioambiental es la definicin del marco muestral.

Si nos centramos en muestras obtenidas mediante un diseo muestral basado en la probabilidad, la


primera caracterstica de stas es que cada unidad de la poblacin tiene que estar definida de forma
explcita. Esta definicin se puede utilizar para desarrollar un marco para la poblacin objetivo, es
decir, es una forma de indicar qu elementos de la poblacin pueden ser seleccionados va un
proceso aleatorio. La construccin de un marco es el primer paso para cualquier muestra que use el
enfoque basado en la probabilidad, pero los marcos medioambientales pueden tomar algunas
formas distintas de las que usualmente encontramos en la metodologa de encuestas.
En caso de tener recursos ambientales discretos con unidades de muestreo distintas (tales como
lagos) sera posible, en teora, desarrollar una exhaustiva lista de todos los elementos del recurso.
La Encuesta de Lagos del Este, en ingls, Eastern Lake Survey (ELS) (Linthurst et al., 1986) y
la Encuesta de Lagos del Oeste, en ingls Western Lake Survey (WLS) (Landers et al., 1987), que
fueron llevadas a cabo por la Agencia de Proteccin Medioambiental de Estados Unidos
(Environmental Protection Agency (EPA)) como una parte del Programa Nacional de Evaluacin de
la Lluvia cida (National Acid Precipitation Assessment Program (NAPAP)), tomaron este
enfoque. As pues, el marco para estas encuestas se desarroll listando cada lago en la regin
objetivo a partir de los mapas topogrficos a escala 1:250.000 de la Encuesta Geolgica de los
Estados Unidos (U.S. Geological Survey (USGS)).
Un serio inconveniente que presenta un marco de lista es la cantidad de tiempo requerido para
construir la lista. Incluso en aquellas circunstancias afortunadas en las que existe un marco casi
confeccionado, debe dedicarse un esfuerzo considerable para verificar que el marco cubre
completamente la poblacin de inters sin que haya una excesiva inclusin de poblaciones que no
son objeto de estudio. Por ejemplo, en la Encuesta de Lagos del Este, los investigadores
descubrieron que muchas masas de agua representadas como lagos en los mapas de escala
1:250.000 eran de hecho pantanos, reas inundadas intermitentemente o lugares ensanchados de
una corriente de agua. Estas unidades no objetivo se pueden eliminar en el muestreo, pero
complican los procedimientos de estimacin de la poblacin. No hay una forma sencilla de
compensar las unidades de la poblacin objetivo que fueron omitidas de la lista.
Otras de las estrategias para el muestreo de recursos ambientales es desarrollar un diseo de
muestreo de reas basado en un marco muestral de una sola rea. En ese marco, la regin entera
que va a ser monitorizada es dividida en un conjunto de reas mutuamente excluyentes y
exhaustivas. A estas reas frecuentemente se les denomina unidades de muestreo primarias. La
particin de la regin puede estar basada en figuras geomtricas arbitrarias o en alguna
caracterstica del paisaje. Por lo general, las unidades de muestreo primarias son elegidas segn
lmites que son fcilmente perceptibles en el terreno, tales como carreteras permanentes,
ferrocarriles o ros. A partir de estas unidades de muestreo primarias se selecciona una muestra de
forma que cada unidad de muestreo primaria tiene probabilidad proporcional a su tamao de ser
elegida. Normalmente, se impone alguna restriccin en la eleccin de la muestra para asegurar la
dispersin espacial de la misma. Los recursos presentes en cada unidad de muestreo primaria de la
muestra son identificados, caracterizados y medidos.

Para la elaboracin de los marcos tambin se pueden utilizar bases de datos con informacin
auxiliar. Por ejemplo, los Estados Unidos disponen de bases de datos de uso y cobertura del suelo
que cubren todo el territorio por completo. Estas bases de datos pueden proporcionar informacin
auxiliar, tal y como el uso del suelo, forma del terreno, clasificacin del suelo, cubierta vegetal,
hidrologa y modificaciones inducidas por el hombre, que pueden ser usadas para estructurar un
diseo muestral. Tambin se dispone de informacin adicional a partir de las bases de datos
meteorolgicas existentes.
As, la Base de Datos Hidrogrfica Nacional (National Hydrography Database (NHD; USGS,
2000)) podra decirse que es la mejor fuente de informacin disponible sobre masas de agua en los
Estados Unidos, pero sin embargo no es un marco ideal. Aunque los atributos de los que dispone la
base de datos pueden utilizarse para identificar un subconjunto de la misma que ms se acerque al
objetivo de estudio, el subconjunto todava puede incluir muchas entradas no objetivo. Por ejemplo,
supongamos que el objetivo original fuera describir la poblacin de los lagos en California que
sustentan poblaciones de peces. La base de datos NHD tiene sobre 9.000 entradas identificadas
como lagos en California. Muchas de estas son muy pequeas (sobre 1.000 son menores a 1
hectrea y sobre 5.000 son menores a 5 hectreas). De hecho, muchas de las entradas ms
pequeas identificadas como lagos no lo son, son estanques de granjas, estanques de contencin
para el tratamiento de aguas residuales, o cuencas de filtracin intermitentes que estn secas la
mayor parte del ao.
Otra forma de construir un marco consiste en utilizar una rejilla para enmarcar a la poblacin que se
distribuye sobre alguna extensin espacial. La idea sera superponer la rejilla sobre una
representacin de la extensin espacial y luego muestrear en o alrededor de cada punto de la rejilla.
En este sentido, las rejillas sistemticas aleatorizadas tienen una larga historia de aplicacin en el
muestreo medioambiental.
Por el contrario, tambin puede darse el caso de que el mejor marco disponible pueda no incluir
alguno de los recursos objetivo. Por ejemplo, en sistemas de informacin geogrfica (SIG), la
cobertura de la poblacin objetivo es ms segura partiendo de fotos areas. El hecho de que la
cobertura sea til como marco poblacional depende de la habilidad del intrprete de la foto y del
cartgrafo. Por ejemplo, la mejor fuente de informacin del marco de humedales en los Estados
Unidos es el Inventario Nacional de Humedales (National Wetland Inventory (NWI; USFWS,
2002; http://www.fws.gov/nwi/)). No obstante, con este sistema puede ser muy difcil identificar
humedales en reas boscosas debido a que los rboles cubren a los humedales como si fueran un
toldo. De hecho, hasta el 50% de los humedales podran no estar incluidos en el inventario.
Con la disponibilidad de los SIG, las representaciones de mapas electrnicos son cada vez ms
comunes en poblaciones medioambientales. Si representamos un marco mediante un SIG, la
poblacin puede verse como una poblacin finita o continua de puntos. Por ejemplo, una lista de
coordenadas de los lagos se puede obtener a partir de la Base de Datos Hidrogrfica Nacional. Por
el contrario, un bosque, un gran estuario, o una red de arroyos pueden ser tratados como continuos.

10

Los lugares de muestreo se pueden identificar mediante la eleccin de puntos a partir de la


representacin SIG.
El uso de un SIG puede facilitar la conservacin del contexto espacial de los puntos de la muestra.
Como mnimo, el contexto espacial es la informacin necesaria para localizar un punto muestral en
el paisaje, por ejemplo, latitud y longitud. Sin embargo, hay una connotacin ms rica en toda la
informacin disponible sobre el paisaje, la cual tambin se adjunta a las coordenadas geogrficas:
regin ecolgica, uso del suelo, topografa del suelo, y as sucesivamente. Conocer el contexto
espacial de una muestra a partir de un recurso, esto es, conocer donde estn localizadas las
muestras y conocer su relacin espacial entre s proporciona el vnculo de proximidad para admitir la
evaluacin conjunta de mltiples recursos y evaluar los efectos del estrs con propiedades
espaciales conocidas. No obstante, sobre la combinacin de datos SIG de mltiples fuentes es
necesario advertir que los diferentes niveles de precisin pueden dar lugar a inconsistencias en el
marco muestral derivado. En este caso sera importante cuando se combinan mltiples fuentes de
datos comprobar si hay combinaciones inaceptables y eliminarlas antes de proceder.

1.3 Diseos para muestras medioambientales


El mtodo de muestreo ms simple y ms fcil de implementar es el muestreo aleatorio simple
(Cochran, 1977). Este mtodo es capaz de estimar los atributos o caractersticas de una poblacin y
la varianza utilizando frmulas simples. Sin embargo, en muy pocas ocasiones es apropiado su uso
ya que a la hora de seleccionar la muestra no hace uso de informacin auxiliar ni del conocimiento a
priori que se pueda tener sobre una poblacin. As pues, las muestras obtenidas mediante un
muestreo aleatorio simple sern ineficientes en comparacin con las obtenidas con otros mtodos
que usan el conocimiento sobre las caractersticas o estructura de la poblacin.
As pues, en este apartado se van a analizar diferentes tipos de diseos muestrales que se utilizarn
para muestreos medioambientales. Hay que indicar que todos ellos son diseos basados en la
probabilidad.

1.3.1 Diseos multietapa


En este tipo de diseos, un rea seleccionada en una etapa dada se divide posteriormente en
subreas y se selecciona una muestra a partir de las subreas. Una completa caracterizacin y
medicin tiene lugar slo en el conjunto de reas de orden ms bajo. Entre ellos tenemos:
1.3.1.1 Diseos espacialmente limitados
Estos diseos se basan en la idea de que siempre se tiene algn conocimiento a priori acerca de las
poblaciones medioambientales, el cual hay que utilizar ya que esa informacin a priori podra influir o
estar relacionada con la variable objetivo o respuesta.
Por ejemplo, un dato de informacin importante que siempre est disponible para las poblaciones
medioambientales es la localizacin. Adems como se indic al inicio del documento, las

11

poblaciones medioambientales siempre presentan una estructura espacial y un patrn. Luego esta
informacin se podra tener en cuenta para realizar un control espacial de elementos de la
poblacin. La ventaja del mismo deriva de la tendencia que tienen los elementos de una poblacin
medioambiental de ser ms similares a medida que estn ms cerca unos de otros y de ser ms
distintos a medida que estn ms lejos. Las observaciones de elementos que se encuentran cerca
unos de otros contienen informacin redundante. As, las muestras que estn bien dispersas en el
dominio de la poblacin tienden a dar lugar a estimaciones ms precisas de los atributos de la
poblacin que las muestras sin control espacial. Para lograr esa dispersin hay muchas tcnicas
entre las que se incluye el muestreo de reas, la estratificacin espacial, el muestreo sistemtico y el
basado en la rejilla, los marcos de listas estructurados espacialmente y los diseos espacialmente
equilibrados o balanceados.
1.3.1.2 Diseos espacialmente equilibrados o balanceados
La nocin de muestra equilibrada o balanceada fue introducida por Yates (1946). Una muestra de la
variable respuesta Z es equilibrada sobre una variable auxiliar X si los x-valores (que se conocen de
antemano) son elegidos de forma que la media muestral de los mismos es exactamente igual a la
media poblacional de X. Una versin ms estricta de equilibrio fue sugerida por Royall y Herson
(1973). sta requiere que varios de los primeros momentos muestrales de la x-muestra coincidan
con los momentos poblacionales. Lo que se intuye detrs de esta situacin de equilibrio es que la
variable auxiliar est correlacionada con la variable respuesta desconocida, que es la que vamos a
evaluar. Al mantener el equilibrio sobre la variable auxiliar, esperamos obtener un equilibrio
aproximado sobre la variable respuesta desconocida, y por tanto, obtener una estimacin ms
precisa que la que dara el muestreo aleatorio simple. Kott (1986) seal que una opcin intermedia
entre muestreo aleatorio y el equilibrio estricto se puede obtener dividiendo el rango de X en n
cuantiles y eligiendo un elemento de la muestra en cada cuantil. Aunque esta opcin no
logra el equilibrio en el sentido estricto de tener momentos muestrales coincidentes con momentos
poblacionales, da garantas de que la funcin de distribucin muestral de X se acercar a la
verdadera funcin de distribucin para cada muestra seleccionada. Esta es la idea subyacente de
todos los diseos muestrales estratificados. Debido a la correlacin entre X y Z, la esperanza es que
la muestra de Z ser ms precisa.
Si la variable auxiliar X es la localizacin, entonces decimos que una muestra ser espacialmente
equilibrada o balanceada si los momentos espaciales de las localizaciones de la muestra coinciden
con los momentos espaciales de la poblacin. Los dos primeros momentos espaciales son el centro
de gravedad y la inercia de una regin R.
El segundo momento espacial es anlogo a la matriz de covarianzas y mide la regularidad de la
forma de la regin R o del patrn de puntos formados por los puntos de muestrales.
En general, una muestra cuyo diseo est basado en la probabilidad no alcanzar el equilibrio
espacial exacto, pero el equilibrio espacial aproximado es una meta que vale la pena. Adems, la

12

discrepancia entre los momentos muestrales y los momentos poblacionales puede usarse como una
medida del equilibrio espacial de una muestra.
A todas las tcnicas que se describen a continuacin para lograr el control espacial les va mejor
en la consecucin del equilibrio espacial que al muestreo aleatorio simple.

1.3.2 Diseos estratificados


Consisten en dividir a priori la poblacin en subunidades o estratos y luego aplicar algn tipo de
diseo muestral dentro de cada estrato. La subdivisin responde a un conocimiento a priori de la
existencia de dichos estratos y de que el parmetro a medir est influido por ellos.
Los diseos muestrales casi siempre pueden ser mejorados introduciendo la estratificacin. Por
ejemplo, se pueden estratificar los marcos para asegurar la representacin en la muestra de
unidades con caractersticas concretas o para mejorar la precisin de las estimaciones. La
estratificacin segn dominios analticos de inters puede asegurar la representacin de cada
dominio, lo que mejora la estimacin en reas pequeas. Si las unidades dentro de los estratos son
ms homogneas que la poblacin en su conjunto, entonces los diseos estratificados (con los
estimadores correspondientes) pueden mejorar la precisin de la encuesta.
A continuacin, se describen una serie de diseos estratificados muy comunes en entornos
medioambientales.
1.3.2.1 Muestreo sistemtico
Cuando una poblacin puede ser numerada en orden o cubre un rea espacial bien definida, se
puede muestrear de manera sistemtica muestreando a intervalos regulares (tomando los
elementos pares de la poblacin o muestreando cada cierta distancia). Para que este tipo de
muestreo permita calcular errores de muestreo o realizar comparaciones entre poblaciones, se debe
cumplir el supuesto de que los puntos estn distribuidos al azar. Este tipo de muestreo es
generalmente ms fcil de llevar a cabo que los muestreos aleatorios.
Por ejemplo, para obtener la muestra de una red de arroyos, se puede colocar una rejilla sobre un
mapa que represente a la red, de forma que los puntos muestrales se pueden seleccionar a
intervalos regulares a lo largo de la rejilla empezando en la salida y trabajando a contracorriente. En
las confluencias ser necesaria una regla sobre la forma de proceder.
Un inconveniente potencial de las muestras sistemticas es que pueden alinearse con
caractersticas naturales del paisaje o caractersticas que son resultado de las actividades humanas
sobre

el

mismo.

Si

esas

caractersticas

tambin

influyen

en

la

respuesta,

entonces pueden dar lugar a una alta variabilidad de los estimadores. Este fenmeno suele darse en
relacin con variables respuesta peridicas o casi peridicas, pero tambin puede ocurre en
variables respuesta con una estructura de mosaico. Otra de las carencias de una muestra

13

sistemtica es su inflexibilidad. Errores del marco o sitios inaccesibles, no tienen cabida fcilmente
en estos diseos, ni son diseos de probabilidad variable. Finalmente, indicar que las muestras
sistemticas no dan lugar a frmulas de estimacin de la varianza insesgadas.
1.3.2.2 Diseos espacialmente estratificados
Uno de las formas ms populares de conseguir una muestra espacialmente dispersa es usar la
estratificacin espacial. Los estratos se definen como polgonos disjuntos que cubren el dominio.
Los estratos pueden ser figuras geomtricas regulares, tales como las celdas de la rejilla; polgonos
arbitrarios tales como regiones ecolgicas; fronteras polticas, tales como fronteras del estado o del
condado; o lmites naturales, tales como cuencas hidrogrficas. El mximo equilibrio espacial
generalmente ser alcanzado por dispersin mxima sobre el dominio, que a su vez se obtendr
eligiendo los estratos con pocas muestras por estrato. El objetivo de definir los estratos debera ser
tener una cantidad igual de recursos (nmero, longitud y rea) e igual nmero de muestras en cada
estrato, dando lugar a un diseo equiprobable Comnmente, las muestras son seleccionadas dentro
de los estratos usando un muestreo aleatorio simple, pero se podran haber utilizado otras tcnicas.
Si

el

diseo

no

es

equiprobable, entonces el objetivo debe seguir siendo tener un nmero constante de muestras por
estrato, aunque la cantidad de recursos por estrato puede variar.
La estratificacin mxima logra un buen control espacial, pero tener slo unas pocas muestras por
estrato limita la flexibilidad. Dadas las dificultades de muestreo medioambiental, sera muy posible
que se perdieran todas las muestras de un estrato debido a la inaccesibilidad. En caso de que las
muestras perdidas fueran reemplazadas, como podra hacerse si el muestreo aleatorio simple se
usara dentro de la seleccin de cada estrato, entonces la probabilidad de inclusin podra ser
sustancialmente diferente para ese estrato.
La formacin de los estratos con igual tamao e igual nmero de muestras suele ser sencilla para
diseos equiprobables y recursos objetivo bidimensionales pero puede ser problemtica para
recursos finitos de desigual tamao. Por ejemplo, los lagos a menudo son tratados como
poblaciones finitas para fines de muestreo. La distribucin del tamao de los lagos est fuertemente
sesgada hacia pequeos lagos (Larsen et al, 1994; Stevens, 1994). Una muestra equiprobable se
traducira en lagos en su mayora muy pequeos, que probablemente no sern los lagos de mayor
inters (es decir, los que son accesibles, los que apoyan la pesca recreativa o comercial, los que
apoyan otro uso recreativo, los que han desarrollado lneas de costa, o los que estn sujetos a
impactos del desarrollo). Adems, el patrn espacial de los lagos tiende a ser agrupado en lugar de
uniforme. Para obtener un beneficio de la estratificacin espacial, los estratos deben abarcar un rea
de influencia ms o menos homognea, por ejemplo, el uso/cobertura del suelo, el terreno, regiones
ecolgicas, y los impactos que son resultado de actuaciones humanas. Esto sugiere que los estratos
son espacialmente compactos, con pequeo permetro a razn del rea. La formacin de tales
estratos (espacialmente compactos con igual nmero de muestras) puede ser difcil. Stevens (1994)
describe un algoritmo usado por EMAP para formar los estratos espaciales de los lagos.

14

1.3.2.3 Diseos estratificados aleatorios de teselas


Un compromiso entre los diseos de muestreo aleatorio simple y los de muestreo sistemtico es un
diseo estratificado aleatorio de teselas. Este diseo se implementa colocando aleatoriamente una
rejilla sobre el dominio de la poblacin y seleccionando un punto al azar en cada celda de la rejilla.
Para un recurso lineal, el diseo es implementado dividiendo sistemticamente el recurso en
unidades con la misma longitud y luego eligiendo un punto al azar en cada unidad. Tambin se
puede aplicar a un recurso finito mediante la seleccin de una unidad al azar de entre las unidades
cubiertas por una celda de la rejilla. Aunque el diseo estratificado aleatorio de teselas da una buena
dispersin espacial tambin sufre de la misma falta de flexibilidad y del estimador de la varianza
insesgado al igual que el diseo sistemtico.

1.3.2.4 Tcnicas de direccin/orientacin espacial


Un mtodo que se ha utilizado para dispersar puntos en el espacio es inducir un orden lineal en los
puntos del espacio bidimensional, aplicar ese orden a los elementos de la poblacin, y luego, usar
un muestreo sistemtico entre la poblacin ordenada.
Algunos mtodos para crear orientaciones/direcciones espaciales se relacionan con el concepto de
curvas que rellenan el espacio, tales como la primera construida por Peano (1890). Wolter y Harter
(1990) han utilizado una construccin similar a la de Peano para construir una "clave de Peano" que
mantenga la dispersin espacial de una muestra de igual forma que se dispersan los eventos de
nacimientos y muertes de la poblacin subyacente. La clave de Peano es un ejemplo de direccin
espacial creada a travs de una funcin recursiva de cuadrantes (Mark, 1990). Sin prdida de
generalidad, podemos suponer que el dominio de poblacin bidimensional se ha reducido y
trasladado a una unidad cuadrada. Una funcin recursiva de cuadrantes (q-r) asigna el cuadrado
unidad al intervalo unidad y tiene la caracterstica de que los subcuadrantes de cualquier orden se
asignan a subintervalos. Como su nombre indica, una funcin q-r se define recursivamente.
Ilustramos la construccin de una funcin q-r con la clave Peano. En primer lugar, se divide el
cuadrado unidad en cuatro cuadrantes, que se etiquetan de 0 a 3, comenzando en la parte inferior
izquierda, luego procediendo hacia arriba, posteriormente diagonalmente hacia abajo, y luego hasta
el final en la parte superior derecha (ver Figura 1). El segundo paso consiste en dividir cada
cuadrante en cuatro subcuadrantes etiquetados en el mismo orden. En sucesivos pasos continua el
proceso de subdivisin de los subcuadrantes de forma que cada vez se van creando subcuadrantes
ms pequeos. La Figura 1 ilustra el proceso, con la subdivisin llevada a cabo slo en los primeros
subcuadrantes. Una direccin espacial se construye uniendo las etiquetas asignadas a los
subcuadrantes, empezando en la primera divisin y siguiendo la cadena. El nmero resultante se
trata como una fraccin en base 4. As, cada punto del subcuadrante rayado de la Figura 1 obtendr
una direccin que comienza con 0.001 4. Si este proceso fuera llevado a cabo de forma indefinida,

15

entonces el lmite es una funcin medible, 1-1, del cuadrado unidad al intervalo unidad (Stevens y
Olsen, 2004).

Figura 1

La funcin recursiva de cuadrante bsica se convierte en un mapa aleatorio mediante la


permutacin del orden en el que las etiquetas son asignadas a los cuadrantes, en cada ocasin
posible. Esta aleatorizacin, denominada aleatorizacin jerrquica (Stevens y Olsen, 1999),
conserva la naturaleza recursiva del cuadrante del mapa.
Stevens y Olsen (2004) usan particiones recursivas para desarrollar una tcnica muy general, el
mtodo estratificado aleatorio de teselas generalizado, que seleccione diseos espacialmente
equilibrados. El concepto subyacente de estos diseos es aplicar una particin recursiva para crear
una direccin espacial. En cada etapa, la probabilidad de inclusin total de cada celda se calcula
como la suma o integral de la probabilidad de inclusin de todos los elementos de la poblacin
dentro de la celda. La probabilidad de inclusin no tiene que ser constante y se pueden tener en
cuenta diseos de probabilidad variables muy generales.

16

La recursividad contina hasta que cada celda tiene una probabilidad de inclusin total menor que
uno y posteriormente se aplica una aleatorizacin jerrquica. El proceso se ilustra en la Figura 2.

Figura 2

La parte (a) de la figura muestra las q-r direcciones de las primeras 16 celdas, con una lnea de
conexin de las celdas siguiendo el orden q-r. En la parte (b), la ruta conecta las celdas siguiendo un
orden aleatorio jerrquico. A cada celda se le asigna una longitud igual a su probabilidad de inclusin
y a continuacin, las longitudes se conectan entre s formando una lnea con una longitud igual al
tamao de la muestra total. A lo largo de la lnea se ha seleccionado se muestra sistemtica. Debido
a la naturaleza 1-1 de un mapa cuadrante recursivo, cada punto de la lnea se corresponde con
algn elemento de la poblacin, por lo que los puntos seleccionados en la lnea se pueden asignar a
determinados elementos de la poblacin.

1.3.3 Otros diseos muestrales


1.3.3.1 Muestreo adaptativo
Algunas poblaciones medioambientales tienen una estructura espacial que hace que sea difcil
extraer una muestra de manera eficiente, incluso cuando se utilizan estratagemas para mantener el
equilibrio espacial. Por ejemplo, las poblaciones biolgicas con frecuencia se presentan agrupadas:
los individuos del mismo tipo o especie tienden a agruparse juntos. Una tcnica potencial para
mejorar la eficiencia de la muestra para poblaciones es el muestreo adaptativo (Thompson, 1990,
1991b). El muestreo adaptativo permite modificar la muestra basada en la informacin que se
recoge.
La idea bsica se ilustra mejor con un ejemplo. Supongamos que se coloca sobre el dominio de
alguna poblacin agrupada una rejilla cuadrada regular. Por otra parte, supongamos que estos

17

grupos tienden a ser de un tamao que abarca varias celdas de la rejilla de modo que el rea de la
celda de la rejilla es sustancialmente menor que el tamao medio del grupo. Una muestra inicial de
celdas de la rejilla se selecciona y se visitan, y la respuesta (por ejemplo, el nmero de individuos de
las especies objetivo en la celda de la rejilla) se registra para cada celda. Si la respuesta satisface
algunos criterios (por ejemplo, el nmero de individuos observados es positivo, o mayor que un
nmero), entonces las celdas adyacentes se aaden a la muestra. Esta secuencia de
observacin/aumento contina hasta que no se observa nuevamente una celda que cumpla los
criterios de activacin del aumento.
La muestra resultante presenta algunas dificultades de anlisis, porque la probabilidad de inclusin
de una celda es imposible calcularla sin el conocimiento completo de la estructura de la poblacin,
que no est disponible. Thompson (1990) muestra cmo obtener algunos pesos modificados que
permiten estimaciones insesgadas del total utilizando un estimador similar al estimador de HorvitzThompson. Christman (1997) compara la eficiencia de varios diseos para muestrear poblaciones
agrupadas y concluye que el muestreo adaptativo es un esquema de muestreo eficiente para
poblaciones raras agrupadas, cercanas entre s (Chao y Thompson, 2001).
Tambin hay algunas dificultades en la aplicacin del muestreo adaptativo en el campo. La regla
para aadir celdas a la muestra debe ser formulada antes de que comience el muestreo y debe
continuar en el campo. En particular, los nuevos lugares vecinos deben ser aadidos tan pronto
como el lugar que se acaba de observar cumpla con los criterios. Algunos investigadores han
informado de que ha llegado a tamaos de muestra incontrolables (Hanselman et al, 2003; Kimura y
Somerton, 2006). Thompson (2006) ha ampliado recientemente los criterios de parada permisibles
para un mayor control sobre la evolucin de la muestra. En particular, la nueva metodologa permite
al investigador asegurar un tamao de muestra fijo. Sin embargo, el procedimiento puede ser
computacionalmente intenso.
1.3.3.2 Diseos muestrales para la estimacin de la abundancia animal
Estos diseos pretenden estimar el nmero de individuos cuando se trabaja con poblaciones de
animales salvajes cerradas, es decir, no se producen incorporaciones o traslados de la poblacin
durante el perodo de observacin. Entre ellos tenemos:
-

Muestreo por parcelas

Mtodos de eliminacin, captura-esfuerzo y change-ratio

Mtodos de marca/recaptura

Muestreo de distancia: muestreo de transectos de lnea, muestreo de transectos de punto,


otros mtodos.

Mtodo del vecino ms cercano y mtodo del punto al objeto ms cercano

18

Modelos espacio temporales con deteccin segura

En el siguiente captulo se analizar en profundidad cada uno de ellos.


1.3.3.3 Diseos para la evaluacin de la tendencia o del estado y la tendencia
Se dispone de tcnicas estadsticas poderosas y sofisticadas para identificar y poner a prueba
cambios en los parmetros de la poblacin como, por ejemplo, pruebas de cambio en la media.
Tambin se tienen tcnicas para identificar y cuantificar la tendencia en un solo lugar o en un solo
parmetro, por ejemplo, podemos cuantificar la tendencia en alguna concentracin qumica en una
determinada estacin de muestreo o la tendencia del valor medio de varias estaciones de muestreo,
mediante el ajuste de un modelo de regresin que incluye un trmino dependiente del tiempo. Sin
embargo, las nociones de cambio regional y especialmente de tendencia regional son mucho menos
entendidas. Duncan y Kalton (1987) identificaron varios tipos de cambio que podran ser abordados
mediante el muestreo de una poblacin a lo largo del tiempo. Aunque la discusin se orient hacia
las poblaciones humanas, los siguientes tipos de cambio que se identificaron son relevantes para las
poblaciones medioambientales:
-

Variacin bruta: es el cambio de lugar entre dos perodos de tiempo.

Cambio promedio durante varios perodos de tiempo: puede hacer referencia a la tasa de
cambio o tendencia en un lugar (en oposicin al cambio o tendencia regional).

Inestabilidad individual: es una medida de la varianza en un lugar, posiblemente corregida


por la tendencia.

El concepto estadstico tradicional es el cambio en un parmetro de la poblacin, donde el


parmetro poblacional habitual de inters es la media. El cambio se describe tomando una muestra
de la poblacin y estimando los parmetros en distintos puntos en el tiempo. Las estimaciones
resultantes se analizan para el cambio/tendencia, por ejemplo, con series temporales o mtodos de
regresin o tests de diferencias significativas.

19

Captulo 2. El problema de la estimacin de la abundancia animal.


Todos los mtodos considerados en este captulo tienen una caracterstica en comn y es que
estiman la abundancia animal mediante el mtodo de mxima verosimilitud, por lo que se necesita
construir una funcin de verosimilitud que va a ser la que proporcione el enlace entre lo que se
observa y lo que se quiere estimar. Esta funcin se construye en base a unos modelos estadsticos
denominados modelo de estado y modelo de observacin que conjuntamente van a describir cmo
se generan los datos observados dada una regin investigada. Estos mtodos sern ms simples o
ms complejos en funcin del diseo de muestreo. Para ms detalle sobre estos modelos se puede
consultar el Anexo, apartados 1 y 2.
Independientemente del mtodo utilizado para estimar la abundancia de una poblacin, las
estimaciones obtenidas a partir de cada uno de ellos van a ser distintas siendo ms o menos fiables
dependiendo de las circunstancias en las que se desarrolle el estudio.
Para ilustrar algunos de estos mtodos se va a considerar la poblacin de St. Andrews, la cual se
describe a continuacin: los datos de esta poblacin proceden de inspecciones independientes
realizadas por 8 observadores diferentes de una poblacin de 250 grupos de tees de golf (760
individuos). Los tees, de dos colores (amarillos y verdes), fueron colocados en grupos de entre 1 y 8
en una regin de estudio de 1680m2, unos por encima del csped y otros escondidos entre l. Cada
grupo de tees de golf se trata como un solo animal (o planta), con tamao igual al nmero de tees
en el grupo; los tees amarillos son machos y los verdes hembras; los que sobresalen por encima del
csped se clasifican como visibles y los otros como no visibles.

2.1 Muestreo por parcelas


Nos referimos al muestreo por cuadros, por bandas y a los mtodos similares en general con el
nombre de muestreo por parcelas. Todos estos mtodos aunque pueden ser diferentes en su
implementacin, desde el punto de vista estadstico casi todos son idnticos. El muestreo por
cuadros y el muestreo por bandas implican parcelas rectangulares, pero en algunas aplicaciones
tambin son comunes las parcelas circulares. Su caracterstica esencial desde una perspectiva
estadstica es que todos los animales dentro de las parcelas investigadas (cualquiera que sea la
forma) son detectados.
Cuando se investiga la regin completa, es decir, la regin inspeccionada coincide con la regin de
estudio, y todos los animales son detectados se tiene un censo o recuento completo. Este no es el
caso que se va a tratar en este trabajo sino que se van a considerar aquellos estudios por parcelas
en los que la regin inspeccionada es ms pequea que la regin de estudio.
As pues, de acuerdo a un diseo muestral se seleccionar un subconjunto de parcelas o bandas
dentro de la regin de estudio que formarn la regin inspeccionada y el problema ser entonces
estimar el nmero total de animales en la regin de estudio a partir de los animales que se detectan

20

en la regin inspeccionada, teniendo en cuenta que en este tipo de muestreo se asume que los
animales se distribuyen uniforme e independientemente en la regin de estudio.

2.1.1 Estimacin mximo verosmil


La estimacin de N basada en la verosimilitud se fundamenta en la aleatoriedad de las
localizaciones de los animales o grupos de animales, y esto se especifica en el modelo de estado.
Ntese que en el muestreo por parcelas no hay aleatoriedad que se pueda cuantificar con el modelo
de observacin ya que la probabilidad de deteccin o captura est asegurada en la regin
inspeccionada. Conceptualmente, las posiciones de cada animal o grupo de animales estn
controladas por el verdadero modelo de estado, que es desconocido y las posiciones en el momento
de la investigacin son justamente una realizacin de este proceso aleatorio.
2.1.1.1 Estimacin puntual
Si es igualmente probable que un animal o grupo de animales est en cualquier lugar de la regin de
estudio de rea A, se tiene que la probabilidad de que el grupo est en la regin inspeccionada de
rea a es justamente:

a
A

(2.1)

Si las localizaciones de los grupos son independientes y se piensa en el suceso grupo que est en
la regin inspeccionada como un xito, entonces el nmero de grupos en la regin inspeccionada,
n, es una variable aleatoria binomial con parmetros N y c , cuya funcin masa de probabilidad
viene dada por:

N n
c (1 c ) N n
f n, N, c
n

(2.2)

y por tanto, la funcin de verosimilitud se expresa como:

N n
c (1 c ) N n
L N
n

(2.3)

de donde se tiene que el estimador mximo verosmil (EMV) de N es justamente:

n
nA
N

c
a

(2.4)

2.1.1.2 Estimacin por intervalos


Estimacin paramtrica

21

se distribuye normalmente, entonces un intervalo de confianza estimado al


Si se asume que N
95% para N viene dado por:

N 1,96 se N , N 1,96 se N
Sin asumir normalidad tambin se pueden calcular intervalos de confianza al 95% para N utilizando
que n sigue una distribucin binomial de parmetros N y p. En esta situacin se pueden construir
intervalos de confianza exactos, intervalos de confianza de la verosimilitud maximizada (profile
likelihood) o intervalos de confianza obtenidos a partir de un bootstrap paramtrico (ver apartado 3
del Anexo para ms informacin sobre la tcnica de remuestreo bootstrap). Todos ellos se basan en
el modelo de estado de ecuacin (2.3) con c =

a
.
A

Estimacin no paramtrica
Si se aplica un bootstrap no paramtrico para remuestrear las unidades del diseo (bandas en este
caso), no es necesario asumir que las localizaciones de los animales son independientes. Esta
tcnica se puede utilizar de formas distintas. Por ejemplo, podemos asegurarnos que cada muestra
bootstrap muestree aproximadamente la misma proporcin de la regin de estudio que la muestra
original o alternativamente, podemos asegurarnos que todas las muestras tengan el mismo nmero
de bandas que la muestra original. Este ltimo procedimiento es ms simple e involucra los
siguientes pasos:
1.

Para la muestra i, i = 1, , B, se eligen J parcelas, con reemplazamiento a partir de


aquellas muestreadas, donde J es el nmero de parcelas muestreadas en el diseo original.

2.

ni
Se calcula el EMV para la muestra i: N i
, donde ni es el nmero total de grupos de

ci

animales en las J bandas remuestreadas, ai es la suma de las reas de las bandas


remuestreadas y ci =

ai
.
y se almacena N
i
A

3.

Los pasos 1 y 2 se repiten B veces, donde normalmente B podra estar entre 400 y 2000.

4.

como sigue:
Se calcula la media y la varianza de los B N
i
B

N b

N i

i 1

N
B

Va r b

i 1

N b

(2.5); (2.6)

B 1

22

5.

Se estima un intervalo de confianza al 95% para N por

( j ) , N(k )

donde

j B 1 0,025 y k B 1 0,975 y la notacin N


( j ) y N ( k ) indican los j-simo y

, respectivamente.
k-simo mayores N
i
, usualmente se utiliza ms que la media
La estimacin puntual basada en los datos originales, N
) se estima por Va
. La Var (N
).
r b (N
bootstrap, N
b
b

2.1.2 Efectos producidos al violar las hiptesis


Las hiptesis que se han hecho en relacin a este mtodo para obtener la estimacin de la
abundancia animal son dos:
Hiptesis 1.- Todos los animales en la regin inspeccionada son detectados.
La violacin de esta hiptesis hace que el estimador sea negativamente sesgado por un factor igual
a la probabilidad de que un animal sea detectado en la regin inspeccionada.
Hiptesis 2.- Los animales se distribuyen uniforme e independientemente unos de otros, es decir,
cualquier animal tiene la misma probabilidad de estar en cualquier lugar de la regin de estudio y su
colocacin no afecta a donde se siten los otros.
Muchas poblaciones de animales no se distribuyen independientemente unos de otros, sino que
tienden a agruparse o en el caso de animales altamente territoriales se evitan unos a otros. Los
intervalos de confianza basados en la hiptesis de que los animales estn uniformemente
distribuidos sern demasiado estrechos (si los animales estn agrupados), o demasiado amplios (si
los animales estn distribuidos ms regularmente). Estos sern similarmente sesgados si la
hiptesis de que las localizaciones de los animales son independientes se viola, siendo demasiado
estrechos si hay correlacin positiva en sus localizaciones, y demasiado amplios si hay correlacin
negativa.

23

2.2 Mtodos de eliminacin, captura-esfuerzo y change-in-ratio


En el apartado anterior, slo se trat con mtodos de estimacin de la abundancia en los que p era
conocida e igual a uno. En este captulo el escenario comn que se considera es aquel en el que ni
N ni p son conocidos. En esta situacin, el nmero de estudios requeridos es por lo menos dos. Se
asume completa cobertura de la regin de estudio, luego no va a existir modelo de estado y la
probabilidad de deteccin captura va a ser la misma para todos los animales todas las veces que
se realice el estudio o slo va a depender de las variables relativas a este. Adems, las detecciones
capturas van a ser independientes.
Supongamos pues que un primer observador realiza una inspeccin completa de la regin de
estudio y captura un nmero n de animales. Ntese que como se ha investigado por completo la
regin no es necesario plantear un modelo de estado para extrapolar inferencias sobre el nmero de
animales existente en alguna regin no inspeccionada. Por otro lado, el diseo muestral no
introduce ninguna aleatoriedad ya que en este caso este consiste en investigar en cualquier lugar.
Luego, toda la aleatoriedad est contenida en el modelo de observacin, para el cual se asume que:
1.

Todos los animales tienen la misma probabilidad de ser capturados o detectados. Esta
probabilidad vale p y es desconocida.

2.

Los animales son capturados o detectados independientemente unos de otros.

A partir del primer estudio la nica parte de los datos til es el nmero de detecciones, n, pero no
hay forma de saber si este nmero representa una gran proporcin de una baja abundancia ( p
grande y N pequeo) o una pequea proporcin de una gran abundancia (p pequeo y N grande).
Lo que s est claro es que no se pueden estimar los dos parmetros desconocidos N y p con una
sola parte de los datos (n).
Las hiptesis sobre el modelo de estado anteriores llevan a una funcin de verosimilitud binomial de
dos parmetros N y p. Por tanto, para poder utilizar el mtodo de mxima verosimilitud y encontrar
los nicos N y p ms probables, dado un nmero de detecciones, n, se van a necesitar datos
adicionales que pueden proceder de algn estudio adicional y/o hiptesis adicionales.

2.2.1 Mtodo de eliminacin


2.2.1.1 Estimacin puntual

24

Este mtodo implica examinar la regin de estudio completa y eliminar un nmero conocido de
animales en despus del primer estudio. A continuacin, la regin es estudiada por segunda vez,
manteniendo constante la probabilidad de deteccin. El tamao de la reduccin del nmero de
detecciones entre la primera y la segunda vez que se realiza el estudio contiene informacin sobre
N (y la probabilidad de deteccin). Por ejemplo, si el nmero de detecciones es prcticamente el
mismo en las dos ocasiones en las que se examina la regin, a pesar de haber eliminado un gran
nmero de animales cada vez, esto sugiere que el nmero de animales eliminado era una
proporcin insignificante del nmero total. Por tanto, el tamao de la poblacin total debe de ser
grande.
Para ilustrar este hecho se van a usar los datos de la poblacin de St. Andrews. Supongamos
entonces que un primer observador elimina los 64 animales que detecta. De los animales restantes,
33 fueron detectados por un segundo observador. Ahora la informacin que se tiene sobre los datos
es n1 = R2 = 64 y n2 = 33, donde R2 denota el nmero total de eliminaciones al inicio del segundo
estudio.
La nueva informacin sobre los datos n2 = 33 nos dice que si los dos observadores vieran
exactamente la misma proporcin de la poblacin presente en el momento de sus estudios,
entonces el nmero de animales presentes en el momento en el que se realiza el segundo estudio,
N2, debe ser

33

64

del nmero de animales presentes en el momento en el que se lleva a cabo el

primer estudio (el cual se denota por N1 slo N). Esto es:

N2 =

33
N
64

Tambin se sabe que al comienzo del segundo estudio hay 64 animales menos, luego se tiene que:

33
N = N-64
64

=
Resolviendo esta ecuacin para N se obtiene la estimacin N

(64) 2
= 132 (por el entero ms
64 33

viene dado por:


cercano). En general, para algn n1 y n2, se tiene que el estimador N

=
N

n12
n 1 n 2

(2.7)

La Figura 3 muestra grficamente cmo funciona el estimador:

25

Figura 3

La probabilidad de eliminacin constante, p, y la abundancia, N, especifican conjuntamente la curva


de eliminaciones acumuladas predichas que se puede observar en la figura (lnea slida). El
estimador encuentra la curva (esto es, el N y el p) que mejor se ajusta a las eliminaciones
observadas (puntos del grfico) en trminos de la verosimilitud. El punto en el que la curva es
horizontal es aquel en el que el modelo predice que la poblacin entera ha sido eliminada. La altura
de la curva en este punto es la abundancia estimada.
Resumiendo, para construir el estimador ha sido necesario:
1.

Considerar una parte adicional de los datos, n2.

2.

Asumir que ambos observadores vieron exactamente la misma proporcin de los animales
presentes.

Aunque (2) no asume que se conoce la proporcin, esta hiptesis es todava fuerte y difcil de creer.
Una hiptesis ligeramente ms creble es que los dos observadores son igual de buenos en media.
Esto es, se asume que para los dos observadores la probabilidad de deteccin, p, es la misma
aunque en algn estudio particular, el primero podra detectar una proporcin ms alta que el
segundo, o viceversa. Esta hiptesis es la base del mtodo de eliminacin simple con dos muestras.
2.2.1.2 Estimacin mximo verosmil mediante el mtodo de eliminacin simple
Supongamos que para un estudio dado se asume que:
1.

Todos los animales son detectados (capturados) con la misma probabilidad p.

2.

Las detecciones son sucesos independientes.

Entonces, a partir de un solo estudio la verosimilitud para N y p viene dada por la ecuacin:

N n
p (1 p ) N n
L N n, p
n

(2.8)

26

con N y p ahora desconocidos. Considerando las hiptesis adicionales de que:


3.

Las detecciones (capturas) son independientes cada vez que se realiza un estudio.

4.

La probabilidad de deteccin (captura), p, es la misma todas las veces.

la verosimilitud para N y p es justo el producto de las verosimilitudes de cada estudio individual. As


pues, con S estudios realizados en total, en los cuales se eliminaron un total de Rs animales al inicio
del estudio s y ns animales fueron detectados en el estudio s, la verosimilitud viene dada por:

L(N, p n, R )

L(N, p n s , R s )

s 1

N s ns
p (1 p ) Ns ns
ns
s 1

(2.9)

donde n, R = (n1, R1), ,( nS, RS), N N1 y R1 = 0.


A partir de ella se obtienen los estimadores mximo verosmiles de N y p, los cuales satisfacen las
dos ecuaciones siguientes:

p
n
1
(1 p )S y
N

n
S

(N R

(2.10)

s 1

donde n es el nmero total de detecciones en las S veces que se realiza el estudio. Es fcil
comprobar que el EMV de N del mtodo de eliminacin simple con dos muestras es idntico al
estimador construido de forma intuitiva de la ecuacin (2.7) y que el correspondiente EMV de p es:

n1 n2
n1

(2.11)

Es evidente que el estimador del mtodo de eliminacin con dos muestras falla cuando n2 n1 ya
que la probabilidad p no puede ser negativa; tampoco puede ser cero (lo cual ocurre cuando

n2 n1 ). Este fallo puede ocurrir incluso verificndose todas las hiptesis del modelo y constituye
una limitacin del mtodo. Otra consideracin a tener en cuenta es que es probable que no
produzca buenas estimaciones cuando la probabilidad de deteccin p es pequea. Adems en el
caso de que la poblacin sea heterognea las estimaciones tendern a ser negativamente sesgadas
ya que los animales que tienen ms posibilidad de ser capturados tendern a ser eliminados primero
y las probabilidades de deteccin de los animales no eliminados tienden a hacerse ms pequeas
despus de cada proceso de eliminacin.
2.2.1.3 Estimacin por intervalos
Intervalo de confianza por aproximacin normal

27

En la situacin en la que nos encontramos se sabe que toda la incertidumbre surge del proceso de
observacin, por lo que las estimaciones de la varianza y las estimaciones por intervalos de
confianza solo estn basadas en el modelo de observacin, que se define como el producto de
funciones de densidad binomiales (ecuacin 2.9). Seber (1982, pg. 312) da las siguientes
:
y p
expresiones para las varianzas asintticas de N

Var N

Var p

N (1 q S )q S

(2.12)

(1 q S ) 2 ( pS ) 2 q S 1

(qp ) 2 (1 q S )

N q(1 q S ) 2 ( pS ) 2 q S

(2.13)

donde q = 1-p.
Como ni N ni p se conocen las varianzas pueden ser estimadas sustituyendo en estas ecuaciones N
y los intervalos de confianza se pueden construir asumiendo que tanto N
y p
como
y p por N
se distribuyen normalmente, luego se definen por:
p

N 1,96 se N , N 1,96 se N
p 1,96 se N , p 1,96 se N
Intervalo de confianza de la verosimilitud maximizada (profile likelihood)
Hasta ahora se han estudiado los intervalos de confianza de la verosimilitud maximizada con un
parmetro desconocido. En este caso la verosimilitud maximizada coincide con la verosimilitud. La
verosimilitud del mtodo de eliminacin simple implica dos parmetros desconocidos N y p.
La verosimilitud maximizada para N es la funcin de verosimilitud evaluada en N y en un valor
particular de p que se puede calcular a partir de N. As pues, para un N dado, el valor de p se denota
N y va a ser el que maximice la verosimilitud para N.
por p

Para el mtodo de eliminacin simple con S = 2, viene dado por:

p N

n1 n 2
2N n1

(2.14)

Intervalo de confianza del mtodo percentil


Para implementar un mtodo bootstrap que nos permita estimar un intervalo de confianza para N se
necesitan tener en cuenta las fuentes de variacin. Como se ha comentado con anterioridad, el

28

diseo muestral de este mtodo consiste en investigar la regin de estudio por completo, as que
hay una nica unidad muestral, la regin completa. En consecuencia, un bootstrap no paramtrico
simple que utiliza a esta como unidad de remuestreo no se debe usar ya que reproducir los datos
originales todo el tiempo. Por tanto, la nica fuente de variacin se debe a la aleatoriedad en el
proceso de observacin y para capturarla se puede usar un procedimiento bootstrap que obtiene
muestras a partir de una muestra original utilizando el modelo ajustado al proceso de observacin.
As pues, si se conocen N y p, entonces se podra simular un gran nmero de ensayos en el
ordenador (generando muchos pares de valores n1 y n2) y luego calcular las correspondientes
estimaciones de N. Sin embargo, ni N ni p se conocen, por lo que para calcular un intervalo de
confianza para N al 95% se va a utilizar el mismo procedimiento que se ha descrito antes, slo que
, en lugar de N y p. Las estimaciones bootstrap de N se ordenan y se
y p
se considerarn N

obtienen los lmites de confianza del percentil.


El procedimiento bootstrap no paramtrico es muy similar al paramtrico ya que tambin calcula B

. La nica diferencia
estimaciones generando B muestras a partir de una poblacin de tamao N
es que ahora se usa un mtodo distinto para generar las muestras.

animales se le asigna una historia de captura de forma que


En primer lugar, a cada uno de los N
- n1- n2 animales, que nunca fueron capturados, se les
en un estudio con dos muestras, a los N
asigna la historia de captura (0,0), a los n1 animales capturados la primera vez se les asigna la
historia (1,0) y a los n2 animales capturados la segunda vez se les asigna la historia (0,1). Para
generar un estudio bootstrap se selecciona una muestra aleatoria simple, con reemplazamiento, a

animales y se anotan sus historias de captura. A partir de estas se pueden calcular


partir de los N
* . Ahora como en el caso paramtrico, se trata
los valores n1* y n 2* de este estudio y por tanto N
de obtener las mayores estimaciones de N tales que por debajo y por encima de estas se queden

generados por el ordenador. Estas dos estimaciones proporcionan


fuera el 2.5% de los valores N
un intervalo de confianza al 95% para N.

2.2.2 Mtodo de captura-esfuerzo


Si se llevan a cabo algunos estudios en los que se realiza mucho esfuerzo en capturar animales, la
hiptesis de que p es constante puede ser errnea. Lo lgico es que cuanto mayor sea el esfuerzo
realizado mayor sea la proporcin de animales capturados. Luego, la probabilidad de deteccin en
cada estudio se asume que depende de una medida del esfuerzo realizado en este. El mtodo de
captura-esfuerzo para poblaciones cerradas no es ms que una simple extensin del mtodo de
eliminacin que intenta explicar este hecho y para ilustrarlo se puede utilizar el ejemplo de la
poblacin de St. Andrews.

29

Supongamos por tanto que se van a llevar a cabo tres estudios de forma que el primero lo realiza un
nico observador (observador 1), el segundo lo realiza un equipo de dos observadores
(observadores 2 y 3) y el tercero lo realiza un equipo formado por 5 observadores (observadores 4,
5, 6, 7 y 8). Sea l s el nmero de personas que forman un equipo en el estudio s, luego l1 = 1, l2 = 2
y l3 = 5. En esta situacin se espera que el nmero de animales capturado por los dos observadores
sea mayor que el capturado por uno solo, pero inferior al capturado por los cinco. Esto se puede
comprobar en la Figura 4, que muestra los animales detectados por cada uno de los tres equipos
frente al tamao del equipo ( l s ).Tngase en cuenta que no se han eliminado animales por ningn
equipo.

Figura 4

La hiptesis considerada en el mtodo de eliminacin simple sobre la igualdad de la probabilidad de


deteccin en cada estudio es claramente violada en este caso. Nos planteamos entonces cmo se
puede utilizar el conocimiento que se tiene sobre el esfuerzo realizado en cada estudio. Para ello, lo
que se hace es modelizar la probabilidad de deteccin como una funcin del esfuerzo, para ver de
qu forma influye este en aquella. Aunque no se tiene conocimiento de que esta relacin exista
realmente, sera deseable que la funcin sea tal que permita que la probabilidad de deteccin tienda
a cero cuando el esfuerzo tiende a cero, para convertirse en uno con suficientes observadores y que
pase lo ms cerca posible del nmero de animales capturados por cada equipo.
Una posible candidata es la frmula funcional:

p l s = 1- exp l s

(2.15)

donde l s es el nmero de observadores, en el estudio s y son parmetros desconocidos ya que


no se sabe cmo afecta el esfuerzo a la probabilidad de deteccin y van a ser estimados ajustando
la funcin a los datos (maximizando la apropiada verosimilitud, por ejemplo).

30

La Figura 4 muestra la funcin de deteccin ajustada (la que est ms prxima a los puntos) junto
con otros dos ejemplos de funciones de deteccin con la misma frmula funcional pero diferentes
valores de los parmetros.
Hasta este momento no se han llevado a cabo eliminaciones de animales. En la prctica esta
situacin no se da y lo comn es que el mtodo involucre la eliminacin de todos los animales
detectados (por ejemplo, pesca para el consumo, caza, etc.). As pues, si hacemos que los tres
equipos de observadores del ejemplo eliminen los animales que detectan, el nmero de detecciones
de los animales restantes es muy distinto al de la Figura 4 (ver Figura 5).

Figura 5

A pesar de que se doble el esfuerzo cada ocasin que se realiza el estudio, el nmero de
detecciones cae de una ocasin a la siguiente. La captura por unidad de esfuerzo (ns/ls) (CPUE) cae
drsticamente entre ocasiones como muestra la Figura 6. Esto nos indica que el tamao de la
poblacin va disminuyendo sustancialmente de una ocasin a otra ya que una proporcin sustancial
de la poblacin restante se ha eliminado en cada ocasin.

Figura 6

A consecuencia de las eliminaciones la relacin entre la probabilidad de deteccin y el esfuerzo


visualmente ya no es clara, aunque por otro lado, conocidas las eliminaciones se tiene informacin
adicional sobre la abundancia.

31

A continuacin se va a introducir la funcin de verosimilitud para este escenario.


El mtodo de captura-esfuerzo se basa en las mismas hiptesis que el mtodo de eliminacin, pero
permite que la probabilidad de deteccin de cada estudio dependa de una medida del esfuerzo que
se realiza en estos. Esta medida puede ser el nmero de personas o trampas utilizadas, el tiempo
empleado en la investigacin o alguna otra apropiada. La funcin de verosimilitud en este caso es
una extensin simple de la del mtodo de eliminacin, donde la probabilidad de deteccin constante,
p, se ha reemplazado por

p l s - una funcin del esfuerzo, ls. Luego se tiene:

L(N, n, R )

Ns
p( l s ) ns (1 p(l s ))Ns ns
n
s
s 1

(2.16)

donde n, R = (n1, R1), ,( nS, RS), Ns es el tamao de la poblacin o abundancia en el estudio s y

es el vector de parmetros desconocidos de

Las frmulas funcionales para

p l s .

p l s dependen de la aplicacin y de las hiptesis que se hagan

sobre el proceso de deteccin. Por ejemplo, si ls es el nmero de trampas en el estudio s y se


asume que cada animal puede ser capturado en cada trampa con probabilidad
independientemente de las detecciones de otros animales, entonces

p l s = 1 (1 ) ls puede

ser apropiada. En aplicaciones de pesca, donde ls podra ser el tiempo empleado en pescar, se usa
a menudo

p l s = 1- exp l s , ya que cuando l s es pequeo se tiene la correspondiente

aproximacin lineal

p l s l

Con frmulas razonables para

p l s , las estimaciones mximo-verosmiles usualmente no pueden

calcularse analticamente por lo que es necesario recurrir a clculos computacionales. No obstante,


a menos que se realicen muchos estudios y/o una gran proporcin de la poblacin sea eliminada,
maximizar la verosimilitud puede ser difcil y las rutinas de maximizacin pueden fallar,
esencialmente porque no existen datos suficientes para ajustar el modelo de forma fiable.

2.2.3 Mtodo change-in-ratio


El mtodo de captura-esfuerzo est diseado para hacer frente al cambio en la probabilidad de
deteccin causado por las variables relativas al estudio (al esfuerzo en particular), pero no tiene en
cuenta las diferencias en las variables relativas a los animales (tamao, sexo, etc.). En contraste, el
mtodo change-in-ratio depende de la presencia de diferencias observables en las variables
relativas a los animales. En particular, se confa en que:

32

1.

Las variables relevantes relativas a los animales toman un nmero finito de valores
conocidos (muy a menudo slo toman uno de dos valores).

2.

La probabilidad de deteccin no depende de las variables relativas al animal.

Aunque este mtodo involucra variables relativas a los animales, no incorpora heterogeneidad en las
probabilidades de deteccin debida a estas, es decir asume que estas diferencias no le afectan a la
probabilidad de deteccin.
Para este mtodo, un estimador de la abundancia con dos muestras se construye como sigue:
Sea x la variable sexo del animal, sea Ns(x) el nmero de animales de sexo x en la poblacin al
inicio del estudio s, y sea Ns el tamao de la poblacin al inicio del estudio s. Similarmente, sea R2(x)
el nmero de animales de sexo x que fueron eliminados al comienzo del segundo estudio y sea R2 el
total de animales eliminados al comienzo del segundo estudio. Entonces la proporcin de machos
en la poblacin en el segundo estudio ( 2 (1) N 2 (1) N 2 ) se puede expresar como:

2 (1)

1(1)N1 R 2 (1)
N1 R 2

(2.17)

y resolviendo para N1 (que coincide con N), se obtiene:

R 2 (1) R 2 2 (1)
1(1) 2 (1)

(2.18)

donde 1(1) N1(1) N1 es la proporcin inicial de machos en la poblacin. Los valores de

1(1) y 2 (1) no se conocen pero si los machos y las hembras son igualmente captables, se
pueden estimar razonablemente utilizando la proporcin de machos en la muestra cada vez que se
realiza el estudio, esto es:

1(1)

n1(1)
;
n1

2 (1)

n 2 (1)
n2

(2.19)

donde n1 y n2 son los tamaos de muestra en el primer y segundo estudio respectivamente. As


pues, utilizando la ecuacin (2.18), se obtiene el estimador:

R (1) R 2 2 (1)
N 2
1(1) 2 (1)

(2.20)

Ntese que en este caso no se ha hecho ninguna hiptesis sobre las probabilidades de deteccin en
las distintas ocasiones en las que se realiza el estudio ni tampoco se requiere medir o conocer el

33

esfuerzo realizado en cada estudio. Lo nico que se ha asumido es que los dos tipos de animales
(machos y hembras) eran igualmente captables.
Para ilustrar el mtodo vamos a considerar los datos del ejemplo de St. Andrews, teniendo en
cuenta que en el primer estudio va a llevar a cabo la inspeccin un nico observador (el observador
1) y en el segundo van a ser dos (los observadores 2 y 3). Asumiendo que todos los animales son
igualmente captables, en el primer estudio se detectan n1(0) = 16 hembras y n1(1) = 48 machos.
Supongamos ahora que los 48 machos fuesen eliminados (R2(0) = 0; R2(1) = 48). En el segundo
estudio se detectaron n2(0) = 26 hembras y n2(1) = 38 machos previamente no detectados. Con
estos datos se estima que la proporcin inicial de machos en la poblacin y la proporcin de machos
en el segundo estudio son:

1(1) =

48
0.75 ;
64

2 (1) =

38
0 .6
64

Luego, eliminando a los 48 machos la proporcin de estos se ha reducido en una cantidad


sustancial (de 0.75 a 0.6), lo cual sugiere que el nmero de inicial de machos en la poblacin no era
muy superior al nmero eliminado. Utilizando la ecuacin (2.20) se tiene que la abundancia se
estima por:

48 48 38
=
N

48 38

64 64

64 125

Como se puede comprobar el valor de la estimacin de N es la mitad del verdadero tamao de la


poblacin (N = 250), lo cual nos indica que la estimacin de la abundancia proporcionada por este
mtodo es sesgada. Por tanto, si se calcula su varianza esta debe ser grande. Concretamente se
puede utilizar la siguiente expresin debida a Seber (1982) para calcular una estimacin suya:
2

Va r N

donde Va r s (1)

2
s Var

s (1)

s 1

( 1 (1) 2 (1)) 2

1086.5060 1087

ns
1 (1)(1 1 (1))
1
para s = 1, 2.
( n s 1)
N s

(2.21)

(2.22)

2.2.3.1 Verosimilitud total


Si en lugar de realizar dos estudios se realizan S y en lugar de considerar una variable relativa al
animal que tome un valor de dos posibles se considera una variable que pueda tomar un valor de K
valores posibles, entonces el nmero de animales de cada tipo que se elimina de la poblacin en el

34

estudio s viene dado por el vector R s , mientras que el nmero de animales de cada tipo que
permanece en la poblacin en ese mismo estudio viene dado por el vector N s .
Se verifica que N s = N 1 - R s , o lo que es lo mismo:

N s ( x 1 ) N1( x 1 ) Rs ( x 1 )

N ( x ) N ( x ) R ( x )
s K 1 K s K

(2.23)

Similarmente, n s es el vector observacin. Este proporciona el nmero de animales de cada uno


de los K posibles tipos que hay en la poblacin y que se han observado durante el estudio s. Luego:

ns ( x 1 )

ns ( x 2 )

ns =

(2.24)

n ( x )
s K
Con esta notacin, la verosimilitud total para el mtodo change-in-ratio se puede escribir como:

L(N, n, R )

L(N, p n
s 1

s ,R s

(2.25)

donde

L(N, p n s , R s ) =

Ns ( x )
p(l s ) ns ( x ) (1 p(l s )) Ns ( x )ns ( x )
n s ( x )

(2.26)

2.2.3.2 Verosimilitud condicionada


La ecuacin (2.25) es apropiada si los animales son detectados en cada estudio (ns, con s = 1, ,
S) con probabilidad

p l s . En muchas aplicaciones de este mtodo, los animales o son detectados

por algn medio desconocido o el nmero detectado en cada estudio se especifica por adelantado.
En ambos casos, los ns no contienen informacin til sobre N y resulta apropiado tratarlos como fijos
(no como variables aleatorias) y trabajar con la verosimilitud condicionada dado ns, con s = 1,, S.
As pues, la ecuacin (2.25) puede factorizarse como sigue:

35

Ns

L
n
s 1 s


ns
Ns ns
p(l s ) (1 p(l s ))

P (n s N s )
s 1

donde ns =

El trmino

P (n

n s ( x ) y Ns =

P (n

s 1

s 1

Ns (x )


x n (x)
s

Ns

n s , N s )

(2.27)

Ns (x ) .

n s , N s ) es la probabilidad condicionada de observar n s , dados ns y N s .

s 1

Cuando x es un escalar que solamente toma dos valores (por ejemplo, x = 0 para hembras y x = 1
para machos), esta probabilidad es el producto de densidades hipergeomtricas pero cuando toma
ms de dos valores, la apropiada distribucin hipergeomtrica multivariante sustituye a la
distribucin hipergeomtrica. Si se considera como una funcin de N, esta es la verosimilitud
condicionada de N, dado ns (s = 1,, S).
Ntese que cuando S = 2, la ecuacin (2.20) es el estimador mximo verosmil condicionado.

2.2.4 Efectos producidos al violar las hiptesis


Las hiptesis que se han hecho en este apartado para obtener la estimacin de la abundancia
animal son:
Hiptesis 1a (Mtodo de eliminacin simple).- Todos los animales son detectados con igual
probabilidad, p.
La violacin de esta hiptesis hace que las estimaciones de la abundancia sean negativamente
sesgadas. En este caso, cuanto ms vara p en la poblacin, es decir, cuanta ms heterogeneidad
haya, mayor es el sesgo. Los cambios en p entre cada estudio debidos a la variabilidad relativa al
estudio tambin pueden causar un gran sesgo.
Hiptesis 1b (Mtodo de captura-esfuerzo).- La probabilidad de deteccin slo depende de
variables relativas al estudio, como el esfuerzo medido.

36

La violacin de esta hiptesis proporciona estimaciones de la abundancia negativamente sesgadas


si la probabilidad de deteccin depende de variables relativas al animal.
Hiptesis 1c (Mtodo change-in-ratio).- La probabilidad de deteccin puede variar entre los
estudios realizados, pero es constante para todos los animales en cada estudio.
El efecto producido al violar esta hiptesis es el mismo que en el caso anterior.
Hiptesis 2.- Las eliminaciones son conocidas.
La violacin de esta hiptesis supone sesgo y/o inflacin de la varianza.

37

2.3 Mtodo de marca-recaptura simple

Si se tienen datos de un nico estudio, la abundancia no se puede estimar sin establecer fuertes
hiptesis sobre la probabilidad de captura. Por ejemplo, en el caso del muestreo por parcelas se
asumi que la probabilidad de captura era conocida. Estas hiptesis pueden ser bastante
razonables o no dependiendo de la aplicacin, de manera que cuando no se establecen los mtodos
de eliminacin o los de marca-recaptura pueden ser tiles.
En el caso de los mtodos de marca-recaptura los animales continan en la poblacin despus de
haber sido capturados inicialmente, proporcionando as informacin sobre la probabilidad de
captura. La base de estos mtodos es realmente simple. Si los animales que se capturan en un
estudio son los animales tpicos de la poblacin, estos constituyen una subpoblacin representativa
de tamao conocido. La proporcin de animales de esta subpoblacin marcada que se captura en
un estudio posterior es un estimador obvio de la probabilidad de captura de un animal, p. As pues,
aplicando esta estimacin a la poblacin entera se puede estimar la abundancia, N. Todos los
mtodos de marca-recaptura confan fuertemente en que la subpoblacin capturada es
representativa de toda la poblacin, lo cual puede ser un problema.
Los animales pueden ser capturados y marcados segn una amplia variedad de formas, de hecho,
la captura podra ser una captura fsica o simplemente una deteccin (visual, por satlite, radio u
otros medios), mientras que el marcado podra involucrar realizar una marca fsica al animal,
registrar una marca natural, por ejemplo, las rayas de los tigres o las colas de las ballenas
jorobadas, o una marca subjetiva al observador segn la colocacin del animal en un momento dado
(como en el ejemplo de la poblacin de St. Andrews).
Los diferentes tipos de marca contienen distintos tipos de informacin:
1.

Algunas marcas no contienen informacin sobre la historia de la captura previa, sino que
simplemente indican que el animal ha sido capturado por lo menos una vez. Este sera el
caso en el que los animales que se capturan inicialmente se marcan con un punto rojo.

2.

Algunas marcas informan sobre cuando fue capturado el animal. Este sera el caso en el
que se usan distintos colores para marcar a los animales cada vez que se lleva a cabo un
estudio.

3.

Otras permiten que los individuos sean reconocidos. Este es el caso en el que se usa un
color diferente junto con un nico nmero para marcar cada animal capturado cada vez que
se realiza el estudio.

Idealmente todas las marcas deberan ser del tipo (3) ya que son las que contienen informacin ms
til para estimar la abundancia y permiten realizar anlisis ms sofisticados aunque en este captulo
nicamente nos vamos a fijar en el anlisis de las marcas de tipo (1).
Antes de analizar este mtodo es necesario establecer la notacin que se indica a continuacin.

38

2.3.1 Notacin
Sea xs la variable que indica si el animal es marcado o no en el estudio s. Esta toma el valor 1 si es
marcado y 0 si no lo es. Sea Ns el nmero de animales al comienzo del estudio s. De estos, Ns(1)
estn marcados (es decir, se tiene que xs = 1) y Ns(0) no. Para simplificar se denota al nmero de
animales marcados al inicio del estudio s, Ns(1), por Ms y al nmero no marcado por Us, de donde se
tiene que Ms + Us = Ns.
Por otro lado, el nmero de animales marcados que son detectados (capturados) en el estudio s es
ns(1) y el nmero de animales detectados que no estn marcados es ns(0). De igual forma que antes
para simplificar denotamos ns(1) y ns(0) por ms y us respectivamente. De esta forma, ms + us = ns.
La notacin general utilizada para denotar la probabilidad de capturar un animal del tipo x en el
estudio s es p(x, s), pero en este captulo se va a usar una notacin abreviada de forma que cuando
la probabilidad de captura solo dependa del estudio que se realiza y no del tipo de animal se
denotar por ps, cuando solo dependa de si el animal ha sido marcado o no, se denotar por pm y pu
respectivamente y cuando no dependa ni del tipo de animal ni del estudio realizado se denotar por
p.

2.3.2 Ilustracin del mtodo de marca-recaptura

El experimento de marca-recaptura ms simple es aquel en el que se lleva a cabo un nico proceso


de marcado y un nico proceso de recaptura en el cual todos los animales tienen la misma
probabilidad de ser capturados. La poblacin que se va a utilizar para ilustrar el mtodo es la de St.
Andrews. Supongamos que al comienzo del primer estudio no hay animales marcados, as que M1 =
0. Si al realizar este el observador captur visualmente u1 = 64 animales, entonces al comienzo del
segundo estudio el siguiente observador tena ya marcados 64 animales, es decir, M2 = 64. De
estos, se recapturaron m2 = 34. A partir de esta informacin se puede estimar razonablemente la
probabilidad de que el segundo observador capture un animal mediante la proporcin de animales
marcados que el captur, sin necesidad de recurrir a un desarrollo estadstico. Por tanto, se tiene:

p 2

m2 34
=
0,53125
M 2 64

Como el segundo observador captur en total n2 = 67 animales, entonces se espera que los 67 sean

0,53125 = 67, de donde despejando N

aproximadamente el 53% de la poblacin, luego, N


= 126. En general,
se tiene que N

39

=
N

n2
n
n n
2 1 2
p 2 m2
m2

n1

(2.28)

Este es el estimador de marca-recaptura de Petersen o ndice de Lincoln, siendo un estimador de su


varianza:

n n (n m2 )(n 2 m 2 )
Va r (N ) 1 2 1
m 23

(2.29)

Similarmente, se puede estimar la probabilidad de que el primer observador capture un animal por

p 1

m 2 34
=
0,507 . Por tanto, con dos estudios y los datos que describen qu animales se
n 2 67

capturaron en cada uno, se pueden estimar las probabilidades de captura (p1 y p2) y la abundancia
N. Debido a que el marcado de los animales la primera vez que se capturan genera una
subpoblacin de n1 = u1 = M2 animales marcados, la segunda ocasin en la que se lleva a cabo la
captura se estudia una subpoblacin de tamao conocido (M2) para la cual slo hay un parmetro
desconocido (p2). Adems, acerca de esta subpoblacin se tiene una parte relevante de los datos
que es el nmero de animales recapturados, m2, lo cual es suficiente para estimar un parmetro

p 2

m2
. Ahora si los animales marcados y los no marcados son igualmente detectables,
M2

entonces la estimacin de p2 se puede aplicar a toda la poblacin, y usndola con todos los datos de
la segunda ocasin de captura (n2), se puede estimar N.
Como el nmero de animales marcados en la segunda ocasin de captura (m2) puede ser cero, el

no tiene una varianza finita. Es por esta razn por lo que Chapman (1951) propuso el
estimador N
siguiente estimador modificado:

=
N

(n1 1) (n 2 1)
1
m2 1

el cual es aproximadamente insesgado para n1 + n2 < N y exactamente insesgado si n1 + n2

(2.30)

Ny

un estimador aproximadamente insesgado de su varianza (Seber, 1970 y Wittes, 1972) viene dado
por:

Va r (N )

(n1 1)(n 2 1)(n1 m2 )(n 2 m2 )


(m2 1) 2 (m2 2)

(2.31)

40

es mucho menor que el


Para finalizar esta ilustracin, decir que el valor de la estimacin N
verdadero valor de N. Una explicacin a esto se centra en si los animales marcados y no marcados
son igualmente detectables y en ver cmo de representativos son los animales capturados con
respecto a la poblacin entera.

2.3.3 Verosimilitud del mtodo de marca-recaptura con dos muestras

Como siempre se necesita especificar el modelo de probabilidad para obtener la funcin de


verosimilitud. En este captulo, se asume que todos los animales en la poblacin estn en riesgo de
ser capturados y que la probabilidad de captura no depende de las caractersticas individuales del
animal. Como consecuencia no se necesita un modelo de estado para realizar inferencias fuera de
la regin inspeccionada, ya que en este caso la regin inspeccionada coincide con la regin de
estudio y por tanto la verosimilitud contiene solo un modelo de observacin, para el que se asume
que:
1.

Todos los animales son igualmente capturables en cualquier estudio, aunque la probabilidad
de captura puede cambiar de un estudio a otro, por ejemplo, puede ser p1 en el estudio 1 y
p2 en el siguiente.

2.

Las detecciones de los animales son sucesos independientes, tanto dentro de un estudio
como entre ellos. Es decir, el hecho de que un animal sea capturado en un estudio no
afecta a la probabilidad de que cualquier otro sea capturado en el mismo y el hecho de que
un animal sea capturado en un estudio no afecta a la probabilidad de que sea capturado en
otro.

A continuacin derivamos una verosimilitud para N, p1 y p2, dado el nmero de animales marcados
en la poblacin.
Primera ocasin de captura
Como en el primer estudio los animales son capturados independientemente con igual probabilidad
p1,

la

probabilidad

de

capturar

N n
p (1 p ) N n
L N n, p
n

n1

animales

viene

dada

por

la

ecuacin

Es decir, la probabilidad de capturar n1 = u1 animales no marcados la primera vez dado que hay U1 =
N animales en la poblacin, es:

U
P1 1 p1u1 (1 p1 )U1u1
u1

(2.32)

41

Si se considera esta expresin como una funcin de N = U1 y p1, esta es la funcin de verosimilitud
para la primera ocasin de captura.

Segunda ocasin de captura


Todos los animales que se han capturado en el primer estudio se han marcado, luego la poblacin
de la que se parte en el segundo estudio se divide en dos grupos: animales marcados y no
marcados. De esta forma, el nmero de animales marcados al inicio del segundo estudio es el
nmero de animales capturados en el primero, luego, M2 = n1 = u1. Como al inicio del segundo
estudio se conoce cuantos animales marcados hay, el objetivo en este caso no es conocer
solamente el nmero de animales capturados en el (n2), sino que se quiere saber cuntos de los M2
animales, que se sabe que fueron marcados, fueron capturados (m2) y cuntos de los U2 = (N - M2)
animales, que no se conoce que fueron marcados, fueron capturados ( u2). La probabilidad de
observar n2 = (u2, m2)T es por tanto, un producto de dos verosimilitudes binomiales.
La primera es la probabilidad de capturar m2 animales marcados:

M
P2m 2 p2m2 (1 p2 )M2 m2
m2

(2.33)

Dado m2, esta es una funcin de verosimilitud con un solo parmetro desconocido, p2 (recordemos
que M2 se conoce por ser el nmero de animales marcados en el primer estudio). Luego, a partir de

los datos de animales marcados, m2, se puede estimar p2 de la siguiente forma: p 2

m2
.
M2

Anlogamente, la probabilidad de capturar u2 animales no marcados viene dada por:

U
P2u 2 p2u2 (1 p2 )U2 u2
u2

(2.34)

Dado u2, esta es una funcin de verosimilitud con dos parmetros desconocidos, p2 y U2. Por tanto,
utilizando los datos de animales no marcados, u2, no se pueden estimar los dos parmetros. En este
caso lo que se puede hacer es utilizar la estimacin de p2 obtenida anteriormente y estimar U2 a
partir de la verosimilitud para animales no marcados. De esta forma se puede estimar tanto p2 y N =
M2 + U2.
Alternativamente, se pueden combinar las ecuaciones (2.33) y (2.34), y estimar p2 y N de un solo
golpe a partir de la verosimilitud:

U2

M2

p2 2 (1 p2 )U2 u2
p2 2 (1 p2 ) M2 m2
L2 nica = P2u P2m =
u
m
2
2
u

(2.35)

42

Por otro lado, se puede estimar N, p1 y p2 simultneamente a partir de la verosimilitud total para
ambas ocasiones de captura, dados los datos observados u1, m2 y u2. La verosimilitud total se puede
expresar como:
2

L2

Psu Psm

s 1

donde P1m

Us

u
s 1

M s ms
ps (1 ps ) Ms ms
m
s

p sus (1 ps )Us us

(2.36)

1 por conveniencia.

La ecuacin (2.36) es la verosimilitud de una multinomial con cuatro elementos donde el estimador
mximo verosmil es el estimador de Petersen.
Hasta ahora, las ecuaciones de verosimilitud desarrolladas y el estimador de Petersen asumen que
en cualquier estudio todos los animales son igualmente capturables. Sin embargo, la poblacin de
St. Andrews que se est utilizando a lo largo del trabajo como ejemplo se sabe que es heterognea,
con lo cual esta suposicin no parece muy razonable. Al igual que en el mtodo de eliminacin, el no
considerar la heterogeneidad cuando realmente est presente provoca que la estimacin de la
abundancia mediante el mtodo de marca-recaptura simple sea negativamente sesgada. Ntese
que si los animales marcados y los no marcados son igualmente capturables, entonces es razonable
usar la proporcin de animales marcados que son recapturados en el segundo estudio como un
estimador de la probabilidad de captura de animales no marcados. Pero si la poblacin es
heterognea, los animales ms capturables tendern a ser capturados y marcados primero y las
probabilidades de captura de los animales no marcados tendern a hacerse cada vez ms
pequeas despus de cada ocasin de captura (exactamente el mismo fenmeno que caus el
sesgo en el mtodo de eliminacin). No obstante, segn se deduce de estudios de simulacin, el
hecho de disponer de informacin sobre las recapturas hace que la varianza del estimador sea ms
pequea y los intervalos de confianza sean mejores.

2.3.4 Estimacin por intervalos


2.3.4.1 Intervalo de confianza de la verosimilitud maximizada (profile likelihood)
Como ocurra con los mtodos de eliminacin simple, toda la incertidumbre en las estimaciones de
marca-recaptura surge en el proceso de observacin; las estimaciones de la varianza y de los
intervalos de confianza se basan slo en el modelo de observacin, que es un producto de
funciones de densidad binomiales. Por tanto, los intervalos de confianza de la profile likelihood se
pueden construir utilizando este producto. De hecho, en el caso en el que la probabilidad de captura
es la misma en las dos ocasiones de captura, la profile likekihood se obtiene evaluando la ecuacin
(2.36) con p1 = p2 = p en:
p1(N)

p2(N)

n n2
p(N) = 1
2N

(2.37)

2.3.4.2 Intervalo de confianza basado en la normal

43

Usando el estimador aproximadamente insesgado de la varianza del estimador modificado


propuesto por Chapman:

Va r (N )

(n1 1)(n 2 1)(n1 m2 )(n 2 m2 )


(m2 1) 2 (m2 2)

un intervalo de confianza al 95% para N viene dado por:

N z Va r (N ) , N z Va r (N )

2.3.4.3 Intervalo de confianza del mtodo percentil


Al igual que en los mtodos de eliminacin considerados en el captulo anterior, el diseo muestral
consiste en inspeccionar la regin de estudio por completo, luego hay una nica unidad muestral (la
regin completa) y un bootstrap no paramtrico simple que use a sta como unidad de remuestreo
no debe utilizarse. Por tanto, la nica fuente de variacin se debe a la aleatoriedad en el proceso de
observacin. Una forma de capturar esto en un procedimiento bootstrap consiste en generar
muestras a partir de un apropiado modelo del proceso de observacin. Concretamente, en este caso
el mtodo percentil funciona generando muestras a partir de la funcin de densidad de una
multinomial. De hecho, cuando tienen lugar dos procesos de captura y p1 no es necesariamente

1(1 p 2 ) , (1 p
1 ) p
2 , p
1p
2 y
, p
igual a p2, se tiene una multinomial con parmetros N
1 (1 p1 )(1 p 2 ) .
As pues, si se generan B muestras bootstrap y para cada una de ellas se calcula una estimacin del

* , usando el estimador modificado de Chapman, entonces un intervalo


tamao de la poblacin, N
de confianza al 95% para N viene dado por
* y N
*
k (B 1) 0,975 y la notacin N
( j)
(k )

*
*
( j ) , N(k )

donde

j (B 1) 0,025 y

* (i =
indican los j-simo y k-simo mayores N
i

1, , B ) respectivamente.
El procedimiento bootstrap no paramtrico es muy similar en cuanto a que tambin se calculan B

. La nica
estimaciones usando estudios generados a partir de una poblacin de tamao N
diferencia es que ahora se remuestrean las historias de captura con reemplazamiento. Una historia
de captura es un vector fila de ceros y unos con un cero en la posicin s si el animal no fue
capturado en el estudio s, y un uno si s lo fue. En nuestro ejemplo con dos muestras, los u1 m2
animales capturados en el primer estudio tienen una historia de captura (1,0), los u2 animales
capturados en el segundo estudio tienen una historia de captura (0,1), los m2 capturados en ambos

- (u1 + u2) animales estimados que nunca fueron


estudios tienen la historia (1,1) y a los N
capturados se les asign la historia (0,0).

44

Para generar un estudio se toma una muestra aleatoria simple, con reemplazamiento, a partir de

animales y se anotan sus historias de captura. A partir de estas se pueden calcular n1* , u 2* y
N
* . De esta forma, el intervalo de confianza al 95% para N se
m 2* para cada estudio y por tanto, N
construye de la misma forma que en el caso paramtrico.

2.3.5 Mltiples estudios: El censo de Schabel

El estimador mximo verosmil (EMV) para un estudio con dos procesos de captura ( S = 2) se
formula de forma sencilla (vase ecuacin (2.28)). Cuando S = 3, tambin se puede expresar
explcitamente (Seber, 1982, pg. 132), pero para S > 3 no se tiene ninguna expresin explcita del
EMV y se tiene que maximizar la verosimilitud.
La funcin de verosimilitud para estudios de captura mltiples no es ms que una extensin de la
funcin de verosimilitud de la ecuacin (2.36), solo que ahora se tienen en cuenta ms de dos
procesos de captura, concretamente S procesos. Esto es:
S

LS

Ls

s 1

Psu Psm

s 1

Us

u
s 1

M s ms
ps (1 ps ) Ms ms
m
s

psus (1 ps )Us us

(2.38)

Estas verosimilitudes sirven para ver si un animal capturado ha sido capturado y marcado antes o
no, pero no sirven para ver en qu estudio fue capturado el animal o para conocer su identidad. Por
ejemplo, si al ser capturado el animal se marcase con un punto rojo, al verlo de nuevo slo se puede
decir que ya ha sido capturado antes, pero no se sabe nada sobre el estudio en el que se captur ni
sobre su identidad. En estos casos las verosimilitudes difieren un poco de la de la ecuacin (2.38)
pero de una forma bastante sencilla.
Supongamos por ejemplo, que las marcas podran ser tales que a partir de ellas se pudiese conocer
el estudio(s) en el que el animal fue previamente capturado. Este sera el caso en el que al animal
se le va marcando con un punto de diferente color cada vez que es recapturado. De esta forma se
puede conocer la historia de captura del animal y la verosimilitud (2.38) pasara a ser:

Ls

N s (w s ) n2 ( x 2 )
N (w ) n ( w )
p
(1 ps ) s s w w
n s (w s ) s


ws

(2.39)

donde ws es una de las 2s-1 historias de captura posibles de animales marcados en la poblacin al
inicio del estudio s y

ws

es el producto de todas esas historias de captura. N s (w s ) es el

nmero de animales con historia de captura ws, y n s (w s ) es el nmero de estos que son
capturados.

45

Por otro lado, el proceso de marcado tambin podra ayudar a reconocer individualmente a animales
capturados anteriormente en estudios posteriores. Para conseguir esto se podra pegar un nmero
concreto a cada animal capturado. En este caso la ecuacin (2.38) pasara a ser:

Ls

Ms

w si
s

(1 ps )1w si

(2.40)

i 1

donde wsi es una variable indicadora de la captura, la cual toma el valor 1 si el animal i fue capturado
en el estudio s y cero en otro caso.

2.3.6 Tipos de modelos de marca-recaptura

Pollock (1974) y Otis et al. (1978) desarrollaron un til esquema de clasificacin para modelos de
marca-recaptura en poblaciones cerradas, que incorpora tres fuentes bsicas de heterogeneidad en
las probabilidades de captura. Los modelos se van a denotar por Mm, donde m indica el tipo de
heterogeneidad. As pues, incluyendo un modelo sin heterogeneidad, los modelos bsicos son los
siguientes:

M0 : la poblacin se asume que es homognea con respecto a la probabilidad de captura,


esto es, todos los animales son igualmente capturables en cualquier proceso de captura. El
subndice 0 indica que no hay heterogeneidad.

Mt : las probabilidades de captura varan de un proceso de captura a otro, pero se asume


que todos los animales son igualmente capturables en cualquier ocasin. El subndice t
indica que la heterogeneidad depende solamente del tiempo.

Mb : la probabilidad de captura solo va a depender de si el animal ha sido capturado


previamente o no, hecho que va a determinar su comportamiento ante las capturas futuras.
El subndice b indica la respuesta de comportamiento.

Mh : Este modelo solo permite que haya heterogeneidad entre los animales, es decir, los
animales se asume que tienen diferentes probabilidades de captura, pero estas
permanecen constantes a lo largo de todos los procesos de captura. El subndice h indica
heterogeneidad.

Ntese que si se combinan las tres fuentes de heterogeneidad de varias formas se pueden construir
otros cuatro modelos ms complicados: Mth, Mtb, Mbh y Mtbh.
As por ejemplo, si consideramos los modelos M0, Mt, Mb y Mtb la nica diferencia entre ellos est en
cmo modelizar la funcin de deteccin o captura, p. La probabilidad de capturar un animal i en el
momento de captura s depende tanto de variables relativas al animal, xs, como de las variables
relativas al estudio, ls. La nica variable relativa a los animales que se considera aqu es la historia
de captura del animal i en el momento s, wsi. Por tanto, la funcin de captura ms general que se

46

considera en este captulo para el animal i en el momento s puede escribirse como p(wsi, ls). Las
funciones de captura para cada modelo vienen dadas por:

M0 : p(wsi, ls) =

, donde es el nico parmetro de la funcin de captura para ser

estimado.

Mt : p(wsi, ls) = p( ls). Si se considera que ls = s , entonces (1,..., S ) ' es el vector


de parmetros de la funcin de captura a estimar. Por otro lado, ls podra ser igual a una
medida escalar del esfuerzo en la captura (por ejemplo, el nmero de trampas usado). En
este caso, una frmula razonable para la funcin de captura podra ser p( l s ) 1 e l s ,
que es comnmente utilizada en modelos pesqueros.

Mb : p(wsi, ls) = p(wsi) = p(csi) tal que csi = 1 si al inicio del proceso de captura s el animal i ha
sido marcado , y csi = 0 si no. Una frmula de dependencia obvia de la probabilidad de
captura de wsi es p(wsi) = csi , en cuyo caso ( 0 , 1 ) ' es el vector de parmetros a
estimar pero dependiendo de la aplicacin otras frmulas tambin pueden ser apropiadas.

Mtb : p(wsi, ls) = p(csi, ls) depende tanto de la variable relativa al animal (csi) como de la
variable relativa al estudio (ls = s ). Una frmula til para la dependencia de la
probabilidad de captura de estas dos variables es la logstica:

p(wsi, ls) =

e (c csi )s
1 e (c csi )s

(2.41)

donde c es un parmetro de comportamiento de los animales capturados, y csi = 1 si el


animal i ha sido capturado al inicio del proceso de captura s y csi = 0 en otro caso.
Una vez que se especifica la funcin de captura o deteccin, la verosimilitud para estos modelos es
justo la funcin de verosimilitud general de la ecuacin (2.38) sin ms que sustituir ps por la funcin
de captura correspondiente.

2.3.7 Efectos producidos al violar las hiptesis

Las hiptesis que se han establecido en este mtodo para obtener la estimacin de la abundancia
animal son:
Hiptesis 1.- La probabilidad de captura en el modelo M0 es constante, en el modelo Mt depende
solo del momento de la captura, en el modelo Mb es constante excepto que los animales marcados

47

sean ms/menos capturables que los no marcados y en el modelo Mtb depende del momento de la
captura y de si un animal ha sido capturado o no.
La violacin de esta hiptesis hace que todos los estimadores sean sesgados. La probabilidad de
captura se puede ver afectada por la presencia de heterogeneidad entre los animales. Esta
heterogeneidad no ha sido modelizada y puede hacer que los estimadores sean muy sesgados, no
obstante incluso si la heterogeneidad no es un problema, los estimadores pueden ser
sustancialmente sesgados.
Hiptesis 2.- Los animales son capturados independientemente unos de otros.
Si se viola esta hiptesis los intervalos de confianza basados en ella tienden a ser sesgados, cuando
usualmente son muy estrechos, y las estimaciones puntuales pueden ser sesgadas.
Hiptesis 3.- Las marcas no se pierden.
El efecto producido al violar esta hiptesis provoca un sesgo positivo en la estimacin de la
abundancia. Frecuencias de recaptura ms bajas que las causas por las que se pierden las marcas
se interpretan por los estimadores como si una fraccin de la poblacin ms pequea de la que
realmente era hubiera sido marcada. El mismo efecto ocurre cuando las marcas no son registradas
para algunos animales capturados incluso aunque estn todava en los animales.

48

2.4 Muestreo de distancia

Los mtodos relacionados con el muestreo de distancia involucran medir o estimar las distancias de
los animales detectados a partir de una lnea un punto. Los principales mtodos son el muestreo
de transectos de lnea y el muestreo de transectos de punto (algunas veces llamado Variable
Circular Plots). Ambos son extensiones del muestreo por parcelas, en los cuales slo se hacen
recuentos incompletos de animales dentro de la regin inspeccionada. La estimacin de la
abundancia a partir de estos mtodos no precisa de ms de un estudio, ya que se considera una
fuerte hiptesis sobre la probabilidad de deteccin: todos los animales que son localizados en la
lnea en el punto son detectados con certeza y a medida que la distancia a partir de la lnea el
punto es mayor a x = w, la probabilidad de deteccin, p(x), disminuye de una forma suave.

2.4.1 Muestreo de transectos de lnea

El muestreo de transectos de lnea es una extensin del muestreo de bandas. Supongamos que hay
u bandas, de forma que cada una tiene una anchura de 2w unidades (por tanto, a cada lado de su
u

lnea central hay una distancia w). Supongamos que la banda j tiene una longitud lj, con

= L.

j 1

Entonces la regin inspeccionada es de tamao a = 2wL. En el caso del muestreo por bandas si se

cuentan n animales en ellas, una estimacin de la abundancia animal viene dada por

n
N
a , sin
A

embargo, en el muestreo de transectos de lnea, el nmero de animales detectado no es el nmero


total presente en la regin inspeccionada sino que hay otro elemento de complejidad a la hora de
modelizar el problema que se va a tratar seguidamente.
En el muestreo de transectos de lnea, el observador camina a lo largo de la lnea central de la
banda, y registra la distancia perpendicular x de cada animal detectado (o grupo de animales) a la
lnea. Algunas veces, es ms fcil registrar la distancia radial de deteccin r y el ngulo

(Figura

7), a partir de los cuales x = r sen ( ).

49

Figura 7

Generalmente, el diseo muestral para este muestreo est formado por lneas o por una rejilla de
lneas sistemticas, colocadas aleatoriamente en la regin de estudio. Esta colocacin asegura que
los animales estn uniformemente distribuidos con respecto a sus distancias a la lnea. Adems, se
asume que todos los animales en muy cerca de la lnea son detectados, de modo que la
probabilidad de deteccin va a disminuir a medida que la distancia a partir de la lnea es superior a
w. Siempre que las principales hiptesis del mtodo se cumplan, los mtodos de transectos de lnea
son capaces de compensar la prdida de animales en la regin inspeccionada y dar estimaciones de
la abundancia insesgadas incluso cuando se pierde una gran proporcin de los animales de la
regin inspeccionada.
2.4.1.1 Estimacin mximo verosmil
Los mtodos de muestreo de distancia involucran tanto a modelos de estado como de observacin,
ya que la regin inspeccionada es bastante inferior a la regin de estudio y no todos los animales de
la regin inspeccionada son detectados. El motivo se debe a que la probabilidad de deteccin
depende de la distancia a la lnea y las posiciones de todos los animales respecto a sta no son
conocidas.
Por tanto, para establecer el muestreo de transectos de lnea en un marco de trabajo de
verosimilitud total, se necesita especificar un modelo de estado que modelice las localizaciones de
todos los animales o grupos de animales en el momento del estudio y un modelo de observacin
para el proceso de deteccin dentro de la regin inspeccionada.
Como en el muestreo por parcelas, si un grupo tiene la misma probabilidad de estar en cualquier
lugar de la regin de estudio de tamao A, entonces la probabilidad de que est dentro de la regin
inspeccionada de rea a, es

. En este caso, la regin inspeccionada es una banda (o serie de

bandas) de anchura media w y longitud total L, as que a = 2wL. La funcin de densidad de la


distancia perpendicular a la lnea del transecto (x) de un grupo que est en la banda es uniforme,
esto es:

50

(x)

1
w

(2.42)

Luego, la probabilidad de que un grupo est en la banda y en el intervalo de distancias


perpendiculares (x, x+dx) (donde dx es convenientemente pequeo) es:

a 1
dx
A w

(2.43)

Esta ecuacin es la que modeliza el modelo de estado para un solo grupo de animales.
Por otro lado, la probabilidad de que un grupo sea detectado, dado que est situado en x es p(x),
siendo esta la base del modelo de observacin.
Supongamos que la probabilidad de deteccin de los animales dentro de la regin inspeccionada es
algn valor conocido, el cual se denota por E[p]. La probabilidad de que un animal est en la regin
inspeccionada es c

a
, as que la probabilidad de que un animal est en la regin
A

inspeccionada y sea detectado, es

c E[p]. Si los grupos son detectados independientemente

unos de otros, entonces la probabilidad de que n grupos sean detectados es una variable aleatoria
binomial de parmetros N y

c E[p]. Por tanto, si se conociese E[p] la verosimilitud para N

vendra dada por:

N
( c E p ) n 1 c E p N n
n

L(N E p )

(2.44)

As pues, dado E[p], el EMV de N es:

n
c E p

(2.45)

Esta verosimilitud y el EMV es idntico al del muestreo por parcelas cuando E[p] = 1. Sin embargo,
en realidad E[p] no se conoce, luego la verosimilitud tiene dos parmetros (N y E[p]) desconocidos
que no pueden estimar a partir del nico dato que se conoce, n. Se necesitan por tanto nuevas
hiptesis y/o nuevos datos para estimar N razonablemente.
La clave para estimar N a partir de los datos del transecto de lnea es estimar E[p], lo cual se
consigue a partir de las distancias perpendiculares a las detecciones. Para usar los datos contenidos
en las distancias perpendiculares observadas, necesitamos un modelo estadstico que muestre
cmo se generaron estas, aunque en primer lugar vamos a expresar E[p] en trminos del ancho de
banda efectivo o ms concretamente medio-ancho de banda efectivo (ver apartado 4 del Anexo).
Este ltimo se denota por

e indica la amplitud media efectiva de la banda, en el sentido de que el

51

es igual al nmero

nmero de animales esperado a distancias a partir de la lnea superiores a

. Por tanto, el rea efectiva

esperado de animales perdidos por debajo de una distancia


inspeccionada en un estudio de transecto de lnea es 2 L.

De este modo, la E[p] se puede definir como la proporcin de la regin inspeccionada que
efectivamente se estudia, esto es:

2 L

2 wL w

E p

(2.46)

Tanto E[p] como p(x) dependen de un vector de parmetros desconocidos que por abreviar no
se muestra explcitamente. Este vector est formado por parmetros asociados a variables relativas
al animal y al estudio.
Si se conociera el parmetro(s) de la funcin de deteccin se tendra la verosimilitud de la ecuacin
(2.44) y el EMV para N de la ecuacin (2.45). Claramente los datos de las distancias
perpendiculares contienen informacin sobre la funcin de deteccin: si el histograma de las
distancias detectadas baja rpidamente, la probabilidad de deteccin media es baja, mientras que si
permanece alto, la probabilidad de deteccin media tambin es alta. Es necesario por tanto,
considerar una verosimilitud que introduzca esta informacin, permitindose as estimar la funcin
de deteccin ( equivalentemente ). Nos referiremos a ella con el nombre de verosimilitud
condicionada, ya que est condicionada al nmero de animales detectados, n.
La probabilidad de que un grupo sea detectado en una banda concreta, dado que est en la
posicin x, es p(x). La funcin de densidad de las distancias perpendiculares, x, de los grupos de
animales en la banda es (x ) . Por tanto:

Pr x visto

0 Pr x visto ( x )dx
Pr x visto ( x )

p( x ) ( x )
w

p( x ) ( x )dx

p( x ) ( x )
E p

(2.47)

Esta es la funcin de densidad de x, dado que un grupo ha sido detectado y se denota por f(x). Si
los grupos son detectados independientemente, la funcin de densidad de las x distancias

f (x

perpendiculares de los grupos detectados es

) y por tanto, la verosimilitud para ,

dadas estas x distancias perpendiculares es:


L( ) =

i 1

E
p

f ( x i )

p( x ) ( x )
i

(2.48)

i 1

52

Cuando ( x ) =

1
, entonces:
w
L( ) =

p( x

(2.49)

i 1

Resumiendo se puede estimar , y por tanto la E[p] a partir de la ecuacin (2.48). Esta ltima
estimacin se puede usar en la ecuacin (2.44) y de este modo se estima N. Alternativamente, se
pueden combinar las ecuaciones (2.44) y (2.48) para obtener una verosimilitud total, y estimar N y

simultneamente a partir de ella. A continuacin se desarrollan estas dos aproximaciones con


ms detalle.

EMV a partir de la verosimilitud total


La verosimilitud para N y es el producto de las ecuaciones (2.44) y (2.48):
L(N; ) =

L(N )

N
1 c E p N n ( c ) n
n

L( ) =

p( x

) ( x i )

(2.50)

i 1

Esta es la verosimilitud total para los mtodos de muestreo de distancia en general. Cuando ( x )

1
, se tiene la verosimilitud total para los mtodos de transectos de lnea.
w

Para maximizar la verosimilitud con respecto a N y , se necesita usar una rutina de maximizacin
numrica. Si se pueden obtener las derivadas de ln(L) con respecto a N y , entonces el mtodo
de Newton-Raphson junto con un procedimiento de Marquardt pueden utilizarse.

EMV condicionado

Usualmente la estimacin se obtiene en dos pasos utilizando la verosimilitud condicionada, en lugar


de obtenerla en un solo paso a partir de la verosimilitud total. Una estimacin del vector de
parmetros de la funcin de deteccin se obtiene maximizando L( ) (ecuacin (2.48)). Esto nos
permite ajustar la funcin de deteccin y estimar

. Se sabe que E p

, el rea bajo la funcin, la cual se denota por

, luego E[p] se puede estimar por:


w

E p
w

53

Por tanto, usando esta estimacin en lugar de E[p] en la ecuacin (2.44) y maximizando respecto a
N se obtiene:

n
n
nA

2
wL

2L
c E p
A w

(2.51)

por lo que la densidad estimada viene dada por la expresin:

N n
D
A
2L

(2.52)

2.4.1.2 Estimacin basada en el diseo: estimador Horvitz-Thompson


En el muestreo de transectos de lnea un animal est en la muestra si est tanto dentro del rea
inspeccionada (es decir, dentro de alguna de las bandas estudiadas) como si es detectado. Ntese
que como se vio en el apartado anterior la probabilidad de que suceda esto es

c E[p].

Entonces, el estimador de Horvitz-Thompson, dado que solamente se detectaron n animales en la


regin inspeccionada es:

E p
j 1

(2.53)

donde J es el nmero de bandas que forman la regin inspeccionada, c es la probabilidad de que


un animal est en la regin inspeccionada y E[p] es la detectabilidad media de los animales en la
regin inspeccionada.
Como E[p] no se conoce es necesario estimarla. Una forma de hacerlo sera considerar los mtodos
del apartado anterior. Con el muestreo de transectos de lnea, E p

, as que utilizar el
w

estimador E p
proporciona el estimador de la abundancia Horvitz-Thompson-like:
w

n
a
Aw

(2.54)

el cual se reduce al estimador convencional del muestreo de transectos de lnea cuando la anchura
media del transecto es w y la longitud total es L (Buckland et al., 2001):

54

nA
N
2 L
donde

(2.55)

se ha estimado utilizando las distancias de los animales detectados a la lnea.

Un estimador Horvitz-Thompson alternativo al de la ecuacin (2.55) usa las probabilidades de


deteccin de cada animal dada su distancia xi, en lugar de la E[p], esto es:

A
N
a

p x

(2.56)

i 1

Las probabilidades p(xi) se estiman a partir del modelo fijado para la funcin de deteccin, por lo que
el estimador Horvitz-Thompson-like viene dado por:

A
N
a

p x
i 1

(2.57)

estimador que es inestable si muchas de las probabilidades de deteccin estimadas son cercanas a
cero. Para evitar esto se puede truncar la distancia w, tal que

p w 0,2 debera ser adecuada.

2.4.1.3 Estimacin por intervalos


Si se parte de la aproximacin de la verosimilitud total se puede aplicar un bootstrap paramtrico
generando las posiciones de los animales mediante un modelo de estado espacial uniforme para la
distribucin de stos y mediante la funcin de deteccin ajustada para generar nuevas distancias de
deteccin. Este mtodo tiene las desventajas de que las detecciones se asumen como sucesos
independientes y que las estimaciones de la varianza estn condicionadas al modelo seleccionado
para la funcin de deteccin. Aunque a lo largo de todo el captulo slo se considera que los
animales se distribuyen uniforme e independientemente, en realidad este modelo no es apropiado
ya que los animales tienden a estar ms o menos agrupados en la regin de estudio.
Si se quiere evitar hacer todas estas hiptesis se puede usar un bootstrap no paramtrico, en el cual
la unidad de muestreo es la lnea individual y su implementacin en la mayora de los casos se
realiza de la misma forma que en el muestreo por parcelas, sin ms que sustituir las bandas por
lneas. Por el diseo se puede asegurar que los datos procedentes de distintas lneas son
independientes, y que los datos de las remuestras no son generados a partir de un modelo asumido
para la funcin de deteccin. Esto hecho har que las estimaciones por intervalos sean ms
robustas.
Si todas las lneas son de igual longitud, entonces la tcnica bootstrap implica remuestrear lneas,
con reemplazamiento, hasta que la nueva muestra contenga el mismo nmero de lneas que la
muestra original. Si las lneas son de distinta longitud, usualmente el remuestreo contina hasta que
la longitud total de la lnea es igual o casi igual a la longitud de la lnea del diseo original. Un hecho

55

a tener en cuenta es que para obtener intervalos de confianza fiables, sera necesario tener un
diseo con al menos 15-20 lneas.

2.4.2 Muestreo de transectos de punto

Este tipo de muestreo es una extensin de los conteos de puntos, los cuales son un caso especial
de muestreo por parcelas, en el cual las J parcelas son crculos de radio w. La regin inspeccionada
tiene un rea a = J w2. Si se asume que el nmero de todos los animales detectado en la regin
inspeccionada es n, entonces la estimacin de N viene definida como en el muestreo por parcelas
por:

nA
nA
N

a
Jw 2
En el muestreo de transectos de punto algunos de los animales que estn en la regin
inspeccionada se pierden y las distancias de los animales detectados a partir del punto se utilizan
para modelizar este elemento aadido.
As, el estudio de transectos de punto ms simple est formado por J puntos aleatoriamente
posicionados en la regin de estudio, o ms usualmente una rejilla sistemtica de J puntos
aleatoriamente superpuestos en la regin. El observador visita cada punto y registra la distancia de
deteccin, x, de cada animal detectado al punto. Todos los animales en muy cerca del punto se
asumen que son detectados y la probabilidad de deteccin se asume que disminuye a una distancia
a partir del punto superior a w.
2.4.2.1 Estimacin mximo verosmil
Al igual que en el muestreo de transectos de lnea, para definir un marco de trabajo para la
verosimilitud total se necesita especificar un modelo de estado para las posiciones de todos los
animales o grupos de animales en el momento del estudio y un modelo de observacin. La
diferencia esencial entre el muestreo de transectos de lnea y el de punto est en la funcin de
densidad de las posiciones de los animales que estn en la regin inspeccionada. En el caso de los
transectos de lnea, es razonable asumir que el nmero esperado de animales es el mismo para
todas las distancias a partir de la lnea en la regin inspeccionada. En el caso de los estudios de
transectos de puntos, el nmero esperado de animales aumenta a medida que aumenta la distancia
a partir del punto. Esto se debe a que el rea de la superficie del anillo o corona con centro en el
punto aumenta cuando nos alejamos de ste.
Los modelos de observacin para el muestreo de transectos de punto son los mismos que para el
muestreo de transectos de lnea. Si se asume un modelo de estado uniforme, en el cual un animal o
grupo de animales es igualmente probable que est en cualquier lugar de la regin de estudio de

56

tamao A, entonces la probabilidad de que est en la regin inspeccionada de rea a es

. Por

tanto, el nmero esperado de grupos en una corona o anillo, que comprende el rea entre las
distancias (x, x + dx) y el punto, es proporcional al rea de la superficie de la corona. Para dx
pequeo este nmero es 2 xdx y de ah que la funcin de densidad de las distancias radiales del
animal o grupos de animales dentro de un crculo de radio w con centro el punto sea:

(x)

2x

2x

(2.58)

w2

EMV a partir de la verosimilitud total

La derivacin de una verosimilitud total para el muestreo de transectos de punto es idntica a la del
muestreo de transectos de lnea, excepto por el hecho de que ( x )
ecuacin E p

p( x ) ( x )dx

w 2

. Su sustitucin en la

da lugar a:

E p

donde 2

2x

p( x )

2x

dx

w 2

(2.59)

xp( x ) . Ntese que como en el muestreo de transecto de lnea p(x) y E[p] son

funciones del vector de parmetros .


A consecuencia de este cambio, la verosimilitud total viene dada por:

N
1 c E p N n ( c ) n
n

L(N; ) =

p( x
i 1

2x i
w2

(2.60)

de modo que para estimar N, se pueden emplear los mismos mtodos de maximizacin numrica
usados en el muestreo de transectos de lnea.

EMV condicionado

Se puede adoptar una estrategia similar a la del muestreo de transectos de lnea y condicionar la
verosimilitud al tamao muestral n. Considerando las ecuaciones (2.58) y (2.59) y sustituyendo en la
ecuacin (2.48) se tiene la verosimilitud condicionada:

57

L( ) =
( )

x p( x
i

(2.61)

i 1

Al igual que en el muestreo de transectos de lnea, esta verosimilitud se puede maximizar con
respecto a , obteniendo as las estimaciones mximo verosmiles condicionadas de los
parmetros de la funcin de deteccin. Esto nos da el EMV de

, el cual se denota por

( ) , o

ms abreviadamente por .
Ahora se necesita estimar N. Si w es finito, la regin inspeccionada tiene rea J w2, donde J es el
nmero de puntos. Si dentro de ste rea se detectaron n animales podemos estimar N usando la
p de los estudios de transectos de punto, de modo que se
ecuacin (2.51) y la correspondiente E

tiene:

N c

(2.62)

w
y por tanto

n
n
nA

J
a
Jw

A w 2
A w 2

(2.63)

De igual forma, la densidad se estima por:

n
D
J

(2.64)

Esta es la aproximacin estndar para el muestreo de transectos de punto dada por Buckland et al.
(2001). Si se define

= 2 , entonces

es el radio efectivo del crculo, en el sentido de que el

nmero esperado de animales detectados en distancias al punto mayores a

es igual al nmero

esperado de animales perdidos en distancias al punto por debajo de

. El rea efectiva

inspeccionada es J = J 2 .

2.4.2.2 Estimacin basada en el diseo: estimador Horvitz-Thompson


El desarrollo realizado es prcticamente el mismo que en el caso del muestreo de transectos de
lnea. En este caso, sustituyendo E p

y a = J w2, donde J es el nmero de puntos, en


w 2

58

la ecuacin (2.53) se obtiene el estimador de la abundancia Horvitz-Thompson-like para estudios de


transectos de punto:

nA
N
J

(2.65)

estimador que coincide con el estimador convencional del muestreo de transectos de punto.
Anlogamente, el estimador de la abundancia Horvitz-Thompson-like que utiliza las probabilidades
p se puede escribir como:
de deteccin estimadas de cada animal en lugar de la E

A
N
a

p x
i 1

(2.66)

2.4.2.3 Estimacin por intervalos


Se procede como en el muestreo de transectos de lnea. Si los puntos estn aleatoriamente situados
en la regin de estudio, entonces el bootstrap no paramtrico se aplica para remuestrear puntos
(junto con las distancias asociadas a ellos), con reemplazamiento hasta que la remuestra tenga el
mismo nmero de puntos que la muestra original. Si el diseo consta de una rejilla regular de
puntos, que se extiende sobre la regin de estudio completa, se asume que stos representan una
muestra aleatoria de puntos y se remuestrea como antes.
Algunas veces, los estudios de transectos de puntos se disean situando lneas paralelas,
igualmente espaciadas por la regin de estudio y situando los puntos en intervalos regulares entre
las lneas. A menos que el espacio entre lneas sucesivas sea igual al espacio entre puntos
sucesivos en una lnea (en cuyo caso se obtiene una rejilla regular de puntos), las lneas deberan
ser tratadas como las unidades de muestreo cuando se generan las remuestras. Esto es, las lneas
son las que se remuestrean, de manera que cuando una es seleccionada para formar parte de la
muestra todos los puntos de esa lnea y sus datos asociados estn incluidos en la remuestra. El
remuestreo podra detenerse una vez que han sido seleccionadas el mismo nmero de lneas que
en el diseo original, o alternativamente, tan pronto como el nmero de puntos sea ms grande o
igual al nmero de la muestra original.

2.4.3 Heterogeneidad

Las poblaciones de animales casi siempre son heterogneas y modelizar la heterogeneidad puede
ser difcil. Los mtodos de muestreo de distancia se basan en cambios en la probabilidad de
deteccin debidos a una variable relativa al animal. Dicha variable es la distancia que existe entre el
animal y la lnea el punto. Estos mtodos tratan y modelizan la heterogeneidad incorporando un
modelo de probabilidad (un modelo de estado) para la distribucin de la distancia en la poblacin, el

59

cual viene dado por la ecuacin (5.1) en el caso de estudios de transectos de lnea y por la ecuacin
(5.17) en el caso de estudios de transectos de punto.
En presencia de heterogeneidad la importancia del modelo es evidente en los estudios de transectos
de lnea. La nica razn por la que somos capaces de interpretar la bajada de la frecuencia de
deteccin a medida que la distancia a partir de la lnea aumenta, es que el modelo de estado implica
que, en media, hay el mismo nmero de animales (detectados o no) a cualquier distancia. Luego, sin
el modelo de estado no habra forma de distinguir una bajada en la frecuencia de deteccin causada
por la presencia de pocos animales lejos de la lnea, de una bajada debida a una pequea
probabilidad de deteccin lejos de la lnea.
No obstante, una de las caractersticas ms interesantes de los mtodos de muestreo de distancia
es que proporcionan estimaciones de la abundancia que son robustas frente a la heterogeneidad no
modelizada. Esta propiedad que se denomina pooling robutness es muy deseable ya que como se
ha empezado diciendo en este apartado las poblaciones de animales casi siempre son
heterogneas.

2.4.4 Otros mtodos de muestreo de distancia


Se van a describir brevemente otros mtodos de muestreo de distancia.
2.4.4.1 Recuento de seales
Este mtodo se usa exclusivamente en estudios de mamferos marinos llevados a cabo por barco o
avin. En este tipo de estudio se estima por un lado el nmero de seales por unidad de rea y por
unidad de tiempo y por otro la razn de seales de cada animal, de forma que al dividir la primera
estimacin por la segunda, se tiene una estimacin de la densidad animal.
Supongamos pues que se lleva a cabo un estudio martimo de ballenas, en el cual los observadores
exploran un sector de ngulo delante del barco, registrando cualquier respiracin de las ballenas
detectadas dentro del sector y sus distancias al barco (ver Figura 8).

Figura 8

60

Este mtodo es similar al muestreo de transectos de punto, en el cual una proporcin

del

crculo es considerada. No obstante, en lugar de muestrear J puntos, se controla un nico sector


durante un tiempo T. Si la densidad animal fuese uniforme, el barco no necesitara moverse, pero en
la prctica, el mtodo es menos robusto si el estudio tiene una buena cobertura espacial de la regin
de estudio. Esta se logra viajando a lo largo del transecto como en el muestreo de transectos de
lnea.

Asumiendo que las seales suceden uniformemente en el tiempo y la independencia de la posicin


del barco, entonces la verosimilitud total del muestreo de transectos de punto (ecuacin (5.19)) se
aplica a las seales, con la excepcin de que debido a que las seales son instantneas, la

w 2
dividida por el rea de la regin de estudio
2

probabilidad de cobertura es el rea del sector

A. Es decir, se tiene que la probabilidad de cobertura es:

w 2

(2.67)

2
w
A
2A

La estimacin mximo verosmil condicionada de los parmetros de la funcin de deteccin se


obtiene exactamente como en el muestreo de transectos de punto (ver apartado 2.4.2.1). Ya que el
rea cubierta o inspeccionada en cualquier instante es el rea del sector, se debe multiplicar por el

tiempo T para obtener el rea total inspeccionada,

Tw 2 . No importa que las reas se solapen en


2

el espacio, ya que las seales son instantneas. Las unidades del rea inspeccionada son en
realidad rea-tiempo. Por tanto, se estima el nmero de seales por unidad de rea y por unidad de
tiempo mediante la expresin:

D c

Tw
2

2n
T

(2.68)

la cual se puede convertir en una estimacin de la abundancia animal, dividiendo por una estimacin
de la razn de seales media de la poblacin,

y multiplicando por el tamao de la regin de

estudio A:

Representa las seales por animal y por unidad de tiempo .

61

2nA
N
T

(2.69)

2.4.4.2 Redes de trampas


En este caso se eligen puntos muestrales de forma que en cada punto se disea una red. Por tanto,
las redes de trampas van a estar formadas por una muestra de parcelas circulares. Estas van a ser
ms estrechas cerca del centro y van a ir aumentando de tamao progresivamente conforme
aumenta la distancia a ste (ver Figura 9).

Figura 9

De esta manera, la densidad de ser atrapado por una trampa va a ser ms alta cuanto ms cerca
del centro de la red se est. Los animales atrapados nos van a proporcionar las detecciones, y la
distancia de deteccin es la distancia que hay desde la trampa que captur al animal al centro de la
red.
La filosofa de este mtodo es que el espacio de la trampa debera de ser suficientemente pequeo
para asegurar que todos los animales cerca del centro de la red sean atrapados. Los datos de las
distancias que se registran son las del centro de la red a las trampas en las que los animales
detectados son cogidos. Este mtodo es por tanto similar al del muestreo de transectos de punto,
por lo que se consideran las mismas verosimilitudes y estimadores.
Un inconveniente de este mtodo es que depende del movimiento de los animales para atraparlos.
Como la densidad de atrapar los animales es ms alta cerca del centro de la red, los animales que
se mueven sobre un gran rea son ms probables que sean atrapados cerca del centro de la red,
causando un sesgo ascendente en las estimaciones de la densidad.
2.4.4.3 Muestreo de distancia indirecto
En este caso el muestreo de transectos de lnea o de punto no se lleva a cabo con los animales de
inters sino con los signos o marcas que stos producen. Ejemplos de estos signos son los
montones de estircol (elefantes), las agrupaciones de bolitas de estircol (ciervos) o los nidos
(monos).

62

Supongamos pues que se van a estudiar los montones de estircol. Si se aplica el mtodo de
transectos de lnea o el de transectos de punto estndar al estudio de los montones de estircol, las
verosimilitudes y los estimadores que se consideran son los mismos que los de los apartados de los
muestreos de transectos de linea y de puntos, dependiendo de qu tcnica se emplee. Una vez
estimada la densidad de los montones de estircol, se debe dividir por una estimacin del tiempo
medio de putrefaccin (en das) de los montones de estircol en el periodo precedente al estudio.
Esto nos da una estimacin del nmero de montones de estircol depositados por da, de modo que
para convertirla en una estimacin de la densidad animal se necesita dividir de nuevo por una
estimacin del nmero de montones de estircol producidos por da y por animal.

2.4.5 Efectos producidos al violar las hiptesis

Las hiptesis realizadas para este mtodo son:


Hiptesis 1.- Todos los animales a distancia cero son detectados: p(0) = 1.
Si se viola esta hiptesis, las estimaciones de la abundancia son negativamente sesgadas en
proporcin a p(0). Por ejemplo, si p(0) = 0,25, entonces en media slo el 25% de las estimaciones
coincidirn con el verdadero valor de la abundancia. Pero si se cumple, los estimadores van a ser
pooling robust, es decir, no se va a introducir ningn sesgo cuando se agrupan datos de animales
con distintas probabilidades de deteccin.
Hiptesis 2.- Los animales o grupos de animales se distribuyen aleatoriamente (no uniformemente)
e independientemente en la regin de estudio.
La violacin de esta hiptesis conlleva intervalos de confianza que tienden a ser sesgados.
Hiptesis 3.- Los animales no se mueven antes de la deteccin.
Los efectos que se producen cuando se viola esta hiptesis son varios: los movimientos aleatorios
inducen un sesgo positivo (la razn a la que se encuentran los animales es excesiva), el movimiento
del animal se retrasa con respecto al movimiento del observador por lo que el sesgo es pequeo y el
movimiento de respuesta puede causar un gran sesgo (positivo si hay atraccin hacia el observador
y negativo si hay rechazo).
Hiptesis 4.- Las distancias son medidas exactamente.
Los estimadores de transectos de lnea son claramente robustos a errores aleatorios de medida,
mientras que los de transectos de punto son ms sensibles. No obstante, ambos son sensibles al
sesgo sistemtico presente en la medicin de la distancia y al redondeo a cero de la distancia.

63

2.5 Mtodo del vecino ms cercano y mtodo del punto al objeto ms


cercano

En el muestreo del vecino ms cercano, los objetos dentro de la regin de estudio se muestrean
aleatoriamente, y se miden las distancias a sus vecinos ms cercanos. En el muestreo del punto al
objeto ms cercano, se muestrean aleatoriamente los puntos que hay dentro de la regin de estudio
y se mide la distancia de cada punto al objeto ms cercano. Si se asume que los objetos estn
distribuidos uniforme e independientemente a lo largo de la regin de estudio, entonces la
distribucin de distancias al objeto ms cercano es la misma bajo ambas aproximaciones.
Estos mtodos se pueden extender al caso en el que se mide la distancia a los K objetos ms
cercanos con K 1 (Diggle, 1983). De este modo en reas de alta densidad animal, el hecho de
que K>1 proporciona una estimacin de la densidad ms eficiente.
No obstante, en la prctica rara vez se usan estos mtodos cuando se llevan a cabo estudios de
vida salvaje. Las razones son varias:

Si los objetos estn distribuidos esparcidamente en la regin de estudio, puede resultar


difcil y costoso localizar el objeto ms cercano.

Los mtodos son ineficientes porque pueden localizarse muchos otros objetos mientras
intentamos identificar al objeto ms cercano.

Si los objetos son mviles, la medicin de la distancia al objeto ms cercano puede ser
propensa a sesgo. Es por esta razn por la que este mtodo es mejor aplicarlo en estudios
donde los objetos sean inmviles, tales como las plantas.

Para el mtodo del vecino ms cercano, es difcil seleccionar una muestra aleatoria de
objetos a partir de la poblacin entera.

El modelo de estado, el cual especifica que los objetos estn uniformemente distribuidos a
travs de la regin de estudio, no es realista en muchas aplicaciones, y la estimacin de la
densidad es muy sensible a esta hiptesis.

El ltimo problema lleva mucho tiempo siendo reconocido, y se han llevado a cabo varios intentos
para ajustar la no uniformidad. De hecho, estos mtodos se han usado ms comnmente para medir
la no uniformidad que para estimar la abundancia. Si la distribucin de los animales tiende a ser ms
agrupada o agregada que un patrn aleatorio, la abundancia es subestimada si las distancias se
miden a partir de un punto aleatorio y sobreestimada si se miden a partir de un objeto aleatorio. Es
por esta razn por la que algunos estimadores ad hoc estn basados en una media de las dos
estimaciones (Diggle, 1983).

2.5.1 Estimacin mximo verosmil

64

Superficialmente, los estudios del punto al objeto ms cercano parecen similares a los del muestreo
por parcelas. Conceptualmente, las parcelas se muestrean a partir de la regin de estudio, donde
cada una de ellas es un crculo con centro el punto muestreado y con radio igual a la distancia al
objeto ms cercano. Ahora el problema est en que el tamao de la parcela es una variable aleatoria
y no una constante conocida.
Es necesario por tanto encontrar una funcin de verosimilitud, dado el modelo de estado asumido,
es decir, dado que los animales se distribuyen uniforme e independientemente en la regin de
estudio. Para ello se deriva la funcin de densidad de la distancia x al objeto ms cercano (o
equivalentemente la del rea de la parcela, si la parcela se define como arriba). Este procedimiento
se puede aplicar a ambos mtodos.
Por tanto, sea X la variable aleatoria distancia al objeto ms cercano y sea x un valor concreto que
toma dicha variable aleatoria. La probabilidad de que la variable aleatoria X sea mayor que el valor
x, Pr(X > x), es la probabilidad de que ningn objeto est dentro de un rea x 2 . Dado que los
objetos estn uniforme e independientemente distribuidos a lo largo de la regin de estudio (esto es,
el modelo de estado que determina la posicin de un animal, la cual viene dada por las coordenadas
cartesianas (u, v), es (u,v )

1
), el nmero de ellos en un rea de tamao unidad sigue una
A

distribucin de Poisson de razn

N
. As, el nmero de objetos en un rea de tamao x 2 sigue
A

una distribucin de Poisson de razn

x 2 N . Luego:
A

x 2 N

A
Pr(X > x) =

x 2 N
exp

0!

x 2 N
exp

(2.70)

As la funcin de distribucin acumulada de x es:

x 2 N
F(x) = Pr(X x) = 1- exp

(2.71)

Diferenciando con respecto a x, se obtiene la funcin de densidad, la cual es el modelo de estado


para la distancia x al objeto ms cercano:

65

(x)

2xN
x 2 N
exp

A
A

(2.72)

Para obtener la funcin de verosimilitud evaluamos esta expresin en cada una de las J distancias al
objeto ms cercano y se multiplican las evaluaciones conjuntamente, de forma que se tiene:
J

L(N) =

j 1

2N

(x j )

j 1

x 2j N
x j exp

(2.73)

A continuacin se toman logartmos, se diferencia con respecto al parmetro desconocido N y se


iguala a cero la expresin. Por ltimo, se resuelve despejando N:

JA

(2.74)

2
j

j 1

Anlogamente, si medimos las distancias a los K objetos ms cercanos, la derivacin da lugar a:

JAK

2
jk

(2.75)

j 1 k 1

donde xjk es la distancia del k-simo objeto al j-simo objeto o punto muestreado.

2.5.2 Estimacin por intervalos


en la funcin de densidad
El bootstrap paramtrico se puede implementar sustituyendo N por N
de x (ecuacin (2.72)) y generando J distancias a partir de ella. Para esta muestra bootstrap
obtenida se calcula el estimador mximo verosmil (ecuacin (2.74)) y el proceso se repite un gran
nmero de veces (B).
El bootstrap no paramtrico acta de forma similar, solo que las remuestras se obtienen
seleccionando J puntos (y sus distancias asociadas) con reemplazamiento a partir de los J puntos
de la muestra original. Si el diseo de un estudio del punto al objeto ms cercano es tal que los
puntos se localizan aleatoriamente o sistemticamente a lo largo de las lneas colocadas, entonces
se remuestrean las lneas en lugar de los puntos.

2.5.3 Efectos producidos al violar las hiptesis

La hiptesis que se realiza en este captulo es:


Hiptesis.- Los animales se distribuyen segn un modelo espacial uniforme en la regin de estudio.

66

En el caso del muestreo del punto al objeto ms cercano el efecto que se produce al violar dicha
hiptesis es que las distancias de los puntos a los animales ms cercanos en media son mucho
mayores que las que habra en el caso de que la poblacin se distribuyese uniformemente en la

regin de estudio. Por tanto, el denominador de la ecuacin (2.74) es demasiado grande y N


demasiado pequeo. Lo contrario ocurrira en el caso del muestreo del vecino ms cercano, ya que
las distancias entre un animal y el vecino ms cercano dentro de un grupo o cluster van a ser
pequeas (ver Figura 10).

Figura 10

Hasta ahora los modelos de estado han estado prcticamente ausentes en los mtodos de
estimacin de la abundancia anteriores. El muestreo por parcelas y el de distancia han sido los
nicos en los que se ha asumido una distribucin uniforme de los animales pero no se ha
considerado ningn otro modelo de estado a parte de ste. En el siguiente apartado, los modelos de
estado juegan un papel mucho ms importante siendo los modelos de estado espaciales un tipo de
los muchos modelos posibles. A partir de este momento, se van a tener en cuenta poblaciones de
animales que van a ser heterogneas no slo en lo que respecta a su distribucin espacial, y es por
esta razn por la que se van a considerar modelos de estado para todas las fuentes de
heterogeneidad. Como indicamos al inicio de este captulo para ms informacin sobre los nuevos
modelos de estado y observacin ver el apartado 2 del Anexo.

67

2.6 Modelos espacio/temporales con deteccin segura

En este apartado, se trabaja con modelos que permiten la estimacin de la distribucin espacial y/o
temporal de los animales cuando la deteccin de todos ellos es segura dentro de la regin
inspeccionada. Concretamente se va a estudiar la estimacin de la abundancia mediante:

La modelizacin de la distribucin espacial de los animales a partir de estudios por parcelas

La modelizacin de la distribucin temporal de los animales a partir de recuentos


migratorios

La modelizacin de la distribucin espacio-temporal de los animales a partir de una serie de


estudios por parcelas

Los estudios por parcelas y los recuentos migratorios conceptualmente son muy similares. Mientras
un estudio por parcelas comprende una muestra de stas en las que se contabiliza el nmero de
animales en un instante de tiempo dado, un recuento migratorio comprende una muestra de
periodos de vigilancia u observacin en los que se contabiliza el nmero de animales que se
observan durante dichos periodos.
De igual forma que en el muestreo por parcelas se asuma que todos los animales que se
encontraban en la regin inspeccionada podan ser detectados, en el caso de los recuentos
migratorios se asume que todos los animales que pasan durante un periodo de observacin van a
ser contados. Ntese que aunque en el apartado 2.1 tambin se asumi que la distribucin espacial
de los animales era uniforme (hecho que con frecuencia era violado), considerar la hiptesis de que
la distribucin temporal de un proceso migratorio es uniforme no es admisible dada la naturaleza de
dicho proceso. De hecho, se sabe que la distribucin temporal de los animales migratorios tiene una
formulacin bastante simple. Es unidimensional (el tiempo es la dimensin) y con frecuencia suave;
el nmero de animales que pasan desde el inicio del periodo de vigilancia crece de forma suave
hasta algn mximo para luego disminuir suavemente al final de la estacin de migracin. Esta
situacin contrasta con el caso del muestreo por parcelas, en donde la distribucin espacial de los
animales en la regin de estudio tiene dos dimensiones y raramente tiene una formulacin sencilla.

2.6.1 Modelizacin temporal: recuentos migratorios

Hasta la fecha, los recuentos migratorios han sido utilizados exclusivamente para estimar el tamao
de las poblaciones de ballenas que anualmente emigran pasando por puntos de vigilancia costera.
Potencialmente estos recuentos son relevantes para cualquier otra poblacin de animales
migratorios siempre y cuando exista un rea de estudio desde la que se los pueda observar
regularmente y por la que deba pasar la poblacin entera.
La poblacin de ballenas grises de California (Eschrichtius robustus) se estudi desde Monterrey
(Reilly et al., 1980, 1983), mediante este mtodo durante el periodo de emigracin que transcurre

68

desde su zona de alimentacin en los Mares de Bering y Chukchi a su zona de cra en Baja
California.
2.6.1.1 Estimacin mximo verosmil
Datos agrupados
Para poder usar los mtodos basados en el modelo del apartado 2.1 estaramos forzados a asumir
que los animales pasan por el punto de vigilancia independientemente a una velocidad uniforme
durante todo el periodo de migracin, hiptesis que es insostenible (Figura 11).

Figura 11

El nmero de animales que pasan por unidad de tiempo cambia durante el periodo de migracin.
Por tanto, es necesario especificar un modelo de estado temporal para el proceso migratorio
definiendo una razn de migracin de (t ) animales por unidad de tiempo en el instante t, donde t
= 0 corresponde al inicio de la migracin y t = T corresponde al final de esta. As pues, (t ) es la
base del modelo de estado temporal y tiene asociado un vector de parmetros desconocidos ,
los cuales se van a estimar por mxima verosimilitud.
Por tanto, es necesario formular una verosimilitud y para ello se precisa obtener una expresin que
nos proporcione la probabilidad de que un animal dado pase por el punto de vigilancia durante el
periodo de observacin j. Dicha probabilidad la vamos a denotar por j .
La probabilidad de que un animal pase por el punto de vigilancia en el pequeo intervalo de tiempo
(t, t + dt) es:

69

dt

(t )

(2.75)

(t )dt
0

y el correspondiente modelo de estado que modeliza el tiempo en el que el animal pasa por el punto
de vigilancia viene dado por:

(t )

(t )
(2.76)

(t )dt
0

Luego, la probabilidad de que el animal pase por el punto de vigilancia en el periodo de observacin
j el cual se inicia en el instante tsj y finaliza en el instante tfj se expresa por:

t fj

t sj

(t )dt

(2.77)

Ya que un animal dado solo puede pasar durante un periodo, la probabilidad de que un animal pase
durante uno de los J periodos de vigilancia (que conforman el periodo de cobertura) es justamente la
suma de los j :

c c ( )

( )

(2.78)

j 1

Si se asume que el instante en el que pasa cualquier animal es independiente de los instantes en los
que pasan otros animales, y se considera el suceso pasar en un periodo de vigilancia como un
xito, entonces la verosimilitud para N y es la multinomial siguiente:

Lb ( N ; )

N!

1 c

N n ! n j !
j 1

N n nj

(2.79)

j 1

Luego, como se puede comprobar la verosimilitud se determina por el modelo de estado de la razn
de migracin, (t ) . Ntese que al igual que en el muestreo por parcelas, no hay aleatoriedad en
el modelo de observacin ya que la deteccin es segura dentro de los periodos de vigilancia. La

70

estimacin de los parmetros N y se obtiene maximizando la ecuacin (2.79) respecto a N y


mediante procedimientos numricos estndar.
Otra forma alternativa, utilizada en la prctica, consiste en estimar maximizando la verosimilitud
~
condicionada, dado n, con respecto a . As se obtiene una estimacin de , de modo que

c se puede estimar por

~ ( ) . En este caso dado

c
c

~c , N se puede estimar por mxima

verosimilitud dando lugar al EMV condicionado:

n
~
N ~
c

(2.80)

Sanathanan (1972) demostr que las distribuciones asintticas de los estimadores mximo
~
~ y
verosmiles condicionados N
son idnticas a las de los estimadores mximo verosmiles no

condicionados N

y , obtenidos maximizando la ecuacin de verosimilitud total (2.79) con

respecto a N y a .

Datos no agrupados

Generalmente la estimacin a partir de estudios de recuentos migratorios involucra el uso de los


recuentos en cada periodo de vigilancia en lugar de los instantes observados en los que cada animal
pasa por los puntos de vigilancia. Usualmente, los periodos de vigilancia son tan cortos en
comparacin con la duracin de la migracin que poco provecho se obtendra usando los instantes
de deteccin de cada animal. No obstante, es bastante fcil extender la verosimilitud de la ecuacin
(2.79) al caso en el que los instantes de deteccin de cada animal son registrados.
Para desarrollar una funcin de verosimilitud que use los instantes de deteccin individuales, se
necesita la funcin de densidad condicionada de tiempo de paso, dado que el animal fue detectado.
Sea tij el instante de tiempo en el que el i-simo animal detectado en el j-simo periodo de vigilancia
pasa por donde est el observador. La funcin de densidad no condicionada de tij es (t ij ) .
Usando el Teorema de Bayes y la hiptesis de que los animales pasan independientemente unos de
otros, la funcin de densidad conjunta de los tiempos de paso es:

Lu ( n )

nj

j 1 i 1

(t ij )
j

(2.81)

Multiplicando la ecuacin (2.79) por esta, se tiene:

71

N
1 c N n
n

Lu (N; )

(t

(2.82)

k 1

donde tk es el instante de tiempo en el que tiene lugar la k-sima deteccin.


2.6.1.2 Estimacin por intervalos
Los mtodos de la profile likelihood o el bootstrap paramtrico se puede utilizar para estimar
intervalos de confianza, mediante la generacin de muestras a partir de la distribucin multinomial
fijada.
El bootstrap no paramtrico, aunque se implementa de forma diferente, es equivalente al bootstrap
paramtrico en esta situacin. Se puede aplicar listando todos los animales y remuestrendolos con

reemplazamiento, de forma que nj animales se listan como contados en el periodo j, j = 1, ..., J y N


J

- n animales son listados como no contados, donde n =

. As pues, a partir de este listado se

j 1

seleccionan N

animales con reemplazamiento para cada nueva muestra y se obtienen los

intervalos de confianza correspondientes como ya se ha explicado anteriormente en otras


ocasiones.

2.6.2 Modelizacin espacial: muestreo por parcelas


La estimacin de la abundancia modelizando la distribucin espacial de los animales con datos de
muestras por parcelas es la misma que la estimacin de la abundancia a partir de un estudio de
migracin simple, con la excepcin de que:
1.

En un estudio de migracin la regin de estudio es unidimensional siendo la dimensin el


tiempo, mientras que en un estudio por parcelas la regin de estudio es bidimensional
siendo las dimensiones espaciales.

2.

En un estudio de migracin el modelo de estado usualmente tiene una formulacin


relativamente simple, cuyas caractersticas clave se conocen bien antes del estudio,
mientras que la distribucin espacial de los animales en un estudio por parcelas puede ser
muy complicada sin conocer las caractersticas clave.

2.6.2.1 Aplicacin de ejemplo

72

Un ejemplo real de la utilidad de esta aproximacin es la estimacin de la abundancia de caballa


frente a las costas occidentales de Francia, Gran Bretaa e Irlanda a partir de datos de estudios del
desove. Las existencias de huevos se calculan usando el Mtodo de Produccin de Huevos Diarios
(DEPM: Gunderson, 1993; Hunter y Lo, 1993). El mtodo involucra estimar la abundancia de huevos
en un solo da a partir de un estudio de estos realizado en barco, y estimar el nmero medio de
huevos producidos por pescado y por da a partir de un estudio simultneo del pescado. Este
procedimiento es un ejemplo de un mtodo de clculo indirecto, en el cual la abundancia de
pescado se estima a partir de una estimacin de la abundancia de huevos. La regin de estudio y la
localizacin de redes de muestras de huevos del estudio realizado en 1992 se muestra en la Figura
11.

Figura 11

Cada localizacin de la muestra (redada de pescado) se puede ver como una unidad muestral del
muestreo por parcelas y las redes son tales que todos los huevos que estn dentro de la parcela son
observados. La densidad de huevos de caballa en la regin de estudio se sabe que no es muy
uniforme (ver Figura 12).

73

Figura 12

Observando la Figura 12 se ve que hay un considerable cambio en la densidad que va desde cero
en el este hasta una cima usualmente cercana a la curva de profundidad de 200m volviendo a ser
muy baja en el borde oeste de la regin de estudio. Tambin hay un cambio sistemtico
considerable en la densidad de norte a sur, de manera que la densidad es ms baja en el sur, ms
alta en latitudes medias y de nuevo es muy baja en el norte. El agua que hay alrededor del banco
de puerco espines , una regin de agua poco profunda situada a 14 Oeste, 53,5 Norte,
usualmente tambin es una regin con una densidad de huevos relativamente alta.
La superficie de la densidad es una funcin de la localizacin, de la profundidad y de otras posibles
variables, aunque en principio slo se va a considerar que es una funcin de la localizacin. Nos
referimos a la superficie de la densidad como ( x ) , donde x = (u, v) y u y v son la longitud y la
latitud. Ya que la forma de la superficie no es muy predecible, se debe utilizar una formulacin
funcional no paramtrica para ( x ) . En este ejemplo concreto, ( x ) se ha modelizado usando
splines de suavizamiento (ver Hastie y Tibshirani, 1990). Con esta formulacin, el modelo de estado
para la localizacin de huevos es:

(x)

( x )

( x )dudv

(2.83)

y la probabilidad de que algn huevo est en la j-sima redada se modeliza como:

( x )dudv

(2.84)

74

En este ejemplo, se ha considerado que la curva de profundidad de 200m (D200) y la profundidad


del fondo (BDp) son variables explicativas importantes por lo que se deben incluir en el modelo. Por
tanto, el modelo de la ecuacin (8.9) sera fcil de extender para incluir estas variables definiendo x
= (u, v, D200, BDp). Ntese que tanto D200 como BDp son conocidas en cualquier lugar de la
regin de estudio.
Para terminar decir que como se ha considerado una formulacin no paramtrica para ( x ) no va
a ser posible obtener una estimacin maximizando la ecuacin de verosimilitud (2.79) y es por esta
razn por la que la estimacin se debe obtener utilizando Modelos Aditivos Generalizados (GAM;
Hastie y Tibshirani, 1990).
2.6.2.2 Estimacin por intervalos
La estimacin de la varianza y del intervalo de confianza se puede obtener como en el caso de los
recuentos migratorios. Si se aplica un mtodo bootstrap que involucre el muestreo de parcelas con
reemplazamiento, ste tendr una cobertura ms pobre de la regin de estudio que el estudio
original, ya que en cualquier muestra bootstrap algunas parcelas se omiten mientras que otras se
eligen ms de una vez. Este problema no le afecta a un bootstrap paramtrico, aunque en este caso
ser necesario encontrar un modelo paramtrico apropiado para ir generando las remuestras.

2.6.3 Modelizacin espacio-temporal

En algunas situaciones tiene sentido modelizar tanto la distribucin espacial de una poblacin
nominalmente cerrada, como la forma en la que cambia con el tiempo. De nuevo el ejemplo de la
estimacin de la abundancia de caballa nos va a servir para ilustrar esta situacin. En este caso, el
modelo de estado que se considera es uno de los llamados Population-level drift (Ver apartado 2
del Anexo). Rutinariamente para calcular las existencias de caballa se utiliza el Mtodo de
Produccin de Huevos Anual (AEPM; ver Gunderson, 1993). Este mtodo estima la abundancia de
huevos diaria as como la produccin total de huevos en una estacin de desove. Los datos se
recogen a partir de un nmero de estudios realizados sobre la cantidad de huevos depositados
durante dicha estacin, considerndose cada uno de ellos como una pequea versin del estudio
DEPM descrito en el apartado anterior.
En 1995 se llev a cabo un estudio para estimar la produccin de huevos de caballa y los resultados
obtenidos se resumen brevemente a continuacin (ver Augustin et al., 1998b para ms detalles). La
densidad se modeliz como una funcin de cuatro variables: la distancia desde la curva de
profundidad de 200m, la distancia norte a lo largo de esta curva, la profundidad del fondo y la fecha.
Al igual que en el caso anterior la formulacin de la dependencia de las variables espaciales y
temporales no se conoce bien y puede ser complicada, as que ( x ) se modeliz utilizando
splines suavizados y la estimacin se obtuvo usando los mtodos GAM.

75

La Figura 13 muestra la produccin de huevos estimada a lo largo del ao 1995, que como se puede
observar es anloga a la curva de suavizamiento representada para la migracin de las ballenas en
la Figura 11.

Figura 13

76

Anexo

1. Modelos de estado y de observacin para mtodos simples


El problema de la estimacin de la abundancia animal se ha formulado en trminos de modelos de
estado y modelos de observacin.
Los modelos de estado y de observacin representan conjuntamente al modelo estadstico que
describe cmo se generan los datos observados dada una regin investigada. Los procesos
mediante los que se obtienen los datos tienen en cuenta las caractersticas de los animales (dnde
estn situados, cul es su tamao, etc.), y el modo en el que se han observado dadas sus
caractersticas. Lo primero se intenta capturar en el modelo de estado y lo segundo se describe con
el modelo de observacin.
Para su estudio vamos a considerar una regin de estudio en la que existen N animales y la
probabilidad de detectar cualquier animal en dicha regin es denotada por p y asumiremos en
principio que es conocida.

1.1 Modelos de estado


El modelo de estado es un modelo estadstico que describe el estado de la poblacin, luego controla
la distribucin de los animales con respecto a la localizacin, sexo, tamao, etc., as como las
caractersticas de estos en aquella.
A la distribucin real de los animales en cualquier momento se le llama realizacin del modelo de
estado. Por ejemplo, la figura que se observa abajo muestra la densidad media constante asociada
a un modelo de estado espacial uniforme y las localizaciones de N = 200 animales para una
realizacin de esta hipottica poblacin (derecha).

Si se llevasen a cabo otras realizaciones del mismo modelo de estado se obtendran diferentes
localizaciones de los animales. De hecho los modelos de estado rara vez son tan simples ya que la

77

mayora de las veces los animales se distribuyen atendiendo a las localizaciones de otros animales.
De este modo, podran tender a estar cerca de otros animales o si son muy territoriales podran
tender a estar cerca de otros animales de la misma especie.
Los modelos de estado espaciales no son los nicos relevantes. Conceptualmente en una poblacin
podemos encontrarnos modelos bajo la distribucin de la edad, el sexo, el tamao, etc. Adems, son
modelos que van a depender del tiempo ya que las poblaciones de animales son dinmicas. Tal
dependencia existir a menos que se trabaje con fotos instantneas de la poblacin, es decir, con
la poblacin en un solo instante de tiempo.
La realizacin del modelo de estado divide a los N animales de la poblacin en subpoblaciones
homogneas, de forma que hay N( x ) animales, donde x es el vector de variables relativas a
caractersticas de ellos. As por ejemplo, si el sexo fuese la nica variable relativa a los animales
relevante, x sera la variable sexo ( x = 0 para machos y x = 1 para hembras) y la poblacin
estara dividida en dos subpoblaciones formadas por N(0) animales machos y N(1) animales
hembras.

1.2 Modelos de observacin


Los modelos de observacin son modelos estadsticos que describen cmo se detectan o capturan
los animales, dadas las caractersticas de estos y la naturaleza del estudio. Estos modelos slo se
aplican dentro de la regin inspeccionada ya que nicamente los animales de esa regin pueden ser
detectados.
La regin inspeccionada usualmente se elige utilizando algn conjunto de reglas probabilsticas que
involucran alguna aleatoriedad. A este conjunto se le llama diseo muestral. El inspector o
inspectores son quienes controlan dicho diseo, incluyendo qu observadores o trampas y cuntos
se utilizan y qu conjunto predefinido de unidades muestrales se incluyen en el estudio, mientras
que el modelo de deteccin describe el proceso probabilstico mediante el cual los animales son
detectados o capturados en esas unidades.
Existen diferentes modelos de observacin dependiendo de la probabilidad de deteccin de los
animales.
El modelo de observacin ms simple posible se desarrolla en un escenario de un solo estudio en el
que todos los animales de la regin inspeccionada son detectados con seguridad, es decir, con
probabilidad p = 1. As por ejemplo, supongamos que hay Nc animales en la regin inspeccionada.
No hay incertidumbre sobre el nmero n de animales que sern vistos, el nico resultado posible es
que n = Nc. En este caso, toda la incertidumbre en la estimacin de la abundancia procede del
hecho de que no se inspeccion por completo la regin de estudio. Si la poblacin entera est en la

= n, si la mitad de la poblacin est en la regin inspeccionada


regin inspeccionada entonces N

78

= 2n y as sucesivamente. El modelo de estado especifica las localizaciones de los


entonces N
animales y este es la fuente de toda incertidumbre en la estimacin de la abundancia.
En el caso de que la probabilidad de deteccin no sea segura (no es 1), el modelo de observacin
ms simple posible es aquel en el que todos los animales son detectados independientemente (la
deteccin de un animal no afecta a la deteccin de otro) con la misma probabilidad p < 1. Si hay Nc
animales en la regin inspeccionada, la probabilidad de que n de ellos sean detectados viene dada
por la funcin de densidad de una binomial B( N c , p) evaluada en n:

Nc n
p (1 p ) Nc n
n

p(n) =

(1.1)

El nmero de animales en la regin inspeccionada ahora no se conoce con seguridad y se puede


estimar por:

= n
N
c
p

(1.2)

Este es un estimador insesgado de la poblacin total N c y su varianza viene dada por:

1 p

Var (N c ) N c
p

(1.3)

En general N c no se conoce, luego un estimador insesgado de la varianza se puede expresar


como:

) n(1 p )
Va r (N
c
p2

(1.4)

Como n es una variable aleatoria, N


c tambin lo es. Si la regin fuese inspeccionada por
= N
, luego toda la incertidumbre procedera del modelo de
completo, entonces Nc = N y N
c
observacin. En este caso, si la regin de estudio tiene rea A, entonces el nmero de animales por
unidad de rea en dicha regin se denomina densidad de la poblacin y se define como:

N
A

(1.5)

siendo un estimador insesgado suyo y su varianza las siguientes:

79


N n ;
D
A
pA

Var (D )

N 1 p

A2 p

(1.6)

En general N no se suele conocer, por lo que un estimador de la varianza va a venir dado por:
) n 1 p
Va r (D
A 2 p 2

(1.7)

Por otro lado, si la regin inspeccionada fuese menor que la regin de estudio, entonces tambin
habra incertidumbre sobre qu fraccin de la poblacin estaba en la regin inspeccionada. Si
suponemos que en media una fraccin c de la poblacin est en la regin inspeccionada
podemos estimar N mediante:

=
N

n
N c
=
c p c

(1.8)

se puede descomponer en incertidumbre debida al modelo de observacin


La incertidumbre en N
(n es aleatoria) y al modelo de estado (la fraccin de la poblacin en la regin de estudio es
aleatoria).
Podra suceder que la probabilidad de deteccin no fuese la misma para todos los animales de la
poblacin ya que podra haber animales ms detectables que otros en funcin de ciertas
caractersticas de estos como son el tamao, sexo, localizacin, etc. Por otro lado, la probabilidad
de deteccin tambin podra depender de las caractersticas del estudio (destreza de los
observadores, nmero de observadores, etc.). La existencia de diferentes probabilidades de
deteccin en la poblacin indica la presencia de heterogeneidad y a la poblacin se le llama
heterognea. Si se ignora completamente la heterogeneidad cuando est presente, casi todos los
mtodos de estimacin de la abundancia animal dan estimaciones de esta insesgadas, aunque
algunos mtodos son mucho ms sensibles que otros.
Por tanto, un modelo general para el proceso de deteccin puede incluir variables relativas al animal
y relativas al estudio. Si denotamos a las variables relativas al animal por x y a las variables
relativas al estudio por l , entonces la probabilidad de deteccin es cualquier funcin de las dos:
p( x , l ) = Pr (detectar un animal del tipo x , usando un esfuerzo en el estudio l )

2. Modelos de estado y de observacin para mtodos complejos


2.1 Modelos de estado

80

La diferencia entre estos modelos y los usados en los mtodos de estimacin de la abundancia
animal ms simples es que introducen una dimensin temporal al modelo de estado. De esta forma
se puede conocer si las variables asociadas a la poblacin de estudio, es decir, a los animales,
pueden cambiar a lo largo del periodo de realizacin del estudio y si lo hacen, ver cmo se produce
ese cambio.
Supongamos pues que se quiere estimar la abundancia de una poblacin en donde la probabilidad
de captura depende slo de si un animal vive en el bosque o en la pradera. Sea xsi = 0 si el animal i
vive en la pradera en el momento del estudio s y xsi = 1 si el animal i vive en el bosque. Si los N
animales de la poblacin se comportaran idntica e independientemente, un modelo de estado
apropiado para el estudio s sera:
N

( x s 1 ,..., x sN ) 1 s

1 xsi

sxsi

i 1

donde

(2.1)

s es la probabilidad de estar en el bosque en el momento s.

Cuando un animal se mueve entre dos hbitats a medida que se van realizando estudios, se genera
una historia de localizaciones, que se denota por H . En general, cada vez que se realiza un estudio,
a parte de la localizacin, habr variables relativas a los animales relevantes que se van a ir
registrando en una historia. Se define por tanto H

si

como las i historias de un animal al inicio del

momento s:
H si = (x1i, , xsi)

(2.2)

Y se define la historia de la poblacin, denotada por H s, como la matriz cuyas filas son las historias
de los individuos de la poblacin, esto es:
H s = (H s1, , H sN) T
En funcin de los cambios que sufren las variables relativas a los animales de un estudio a otro se
tienen distintos tipos de modelos de estado. Estos se van a formular en trminos de un escalar x
para abreviar, pero se podran generalizar al caso en el que x es un vector (x).

Modelo de estado esttico


Los animales permanecen donde estn (bosque o pradera) a lo largo del estudio. Conceptualmente,
el modelo de estado determina la localizacin del animal una sola vez, al comienzo del estudio y a

81

partir de ese momento xsi est fijo (xsi = x1i = xi para todo s). El modelo de estado esttico para el
animal i se puede escribir como sigue:

( H si) = (x1i)

(2.3)

donde x1i es el primer elemento de H si.


Modelo de estado dinmico independiente
Los animales se mueven de un hbitat a otro a lo largo de los distintos estudios realizados, de tal
forma que la probabilidad de que un animal est en el bosque (o pradera) no est completamente
relacionado con donde estaba en estudios previos. Conceptualmente, de nuevo se aplica el mismo
modelo de estado para cada estudio (xsi es independiente de xs*i para s

s*). En este caso, el

modelo de estado para el animal i se puede escribir como:


s

( H si) =

( x
s* 1

s* i

)
(2.4)

Modelo de estado dinmico de Markov


Las localizaciones de los animales en cada estudio solo estn influenciadas por su localizacin en el
estudio ms reciente. Conceptualmente, el modelo de estado determina de nuevo la localizacin
para cada estudio, pero la probabilidad de que un animal est en el bosque o la pradera depende de
si estaba previamente en el bosque o en la pradera (xsi es aleatoria pero depende de x(s-1)i). La
funcin de densidad de xsi dado x(s-1)i se expresa como

(xsi| x(s-1)i), por lo que el modelo de estado

para el animal i se puede escribir como:


s

( H si) =
donde

( x1i x0 i ) ( x1i )

( x
s* 1

s* i

x( s* 1 )i )

(2.5)

es el modelo de estado al comienzo del primer estudio.

Population-level drift
Las localizaciones de los animales en cada estudio se determinan independientemente de sus
posiciones previas, pero hay drift en la distribucin de animales, es decir, la distribucin de la
poblacin cambia cuando el tiempo avanza. Conceptualmente, el modelo de estado determina de
nuevo la localizacin en cada estudio, pero la forma de este cambia cuando el tiempo avanza
(algunos de sus parmetros dependen del tiempo). Para ilustrar este modelo utilizando el escenario
bosque-pradera, se tiene:

82

1 ( t )
s

( H si) =

donde

t s*

1 x si

s*

s* 1

es el tiempo en el que se realiza el estudio s* y

Ntese que cuando t es suficientemente grande (t

( t s* ) xsi

( t )

(2.6)

1
1 e 0 t t

), los animales estn en el bosque o en la

pradera sin incertidumbre (dependiendo del signo de

t ).

2.3 Modelos de observacin


En general, la probabilidad de captura o deteccin puede depender de alguna, todas o ninguna de
las componentes de las variables relativas al animal, xs, as como de alguna, todas o ninguna de las
componentes de las variables relativas al estudio, ls. Tambin puede depender de la historia de
captura, ws= (w1, , w(s-1)) o del indicador de captura cs (el cual es uno si el animal ha sido capturado
antes y cero en otro caso) o de la identidad del animal individual si este es observable. La historia de
captura se define en trminos de los indicadores de captura en cada ocasin en la que se realiza el
estudio como sigue:
-

wsi es el indicador de captura del i-simo animal en el momento de captura s y toma los
valores uno si el animal i es capturado en el momento s y cero en otro caso.

wsi es la historia de captura del i-simo animal inmediatamente antes del momento de
captura s y se define como wsi = (w1i,, w(s-1)i).

La historia de captura de los animales que no han sido capturados al inicio del estudio s es un vector
de (s-1) ceros, denotado por 0s = (0,..., 0).
Para terminar decir que aunque existen muchas frmulas que definen la funcin de deteccin o
captura a menudo se utiliza la frmula logstica funcional:

p( x ,l )

0 x x l l

1 e

0 x x l l

3. Tcnica de remuestreo bootstrap


La metodologa bootstrap debe su nombre y su formulacin original a Bradley Efron (1979).
Constituye la lnea ms desarrollada, tanto desde el punto de vista terico como aplicado, de una
variedad de tcnicas para la inferencia estadstica denominadas genricamente mtodos de

83

remuestreo (Simon, 1969). El bootstrap emplea un gran nmero de clculos repetitivos en el


ordenador para estimar la forma de la distribucin muestral de un estadstico, en lugar de fuertes
hiptesis distribucionales y frmulas analticas. El requerimiento de una gran potencia computacional
ha llevado a que esta tcnica se denomine tambin tcnica de computacin intensiva.
La aplicacin del enfoque bootstrap proporciona una buena aproximacin de la distribucin de los
estimadores (Diaconis y Efron, 1983; Efron, 1981; Lunneborg, 1987) lo cual permitir describir
algunas de sus propiedades muestrales, as como el clculo de intervalos de confianza y la
realizacin de contrastes de hiptesis en aquellas situaciones en las que no se dispone de
informacin acerca de la distribucin muestral de un estadstico o en las que la distribucin es
dependiente de parmetros desconocidos. En estos casos, es mejor extraer conclusiones sobre las
caractersticas de la poblacin utilizando una muestra extrada a partir de ella, que hacer hiptesis
quizs poco realistas sobre la poblacin.
El bootstrap consiste en generar un nmero B de muestras aleatorias, con reemplazamiento, a partir
de una muestra original, teniendo las muestras simuladas el mismo tamao muestral que esta. Para
cada una de las muestras se estudia el estadstico de inters, de forma que a partir de ellos se
estima empricamente la distribucin muestral de este. Ntese que aunque cada muestra generada
tiene el mismo nmero de elementos que la muestra original, al utilizar un remuestreo con
reemplazamiento cada muestra podra tener algn dato de la muestra original representado en ella
ms de una ocasin, y alguno que no aparezca. Por lo tanto, cada una de las muestras
probablemente ser leve y aleatoriamente diferente de la muestra original, y como consecuencia, el
estadstico calculado a partir de una de ellas probablemente tomar un valor ligeramente diferente
de los estadsticos calculados a partir de las otras muestras y del calculado a partir de la muestra
original.
La afirmacin fundamental del bootstrapping es que una distribucin de frecuencias relativas de los
estadsticos calculados a partir de las B muestras es una estimacin de la distribucin muestral del
estadstico de inters (Money y Duval, 1993).
Ms formalmente, los pasos a seguir en la estimacin bootstrap son los siguientes (Efron, 1979;
Hinckley, 1988; Efron y Tibshirani, 1993):
1.

Construir una distribucin de probabilidad emprica, F ( x ) , a partir de la muestra original


extrada de la poblacin asignando una probabilidad de 1/n a cada valor x1, x2,, xn de la
muestra. Esta es la funcin de distribucin emprica de x.

2.

A partir de ella se extrae una muestra aleatoria simple de tamao n con reemplazamiento.
Esta es una remuestra, x b* .

3.

A partir de esa remuestra se calcula el estadstico de inters , dando lugar a b* .

84

4.

Se repiten los pasos 2 y 3 B veces, donde B es un nmero grande 2.

5.

Construir una distribucin de probabilidad a partir de los B estimadores calculados, b* ,


asignando una probabilidad de 1/B a cada valor 1* , 2* , , B* . Esta distribucin es la
estimacin bootstrap de la distribucin muestral de y se puede usar para hacer
inferencias sobre

El estimador bootstrap del parmetro

se define como:
B

*
b

b 1

Por ltimo, decir que en algunas ocasiones se tiene algn conocimiento ms que el estrictamente
aportado por la muestra, por ejemplo se conoce la funcin de distribucin de la variable objeto de
estudio pero se desconocen los parmetros, que deben ser estimados. En estos casos se
estimaran los parmetros a partir de la muestra y el remuestreo se realizara a partir de la funcin
terica conocida, con los parmetros estimados, en lugar de a partir de la funcin de distribucin
emprica construida a partir de la muestra. En este caso se habla de Bootstrap Paramtrico.

Aplicacin del bootstrap en poblaciones finitas


En poblaciones finitas el problema fundamental es cmo construir la poblacin artificial a partir de la
muestra. Existen distintos mtodos para construir esta poblacin finita, entre los que destacan los
mtodos que a continuacin vamos a estudiar bajo el diseo muestral ms simple: el muestreo
aleatorio simple.
Mtodo de Chao y Lo
Consideremos una muestra s de tamao n obtenida mediante muestreo aleatorio simple de una
poblacin U de tamao N= k n, siendo k un entero cualquiera.
La poblacin emprica U* se construye haciendo k rplicas de la muestra s. Es decir si en la
muestra s se observan los datos (xi1,...,x in), en la poblacin U* los valores de la variable objeto de
estudio sern:
( xi1,...,x in , xi1,...,x in , xi1,...,x in)

En la prctica la magnitud de B depende de las pruebas que se van a aplicar a los datos. En general, B debera estar entre 50
y 200 para estimar el error tpico de un estadstico de inters y debera ser al menos 1000 para estimar intervalos de confianza
para dicho estadstico.

85

es decir tenemos una poblacin con N valores de la cual se seleccionan mediante muestreo
aleatorio simple tantas muestras bootstrap s* como queramos. Evidentemente en cada una de estas
muestras bootstrap pueden aparecer valores repetidos, habiendo como mximo n valores distintos.
A partir de cada muestra bootstrap obtenida, se calcula el estimador del parmetro deseado y se
puede estimar la varianza de dicho parmetro como se ha explicado con anterioridad.
Mtodo de Bickel y Freedman
Este mtodo generaliza el mtodo anterior para el caso de que N/n no sea entero.
Supongamos que N=kn+l con 0<l<n. Se construyen dos poblaciones artificiales U1* y U 2* en la
que la primera est compuesta por k copias de s mientras que la segunda est compuesta por k+1
copias de s igual que en el mtodo anterior.
La seleccin de cada muestra bootstrap s* se realiza de la poblacin primera U1* , con probabilidad

y de la segunda poblacin U 2* , con probabilidad 1- . En la prctica el valor

utilizado es

l
l

1 1
. As pues se obtienen un conjunto de muestras bootstrap, todas del
n
N 1

mismo tamao, pero unas se han seleccionado de una poblacin de tamao kn y otras de una
poblacin de tamao (k+1)n.
Una vez obtenidas las muestras bootstrap, se evala el estimador en dichas muestras y se procede
a estimar su varianza.
Mtodo de Booth, Butler y Hall
Se construye una poblacin emprica, U*, de tamao N=kn+l, agrupando k copias de la muestra
primitiva s, con una muestra aleatoria simple de l unidades de s. De esta forma la poblacin U* est
formada por exactamente N unidades, a partir de ella se procede a extraer las muestras bootstrap y
se continua el proceso de estimacin como en los mtodos anteriores.
Otros mtodos de remuestreo bootstrap
En los ltimos aos han aparecido diversos mtodos de remuestreo, que suponen la poblacin finita
como realizacin de una superpoblacin con funcin de distribucin F. En este caso las poblaciones
bootstrap se obtienen a partir Fn de la misma forma que la poblacin U fue obtenida de F. Ejemplos
de estos mtodos son los de Presnell y Booth, Helmers y Wegkamp,... Un estudio ms amplio de
mtodos bootstrap en poblaciones finitas puede verse en Lombarda y et al. (2003).

86

4. Ancho de banda efectivo


La probabilidad de que un grupo est en una banda concreta, en el intervalo de distancias
perpendiculares (x, x + dx) y sea seleccionado, es:

a
( x )dx
A

p( x )

La probabilidad de detectar un grupo, dado que est en una banda a una distancia perpendicular
desconocida, es la probabilidad de deteccin media de animales dentro de la banda; esto es, es el
valor esperado de la funcin de deteccin en la banda con respecto al modelo de estado:
E p

p( x ) ( x )dx

En el caso de los estudios de transectos de lnea, ( x )

E p

donde

p( x )

1
, por lo que se tiene que:
w

1
1
dx

w
w

= wp( x )dx y p(x) es la probabilidad de que un grupo de animales, a una distancia x

de la lnea central de la banda (0 x

w), sea detectado.

87

Bibliografa

Agresti, A. 1994. Simple capture-recapture models permitting unequal catchability and variable
sampling effort. Biometrics, 50, 494-500.
Alho, J. M. 1990. Logistic regression in capture-recapture models. Biometrics, 46, 623-635.
Augustin, N. H., Borchers, D.L., Clarke, E.D., Buckland, S.T., y Walsh, M. 1998b. Spatiotemporal
modelling for the annual egg production method of stock assessment using generalized additive
models. Canadian Journal of Fisheries and Aquatic Sciences, 55, 2608-2621.
Borchers, D.L., Buckand, S.T. y Zucchini, W. 2002. Estimating Animal Abundance: Closed
populations.
Buckland, S.T., Anderson, D.R., Burnham, K.P., Laake, J.L., Borchers, D.L., y Thomas, L.J. 2001.
Introduction to distance sampling. Oxford: Oxford University Press.
Burnham, K. P. 1972. Estimation of population size in multinomial capture-recapture studies when
capture probabilities vary among animals. PhD Thesis, Oregon State University, Oregon.
Cassel, C.-M., Srndal, C.-E., Wretman, J.H. (1993b). Foundations of Inference in Survey Sampling.
Wiley, New York.
Chao, C.-T., Thompson, S.K. (2001). Optimal adaptive selection of sampling sites. Environmetrics
12, 517538.
Chapman, D.G., 1951. Some properties of the hypergeometric distribution with applications to
zoological censuses. University of California Publications in Statistics, 1, 131-160.
Chapman, D.G., y Junge, C.O. 1956. The estimation of the size of a stratified animal population.
Annals of Mathematical Statistics, 27, 375-389.
Christman, M.C. (1997). Efficiency of adaptive sampling designs for spatially clustered populations.
Environmetrics 8, 145166.
Cochran,W.G. (1977). Sampling Techniques, 3rd ed. JohnWiley & Sons, New York.
Cormack, R.M. 1989. Log-linear models for capture-recapture. Biometrics, 45, 395-413.
Cuesta, M. y Herrero, F.J. Introduccin al bootstrap: Inferencia estadstica mediante bootstrap,
Intervalos
confidenciales.
Dpto.Psicologa
Universidad
de
Oviedo.
http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.9/boot1.html
David A. Marker and Don L. Stevens Jr., 2009. Sampling and Inference in Environmental Surveys.
Sample Surveys: Design, Methods and Applications, Vol. 29A, 487-512.
Diaconis, P., y Efron, B. (1983). Computer intensive methods in statistics. Scientific American,
248(5), 116-13.
Diggle, P.J. 1983. Statistical analysis of spatial point patterns. London: Academic Press.
Duncan, G.J., Kalton, G. (1987). Issues of design and analysis of surveys across time. International
Statistical Review 55, 97117.
Efron, B. (1979). Bootstrap methods. Annals of statistics, 7, 1-26.
Efron, B. (1981). Nonparametric estimates of standard error: the jacknife, the bootstrap, and other
resampling methods. Biometrika, 68, 589-599.

88

Efron, B., y Tibshirani, R.J. 1993. An introduction to the bootstrap. New York: Chapman & Hall.
El Khorazaty, M.N., Imrey, P.B., Koch, G.O., y Wells, H.B. 1977. A review of methodological
stratiegies for estimating the total number of events with data from multiple-record systems.
International Statistical Review, 45, 129-157.
Evans, M.A., Bonnet, D.G., y McDonald, L.L. 1994. A general theory for modeling capture-recapture
data from a closed population. Biometrics, 50, 396-405.
Feinberg, S.E. 1972. The multiple-recapture census for closed populations and incomplete 2 k
contingency tables. Biometrika, 59, 591-603.
Gunderson, D.R. 1993. Surveys of fisheries resources. New York: Wiley.
Grtler, Ricardo, 2002. Estimacin de la abundancia: Introduccin al muestreo de poblaciones.
Trabajo prctico 3. http://biolo.bg.fcen.uba.ar/ecologia/TP3.pdf
Hanselman, D.H., Quinn, T.J., Lunsford, C., Heifetz, J., Clausen, D. (2003). Applications in adaptive
cluster sampling of Gulf of Alaska rockfish. Fishery Bulletin 101, 501513.
Hastie, T.J., y Tibshirani, R.J. 1990. Generalized additive models. London: Chapman & Hall.
Hinckley, D.W. (1988). Bootstrap Methods. Journal of the Royal Statistical Society, Series B, 50, 321337.
Huggins, R.M. 1989. On the statistical analysis of capture experiments. Biometrika, 76, 133-140.
Huggins, R.M., and Yip, P.S.F. 1997. Statistical analysis of removal experiments with the use of
auxiliary variables. Statistica Sinica, 7, 705-712.
Hunter, J.R., y Lo, N.C.H. 1993. Ichthyoplankton methods for estimating fish biomass: introduction
and terminology. Bulletin of Marine Science, 53, 723-727.
Kimura, D.K., Somerton, D.A. (2006). Review of statistical aspects of survey sampling for marine
fisheries. Reviews in Fisheries Science 14, 245283.
Kish, L. (1987). Statistical Design for Research. JohnWiley & Sons, New York.
Kott, P.S. (1986). Some asymptotic results for the systematic and stratified sampling of a finite
population. Biometrika 73, 485491.
Landers, D.H., Eilers, J.M., Brakke, D.F., Overton, W.S., Kellar, P.E., Silverstein, M.E., Schonbrod,
R.D., Crowe, R.E., Linthurst, R.A., Omernik, J.M., Teague, S.A., Meier, E.P. (1987). Characteristics of
lakes in the Western United States. Volume I: Population Descriptions and Physico-Chemical
Relationships. EPA-600/3-86/054a. US Environmental Protection Agency, Washington, DC.
Larsen, D.P., Thornton, K.W., Urquhart, N.S., Paulsen, S.G. (1994). The role of sample surveys for
monitoring the condition of the Nations lakes. Environmental Monitoring and Assessment 32, 101
134.
Linthurst, R.A., Landers, D.H., Eilers, J.M., Brakke, D.F., Overton, W.S., Meier, E.P., Crowe, R.E.
(1986).
Lohr, S. (1999). Sampling: Design and Analysis. Duxbury Press, Brooks/Cole Publishing, Pacific
Grove, CA.
Lpez Juregui, A. y Elosua Oliden, P. 2004. Estimaciones bootstrap para el coeficiente de
determinacin: un estudio de simulacin. Revista Electrnica de Metodologa Aplicada 2004, Vol. 9
n 2, pp. 1-14. http://www.psico.uniovi.es/REMA/v9n2/a1/n9v2a1_1.htm

89

Lunneborg, C. E. (1987). Bootstrap applications for the behavioral sciences. Educational and
Psychological Measurement, 47, 627-629.
Mark, D.M. (1990). Neighbor-based properties of some orderings of two-dimensional space.
Geographical Analysis 2, 145157.
Mooney, C.Z. y Duval, R.D. (1993). Bootstrapping: A Nonparametric Approach to Statistical
Inference. Newbury Park, CA: Sage.
Norris, J.L., y Pollock, K.H. 1995. A capture-recapture model with heterogeneity and behavioural
response. Envioronmental and Ecological Statistics, 2, 305-313.
Norris, J.L., y Pollock, K.H. 1996. Nonparametric MLE under two closed capture-recapture models
with heterogeneity. Biometrics, 52, 639-649.
Otis, D.L., Burnham, K.P., White, G.C., y Anderson, D.R. 1978. Statistical inference from capture
data on closed animal populations. Wildlife Monographs, 62, 1-135.
Overton,W.S., Stehman, S.V. (1993). Properties of designs for sampling continuous spatial resources
from a triangular grid. Communications in Statistics, Part A Theory and Methods 22, 26412660.
Paulsen, S.G., Hughes, R.M., Larsen, D.P. (1998). Critical elements in describing and understanding
our nations aquatic resources. Journal of The American Water Resources Association 34, 9951005.
Peano, G. (1890). Sur Une Courbe, Qui Remplit Toute Une Aire Plane. Mathematische Annalen 36,
157160.
Peterson, S.A., Urquhart, N.S., Welch, E.B. (1999). Sample representativeness: a must for reliable
regional lake condition estimates. Environmental Science and Technology 33(10), 15591565.
Pledger, S. 2000. Unified maximum likelihood estimates for closed capture-recapture models using
mixtures. Biometrics, 56, 434-442.
Pollock, K.H. 1974. The assumption of equal catchability of animals in tag-recapture experiments.
PhD Thesis, Cornell University, New York.
Reilly, S.B., Rice, D.W. y Wolman, A.A. 1980. Preliminary population estimate for the California gray
whale based upon Monterey shore censuses. Report of the International Whaling Commission, 30,
359-368.
Reilly, S.B., Rice, D.W. y Wolman, A.A. 1983. Population assessment of the gray whale, Eschrichtius
robustus, from California shore censuses, 1967-80. Fishery Bulletin, 81, 267-281.
Royall, R.M., Herson, J. (1973). Robust estimation infinite populations I. Journal of the American
Statistical Association 68, 880889.
Sanathanan, L. 1972. Estimating the size of a multinomial population. Annals of Mathematical
Statistics, 43, 142-152.
Srndal, C.-E., Swensson, B., Wretman, J. (1992). Model Assisted Survey Sampling. SpringerVerlag, New York.
Schwarz, D.J., y Seber, G.A.F. 1999. Estimating animal abundance: Review III. Statistical Science,
14, 427-456.
Seber, G.A.F. 1970. The effects of trap response on tag-recapture estimates. Biometrika, 26 (57), 1322.
Seber, G.A.F. 1982. The estimation of animal abundance and related parameters. 2nd edn. London:
Charles Griffin.

90

Simon, J. L. (Ed.). (1969). Basic Research Methods in Social Science. (Vol. acceso en Marzo 2003).
New York: Random House.
Stevens, D.L. Jr. (1994). Implementation of a national environmental monitoring program. Journal of
Environmental Management 42, 129.
Stevens, D.L. Jr., Olsen, A.R. (1999). Spatially restricted surveys over time for aquatic resources.
Journal of Agricultural, Biological, and Environmental Statistics 4, 415428.
Stevens, D.L. Jr., Olsen,A.R. (2004). Spatially balanced sampling of natural resources. Journal of the
American Statistical Association 99, 262278.
Thompson, S.K. (1990). Adaptive cluster sampling. Journal of American Statistical Association 85,
10501059.
Thompson, S.K. (1991b). Stratified adaptive cluster sampling. Biometrika 78, 389397.
Thompson, S.K. 1992. Sampling. New York: Wiley.
Thompson, S.K. (2002). Sampling, 2nd ed. JohnWiley & Sons, New York.
Thompson, S.K. (2006). Adaptive web sampling. Biometrics 62, 12241234.
Wittes, J.T. 1972. On the bias and estimated variance of Chapmans two-sample capture-recapture
population estimate. Biometrics, 28, 592-597.
Wolter, K.M., Harter, R.M. (1990). Sample maintenance based on Peano keys. Proceedings of the
1989 International Symposium: Analysis of Data in Time. Statistics Canada, Ottawa, ON, Canada,
2131.
Yates, F. (1946). A review of recent statistical developments in sampling and sample surveys.
Journal of the Royal Statistical Society 109(1), 1243.
Yates, F. (1981). Sampling Methods for Censuses and Surveys, 4th ed. Griffin, London.

91

También podría gustarte