Está en la página 1de 12

CAPTULO 7

UN NUEVO MTODO ESTADSTICO PARA


LA EVALUACIN DE LA SIMILITUD EN LA
COMPOSICIN DE ESPECIES CON DATOS
DE INCIDENCIA Y ABUNDANCIA*

Anne Chao, Robin L. Chazdon,


Robert K. Colwell & Tsung-Jen Shen

* Traduccin del artculo publicado en: Ecology Letters (2004), 8: 148-159.

Resumen: Los ndices clsicos Jaccard y Srensen de similitud en la composicin de


CAPTULO 7: especies (y otros ndices que dependen de las mismas variables) son notoriamente
sensibles al tamao de la muestra, especialmente aquellos ensamblajes con numero-
Un nuevo mtodo estadstico para sas especies raras. Adems, dado que estos ndices se basan exclusivamente en
la evaluacin de la similitud en la datos presencia-ausencia, no hay estimadores precisos para ellos. Ofrecemos una
composicin de especies con datos derivacin probabilstica para las formas clsicas basadas en incidencia de estos
de incidencia y abundancia ndices y extendemos este mtodo para formular nuevos ndices tipo Jaccard o Sren-
1
sen basados en datos de la abundancia de especies. Luego proponemos estimadores
Anne Chao , para estos ndices, los cuales incluyen el efecto de las especies compartidas no vistas
Robin L. Chazdon ,
2* y que se basan en datos de muestreos de incidencia o de abundancia (replicados). En
2
las simulaciones de muestreo, estos nuevos estimadores demuestran ser menos
Robert K. Colwell sesgados que los ndices clsicos cuando falta una proporcin sustancial de especies
Tsung-Jen Shen
1 en las muestras. Utilizando conjuntos de datos empricos y ricos en especies, demos-
tramos como la incorporacin del efecto de especies compartidas pero no vistas no
1
. Institute of Statistics, solamente incrementa la exactitud, sino tambin puede afectar la interpretacin de los
National Tsing Hua University, resultados.
Hsin-Chu, Taiwan
2
Palabras Clave: datos de abundancia, diversidad beta, biodiversidad, complementa-
. Department of Ecology and riedad, datos de incidencia, especies compartidas, estimadores de similitud, ndice de
Evolutionary Biology, similitud, solapamiento de especies, sucesin.
University of Connecticut,
Storrs, CT, USA A new statistical approach for assessing similarity of species composition with
* chazdon@uconn.edu incidence and abundance data
Abstract: The classical Jaccard and Srensen indices composotopnal similarity (and
others indices that depend upon the same variables) are anotoriously sensitive to
Sobre Diversidad Biolgica: sample size, especially for assemblages with numerous rare species. Furthers, becau-
El significado de las Diversidades se these indices are based solely on presence-absence data, accurate estimators for
Alfa, Beta y Gamma. them are unattainable. We provide a probabilistic derivation for the classic, incidende-
Editores: based forms of these indices and extend this approach to formulate new Jaccerd-type
Gonzalo Halffter, Jorge Sobern, of Srensen-type indices based on species abundance data. We then propose estima-
Patricia Koleff & Antonio Melic tors for these indices thatinclude the effect of unseen shared species, based on either
(replicated) indicende- or abundance- based sample data. In sampling simulations,
Patrocinadores: these new estimator prove to be considerably less biased than classic indices when a
COMISION NACIONAL PARA EL substantial proportion od species are missing from samples. Based on species-rich
CONOCIMIENTO Y USO DE LA empirical datasets, we show how incorporating the effect of unseen shared species not
BIODIVERSIDAD (CONABIO) MXICO only increases accuracy but also can change the interpretation of results.
SOCIEDAD ENTOMOLGICA ARAGONESA Key words: Abundance data, beta diversity, biodiversity, complementarity, indicence
(SEA), ZARAGOZA, ESPAA. data, shared species, similarity stimators, similarity index, species overlap, succession.
GRUPO DIVERSITAS-MXICO
CONSEJO NACIONAL DE CIENCIA Y
TECNOLOGA (CONACYT) MXICO

ISBN: 8493280771 Introduccin


Dep. Legal: Z227505
m3m: Monografas Tercer Milenio Los eclogos quienes llevan a cabo el registro de la riqueza de especies,
vol.4, S.E.A., Zaragoza, Espaa
30 Noviembre 2005
desde hace mucho se han dado cuenta de que es casi imposible detectar a
pp: 85 96. todas las especies y determinar sus abundancias relativas con un nmero
limitado de muestras o una intensidad limitada de muestreo. Limitaciones de
muestreo crean retos para estimar con precisin la diversidad alfa, el nmero
Informacin sobre la publicacin:
de especies dentro de ensamblajes locales y aproximadamente homogneos,
www.sea-entomologia.org/m3m
particularmente para los ensamblajes con una riqueza especfica alta y una
fraccin grande de especies raras (Colwell y Coddington, 1994; Chazdon et
al., 1998; Colwell et al., 2004; Magurran, 2004). Para enfrentar este reto, se
han desarrollado varios mtodos para estimar la riqueza de especies a partir
86 A. Chao et al.

de los datos de muestreo, o por la extrapolacin de las ciosa de especies raras (Wolda, 1981; Colwell y Cod-
curvas de acumulacin de especies o con la aplicacin dington, 1994; Plotkin y Muller-Landau, 2002), dado
de mtodos no paramtricos (vanse reseas por Bunge que se asume que los datos de muestreo (usualmente
y Fitzpatrick, 1993; Colwell y Coddington, 1994; Ma- errneamente) son representaciones verdaderas y com-
gurran, 2004; Chao, en prensa). Este ltimo enfoque pletas de la composicin del ensamblaje. [En efecto,
involucra la estimacin de las especies no vistas (las con pocas excepciones (p. ejem. Grassle y Smith, 1976;
especies que probablemente estn presentes en una MacKenzie et al., 2004), casi todos los mtodos actua-
muestra homognea y ms grande del ensamblaje, pero les para medir la similitud parten de este supuesto.] En
que no se encuentran en los datos de la muestra actual). general, como demostraremos con simulaciones, es
Dado que los estimados de las especies no vistas se probable que estas medidas subestimen severamente la
basan en el nmero de especies raras observadas dentro verdadera similitud entre dos ensamblajes (genuinamen-
de las muestras (Colwell y Coddington, 1994; Chazdon te similares) que contienen numerosas especies raras.
et al., 1998), para estimar la riqueza se requiere de datos Dado que muchas especies quedan fuera de la muestra,
de la abundancia o de muestras de la incidencia replica- es probable que las especies raras que aparecen en una
das. En los estimadores de la riqueza ms sencillos (p. muestra sean diferentes a las que aparecen en la otra
ejem. Chao1, Chao2 o los estimadores jack-knife), las muestra, aun cuando todas estn realmente presentes en
especies raras se clasifican como especies con una ambos ensamblajes. Problemas similares surgen al
abundancia total de 1 (singletons) o 2 (doubletons) en comparar dos muestras de tamaos notablemente dife-
una muestra basada en la abundancia, y se encuentran rentes: sencillamente porque la muestra ms pequea
en solamente una unidad de muestreo (nicos = uni- tiene un nmero menor de individuos o de unidades de
ques) o en exactamente dos unidades de muestreo (du- muestreo, puede que no tenga especies que aparecen en
plicados = duplicates) en los datos de incidencia con la muestra ms grande. En breve, la subestimacin de la
muestreo replicado. El estimador de cobertura basada en similitud ocurre por no tomar en cuenta las especies
abundancias (abundance-based coverage estimator: compartidas pero no vistas.
ACE) utiliza informacin adicional basada en aquellas En principio, la sobre-estimacin de la similitud
especies con diez o menos individuos en la muestra tambin puede ocurrir al comparar comunidades sub-
(Chao et al., 1993) y el correspondiente estimador basa- muestreadas de dominancia alta en las cuales las espe-
do en incidencia (incidence-based coverage estimator: cies comunes estn ampliamente distribuidas y en donde
ICE) se basa en las especies que ocurren en diez o me- las especies raras tienden a ser endmicas localmente.
nos unidades de muestreo (Lee y Chao, 1994; Chazdon En este caso, dos muestras pueden dar las mismas pocas
et al., 1998; Magurran, 2004). especies comunes, pero no revelan las especies raras
Las mismas limitaciones que se aplican a la esti- que diferenciaran los ensamblajes de contar con mues-
macin de la diversidad alfa de los ensamblajes de es- tras ms grandes (Colwell y Coddington, 1994; Ruoko-
pecies, se aplican de igual manera a la estimacin de la lainen y Tuomisto, 2002 discuten un posible ejemplo).
diversidad beta o la disimilitud (complementariedad, Sin embargo, en casi todos los casos que hemos exami-
recambio o distancia) entre dos ensamblajes. El ndice nado cuantitativamente, la rareza (o por naturaleza o por
Jaccard de similitud y el muy relacionado ndice Sren- tratarse de un tamao de muestra pequeo) incrementa
sen son los dos ms viejos y ampliamente utilizados la posibilidad de que una especie est errneamente
para la valoracin de la similitud en la composicin de ausente de una muestra pero no de otra, introduciendo
los ensamblajes (a veces llamado solapamiento de equivocadamente as un sesgo negativo a los ndices de
especies) y, por lo tanto, su complemento, la falta de similitud. [Fisher (1999, Fig. 8) llega a la misma con-
similitud. Ambos se basan en la presencia/ausencia de clusin para varios conjuntos de datos, basado en prue-
especies en ensamblajes pareados, y son clculos senci- bas de rarefaccin.] Adems, para los nuevos ndices
llos (Magurran, 2004). Existen muchos otros ndices de que presentamos aqu, se puede demostrar tericamente
la similitud que se basan en la misma informacin: el que el sesgo de muestreo, cuando presente, siempre es
nmero de especies compartidas por dos muestras y el negativo. [Los autores demuestran el sesgo negativo
nmero de especies nicas en cada muestra (Legendre y esperado matemticamente (A. Chao, R. L. Chazdon, R.
Legendre, 1998), y nuevos ndices siguen apareciendo K. Colwell y T.-J. Shen, datos no publicados); se puede
(p. ejem. Lennon et al., 2001). Una versin modificada probar para cualquiera de los modelos de abundancia
del ndice Srensen fue desarrollada por Bray y Curtis dados en Magurran (2004) y en Plotkin y Muller-
(1957), con base en datos de abundancia (tambin co- Landau (2002).]
nocido como el ndice Srensen de la abundancia; Ma- Recientemente, se ha intensificado el inters en el
gurran, 2004), y un gran nmero de otros ndices basa- desarrollo y evaluacin de los ndices para medir la
dos en abundancias se han desarrollado (Legendre y diversidad beta, o la tasa de recambio, de ensamblajes
Legendre, 1998), incluyendo el ampliamente aplicado de especies (Duivenvoorden, 1995; Lennon et al., 2001;
ndice MorisitaHorn (Magurran, 2004). Arita y Rodrguez, 2002, 2004; Condit et al., 2002;
A pesar de su amplia aplicacin en los estudios Plotkin y Muller-Landau, 2002; Koleff et al., 2003;
ecolgicos, los ndices clsicos de Jaccard y Srensen, Rodrguez y Arita, 2004), subrayando la necesidad de
cuando calculados con datos de muestreo, tienen un estimadores estadsticos robustos para poder inferir la
desempeo pobre como medidas de la similitud entre similitud de la composicin a partir de los datos de
ensamblajes diversos que incluyen una fraccin sustan- muestreo. El aumento en el recambio de especies (simi-
Un nuevo mtodo estadstico para la evaluacin de la similitud 87
litud decreciente) conforme se incrementa la distancia abundancias, usando datos de un estudio sucesional de
entre sitios puede reflejar patrones espaciales de disper- las abundancias de rboles, plntulas y briznales para
sin o podran resultar del aumento en la heterogenei- especies del dosel. Con base en conjuntos de datos para
dad ambiental a escalas mayores (Harte et al., 1999; ensamblajes ricos de insectos y plantas tropicales, de-
Hubbell, 2001; Balvanera et al., 2002; Chave y Leigh, mostramos como la incorporacin del efecto de especies
2002; Condit et al., 2002; Duivenvoorden et al., 2002; compartidas no vistas no solamente incrementa la exac-
Ruokolainen y Tuomisto, 2002; Rodrguez y Arita, titud, pero tambin puede cambiar la interpretacin de
2004; Valencia et al., 2004). Desafortunadamente, la los resultados.
mayora de los ndices de diversidad beta dependen de
la misma informacin que los ndices clsicos de Jac-
El desarrollo de los nuevos ndices
card y Srensen, y comparten las limitaciones arriba
y estimadores
mencionadas.
Con este problema en mente, Plotkin y Muller-
Los ndices clsicos de Srensen y Jaccard
Landau (2002) desarrollaron un ndice de similitud tipo
Srensen para conteos de abundancia utilizando un Los ndices clsicos de Srensen y Jaccard dependen de
enfoque paramtrico que depende de la distribucin tres sencillos conteos de incidencia: el nmero de espe-
gama para caracterizar la estructura de las abundancias cies compartidas por dos ensamblajes y el nmero de
de las especies. Condit et al. (2002) adoptan un mtodo especies nicas en cada ensamblaje. Se ha vuelto tradi-
para medir la diversidad beta usando el ndice de co- cin referirse a estos conteos como A, B y C, respecti-
dominancia F (codominance index F) de Leigh et al. vamente (Tabla I). Los ndices clsicos Jaccard y
(1993); la probabilidad de que dos individuos seleccio- Srensen para los conteos de incidencia entonces son
nados al azar, cada uno de un diferente ensamblaje sean
la misma especie. Aunque esta medida est basada en A
J clas = (1) y
los datos de la abundancia, F, en si, no es un ndice de A+ B +C
similitud estadsticamente vlido. Para dos ensamblajes
idnticos con muchas especies, F tiende a 0. Adems, es 2A
Lclas = (2)
posible para cualquier par de ensamblajes tener un valor 2A + B + C
de F de 0 a 1, dependiendo de cuntas especies estn
presentes y de los patrones de la abundancia relativa. (Usamos L para el ndice de Srensen para evitar la
Sin embargo, es posible normalizar F para producir un confusin con la S para especies.) Hay una relacin
ndice de similitud vlido. Chave y Leigh (2002) cercana monotnica entre los dos ndices: Lclas =
sealan que el ndice MorisitaHorn es una versin 2Jclas/(Jclas + 1) y Jclas = 1/(2/Lclas - 1).
normalizada de F. Asuma que hay S1 especies en el Ensamblaje 1 y
Empezamos por desarrollar un nuevo mtodo S2 especies en el Ensamblaje 2. Que el nmero de espe-
probabilstico para los ndices clsicos Jaccard y Sren- cies compartidas sea S12. Entonces, los conteos de inci-
sen basados en la incidencia. Posteriormente, extende- dencia A, B, C en la Tabla I corresponden a: A = S12, B
mos este enfoque para formular ndices tipo Jaccard y = S1 S12, y C = S2 S12. Sustituyendo estas expresio-
tipo Srensen que consideran las abundancias de las nes en las ecuaciones 1 y 2 tenemos una manera alterna-
especies. A cambio de Plotkin y Muller-Landau (2002), tiva de escribir los ndices clsicos que sern requeridos
adoptamos una estrategia no paramtrica que no requie- para los prximos pasos en el desarrollo de los nuevos
re de ningn supuesto en cuanto a las distribuciones de ndices:
la abundancia de las especies. Luego, proponemos un
mtodo para estimar tanto los ndices Jaccard y Sren- A S12
sen basados en incidencia y abundancia a partir de datos J clas = = (3) y
de muestreo, incorporando el efecto de las especies
A + B + C S1 + S 2 S12
compartidas no vistas.
Despus, llevamos a cabo simulaciones de mues- 2A 2 S12
Lclas = = (4)
treo con conjuntos de datos empricos con el fin de 2 A + B + C S1 + S 2
evaluar el desempeo de los ndices clsicos de Jaccard
y Srensen; sus nuevas contrapartes Jaccard y Srensen
basadas en abundancias; y los correspondientes estima-
dores Jaccard y Srensen. Demostramos que la incorpo-
Tabla I. Conteos de clasificacin de especies
racin del efecto de las especies no vistas disminuye utilizados en los ndices clsicos
sustancialmente el sesgo de tamao de muestra de estos
estimadores y mejora su utilidad para inferir la similitud Ensamblaje 2
(o su complemento, la disimilitud) entre ensamblajes Presente Ausente
hiper-diversos en los cuales una porcin grande de sus Ensamblaje 1
especies no se registra en las muestras. Finalmente, Presente A B
ilustramos una aplicacin del nuevo ndice Jaccard Ausente C -
basada en abundancias y el estimador Jaccard basada en
88 A. Chao et al.

Fig. 1.Una representacin grfica del signifi-


cado de especies compartidas para dos ensam-
blajes. El Ensamblaje 1 (a1) es gris, el Ensam-
blaje 2 (a2) es blanco. El punto gris representa
una especie seleccionada al azar del Ensambla-
je 1 y el punto blanco representa una especie
seleccionada al azar del Ensamblaje 2. El Caso
1 es el nico caso en el que ambas especies
estn compartidas (pero no necesariamente la
misma especie). En el Caso 2, la especie selec-
cionada al azar del Ensamblaje 1 es una espe-
cie compartida, pero la especie seleccionada
del Ensamblaje 2 no est compartida con el
Ensamblaje 1. El opuesto ocurre en el Caso 3.
En el Caso 4, ninguna de las especies seleccio-
nadas est compartida. Estos patrones se des-
criben matemticamente en la Tabla II.

Un enfoque probabilstico de los ndices clsicos de Jaccard y Srensen


Los ndices clsicos de Jaccard y Srensen solamente Primero, tenemos que proveer una derivacin
consideran la presencia o ausencia (incidencia) de espe- probabilstica de los ndices clsicos de incidencia Jac-
cies. Dos pares de ensamblajes, uno compartiendo las card y Srensen. Suponga que seleccionamos al azar
especies abundantes pero no las raras y el otro compar- una especie del Ensamblaje 1 y una especie del Ensam-
tiendo las especies raras pero no las comunes, darn el blaje 2 y luego clasificamos a cada miembro de este par
mismo valor para el ndice. Desde el punto de vista de de acuerdo con si se trata de una especie compartida o
la similitud global de los ensamblajes, llevar la similitud no. Las probabilidades correspondientes se muestran
de la composicin del ensamblaje al nivel del individuo grficamente en la Fig. 1 y se especifican en la Tabla II.
suele ser sensato (Magurran, 2004). Nuestro prximo Aunque las probabilidades en la Tabla II no son
objetivo es extender los ndices de incidencia para que conteos, pueden ser considerados como conteos norma-
tomen en cuenta la abundancia relativa de las especies, lizados dado que suman la unidad (1). Sustituyendo
un prerrequisito para el desarrollo de estimadores del estas probabilidades en las ecuaciones 1 y 2, entonces
ndice para datos de muestreo que toman en cuenta las tenemos:
especies raras no vistas.

J clas =
A
=
[(S12 / S1 )(S12 / S 2 )] =
S12
A + B + C [(S12 / S1 )(S12 / S 2 )] + [(S12 / S1 )(1 (S12 / S 2 ))] + [(1 (S12 / S1 ))(S12 / S 2 )] S1 + S 2 S12

que es exactamente la ecuacin 3. Asimismo, tenemos

2A 2[(S12 / S1 )(S12 / S 2 )] 2S12


Lclas = = =
2 A + B + C 2[(S12 / S1 )(S12 / S 2 )] + [(S12 / S1 )(1 (S12 / S 2 ))] + [(1 (S12 / S1 ))(S12 / S 2 )] S1 + S 2

que es la misma que la ecuacin 4.

Tabla II. Derivacin probabilstica de conteos de especies para los ndices clsicos

Seleccione cualquier especie del Ensamblaje 2


Compartida No compartida
Seleccione cualquier especie del Ensamblaje 1
S12 S12 S12 S12
Compartida A= (Caso 1) B= 1 (Caso 2)
S1 S2 S1 S 2
S S S S
No compartida C = 1 12 12 (Caso 3) D = 1 12 1 12 (Caso 4)
S1 S 2 S1 S2
Un nuevo mtodo estadstico para la evaluacin de la similitud 89

Puede parecer que no hemos avanzado, pero este Tabla III Probabilidades para conteos de especies
mtodo probabilstico establece la base para desarrollar basados en individuos
ndices basados en abundancias, que a su vez permiten Seleccione cualquier
la estimacin de ndices que toman en cuenta el efecto individuo del Ensamblaje 2
Compartido No compartido
de las especies compartidas no vistas. Ntese que, utili- Seleccione cualquier
zando este mtodo, tambin podemos calcular la proba- individuo del Ensamblaje 1
bilidad de que ambas especies seleccionadas al azar Compartido A = UV B = U(1 - V)
sean especies no compartidas (Caso 4, presentado en la No compartido C = (1 - U)V D = (1 - U)(1 - V)
Fig. 1 y la Tabla II). Sin embargo, el concepto funda-
mental para los ndices Jaccard y Srensen se basa so- ensamblajes idnticos y tienden hacia 0 para ensambla-
lamente en informacin para las otras tres celdas (Casos jes disimilares. En este ltimo caso, por ejemplo Labd =
1-3). 2/[(1/U) + (1/V)] tiende hacia 0 conforme tanto U como
V se acercan a 0.
Extendiendo el enfoque probabilstico a
los ndices basados en abundancias Estimacin de los ndices basados en abundancia
Dejemos que las probabilidades de que las especies a partir de datos de muestreo
sean descubiertas (mismas que dependen principalmente Hasta ahora, solamente hemos considerado las especies
de la abundancia relativa, asumiendo una mezcla aleato- y los individuos observados en dos ensamblajes. Tanto
ria y detectabilidad equiparable) en los Ensamblajes 1 y las versiones clsicas de Jaccard y Srensen como la
2 sean denotadas por (p1, p2, ..., pS1) y (1, 2, ..., S2), nueva versin basada en abundancias, asumen total y
respectivamente, donde pi > 0, i > 0 y completo conocimiento de los dos ensamblajes que
S1 S2
estamos comparando. En la prctica, necesitamos esti-
pi = i = 1 .
i =1 i =1
mar los ndices de similitud usando datos de muestreo,
Ya no tratamos a todas las especies de manera igual una tarea que realizamos ahora. Nuestro enfoque es no
dado que algunas son comunes y otras son raras. En paramtrico en el sentido de que no necesitamos postu-
cambio, la idea bsica para manejar los conteos de la lar ninguna distribucin de abundancia de especies en
abundancia es que tratemos a todos los individuos idn- particular para derivar los estimadores, mismos que por
ticamente. Adaptando el mtodo de la seccin anterior, lo tanto son vlidos bajo muchos modelos estadsticos
seleccionamos al azar un individuo del Ensamblaje 1 y de la abundancia (p. ejem. log-normal, vara rota, gam-
un individuo del Ensamblaje 2. Para cada individuo del ma, etc.). La derivacin s asume que el nmero de
par, notamos si pertenece a una especie compartida o especies es finito por lo que las probabilidades de des-
no. cubrimiento de especies tienen un lmite. [Los autores
Derivamos ahora las frmulas generales para las demuestran que los estimadores son vlidos bajo mu-
versiones basadas en abundancias de los ndices Jaccard chos de los modelos estadsticos de la abundancia (A.
y Srensen. Sin perder la generalidad, asumimos que las Chao, R. L. Chazdon, R. K. Colwell y T.-J. Shen, datos
primeras S12 especies son especies compartidas, es decir no publicados) (p. ejem. log-normal, exponencial,
las especies compartidas estn indexadas por 1,2,...,S12. gamma, binomial negativo, Zipf-Mandelbrot, modelos
En el Ensamblaje 1, dejemos que U denote la suma de de vara rota, etc.) que aparecen en Magurran (2004,
las abundancias relativas de individuos que pertenecen a Tabla 2.1) o en Plotkin y Muller-Landau (2002, Tabla
las especies compartidas, U = p1 + p2 + ... + pS12. Asi- 1]
mismo, en el Ensamblaje 2, dejemos que V denote la Una muestra aleatoria de n individuos (Muestra 1)
suma de las abundancias relativas de individuos que se toma del Ensamblaje 1 y una muestra aleatoria de m
pertenecen a las especies compartidas, V = 1 + 2 + ... individuos (Muestra 2) se toma del Ensamblaje 2. De-
+ S12. La Tabla III muestra las probabilidades de que note las frecuencias de las especies en las muestras por
dos individuos, uno de cada ensamblaje, representen (X1, X2, ..., XS1) y (Y1, Y2, ..., YS2), respectivamente.
cada una de las cuatro categoras usuales. (Ntese que si una especie falta en una muestra, Xi o Yi
Con base en las ecuaciones 1 y 2 para las tres ser igual a cero.) As, el par de frecuencias para las
probabilidades (A, B y C en la Tabla III), obtenemos los especies S12 verdaderamente compartidas por los dos
siguientes ndices basados en la abundancia en trminos ensamblajes son (X1, Y1)(X2, Y2)...(XS12, YS12). Asuma
de U y V: que D12 de las S12 especies compartidas disponibles de
A UV hecho se observan en ambas muestras, y que sus fre-
J abd = = (5) y cuencias son los primeros D12 pares. De esta manera, S12
A + B + C U + V UV - D12 especies adicionales se comparten entre los dos
ensamblajes, pero estn ausentes de una o dos de las
A2 2UV muestras. Conforme las frecuencias de las especies raras
Labd = = (6)
2A + B + C U +V compartidas sean mayores, se incrementa la probabili-
dad de que especies compartidas adicionales estn pre-
Dado que U y V representan las abundancias totales de sentes en ambos ensamblajes, pero ausentes de una o
las especies compartidas en Ensamblajes 1 y 2, respec- ambas muestras. Nos referimos a stas como especies
tivamente, vemos que ambos ndices tienden a 1 para compartidas, no vistas.
90 A. Chao et al.
Para incorporar a las probabilidades de la Tabla III partidas no vistas, no es posible usar una sencilla lista
el efecto de las especies compartidas pero no vistas, de las especies presentes en dos ensamblajes (datos de
usamos las frecuencias de las especies raras observadas incidencia), aun en principio, para ajustar los ndices de
y compartidas para estimar el trmino de ajuste apro- similitud para el efecto de las especies no vistas. Por
piado para U y V para tomar en cuenta las especies otro lado, el mtodo basado en estimacin se puede
compartidas no vistas. Primero definimos la funcin extender a los datos de incidencia (presencia-ausencia)
indicadora I(expresin) tal como I = 1 si la expresin replicados.
es verdadera y I = 0 si la expresin es falsa. Dejemos Suponga que tomamos un conjunto de w muestras
que de incidencia replicadas del Ensamblaje X y un conjunto
D12 de z muestras de incidencia replicadas del Ensamblaje
f1+ = I [X i = 1, Yi 1] Y. Para ambos conjuntos de muestras combinados, hay S
i =1 especies. El nmero de muestras en las que se encuentra
sea el nmero observado de las especies compartidas una especie en el Ensamblaje X o Y es la frecuencia
que ocurren una sola vez [singletons] (Xi = 1) en la para esta especie en dicho conjunto de muestras. Las
Muestra 1 (estas especies tienen que estar presentes en frecuencias para la especie i entonces se definen como
la Muestra 2, pero pueden tener cualquier abundancia).
w z
Ahora, dejemos que f2+ sea el nmero observado de
X i = xij y Yi = yij
especies compartidas que ocurren dos veces [double- j =1 j =1
tons] (Xi = 2) en la Muestra 1. De igual manera, defini-
mos f+1 y f+2 como el nmero observado de especies donde xij y yij representan la presencia (1) o ausencia (0)
compartidas que ocurren, respectivamente, una sola vez de la especie i en la muestra j.
(Yi = 1) y dos veces (Yi = 2) en la Muestra 2. Ntese que Xi o Yi ser cero para algunas especies,
Entonces, el estimador propuesto para U es a menos que todas las especies estn compartidas y
observadas.
D12
X (m 1) f +1 D12
Xi
U = i + I (Yi = 1) (7) Bajo el supuesto que las muestras replicadas de la
i =1 n m 2 f +2 i =1 n incidencia son estadsticamente homogneas (dentro de
cada ensamblaje), la probabilidad de que una especie
Ntese que el primer trmino al lado derecho de la ec. 7 est presente en una muestra dada es proporcional a su
denota el total observado de las frecuencias asociadas abundancia relativa en el ensamblaje, y los vectores de
con las especies observadas compartidas; el segundo frecuencia Xi o Yi as representan estadsticamente la
trmino representa el efecto estimado de las especies abundancia relativa de las especies en los Ensamblajes
compartidas no vistas. De manera similar, tenemos X y Y (p. ejem. Chao, 2004; Colwell et al., 2004). Por
ello, con cambios menores, las ecuaciones 7 y 8 pueden
D12
Y (n 1) f1+ D12
Yi
V = i +
i =1 m n 2 f 2+
mI (X
i =1
i = 1) (8) usarse para calcular las probabilidades ajustadas de que
una incidencia seleccionada al azar (deteccin de espe-
cies) de cada uno de los dos ensamblajes representarn
Cuando f+2 = 0 o f2+ = 0, reemplace f+2 y f2+ en los especies compartidas (aunque no necesariamente la
denominadores por f+2 + 1 o f2+ + 1, respectivamente. Si misma especie compartida).
el valor de o V es mayor a 1 (que rara vez ocurre), Para los datos de incidencia replicados, f1+ es el
entonces se reemplaza por 1. Los estimadores Jaccard y nmero de especies compartidas observadas que ocurre
Srensen basados en abundancias que proponemos son en exactamente una muestra (Xi = 1) en X y f2+ es el
nmero de especies compartidas observadas que ocurre
UV
Jabd = (9) y en exactamente dos muestras (Xi = 2) en X; f+1 y f+2 son
U + V UV los nmeros correspondientes para la matriz de muestras
Y. Definamos la suma de las frecuencias de incidencia
2UV para las matrices como
Labd = (10)
U + V S S
n = Xi y m = Yi
Las varianzas para estos dos estimadores se pue- i =1 i =1
den derivar por el mtodo bootstrap. (La derivacin
completa de las ecuaciones 7 y 8 y los detalles del pro- Entonces los estimadores propuestos son
cedimiento bootstrap para calcular los estimadores de la
varianza para las ecuaciones 9 y 10 estn disponibles D12
X ( z 1) f +1 D12
X
previa solicitud al primer autor.) U inc = i +
i =1 n z 2 f +2
n I (Y = 1)
i =1
i
i
(11) y

Estimacin de los ndices de similitud a partir


de frecuencias de incidencia D12
Y (w 1) f1+ D12
Yi
En virtud de que la informacin acerca de las frecuen-
Vinc = i +
i =1 m w 2 f 2+
m I ( X
i =1
i = 1) (12)

cias y las identidades de las especies raras, provee in-
formacin crtica para ajustar los ndices de similitud (Las mismas modificaciones descritas para las ecuacio-
para que tomen en cuenta el efecto de las especies com- nes 7 y 8 pueden aplicarse aqu si f+2 = 0 o f2+ = 0.) De
Un nuevo mtodo estadstico para la evaluacin de la similitud 91
esta manera, nuestros estimadores Jaccard y Srensen caso omiso de la abundancia relativa (aunque son fuer-
basados en incidencia son temente afectados por ella, cuando se trata de mues-
trear), mientras nuestros nuevos ndices [y muchos otros
U incVinc (Legendre y Legendre, 1998; Magurran, 2004)] consi-
Jinc = (13) y
U inc + Vinc U incVinc deran explcitamente la abundancia relativa. De esta
manera, para cualquier conjunto de datos en particular,
2U incVinc las diferencias en la magnitud absoluta de los valores
Linc = (14)
Jaccard o Srensen basados en incidencia vs. abundan-
U + V
inc inc
cia (o bien, las diferencias entre la mayora de los otros
ndices de similitud) en s, carecen de sentido.
No obstante, los ndices de similitud en la compo-
Evaluacin de desempeo: sicin pueden compararse en trminos de su desempeo
ndices clsicos vs. ndices nuevos en pruebas de su sensibilidad al submuestreo. Utilizan-
do los datos de las hormigas, ilustramos tres pruebas:
ndices evaluados (1) Prueba 1: muestras de igual tamao de un solo con-
Llevamos a cabo pruebas de desempeo para: (1) los junto de datos (rarefaccin dentro del mismo ensambla-
ndices clsicos de Jaccard y Srensen (ecuaciones 1 y je); (2) Prueba 2: muestras de tamao desigual de un
2); (2) los nuevos ndices Jaccard y Srensen basados solo conjunto de datos; y (3) Prueba 3: muestras de
en incidencia (ecuaciones 5 y 6); (3) los estimadores igual proporcin de dos conjuntos de datos (rarefaccin
para los ndices basados en abundancia (ecuaciones 9 y entre ensamblajes). Para los fines de estas pruebas,
10); y (4) los estimadores de incidencia replicada para tratamos a los datos de cada uno de los mtodos de
los ndices basados en abundancias (ecuaciones 13 y colecta de hormigas (Berlese, Malaise o la fumigacin)
14). como un ensamblaje completo y por separado, al cual
nos referimos aqu como el agrupamiento de muestreo
Conjuntos de datos utilizados en las pruebas (sampling pool). Muestras de tamaos especificados (en
trminos de los nmeros de individuos) fueron entonces
Llevamos a cabo pruebas de desempeo con un conjun- seleccionadas al azar, con reemplazo, de estos agrupa-
to de datos grande para hormigas de la selva, rico en mientos. Desde luego, no todas las especies presentes
especies (Longino et al., 2003), coleccionado mediante en un agrupamiento de muestreo estn representadas en
varias tcnicas de colecta masiva replicada en la Esta- las muestras de menor tamao. Sin embargo, dado que
cin Biolgica La Selva, en Costa Rica. Aqu presenta- el muestreo se hizo con reemplazo, no todas las especies
mos resultados representativos para tres mtodos de estn presentes aun cuando el nmero de individuos
coleccin: la extraccin de muestras de suelo Berlese seleccionado es el mismo que el nmero de individuos
(217 muestras, 4318 individuos, 117 especies de las en el agrupamiento.
cuales 19 ocurrieron una sola vez), muestras de trampas
Malaise para insectos voladores y rastreros (62 mues-
tras, 1660 individuos, 103 especies de las cuales 35 Resultados
ocurrieron una sola vez) y muestras obtenidas con la
aspersin de insecticida (fumigacin del dosel) (459 Prueba 1: Muestras de igual tamao de un solo
muestras, 26302 individuos, 165 especies de las cuales conjunto de datos
19 ocurrieron una sola vez). [Los diagramas de abun-
Todos los ndices de similitud rinden un valor verdadero
dancia relativa aparecen en Longino et al. (2002).] Tal y
de 1 cuando un agrupamiento de muestreo completo
como Longino et al. (2002) sealan, estos tres mtodos
(ensamblaje) es comparado con si mismo. Qu pasa
muestrean, a propsito, diferentes pero solapados seg-
cuando un ndice de similitud se calcula para dos mues-
mentos de la fauna local de hormigas. Mientras la suma
tras aleatorias de un solo agrupamiento de muestreo? Si
bruta de especies para los tres mtodos sera 117 + 103
un ndice no est sesgado por el tamao de la muestra,
+ 165 = 385 especies, el nmero actual de especies
debe dar un valor de 1 cuando se aplica a muestras de
capturadas por estos tres mtodos solamente fue de 276
cualquier tamao. Primero, muestreamos individuos al
especies. Pruebas paralelas para otros conjuntos de
azar (con reemplazo) del agrupamiento de datos de
datos ricos en especies, incluyendo los datos de especies
hormigas para un solo mtodo de colecta para producir
de rboles de la selva presentados ms adelante en este
pares de muestras con el mismo nmero de individuos
artculo, dieron resultados concordantes (A. Chao, R. L.
que los agrupamientos mismos (muestras completas).
Chazdon, R. K. Colwell y T.-J. Shen, datos no publica-
Luego, al azar seleccionamos muestras ms pequeas,
dos).
cada una con la mitad del nmero de individuos en el
agrupamiento de muestreo original. Seguimos repitien-
Las pruebas
do este procedimiento para un par de muestras, cada una
Aunque los ndices clsicos de Jaccard y Srensen y 1/4 del tamao del agrupamiento original, luego un par
nuestros nuevos ndices miden todas la similitud, su 1/8 del tamao del agrupamiento, etc., sucesivamente
propsito es medir aspectos diferentes de esta construc- dividiendo la muestra a la mitad hasta quedar con 1/64
cin: los ndices clsicos miden ostensiblemente la del nmero original de individuos. (Ntese que es una
similitud en la composicin de especies mientras hacen prueba muy severa del sesgo del submuestreo, aun para
92 A. Chao et al.

Fig. 2. Pruebas de muestreo aleatorio de los


ndices de solapamiento clsicos de Jaccard
(Jclas, ec. 1) y Srensen (Lclas, ec. 2). Las
grficas muestran el efecto sobre cada
ndice al considerar muestras aleatorias
compuestas de 1/1 (Completo), 1/2, 1/4, ...,
1/64 de las abundancias o los equivalentes
en incidencia en los agrupamientos de
muestreo, muestreados con reemplazo. (Las
etiquetas de la grfica inferior a la izquierda
se aplican a todas las grficas). La columna
1 (Prueba 1: Berlese rarefaccin) muestra
valores del ndice de similitud para pares de
muestras del mismo tamao del conjunto de
datos Berlese de hormigas. La columna 2
(Prueba 2: Berlese desigual) muestra los
valores del ndice para comparaciones de
muestras de tamao decreciente vs. una
muestra del mismo tamao del conjunto completo de datos Berlese de hormigas. La columna 3 (Malaise-fumigacin rarefaccin)
muestra valores del ndice de similitud para pares de muestras de igual proporcin (Prueba 3) de los conjuntos de datos de hor-
migas Malaise vs. fumigacin, una comparacin de alta similitud. La columna 4 (Malaise-Berlese rarefaccin) muestra los valo-
res del ndice de similitud para pares de muestras de igual proporcin (Prueba 3) del conjunto de datos de hormigas Berlese vs.
Malaise, una comparacin de baja similitud. El verdadero valor de cada ndice para los agrupamientos de muestreo se indica con
lneas punteadas horizontales en las columnas para la Prueba 3 (rarefaccin Malaise-fumigacin y Malaise-Berlese). El verdade-
ro valor del ndice para la Prueba 1 y la Prueba 2 es 1.0, es decir, la parte superior de las grficas.

estos agrupamientos muy grandes.) Este proceso com- debe mantener un valor de 1, sin importar discrepancias
pleto se repiti 1000 veces y promedios fueron calcula- en los tamaos de las muestras. Las Figuras 2 y 3 (se-
dos para cada prueba de cada ndice, y para cada uno de gunda columna, Prueba 2: Berlese desigual) muestran
los tres mtodos de colectar las hormigas. una prueba as para los datos de hormigas de la muestra
La Figura 2 presenta los resultados representativos Berlese, utilizando muestras creadas por el mismo es-
para esta prueba para los ndices clsicos de Jaccard y quema indicado en el primer mtodo. Aun ms que en la
Srensen (primera columna, Prueba 1: rarefaccin Ber- primera prueba, los ndices clsicos de Jaccard y Sren-
lese). Claramente ambos ndices fueron muy sensibles sen (Fig. 2) se vieron fuertemente afectados por el ta-
al submuestreo. La Figura 3 (primera columna) presenta mao de la muestra, causando un sesgo negativo y seve-
los resultados correspondientes a los nuevos ndices ro cuando una muestra era mucho ms pequea que la
para esta prueba. Los nuevos ndices Jaccard y Srensen muestra completa. En cambio, los nuevos estimadores
basados en abundancia, sin ajustar por las especies de Jaccard y Srensen (Fig. 3, segunda columna) resul-
compartidas no vistas (Jabd y Labd), fueron tambin sen- taron notablemente resistentes al submuestreo, inclu-
sibles al tamao de la muestra. En cambio, los estima- yendo tanto los estimadores basados en abundancia
dores Jaccard y Srensen, mismos que incluyen el efec- ( Jabd y Labd ) y los basados en datos de incidencia repli-
to estimado de las especies compartidas, no vistas, re-
cados ( J y L ).
sult menos sensible al submuestreo, con valores nota- inc inc

blemente ms cercanos a 1 aun para muestras pequeas


(Fig. 3). Esto fue cierto tanto para los estimadores basa- Muestras de igual proporcin de dos conjuntos
dos en abundancia ( Jabd y Labd ) como para los estima- de datos
dores basados en los datos de incidencia replicados Est bien que un ndice de la similitud sea robusto al
( Jinc y Linc ). tamao de muestra al comparar muestras pareadas que
provienen del mismo agrupamiento, pero un ndice es
de poca utilidad si no retiene esta robustez al comparar
Prueba 2: Muestras de diferentes tamaos de un
conjuntos de datos distintos, a la vez que detecta exito-
solo conjunto de datos
samente las diferencias en la composicin entre ellos.
Un ndice de similitud idealmente debera ser robusto en Llevamos a cabo los mismos procedimientos de compa-
cuanto al tamao de muestra no solamente para mues- racin de tamao de muestra descritos para el primer
tras de igual tamao, sino tambin para muestras de conjunto de pruebas, pero en vez de comparar pares de
diferentes tamaos. Para poner a prueba esta propiedad muestras del mismo agrupamiento de muestreo, compa-
calculamos los ndices de similitud para muestras de ramos pares de muestras sucesivamente ms pequeos
tamaos sucesivamente ms pequeos, vs. muestras de los conjuntos de datos Malaise y fumigacin [de alta
completas, con un nmero de individuos igual al n- similitud (Longino et al., 2002)], y de los conjuntos de
mero en el agrupamiento de muestreo correspondiente. datos de Malaise y Berlese (baja similitud). Los resulta-
Tal y como se vio en la primera prueba, un ndice ideal dos para los ndices clsicos de Jaccard y Srensen se
Un nuevo mtodo estadstico para la evaluacin de la similitud 93

Fig. 3. Pruebas de muestreo aleatorio de los


nuevos ndices de solapamiento. Para cada
ndice las grficas muestran el efecto al consi-
derar muestras aleatorias compuestas de 1/1
(Completo), 1/2, 1/4, ..., 1/64 de las abundan-
cias o equivalentes de incidencia en los agru-
pamientos de muestreo, muestreados con re-
emplazo. (Las etiquetas de la grfica inferior se
aplican a todas las grficas.) Las columnas se
describen en la leyenda de la Figura 2. ndices
de Jaccard: Jabd es el nuevo ndice basado en
abundancia, no ajustado para las especies no
vistas, calculado con la ecuacin 5. J abd es el
estimador basado en abundancias correspon-
diente que toma en cuenta las especies no
vistas, calculado con la ecuacin 9. El estima-
dor basado en datos de incidencia replicados,
J inc , se calcula con la ecuacin 13. Los ndices
Srensen: Labd es el nuevo ndice Srensen
basado en abundancias, no ajustado para las
especies no vistas, y calculado con la ecuacin
6. L abd es el estimador basado en abundancias
que toma en cuenta las especies no vistas,
calculado con la ecuacin 10. El estimador
basado en los datos de incidencia replicados,
Linc , se calcula con la ecuacin 14. El verdade-
ro valor de cada ndice para los agrupamientos
de muestreo considerados se indica con lneas
punteadas horizontales en las columnas para la
Prueba 3 (Rarefaccin Malaisefumigacin y
MalaiseBerlese). El verdadero valor del ndi-
ce para la Prueba 1 y la Prueba 2 es 1.0, es
decir, la parte superior de las grficas. Para
permitir la comparacin vlida entre los esti-
madores basados en incidencia ( J inc y Linc ) y los
estimadores basados en abundancias correspon-
dientes ( J abd y L abd , respectivamente), el eje X
para cada estimador basado en incidencia se
ajust para que el nmero mnimo de incidencias
corresponda con la abundancia mnima del esti-
mador basado en abundancias, igualando as
la cantidad de informacin estadstica.

presentan en la tercera y cuarta columna de la Fig. 2. Un Aplicacin


ndice ideal dara y mantendra el verdadero valor calcu-
A manera de ejemplo de los nuevos ndices, aplicamos
lado para los agrupamientos completos (la lnea puntea-
el ndice clsico Jaccard (ec. 1), el nuevo ndice Jaccard
da y horizontal en cada caja) en el proceso de rarefac-
basado en abundancias (ec. 5) y su estimador (ec. 9) a
cin. Los ndices clsicos de Jaccard y Srensen resulta-
datos provenientes de dos sitios de selva madura y cua-
ron muy sensibles al submuestreo en esta prueba (Fig.
tro sitios de selva secundaria en Costa Rica. Examina-
2). Los nuevos ndices Jaccard y Srensen basados en
mos la similitud en la composicin entre las especies de
abundancia y sin corregir por las especies no vistas (Jabd
rboles 25 cm dimetro a la altura del pecho (dap;
y Labd en la tercera y la cuarta columna de la Fig. 3),
especies de rboles del dosel), briznales de las especies
tambin sufrieron del sesgo del submuestreo, pero el
del dosel (1 5 cm dap) y plntulas de las especies del
sesgo se redujo para sus contrapartes basadas en la
dosel (altura > 20 cm, dap < 1 cm) en cuatro selvas
abundancia y corregidas para las especies no vistas
secundarias con diferente tiempo transcurrido desde su
( Jabd y Labd en la tercera y cuarta columna de la Fig. 3) abandono como pastizal y en dos selvas maduras en la
as como para los estimadores basados en los datos misma rea de estudio. Durante las etapas tempranas de
correspondientes de incidencia replicados ( Jinc y Linc en las sucesin, cuando el dosel empieza a cerrarse, las
la tercera y cuarta columna de la Fig. 3). especies arbreas colonizadoras de rpido crecimiento
94 A. Chao et al.
Tabla IV. Patrones observados de riqueza de especies se enriquecen con las especies tolerantes a la sombra
arbreas para plntulas, briznales e individuos del dosel que no estn representadas en el dosel, y esto resulta en
para cuatro cuadros de una ha de selva secundaria y dos
cuadros de selva madura en el ao 2000 la disminucin de la similitud en la composicin que
lleg a su mnimo en la selva LEP de 23 aos de edad
Sobs
Sitio Edad
Sobs Sobs
rboles
(Fig. 4). Esta similitud mnima representa un punto en la
plntulas briznales sucesin de la selva de mxima limitacin de recluta-
del dosel
LSUR 15 45 68 12 miento tanto para plntulas como para briznales. En el
TIR 18 49 74 16 sitio con la selva secundaria de mayor edad, CR, el
LEP 23 47 67 24 ndice Jaccard basado en abundancias empez a aumen-
CR 28 57 91 33
LSUR
tar, reflejando el reclutamiento de las especies tolerantes
selva >200 47 101 37 a la sombra en cada una de las tres clases de tamao
madura (Fig. 4). El ndice de similitud continu aumentando y
LEP se estabiliz en 0.4 0.5 en las dos selvas maduras. Con
selva >200 69 102 43
madura
la excepcin de uno de los sitios de selva madura, los
ndices de similitud fueron ms altos para plntulas vs.
Todos los rboles y los briznales fueron marcados y su dime-
tro medido dentro de un cuadro de una ha en cada selva. Las
rboles que para briznales vs. rboles. En la escala de
plntulas fueron muestreadas en 144 cuadros que medan 1 x cuadros de una ha, la similitud en la composicin entre
5 m dentro del cuadro de una ha, resultando en un rea mues- las clases de tamao rboles, plntulas y briznales (es-
treada de 0.072 ha. En estos anlisis, incluimos solamente pecies del dosel) en selvas maduras fue comparable a lo
especies arbreas; se excluyeron los arbustos, arbolitos (tree-
lets) y rboles del dosel medio. Ntese que los sitios jvenes observado en una selva secundaria de 15 aos de edad,
tienen un nmero bajo de especies arbreas del dosel por pero mayor a lo observado en selvas secundarias de
hectrea (individuos 25 cm dap) y un nmero menor de edad intermedia. Por diseo, el ndice Jaccard basado en
briznales comparado con la selva madura, pero para el caso de abundancias responde sensiblemente a cambios en las
las plntulas las diferencias en la riqueza de especies fueron
menos notables. abundancias relativas totales de especies compartidas
durante la sucesin en selvas.
El estimador Jaccard basado en abundancias (ec.
que no toleran la sombra estn presentes en el dosel y 9), el cual incorpora los efectos de las especies compar-
tambin se encuentran como briznales y plntulas en el tidas no vistas, mostr tendencias generales similares
sotobosque. Conforme avanza el tiempo y el sotobosque para todas las selvas cuando se compar con el ndice
se vuelve ms sombreado, las especies que no toleran la Jaccard basado en abundancias (Fig. 4). La selva secun-
sombra desaparecen del agrupamiento de plntulas y daria de 28 aos de edad, sin embargo, tuvo estimados
briznales y las especies que toleran la sombra rpida- de similitud casi comparables con las dos selvas madu-
mente colonizan estas clases de tamao pequeas. Estas ras, sugiriendo que el estimador est respondiendo a
especies tolerantes a la sombra estn representadas en especies raras o infrecuentes que estn compartidas
los briznales y las plntulas, pero tienen pocos o ningn entre las clases de tamao (Fig. 4). El estimador para la
rbol en el dosel, gradualmente aumentando la riqueza similitud entre briznales y rboles fue ms alto que el
de las especies arbreas conforme la selva madura obtenido para plntulas vs. rboles en el sitio de selva
(Guariguata et al., 1997; Tabla IV). De esta manera, secundaria TIR, indicando que este sitio tiene un mayor
predeciramos que, a la medida que la selva secundaria nmero de especies raras compartidas en briznales que
madura, la similitud en la composicin entre especies de en plntulas.
rboles inicialmente sera alta pero rpidamente dismi-
nuira a un mnimo durante las etapas intermedias de la
Conclusiones
sucesin y luego empezara a aumentarse ms tarde en
la sucesin cuando los rboles tolerantes a la sombra En virtud de que la similitud es una construccin cuali-
alcanzan la madurez reproductiva y producen plntulas tativa humana, no tiene una definicin matemtica pre-
que pueden establecerse, crecer y sobrevivir. cisa. No obstante, el medir la similitud depende de
El ndice clsico Jaccard (ec. 1) mostr baja simi- ndices cuantitativos diseados para el propsito, y en la
litud en la composicin entre rboles y plntulas para prctica, podemos esperar que los ndices de la similitud
las cuatro selvas secundarias en comparacin con las cumplan con criterios razonables para su comporta-
selvas maduras, con la similitud disminuyendo un poco miento matemtico (Legendre y Legendre, 1998). Da-
a mayor edad entre las cuatro selvas secundarias (Fig. dos ndices que tengan sentido matemticamente, lo que
4). La similitud entre rboles y briznales, en cambio, nos concierne aqu es su desempeo estadstico en el
mostr aumentos graduales de la selva ms joven a la contexto de la realidad del muestreo de campo, particu-
selva secundaria mayor, continuando con esta tendencia larmente para aquellos taxa ricos en especies para los
a las selvas maduras (Fig. 4). cuales es poco prctico o incluso imposible llevar a
El ndice Jaccard basado en abundancias (ec. 5) cabo inventarios completos.
mostr un patrn marcadamente diferente para los seis Utilizando simulaciones de muestreo aplicadas a
sitios de selva. La similitud en la composicin entre los conjuntos de datos de campo representativos, confir-
ensamblajes de plntulas y rboles, y entre los de los mamos que dos de los ndices clsicos ms ampliamente
briznales y los rboles fue inicialmente alta en la selva usados, Jaccard y Srensen, sufren de sesgo negativo
ms joven, tal y como se predijo. Conforme la selva va bajo condiciones de submuestreo, a menudo un sesgo
madurando, los agrupamientos de plntulas y briznales muy fuerte (Fig. 2). Nuestro objetivo fue desarrollar
Un nuevo mtodo estadstico para la evaluacin de la similitud 95

Fig. 4. La similitud en composicin entre los rboles del


dosel y las plntulas y los rboles del dosel y los briznales en
cuatro cuadros de selva secundaria de diferentes edades y en
dos cuadros de selva madura. Los resultados se presentan para
Jclas, el ndice clsico de Jaccard (ec. 1 grfica superior), para
el nuevo ndice Jaccard basado en abundancias Jabd (ec. 5) sin
ajustar por las especies no vistas (grfica de en medio), y para
abd, el nuevo estimador Jaccard basado en abundancias que
toma en cuenta las especies no vistas (ec. 9; las barras de error
muestran 1 error estndar, calculado con el procedimiento
bootstrap; detalles disponibles del primer autor; A. Chao, R.
L. Chazdon, R. K. Colwell & T.-J. Shen, datos no publica-
dos). Estos anlisis incluyen solamente especies arbreas del
dosel; se excluyeron los arbustos, arbolitos (treelets) y rboles
del dosel medio.

nuevos ndices basados en la probabilidad que reduce el


sesgo introducido por el submuestreo mediante la esti-
macin y compensacin por los efectos de las especies
compartidas no vistas. Basamos un nuevo ndice de
similitud en la probabilidad de que dos individuos se-
leccionados al azar, cada uno proveniente de una de dos
muestras, pertenezcan a cualquiera de las especies com-
partidas por las dos muestras [no necesariamente a la
misma especie compartida, la base de F (Chave y
Leigh, 2002; Condit et al., 2002) y el ndice Morisita- ndices para cualquier aplicacin en la que no solamente
Horn]. Este enfoque abri el camino al paso crtico, el el apareamiento de especies sino tambin la similitud de
ajuste de esta probabilidad para tomar en cuenta la po- las abundancias relativas sean de inters. Ms an, estos
sibilidad de que muestras ms grandes revelaran una nuevos ndices son ms apropiados que los ndices
proporcin mayor de las especies compartidas. Como se clsicos correspondientes para la evaluacin de la simi-
anticip, los nuevos ndices redujeron de manera consis- litud en la composicin entre muestras de diferentes
tente el sesgo del submuestreo en las pruebas de desem- tamaos, as como en situaciones reales o sospechadas
peo, notablemente en la mayora de las circunstancias. de submuestreo, y cuando es probable que las muestras
Inevitablemente, todava hay algo de sesgo, especial- tengan numerosas especies raras.
mente cuando se trata del submuestreo severo y para las
muestras altamente disimilares. Bajo tales condiciones,
Agradecimiento
existe relativamente poca informacin para guiarnos en
la reduccin del sesgo. Agradecemos a tres rbitros annimos sus comentarios
Los eclogos distinguen dos aspectos de la simili- y sugerencias. Este trabajo recibi el apoyo del Consejo
tud en la composicin de los ensamblajes de especies: la Nacional de Ciencias de Taiwan (Contrato NSC92-
similitud en las listas de especies (incidencia) y la simi- 2118-M007-013) otorgado a A. Chao y T.-J. Shen, y un
litud en las abundancias relativas de las especies. Los apoyo del Andrew W. Mellon Foundation otorgado a R.
ndices clsicos basados en abundancias (p. ejem. Mori- L. Chazdon, y por US-NSF proyecto DEB-0072702
sita-Horn o Bray-Curtis) aparean abundancias, especie otorgado a R. K. Colwell. Damos las gracias a Jorge
por especie. Nuestros nuevos ndices toman un camino Leiva por compartir sus datos de vegetacin para las
intermedio, evaluando la probabilidad de que individuos especies arbreas en selvas maduras. Los nuevos esti-
pertenezcan a especies compartidas vs. no compartidas, madores presentados en este artculo se incluyen en la
sin importar a qu especies pertenecen. Desafortunada- versin 7.5 de ESTIMATES (Colwell 200n 7.5 de
mente, para muchos estudios, datos puros de incidencia, ESTIMATES (Colwell 2004) y el programa SPADE
no replicados (listas pareadas de especies) no proveen (Chao y Shen 2003), que sern difundidos al publicar
informacin que se pueda usar para estimar el nmero este artculo. La derivacin completa de las ecuaciones
de especies compartidas pero no vistas. En principio, 7 y 8 y los estimadores de la varianza para las ecuacio-
puede ser posible derivar estimadores que utilizan datos nes 9 y 10 son disponibles, previa solicitud, del primer
de abundancia para corregir ndices de similitud puros autor. Los conjuntos completos de los datos de las hor-
de incidencia para las especies no vistas, pero actual- migas estn disponibles de RKC.
mente es estadsticamente difcil para datos biolgica- La traductora, Bianca Delfosse, agradece a Javier
mente realistas. Sin embargo, recomendamos los nuevos Laborde su puntual asesora.
96 A. Chao et al.

Bibliografa
Arita, H. T. & P. Rodriguez. 2002. Geographic range, turn- Fisher, B. L. 1999. Improving inventory efficiency: a case
over rate and the scaling of species diversity. Ecogra- study of leaf-litter ant diversity in Madagascar. Ecol.
phy, 25: 541-550. Appl., 9: 714-731.
Arita, H. T. & P. Rodriguez. 2004. Local-regional relation- Grassle, J. R. & W. Smith. 1976. A similarity measure sensi-
ships and the geographical distribution of species. tive to the contribution of rare species and its use in in-
Global Ecol. Biogeogr., 13: 15-21. vestigation of variation in marine benthic communities.
Balvanera, P., E. Lott, G. Segura, C. Siebe & A. Islas. 2002. Oecologia, 25: 13-22.
Beta diversity patterns and correlates in a tropical dry Guariguata, M. R., R. L. Chazdon, J. S. Denslow, J. M.Dupuy
forest of Mexico. J. Veg. Sci., 13: 145-158. & L. Anderson. 1997. Structure and floristics of sec-
Bray, J. R & J. T. Curtis. 1957. An ordination of the upland ondary and old-growth forest stands in lowland Costa
forest communities of southern Wisconsin. Ecol. Rica. Plant Ecology, 132: 107-120.
Monogr., 27: 325-349. Harte, J., A. Kinzig & J. Green. 1999. Self-similarity in the
Bunge, J. & M. Fitzpatrick. 1993. Estimating the number of distribution and abundance of species. Science, 284:
species: a review. J. Am. Stat. Assoc., 88: 364-373. 334-336.
Chao, A. (in press). Species richness estimation. In: Encyclo- Hubbell, S. P. 2001. A Unified Neutral Theory of Biodiversity
pedia of Statistical Sciences, 2nd edn (eds. Balakrish- and Biogeography. Princeton University Press, Prince-
nan, N., Read, C.B. & Vidakovic, B.). Wiley Press, ton, NJ.
New York, NY, USA. Koleff, P., K. J. Gaston & J. J. Lennon. 2003. Measuring
Chao, A. & T. J. Shen. 2003. Program SPADE (Species Predic- beta diversity for presence-absence data. J. Anim.
tion and Diversity Estimation). Program and User's Ecol., 72: 367-382.
Guide available at http://chao.stat.nthu.edu.tw. Lee, S.-M. & A. Chao. 1994. Estimating population size via
Chao, A., M.-C. Ma & M. C. K Yang. 1993. Stopping rules sample coverage for closed capture-recapture models.
and estimation for recapture debugging with unequal Biometrics, 50: 88-97.
failure rates. Biometrika, 80: 193-201. Legendre, P. & L. Legendre. 1998. Numerical Ecology. El-
Chave, J. & E. G. Leigh. 2002. A spatially explicit neutral sevier, Amsterdam.
model of beta-diversity in tropical forests. Theor. Pop. Leigh, E.G., S. J. Wright, F. E. Putz & E. A. Herre. 1993.
Biol., 62: 153-168. The decline of tree diversity on newly isolated tropical
Chazdon, R. I., R. K. Colwell, J. S. Denslow & M. R. islands: a test of a null hypothesis and some implica-
Guariguata. 1998. Statistical methods for estimating tions. Evol. Ecol., 7: 76-102.
species richness of woody regeneration in primary and Lennon, J. J., P. Koleff, J. J. D. Greenwood & K. J. Gaston.
secondary rain forests of NE Costa Rica. In: Forest 2001. The geographical structure of British bird distri-
Biodiversity Research Monitoring and Modeling. Con- butions: diversity, spatial turnover and scale. J. Anim.
ceptual Background and Old World Case Studies. (eds Ecol., 70: 966-979.
Dallmeier, F. & Comiskey, J.). Parthenon Publishing, Longino, J.T., J. Coddington & R. K. Colwell. 2002. The ant
Pars, France, pp. 285-309. fauna of a tropical rain forest: estimating species rich-
Colwell, R. K. 2004. ESTIMATES: Statistical Estimation of ness three different ways. Ecology, 83: 689-702.
Species Richness and Shared Species from Samples, MacKenzie, D. I., L. Bailey & J. D. Nichols. 2004. Investi-
Version 7.5. Available at http://viceroy.eeb.uconn.edu/ gating species co-occurrence patterns when species are
estimates. Persistent URL http://purl.oclc.org/estimates. detected imperfectly. J. Anim. Ecol., 73: 546-555.
Colwell, R. K. & J. A. Coddington. 1994. Estimating terres- Magurran, A. E. 2004. Measuring Biological Diversity.
trial biodiversity through extrapolation. Phil Trans. R. Blackwell, Oxford.
Soc. Lond. B. Biol. Sci., 345: 101-118. Plotkin, J. B. & H. C. Muller-Landau. 2002. Sampling the
Colwell, R.K., C. X. Mao & J. Chang. 2004. Interpolating, species composition of a landscape. Ecology, 83: 3344-
extrapolating, and comparing incidence-based species 3356.
accumulation curves. Ecology, 85: 2717-2727. Rodriguez, P. & H. T. Arita. 2004. Beta diversity and latitude
Condit, R., N. Pitman, E. G. Leigh Jr, J. Chave, J. Terborgh, in North American mammals: testing the hypothesis of
R. B. Foster et al. 2002. Beta-diversity in tropical for- covariation. Ecography, 27: 1-11.
est trees. Science, 295: 666-669. Ruokolainen, K. & H. Tuomisto. 2002. Beta-diversity in
Duivenvoorden, J. F. 1995. Tree species composition and rain tropical forests. Science, 297: 1439a.
forest-environment relationships in the. middle Caquet Valencia, R, R. B. Foster, G. Villa, R. Condit, J.-C. Svenning,
area, Colombia, NW Amazonia. Vegetatio, 120: 91- C. Hernndez, C. et al. 2004. Tree species distributions
113. and local habitat variation in the Amazon: large forest
Duivenvoorden, J. F., J.-C. Svenning & S. J. Wright. 2002. plot in eastern Ecuador. J. Ecol., 92: 214-229
Beta diversity in tropical forests. Science, 295: 636- Wolda, H. 1981. Similarity indices, sample size and diversity.
637. Oecologia, 50: 296-302.

También podría gustarte