Biodiversida Inferencia en El Indice de Shannon PDF

Interciencia
ISSN: 0378-1844
interciencia@ivic.ve
Asociación Interciencia
Venezuela
Pla, Laura
Biodiversidad: inferencia basada en el índice de shannon y la riqueza
Interciencia, vol. 31, núm. 8, agosto, 2006, pp. 583-590
Asociación Interciencia
Caracas, Venezuela
Disponible en: http://www.redalyc.org/articulo.oa?id=33911906
Cómo citar el artículo

Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
BIODIVERSIDAD:
INFERENCIA BASADA EN EL
ÍNDICE DE SHANNON Y LA RIQUEZA
LAURA PLA
RESUMEN
Se describen los estimadores puntuales y por intervalos de ofrecen recomendaciones para la aplicación de la técnica de
confianza (IC) de la riqueza y del índice de Shannon; se apli- remuestreo adecuada, con énfasis en casos de muestras peque-
can a un ejemplo con datos de vegetación y a otro con conteo ñas o sin repeticiones. Se orienta también en el uso del soft-
de aves, y se comparan los resultados obtenidos sobre la base ware disponible.
de simulaciones originales y de consideraciones teóricas. Se
Introducción con π i la proporción de i-ésima clase. hacerse a partir de las frecuencias relati-
Estas clases son excluyentes, es decir vas como
n estudios de biodiversi- que un mismo elemento o individuo (1)
dad, a partir del mues- no puede pertenecer a más de una
treo de comunidades, el clase, y por lo tanto los π i están suje- Los estimadores de la ri-
tamaño de la muestra o número de unida- queza se basan en las frecuencias (los fk)
des de observación puede ser pequeño, tos a la restricción que . Si se y en el número de clases o especies efec-
para realizar inferencia paramétrica sobre tivamente observadas (r). Los estimadores
la diversidad existente. No obstante, es toma una muestra aleatoria de esta
de los índices de biodiversidad se basan
deseable lograr estimaciones con niveles comunidad, llamaremos n i al número
directamente en las pi o frecuencias rela-
de confianza conocidos. Una alternativa a de individuos o abundancia de la cla-
tivas de cada especie, e indirectamente en
la estimación paramétrica para los índices se i; si n i=0, entonces la i-ésima espe-
la riqueza.
de diversidad es la construcción de inter- cie no se ha observado en la muestra.
valos de confianza (IC) mediante técnicas Al número total de especies observa-
das en la muestra la llamamos r, que Índice de Shannon
de computación intensiva tales como
remuestreo (Pla y Matteucci, 2001), que nunca podrá ser mayor que S.
Uno de los índices más
no se basan en supuestos distribucionales. Denominaremos fk al
utilizados para cuantificar la biodiversi-
Este trabajo aborda el número de clases con frecuencia o abun-
dad específica es el de Shannon, también
problema con un enfoque aplicado. Se dancia k y así, el número total de indivi-
conocido como Shannon-Weaver (Shan-
describen los métodos de estimación de duos o abundancia total (N) en la mues-
non y Weaver, 1949), derivado de la teo-
la biodiversidad expresada mediante la ri- tra puede calcularse como
ría de información como una medida de
queza y el índice de Shannon, se propone la entropía. El índice refleja la heteroge-
un método de remuestreo para la inferen- neidad de una comunidad sobre la base
cia, y se discuten los resultados de dos que puede ser expresado de dos factores: el número de especies
ejemplos, orientando también en el uso en función de los fk como presentes y su abundancia relativa. Con-
del software disponible. ceptualmente es una medida del grado de
En una comunidad con incertidumbre asociada a la selección
un número total S de clases (típica- recordando que el símbolo ∀ indica aleatoria de un individuo en la comuni-
mente especies en estudios de biodi- ‘para todos los posibles valores de k’. dad. Esto es, si una comunidad de S es-
versidad) no superpuestas, identifica- Asimismo, la estimación pecies es muy homogénea, por ejemplo
das por i=1, 2, ..., S, designaremos de los πi en una muestra aleatoria puede porque existe una especie claramente do-
PALABRAS CLAVE / Bootstrap / Diversidad Biológica / Intervalo de Confianza / Remuestreo /

Recibido: 28/10/2005. Modificado: 14/07/2006. Aceptado: 18/07/2006.
Laura Pla. Magister Scientiarum en Estadística y Doctora en Ciencias Agrícolas, Universi-

dad Central de Venezuela. Profesora, Universidad Nacional Experimental Francisco de Miranda, Venezuela. Dirección:
Apartado 7434, Coro 4101, Venezuela. e-mail: laura@reacciun.ve.
AUG 2006, VOL. 31 Nº 8 0378-1844/06/08/000-07 $ 3. 00/0 583

vados pueden tes en ella, se obtiene siempre un límite
contribuir a la inferior para la riqueza de la comunidad.
comparación Una propuesta para corregir el sesgo de
entre comunida- esta estimación se basa en el concepto de
des (Figura 1). ‘cobertura muestral’ que corresponde a la
El uso de proporción que representa la abundancia
datos muestra- total de las especies presentes en una
les aplicando la muestra, con relación a la abundancia to-
Ec. 2 produce tal de la comunidad (Good, 1953). En las
estimadores ses- dos últimas décadas se han propuesto va-
gados que sub- rios estimadores de la riqueza, muchos de
estiman siem- ellos derivados de los métodos de estima-
pre el valor del ción de totales poblacionales en animales
índice en la po- con métodos de captura-recaptura.
blación, espe-
Figura 1: Índice de Shannon en función de la riqueza. a: r-eH, diferencia entre a) ACE (abundance coverage estimator).
cialmente cuan-
riqueza observada y equiabundante; b: Hmax-H, diferencia entre diversidad poten- Chao y colaboradores (Chao y Lee, 1992;
do se trata de
cial y observada. Chao et al., 2000) dividen las especies
muestras relati-
presentes en una muestra en abundantes
vamente peque-
(rabun: cuando tienen más de k individuos
minante y las restantes S-1 especies ape- ñas donde es poco probable que estén in-
en la muestra) y raras (rrara: aquellas con
nas presentes, el grado de incertidumbre cluidas todas las especies presentes en la
k o menos individuos). La estimación del
será más bajo que si todas las S especies comunidad. Dado que esta es la situación
número de especies ausentes, utilizado
fueran igualmente abundantes. O sea, al más frecuente en los estudios ecológicos
para corregir el sesgo, se basa enteramen-
tomar al azar un individuo, en el primer y ambientales, es necesario encontrar un
te en las especies consideradas raras, ya
caso tendremos un grado de certeza ma- procedimiento que corrija el sesgo y aso-
que las abundantes serán observadas en
yor (menos incertidumbre, producto de cie al índice un nivel de incertidumbre
toda muestra (Chao y Shen, 2003). El es-
una menor entropía) que en el segundo; que permita separar las fluctuaciones
timador propuesto es
porque mientras en el primer caso la pro- aleatorias no atribuibles a causas identifi-
babilidad de que pertenezca a la especie cables, de aquellas que poseen un patrón
(3)
dominante será cercana a 1, mayor que de comportamiento peculiar. La correc-
para cualquier otra especie, en el segundo ción del sesgo puede hacerse si se dispo-
la probabilidad será la misma para cual- ne de una buena (en el sentido de que se
quier especie. acerca al verdadero valor en la población) siendo
El índice de Shannon estimación de la riqueza.
(Shannon y Weaver, 1949) se define Generalizando, se trata el estimador de la ‘cobertura muestral’ y
como de construir un intervalo de confianza
con probabilidad conocida (1-α) para un
(2) parámetro de interés q, en este caso el
índice de Shannon, del que existe un esti-
La diversidad máxima mador calculado a partir de una muestra
(Hmax= lnS) se alcanza cuando todas las aleatoria x1, x2, ..., xn, tomada de la po-
especies están igualmente presentes. Un blación de interés, con una distribución el coeficiente de variación de la abundan-
índice de homogeneidad asociado a esta de probabilidad F desconocida, y general- cia de las especies. Este estimador re-
medida de diversidad puede calcularse mente a partir de una muestra relativa- quiere la selección a priori de k, y no
como el cociente H/Hmax=H/lnS, que será mente pequeña. Esta estimación puede está definido para aquellos casos en que
uno si todas las especies que componen ser puntual cuando solo se estima un va- todas las especies raras tienen un solo in-
la comunidad tienen igual probabilidad lor del índice o por intervalo cuando se dividuo. Chao y Shen (2003) han sugeri-
(πi = 1/S). estiman los límites inferior y superior
do fijar k=10 sobre base empírica.
El antilogaritmo de H con probabilidad fijada de antemano. El
(eH) cuantifica el número de especies, segundo procedimiento, más informativo b) rpot (de potencia ponderada). Pla et al.
igualmente abundantes, suficiente para y que permite comparaciones estadística- (2004) han propuesto un estimador de na-
producir el mismo grado de incertidum- mente válidas entre comunidades requiere turaleza no-paramétrica, que no requiere
bre, o sea el mismo valor de H. Cuanto la estimación del índice y de una medida especificar parámetros de distribución de
mayor sea la diferencia entre eH y S, el de variabilidad. las abundancias por especie, y ajusta la
total de especies, menos diversa será la riqueza observada r por adición de la
comunidad. Esta cuantificación puede ser Estimadores de la riqueza suma de las frecuencias de especies,
útil al comparar gráficos de dispersión inversamente ponderada por la potencia
del índice de Shannon en función de la A continuación se deta- de su abundancia muestral,
riqueza en varias comunidades. Con datos llan procedimientos de estimación puntual
muestrales, Hmax=ln(r) indica qué índice de la riqueza. No se considerarán aquí las (4)
de diversidad de Shannon podría haberse estimaciones asintóticas y las basadas en
alcanzado con las especies presentes, mien- curvas de rarefacción (Gotelli y Colwell, donde ρ=1/2 es un coeficiente selecciona-
tras SH=eH indica cuántas especies equia- 2001). do sobre evidencia empírica, fk es el nú-
bundantes serían necesarias para obtener Cuando se cuantifica la mero de especies con k individuos en la
ese índice observado. Diferencias promedio riqueza observada en la muestra (r), muestra, con k=1,…, maxk (abundancia
entre estos valores potenciales y los obser- como el número total de especies presen- máxima observada). El término que se
584 AUG 2006, VOL. 31 Nº 8

adiciona es la parte entera de la sumato- bootstrap y su uso para corregir el sesgo bootstrap del índice. Para muestras con
ria. Supone que las especies de las que del estimador máximo verosímil como frecuencias o abundancias totales >2000
no se encontraron individuos en la mues- (8) se recomienda el método de remuestreo
tra son más similares a aquellas con me- corregido por el sesgo y por la acelera-
nor abundancia y no requiere fijar un va- siendo el índice calculado con la Ec. ción: BCA, por sus siglas en inglés
*
lor de abundancia para separar especies 5, la media bootstrap del índice y r la (bias-corrected and accelerated). Mien-
raras de abundantes. riqueza observada. tras que con presencia de varias mues-
tras por unidad de análisis o estructuras
Estimadores puntuales Estimación del intervalo de confianza jerárquicas de clasificación se recomien-
del índice de Shannon del índice de Shannon da el uso del IC por BCA para el pro-
medio (Pla y Matteucci, 2001).
a) Máximo verosímil (MV). El estimador Como se ha señalado
máximo verosímil a partir de datos de la arriba, la definición de los límites del in-
tervalo de confianza requiere una estima- Materiales y Métodos
abundancia de cada especie es
ción de la variabilidad aleatoria asociada Se comparan los esti-
(5) a la estimación. En el caso del estimador madores de riqueza (Ec. 3 y 4) y del ín-
máximo verosímil, la varianza puede cal- dice de Shannon (Ec. 5, 6, 7 y 8) a tra-
siendo pi, el definido en la Ec. 1. Este cularse como (Hutcheson, 1970) vés de su aplicación a dos conjuntos de
método produce un estimador sesgado
datos, uno de vegetación y otro de aves.
(Hutcheson, 1970), con esperanza (9) Se presentan los dos conjuntos de datos
(6) usados y el método de estimación de la
y la riqueza (S) deberá ser sustituida por
variabilidad por remuestreo.
su estimación. Surgirán así tres variantes
y cuando no se conoce el total de espe-
del intervalo de confianza máximo vero-
cies en la población (S), que es el caso Bases de datos utilizadas
símil según se utilice r, ACE o rpot.
más frecuente en la práctica, no es posi-
Con la corrección por
ble corregir el sesgo sin estimar a su vez Vegetación de Falcón. Es una base amplia
ACE, Chao (1987) ha sugerido el uso de
el número de especies presentes en la po- de datos de vegetación y ambiente
una transformación logarítmica para ajus-
blación (Peet, 1974). georeferenciada del estado Falcón, Vene-
tar los límites del intervalo que garantiza
zuela (Matteucci et al., 2001). Se toma-
b) Máximo verosímil corregido por sesgo la obtención de un límite inferior >0. Se
ron cuatro formaciones de Beard (Mat-
(MVr, MVACE y MVrpot). Se trata de ajus- considera que la variable aleatoria
teucci, 1987): cardonales (C), cardonales
tar el estimador puntual de la Ec. 5 su- l n(MVACE- ) tiene una distribución que se secundarios (CS), espinares (E) y espi-
mándole el sesgo estimado por la Ec. 6 aproxima a la normal y el límite inferior nares deciduos (ED). La sub-base posee
sustituyendo S, que es desconocida, por
del IC puede calcularse como Ll= +D/L, datos de abundancia de 151 especies en
su estimador: la riqueza observada (r), el
mientras que el límite superior será 37 sitios de muestreo. Las cuatro forma-
estimador ACE, o rpot.
LS= +D * L, siendo D=(MVACE- ) y ciones corresponden a bosques secos tro-
c) Basado en Horvitz-Thompson (HT). picales que han sido estudiados en su re-
Chao y Shen (2003) combinaron la pro- lación con el ambiente en otros trabajos
puesta de Horvitz y Thompson (1952) (10) (Matteucci et al., 1999a, b).
para estimar el total de una población Aves de Misiones. Es una base de datos
bajo un diseño de muestreo no equipro- resultante del muestreo de aves en la
bable con el concepto de ‘cobertura En la discusión de los selva atlántica de la Provincia de Misio-
muestral’ para ajustar el sesgo producido ejemplos podremos ver la diferencia entre nes, Argentina (Giraudo et al., 2005). Se
por las especies no observadas. El esti- estas aproximaciones. realizaron campañas en los meses de oc-
mador resultante puede calcularse como La estimación del índice tubre, diciembre 2004 y abril 2005 en
por Horvitz-Thompson permite el cálculo 94 unidades de observación divididas en
(7) de la varianza por aproximación fragmentos grandes (n=53) y fragmentos
asintótica como (Chao y Shen, 2003) pequeños (n=41). Del total de 155 espe-
cies detectadas para toda la selva (26
siendo el estimador de la ‘co- generalistas y 129 exclusivas del bos-
que), 86 están tanto en los fragmentos
bertura muestral’ basado en todas las es- siendo côv(fi,fj)=fi(1-fi/ACE) cuando i=j, y grandes como en los pequeños (de esas,
pecies. Así, si todas las especies están côv(fi,fj)=fifj/ACE cuando i≠j. Esta ecuación 76 son exclusivas del bosque y 10 son
presentes con dos o más individuos en la requiere la evaluación de las derivadas para generalistas). De las especies que faltan
muestra, ésta puede considerarse ‘com- cada par de individuos. Una alternativa es en los fragmentos grandes, 11 son gene-
pleta’ en el sentido de que todas las espe- el uso de la estimación bootstrap de la ralistas y 8 exclusivas del bosque; mien-
cies están representadas y la estimación varianza. Comparando resultados entre am- tras que de las especies que faltan en los
de la cobertura muestral será 1 y no afec- bos procedimientos no se encontraron dife- fragmentos pequeños y sí fueron detecta-
tará la estimación. La diferencia con el rencias significativas, y en este trabajo se das en los grandes, 5 son generalistas y
estimador máximo verosímil (Ec. 5) resi- aplicó la segunda opción. 45 exclusivas del bosque. La probabili-
de en el denominador que corresponde al En el caso del ajuste dad de que en los fragmentos pequeños
ajuste basado en Horvitz-Thompson. empírico propuesto por Pla (2004), la falte una especie de bosque tiene un
d) Ajustado empíricamente (HA). Pro- construcción de los IC se basa en la riesgo 4.55 veces mayor a que falte una
puesto por Pla (2004) para muestras con desviación estándar bootstrap y sus lími- especie generalista.
frecuencias o abundancias totales ≤2000, tes se calculan como HA ± zα/2 sd* * Para comparar los sub-
se basa en la estimación del sesgo por siendo sd* * la desviación estándar grupos se aplicó la prueba no paramétrica
AUG 2006, VOL. 31 Nº 8 585

de Wilcoxon para muestras independien- pertenece a la especie ‘i’, el cuál puede o Resultados
tes, a no ser que se indique lo contrario. no ser incluido en la muestra según el re-
sultado del remuestreo aleatorio. Biodiversidad en la Base de Vegetación
Estimación por remuestreo En este trabajo se usó el
intervalo estándar por aproximación nor- Las estimaciones apli-
No es razonable supo- mal. Esta técnica se basa en suponer que cadas al ‘espinar’ se presentan en la Ta-
ner una distribución normal y tampoco existe una transformación monotónica del bla I. La variabilidad entre muestras de
conocida para el índice de Shannon, por estimador que llamaremos genéricamente una misma formación influye en el ta-
lo que no es posible aplicar métodos I con una distribución aproximadamente maño o amplitud (diferencia entre los
paramétricos de estimación por interva- normal con media μ y desviación están- límites) del intervalo de confianza para
los. La estimación por remuestreo del dar σ; y que por lo tanto hay una proba- toda la formación. Se ha evitado expre-
índice de Shannon se basa en la abun- bilidad de (1-α) que samente el término “promedio” al final
dancia de las especies observadas en una I + zα/2σI < I* < I + zI-α/2σI de la Tabla I, ya que en este caso no se
muestra y el único supuesto que debe trata de un promedio de los índices a
para toda muestra aleatoria usada en la
cumplirse es que la población de la cual nivel de la formación, sino del valor
estimación I* (Efron 1979).
provenga la muestra sea homogénea a la obtenido con el amalgamiento de la in-
Sobre esta base es posi-
escala de análisis seleccionada. Para formación de todas las muestras. La di-
ble estimar los límites del intervalo de
aplicar métodos de remuestreo se puede ferencia entre uno y otro procedimiento
confianza usando la estimación bootstrap
entonces asumir que la abundancia total al calcular un indicador y su intervalo
de la desviación estándar como
puede subdividirse en ‘porciones unita- ∗
de confianza, dependerá del plan de
rias’ cada una tan grande como el míni- ± zα/2σ1* muestreo utilizado para relevar la infor-
–∗
mo tamaño identificable (Pla, 2004), ex- siendo Ι la media del estimador boot- mación a campo.
presado en las unidades de abundancia strap del índice, σI* el estimador bootstrap Los intervalos utilizando
utilizadas (área basal, cobertura, bioma- de la desviación estándar y zα/2 el corres- el estimador máximo verosímil sin corregir
sa, frecuencia). pondiente valor de la distribución normal o corregido por r o rpot son comparativa-
Así, la abundancia de estándar. mente menores que aquellos corregidos por
cada especie se subdivide en ni porciones Detalles de éste y otros ACE. La amplitud del ajuste empírico pro-
unitarias que pueden ser remuestreadas. métodos de estimación de intervalos de puesta por Pla (2004) resulta en IC menos
Como la abundancia se expresa en la confianza pueden encontrarse por ejemplo amplios que la estimación de Horvitz-
misma escala para todas las especies, tan- en Efron y Tibshirani (1998). Para el cálcu- Thompson propuesta por Chao y Shen
to en la población como en la muestra (y lo de los índices y sus IC existe software (2003). Los valores excesivamente altos que
en las remuestras) podemos hacer una se- específico de acceso libre como por ejem- se registran para los intervalos corregidos
lección aleatoria de ‘porciones unitarias’ plo EstimateS (Colwell, 2005) o SPADE por ACE están asociados directamente a
caracterizadas por la especie que se regis- (Chao y Shen, 2003-2005). En el programa una estimación de la riqueza que discrepa
tra en ella. Estos son N objetos virtuales, InfoStat se ha desarrollado un módulo de altamente de la observada. Estos casos se
que se suponen mutuamente independien- aplicación que calcula éstos y otros índices presentan cuando predominan especies con
tes y que tienen la misma distribución de biodiversidad y sus IC (InfoStat, 2004). muy baja abundancia, como por ejemplo en
(no conocida) de probabilidad. Este valor Los cálculos en este trabajo se hicieron con el espinar identificado como e4, con 36 es-
de N es el que se toma en estos casos InfoStat y las simulaciones utilizando Re- pecies, donde la estimación de la riqueza
como ‘tamaño de la muestra’. El caso samplingStats (Simon, 2003) con rutinas por ACE fue de 739. El efecto en la co-
más simple es aquel dónde cada ‘porción desarrolladas especialmente que pueden ser rrección del estimador máximo verosímil
unitaria’ corresponde a un individuo que solicitadas a la autora. produce un aumento excesivo del límite su-
TABLA I
ESTIMADORES DE RIQUEZA Y DEL ÍNDICE DE SHANNON
EN LA FORMACIÓN ‘ESPINAR’
Muestra Riqueza Estimación puntual
Estimación por Intervalo (LI - LS)
r ACE rPOT MV MVr MVACE MVrPOT HA HT
e1 36 156 50 2,60 (2,36 - 2,85) 2,74 (2,49 - 2,98) 3,19 (2,75 - 4,98) 2,79 (2,04 - 3,54) 2,82 (2,58 - 3,06) 2,96 (2,72 - 3,20)
e2 13 36 17 1,65 (1,42 - 1,87) 1,71 (1,48 - 1,94) 1,84 (1,66 - 4,40) 1,73 (1,19 - 2,28) 1,74 (1,52 - 1,96) 1,84 (1,61 - 2,07)
e3 25 36 31 2,47 (2,33 - 2,61) 2,53 (2,39 - 2,67) 2,55 (2,49 - 2,82) 2,54 (2,07 - 3,00) 2,53 (2,40 - 2,67) 2,56 (2,43 - 2,70)
e4 36 739 52 2,63 (2,33 - 2,92) 2,81 (2,51 - 3,11) 6,51 (2,69 - 239,94)2,90 (2,01 - 3,79) 2,97 (2,67 - 3,26) 3,20 (2,88 - 3,52)
e5 22 45 28 2,31 (2,14 - 2,47) 2,37 (2,21 - 2,53) 2,44 (2,34 - 2,92) 2,39 (1,87 - 2,91) 2,40 (2,23 - 2,56) 2,45 (2,27 - 2,62)
e6 28 206 39 2,47 (2,23 - 2,71) 2,60 (2,36 - 2,84) 3,45 (2,50 - 41,28) 2,65 (1,91 - 3,39) 2,68 (2,44 - 2,92) 2,82 (2,56 - 3,08)
e7 20 73 27 1,90 (1,69 - 2,12) 1,97 (1,76 - 2,18) 2,16 (1,91 - 8,69) 1,99 (1,44 - 2,54) 2,01 (1,80 - 2,22) 2,11 (1,88 - 2,34)
e8 43 406 63 3,69 (3,47 - 3,91) 4,12 (3,90 - 4,34) 7,82 (5,74 - 12,03) 4,33 (3,03 - 5,62) 4,49 (4,30 - 4,68) 5,34 (4,80 - 5,88)
e9 29 136 41 2,02 (1,72 - 2,33) 2,14 (1,84 - 2,45) 2,60 (2,09 - 6,91) 2,19 (1,45 - 2,94) 2,24 (1,93 - 2,55) 2,45 (2,15 - 2,75)
e10 45 187 63 3,17 (2,95 - 3,39) 3,35 (3,14 - 3,57) 3,95 (3,52 - 4,91) 3,43 (2,56 - 4,30) 3,49 (3,27 - 3,71) 3,55 (3,30 - 3,80)
e11 42 353 61 2,64 (2,32 - 2,97) 2,84 (2,52 - 3,17) 4,34 (2,66 - 183,93)2,93 (2,01 - 3,86) 3,01 (2,68 - 3,34) 3,31 (2,98 - 3,63)
Total 113 192 143 3,28 (3,20 - 3,37) 3,32 (2,92 - 3,73) 3,35 (3,31 - 3,49) 3,33 (2,92 - 3,74) 3,33 (3,24 - 3,41) 3,39 (3,30 - 3,47)
r: número de especies observadas, ACE: estimador de Chao, rPOT: estimador de Pla et al. (2004), MV: estimación máximo verosímil del índice de Shannon, MVr:
MV con sesgo corregido por r; MVACE: MV con sesgo corregido por ACE; MVrPOT: MV con sesgo corregido por rpot, HA: estimador ajustado de Pla, HT: estima-
dor de Horvitz-Thompson, LI: límite inferior, LS: límite superior. Los intervalos de confianza se obtuvieron por bootstrap con B=500, salvo para MV y MVr
cuando se utilizó la Ec. 9 y MVACE cuando se utilizó la transformación logarítmica de la Ec. 10.
586 AUG 2006, VOL. 31 Nº 8

TABLA II tivas las diferencias entre las formacio-
INTERVALO DE CONFIANZA CON MÁS DE UNA MUESTRA nes secundarias y aquellas que les die-
POR FORMACIÓN ron origen.
La amplitud de los IC
Estimador Formación (n) Promedio Total
construidos a partir del promedio de los
LI - LS LI - LS
índices por muestra es entre 3 y 4 veces
MV Cardonal (8) 1,68 - 2,44 a 2,65 - 2,85 a mayor que la de aquellos calculados
Cardonal secundario (6) 2,10 - 2,58 a 2,84 - 3,01 a amalgamando la información de todas las
Espinar (11) 2,17 - 2,84 a 3,20 - 3,37 b muestras. La amplitud del intervalo por
Espinar deciduo (12) 2,40 - 2,80 a 3,23 - 3,36 b aproximación normal refleja la variabili-
HA Cardonal (8) 1,78 - 2,71 a 2,70 - 2,90 a dad aleatoria entre las muestras y la va-
Cardonal secundario (6) 2,20 - 2,71 a 2,88 - 3,04 a riabilidad dentro de muestras (la debida a
Espinar (11) 2,31 - 3,21 a 3,24 - 3,41 b la necesidad de estimar la abundancia re-
Espinar deciduo (12) 2,54 - 3,04 a 3,24 - 3,38 b lativa de cada especie). En el caso de las
HT Cardonal (8) 1,88 - 2,83 a 2,77 - 2,99 a muestras amalgamadas no existe variabili-
Cardonal secundario (6) 2,28 - 2,82 a 2,92 - 3,08 a dad entre muestras, y toda la variabilidad
Espinar (11) 2,41 - 3,52 a 3,30 - 3,47 b aleatoria está asociada a la estimación de
Espinar deciduo (12) 2,58 - 3,13 a 3,28 - 3,42 b la abundancia relativa de las especies. El
Ver referencias en Tabla I. n: número de muestras por formación de Beard. En cada conjunto de for- número de individuos incluidos en la
maciones, letras iguales identifican IC que se solapan. muestra amalgamada es siempre mayor
que el de cada muestra individual, permi-
perior, tornando no informativo al IC. Los el estimador máximo verosímil sin co- tiendo que la estimación de la proporción
resultados obtenidos para otras tres forma- rrección, el propuesto por Pla (2004) y por especie se base en una muestra más
ciones (resultados no mostrados) permiten el propuesto por Chao y Shen (2003), se grande (y por lo tanto más eficiente) de
generalizar estas conclusiones en relación al presentan en la Tabla II. Mientras que al la misma comunidad. No debe sorprender
comportamiento de los estimadores. utilizar el promedio por formación no se al investigador obtener esta diferencia de
Los intervalos de con- detectan diferencias significativas entre amplitudes.
fianza estimados para el promedio de los cardonales y espinares; al amalgamar las Muestras independientes
censos de cada formación y para el total muestras éstas se ponen de manifiesto. que constituyan repeticiones al azar pueden
amalgamado de la formación utilizando Sin embargo, siguen siendo no significa- ser tratadas en cualquiera de las dos for-
mas, mientras que muestras sistemáticas o
provenientes de un plan de muestreo no
aleatorio deberían ser amalgamadas a fin de
aprovechar la variabilidad observada en
campo para mejorar la estimación de la
abundancia relativa de cada especie, en lu-
gar de considerar un promedio. El uso del
error estándar (desvío del promedio: σ-x =
σ/√n) que podría tender a declarar signifi-
cativas diferencias atribuibles al azar, en
realidad produce IC más amplios por la fal-
ta de ‘cobertura muestral’. Por este motivo
la correcta construcción de los intervalos de
confianza contribuirá a que el investigador
efectivamente identifique aquellas diferen-
cias de interés, y sobre ellas concentre su
atención.
Estudios por simulación
de poblaciones con patrones de abundan-
cia de especies similares a los del ejem-
plo indican que la cobertura (probabilidad
de que el intervalo calculado con 95% de
confiabilidad efectivamente cubra el
parámetro) depende no solo del tamaño
de cada muestra y del número de mues-
tras que se promedien, sino también del
método de estimación utilizado. Acorde a
lo esperado, el estimador máximo verosí-
mil y el ajustado de Pla mejoran su esti-
mación tanto al aumentar el número de
individuos por muestra, como el número
de muestras tomadas en cada caso (Figu-
ra 2). Al contrario, el estimador de
Figura 2: Calidad de los estimadores del Índice de Shannon. Las barras indican el límite inferior, la media esti- Horvitz-Thompson si bien mejora la esti-
mada y el límite superior para cada caso identificado en las abscisas con “número de individuos por muestra : mación cuando se utiliza el promedio de
total de muestras”. La línea horizontal corresponde al parámetro a estimar. Resultados de 1000 simulaciones. varias muestras a medida que su número
AUG 2006, VOL. 31 Nº 8 587

aumenta, cuando las muestras se amalga- los promedios de riqueza y de abundan- medio de 18 especies y se estimó la ri-
man las estimaciones son menos con- cia suponiendo que las variables fueran queza con ACE en 28 y con rpot en 24.
fiables a medida que aumenta el número aproximadamente normales o que el nú- Sin embargo, si se amalgaman esas mis-
de individuos muestreados. Para cualquier mero de muestras fuese suficientemente mas muestras se encuentran 55 especies
situación la estimación máximo verosí- grande para justificar la aplicación del presentes con un valor estimado para
mil no es confiable, cuando se trata de teorema central del límite. En este caso ACE de 63 y para rpot de 65. El promedio
muestras amalgamadas la estimación las pruebas de falta de bondad de ajuste de las abundancias fue 34 individuos,
ajustada de Pla ofrece los intervalos más a la normal para la riqueza observada mientras que en la muestra amalgamada
informativos (menor amplitud) y cuando fueron no significativas (p=0,4932 y se totalizaron 271 individuos. Si se ex-
se trata de promedios de varias muestras p=0,7353) y para la abundancia también presa la riqueza en forma relativa al nú-
la mejor opción se logra al utilizar el (p=0,5608 y p=0,8192) en ambos tipos de mero de ejemplares (por ejemplo, expre-
método Horvitz-Thompson, que ofrece fragmentos. Las pruebas t de Student per- sada como número de especies por cada
intervalos más amplios pero con una co- miten concluir que no existieron diferen- 10 aves avistadas), se obtiene un valor de
bertura óptima. cias significativas del número de aves ob- 5,3 para el promedio y de 2,0 para la
El comportamiento observadas por muestra entre los fragmentos muestra amalgamada.
servado es esperable ya que la propuesta grandes y los pequeños (p=0,2431), Esta discrepancia es el
de Chao y Shen (2003) está definida pero que los primeros tienen significati- resultado de cómo se procesó la infor-
para situaciones donde el número de in- vamente mayor número de especies mación del muestreo para estimar tanto
dividuos es bajo y la capacidad de una (p=0,0017). El índice de Shannon se es- la riqueza como el índice de Shannon.
sola muestra de incluir una buena pro- timó usando Horvitz-Thompson ya que En el presente ejemplo se requieren en
porción de las especies es también baja. el número máximo de aves fue 55 en cada muestra aproximadamente 2 indi-
Así, al amalgamar muestras disminuye los fragmentos grandes y 46 en los pe- viduos para detectar una nueva especie,
su efectividad. En el caso de la estima- queños. Si se amalgaman las muestras mientras que en el total amalgamado se
ción ajustada por Pla (2004) la amplitud debe usarse HA. requieren 5; es decir que se debe tener
del intervalo se mantiene reducida; la Los fragmentos peque- al menos 2,5 muestras (5/2) para amal-
estimación puntual (centro del intervalo) ños (con una superficie promedio de gamar, a fin de obtener la misma efec-
corresponde al ajuste por el número de 67,36ha) que varían entre 3,45 y tividad. Pero cualquier incremento en el
especies presentes y la estimación 129,67ha no presentan diferencias de número de muestras amalgamadas re-
bootstrap del índice que reproduce la di- biodiversidad asociadas a su superficie sultará en una ganancia en la capacidad
ferencia entre población y muestra se (p=0,3279), como tampoco difieren en de detectar especies raras (o poco fre-
utiliza para corregir el sesgo de la esti- su abundancia (p=0,1291). Los fragmen- cuentes). Si disponemos de 8 muestras
mación puntual. tos grandes tienen sólo dos tamaños la ganancia debería ser significativa,
Cuando se poseen mues- (24060ha y 21879ha) y su riqueza pro- como efectivamente se observa al com-
tras independientes, la diferencia entre medio no difiere significativamente parar la potencia de ambos procedi-
los procedimientos de amalgamiento y (p=0,4696) como tampoco difiere la mientos. En la Figura 3 se muestra la
por promedio, también pueden ser apro- abundancia promedio (p=0,6452). Asi- capacidad de detectar cierto porcentaje
vechados por el investigador. Mientras mismo, la diferencia entre la abundancia de las especies (abscisas) en función de
que al utilizar el amalgamiento se obtie- promedio de los fragmentos grandes (30) la potencia (proporción de veces en que
ne información de la diversidad alfa (de y los pequeños (27) no es estadística- se alcanza dicho porcentaje). La mues-
un solo sistema considerado homogéneo mente significativa (p=0,2431), todo lo tra amalgamada es capaz de detectar
a la escala de análisis), el uso del pro- cuál permite comparar la biodiversidad con certeza (potencia 1) el 80% de las
medio de las muestras permite cambiar sobre la base de los índices (riqueza e ín- especies, mientras que para el promedio
la escala de observación al considerar la dice de Shannon) en muestras que pue- este porcentaje baja al 50%. Si bien el
variación dentro del sistema (diversidad den considerarse de tamaño homogéneo. amalgamiento no garantiza una estima-
beta) y asociar la biodiversidad con al- La pregunta que resta es si el tamaño fue ción no sesgada de riqueza, mejora
gún patrón del ambiente, ya que se dis- suficiente para ambos tipos de fragmen- considerablemente la inferencia utili-
pondría de una estimación para cada tos, solo para
muestra y una para el promedio. En la uno, o bien para
Figura 2 puede observarse, en especial ninguno.
para las muestras de hasta 60 individuos, Una opción
que el índice estimado por promedios es para encontrar es-
menor que el estimado con la muestra ta respuesta po-
amalgamada. Si el objetivo es estimar la demos obtenerla
diversidad alfa, el segundo procedimien- si amalgamamos
to corrige con mayor eficiencia el sesgo las muestras que
negativo de la estimación aunque siem- provienen del
pre se subestima el índice poblacional. mismo fragmento
y el mismo día, y
Biodiversidad en la Base de Aves comparamos los
resultados. En 8
Dado que el objetivo de sitios de muestreo
los investigadores es detectar posibles provenientes de
diferencias entre la riqueza y la abun- un mismo frag-
dancia de fragmentos grandes y peque- mento pequeño Figura 3: Eficiencia en el tratamiento de la información. Cada curva repre-
senta la potencia (proporción de veces de un total de 10000 simulaciones)
ños con fines de manejo del ecosistema, de 129,67ha se con que se detectó un porcentaje dado de especies, expresado como número
una primera aproximación es comparar calculó un pro- de especies detectadas en relación al total de la población.
588 AUG 2006, VOL. 31 Nº 8

TABLA III AGRADECIMIENTOS
BIODIVERSIDAD DE AVES EN FRAGMENTOS GRANDES Y PEQUEÑOS
DE LA ‘SELVA ATLÁNTICA’ AMALGAMANDO POR TAMAÑO La autora agradece a
Alejandro Giraudo por facilitar la base
Fragmentos (n) Riqueza Índice de Shannon
de datos de aves.
r ACE (LI - LS) HA (LI - LS)
grandes (53) 136 158 (152 - 167) 4,33 (4,28 - 4,38) REFERENCIAS
pequeños (41) 105 132 (125 - 142) 4,06 (4,00 - 4,12)
Chao A (1987) Estimation the population size
Ver referencias en Tabla I; n: número de muestras. for capture-recapture data with unequal
catchability. Biometrics 43: 783-791.
zando los estimadores ACE o rpot al dis- alto. Como alternativa, se sugiere el uso Chao A, Lee S-M (1992) Estimating the number
of classes via sample coverage. J. Am. Stat.
minuir el número de especies no inclui- de una transformación logarítmica que Assoc. 87: 210-217.
das en la muestra. resuelve la negatividad del límite infe-
Chao A, Shen T-J (2003) Nonparametric estima-
Así, al amalgamar todas rior, pero mantiene la amplitud del IC tion of Shannon’s index of diversity when
las muestras según el tipo de fragmento muy alta. Se pueden obtener estimacio- there are unseen species in sample. Env.
del que provengan se obtienen los resul- nes de la riqueza que discrepan en más Ecol. Stat. 10: 429-443.
tados que se muestran en la Tabla III. de un 2000% de la observada, en parti- Chao A, Shen TJ (2003-2005) Program SPADE
Los intervalos de confianza de ACE no cular cuando se trata de muestras con (Species Prediction And Diversity Estima-
se solapan, lo que mantiene la conclu- muchas especies muy poco abundantes. tion). Program and User’s Guide. http://
sión inicial de que los fragmentos gran- La propuesta de Pla chao.stat.nthu.edu.tw.
des tienen comparativamente mayor nú- (2004) permite la estimación por IC con Chao A, Hwang W-H, Chen Y-C, Kuo C-Y
mero de especies que los pequeños y límites ajustados y ofrece comportamien- (2000) Estimating the number of shared
species in two communities. Stat. Sinica
poseen una diversidad estimada por el to óptimo cuando se trata de muestras 10: 227-246.
índice de Shannon significativamente con d»2000 individuos, independiente-
Colwell RK (2005) EstimateS: Statistical esti-
mayor. mente de la abundancia de las especies, mation of species richness and shared spe-
mejorando la confiabilidad a medida que cies from samples Version 7.5. User’s Guide
Conclusiones aumenta el número de individuos en la and application. http://purl.oclc.org/esti-
muestra. Por ello es la opción recomen- mates.
El uso generalizado del dada cuando se pueden amalgamar Efron B (1979) Bootstrap methods: An other
índice de Shannon como una expresión sin- muestras. look to the Jacknife. Ann. Stat. 7: 1-26.
tética de la biodiversidad ha estimulado la La propuesta de Chao y Efron B, Tibshirani RJ (1998) An introduction
aparición de estimadores que corrigen el Shen (2003) ofrece IC más amplios pero to the bootstrap. 1 a reimpresión. CRC.
sesgo y mejoran la cuantificación de la va- su cobertura es óptima. Se lo recomien- Boca Ratón, FL, EEUU. 436 pp.
riabilidad aleatoria para permitir la cons- da para casos donde abundan las espe- Giraudo AR, Matteucci SD, Morello J, Alonso
trucción de intervalos de confianza. Hasta cies raras, ya sea para una muestra única J, Herrera J, Abramson RR (2005) Efectos
de la fragmentación sobre la riqueza y
la década pasada el estimador máximo ve- como para el promedio de varias mues- abundancia de aves en la Selva Atlántica de
rosímil constituyó la única opción y su uso tras. La desventaja de este estimador re- Argentina. Un análisis preliminar en
generalizado produjo con toda seguridad side en que a medida que aumenta el parches grandes y pequeños. XI Reunión
subestimaciones de los valores reportados número de individuos en la muestra, Argentina de Ornitología. Buenos Aires,
en la literatura. La aparición de alternativas desmejora la corrección por sesgo y, al Argentina. www.avesargentinas.org.ar/rao/
resumenes.htm
que mejoran la estimación puntual porque contrario de lo esperado, aumenta la am-
corrigen el sesgo negativo, como la de plitud del intervalo. Good IJ (1953) The population frequencies of
species and the estimation of population pa-
Chao y Shen (2003) o de Pla (2004), La cuantificación de la rameters. Biometrika 40: 237-264.
revitalizan la utilidad de este índice. biodiversidad será apreciada en tanto
Gotelli NJ, Colwell RK (2001) Quantifying
El estimador máximo pueda utilizarse con fines comparativos biodiversity: procedures and pitfalls in the
verosímil, aun corrigiendo con una esti- y por ello el énfasis está en la construc- measurement and comparison of species
mación mejorada de la riqueza, resulta ción de intervalos de confianza. La in- richness. Ecol. Lett. 4: 379-391.
en valores puntuales e IC más bajos que vestigación metodológica está en desa- Horvitz DG, Thompson DJ (1952) A generaliza-
cualquiera de las otras propuestas. La rrollo y los estudios que comparan tion of sampling without replacement from
revisión de la literatura y los resultados estimadores en diversas condiciones por a finite universe. J. Am. Stat. Assoc. 47:
de nuestra simulación nos hacen descar- métodos de simulación Monte Carlo se 1475-87.
tar su aplicación. Esta recomendación, han generalizado. La dependencia del Hutcheson K (1970) A test for comparing diver-
sin embargo, conlleva una dificultad para desempeño de los estimadores del patrón sities based on Shannon formula. J. Theor.
Biol. 29: 151–154.
comparar resultados anteriores ya publi- de distribución de la abundancia de las
cados con nuevas estimaciones, salvo especies, hoy ampliamente aceptada, es InfoStat (2004) InfoStat versión 1.5. Grupo
InfoStat, FCA, Universidad Nacional de
que se disponga de los datos originales. un obstáculo para la generalización des- Córdoba, Argentina. www.infostat.com.ar
En estos casos siempre podrán conside- contextuada.
rarse las dos opciones y utilizar la máxi- Por ello, una vez más Matteucci SD (1987) The vegetation of Falcón
State, Venezuela. Vegetatio 70: 67-91.
ma verosímil para comparaciones cuali- es posible afirmar que la colaboración
tativas. entre biólogos, ecólogos y biómetras Matteucci SD, Colma A, Pla L (1999a)
Biodiversidad vegetal en el árido falconiano
Cuando el estimador permitirá definir la mejor estrategia de (Venezuela). Interciencia 24: 300-307.
máximo verosímil del índice de Shannon análisis para casos particulares y aumen-
Matteucci SD, Colma A, Pla L (1999b)
se corrige usando ACE para estimar la tará el conocimiento sobre la biodiversi- Bosques secos tropicales del estado
riqueza el límite inferior del IC puede dad para manejar adecuada y sosteni- Falcón, Venezuela. En Matteucci SD,
ser negativo y el superior excesivamente blemente el ecosistema. Solbrig OT, Morello J, Halffter G (Eds.)
AUG 2006, VOL. 31 Nº 8 589

Biodiversidad y Uso de la Tierra. Peet RK (1974) The measurement of species di- Pla L, Balzarini M, DiRienzo JA (2004) The
Conceptos y ejemplos de Latinoamérica. versity. Ann. Rev. Ecol. Sistem. 5: 285-307. Assessment of Biodiversity: Inference about
Colección CEA-UBA Vol. 23. EUDEBA. Pla L (2004) Bootstrap Confidence Intervals for richness. XXII International Biometric Con-
Buenos Aires, Argentina. pp. 399-420. the Shannon Biodiversity Index: A Simulation ference, Cairns, Australia. pp. 134.
Matteucci SD, Colma A, Pla L (2001) Falcón Study. J. Agric. Biol. Env. Stat. 9: 42–56. Shannon CE, Weaver W (1949) The mathemati-
y sus recursos naturales: base electrónica Pla L, Matteucci SD (2001) Intervalos de cal theory of communication. University of
de información biofísica. UNEFM- confianza bootstrap del índice de Illinois Press. Urbana, IL, EEUU. 144 pp.
CONICIT. Coro, Venezuela. ISBN: 980- biodiversidad de Shannon. Rev. Fac. Agron. Simon JL (2003) Resampling Stats, version
858-7 (LUZ) 18: 222-234. 5.02. www.resample.com.
BIODIVERSITY: INFERENCE ABOUT RICHNESS AND SHANNON INDEX

Laura Pla
SUMMARY
Point estimators and confidence intervals for richness and and theoretical formulation conditions. A guide to proceed with
Shannon index are described and applied to a vegetation ex- emphasis on small real data set and bootstrap estimation is
ample and a bird inventory survey. Results of various tech- provided, including available software use orientation.
niques are compared based on original simulation performance
BIODIVERSIDADE: INFERÊNCIA BASEADA NO ÍNDICE DE SHANNON E A RIQUEZA

Laura Pla
RESUMO
Descrevem-se os estimadores pontuais e por intervalos de simulações originais e de considerações teóricas. Oferecem-se
confiança (IC) da riqueza e do índice de Shannon; se aplicam recomendações para a aplicação da técnica de reamostragem
a um exemplo com dados de vegetação e a outro com contagem adequada, com ênfase em casos de amostras pequenas ou sem
de aves, e se comparam aos resultados obtidos sobre a base de repetições. Orienta-se também no uso do software disponível.
590 AUG 2006, VOL. 31 Nº 8

Biodiversida Inferencia en El Indice de Shannon PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Biodiversida Inferencia en El Indice de Shannon PDF

Cargado por

Copyright:

Formatos disponibles

Interciencia

Disponible en: http://www.redalyc.org/articulo.oa?id=33911906

Cómo citar el artículo

PALABRAS CLAVE / Bootstrap / Diversidad Biológica / Intervalo de Confianza / Remuestreo /

Laura Pla. Magister Scientiarum en Estadística y Doctora en Ciencias Agrícolas, Universi-

AUG 2006, VOL. 31 Nº 8 0378-1844/06/08/000-07 $ 3. 00/0 583

584 AUG 2006, VOL. 31 Nº 8

AUG 2006, VOL. 31 Nº 8 585

586 AUG 2006, VOL. 31 Nº 8

AUG 2006, VOL. 31 Nº 8 587

588 AUG 2006, VOL. 31 Nº 8

AUG 2006, VOL. 31 Nº 8 589

BIODIVERSITY: INFERENCE ABOUT RICHNESS AND SHANNON INDEX

BIODIVERSIDADE: INFERÊNCIA BASEADA NO ÍNDICE DE SHANNON E A RIQUEZA

590 AUG 2006, VOL. 31 Nº 8

También podría gustarte