Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Paper Semana 1
Paper Semana 1
Paper Semana 1
BioOne sees sustainable scholarly publishing as an inherently collaborative enterprise connecting authors, nonprofit
publishers, academic institutions, research libraries, and research funders in the common goal of maximizing access to critical
research.
Ann. Zool. Fennici 46: 93–111 ISSN 0003-455X (print), ISSN 1797-2450 (online)
Helsinki 30 April 2009 © Finnish Zoological and Botanical Publishing Board 2009
Antony J. Underwood
Centre for Research on Ecological Impacts of Coastal Cities, Marine Ecology Laboratories A11,
University of Sydney, NSW 2006, Australia
Received 18 Feb. 2008, revised version received 8 Aug. 2008, accepted 27 Aug. 2008
Underwood, A. J. 2009: Components of design in ecological field experiments. — Ann. Zool. Fen-
nici 46: 93–111.
Retain H0 Reject H0
Las ideas preconcebidas que no se hacen Refute hypothesis Suppor thypothesis
and model and model
explícitas (en el contexto discutido aquí, se INTERPRETATION
hacen explícitas como posibles modelos) son
a menudo (probablemente siempre) peligrosas
DON’T END HERE
para sacar conclusiones sólidas. Cualquier
dato experimental sesgado o influenciado por Fig. 1. A framework for components of ecological field
expectativas previas no reconocidas no puede experiments. Note that experiments are at the end of a
permitir interpretaciones confiables. Asumir chain of thought processes and that there are no exits.
que ciertos procesos operan o no pueden See text for detailed explanation (from Underwood
simplificar cualquier estudio, pero las 1997).
consecuencias de tales suposiciones para
cualquier conclusión deben quedar claras. Por
ejemplo, si se supone que los patrones de Aquí se utiliza el siguiente marco (y se describe en
distribución de una especie actualmente detalle, con ejemplos en Underwood 1990, 1991).
observados están regulados por los procesos Como todo en ecología, cualquier intento de definir
operativos actuales, puede ocurrir todo tipo de los componentes de un experimento (o incluso ver
confusión. Puede haber efectos importantes la necesidad de experimentos) provoca
(estadísticamente y biológicamente) comentarios críticos. Esto probablemente es
importantes de procesos como la depredación saludable porque promueve el pensamiento y la
o la competencia. Estos pueden, de hecho, discusión. En lugar de tratar de lidiar con las
ser procesos importantes que mantienen una críticas en el espacio limitado disponible aquí,
distribución actual o abundancia de algunas sería mejor para los lectores examinar las
especies. Sin embargo, esto no es lo mismo metodologías alternativas que se proponen
que los procesos que causaron el patrón (aunque algunos críticos de los experimentos
actual en primer lugar. Las ideas nunca parecen producir una descripción detallada
preconcebidas de que solo los procesos de una metodología preferida). Luego, los lectores
actuales son importantes impedirán el diseño pueden decidir cómo proceder. Algunos temas
de experimentos que realmente discriminen centrales sobre el diseño experimental trascienden
entre un conjunto de posibles razones la mayoría de los métodos y son tan relevantes
perfectamente razonables para los patrones para los descriptores de la naturaleza y los
observados, porque muchos de estos modeladores como lo son para los
procesos nunca serán considerados. experimentadores.
a
Como un ejemplo específico de cómo es
probable la confusión a menos que todo esté
muy claro, considere los experimentos que
implican el trasplante de organismos para
probar hipótesis sobre procesos que influyen
en el crecimiento y el tamaño de los individuos.
Estos se han discutido en detalle en otra parte b
(Underwood et al. 2004).
Mean height
Las observaciones originales son que los
individuos maduros de una especie de hierba
son más altos en un hábitat (A), cerca de los
fondos de las colinas que los individuos en otro
hábitat (B), más arriba de las colinas. De
varias posibilidades, considere dos modelos
c
simples pero generales que podrían explicar
esta diferencia. Ambos incluyen la noción de
que las plantas alcanzan la madurez y dejan
de crecer más o menos a la misma edad en
los dos hábitats (para mantener los modelos
bajo consideración para este ejemplo lo más
simple posible). Por lo tanto, sus diferentes U D TL TP U D TL TP
tamaños son el resultado de un crecimiento Habitat A Habitat B
más rápido en el hábitat A. Los dos modelos Fig. 2. Observed and predicted patterns of mean (+
son entonces: SE) heights of plants in two habitats (A and B). — a:
Observed difference in height; — b and c: Predicted
I. los individuos en el hábitat A tienen heights in experimental transplants; U are undisturbed
un crecimiento intrínseco, genéticamente más plants remaining, untouched, in the original habitat; TP
rápido que los de B: la diferencia se debe a are transplanted to the other habitat. White originate
que las plantas son de dos tipos, cada una in habitat A, black in habitat B. D are disturbed (con-
asociada con un hábitat diferente; o trol) plants; TL are translocated (control) plants, as
explained in the text. b are hypotheses from the model
II. las plantas son intrínsecamente that growth/height differ because of intrinsic differences
(genéticamente) similares y la diferencia en el between plants from the two habitats. c are hypotheses
crecimiento se debe completamente a las from the model that growth/height are determined by
influencias ambientales (agua, suelo, the habitats themselves.
nutrientes, alteraciones, enfermedades, etc.)
que causan un crecimiento más rápido de los Estas hipótesis se ilustran en la Fig. 2. Por el
individuos que se encuentran en el hábitat A. momento ignore los otros tratamientos
experimentales (discutidos más adelante, vea
Por supuesto, hay todo tipo de otras la sección sobre controles).
posibilidades, incluidas las combinaciones Por el contrario, si el modelo (ii) es correcto y
de estos dos (por ejemplo, hay influencias los factores ambientales influyen en el
genéticas y ambientales que se combinan crecimiento y el tamaño, los juveniles
para crear las diferentes tasas de trasplantados del hábitat A a B ahora crecerán
crecimiento). El punto aquí es mantener el más lentamente que los que permanecen en A
ejemplo simple. y alcanzarán tamaños finales más cortos que
A partir del modelo (i), se puede proponer la coinciden con los individuos que permanecen
hipótesis de que los individuos muy jóvenes en B en todo momento. Por el contrario, los
del hábitat A trasplantados al hábitat B juveniles trasplantados de B a A ahora
continuarán creciendo tan rápido como los crecerán tan rápido como los que se originan
juveniles similares que quedan en A y, por lo en A y, por lo tanto, alcanzarán tamaños
tanto, alcanzarán tamaños maduros más maduros más altos que los que quedan en B.
altos (como los de A) que los juveniles (Estas hipótesis se muestran como
similares en B. Por el contrario, los tratamientos U y TP en la figura 2c).
individuos pequeños y jóvenes trasplantados
de B a A crecerán más lentamente y Hacer que las hipótesis sean lo más explícitas
alcanzarán tamaños finales más pequeños posible (y, cuando sea posible, indicando con
que los de A (y serán como los que quedan precisión qué datos cada uno predice) aclara
en B). las expectativas de los resultados de los
experimentos y ayuda en gran medida a la
interpretación de los resultados en relación con
los modelos contrastados.
100 Underwood • ANN. ZOOL. FENNICI Vol. 46
Las hipótesis explícitas en este caso también Por lo tanto, la diferencia entre los tratamientos
son extremadamente importantes porque hay experimentales U y TP depende de si los
opciones de cómo se pueden analizar los individuos provienen de A o B (es decir,
datos. Sin preocuparse por los detalles, los depende de su origen). Esto es sencillo y los
datos aquí podrían analizarse mediante dos resultados diferentes son fáciles de
modelado lineal general o análisis de varianza identificar y asociar con los dos modelos
(O’Hara 2009). Puede elegir distinguir entre diferentes.
los dos conjuntos de hipótesis (de los dos Por el contrario, si los datos se analizan según
modelos que se están discutiendo) para dónde terminaron las plantas (sus destinos), los
analizar los datos considerando su origen o su patrones esperados en los análisis son bastante
destino final. Los dos modelos predicen diferentes (como se muestra en la Tabla 1b).
patrones muy diferentes en los datos (como en Ahora, si el modelo (i) es correcto y las
la Fig. 2b versus 2c), pero también patrones diferencias se deben a si las plantas provienen
diferentes en los análisis por origen o por originalmente del hábitat A o B, habrá una
destino (Tabla 1). interacción entre el destino del factor (es decir,
Si el análisis es por origen, hay dos factores todas las plantas cultivadas en A versus todas
experimentales. "Origen" contrasta todas las las plantas cultivadas en B) y los tratamientos.
plantas del hábitat A con todas las plantas de Las plantas tomadas de A a B (TP blanco en la
B, donde sea que hayan terminado en el Fig. 2b) ahora crecerán más rápidamente que
experimento (por lo que compara los datos en las que quedan en B (U negro en la Fig. 2b),
columnas blancas con las de columnas pero los trasplantes de B a A (TP negro en la
sombreadas). El segundo factor es el Fig. 2c) crecer más lentamente que los que
"tratamiento experimental" que contrasta las quedan en el hábitat A (U blanca en la Fig. 2c).
plantas no perturbadas (aquellas en su hábitat Claramente, la diferencia entre los tratamientos
original; U en la figura 2b o 2c) con individuos U y TP depende del hábitat en el que crecieron
trasplantados (TP en la figura 2b o 2c). Como las plantas.
se muestra en la Tabla 1, si el modelo (i) es
correcto, dicho análisis revelará una diferencia Si el modelo (ii) es correcto, ahora no habrá
significativa entre los orígenes porque todos interacción. Debido a que el crecimiento y el
los individuos de A crecerán a tasas similares tamaño final están determinados por el
y más rápido que los de B, en cualquier hábitat hábitat, todas las plantas en los tratamientos
en el que se encuentren. En contraste (como U y TP en el Hábitat A (es decir, U blanco y
en la Tabla 1b), si el modelo (ii) es correcto, TP negro en la Fig. 2c) crecerán rápidamente
habrá una interacción estadística (Origen x y todas las plantas en los tratamientos U y TP
Tratamiento) porque los individuos (U negro, blanco TP en la Fig. 2c) crecerá
trasplantados de A a B ahora crecen más lentamente. No hay diferencia entre los
lentamente que los individuos no perturbados tratamientos, una diferencia importante entre
del mismo origen (es decir, A; U en la Fig. 2c), los hábitats de destino y ninguna interacción
pero los trasplantes de B a A crecerán más (Tabla 1b).
rápidamente que los individuos no perturbados
del mismo origen.
Table 1. Illustration of analyses of experimental transplants (see also Fig. 2). “Origin” indicates whether experimen-
tal plants come from habitat A (white columns in Fig. 2) or habitat B (black in Fig. 2). “Destination” indicates whether
plants grew in habitat A or in habitat B. Experimental treatments are U, or undisturbed (i.e. remaining in the original
habitat or not being moved to the destination habitat) and TP, or transplanted (from the original to the destination
habitat). * indicates components of analyses expected to be large under different hypotheses. For detailed explana-
tion, see text.
Tenga en cuenta que este experimento está Pero la dispersión es variable (las distancias
muy simplificado (hay otros modelos y otros recorridas y las velocidades de movimiento
tratamientos, controles D y TL en la Fig. 2). varían debido a la variación genética y
Sin embargo, ilustra que solo siendo muy ambiental), por lo que los números que llegan,
claro acerca de las hipótesis será posible los tiempos de llegada, etc., son variables.
tener claridad sobre los análisis e Finalmente, incluso si la propiedad biológica no
interpretaciones con respecto a los diferentes fuera variable, puede haber una variación
modelos sobre procesos ecológicos. considerable en su medición, como resultado
de los métodos utilizados. Entonces, por
Algunos problemas en el diseño ejemplo, puede haber una concentración
experimental constante de clorofila por gramo de tejido en
una especie de planta, pero medir la clorofila y
Estimando la variación apropiada: el peso están sujetos a errores en los métodos
y equipos utilizados.
Independientemente del marco de análisis Por lo tanto, un tema muy importante es
que se vaya a utilizar (incluidas las pruebas identificar el error apropiado para medir, de
de hipótesis, los métodos bayesianos, las modo que los resultados puedan compararse
razones de probabilidad, el modelado), no se de manera confiable.
hará ninguna inferencia sensible a partir de
datos que sean inapropiados. El problema Un caso simple es una comparación del número
más común es diseñar el muestreo o la de peces en áreas de pastos marinos donde hay
experimentación para incluir la replicación, de manglares adyacentes con aquellos en pastos
modo que las estimaciones de los parámetros marinos sin manglares adyacentes. Las
de las muestras se puedan comparar con la observaciones fueron que el número de peces
variación natural y de muestreo adecuada. varía de un área de pastos marinos a otra y se ha
Una de las mejores discusiones sobre este propuesto que una contribución importante a esta
tema para los ecologistas es Hurlbert (1984). variación es la presencia o ausencia de manglares
A pesar de los recientes intentos de pretender que proporcionan nutrientes para este pez (por
que la noción de replicación es innecesaria ejemplo, Pittman et al. 2004, Skilleter et al. 2005).
(Oksanen 2001), Hurlbert (1984, 2004) tiene La hipótesis a ser probada es que el número de
razón sobre la necesidad de medir la peces será, en promedio, mayor en pastos
variación. marinos con manglares adyacentes que en pastos
marinos sin ellos. La hipótesis nula es que no
De hecho, hay dos cuestiones diferentes: la habrá diferencia, en promedio, entre estos dos
replicación para medir la variabilidad y hábitats, o que, de hecho, habrá más peces donde
garantizar que no se confundan las no haya manglares. Tenga en cuenta que esta
conclusiones. El primero es sencillo. Cada habría sido una propuesta de 2 colas si el modelo
característica ecológica que debe medirse (el alternativo también se considerara que los peces
número de especies en áreas de bosque, el pasan más tiempo en los manglares y, por lo
tamaño de las ranas en un área de estudio, la tanto, serían menos abundantes en los pastos
tasa de alimentación o movimiento, etc., etc.) marinos cerca de los manglares. Suponga que
es intrínsecamente variable. Esto ocurre algunas redes apropiadas pueden tomar muestras
debido a la variación genética entre los de peces de manera confiable y que se decide
organismos, por lo que varían tomar muestras de 10 áreas de pastos marinos
intrínsecamente en las tasas de alimentación, con y 10 áreas sin manglares. Ignore por ahora
digestión, procesamiento de energía, etc. y, cómo se eligen estas 20 áreas para muestrear y
por lo tanto, varían en la tasa de crecimiento, suponga que todas se muestrean de forma
tamaño final, velocidad de movimiento, etc. independiente (lo que probablemente significa que
Incluso si no hubiera variabilidad intrínseca, el están bien espaciadas, de modo que los números
hábitat y el medio ambiente no son en cualquier área no están correlacionados con los
constantes en el tiempo y el espacio. Como de áreas adyacentes). Sin embargo, no es realista
resultado, las personas en diferentes lugares suponer que un área particular puede muestrearse
encuentran alimentos de diferente calidad, en bien con una red. En otras palabras, si se usaran
diferentes cantidades y tienen diferentes varias redes en cualquier área, el número de
cantidades de tiempo para alimentarse. peces sería diferente de una red a otra. Entonces,
Incluso si un tramo de hábitat fuera de alguna 6 redes están dispersas en cada una de las 20
manera constante, muchos animales y áreas.
plantas solo pueden ocuparlo como resultado
de procesos de dispersión (como juveniles o
adultos).
102 Underwood • ANN. ZOOL. FENNICI Vol. 46
Ahora hay dos tipos o escalas de replicación, La hipótesis nula es que el número promedio
red a red en cualquier área y área a área en de peces difiere entre los dos tipos de hábitat
cada tipo de hábitat. La variación de red a red en una cantidad consistente con la variación
es la variabilidad natural de un lugar a otro natural entre áreas del mismo tipo.
dentro de un parche de hábitat. La variación de
área a área estima las diferencias entre Para determinar cuánta variación en el número
parches del mismo tipo de hábitat. Es esta medio de peces se esperaría de un área a otra,
variabilidad la que debe examinarse en se requiere la replicación de áreas de cada tipo.
cualquier prueba de diferencias entre los dos Por lo tanto, hay tres diferencias potenciales: (i)
tipos de hábitat. La razón de esto es entre áreas con y áreas sin manglares (según lo
extremadamente simple (Hurlbert 1984), a predicho por la hipótesis, pero ausente bajo la
pesar de que muchos ecologistas la han hipótesis nula); (ii) de área a área con
pasado por alto. Si calcula el número promedio manglares y de área a área sin manglares
de peces en las 6 redes en un área de pastos (debido a las diferencias de área a área en
marinos sin manglares (llámelo A1–), es una varios procesos ecológicos); (iii) de red a red en
estimación del número promedio de peces por cada área (debido a la variación espacial en el
red en toda el área. La estimación equivalente número de peces en cada área y debido a un
para un área de pastos marinos con manglares error de muestreo porque cada red puede tener
(A1 +) es el promedio de las 6 redes en esa diferente eficiencia o efectividad). Para probar la
área. Sin embargo, se espera que estos dos hipótesis estadísticamente y estimar qué tan
promedios no sean los mismos debido a la grande es la diferencia entre los tipos de
variación natural en el número de peces de un hábitats (para determinar si parece lo
área a otra, independientemente de la suficientemente grande como para ser
influencia de los manglares. El número ecológicamente importante) se requiere que (i)
promedio de peces en áreas sin manglares sea mayor que (ii). La tercera diferencia es
diferirá debido a la variabilidad de un área a irrelevante para este procedimiento.
otra en todo tipo de procesos ecológicos. Una forma alternativa de entender esto es notar
Habrá una variación similar entre áreas con que la comparación de los dos tipos de hábitat
manglares. Además, incluso si el número (para probar la hipótesis) podría hacerse
promedio real de peces en cada una de las dos usando el número promedio de peces en cada
áreas es realmente idéntico, existe un error de área, es decir, promediando el número de
muestreo: el promedio medido al muestrear 6 peces de las 6 redes en cada área . Entonces,
redes no es exactamente el promedio solo hay dos tipos de diferencias: (i) y (ii) arriba.
verdadero. El promedio muestreado se ve Ambas incluyen la variación de red a red ((iii)
afectado por la cantidad de redes que se usan arriba) porque ambas son muestras de redes (y
(cuantas más redes, más cerca estará la ver Winer et al. 1991, Underwood 1997 para
estimación muestreada, en promedio, del una discusión de cómo y por qué las diferentes
número real) y cómo los números de peces diferencias se combinan en las muestras).
varían en un área (la variación en los números).
Luego, una prueba apropiada compara la
Entonces, la hipótesis que se está probando diferencia entre los dos tipos de áreas (es
es que el número promedio de peces en decir, áreas con manglares menos áreas sin
áreas de pastos marinos con manglares es manglares) con las diferencias entre las áreas
mayor que el número promedio en áreas sin replicadas del mismo tipo. Si el primero es
manglares y la diferencia es mayor de lo que grande en relación con el segundo (y, en las
se esperaría entre cualquier área de pastos pruebas estadísticas, si el primero es lo
marinos del mismo tipo, cada una suficientemente grande en relación con el
muestreado con 6 redes. En otras palabras, último que es poco probable dada la
las áreas de pastos marinos con o sin variabilidad entre las áreas), se rechaza la
manglares tendrán diferentes números hipótesis nula. Esto generalmente se
promedio de peces simplemente porque son interpreta como que significa que la hipótesis
áreas diferentes. Si los manglares ejercen o es apoyada y que la presencia de manglares
están asociados con alguna diferencia, debe se asocia con más peces en áreas
haber una diferencia sistemática y mayor adyacentes de pastos marinos.
entre los dos hábitats que la que se produce
debido a la variabilidad espacial en el
número de peces de un área a otra. La
hipótesis nula relevante no es entonces que
los dos tipos de hábitat son iguales, porque
nadie espera que lo sean.
ANN. ZOOL. FENNICI Vol. 46 • Components of design in ecological field experiments 103
Permitir interpretaciones lógicamente Una vez que se han elegido los procedimientos
coherentes de los resultados de las estadísticos, es necesario saber cuál es la
manipulaciones experimentales requiere que distribución del estadístico de prueba si la
la confusión debido a los artefactos de los hipótesis nula fuera cierta. En otras palabras, si
procedimientos y tratamientos no confunda la hipótesis nula fuera cierta y hubiera muchas
los resultados. Por lo tanto, los controles repeticiones del experimento, cada una
cuidadosamente construidos son necesarios. generaría datos y, por lo tanto, proporcionaría
Como punto final sobre este tema, algunos una estadística de prueba calculada. La
ecologistas (por ejemplo, Connell 1974, distribución de frecuencia de estas estadísticas
Diamond 1986) hacen distinciones entre los de prueba es su distribución cuando la hipótesis
experimentos realizados en el campo y en el nula es verdadera (porque era verdadera para
laboratorio. Indican que estos últimos se cada experimento). Si la distribución del
controlan más cuidadosamente, controlando estadístico de prueba puede ser conocida o
las influencias no deseadas (temperatura, asumida, no es necesario considerar
humedad, luz, etc.). La distinción es en gran numerosas repeticiones del experimento y el
medida ilusoria. Lo que los laboratorios (o los valor observado del estadístico de prueba
mesocosmos o cualquier otro hábitat artificial) (usando su experimento único) puede
permiten es una mejor regulación de la compararse con la distribución de frecuencia del
variabilidad de tales influencias, en estadístico si el La hipótesis nula era cierta.
comparación con lo que es posible en el
Por lo tanto, generalmente es necesario hacer
campo (Campbell et al. 2009). Por lo tanto, las
suposiciones sobre los datos (algunos de los
variaciones en los niveles de los factores
cuales se pueden probar utilizando los datos
ambientales pueden reducirse mucho en los
experimentales), para suponer que el estadístico
entornos regulados de los laboratorios. Por lo
de prueba tiene la distribución de frecuencia
general, no es cero (por ejemplo, hay
particular que se supone que se aplica. No hay
inevitablemente variaciones temporales de
espacio aquí para considerar este tema en detalle
temperatura en incubadoras con temperatura
(obtenga ayuda de los estadísticos). Como
controlada), sino pequeñas. Todavía es
ejemplo, sin embargo, la prueba t de Student se
importante contar con tratamientos adecuados
usa ampliamente en análisis ecológicos, porque
de replicación y control para garantizar que
es versátil y porque los datos biológicos a menudo
estos factores no confundan las
se ajustan bien a sus supuestos. Un uso común
interpretaciones de los experimentos.
es comparar dos medias muestreadas (como en el
Análisis e interpretaciones. ejemplo anterior sobre peces en diferentes áreas
de pastos marinos). Los supuestos que sustentan
Debido a que las medidas ecológicas son el uso de una prueba t son que los datos de cada
variables, los datos generalmente requieren muestra se muestrean de forma independiente,
análisis estadísticos. Estos imponen que las muestras de los dos hábitats (más versus
consideraciones sobre los supuestos menos manglares adyacentes) se distribuyen
necesarios para las pruebas, además de aproximadamente de manera normal (es decir, el
todas las advertencias sobre la lógica y el número promedio de peces en muchas áreas). de
mantenimiento de la coherencia de los los dos tipos de hábitats se distribuyen con una
procedimientos que conducen a los forma particular de distribución de frecuencia,
experimentos. Aquí, se consideran las llamada distribución normal; ver cualquier texto
pruebas frecuentistas, debido a la preferencia estadístico para más detalles, por ejemplo, Sokal
personal y a los problemas conceptuales y Rohlf 1981, Winer et al.1991, Quinn y Keough
sobre la construcción de probabilidades 2002). Finalmente, también se supone que las
previas para los procedimientos bayesianos distribuciones de las medias de muestra en los
(ver particularmente Dennis 1996, Mayo dos tipos de hábitat tienen las mismas variaciones
1996). Si se favorecen los análisis (es decir, están dispersas de forma variable en la
bayesianos (ver por ejemplo Ellison 1996 y misma medida en cada tipo de hábitat). Muchos
Läärä 2009 para argumentos a favor de datos biológicos y ecológicos tienen medios de
estos), diferentes consideraciones requerirán muestra que se ajustan razonablemente a las
atención. distribuciones normales. Si los datos no lo hacen,
Las pruebas estadísticas requieren algún tal vez sea posible transformar los datos a alguna
modelo sobre la naturaleza de los datos. En otra escala de medición en la que se distribuyan
principio, se debe calcular una prueba aproximadamente de manera normal (ver, por
relevante y apropiada a partir de los datos. La ejemplo, Tukey 1957, Box & Cox 1964, Legendre
elección de la estadística adecuada puede & Gallagher 2001).
ser compleja y se recomienda a los
ecologistas consultar con los estadísticos
antes de considerar el diseño experimental
final que se utilizará.
ANN. ZOOL. FENNICI Vol. 46 • Components of design in ecological field experiments 105
Se pueden realizar pruebas preliminares en los la cuestión central es ¿cuán improbable debería
datos para determinar si las variaciones son ser el estadístico de prueba para que la
suficientemente similares. El cuidado con el conclusión sea rechazar la hipótesis nula?
muestreo puede ayudar a garantizar que los En otras palabras, cualquier resultado puede
datos sean independientes (ver discusión en ocurrir, pero algunos son poco probables si una
Underwood 1997). hipótesis nula es una descripción correcta de
Tenga en cuenta que este tipo de suposiciones los eventos. Si una hipótesis nula fuera cierta,
no son exclusivas de las pruebas t. El orden de algunos resultados (en términos de datos
rango equivalente o la llamada prueba no observados) son bastante probables. Otros son
paramétrica, a veces llamada prueba "sin relativamente improbables y otros son muy
distribución", es la prueba de Mann Whitney improbables. Lo que cualquier experimentador
(Hollander & Wolfe 1973, Siegel 1953). El uso consideraría tan improbable que sería más
de esta prueba también supone que los datos realista rechazar la hipótesis nula es una
se muestrean independientemente y que las cuestión de elección individual. Esto se
distribuciones de los números medios de considera a continuación.
peces en los dos hábitats tienen la misma Aquí, tenga en cuenta que los supuestos del
varianza. No requiere que los datos se procedimiento estadístico a menudo requieren
distribuyan normalmente, pero sí requiere que que se recopilen datos de formas particulares,
las distribuciones de datos sean generalmente por lo que el muestreo para un experimento
similares, excepto por sus medios (que serán puede tener que diseñarse cuidadosamente
similares si la hipótesis nula es verdadera y no para garantizar que se cumplan los supuestos.
si la hipótesis es correcta). En el ejemplo anterior de una prueba t, el
Si los datos generalmente se ajustan a los muestreo debe diseñarse para garantizar que
requisitos de la prueba, el estadístico de los datos en cada área de pastos marinos
prueba calculado a partir de los datos se muestreados sean independientes.
puede comparar con la distribución de
frecuencia del estadístico de prueba si la Diseño y análisis
hipótesis nula fuera cierta. Esto permite
determinar la probabilidad de obtener el valor Obviamente, no hay espacio aquí para
observado del estadístico de prueba si la considerar mucho sobre la forma en que se
hipótesis nula fuera cierta. Si esa probabilidad deben analizar los datos y cómo se deben llegar
es grande, la razón más probable es que la a conclusiones. Debe quedar claro que
hipótesis nula es verdadera, es decir, los datos organizar el marco y la configuración del
experimentales no dan ninguna razón para experimento, con el debido cuidado de sus
considerar que la hipótesis nula es incorrecta, requisitos lógicos, hará que estas tareas sean
porque los resultados son consistentes con lo más simples y, en general, más confiables.
que se espera de los experimentos donde la Suponiendo que se haya tomado el debido
nula La hipótesis es correcta. Si esa cuidado, debería ser sencillo asegurarse de que
probabilidad es pequeña, se interpreta que los procedimientos experimentales estén en las
dicho resultado es improbable (improbable) si escalas apropiadas de espacio y tiempo para
la hipótesis nula es verdadera y, por lo tanto, la que coincidan con las observaciones originales
prueba rechaza la hipótesis nula (porque es y los procesos que se proponen para
poco probable que haya conducido a ese explicarlas. Por lo tanto, si se ha observado que
resultado) a favor de la hipótesis (la única las densidades de los escarabajos varían en
alternativa, dada la forma en que se escalas espaciales de 10s de metros, es
construyen las hipótesis y las hipótesis nulas, improbable que los experimentos a escalas más
ver más arriba). pequeñas prueben hipótesis relevantes. La
variación, o la falta de ella, entre parcelas
Se ha planteado una discusión considerable experimentales en escalas de 10s de cm de
sobre la lógica de tales procedimientos de separación no sería una evaluación muy
toma de decisiones. Al igual que con todos convincente de algún supuesto modelo
los demás marcos sobre procedimientos explicativo. Si las observaciones se refieren a
estadísticos, deben hacerse elecciones, los patrones de dispersión de animales
antes de realizar el experimento y, por lo juveniles justo después de la reproducción en
tanto, antes de que se hayan recopilado los primavera, las hipótesis de prueba sobre los
datos, sobre cómo llegar a una conclusión. procesos que afectan la dispersión en otoño no
Para las pruebas frecuentas (aquellas que son evidentemente relevantes.
usan una distribución de frecuencia del
estadístico de prueba) del tipo descrito
anteriormente,
106 Underwood • ANN. ZOOL. FENNICI Vol. 46
También es necesario, como se discutió
brevemente anteriormente, tener mucho cuidado Aunque casi siempre se consideran con
con los controles que son necesarios en cualquier respecto a los procedimientos estadísticos
manipulación experimental. Al igual que con las frecuentas, en el contexto de lo que se
escalas anteriores, se trata de tratar de denomina análisis de potencia (Cohen 1977,
comprender la biología / ecología relevante de los Winer et al. 1991, Underwood 1997, Ford
organismos, hábitats y procesos que se investigan. 2009), son mucho más generales. En
Sin embargo, existen otras preocupaciones muchos sentidos, reflejan el sentido común,
relacionadas con la cantidad de replicación de los que es algún tipo de criterio que puede ser
procedimientos experimentales y de control que es útil o no. En este caso, parece ser, porque
necesaria para poder llegar a conclusiones el sentido común produce las mismas
confiables. Esto puede pensarse mejor en conclusiones que los análisis matemáticos.
términos de procedimientos frecuentistas, pero Los puntos son que si una hipótesis, como
elementos importantes son igualmente necesarios es generalmente el caso, predice que cierta
para otras formas de tratar los datos. Siempre que cantidad es de diferente magnitud bajo
se muestrean medidas ecológicas, los datos se diferentes condiciones experimentales
utilizan para estimar los valores verdaderos de la controladas, es más probable que la
medida. No se pueden conocer los valores diferencia se vea en los datos
verdaderos, ya que eso requeriría realizar experimentales si:
mediciones de cada posible unidad relevante en I. las medidas se realizan en más, en
estudio. Por ejemplo, si alguna hipótesis predice lugar de menos, unidades experimentales
que las plantas crecen más rápidamente en (es decir, las muestras son grandes);
algunas condiciones que en otras, el crecimiento II. la variabilidad intrínseca en las
de las plantas en cada una de estas condiciones medidas de una unidad experimental a otra
debe medirse o la hipótesis no puede ser probada. (es decir, la varianza de las medidas que se
Pero las mediciones solo se realizan en las realizan) es relativamente pequeña; y
relativamente pocas plantas en el experimento, no III. La (s) diferencia (s) predicha (s)
en todas las plantas posibles a las que podría entre (entre) los tratamientos son
aplicarse la hipótesis. El crecimiento de las plantas relativamente grandes (estas diferencias a
varía de un individuo a otro, por lo que el promedio menudo se denominan "tamaño del efecto").
o rango de mediciones no será el mismo que el Obviamente, considerando (iii) primero, si
promedio real o el rango sobre el cual se hacen predice que la diferencia en la densidad de
las predicciones. los animales entre dos hábitats construidos
Para los procedimientos estadísticos que utilizan experimentalmente será de
pruebas frecuentas (la prueba familiar x^2, t-test, aproximadamente 10 individuos por m2,
análisis de varianza, etc.), se puede medir la tiene menos posibilidades de detectarlo que
medida en que las medidas realizadas en el si predice que son 50 individuos por m2.
experimento son precisas (es decir, cercanas al Dependiendo de la variabilidad intrínseca de
valor verdadero desconocido). los datos se ajustan las densidades de un lugar a otro y de la
a los supuestos de los procedimientos estadísticos precisión de las muestras, una diferencia de
utilizados para medir la precisión (como se 10 podría no ser importante debido a la falta
mencionó anteriormente, todos los procedimientos de claridad de las medidas en cada hábitat.
estadísticos imponen supuestos). Por lo tanto, las Una diferencia de 50 también puede ser
descripciones detalladas de los datos de las difícil de discernir, pero es más grande y,
muestras medidas en cada tratamiento por lo tanto, es más probable que sea
experimental deben incluir no solo las medidas detectable contra la variación de fondo.
muestreadas (sus medias, medianas, rangos,
distribuciones de frecuencia, variaciones, etc., Los otros dos puntos [(i) y (ii) anteriores]
según lo requerido por las hipótesis), sino también están claramente relacionados con el
indicaciones de sus precisión (Läärä 2009). Esto a mismo tema. Si las medidas que se
menudo se realiza proporcionando estimaciones realizan son intrínsecamente muy
de varianza, desviación estándar, error estándar o variables (existe una gran variación entre
sus alternativas. Para experimentos complejos, el las réplicas), habrá mucha imprecisión y
cálculo de estos puede ser complejo (ver las diferencias entre los tratamientos serán
discusión en Quinn y Keough 2002). borrosas [como en (ii)]. Si las muestras
son pequeñas, las medidas que se
La discusión sobre la imprecisión, debido a la estiman son más imprecisas que cuando
variación intrínseca en las cosas que se miden se toman las mismas medidas con
y porque el muestreo inevitablemente no muestras más grandes [punto (i) anterior].
permite el cálculo de las cantidades reales, ha
llevado a algunos principios generales que
ayudan a diseñar experimentos.
ANN. ZOOL. FENNICI Vol. 46 • Components of design in ecological field experiments 107
Por lo tanto, el diseño de experimentos incluye Si, como suele ser el caso, los recursos para
ser muy cuidadoso acerca de cuántas réplicas hacer el experimento son muy limitados, tener
de medidas son apropiadas. En general, cuanto el número mínimo de 2 réplicas crea solo 12
más pueda permitirse o pueda manejar df. Usar todos los esfuerzos para obtener 3
logísticamente, mejores serán los resultados réplicas (24 df) sería una mejora muy
experimentales. El diseño también debe tomar sustancial.
nota de la variación intrínseca en las medidas. El número apropiado de réplicas es un tema
Cuando esto es grande, generalmente es grande e importante. En muchos casos,
necesario tener más medidas replicadas que aumentar la replicación para hacer grandes
donde es pequeño (ver Winer et al. 1991, experimentos no es la mejor estrategia, en
Cohen 1977). comparación con hacer varios experimentos
Aquí no hay espacio para considerar detalles pequeños y combinar los resultados (quizás en
sobre cómo determinar un tamaño apropiado de un metanálisis; ver Gurevitch et al. 1992). La
experimento (es decir, cómo determinar un referencia a las discusiones sobre este tema
número apropiado de réplicas). Recuerde que ayudará (por ejemplo, Cohen 1977,
las unidades de estudio correctas deben ser Underwood 1997).
replicadas (vea la consideración previa sobre
parches de pastos marinos, en lugar de que las También vale la pena recordar que demasiada
redes individuales sean los componentes introspección sobre el diseño de experimentos
correctos del experimento para replicar). En generalmente resulta en que son demasiado
general, sin embargo, cualquier prueba que difíciles de hacer. Suponga que las
tenga más de aproximadamente 30 grados de observaciones originales se hicieron sobre
libertad (df) asociada con las estadísticas patrones encontrados a partir de pocas
utilizadas será grande. Lo que esto significa en medidas replicadas. Luego se hacen modelos
la práctica es que tener suficientes réplicas para sobre los procesos que causan los patrones
alcanzar 30 df será casi tan probable que observados y se construyen patrones
rechace una hipótesis nula incorrecta como un predichos para los datos que se recopilarán
experimento con más réplicas (y, por lo tanto, del experimento. Si algún modelo o
más df). Como ejemplo, considere un combinación de modelos realmente causa el
experimento para probar la hipótesis de que patrón observado, es probable que aparezca
eliminar a los depredadores aumentará el en el experimento, incluso si solo se usan
número de especies de presas en cada uno de pocas réplicas. Por lo tanto, el patrón es
los dos tipos de hábitat (por ejemplo, debajo de evidente en las observaciones de algunas
los árboles en lugar de los pastizales abiertos). réplicas y en condiciones experimentales de
Habrá 3 tratamientos experimentales: intactos algunas réplicas. Por el contrario, si se
(es decir, depredadores intactos), depredadores necesita un gran número de observaciones
eliminados y un control para las perturbaciones replicadas para discernir el patrón original, no
causadas por la eliminación de los es razonable esperar que sea fácil de ver en
depredadores y mantenerlos fuera. El experimentos con pocas réplicas.
experimento se realizará en dos áreas del
estudio. Entonces, hay 2 áreas, 2 hábitats, 3 Interpretación de experimentos.
tratamientos y, por lo tanto, 12 combinaciones
de todos los requisitos del experimento. Si se Dado el marco lógico brevemente descrito
establecen 4 parcelas replicadas de cada aquí (Fig. 1), al final del experimento, se debe
combinación en cada área (es decir, hay 4 tomar una decisión sobre cómo se
réplicas de cada una de las 12 combinaciones interpretarán los resultados. Hay solo dos
de tratamientos) y los datos se examinarán posibilidades. Los datos experimentales llevan
mediante análisis de varianza, habrá 36 df para a la conclusión de que la hipótesis es correcta.
algunas de las pruebas (ver Winer et al.1991, Se llega a esta conclusión cuando se decide
Underwood 1997 para saber cómo calcular df). rechazar la hipótesis nula, o una combinación
Si los recursos estuvieran disponibles para tener apropiada de hipótesis nulas, dejando el
5 réplicas, habría 48 df en lugar de 36. Este patrón predicho de datos que respaldan la (s)
aumento en el esfuerzo y los costos no valdría hipótesis (es) porque esa es la única otra
la pena, ya que no habría mucha diferencia en posibilidad. Es la única otra posibilidad debido
la capacidad del experimento para hacer que las a la forma en que se definen y construyen las
hipótesis nulas sean rechazado. hipótesis nulas (ver más arriba).
108 Underwood • ANN. ZOOL. FENNICI Vol. 46
Annual Review of Oceanography and Marine Biology Hairston, N. G. 1989: Ecological experiments: purpose,
25: 39–90. design and execution. — Cambridge University Press,
Bacon, F. 1620: Novum organum, 1889 Edition. — Claren- Cambridge.
don Press, Oxford. Heath, O. V. S. 1970: Investigation by experiment. — Edward
Box, G. E. P. & Cox, D. R. 1964: An analysis of transforma- Arnold, London.
tions. — Journal of the Royal Statistical Society, Series Hempel, C. G. 1965: Aspects of scientific explanation. —
B 26: 211–243. Free Press, New York.
Brown, J. H. 1999: Macroecology: progress and prospect. Hocutt, M. 1979: The elements of logical analysis and infer-
— Oikos 87: 3–14. ence. — Winthrop, Cambridge.
Carnap, R. 1962: Logical foundations of probability. — Uni- Hollander, M. & Wolfe, D. A. 1973: Nonparametric statisti-
versity of Chicago Press, Chicago. cal methods. — Wiley, New York.
Campbell, D. L. M., Weiner, S. A., Starks, P. T. & Hauber, Hume, D. 1779: Dialogues concerning natural religion (2nd
M. E. 2009: Context and control: behavioural ecology ed. 1947). — Nelson, London.
experiments in the laboratory. — Annales Zoologici Hume, D. 1941: Treatise on human nature. — Clarendon
Fennici 46: 112–123. Press, Oxford.
Caughley, G. & Gunn, A. 1996: Conservation biology in Hurlbert, S. J. 1984: Pseudoreplication and the design of
theory and practice. — Blackwell Science, Cambridge, ecological field experiments. — Ecological Monographs
Massachusetts. 54: 187–211.
Chalmers, A. F. 1979: What is this thing called science? Hurlbert, S. H. 2004: On misinterpretations of pseudoreplica-
— Queensland University Press, Brisbane. tion and related matters: a reply to Oksanen. — Oikos
Chamberlin, T. C. 1965: The method of multiple working 104: 591–597.
hypotheses. — Science 148: 754–759. Läärä, E. 2009: Statistics: reasoning on uncertainty, and the
Chapman, M. G. 1986: Assessment of some controls in insignificance of testing null. — Annales Zoologici Fen-
experimental transplants of intertidal gastropods. — nici 46: 138–157.
Journal of Experimental Marine Biology and Ecology Legendre, P. & Gallagher, E. D. 2001: Ecologically meaning-
103: 181–201. ful transformations for ordination of species data. —
Chapman, M. G. 2000: Poor design of behavioural experi- Oecologia 129: 271–280.
ments gets poor results: examples from intertidal habi- Lemmon, E. J. 1971: Beginning logic. — Nelson, Surrey.
tats. — Journal of Experimental Marine Biology and Mayo, D. G. 1996: Error and the growth of experimental
Ecology 250: 77–95. knowledge. — University of Chicago Press, Chicago.
Cohen, J. 1977: Statistical power analysis for the behav- McDonald, L. L. & Erickson, W. P. 1994: Testing for bio-
ioural sciences. — Academic Press, New York. equivalence in field studies: has a disturbed site been
Connell, J. H. 1974: Ecology: field experiments in marine adequately reclaimed? — In: Fletcher, D. J. & Manly,
ecology. — In: Mariscal, R. (ed.), Experimental marine B. F. J. (eds.), Statistics and environmental monitoring:
biology: 21–54. Academic Press, New York. 183–197. University of Otago Press, Dunedin, New
Connell, J. H. 1983: On the prevalence and relative impor- Zealand.
tance of interspecific competition: evidence from field Mead, R. 1988: The design of experiments: statistical princi-
experiments. — American Naturalist 122: 661–696. ples for practical applications. — Cambridge University
Dennis, B. 1996: Should ecologists become Bayesians? Press, Cambridge.
— Ecological Applications 6: 1095–1103. Medawar, P. 1969: Induction and intuition in scientific
Diamond, J. M. 1986: Overview: laboratory experiments, thought. — Methuen, London.
field experiments and natural experiments. — In: Dia- Mill, J. S. 1865: A system of logic, vol. 2, 6th ed. — Long-
mond, J. M. & Case, T. J. (eds.), Community ecology: mans, Green & Co., London.
3–22. Harper & Row, New York. Miller, B. & Mullette, K. J. 1985: Rehabilitation of an endan-
Ellison, A. M. 1996: An introduction to Bayesian infer- gered Australian bird: the Lord Howe Island woodhen
ence for ecological research and environmental decision- Tricholimnas sylvestris (Sclater) — Biological Conser-
making. — Ecological Applications 6: 1036–1046. vation 34: 55–95.
Fisher, R. A. 1935: The design of experiments. — Oliver and Nagel, E. 1961: The structure of science. — Harcourt, Brace,
Boyd, Edinburgh. World, London.
Ford, E. D. 2009: The importance of a research data state- O’Hara, R. B. 2009: How to make models add up — a primer
ment and how to develop one. — Annales Zoologici on GLMMs. — Annales Zoologici Fennici 46: 124–137.
Fennici 46: 82–92. Oksanen, L. 2001: Logic of experiments in ecology: is pseu-
Gaston, K. J. & Blackburn, T. M. 1999: A critique for macr- doreplication a pseudoissue? — Oikos 94: 27–38.
oecology. — Oikos 84: 353–368. Paine, R. T. 1994: Marine rocky shores and community ecol-
Gurevitch, J., Morrow, L. L., Wallace, A. & Walsh, J. S. ogy: an experimentalist’s perspective. — Ecology Insti-
1992: A meta-analysis of competition in field experi- tute, Oldendorf-Luhe.
ments. — American Naturalist 140: 539–572. Peckarsky, B. L. 1998: The dual role of experiments in com-
Hairston, N. G. 1985: The interpretation of experiments on plex and dynamic natural systems. — In: Resetarits, W.
interspecific competition. — American Naturalist 125: J. & Bernardo, J. (eds.), Experimental ecology: issues
321–325. and perspectives: 311–324. Oxford University Press,
ANN. ZOOL. FENNICI Vol. 46 • Components of design in ecological field experiments 111