Está en la página 1de 54

Diseño experimental y

el análisis estadístico

1
El diseño del estudio y el análisis de datos:
partes cruciales de la investigación
Todo experimento se compone de
cinco elementos
Introducción
Introducción aa la
la Estadística
Estadística
yy Tipos
Tipos de
de Estudios
Estudios enen
Recursos
Recursos Naturales
Naturales
¿Por qué usamos la estadística?

 Como herramienta para:


 Evaluar la confiabilidad de conclusiones basadas en datos
(estadística inferencial).
 Resumir información contenida en los datos (estadística
descriptiva).
 Para diseñar de estudios y así maximizar la confiabilidad de las
conclusiones.
¿Qué es lo que estadística no puede hacer por ti?

 La estadística no puede reemplazar el pensamiento y esfuerzo de trabajo


que requiere una investigación científica.
 El resultado no dice que el método fue mal empleado o que el resultado
obtenido es erróneo.
 No puede decirte la verdad
 Como lo notara Sherlock Holmes, un resultado improbable es cualitativamente
diferente de un resultado imposible: el primero ocurre raramente, el segundo no
ocurre nunca.
 Como lo improbable puede ocurrir, el análisis estadístico puede dar una
respuesta equivocada.
 No se puede confundir apoyo estadístico a un argumento como una
declaración de la “verdad” definitiva.
 La estadística sólo puede estimar la probabilidad de que un argumento es
verdadero, sin embargo, esto es de gran ayuda.
¿Qué es lo que estadística no puede hacer por ti?

 Compensar por un mal diseño de estudio


 Basura entra, basura sale.
 El tiempo para aplicar la estadística es antes de la colecta de los datos
 Indicar significancia biológica
 Significancia estadística no significa significancia biológica
 La significancia biológica o práctica no tiene nada que ver con la
significancia estadística
Tipos
Tipos de
de Estudios
Estudios en
en
Recursos
Recursos Naturales
Naturales
Tipos de datos
 Datos anecdóticos
 Se basan en unos pocas observaciones colectadas sin ningún protocolo serio de
muestreo.
 Se asumen que los datos son representativos de un grupo mayor de
observaciones.
 Es muy difícil conocer cuán confiable o útil son estos datos.
 Datos históricos
 Datos que ya han sido colectados, pero muchas veces es cuestionable su utilidad
para un problema específico.
 Datos observacionales
 Datos colectados en un estudio no experimental. Pueden haber factores que
oscurecen su interpretación y que el investigador no puede controlar de una
manera eficiente.
 Datos experimentales
 Son datos provenientes de experimentos en donde se modifican los factores de
interés y se observa la respuesta.
 Se usan para demostrar causa-efecto
Tipos de Estudios

 El método científico se basa en la idea de la investigación


experimental de una hipótesis (este es un concepto erróneo de lo
que es la ciencia).
 En estudios de campo (Ecología, agroecología, recursos
naturales) un enfoque estrictamente experimental es difícil (sino
imposible) y caro.
 Los objetivos pueden ser alcanzados mediante diferentes
procedimientos de muestreos, sin embargo, la inferencia
resultante es más débil que la obtenida mediante experimentos.
Tipos de Estudios
Estudios Experimentos de
Manipulativos Laboratorio
(Eventos
controlados
por el Experimentos de Campo
observador)

Estudios Descriptivos
Estudios
Mensurativos
(Eventos no
Estudios Observacionales
controlados
por el
observador)
Estudios de Impacto
Tipo de inferencia o conclusión resultante de los
diferentes tipos de estudio

Débil Inferencia o Conclusión Robusta

Descripción Causa-efecto

Descriptivo - Observacional - Evaluación de Impacto - Experimento de campo - Experimento de Laboratorio


Estudios Descriptivos

 Brindan información sobre grupos, por ejemplo, para


obtener medias, totales. Porcentajes (enfoque
cuantitativo).
 Generan parámetros demográficos (tamaño de
población, tasa de supervivencia, tasa de
reclutamiento, etc..)
 Se basan fuertemente en un protocolo de muestreo
(ejemplo, muestreo aleatorio simple, muestreo
aleatorio estratificado, etc.)
Estudio Descriptivo

Fragmento de bosque
Estudios Descriptivos
Ejemplo

 Un biólogo está interesado en estimar la población de una especie de


salamandra en un fragmento de bosque.
Objetivo: evaluar el estado poblacional de una especie de salamandra
Medida: densidad de salamandras
Diseño: serie de parcelas son colocadas aleatoriamente dentro del
fragmento y se realiza captura-recaptura.
Resultado: se reporta la densidad de salamandras con una medida
de precisión (error estándar o intervalo de confianza).
Comentario: no hay variables explicativas y no hay comparación con
otras áreas. La inferencia es sólo posible hacia el área estudiada, no
es posible hacer inferencia hacia otras áreas.
Estudio Observacional

 Se les denomina también, estudios correlacionales, analíticos o


erróneamente, “experimentos mensurativos”.
 Se parecen a los experimentos en que son utilizados para
examinar diferencias entre grupos.
 También, como en el experimento, el primer paso es identificar
potenciales variables explicativas (similares a los factores en el
experimento)
 Sin embargo, difieren de los experimentos en que los
tratamientos no son asignados al azar.
 La interpretación de los resultados tiene severas limitaciones.
 Extraer conclusiones robustas es difícil porque los grupos
difieren en muchas otros aspectos que el investigador no puede
controlar.
Estudios Observacional

Fragmentos sin tala


selectiva

Fragmentos con
tala selectiva
Estudio Observacional
Ejemplo

 El biólogo está interesado en examinar el impacto de la tala selectiva sobre las poblaciones
de una especie de salamandra.
Objetivo: medir el impacto de la tala selectiva sobre las poblaciones de una especie de
salamandra
Medida: densidad de población de salamandras
Diseño: fragmentos son seleccionados al azar dentro de cada factor (con tala selectiva y
sin tala selectiva) en una región y una serie de parcelas son colocadas aleatoriamente
dentro de cada fragmento seleccionado y se mide la densidad poblacional mediante la
técnica de captura-recaptura.
Resultado: se reporta la densidad media de salamandras para cada factor con una
medida de precisión (error estándar o intervalo de confianza). Se procede a comparar las
2 medias usando la variabilidad dentro de cada fragmento y entre fragmentos dentro del
mismo factor.
Comentario: La variable explicativa es tala selectiva o no. La comparación fue hecha
sobre una población de fragmentos de una región. Difiere de un estudio experimental en
que la tala en cada fragmento no puede ser manejada por el investigador. Los resultados
observados pueden deberse a un factor desconocido que no fue medido.

14/01/22 Estadística Básica - Manuel Spínola 18


Estudios Observacionales

 Se debe recordar que es altamente probable que los estudios


observacionales estén expuesto a sesgos.
 Tal como en la experimentación, se necesita del uso de
métodos estadísticos para distinguir “desconfirmación” de la
variación aleatoria entre los individuos o elementos
observados.
 Tal como en el muestreo para propósitos descriptivos, se debe
usar el muestreo para hacer inferencias sobre la población de
interés (población objetivo)
Experimentos
Experimentos

 El experimento es una investigación, en donde bajo condiciones


controladas y repetidas, se busca una asociación entre los
factores de tratamiento y variables respuesta.
 Un diseño experimental es un protocolo para asignar tratamientos
a una colección de unidades experimentales que representa una
población de interés.
 Lo que hace a un diseño “experimental” es que la asignación de
tratamientos está bajo el control del investigador, y es esto lo que
lo distingue de los estudios observacionales.
Estudio Experimental
Unidad Unidad Experimental
Observacional

Fragmentos sin tala


selectiva

Fragmentos con
tala selectiva
Estudios Experimentales
Ejemplo

 El biólogo está interesado en examinar el impacto de la tala selectiva sobre las poblaciones de
una especie de salamandra.
Objetivo: medir el impacto de la tala selectiva sobre las poblaciones de una especie de
salamandra
Medida: densidad de población de salamandras
Diseño: fragmentos son seleccionados al azar dentro de una región con numerosos
fragmentos, de esa muestra de fragmentos se adjudica al azar cual fragmento será sometido a
tala selectiva y cual no. En cada fragmento con diferente tratamiento se ubican al azar una
serie de parcelas y se mide la densidad poblacional mediante la técnica de captura-recaptura.
Resultado: se reporta la densidad media de salamandras para cada factor con una medida de
precisión (error estándar o intervalo de confianza). Se procede a comparar las 2 medias
usando la variabilidad dentro de cada fragmento y entre fragmentos dentro del mismo factor.
Comentario: La variable explicativa es tala selectiva o no. La comparación fue hecha sobre una
población de fragmentos de una región. Como los fragmentos fueron adjudicados
aleatoriamente, los efectos de otro factor no controlado será igual en promedio. La diferencia
con el estudio observacional es que en este caso (el experimento) el investigador tiene control
sobre el tratamiento y puede asignar de manera aleatoria las unidades experimentales a cada
tipo de tratamiento.
Experimentos

 En los experimentos hay dos procesos de aleatorización: (1) la


selección aleatoria de unidades experimentales de una población
de interés (utilizando los diseños vistos en la primera parte de la
clase), y (2) la asignación al azar de o los tratamientos a las
unidades experimentales.
 Cuando el control experimental (espaciales y temporales) están
completamente ausentes, el término experimento no es aplicable.
Limitaciones de los Experimentos

 Escala: es muy difícil implementar experimentos a gran escala.


Más del 80% de experimentos de campo han sido realizados en cuadrantes de
menos de 1 m2.

 Tamaño del elemento de estudio: los experimentos están


generalmente restringidos a organismos pequeños que son más
fáciles de manipular.
El implementar un experimento sobre la interacción de una especie de araña y sus
presas puede ser posible, pero es muy difícil desarrollar un experimento sobre la
interacción de pumas y guatusas.

 Diseño: en muchos casos los requerimientos de un diseño


experimental son muy difíciles de implementar.
Si queremos conocer la interacción entre 8 especies de arañas, sería logísticamente
difícil llegar a combinar todos los posibles arreglos experimentales, incluyendo sus
réplicas.
Elementos fundamentales de un experimento

 Control (puede entenderse como bloqueo o estratificación)


 Replicación
 Aleatorización

 Estos elementos también aplican en los estudios observacionales


Control
 En experimentación, los tratamientos son aplicados a unidades experimentales, con la
idea de que el efecto del tratamiento es observado a través de la comparación de
muestras tratadas y no tratadas.
 En experimentación, los controles se definen como observaciones paralelas usadas para
verificar los efectos de tratamientos experimentales.
 Los controles son unidades experimentales que no reciben el tratamiento.
 Los controles son usados para eliminar los efectos de factores ajenos que pueden
influenciar los resultados o conclusiones.

Efecto de los venados sobre la regeneración del bosque

Control Tratamiento

No exclusión de venados Exclusión de venados


Replicación
 En experimentación, réplicas es la asignación del mismo tratamiento a más de una unidad
experimental.
 Por razones logísticas se pueden medir numerosas submuestras cercanas entre sí dentro
de una unidad experimental. Sin embargo, se debe distinguir estas submuestra de lo que
son muestras independientes.
 La submuestras no son muestras independientes y por lo tanto no son verdaderas réplicas.
 Como regla general, aumentar el número de réplicas por tratamiento aumenta la precisión
del estimados del efecto del tratamiento e incrementa la potencia de la prueba estadística.

Efecto de venados sobre la regeneración del bosque

Control Tratamiento
Réplica

Submuestra

No exclusión de venados Exclusión de venados


Propósitos de la Replicación

 Controla el error estocástico o aleatorio


 Ejemplo: otros factores no examinados pueden determinar
el resultado del estudio

 Incrementa la precisión de nuestros resultados


 Incrementa la generalización de nuestros resultados
 Si se incluyen varios sitios entonces se puede generalizar
fácilmente a otros sitios no muestreados
Replicación

 Muestras = Réplicas
 Maximizar el número de muestras en el estudio.
 Máximo número posible dada las limitaciones logísticas.
 Uso de análisis de poder.
 Sub-muestras = Pseudoréplicas
 Las sub-muestras son consideradas pseudoréplicas si son tratadas
como verdaderas réplicas en los análisis estadísticos.
 Sub-muestras: son útiles para incrementar la precisión de nuestro
estimado para la réplica en cuestión.
 Se deben usar análisis estadísticos específicos para no cometer
pseudoreplicación y poder obtener la mayor información contenida
en los datos.
Pseudoreplicación
 Replicación Incorrecta
 Se realiza replicación de muestras, no de unidades observacionales o
experimentales.
 El tamaño de muestra (n) se infla artificialmente por medidas repetidas
tomadas en las mismas unidades observacionales o experimentales
(relación con los grados de libertad).
 Las réplicas no son independientes.

 La Pseudoreplicación viola un supuesto clave de la


mayoría de los análisis estadísticos: independencia de las
observaciones
 Si las muestras son independientes se incrementa la credibilidad de los
resultados.
 Si evitamos la pseudoreplicación obtenemos mejores inferencias (mejora
la calidad de los resultados de nuestro estudio).
Pseudoreplicación
Ejemplos

 Muchas muestras de un solo sitio


 Estas son realmente submuestras.

 Una única muestra de cada tratamiento o nivel del


factor
 En realidad son réplicas pero el tamaño de muestra es 1.

 Una única muestra de un único sitio, pero replicada en


el tiempo
 Son muestras si la pregunta en cuestión es dependiente del
tiempo.
 Si no, es pseudoreplicación.
Pseudoreplicación
Ejemplo: Efecto de la fertilización en el crecimiento de las orugas
Árboles Árboles no
fertilizados fertilizados

La réplica (en este caso, la unidad experimental) es el árbol, no la oruga (sub-muestra)

n = 2 (no 5)
Pseudoreplicación

“La pseudoreplicación es el uso de la estadística inferencial para


evaluar el efecto de tratamientos con datos de experimentos donde
los tratamientos no son replicados (aunque las muestras si pueden
ser replicadas) o las réplicas no son estadísticamente
independientes” (Hurlbert 1984).
“La pseudoreplicación no se refiere a un problema en el diseño
experimental (o muestreo) sino a una combinación particular del
diseño experimental (o muestreo) y el análisis estadístico que hace
inapropiado la prueba de hipótesis de interés” (Hurlbert 1984).

Hurlbert, S.H. 1984. Pseudoreplication and the design of ecological field experiments. Ecol. Monogr. 54: 187-211.
Tipos más comunes de Pseudoreplicación
A. Pseudoreplicación simple

x1 y1
x2 x x y2 y y4
3 4 3

B. Pseudoreplicación de sacrificio

y1 y2 y3 y4 x3 x4
x1 x2
C. Pseudoreplicación temporal

x1 x2 x3 x4
Tiempo

y1 y2 y3 y4
Pseudoreplicación Simple

x1 y1
x2 x x y2 y y4
3 4 3

La mayoría de los estudios en ecología involucra sólo una réplica de la variable de


exposición o tratamiento (en el caso de un experimento)
 La replicación es a menudo imposible o no deseada cuando se estudian
ecosistemas grandes (lagos, cuencas, grandes áreas de bosques, ríos,
etc.)
 Se toman muestras múltiples de la misma unidad observacional o
experimental como si fueran verdaderas réplicas
 Es deseable tener múltiples muestras porque se aumenta el poder de
nuestro análisis
 Sin embargo, esto no incrementa los grados de libertad para examinar los
efectos del tratamiento o la variable de exposición
Pseudoreplicación simple
Muestreo de un lago
para determinar la
densidad de nidos
de un pez (nidos
excavados en el
sustrato del lago)

Transectos seleccionados al
azar dentro del segrmento
de 100 m
• Hay pseudoreplicación si se
quiere hacer inferencia a
todo el lago. Para que haya réplicas
debería haber 2 o más
• No hay replicas, sólo hay 6 segmentos de 100 m de
submuestras en un sector
100 m de costa seleccionados
de 100 m del lago. costa aleatoriamente
Pseudoreplicación por Sacrificio

y1 y2 y3 y4 x3 x4
x1 x2

 En este caso existen verdaderas réplicas de las unidades observacionales o


experimentales, pero los datos son colapsados previo al análisis estadístico o
las observaciones (muestras) o medidas dentro de cada unidad observacional
o experimental son tratadas como réplicas independientes.
 La información sobre la varianza entre réplicas existe en los datos originales,
pero se confunde con la varianza entre muestras (dentro de las réplicas) o se
pierde cuando las muestras de las réplicas son colapsadas (pooled), de aquí
el nombre de “sacrificio”.
 Menos común que la pseudoreplicación simple.
Pseudoreplicación por sacrificio
Mucho alimento Poco alimento

1 1
2 Media 1 Media 1 2
3 3

4 4
5 Media 2 Media 2 5
6 6

7 7
8 Media 3 Media 3 8
9 9

10 10
11 Media 4 Media 4 11
12 12

12-1 (Incorrecto) 4-1 (Correcto) 4-1 (Correcto) 12-1 (Incorrecto)


Pseudoreplicación Temporal

x1 x2 x3 x4
Tiempo

y1 y2 y3 y4

 Se toman muestras múltiples en cada unidad observacional o experimental pero


no simultáneamente sino secuencialmente a través del tiempo.
 Las observaciones a través del tiempo son tomadas como verdaderas réplicas y
se realizan pruebas estadísticas violando el supuesto de independencia.
 Las muestras sucesivas de una única unidad están obviamente correlacionadas
(autocorrelación) y por lo tanto se corre el riesgo de obtener efectos espurios,
es decir, no relacionados a la variable de interés.
 El diseño es muy apropiado para muchas situaciones. El único problema es el
considerar las observaciones como independientes.
 Para evitar la pseudoreplicación temporal se debe usar la prueba estadística
apropiada.
Aleatorización

 Es un protocolo para asignar los sujetos experimentales al tratamiento para


evitar la influencia de variables no controladas en el resultado del experimento.
 También promueve la adecuada dispersión de las unidades experimentales y la
independencia del efecto del tratamiento.

Efecto de venados sobre la regeneración del bosque

Control
No exclusión de venados

Tratamiento
Exclusión de venados
Asegurando Independencia y evitando el efecto de factores ajenos al estudio

Independencia

 La falta de independencia puede hacer difícil la interpretación de los resultados y puede invalidar
algunos análisis estadísticos.
 La mejor manera de asegurarse la independencia es que las unidades experimentales o muestrales
sean separadas por suficiente espacio o tiempo para que no se afecten unas a otras.

Falta de independencia Independencia

Factores ajenos al estudio


 Cuando los factores se confunden entre sí, sus efectos no pueden diferenciarse.

Más cálido Más frío Más cálido Más frío

La réplicación y aleatorización ayudan a solucionar los problemas resultantes de la falta de


independencia
14/01/22
y el efecto de factores externos al estudio.
Estadística Básica - Manuel Spínola 42
Estudios de Impacto

 Estudios que comparan alguna característica de interés en un sitio


potencialmente afectado por algún factor con respecto a un sitio
de referencia no afectado.
 En su forma más simple este estudio no provee bases para hacer
inferencias porque el sitio de referencia puede diferir del sitio
afectado por diversas razones además del efecto de interés.
Estudios de Impacto
I. Contraste en un sitio antes / después

Lago Efluente de planta Lago


industrial

 Es el diseño de impacto más simple.


 Se realiza una medida antes y después de una perturbación potencial (derrame de petróleo,
incendio forestal), donde, afortunadamente, se posee cierta información previa.
 El investigador obtiene una sola medida de alguna variable de interés antes y después del evento.

Fallas del diseño

 Pude que no haya ninguna relación entre el evento ocurrido y los cambios en la variable de
interés, el cambio puede haber resultado por coincidencia.
 No se tiene información sobre la variabilidad natural de la calidad del agua en el tiempo, por lo que
los cambios se pueden deber a fluctuaciones temporales.
 El diseño no se puede usar si no se tiene información previa.
Estudios de Impacto
II. Muestreo repetido antes / después en un solo sitio

Efluente de planta
industrial
Tiempo 1 Tiempo 2 Tiempo 3 Tiempo 4 Tiempo 5 Tiempo 6

 Mejora el diseño anterior.


 Se realizan varios medidas en diferentes puntos en el tiempo antes y después del evento.
 El investigador obtiene información sobre la variabilidad natural en el tiempo.

Fallas del diseño

 A pesar de las medidas repetidas el diseño sufre de la misma falla que el diseño previo. Las
medidas repetidas son pseudo-replicas en el tiempo en vez de ser verdaderas réplicas.
 Los cambios observados pueden deberse a tendencias temporales más que al efecto del evento.

45
Estudios de Impacto
III. Antes / después y control / impacto (BACI)

Tratamiento Efluente de planta


industrial

Control

 El diseño BACI más simple toma medidas antes y después en un control y un tratamiento.
Calidad de agua

Calidad de agua

Calidad de agua

Calidad de agua
Efecto

No
efecto
Antes Después Antes Después Antes Después Antes Después
Estudios de Impacto
III. Antes / después y control / impacto (BACI)

Fallas del diseño

 Los sitios de impacto no fueron escogidos al azar, por lo tanto es posible que las
diferencias observadas se deban a otro factor que también difiere entre los 2 sitios.
 Este tipo de problema puede ser reducido por monitorear varios sitios y si la diferencia
es más que la que se esperaría basada en los múltiples sitios control, entonces se
puede argumentar que realmente ha habido un impacto.
 Un segundo problema en este tipo de diseño cuando se toma una muestra antes y
después de impacto es que puede fallar en reconocer la variación natural en la
variable de interés que no está relacionada con el impacto del evento.
Calidad de agua

Calidad de agua

Calidad de agua
Control

Tratamiento

Antes Después Antes Después Antes Después


Estudios de Impacto
III. Antes / después y control / impacto (BACI)

 El diseño de impacto BACI se puede extender a otros


diseños más complejos.
Impactos Accidentales

 Los diseños de impacto BACI asumen que el estudio


de impacto ambiental ocurre antes de que el impacto
ocurre.
 En los Impactos Accidentales no existe información
previa al impacto.
 Como el diseño BACI no son experimentos en el
verdadero sentido del término.
Impactos Accidentales (algunos diseños)
Diseño de referencia espacial de impacto

Densidad de almejas

Densidad de almejas
No impacto Impacto

Fuerte Ninguna Fuerte Ninguna


Exposición Exposición

Diseño de regresión espacial


Densidad de almejas

Densidad de almejas
No impacto Impacto

Fuerte Ninguna Fuerte Ninguna


Exposición Exposición

14/01/22 Estadística Básica - Manuel Spínola 50


Diferencias entre tipos de estudios

 Los tipos de estudios difieren en el nivel de control sobre le factor


explicativo. En estudios descriptivos se tiene el menor control,
mientras que en los experimentos se tiene el mayor control.
 Los tipos de estudios difieren en el grado de extrapolación a otros
escenarios. En estudios descriptivos la inferencia es limitada a
aquella población muestreada, mientras que en experimentos las
inferencias tienden a tener mayor amplitud.
Diferencias entre tipos de estudios
Grado de control

Experimentos

Estudios de
Control-Impacto

Estudios de
Impacto
Estudios
Observacionales

Estudios
Descriptivos

Robustez de la Inferencia
Estudios experimentales son más concluyentes que
estudios observacionales o correlacionales

Cierta Experimento de Experimento de


laboratorio Campo Replicado

Experimento de campo
Certeza de la Estudio de
Campo Estudio de Campo
Estudio de
Campo
Conclusión Pseudoreplicado Replicado

Experimento de
Estudio descriptivo Experimento
Campo
Incierta (Historia Natural)
Pseudoreplicado Natural

Pequeño Espacio Inferencial Grande


Planeando un estudio en recursos naturales

1. Formular un(a) claro(a) objetivo(s) o hipótesis.


2. Asegurar que se establecen controles.
3. Estratificar en espacio y tiempo.
4. Tener replicas dentro de cada combinación de tiempo, espacio y cualquier
otra variable controlada.
5. Determinar el tamaño de una diferencia biológicamente significativa.
6. Estimar tamaño de muestra requerido.
7. Ubicar las unidades de muestreo con un protocolo probabilístico.
8. Realizar un muestreo piloto para asegurarse que el diseño y los métodos
de muestreo son apropiados.
9. Mantener una buena calidad del estudio a través del tiempo.
10. Corroborar los supuestos del análisis estadístico que se va a usar.

También podría gustarte