Está en la página 1de 44

Diseo experimental

y anlisis estadstico

Competencias Grados en Biologa,


transversales Biotecnologa y
encaminadas a la Ciencias
mejora del Trabajo Ambientales
Fin de Grado Facultad de Biologa
Profesor: Jos Francisco Calvo Sendn | jfcalvo@um.es | webs.um.es/jfcalvo

1. El mtodo cientfico

2. Fundamentos de probabilidad

3. Contraste estadstico de hiptesis

4. Fundamentos del diseo experimental

5. Anlisis estadstico: enfoques metodolgicos

6. Anlisis estadstico: estadsticos descriptivos

7. Anlisis estadstico: mtodos y modelos

Diseo experimental y anlisis estadstico Facultad de Biologa


Diseo experimental y anlisis estadstico
1. El mtodo cientfico
Ciencia
La ciencia trata de explicar racionalmente la naturaleza obteniendo
explicaciones sobre el funcionamiento de un sistema, o siendo capaz de
predecir los resultados del sistema (Kry y Schaub 2012).
Science is a process for learning about nature in which competing ideas
about how the world works are measured against observations (Richard
Feynman, citado en Hilborn y Mangel 1997).
Hiptesis:
Son las ideas o descripciones sobre cmo funciona el mundo.
Dado que nuestras descripciones del mundo son casi siempre incompletas y
nuestras medidas incorporan incertidumbre e imprecisin, necesitamos
mtodos que nos permitan evaluar el grado de concordancia entre las ideas
confrontadas y las observaciones: la estadstica (Hilborn y Mangel 1997).

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
1. El mtodo cientfico
Hiptesis y teoras
Una hiptesis cientfica se refiera a un mecanismo o relacin causa-efecto
particular. Una teora cientfica es mucho ms general y sinttica (Gotelli y
Ellison 2004) e implica un nivel de evidencia y soporte considerablemente
mayor (Hilborn y Mangel 1997).
Mtodo cientfico
Es la tcnica que se utiliza para decidir entre las hiptesis en base a las
observaciones (Gotelli y Ellison 2004).
Azar, variacin, impredecibilidad, incertidumbre
Cualquier sistema que encontramos en la naturaleza (y cualquier faceta de la
vida) es estocstico; es decir, sistemas que no son completamente predecibles
porque incluyen procesos aleatorios que aaden un mayor o menor grado de
variabilidad y, en consecuencia, de incertidumbre en sus resultados.

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
1. El mtodo cientfico
Modelos
Para interpretar formalmente cualquier observacin necesitamos un modelo.
Los modelos son herramientas para evaluar las hiptesis (Hilborn y Mangel
1997). Un modelo es una definicin abstracta de cmo creemos que nuestras
observaciones son el resultado de cantidades observables (datos) e
inobservables (parmetros).
Los resultados de un sistema estocstico (la respuesta) pueden expresarse, en
forma de modelo estadstico:
= +

seal, informacin estructural ruido, entropa


Pero un modelo es una abstraccin y, por tanto, siempre es incorrecto (Kry
2010).

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
1. El mtodo cientfico
El papel de los modelos en ciencia: Dichos sobre los modelos cientficos

Modelling is as much art as it is science (McCullagh y Nelder)


All models are wrong, but some are useful (Box)
There has never been a straight line nor a Normal distribution in history, and yet,
using assumptions of linearity and normality allows, to a good approximation, to
understand and predict a huge number of observations (Youden)
Everything should be made as simple as possible, but not simpler (Einstein)
Nothing is gained if you replace a world that you dont understand with a model
that you dont understand (Maynard Smith)
It is difficult to imagine another method that so effectively fosters clear thinking
about a system than the use of a model written in the language of algebra (Kry)
Fuente: Kry y Schaub (2012)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
1. El mtodo cientfico
Contraste de hiptesis
Mtodo hipottico-deductivo

Karl Popper (1902-1994)


Fuente: Wikimedia Commons

Fuente: Wiens (1989)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
1. El mtodo cientfico
Cuatro visiones filosficas de la ciencia

Filsofo Palabras clave Tipo de confrontacin

Una nica hiptesis es refutada por confrontacin con los


Popper Falsacin de hiptesis
datos.

Una nica hiptesis es utilizada hasta que exista mucha


Paradigmas, ciencia normal,
Kuhn informacin de que ha sido derrocada por una hiptesis
revolucin cientfica
mejor.
Se permiten mltiples visiones del mundo de acuerdo a
diferentes opiniones de los cientficos. La confrontacin
Polanyi Repblica de la ciencia
de estas visiones y los datos son juzgadas en funcin de
su (i) verosimilitud, (ii) valor, (iii) inters.

Programa de investigacin Confrontacin de mltiples hiptesis con los datos como


Lakatos
cientfica juez.
Fuente: Hilborn y Mangel (1997)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
1. El mtodo cientfico
Probabilidad y estadstica
Son ciencias que tratan sobre la incertidumbre.
Estudian las caractersticas de:
Sistemas estocsticos (descritos por los parmetros de un modelo).
Los efectos o resultados de dichos sistemas (los datos observados).
La teora probabilstica especifica los parmetros y el modelo.
La estadstica intenta inferir (deducir) las propiedades del sistema, dado el
modelo.
You can, for example, never foretell what
any one man will do, but you can say with
La inferencia estadstica tiene como
precision what an average number will be
objetivo la estimacin de las
up to. Individuals vary, but the percentages
propiedades o caractersticas de una
remain constant. So says the statistician.
poblacin a partir del anlisis de una
muestra de dicha poblacin Sherlock Holmes. The Sign of Four.

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
2. Fundamentos de probabilidad
Probabilidad:
Es la frecuencia esperada con la que ocurre un evento
Midiendo la probabilidad
nmero de resultados
=
nmero de ensayos 0,0 1,0
nmero de hembras nacidas Si no hubiese
=
nmero de individuos nacidos incertidumbre en el
resultado no hara falta
ni la probabilidad ni la
Ley de Hardy-
estadstica
Weinberg
= 2
= 2 =
= 2
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
2. Fundamentos de probabilidad
Probabilidad condicional
Es la probabilidad de que ocurra un evento A, sabiendo que tambin sucede
otro evento B (probabilidad de A dado B):
Probabilidad
( ) conjunta de A y B
=
()
rea de B / rea de S

Teorema de Bayes:

()
=
()
posterior
(distribucin o prior (distribucin Conjunto de todos
probabilidad o probabilidad los resultados
posterior) previa) posibles

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
2. Fundamentos de probabilidad
Variables aleatorias y distribuciones de probabilidad
La distribucin de probabilidad de una variable aleatoria es una funcin que
asigna a cada suceso la probabilidad de que ocurra.

Prueba un web app (0,1)


en
showmeshiny.com
Densidad

Distribucin normal
(media = 0, desviacin
estndar = 1)
95%

-1,96 z 1,96
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
2. Fundamentos de probabilidad
Variables aleatorias y distribuciones de probabilidad
Ejemplos:
Distribucin Media Varianza Comentarios
Discretas

Bernoulli (1 ) Un nico experimento con dos posibles resultados

Binomial (1 ) Secuencia de n ensayos de Bernoulli

Poisson Eventos raros independientes

( ) ( )2
Uniforme Resultados equiprobables sobre el intervalo [a, b]
2 12
Continuas

Normal 2 Genera curvas simtricas para datos continuos

+2 +2
Log-normal 2 2
2 Para datos con asimetra positiva (right-skewed)

Exponencial 1 1 2 Distribucin continua anloga a la de Poisson

Fuente: Gotelli y Ellison (2004)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
2. Fundamentos de probabilidad
La probabilidad proporciona las bases para la inferencia
La inferencia estadstica tiene como objetivo la estimacin de las propiedades
o caractersticas de un sistema (por ejemplo, una poblacin) a partir del
anlisis de una muestra.
Por inferencia podemos entender lo siguiente (Royle y Dorazio 2008):

Confrontar modelos con datos para estimar parmetros (ajustar un


modelo).
Contrastar hiptesis, seleccionar modelos o evaluar modelos.
Realizar predicciones.
Proporcionar asesoramiento para muestrear procesos subyacentes de
manera eficiente.

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Significacin estadstica y valores de P
El contraste de hiptesis se realiza mediante pruebas o test estadsticos. Cada
test produce un resultado numrico (un estadstico) y un valor de probabilidad
asociado (P).
La hiptesis nula estadstica (H0)
Establece un modelo simple que considera que las variaciones observadas en
los datos son debidas al azar y no al efecto del factor o factores estudiados.
La hiptesis alternativa (H1)
En general, como hiptesis alternativas (una o varias), se definen las que s
consideran la existencia de efectos debidos al factor o factores estudiados.
Habitualmente se utiliza el criterio P < 0,05 para rechazar H0
Pero el rechazo de H0 NO implica aceptar H1 (solo sugiere que H1 puede ser
cierta).

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
El valor de probabilidad (P, p, P-value, p-value)
Expresa la probabilidad de obtener los datos observados (y otros ms
extremos pero no observados) dado un modelo especfico (definido por un
parmetro o conjunto de parmetros ):
P ( y yobs| )
Habitualmente el modelo considerado es la hiptesis nula (H0), y por tanto, el
valor de P es la probabilidad de obtener unos datos (generalmente expresados
como el resultado de un test estadstico) al menos tan extremos como los
observados:
P (datos|H0) Tambin es frecuente
utilizar otras notaciones:
P no es la P (datos|H0)
probabilidad de que Pr (datos|H0)
H0 sea cierta Pr {datos|H0}
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Verosimilitud (likelihood)
De manera similar a un valor de P, la verosimilitud () cuantifica la
probabilidad de los datos dado un modelo. Pero solo usa los datos
observados, no los ms extremos e inobservados. :
( | yobs ) P ( yobs | )
es proporcional a puede ser un escalar o un vector

La interpretacin de es opuesta (como una versin inversa) a la de P: aqul


valor que proporcione el mximo de la funcin de verosimilitud para los
datos observados es considerado la mejor estima de (estimacin de mxima
verosimilitud, maximum likelihood estimate, MLE).
La verosimilitud de los datos es directamente proporcional a la probabilidad de
obtener los datos observados dado el parmetro o parmetros estimados.
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Verosimilitud (likelihood)
Las verosimilitudes son nmeros muy pequeos, menores que 1, por lo que
suele utilizarse ms frecuentemente el logaritmo (natural) de la verosimilitud:

log Tambin denotado


como logLik, LL, L

Un buen modelo es el que tiene una alta verosimilitud. Por tanto, cuanto
mayor es log, mejor es el ajuste del modelo a los datos.
Un valor de es, en s mismo, irrelevante. Pero tiene utilidad comparativa. La
razn de verosimilitudes (likelihood ratio) permite comparar cunto ms
verosmil es un parmetro frente a otro:

( 2 | yobs ) / ( 1| yobs )

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Verosimilitud, desvianza y criterio de informacin de Akaike (AIC)
La desvianza (deviance) se calcula como:
2 (log log s)
siendo s la verosimilitud del modelo saturado: aqul que tiene tantos
parmetros como datos y, por tanto, tiene un ajuste perfecto.
El criterio de informacin de Akaike (Akaikes information criterion) se calcula
como:
2 (log log s) + 2K
siendo K el nmero de parmetros del modelo.
Al igual que la verosimilitud y la desvianza, el AIC proporciona una medida de
la calidad relativa de un modelo, para un conjunto dado de datos. Cuanto
menor sea el valor de AIC de un modelo, mejor es el ajuste.
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Errores en el contraste de hiptesis
Nivel de
significacin;
Decisin:
habitualmente
Realidad: No rechazar H0 Rechazar H0 = 0,05
Error Tipo I
Decisin correcta
H0 cierta (probabilidad = )
(probabilidad = 1 )
falso positivo
Error Tipo II
Decisin correcta
H0 falsa (probabilidad = )
(probabilidad = 1 )
falso negativo

Poder o potencia
estadstica: 1

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Errores en el contraste de hiptesis

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Potencia estadstica
La potencia estadstica es la probabilidad de rechazar una H0 falsa (la
probabilidad de observar un efecto cuando realmente ocurre). Depende de
cuatro factores:
1. El nivel de significacin ( ).
2. El tamao del efecto. Es la magnitud mnima de la diferencia o
asociacin que se considera relevante. Es una medida del grado de
diferencia o del grado de relacin que queremos detectar. Es una
medida estandarizada, de clculo complejo.
3. El tamao de la muestra (n ). A mayor tamao de muestra mayor
potencia al aumentar la precisin.
4. La variabilidad de la respuesta ( ). A menor variabilidad mayor
potencia. Influye en la estimacin del tamao del efecto y es mayor
cuando el tamao de la muestra es pequeo.
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Potencia estadstica
La potencia 1 aumenta si seleccionamos un nivel de significacin mayor:

Pero elegir un mayor


implica un mayor
riesgo de cometer
error Tipo I.

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
Potencia estadstica
Mayor nivel de
Prueba un web app
en significacin
showmeshiny.com

Mayor tamao Mayor


del efecto tamao de
la muestra
(precisin)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
3. Contraste de hiptesis estadsticas
El debate sobre la utilidad de P
La cultura cientfica basada en el uso de P ha dominado durante la mayor parte
del siglo XX (y an domina en el siglo XXI). No obstante, se tiende a abandonar
su utilizacin y cada vez con mayor frecuencia se emplean como alternativa
procedimientos de seleccin de modelos e inferencia multimodelo, nuevo
paradigma para el anlisis estadstico.
En sntesis, un procedimiento de seleccin de modelos
evala un conjunto de modelos candidatos (generalmente
mediante el AIC) y realiza la estimacin de parmetros en
funcin de las estimaciones ponderadas de dicho parmetro
en los diferentes modelos.
Se busca la mejor explicacin posible para los datos
observados (best approximating model) y, bajo esta
Portada del libro de
perspectiva, el uso de P no tiene sentido. Burnham y Anderson (2002)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Diseo experimental: [Krebs, 1999]
Trmino que describe la estructura lgica de un experimento.
Experimento:
Es una operacin o procedimiento para testar una hiptesis.
Unidad experimental:
Divisin ms pequea de material experimental que recibe un tratamiento.
Tratamientos y controles:
Tratamiento es un trmino general para cualquier conjunto de comparaciones.
Entre los tipos tratamientos de un experimento debe figurar uno de control,
que sirva de comparacin para el anlisis de los efectos (generalmente un no-
tratamiento). En determinadas ocasiones (por ejemplo cuando se pretende
determinar entre dos o mas tratamientos cul es el mejor), cada tratamiento
actuara como control del resto.

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Experimentos manipulativos y experimentos mensurativos
En sentido estricto, un experimento es un procedimiento de investigacin en el
que todos los factores ambientales estn bajo control. Como consecuencia es
imprescindible manipular las condiciones en las que se realiza el estudio:
hablamos de experimentos manipulativos o estudios experimentales.
No obstante, muchas investigaciones utilizan procedimientos de obtencin de
la informacin no manipulativos que reciben la denominacin de muestreos.
El muestreo es un procedimiento de observacin y medida exclusivamente:
hablamos de estudios observacionales, experimentos mensurativos, o
experimentos naturales.
Generalmente el tratamiento estadstico en ambos casos es idntico, pero la
diferencia radica en la confianza y generalidad que podemos atribuir a las
conclusiones derivadas del estudio. En cualquier caso, los principios generales
del diseo experimental deben ser igualmente aplicados.
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Elementos clave en el diseo experimental
1. Replicacin y pseudorreplicacin
Replicar consiste en disponer al menos de dos unidades experimentales por
cada tipo de tratamiento. La incorrecta consideracin de lo que constituye
una unidad experimental se conoce como pseudorreplicacin.
2. Aleatorizacin y espaciamiento
Otro aspecto fundamental es la distribucin de las rplicas en el espacio: un
esquema de disposicin espacial aceptable debe considerar la adecuada
separacin o espaciamiento (interspersion) de aquellas unidades
experimentales con el mismo tratamiento. Lo ideal es una distribucin
aleatoria.
3. Control del diseo
Por control del diseo nos referimos a la consideracin de otros elementos
que tiene por objeto reducir el error experimental.
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Elementos clave en el diseo experimental
1. Replicacin y pseudorreplicacin

Fuente: Krebs (1999)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Elementos clave en el diseo experimental:
2. Aleatorizacin y espaciamiento

Fuente: Krebs (1999)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Elementos clave en el diseo experimental
3. Control del diseo
Para reducir el error experimental (es decir, para que las conclusiones de las
comparaciones estadsticas sean ms precisas), hay que considerar:
a) usar unidades experimentales ms homogneas;
b) usar informacin de variables adicionales medidas en cada unidad
experimental (anlisis de la covarianza);
c) usar ms rplicas;
d) usar un diseo experimental ms eficiente: diseos equilibrados o
balanceados (balancing) y uso de bloques (blocking).

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Factores (efectos) fijos y factores (efectos) aleatorios
Una variable la consideramos factor fijo cuando sus niveles o valores son
considerados de inters especfico en la investigacin y son seleccionados o
deliberadamente.
Una variable la consideramos como factor aleatorio cuando sus niveles o
valores se seleccionan aleatoriamente entre todos los posibles. [No confundir
con el concepto de variable aleatoria.]
Los efectos fijos son los que analizamos normalmente sobre observaciones
estadsticamente independientes. Los efectos aleatorios surgen cuando
tenemos ms de una observacin en cada unidad experimental (Venables y
Ripley 2002).
Segn los factores considerados, tenemos diseos (y modelos estadsticos)
fijos, aleatorios o mixtos (si incluyen ambos tipos de efectos).

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
4. Fundamentos del diseo experimental
Tipos de diseo experimental (Krebs 1999)
1. Modelos lineales aditivos 5. Diseos anidados
2. Diseos factoriales 6. Diseos de cuadrado latino
3. Diseos de bloques aleatorios 7. Diseos de medidas repetidas
4. Diseos split-plot 8. Estudios de impacto ambiental

Tipos (en funcin de la naturaleza de las variables) (Gotelli y Ellison 2004)

Variable independiente
Variable dependiente Continua Categrica
Continua Regresin ANOVA
Categrica Regresin logstica Tabular

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
5. Anlisis estadstico: enfoques metodolgicos
Anlisis paramtrico
Anlisis Bayesiano
Anlisis de Monte Carlo
Anlisis no paramtrico
Seleccin de modelos e inferencia multimodelo

Ronald Fischer (1890-1962)


Fuente: Wikimedia Commons

Anlisis paramtrico (clsico, convencional o frecuentista)


Asume que los datos se ajustan a un determinado tipo de distribucin
conocida. Estima los parmetros de dicha distribucin a partir de los datos.
Aqu la probabilidad se define como la frecuencia relativa de una caracterstica
de los datos.

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
5. Anlisis estadstico: enfoques metodolgicos
Anlisis Bayesiano
El anlisis Bayesiano es mucho ms antiguo (s. XVIII) que el frecuentista, pero
es ms complejo y su uso no se ha generalizado hasta el desarrollo de software
accesible para la mayora de usuarios (WinBUGS).
La estadstica Bayesiana tambin asume que los datos se ajustan a una
distribucin, pero los parmetros se estiman no solo a partir de los datos, sino
tambin de informacin o conocimiento previo, y asigna probabilidades a esos
parmetros. Por tanto, la probabilidad se usa para expresar la incertidumbre
sobre un parmetro (en estadstica clsica es sobre los datos).
La receta para un anlisis Bayesiano es (Lindley 1983):
Qu es lo que no sabes y te interesa? Llmalo .
Qu sabes? Llmalo D.
Ahora calcula P ( |D).
Cmo? Usando las reglas de probabilidad. Thomas Bayes (1702-1761)
Fuente: Wikimedia Commons

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
5. Anlisis estadstico: enfoques metodolgicos
Anlisis de Monte Carlo (tests de aleatorizacin)
No asume ningn tipo de distribucin paramtrica de los datos (por ejemplo,
normalidad). Utiliza la aleatorizacin de los datos observados (permutaciones
aleatorias).
Anlisis no paramtrico
Se fundamentan en el anlisis de los datos transformados en sus rangos
(nmero de orden), pero son un caso especial de anlisis de Monte Carlo.
Actualmente su uso no se recomienda (Gotelli y Ellison 2004) porque:
a) con la transformacin se pierde mucha informacin,
b) las tcnicas paramtricas son a menudo robustas frente las
violaciones de las asunciones (gracias al Teorema del Lmite Central), y
c) solo hay mtodos disponibles para anlisis simples.
Seleccin de modelos e inferencia multimodelo: punto 7
Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
6. Anlisis estadstico: conoce tus datos
Exactitud y precisin
Son dos aspectos fundamentales en el proceso de obtencin de datos. La
ausencia de exactitud se denomina sesgo (bias). La precisin se refiere a la
dispersin de los datos y se relaciona con la repetibilidad y la reproducibilidad.

Fuente: Wikimedia Commons

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
6. Anlisis estadstico: conoce tus datos
Representa tus datos Variable de respuesta
> sewage (dependiente)
> attach(sewage)

Covariable Tratamiento
(variable
categrica
independiente)
Tamao
de la
muestra
(8 + 8)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
6. Anlisis estadstico: conoce tus datos
Representa tus datos grficamente
> hist(coliform)
> plot(day, coliform, col=factor(method))

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
6. Anlisis estadstico: conoce tus datos
Box plot (box-and-whisker plot, diagrama de caja)
> boxplot(coliform ~ method)

Fuente: Wikimedia Commons

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
6. Anlisis estadstico: conoce tus datos
Barras de error
Barra de error Tipo Descripcin Frmula
Amplitud entre los extremos de los
Rango Descriptivo El mayor valor menos el menor
datos

Desviacin Diferencia media entre los datos y ( 2


Descriptivo SD =
estndar (SD) su media 1

Medida de la variabilidad de la
Error estndar Inferencial media, si el estudio se repite SE = SD
muchas veces
Intervalo de valores entre los
Intervalo de cuales se estima que estar la media
Inferencial ,1 2 SE
confianza (CI) verdadera con una determinada
probabilidad de acierto
Fuente: Cumming et al. (2007)

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
6. Anlisis estadstico: conoce tus datos
Requisitos de normalidad y homocedasticidad. Transformaciones
La aplicacin de los test paramtricos presenta una serie de requisitos que
deben cumplir los datos: independencia, normalidad (ajuste a una
distribucin normal) y homogeneidad de varianzas (homocedasticidad).
La independencia se consigue con un diseo experimental (o de muestreo)
adecuado. Si tenemos datos no independientes hay que utilizar las tcnicas
adecuadas para analizarlos (modelos mixtos).
La normalidad y la homocedasticidad (en el caso de variables continuas) se
pueden conseguir a travs de transformaciones (por ejemplo aplicando
logaritmos).
No obstante, los tests paramtricos suelen ser robustos frente a las
violaciones de estos requisitos.

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Diseo experimental y anlisis estadstico
7. Anlisis estadstico: mtodos y modelos
Guion de ejercicios prcticos
ANOVA, regresin lineal y ANCOVA
ANOVA de dos factores
Modelos lineales generalizados
Ms sobre regresin
Modelos mixtos
Modelos anidados
Anlisis split-plot
Anlisis de datos pareados
Tablas de contingencia, chi-cuadrado y anlisis log-lineal
Tablas de contingencia con ms de un factor
Seleccin de modelos e inferencia multimodelo

Competencias transversales encaminadas a la mejora del Trabajo Fin de Grado Facultad de Biologa
Bibliografa recomendada
Gotelli NJ, Ellison AM. 2004. A Primer of Ecological Statistics. Sinauer,
Sunderland, MA.
Krebs CJ. 1999. Ecological Methodology. 2 ed. Benjamin/Cummings,
Menlo Park, CA.
Venables WN, Ripley BD. 2002. Modern Applied Statistics with S. 4 ed.
Springer, New York.
Otras referencias citadas

Burnham KP, Anderson DR. 2002. Model Selection and Multimodel Inference. 2 ed. Springer, New York.

Cumming G, Fidler F, Vaux DL. 2007. Error bars in experimental biology. The Journal of Cell Biology, 177: 7-11.
Hilborn R, Mangel M. 1997. The Ecological Detective. Confronting Models with Data. Princeton University
Press, Princeton, NJ.

Kry M. 2010. Introduction to WinBUGS for Ecologists. Elsevier, Amsterdam.

Kry M, Schaub M. 2012. Bayesian Population Analysis Using WinBUGS. Elsevier, Amsterdam.

Lindley DV. 1983. Theory and practice of Bayesian statistics. Statistician 32: 1-11.

Royle JA, Dorazio RM. 2008. Hierarchical Modeling and Inference in Ecology. Elsevier, Amsterdam.

Wiens JA. 1989. The Ecology of Bird Communities. Cambridge University Press, Cambridge.

Diseo experimental y anlisis estadstico Facultad de Biologa