Está en la página 1de 12

Temas actuales en Etología

La Medición de la Repetibilidad
y el Error de Medida

J.C. Senar

Museu de Zoologia, Ap. Correus 593, 08080 Barcelona


jcsenar@intercom.es

Imaginemos a un macho de Pavo real desplegando su espectacular cola


ante una hembra. Imaginemos que estamos estudiando cuales son las
características que ha de presentar un macho para aumentar sus posibilidades
de ser escogido por la hembra. Nuestra hipótesis es que los ocelos de la cola
pueden ser un factor clave. En este estudio, como en cualquier otro, hemos de
1
medir diferentes variables , por ejemplo, contar el número de ocelos, medir su
anchura y longitud, o el grado de saturación de su color. Cuando medimos una
variable generalmente consideramos que lo hacemos con exactitud.
Desgraciadamente, esto no es siempre así. Es difícil que nos equivoquemos al
contar el número de ocelos, especialmente si lo hacemos sobre una foto. Sin
embargo, al medir una longitud o las variables relacionadas con el color de un
objeto, las posibilidades de error son ya mayores, especialmente cuando el
grado de precisión en la medición del objeto depende de la experiencia del
investigador.

Conocer cual es el error de medida que cometemos, y por tanto, lo


replicables que son nuestras medidas es de suma importancia; en primer lugar
para saber si las mediciones obtenidas describen con facilidad la variable que
estamos tomando; una de las condiciones imprescindibles de todo estudio es
que sea repetible, y que si cualquier otro investigador realiza las mismas
mediciones obtenga los mismos resultados. En segundo lugar, si queremos
analizar qué diferencias existen entre individuos o entre sexos en una
determinada variable, el error de medida debe ser más pequeño que la
diferencia que queremos detectar.
Medición de la Repetibilidad
y el Error de Medida J.C. Senar

Si machos y hembras difieren por ejemplo en unos tres milímetros en relación a


la longitud de su cola, y el error que cometemos es en promedio de unos cinco
milímetros, evidentemente nunca podremos detectar que los dos sexos difieren
en el tamaño de la cola. Este problema ha sido especialmente discutido en
estudios de asimetría fluctuante, en los que el grado de asimetría (e.g, en la
longitud de los dos extremos de la cola) es muchas veces menor que el error de
16
medida .

Repetibilidad V.S. Error de medida

La repetibilidad (también conocida como coeficiente de correlación


27,33
intraclase ) es una medida estadística de la consistencia entre medidas
repetidas de un mismo carácter en un mismo individuo. Generalmente se la
denomina como ri y su valor se expresa como una proporción. Un valor de
repetibilidad de uno indica que la medida es perfectamente consistente y
repetible, y que el investigador no comete ningún error en la medición de ese
carácter. Un valor de cero indica que las medidas repetidas obtenidas de ese
carácter son tan distintas como si se hubieran tomado a partir de individuos
9
distintos tomados al azar .

El Error de Medida (EM) se define como la proporción de variación


fenotípica de un carácter atribuible al error que se pueda cometer en su
medición. De hecho, este valor es el inverso que el de la repetibilidad.

Medición de la Repetibilidad

Para valorar el grado de repetibilidad de una determinada medición, el


investigador debe medir el mismo carácter, en el mismo individuo, al menos dos
veces. La segunda medición, evidentemente, debe realizarse sin recordar ni
comprobar cual era el valor obtenido en la primera medición. Un buen método
puede ser medir una primera vez a I0-20 individuos, marcarlos individualmente,
colocarlos en una jaula o bolsa, y volverlos a medir extrayéndolos al azar,
apuntando los nuevos valores de medición en otra hoja distinta.
Temas actuales en Etología

Cuadro 1. Ejemplo ilustrativo de como se debe calcular la repetibilidad y el error de medida de


un carácter. El ejemplo se ilustra con datos sobre la variación en el tamaño del babero negro
del Lúgano (Carduelis spinus) obtenidos a partir de pieles de Museo. El Lúgano utiliza ese
babero como señal de estatus de dominancia: cuanto mayor es el babero, más dominante es
ese individuo, y más lo evitan sus compañeros 25. Como puede observarse, este carácter es
muy variable, de 0 a más de 70 mm z, lo que aumenta la repetibilidad del carácter.
Medición de la Repetibilidad
y el Error de Medida J.C. Senar

Los distintos valores se introducen luego en una base de datos que conste
de dos columnas: una donde aparezca cada individuo tantas veces como sea
medido y otra donde aparezcan las medidas tomadas para cada uno de los
individuos. En el caso más simple (y aconsejado), cada individuo aparecerá dos
veces, con sus dos medidas (Cuadro 1). A continuación se realiza un Análisis de
la Varianza de un solo factor (ANOVA), en el que el factor analizado es el
individuo (la columna con los identificadores individuales). La repetibilidad se
calcula a partir de los valores obtenidos en esa ANOVA (Cuadro 1). Si el
número de medidas por individuo ha sido dos, la repetibilidad equivale a
calcular:

donde E es la varianza entre individuos y D la varianza dentro de los individuos.


Para mayor claridad, ver el Cuadro 1. Si se toman más de dos medidas por
individuo, o el número de medidas tomadas varia según individuos, consultar el
trabajo de Harper 9.

El Error de Medida (EM), como ya se ha comentado, es el inverso del valor


de repetibilidad. En el Cuadro I se resume como puede computarse este valor.

La forma de computar los límites de confianza de las medidas de


11
repetibilidad pueden consultarse en Krebs , Una aproximación no paramétrica
para el análisis de la repetibilidad puede consultarse en Rothery 24 y en Harper 9.

¿Cuándo un valor de repetibilidad es satisfactorio?

Se considera que un carácter que presenta un valor de ri mayor de 0,70


puede considerarse como repetible 9, aunque para poder tomar ese carácter
como verdaderamente fiable deberíamos obtener repetibilidades mayores de
0,90 9,15,17.

La experiencia del investigador aumenta el grado de repetibilidad de sus


medidas. Mientras esta experiencia no llega, una buena forma de aumentar la
repetibilidad es realizar varias mediciones del mismo carácter y considerar su
media o mediana 32
Temas actuales en Etología

En algunos casos, sin embargo, existen algunas medidas muy poco


repetibles, incluso aunque el investigador sea muy experimentado. Ello puede
suceder por ejemplo al medir una mancha de color en el plumaje de un ave,
debido a que la superficie de la mancha es irregular y además puede variar
considerablemente según la posición de las plumas y lo "peinado" que esté el
animal. La anchura de la corbata negra que el Carbonero común Parus major
presenta en su pecho, medida por algunos investigadores en su punto de
8
máxima anchura, presenta repetibilidades de tan solo 0,66 . En este caso y
otros similares esta claro que hemos de buscar otra forma más exacta de medir
la mancha, como puede ser la anchura en su punto mínimo (ri= 0,91) o la
superficie total de la mancha (ri= 0,98) a partir de fotografías digitales y su
8
posterior análisis en el ordenador .

Factores que afectan a la repetibilidad

Los valores de repetibilidad de los distintos caracteres pueden ser muy


variables (tabla l). Los principales factores implicados en esta variabilidad son:
1). La facilidad en tomar la medida, 2). El tamaño del carácter, 3). El rango de
variación de la medida, y 4). El grado de precisión del utillaje utilizado. Hay
caracteres que son más fáciles de medir que otros. Por ejemplo, la presión
ejercida al medir la longitud del ala de un ave puede hacer variar el resultado de
este valor, es por ello que se aconseja que en lugar de la longitud del ala se
mida la longitud de la primaria más larga, que proporciona una mayor fiabilidad
10,14
. La longitud del pico se puede medir desde la punta hasta el cráneo o hasta
31
el borde dista¡ de la narina , El agujero de la narina es muy fácil de acotar,
mientras que encontrar donde termina el pico y empieza el cráneo es más difícil;
como consecuencia de ello, el error de medida al medir el pico hasta el cráneo
es mucho mayor que si se mide hasta la narina 4. El color amarillo que presenta
el Verdecillo Serinus serinus en el pecho es mucho más homogéneo que el que
aparece en el obispillo, zona en la que aparecen muchas listas de color pardo.
Como consecuencia de ello, la repetibilidad del grado de saturación del amarillo
7
en el pecho es mucho mayor que si esta se mide en el obispillo .
Medición de la Repetibilidad
J.C. Senar
y el Error de Medida

El tamaño de un carácter es otro de los factores importantes que afectan al valor de


repetibilidad. Cuanto mayor es el carácter a medir, menor será su error de medida, simplemente
porque para un mismo valor absoluto de error, el error será proporcionalmente mayor en medidas
pequeñas que en las grandes. La longitud de la cola del Verdecillo es de unos 48 mm, y pese a
que el error medio en su medición es de 0,42 mm., el error de medida es del 13% 26. En cambio,
la cola de la Golondrina, con una longitud media en los machos de 107 mm., tiene un 0% de error
de medida 18 (Tabla I ). Ello quiere decir que cuando midamos animales pequeños la repetibilidad
de nuestras medidas será menor que cuando midamos animales grandes.

Otro factor importante es el rango de variación de la medida. Las medidas poco variables
conllevan mayores errores de medida que las muy variables: un error de 1 mm en una medida
que varia entre 25 y 27 mm es mucho más importante que el mismo error en otra medida que
varíe entre 10 y 50 mm. Si queremos medir el tamaño de la corbata del Carbonero común, la
anchura máxima varia de 14 a 26 mm, mientras que el área total varia de 304 a 1235 mm 2,8. A
parte de otras consideraciones, el mayor rango de variación del área le dará una mayor
repetibilidad.
Temas actuales en Etología

Si al medir la repetibilidad de una medida juntamos machos y hembras, aumentando así


el rango de variación debido al factor sexo, aumentaremos artificialmente su
repetibilidad, A la hora de tomar una submuestra de individuos para medir la
repetibilidad de una medida hemos de procurar que esa submuestra sea
representativa de la variabilidad de la población.

La repetibilidad puede variar también según el método de medición


utilizado. El peso de un animal es más repetible si se mide con una balanza
digital a una precisión de 0,1 gr. que si se mide con un dinamómetro con
precisión de 0,5 gr.

La existencia de todos estos factores de variabilidad hace que dentro de las


distintas medidas alternativas aquellas con mayor rango de variación y de mayor
tamaño serán las más recomendables. Adicionalmente, y debido a que hay
variables más fáciles de medir que otras, antes de escoger una medida hemos
de comprobar su repetibilidad y comprobar si el método que utilizamos es el
más adecuado.

Errores más corrientes en la medición de la repetibilidad

Cuando se dispone de dos mediciones repetidas de un carácter, un error


corriente es computar la correlación entre esas dos mediciones como medida de
repetibilidad. Esta aproximación es totalmente errónea 9 . Si resulta que la
segunda medición siempre nos sale el doble que la primera, el valor de
correlación será de uno, pero la repetibilidad será muy baja 9 .

Otro error corriente es medir la repetibilidad aplicando en la fórmula antes


explicada los valores de los cuadrados mínimos en vez de las componentes de
11,12
la varianza entre y dentro de los grupos . Esto siempre exagera falsamente
la repetibilidad.

Finalmente comentar que el hecho de que al medir un carácter seamos


muy repetibles no quiere necesariamente decir que seamos muy precisos 32 . Un
investigador con baja repetibilidad forzosamente ha de medir de forma
imprecisa, pero un investigador con alta repetibilidad no debe asumir
automáticamente que es preciso en sus mediciones 9 .
Medición de la Repetibilidad
y el Error de Medida J.C. Senar

Se puede dar el caso de que dos investigadores con alto nivel de repetibilidad
difieran en el valor exacto de sus medidas. En este caso los datos deben
estandarizarse respecto a uno de ellos, haciéndolos así comparables 2,29,30 . En la
mayoría de estudios, sin embargo, en los que un solo investigador analiza
1
relaciones o diferencias entre variables , es más importante ser consistente y
11
repetible en las medidas que se toman que no preciso .

Otros usos de la repetibilidad

Hasta aquí hemos hablado de la repetibilidad como un concepto


equivalente al de exactitud de una medida. Esto es cierto cuando las dos
medidas repetidas se toman una a continuación de otra o en periodos de tiempo
muy breves. Si medimos la longitud del ala de varios individuos en dos años
sucesivos, durante este espacio de tiempo el carácter puede haber variado
13,22,23,28,
. En este caso la repetibilidad puede utilizare como medida de la
consistencia de una variable entre años. Un carácter que varia mucho entre
años por fuerza no puede tener una fuerte carga genética y por tanto no puede
ser heredable, se dice que el grado de repetibilidad entre años de un mismo
carácter nos da su límite superior de heredabilidad 6 . En este sentido, la
repetibilidad entre años puede utilizare como una medida aproximada de la
heredabilidad del carácter 3 . La longitud de la cola de la Golondrina Hirundo
rustica tiene muy poco error de medida. La repetibilidad calculada en los machos
capturados dentro de la misma primavera es de ri = 0.998 18 . Si esta misma
repetibilidad de los machos se mide tomando valores de longitud en dos años
distintos, sus valores son todavía altos y significativos, lo que sugiere la
heredabilidad del carácter (ri = 0.83 [tomando valores corregidos para efecto
18
edad) . Análisis posteriores comparando la longitud de la cola de padres e
hijos de Golondrina confirma que esta heredabilidad es significativa 18 .

Una aproximación similar puede utilizare para comprobar la heredabilidad de


otros caracteres como el tamaño de puesta o la resistencia a los parásitos.
19
Møller comprobó que la estimación del número de Malófagos que parasitaban
a las Golondrinas era altamente repetible, tanto dentro del mismo año (ri = 0,99)
como entre años (ri = 0,96), por lo que concluyó que el grado de resistencia a los
parásitos de un individuo debe venir determinado genéticamente. Experimentos
20
posteriores han demostrado que esto es realmente así .
Temas actuales en Etología

Otra utilidad de la medida de repetibilidad es estudiar la consistencia de


caracteres de tipo conductual o ecológico. En la Golondrina, los machos de cola
larga están menos parasitados y presentan una mejor condición física general
que los de cola más corta 20 . En consecuencia, no es de extrañar que los
machos de cola larga sean preferidos por las hembras a la hora de buscar
pareja 20 . Con esta aproximación Møller demostró que esta preferencia es
consistente de un año a otro y que las hembras que escogen individuos de cola
larga un año siguen al año siguiente mostrando la misma preferencia ( r,= 0,57,
21
p<0,00 I) .

Valoración final

Cuando medimos un carácter, sea morfológico, conductual o ecológico, no


debemos asumir que lo medimos de forma consistente: el análisis de la
bibliografía muestra que existen errores de medida. Por tanto, antes de
cualquier estudio debe medirse la repetibilidad de medida del carácter
seleccionado. Esta repetibilidad depende de varios factores: hay caracteres más
fáciles de medir que otros; los caracteres de mayor tamaño o con mayor rango
de variación, tienen mayor nivel de repetibilidad; el método de medición también
puede afectar a la repetibilidad. Todo esto ha de ser tenido en cuenta a la hora
de escoger la variable que vamos a estudiar.

Agradecimientos
A M' Luisa Arroyo y Jordi Doménech por la lectura crítica del manuscrito.
Medición de la Repetibilidad
y el Error de Medida J.C. Senar

Bibliografía

1 .Barnard, C., Gilbert, F. & McGregor, P. (1993) Asking cuestiones in biology,


Longman Scientifc & Technical, Essex, UK

2 Barrett, R.T., Peterz, M., Furness, R.W. & Durinck, J. (1989) The variability of
biometric measurements. Ringing & Migration 10, 13-16

3. Boag, P.T. & van Noordwijk, A.J. (1987) in Avian genetics: A population and
ecological approach (Cooke, F. & Buckley, P.A, eds.), pp. 45-78, Academic
Press, London

4. Borras, A., Pascual, J. & Senar, J.C. (2000) What do different bill measures
measure and what is the best method to use? J. Field Ornithol. 71 , (en
prensa)

5. Carrascal, L.M., Senar, J.C., Mozetich, I., Unbe, F. & Domènech, J. (1998)
Interactions among environmental stress, body condition, nutritional status,
and dominance in Great Tits. Auk 1 15, 727-738

6. Falconer, D.S. (1983) Introduction to quantitative genetics, Longman, London

7. Figuerola, J., Pascual, J. & Senar, J.C. (1999) The use of a colorimeter in feld
studies of Blue Tit Parus caeruleus coloration. Ardea (en prensa)

8. Figuerola, J. & Senar, J.C. (1999) The measurement of plumage badges: an


example on the Great Tit. Ibis 141, (en prensa)

9. Harper, D.G.C. (1994) Some comments on the repeatability of


measurements. Ringing & Migration 15, 84-90

10 Jenni, L. & Winkler, R. (1989) The feather-length of small passerines: a


measurement for wing-length in live birds and museum skins. Bird Study 36,
1-15

11 . Krebs, C.J. (I 989) Ecological methodology, Harper Collins, New York


Temas actuales en Etología

12. Lessells, C.M. & Boag, P.T. (I 987) Unrepeatable repeatabilities: a common
mistake. Auk 104, I 16-121

13. Leverton, R. (I 989) Wing length changes in individually-marked Blackbirds


Turdus merula following moult. Ringing& Migration 10, 17-25

14. Massi, A. & Spina, F. (1995) Accuratezza di due diversi metodi per la
misurazione della lunghezza dell'ala utilizzati da operatori inesperti. Avocetta
19, 219-220

15. Merilä, J. (1996) Genetic and Quantitative trait variation in natural bird
populations. PhD Thesis, Uppsala University

16. Merilä, J. & Björklund, M. (1995) Fluctuating asymmetry and measurement


error. Syst.Biol. 44, 97-101

17. Merilä, J. & Gustafsson, L. (1993) inheritance of size and shape in a natural
population of collared flycatchers Ficedula albicollis. J. evol. Biol. 6, 375-395

18. Møller, A.P. (1991) Sexual seletion in monogamous bam swallow (Hirundo
rustica), I. Determinants of tail ornament size. Evolution 45, 1823- 1836

19. Møller, A.P. (1991) in Bird-parasite interactions. Ecology, evolution and


behaviour (Loye, J.E. & Zuk, M. eds.), pp. 328-343, Oxford University Press,
Oxford

20. Møller, A.P. (1994) Sexual selection and the Barn Swallow, Oxford Univ.
Press, Oxford

21, Møller, A.P. (1994) Repeatability of female choice in a monogamous


swallow. Anim. Behav. 47, 643-648

22. Nielsen, B. (1993) Age dependent variation in wing length of Bearded Tits
Panurus biarmicus. Ornis Svecica 3. 117- 124

23. Nilsson, J.A. (1992) Variation in wing length in relation to sex and age of
Marsh Tits Parus palustris. Ornis Svecica 2, 7-12
Medición de la
Repetibilidad y el Error J.C. Senar
de Medida

24. Rothery, P. (1979) A non-parametric measure of intraclass correlation.


Biometrika 66, 629-639

25.Senar, J.C. & Camerino, M. (1998) Status signalling and the ability to
recognize dominants: an experiment with siskins (Corduelis spinus). Proc. R.
Soc. Lond. B 265, 1515-1520

26. Senar, J.C. & Pascual, J. ( 1997) Keel and tarsus length may provide a good
predictor of avian body size. Ardea 85,

27. Sokal, R.R. & Rohlf, F.J. (1981) Biometry, W.H.Freeman,


New York

28. Stewart, I.F. (1963) Variation of wing length with age. Bird
Study 10, 1-9

29. Summers, R.W., Jardine, D.C., Marquiss, M. & Proctor, R. (1996) The
biometrics of invading Common Crossbills Loxia curvirostra in Britain during
1990-1991. Ringing & Migration 17, 1-10

30. Summers, R.W., Nicoll, M., Underhill, L.G. & Petersen, A. (1988) Methods
for estimating the proportions of Icelandic and British Redshanks Tringo
totanus in mixed populations wintering on British coasts. Bird Study 35,
169-180

31 . Svensson, L. (1992) Identification guide to European Passennes,


L.Svensson, Stockholm

32.Topping, J. (1955) Errores of observation and their treatment, Chapman &


Hall, London

33.Zar, J.H. (1984) Biostatistical analysis, Prentice Hall,


Englewood Cliffs, NJ