Está en la página 1de 8

Istopos Ambientales en el Ciclo Hidrolgico IGME. Temas: Guas y manuales.

ISBN: 84-7840-465-1

13 ERRORES, MEDIAS Y AJUSTES

Este captulo contiene una seleccin de la informacin bsica acerca del anlisis de las incertidumbres, y el tratamiento de grandes cantidades de datos. Se empieza con una discusin de los errores, para llegar a un mtodo que ayude a juzgar cuan probable es un resultado final.

13.2 PRECISIN Y EXACTITUD


13.2.1 DEFINICIONES Resulta importante distinguir entre precisin y exactitud. 1) La precisin de un resultado es una medida de la reproductividad de una observacin, o sea de cuan bien se puede reproducir el resultado, independientemente de lo cerca que se encuentre del valor verdadero. Al error asociado se le denomina incertidumbre de un resultado. 2) La exactitud es una medida de lo correcta que es una observacin, o sea cuan cerca est del valor verdadero. Los dos conjuntos de definiciones se pueden relacionar de manera sencilla. La precisin es una medida de las dimensiones de los errores aleatorios. Si se consiguen reducir los errores aleatorios, por ejemplo a partir de un equipo mejor o de procedimientos mejores, la precisin de la medida ser mejor, el resultado ser ms preciso, y el anlisis ms reproducible. El trabajo de cada laboratorio por separado consiste en reducir los errores aleatorios para aumentar la precisin. Por otro lado, un error sistemtico afecta directamente la exactitud de la medida; si se evitan o se eliminan los errores sistemticos, el resultado ser ms exacto y ms creble. A menudo, el objetivo de la comparaciones internas que se llevan a cabo en algunos laboratorios a nivel internacional consiste en incrementar la exactitud del resultado mediante el anlisis de muestras que se encuentren bajo las mismas condiciones y utilizando estndares definidos. Para poder estudiar y eventualmente reducir los errores sistemticos es importante disponer de datos con pequeos errores aleatorios, que posean una preci159

13.1 ERRORES
En los diccionarios la palabra error se define como la diferencia entre el valor aproximado que resulta de una observacin, una medida o un clculo, y el valor verdadero. El problema surge cuando se ha de conocer el valor verdadero, que generalmente se obtiene como resultado de una medida o de un clculo. Por este motivo se debe encontrar un mtodo para estimar la fiabilidad del resultado obtenido. La palabra errores no est bien definida como tal. Por lo tanto, la definicin ha de ser ms rigurosa. Los errores se pueden clasificar como: 1) Equivocacin o error en la medida o en el clculo; son normalmente aparentes, ya que se encuentran lejos de los valores esperados. Se detectan repitiendo la medida o el clculo. 2) Errores sistemticos, que son ms difciles de detectar. Estas discrepancias son reproducibles. A menudo es el resultado de un fallo en la instrumentacin o provienen de una consistencia matemtica insuficiente. Estos errores se encuentran (y se corrigen) repitiendo el anlisis con diferentes equipos o repitiendo el clculo (por otros medios, o por un compaero). 3) Errores aleatorios, que son los ms comunes. Son debidos a la inevitable limitacin de la calidad de los instrumentos. Slo se pueden eliminar parcialmente si se refina el equipo o el mtodo analtico, y repitiendo las medidas (como por ejemplo, leer una temperatura o el pH) o aumentando el tiempo de observacin (como por ejemplo el tiempo de medida de radioactividad).

Errores, Medias y Ajustes

sin relativamente elevada. Por otro lado, cuando el error sistemtico es grande, es una perdida de tiempo y de dinero invertir mucho esfuerzo en incrementar la precisin. La Fig.13.1 ilustra la diferencia entre la precisin y la exactitud.

13.2.2 CIFRAS Y DGITOS SIGNIFICATIVOS Una regla muy comn a la hora de publicar nmeros consiste en indicar la incertidumbre mediante cifras y los dgitos del nmero que se escribe. Cuando se describe una distancia como 5000 km, por sentido comn normalmente se consideran las cifras situadas ms a la izquierda. No obstante, si se sabe con certeza la cifra siguiente (el 0 situado ms a la izquierda), se escribir como 5,0103 km. Por lo general es preferible escribir los nmeros segn la notacin cientfica, es decir, el argumento en notacin digital con un nmero de dgitos, multiplicado por una potencia de 10. Los dgitos que presentan ms incertidumbre son los situados ms a la dere-

cha. A modo de regla puede decirse que la precisin de la incertidumbre (esto es, el grado de certeza de la incertidumbre) nunca es mejor que 10% de la incertidumbre. Por ejemplo, si la medida de la radioactividad de una muestra es 13,56 Bq, podra presentar una incertidumbre de 13,560,12 o 13,560,08, pero si se da un dgito ms en la incertidumbre, es decir, 13,560,081 se estara exagerando la certeza de la incertidumbre. La incertidumbre tambin determina el nmero de dgitos citados. Por ejemplo, seria correcto citar 13,560,12 Bq, pero no seria consistente escribir 13,5640,12 Bq. En los clculos realizados con ordenador se conservan todos los dgitos; slo se redondea el resultado final. Sin embargo, los resultados que se van escribiendo durante un clculo matemtico se han de dar con un nmero de dgitos que pueda ser justificado. No obstante, el clculo completo se efecta sin realizar un redondeo intermedio.

Fig.13.1 Grficas que ilustran la precisin y exactitud. Se muestran dos series de resultados de 19 medidas de la misma radioactividad. A. Los datos son imprecisos pero exactos; el valor medio adecuado es 13,56 Bq. El rea sombreada representa el nivel 1 de confianza; es decir, el 68% de los datos debe estar dentro de este rango (vase el ejemplo en el Apt.13.5.2). B. Los datos son precisos pero inexactos, probablemente por los errores sistemticos; el valor medio ahora es 13,50 Bq, en lugar del valor "verdadero" 13,56 Bq.

160

Errores, Medias y Ajustes

13.2.3 INCERTIDUMBRES Existen dos tipos de incertidumbres. 1) Incertidumbres instrumentales, debido a fluctuaciones en el resultado de cualquier observacin instrumental, independientemente si se mide la temperatura del exterior o se pesa una carta en una balanza de cartas, o si se aplica un equipo de medida ms sofisticado para medir el tiempo en el laboratorio. A partir de una conjetura razonable o mediante la repeticin de la medida observando posteriormente la distribucin de los resultados se puede estimar la dimensin de la incertidumbre. 2) Incertidumbres estadsticas, debido a que ciertos procesos, incluso tericamente, muestran fluctuaciones. Un ejemplo adecuado sera la desintegracin radioactiva. Incluso un equipo ideal (no real) que la medida de la actividad fluctua, o sea que hay una dispersin estadstica de los resultados. En casos como estos existen procedimientos para determinar la incertidumbre ms all de la duda.

13.3.2 DISTRIBUCIN DE LOS DATOS Los resultados de un nmero de medidas se pueden representar por medio de un histograma, que es un grfico que representa el nmero de veces (eje de las y) que fueron obtenidos los diferentes resultados en el eje de las x (Fig.13.2). Es obvio que la probabilidad de obtener un resultado que se encuentre cada vez ms lejos del valor ms frecuente es menor.

13.3 INCERTIDUMBRES INSTRUMENTALES


13.3.1 VALORES MEDIOS La media o el valor medio que resulta de un nmero de medidas se define como la suma de los resultados dividido entre el nmero de medidas: (13.1) N es el nmero de medidas, i representa el nmero de serie de una medida arbitraria y x es el parmetro medido. A menudo se omite N e i = 1, y simplemente se escribe xi. El nmero de medidas siempre es limitado. No obstante, si se pudiese aumentar este nmero hasta infinito, se obtendra una media mejor, definida como (13.2) La mediana se define como el valor que, en un conjunto de datos, presenta tantos datos superiores como inferiores a l. Para una distribucin simtrica, la media y la mediana son idnticas. Posteriormente se utilizan las desviaciones de un resultado nico respecto de la media (o la mediana), x xi; por definicin, la desviacin media de los resultados a partir del valor medio es igual a cero: (13.3)
Fig.13.2 Histograma (en forma de bloques); indica la distribucin irregular de las medidas dentro de un rango de xi(x), es decir, entre xi y xi + x alrededor de la media; en lugar de dar los resultados, se dan las desviaciones respecto del valor medio (x ) junto con el nmero de observaciones (eje y) para valores que pertenezcan a un determinado rango. La curva suavizada ilustra una distribucin Gausiana, que seria el resultado hipottico cuando se cuenta con infinitas medidas. Tambin representa la probabilidad de distribucin (P) de los datos alrededor de un valor medio. Las desviaciones respecto de la media se expresan en funcin de la desviacin estndar (). En la parte superior se muestra la integral o la suma de las probabilidades: la probabilidad de observar valores entre x + y x es 68 %, entre x + 2 y x 2 es 95 % y finalmente entre x + 3 y 3 es 99,7 %.

El histograma (o diagrama de bloques) consiste en unas columnas que representan el nmero de veces (Ni) que se observa el resultado xi(x) dentro de un cierto rango xi y xi + x. Esto recibe el nombre se distribucin muestral. El valor medio es:

y N = Ni

(13.4)

161

Errores, Medias y Ajustes

Si a la hora de construir el histograma se escoge un x o una amplitud de la clase muy grande, casi todos los datos se encontraran dentro de una columna, lo cual implicara una buena certeza estadstica, pero una mala resolucin; si x es demasiado pequea la resolucin incrementar, pero se tendrn escasos datos en cada columna y por lo tanto ser menos fiable (histograma disperso). Cuantas ms medidas se realicen, se tendr una mejor impresin de la distribucin de los datos alrededor de un cierto valor medio. Para un nmero infinito de resultados con errores aleatorios la distribucin de la muestra se representa por medio de una distribucin normal o Gausiana en forma de campana, en la que la probabilidad de observar un cierto valor de y = yi en x = xi es: (13.5) yi es el valor medido de la variable dependiente, y f(xi) es el valor de y calculado para la variable independiente xi; i es la desviacin estndar de yi, que se define posteriormente. El valor ms probable, la moda, corresponde al pico de la distribucin, es decir, la parte superior de la curva suavizada. Para los datos con errores aleatorios, la distribucin es simtrica alrededor de la parte superior. La Fig.13.2 muestra la curva Gausiana junto con el histograma que se obtiene con un nmero limitado de medidas.

(13.7) Por lo tanto la varianza es la media de los cuadrados menos el cuadrado de las medias. La medida cuantitativa de las dimensiones de los errores aleatorios, es decir, de la dispersin estadstica de los datos alrededor de la media, o en otras palabras, de la precisin se representa a partir de la desviacin estndar , que es la raz cuadrada de la varianza. Cuanto ms pequea sea la desviacin estndar, mejor es la precisin, y ms estrecha es la Gausiana. Si a continuacin se considera el conjunto real de medidas, la desviacin estndar del conjunto ser: (13.8) El motivo por el que se considera N1 en lugar de N en el denominador se explica en libros de textos especializados en anlisis estadstico. No se puede utilizar esta definicin cuando se tiene una nica medida; no se puede utilizar una sola medida para determinar la precisin de sta. Por lo tanto, puede que la fraccin no sea un nmero realista. En la actualidad todas las calculadoras de bolsillo poseen instalada las funciones para calcular x y . En la Fig.13.2 se indican varios intervalos de confianza. La probabilidad de que una medida aleatoria se encuentre entrex + yx vale 68%. Esto significa que si se repite una medida se obtendr un nuevo resultado dentro de de la media en el 68% de los casos (intervalo de confianza 1), de 2 en el 95% de los casos (intervalo de confianza 2), y de de 3 en el 99,7% de los casos (intervalo de confianza 3). 13.3.3.2 PRECISIN
DE LA MEDIA

13.3.3 DESVIACIN ESTNDAR 13.3.3.1 PRECISIN


DE LOS DATOS

Resulta obvio que si los errores aleatorios son pequeos, los valores de la desviacin (xi x) sern pequeos y la distribucin de los resultados alrededor de la media ser ms estrecha. La desviacin media es una medida de la dispersin de los datos alrededor de la media. A sta se la conoce con el nombre de dispersin del conjunto de datos. La Ec.13.3 demuestra que no se puede utilizar un simple promedio de todas las desviaciones, ya que este se deriva de la definicin de media. El promedio de los valores absolutos de las desviaciones, esto es, independientemente de su signo, caracteriza mejor la dispersin: (13.6) Sin embargo, por razones matemticas no resulta apropiado utilizar valores absolutos. Por este motivo, si se pretende caracterizar la distribucin se debern considerar los cuadrados de las desviaciones. El valor que resulta recibe el nombre de varianza:

La discusin anterior se ha centrado en la precisin de los datos, que se caracteriza por la desviacin estndar. Es igualmente de importante determinar la incertidumbre del resultado final de un nmero de medidas. Por este motivo se ha de calcular la precisin de la media o, ms concretamente, la desviacin estndar de la media. A continuacin se discute brevemente la propagacin de los errores; es decir, la incertidumbre media obtenida a partir de un determinado nmero de resultados. Como conclusin, la varianza de la media es la varianza del conjunto de datos multiplicado por el nmero de medidas: (13.9)

162

Errores, Medias y Ajustes

La desviacin estndar de la media ser: (13.13) (13.10) Como ejemplo se calcula la media y las desviaciones estndar de los datos que se muestran en la Fig.13.1A y en la Tabla 13.1. Se supone que todos los datos poseen la misma incertidumbre / precisin. Como es obvio, la precisin relativa ser mejor cuanto mayor sea la tasa de detecciones y el tiempo de medida. El problema de los rangos de confianza de los datos observados con incertidumbres estadsticas es similar a las incertidumbres instrumentales de las que se habla en la seccin previa. La probabilidad de que un valor verdadero observado durante un periodo infinito de tiempo se encuentre entre xi + y xi del valor medido representa el 68%: la desviacin estndar representa el 68% del intervalo de confianza, 2 representa el 95% del intervalo de confianza, y 99,7% representa el 3 del intervalo de confianza.

Tabla 13.1 Conjunto de datos correspondientes a la Fig.13.1A. Nr. 1 2 3 4 5 6 7 8 9 10


Media x =

xi 13,55 13,45 13,57 13,68 13,63 13,47 13,69 13,40 13,56 13,52

xi x 0,01 0,11 +0,01 +0,12 +0,07 0,09 +0,13 0,16 +0,00 0,04

Nr. 11 12 13 14 15 16 17 18 19

xi 13,51 13,63 13,52 13,55 13,45 13,62 13,74 13,65 13,45

xi x 0,05 +0,07 0,04 0,01 0,11 +0,06 +0,18 +0,09 0,11

13.5 PROPAGACIN DE ERRORES


13.5.1 DESVIACIN ESTNDAR A menudo resulta necesario conocer una cantidad A que es funcin de una o ms variables, cada una de las cuales posee su propia incertidumbre. La incertidumbre de cada variable contribuye a la incertidumbre global. A continuacin se presentan las expresiones matemticas de 2 para varios casos. Dichas ecuaciones se basan en la relacin general de la funcin: A = f (x, y, z)

13,56

Desviacin estndar x = {(xi de la media = x/191/2 =

13,56)}1/2/18

0,095 0,022

13.4 INCERTIDUMBRES ESTADSTICAS


Las incertidumbres estadsticas, definidas en el Apt.13.2.3, surgen de las fluctuaciones aleatorias del nmero de sucesos, por ejemplo, el nmero de desintegraciones radioactivas por unidad de tiempo, y no como consecuencia de la limitada precisin del equipo de medida. Para estas fluctuaciones estadsticas la teora estadstica proporciona la tcnica matemtica para describir la distribucin de los datos y la desviacin estndar. Por consiguiente, la desviacin estndar de un nmero de detecciones M durante un periodo de tiempo t simplemente es: = M1/2 (13.11)

En el caso que las incertidumbres sean estadsticas, la desviacin estndar de A depender de las variables independientes x, y, z de la siguiente manera: (13.14) Si se estima que las incertidumbres son instrumentales, se utilizan ecuaciones similares para calcular la incertidumbre del resultado final. Para la relacin general: A = f(x, y, z) con las incertidumbres instrumentales x, y y z, la incertidumbre para A ser: (13.15) obteniendo ecuaciones equivalentes para A y para A segn las Ecs.13.16-13.19. En estos ejemplos a y b son coeficientes constantes, x e y son variables independientes; A es la variable dependiente.

La desviacin estndar para la tasa de detecciones R, esto es, el nmero de detecciones por segundo, ser: (13.12) La incertidumbre relativa de la tasa de detecciones se expresa mediante:

163

Errores, Medias y Ajustes

1) A = ax + by; tambin A = ax, con las incertidumbres x y y; en ambos casos: A2 = a2x2 + b2y2 (13.16)

obtener el ajuste ms probable de una funcin respecto a una serie de datos, tanto grfico como algebraico. El ajuste ms utilizado es la lnea recta, ya que normalmente se considera que los datos siguen una relacin lineal.

2) A = a xy; tambin A = a x/y 13.6.1 AJUSTE LINEAL (13.17) 3) A = a e bx (13.18) El principio fundamental del ajuste por mnimos cuadrados consiste en minimizar la suma de los cuadrados de las desviaciones de la variable dependiente (y) (se considera que la incertidumbre en x es despreciable) de la lnea recta definida con los coeficientes a y b: y = a + bx (13.22)

A/A = bx 4) A = a ln( bx) A = a x/x

(13.19)

13.5.2 MEDIA PONDERADA Hasta el momento se ha considerado que todos los valores promediados posean la misma precisin y por tanto el mismo peso. Si se aplica a cada nmero su propia desviacin estndar, la media se calcular segn:

La desviacin de cualquier valor de y (yi) respecto de la lnea recta se expresa como yi = yi f(xi) = yi a bxi (13.23)

Al minimizar la suma de las desviaciones resulta: yi = 0 (13.24)

(13.20)

mientras que la desviacin estndar de la media se expresa como:

Si se hiciese lo mismo con los valores absolutos de yi no se obtendra un procedimiento matemtico til. Por consiguiente, es imprescindible buscar un procedimiento que proporcione los coeficientes a y b que caracterizan la lnea recta, el cual cumpla que la suma de los cuadrados de las desviaciones: (yi)2 = (yi a bxi)2 (13.25)

sea mnima. Las condiciones para el ajuste son: obteniendo as: y (13.21) El peso de cada resultado es inversamente proporcional al cuadrado de la desviacin estndar, 1/2, que recibe el nombre de factor de ponderacin. Si las desviaciones estndar i son iguales, la expresin de de la media se reduce a la de la Ec.13.10: x2 = 1 / (1/i)2 = 1 / [N(1/i)2] = i2 / N x = i / N1/2 o sea siendo Los valores de a y b que se obtienen son: (13.27a) y (13.27b) (13.26)

13.6 AJUSTE POR MNIMOS CUADRADOS


Por lo general, cualquier medida se relaciona con otras variables, por ejemplo y = f(x). Esta funcin podra tener cualquier forma: lineal, cuadrtica, armnica, etc. El objetivo de este apartado es discutir brevemente algunos mtodos que se utilizan para

(13.27c) Si las desviaciones estndar de y son iguales, los valores de a y b son: a = (xi2 yi xi xiyi) / (13.28a)

164

Errores, Medias y Ajustes

b = (N xiyi xi yi) / = N xi2 (xi)2

(13.28b) (13.28c)

Muchas calculadoras modernas incorporan el clculo del ajuste por mnimos cuadrados a partir de una relacin lineal. En la Fig.13.3 se muestra un ejemplo. Las desviaciones estndar de los coeficientes a y b son: (13.29a) y (13.29b)

independiente, se podr ajustar alguna de las curvas. Un ejemplo sera los esplines cbicos. En un principio los ajustes cbicos (3er orden) realizados en sucesivos conjuntos de datos se relacionan entre ellos. Se puede llegar a conseguir que la curva obtenida ajuste todos los datos, ajustndose al mximo a las pequeas irregularidades que los datos presenten.

13.7 TEST CUADRADO


El ajuste por mnimos cuadrados consiste en minimizar la exponencial de la funcin de probabilidad Gausiana de la Ec.13.5, es decir, de la suma (cuadrtica) de las desviaciones entre los valores y observados (yi) y los calculados a partir de la relacin entre x e y: yi = f(xi). En el caso del ajuste lineal lo que se debe calcular finalmente son los coeficiente de la relacin lineal y = a + bx con la condicin de que la suma (yi a bxi)2 sea mnima (Ec.13.25). Teniendo en cuenta la definicin de probabilidad, Pi, parece lgico considerar, como medida de buena aproximacin, la misma suma del los cuadrados de las desviaciones en relacin con la desviacin estndar: (13.30) Se calcula 2 para el conjunto de datos de la Fig.13.3 y la Tabla 13.

13.6.2 AJUSTE NO LINEAL Cuando se quiere realizar un ajuste por mnimos cuadrados a partir de relaciones cuadrticas o con polinomios de segundo grado, armnicas, exponenciales, y un largo etc, el tratamiento que se sigue no es cuantitativo. Aunque se podra calcular analticamente, el proceso rutinario que se sigue es aplicar programas informticos adecuados. Tambin se aplica en aquellos casos que se dispone de ms de una curva; lo que se obtiene es una superposicin de curvas. An cuando se tengan datos puntuales que no estn tericamente relacionados con la variable

Fig.13.3 Ajuste por mnimos cuadrados lineal de una serie de datos (x,y), cuyas variables independientes y dependientes se relacionan mediante la ecuacin y = 2,5 + 0,5x. Todos los valores de y poseen la misma precisin.

165

Errores, Medias y Ajustes

En resumen, el ajuste ptimo de los datos es el que minimiza 2. El mtodo que se utiliza para minimizar 2 es el de los mnimos cuadrados. Si al dividir 2 entre el nmero de datos (=19) menos los grados de

libertad (= el nmero de parmetros que se ha de determinar, en este caso = 1) se obtiene alrededor de uno (en este caso =12/18), entonces el resultado del ajuste de 2 queda confirmado.

Tabla 13.2 Serie de datos (xi, yi) que obedecen la relacin y = a + bx, a partir de los que se obtiene un valor de 2. En la Fig.13.3 se muestra la grfica de estos datos. El ajuste ptimo de estos datos es el que minimiza 2.

x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2

yi 2,9 0,8 2,4 0,8 4,1 0,8 5,7 0,8 5,7 0,8 4,6 0,8 7,3 0,8 4,9 0,8 7,0 0,8 7,1 0,8 7,5 0,8 9,2 0,8 8,6 0,8 9,4 0,8 8,9 0,8 11,1 0,8 12,8 0,8 12,4 0,8 10,9 0,8

y = 2,5 + 0,5xi 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 11,0 11,5 12,0

[y f(xi)]2/2 0,016 1,891 0,016 2,250 0,766 1,266 2,641 4,000 0,000 0,250 0,391 0,766 0,250 0,016 1,891 0,563 5,063 1,266 1,891 12,094

166

También podría gustarte