Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Errores, Medias y Ajustes
Errores, Medias y Ajustes
Este captulo contiene una seleccin de la informacin bsica acerca del anlisis de las incertidumbres,
y el tratamiento de grandes cantidades de datos. Se
empieza con una discusin de los errores, para llegar a un mtodo que ayude a juzgar cuan probable
es un resultado final.
13.1 ERRORES
En los diccionarios la palabra error se define como la
diferencia entre el valor aproximado que resulta de
una observacin, una medida o un clculo, y el valor
verdadero. El problema surge cuando se ha de conocer el valor verdadero, que generalmente se obtiene como resultado de una medida o de un clculo.
Por este motivo se debe encontrar un mtodo para
estimar la fiabilidad del resultado obtenido.
La palabra errores no est bien definida como tal.
Por lo tanto, la definicin ha de ser ms rigurosa. Los
errores se pueden clasificar como:
1) Equivocacin o error en la medida o en el clculo; son normalmente aparentes, ya que se
encuentran lejos de los valores esperados. Se
detectan repitiendo la medida o el clculo.
2) Errores sistemticos, que son ms difciles de
detectar. Estas discrepancias son reproducibles. A
menudo es el resultado de un fallo en la instrumentacin o provienen de una consistencia
matemtica insuficiente. Estos errores se encuentran (y se corrigen) repitiendo el anlisis con diferentes equipos o repitiendo el clculo (por otros
medios, o por un compaero).
3) Errores aleatorios, que son los ms comunes. Son
debidos a la inevitable limitacin de la calidad de
los instrumentos. Slo se pueden eliminar parcialmente si se refina el equipo o el mtodo analtico, y repitiendo las medidas (como por ejemplo, leer una temperatura o el pH) o aumentando el tiempo de observacin (como por ejemplo
el tiempo de medida de radioactividad).
Fig.13.1 Grficas que ilustran la precisin y exactitud. Se muestran dos series de resultados de 19 medidas de la misma
radioactividad.
A. Los datos son imprecisos pero exactos; el valor medio adecuado es 13,56 Bq. El rea sombreada representa el nivel 1
de confianza; es decir, el 68% de los datos debe estar dentro de este rango (vase el ejemplo en el Apt.13.5.2).
B. Los datos son precisos pero inexactos, probablemente por los errores sistemticos; el valor medio ahora es 13,50 Bq,
en lugar del valor "verdadero" 13,56 Bq.
160
13.2.3 INCERTIDUMBRES
Fig.13.2 Histograma (en forma de bloques); indica la distribucin irregular de las medidas dentro de un rango de
xi(x), es decir, entre xi y xi + x alrededor de la media; en
lugar de dar los resultados, se dan las desviaciones respecto del valor medio (x ) junto con el nmero de observaciones (eje y) para valores que pertenezcan a un determinado rango. La curva suavizada ilustra una distribucin
Gausiana, que seria el resultado hipottico cuando se
cuenta con infinitas medidas. Tambin representa la probabilidad de distribucin (P) de los datos alrededor de un
valor medio. Las desviaciones respecto de la media se
expresan en funcin de la desviacin estndar ().
En la parte superior se muestra la integral o la suma de las
probabilidades: la probabilidad de observar valores entre
x + y x es 68 %, entre x + 2 y x 2 es 95 %
y finalmente entre x + 3 y 3 es 99,7 %.
(13.4)
N = Ni
(13.3)
161
(13.7)
Por lo tanto la varianza es la media de los cuadrados
menos el cuadrado de las medias. La medida cuantitativa de las dimensiones de los errores aleatorios, es
decir, de la dispersin estadstica de los datos alrededor de la media, o en otras palabras, de la precisin
se representa a partir de la desviacin estndar ,
que es la raz cuadrada de la varianza. Cuanto ms
pequea sea la desviacin estndar, mejor es la precisin, y ms estrecha es la Gausiana.
Si a continuacin se considera el conjunto real de
medidas, la desviacin estndar del conjunto ser:
(13.8)
(13.5)
yi es el valor medido de la variable dependiente, y
f(xi) es el valor de y calculado para la variable independiente xi; i es la desviacin estndar de yi, que
se define posteriormente. El valor ms probable, la
moda, corresponde al pico de la distribucin, es
decir, la parte superior de la curva suavizada. Para los
datos con errores aleatorios, la distribucin es simtrica alrededor de la parte superior. La Fig.13.2
muestra la curva Gausiana junto con el histograma
que se obtiene con un nmero limitado de medidas.
DE LOS DATOS
Resulta obvio que si los errores aleatorios son pequeos, los valores de la desviacin (xi x) sern pequeos y la distribucin de los resultados alrededor de la
media ser ms estrecha. La desviacin media es una
medida de la dispersin de los datos alrededor de la
media. A sta se la conoce con el nombre de dispersin del conjunto de datos. La Ec.13.3 demuestra
que no se puede utilizar un simple promedio de
todas las desviaciones, ya que este se deriva de la
definicin de media. El promedio de los valores
absolutos de las desviaciones, esto es, independientemente de su signo, caracteriza mejor la dispersin:
(13.6)
Sin embargo, por razones matemticas no resulta
apropiado utilizar valores absolutos. Por este motivo,
si se pretende caracterizar la distribucin se debern
considerar los cuadrados de las desviaciones. El valor
que resulta recibe el nombre de varianza:
162
DE LA MEDIA
xi
xi x
Nr.
xi
xi x
1
2
3
4
5
6
7
8
9
10
13,55
13,45
13,57
13,68
13,63
13,47
13,69
13,40
13,56
13,52
0,01
0,11
+0,01
+0,12
+0,07
0,09
+0,13
0,16
+0,00
0,04
11
12
13
14
15
16
17
18
19
13,51
13,63
13,52
13,55
13,45
13,62
13,74
13,65
13,45
0,05
+0,07
0,04
0,01
0,11
+0,06
+0,18
+0,09
0,11
Media x =
13,56
13,56)}1/2/18
0,095
0,022
Como es obvio, la precisin relativa ser mejor cuanto mayor sea la tasa de detecciones y el tiempo de
medida.
El problema de los rangos de confianza de los datos
observados con incertidumbres estadsticas es similar
a las incertidumbres instrumentales de las que se
habla en la seccin previa. La probabilidad de que un
valor verdadero observado durante un periodo
infinito de tiempo se encuentre entre xi + y xi
del valor medido representa el 68%: la desviacin
estndar representa el 68% del intervalo de confianza, 2 representa el 95% del intervalo de confianza,
y 99,7% representa el 3 del intervalo de confianza.
(13.11)
163
(13.16)
obtener el ajuste ms probable de una funcin respecto a una serie de datos, tanto grfico como algebraico. El ajuste ms utilizado es la lnea recta, ya
que normalmente se considera que los datos siguen
una relacin lineal.
e bx
A/A = bx
(13.18)
4) A = a ln( bx)
A = a x/x
(13.19)
El principio fundamental del ajuste por mnimos cuadrados consiste en minimizar la suma de los cuadrados de las desviaciones de la variable dependiente (y)
(se considera que la incertidumbre en x es despreciable) de la lnea recta definida con los coeficientes
a y b:
y = a + bx
(13.22)
(13.20)
yi = yi f(xi) = yi a bxi
(13.23)
(13.24)
(13.25)
(13.26)
(13.21)
El peso de cada resultado es inversamente proporcional al cuadrado de la desviacin estndar, 1/2,
que recibe el nombre de factor de ponderacin.
Si las desviaciones estndar i son iguales, la expresin de de la media se reduce a la de la Ec.13.10:
x2 = 1 / (1/i)2 = 1 / [N(1/i)2] = i2 / N
x = i / N1/2
o sea
(13.27b)
siendo
164
(13.27c)
Si las desviaciones estndar de y son iguales, los
valores de a y b son:
a = (xi2 yi xi xiyi) /
(13.28a)
b = (N xiyi xi yi) /
(13.28b)
= N xi2 (xi)2
(13.28c)
Muchas calculadoras modernas incorporan el clculo del ajuste por mnimos cuadrados a partir de una
relacin lineal. En la Fig.13.3 se muestra un ejemplo.
Las desviaciones estndar de los coeficientes a y b
son:
(13.29a)
(13.29b)
Fig.13.3 Ajuste por mnimos cuadrados lineal de una serie de datos (x,y), cuyas variables independientes y dependientes
se relacionan mediante la ecuacin y = 2,5 + 0,5x. Todos los valores de y poseen la misma precisin.
165
Tabla 13.2 Serie de datos (xi, yi) que obedecen la relacin y = a + bx, a partir de los que se obtiene un valor de 2. En la
Fig.13.3 se muestra la grfica de estos datos. El ajuste ptimo de estos datos es el que minimiza 2.
166
yi
y = 2,5 + 0,5xi
2
[y f(xi)]2/
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2
2,9 0,8
2,4 0,8
4,1 0,8
5,7 0,8
5,7 0,8
4,6 0,8
7,3 0,8
4,9 0,8
7,0 0,8
7,1 0,8
7,5 0,8
9,2 0,8
8,6 0,8
9,4 0,8
8,9 0,8
11,1 0,8
12,8 0,8
12,4 0,8
10,9 0,8
3,0
3,5
4,0
4,5
5,0
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
10,0
10,5
11,0
11,5
12,0
0,016
1,891
0,016
2,250
0,766
1,266
2,641
4,000
0,000
0,250
0,391
0,766
0,250
0,016
1,891
0,563
5,063
1,266
1,891
12,094