Está en la página 1de 4

Criterios estadsticos para rechazo de valores dudosos.

I.Q. Carlos Josu Herrera Guzmn

Puntos sospechosos Si un conjunto de datos contiene un valor que apreciablemente es distinto de todos los dems, hay una gran posibilidad de que est equivocado, y que sea el resultado de un error grande. Debe optarse por conservar o rechazar su valor. Si se conserva un valor espurio, el promedio de los datos, y tambin la desviacin estndar de stos, quedarn distorsionados. Por otra parte, naturalmente existe la posibilidad de que el valor dudoso sea vlido en realidad, y simplemente sea inesperado; en este caso puede ser que la precisin del procedimiento analtico sea menor que la esperada. Debe tenerse mucho cuidado, ya que si se rechaza un dato vlido, se introducir un sesgo (o prejuicio) en los datos. La prueba Q Si se sospecha que existe un punto dudoso, la prueba Q permite calcular un cociente, Qexp, y compararlo con una table, para decidir si se debe rechazar o conservar el valor. La prueba no produce un resultado definido, pero da alguna idea de la confianza que se puede asociar al rechazar un valor de dato. Se calcula con la ecuacin:
Qexp = xq xn x h x1

donde xq representa al valor dudoso, xn es el valor vecino ms cercano, xh es el dato con valor mximo y x1 es el dato con el valor mnimo. Habiendo calculado el valor Qexp debemos compararlo con los valores de la tabla que correspondan a la cantidad de datos replicados que se midieron. Si Qexp es menor que todos los valores de la tabla, no se pueden rechazar los datos con la certeza indicada en esa table. Si Qexp es mayor que un valor de Q que aparezca en la tabla, se puede rechazar ese valor (al menos), con la certidumbre asociada con el cociente Q que muestre la tabla. Con frecuencia,, un valor de Qexp queda entre dos valores, y en este caso los datos se pueden rechazar con una certidumbre entre los dos valores que aparecen.

No. De medidas replicadas 3 4 5 6 7 8 9 10

Rechazo con 90% de confianza 0.941 0.765 0.642 0.560 0.507 0.468 0.437 0.412

Rechazo con 95% de confianza 0.970 0.829 0.710 0.625 0.568 0.526 0.493 0.466

Rechazo con 99% de confianza 0.994 0.926 0.821 0.740 0.680 0.634 0.598 0.568

Tabla para la prueba Q

Ejemplo Una serie de medidas replicadas de contenido de agua en una muestra de etanol, para el mtodo Kart-Fischer, tuvo los siguientes resultados: a) b) c) d) e) 0.71% 0.65% 0.68% 0.72% 0.91%

Con qu confianza se puede rechazar el dato e), si se usa la prueba Q? Solucin: Calcular Qexp y comparar con la tabla Q xq = 0.91% es el valor dudoso xn = 0.72% es el valor vecino ms cercano xh = 0.91% es el valor mximo de los datos x1 = 0.65% es el valor mnimo de los datos comparar Qexp con la tabla de la prueba Q, con los valores adecuados que correspondan a cinco puntos de dato: Qexp = 0.73 Los valores Q para cinco datos son 0.642 si no se va a rechazar dato alguno, con 90% de confianza, 0.710 para rechazar datos con 95% de confianza y 0.821 para rechazarlos con un 99% de confianza: Qexp = 0.73 > 0.710, pero <0.821 Por consiguiente se puede llegar a la conclusin que este punto dudoso se puede rechazar con ms de 95% de confianza, pero con menos de 99% de confianza.

La prueba T Otra prueba para evaluar si se debe rechazar un punto dudoso es la prueba Tn, a la que con frecuencia se le conoce slo como la prueba T. Tn =

(xq xn )
s

donde xq es el valor dudoso en cuestin y x n es el valor del dato vecino ms cercano. En este caso, el valor de Tn tambin se compara con una tabla estndar de la prueba T, para la cantidad adecuada de medidas replicadas.
No. De medidas replicadas 3 4 5 6 7 8 9 10 Rechazo con 95% de confianza 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 Rechazo con 97.7% de confianza 1.16 1.48 1.71 1.89 2.02 2.13 2.21 2.29 Rechazo con 99% de confianza 1.17 1.49 1.75 1.94 2.10 2.22 2.52 2.41

Tabla para la prueba T

Ejemplo: Si se usan los datos del ejemplo anterior, para medidas replicadas del contenido de agua en un solvente orgnico, Con qu confianza se puede rechazar el valor e)? f) g) h) i) j) 0.71% 0.65% 0.68% 0.72% 0.91%

Se calcula primero s, la desviacin estndar de los datos. Se calcula la media de los datos. Se calcula el valor T y se compara con la tabla de la prueba T s = 0.10% H2O

x = 0.73% H2O
Tn = (0.91 0.73)/0.1 = 1.8 para cinco datos

1.8 es mayor que todos los valores para la tabla T para cinco datos y, en consecuencia, se puede rechazar por dudoso este dato, con ms del 99% de confianza.