Está en la página 1de 2

Química Analítica Cuantitativa I – CLASE 3_1-JCG-2022

¿CÓMO SE DETERMINA SI UN VALOR ES REALMENTE UN VALOR ATÍPICO


Uno de los problemas arduos en el análisis de datos es manejar los valores atípicos en un grupo de datos.
VALOR ATIPICO. Un valor atípico es una observación con un valor que no parece corresponderse con el resto de los valores en el
grupo de datos. Los valores atípicos también suelen llamarse valores aberrantes o inconsistentes. Por lo general surgen dos preguntas:
1. ¿Es este valor realmente un valor atípico?
2. ¿Puedo eliminar este valor y continuar con el análisis de datos?
La pregunta 1 se refiere a la identificación de un valor atípico, y dos herramientas básicas relacionadas son la representación gráfica
y la prueba estadística.
EJEMPLO: Un excelente gráfico para observar la distribución de pequeños
grupos de datos es el gráfico de puntos.
Tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3
Figura 1. Trazado de puntos para los datos, 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3.
Aquí, el valor 7.8 parecer ser un valor atípico porque está bien a la derecha del resto en el gráfico de puntos. En el gráfico, en realidad
estamos mirando los espacios entre los valores de datos.
Dos de las pruebas estadísticas utilizadas con mayor frecuencia en un grupo de datos único son la prueba de Grubbs y la prueba de
Dixon.
LA PRUEBA DE GRUBBS. Utiliza una estadística de prueba, T, que es la diferencia absoluta entre el valor atípico, X O, y el promedio de la
La

muestra dividida por la desviación estándar de la muestra, s.


parte
de
image
n con
el
ident

La

Para el ejemplo anterior, el promedio de la muestra es = 4.86 y la desviación estándar de la muestra es = 1.48. La estadística calculada de la
parte
de
image
n con
el
ident

prueba es:
Para un n = 7 y un riesgo del 5%, el valor crítico es 1.938 y el T = 1.99 excede este
valor crítico, indicando que el valor 7.8 es un valor atípico.
La desviación estándar es:
(5.3 – 4.86) 2 + (3.1 – 4.86)2 + (4.9 – 4.86)2 +(3.9 – 4.86)2+(7.8 – 4.86)2+ (4.7 – 4.86)2 + (4.3 – 4.86)2 13.1972
Desviación estándar, s2 = ------------------------------------------------------------------------------------------------------------------------ = --------- = 2.19
7–1 6
Desviación estándar, s = √ 2.19 = 1.46
ANÁLISIS DE DATOS.
Debe saberse que las pruebas estadísticas se utilizan para identificar valores atípicos, no para retirarlos del grupo de datos. Técnicamente, una
observación no debe retirarse a menos que una investigación halle una causa probable para justificar esta acción.
En algunos casos, la situación física puede definir el problema. Para las tres observaciones, 98.7, 90.0 y 99.7, el índice de Dixon es: 8.7/9.7 = 0.897
El valor crítico para un n = 3 y un riesgo de 5% es 0.941, ¡por lo que el valor 90.0 no puede identificarse como valor atípico! Parte del motivo puede
ser la proximidad cercana de los otros dos valores. Sin embargo, si los valores registrados son temperaturas del cuerpo humano en grados Fahrenheit,
no hace falta una prueba de valor atípico para llegar a la conclusión de que algo está mal.
Este ejemplo también ilustra que es difícil identificar valores atípicos en pequeños grupos de datos, tal como n < 5.
La norma ASTM E691. Método para llevar a cabo un estudio entre laboratorios para determinar la precisión de un método de prueba, desalienta
estas pruebas de valores atípicos para pequeños grupos de resultados de pruebas repetidos en un mismo laboratorio y sugiere otras metodologías
para identificar grupos de datos aberrantes.
Si en la investigación no se encuentra una causa probable, ¿qué debe hacerse?
Un enfoque sería realizar un análisis de datos con el valor atípico y sin él. Si las conclusiones son diferentes, entonces se considera que el valor
atípico tiene influencia y esto debería indicarse en el informe. Otra opción es utilizar estimadores rigurosos para caracterizar los grupos de datos, tal
como la mediana de la muestra en lugar de la media.
CONSTRATE DE DIXON O CONTRASTE “Q”
Puede utilizarse para rechazar una medida de una población de 3 a 10 medidas de una cantidad, a cualquier nivel de confianza, aunque generalmente
se utiliza el nivel del 90%; es decir, si se rechaza una medida según este criterio, se hace con una confianza del 90%.
Para aplicar el criterio Q, se ordenan las medidas en orden creciente, tomándose los valores más divergentes, superior e inferior de la tabla:
Calcular el intervalo (Mn – M1) y con en los cocientes Q para los valores mayor y menor: Q1 = (M2 - M1) / (Mn – M1)
Qn = (Mn – Mn-1) / (Mn – M1)
Como los valores que podrían eliminarse son M1 o Mn, el criterio Q se aplica a ambos.
Los cocientes Q1 y Q2 se obtienen dividiendo la diferencia de M1 y Mn y de sus valores vecinos
entre el intervalo.
Estos valores se comparan entonces con los de Q de la tabla siguiente:
Si Q1 o Q2 son mayores que el valor dado de la tabla, la medida puede ser rechazada con límite
de confianza determinado.
Por ejemplo, si Q1 tiene un valor de 0.60 y el número de medidas es 7, el valor puede ser
eliminado con un límite de confianza del 90%.
Ejemplo. Los resultados a continuación son el resultado de una serie de determinaciones de hierro, realizadas sobre la misma muestra:
13.18%, 13.92%, 13.99%, 14.20%, 14.28% y 14.30
Los datos ordenados: 14.30; 14.28; 14.20; 13.99 %; 13.92% y 13.18 %.
Química Analítica Cuantitativa I – CLASE 3_1-JCG-2022

Intervalo (M6 – M1) = 14.30 – 13.18 = 1.12 Para un límite de confianza del 90%, Q 0.90 = 0.56.
Q1 = (M2 – M1) / (M6 – M1) = (13.92 – 13.18) / 1.12 = 0.66 El valor 13.18 %  0.66 > 0.56 No se acepta
Q2= (M6 – M4) / (M6 – M1) = (14.30 – 14.28) / 1.12 = 0.018 El valor 14.28 %  0.018 < 0.56 Se acepta

El primer valor 13.18% no entra dentro de este límite y por tanto es eliminado.
Al repetir el procedimiento podemos encontrar que el resto de los datos son aceptables, por lo que el resultado de la media de estos valores se
obtiene solo tomando 5 valores y es 14.14%.
DETERMINACION DE VALOR ATÍPICO: LA PRUEBA DE GRUBBS.
Con los datos que ya se tienen:
Ẍ = 4.86 y s = 1.48. calculamos el valor T
Para un n = 7 y un riesgo del 5%, el valor crítico es 1.938

│Xo - Ẍ│ │3.1 – 4.86│ El dato 3.1 no se rechaza. Porque es menor


Calculo de T: ------------ = ----------------- = 1.1891  1.189 < 1.938 que el valor critico 1.938
s 1.48
Ejercicio 2. Con los datos anteriores, sin considerar 7.9.
Se tienen los siguientes datos de una medición: 5.3, 3.1, 4.9, 3.9, 4.7 y 4.3
Calculo del promedio, Ẍ

5.3 + 3.1 + 4.9 + 3.9 + 4.7 + 4.3 26.2 El redondeo de 4.3666


Ẍ = ------------------------------------------- = -------- = 4.3666 = 4.37 El dato debe tener dos decimales:
6 6 4.3666  4.37 porque 3 es impar y 6 > 5

Calculo de la desviación estándar de la muestra:

(5.3 – 4.37) 2 + (3.1 – 4.37)2 + (4.9 – 4.37)2 +(3.9 – 4.37)2+ (4.7 – 4.37)2 + (4.3 – 4.37)2 3.0934
Desviación estándar, s2 = ------------------------------------------------------------------------------------------------------ = --------- = 0.6186
6–1 5

Desviación estándar, s = √0.6186 = 0.786  0.786 redondeando es igual a = 0.79


Prueba de Grubbs:
│Xo - Ẍ│ │3.1 – 4.37│ El dato 3.1 no se rechaza. Porque es menor que
Calculo de T: ------------ = ----------------- = 1.607  1.60 < 1.822 el valor critico 1.822
s 0.79
El valor crítico para n = 6 datos es: es = 1.822, Comparando: 0.786 < 1.822 Rpta. El dato no se rechaza.
Ejercicio 3. María ligia, prepara una disolución de hidróxido de sodio 0.100 M, después título 5 veces la anterior disolución
con 0.100 g de acido ftalico de potasio (se diluyo el biftalato acido de potasio en 20 ml de agua), Los volumenes
de NaOH gastados en cada titulacion fueron los siguientes: 5.9, 5,1, 5,2, 5,2, y 5,4 ml. Dterminar si el valor de
5.9 ml puede ser rechazado como un valor atipico al 95 % de confianza utilizando el test G.
Criterio: Si Tcalculado es > que T de la tabla, el valor es rechazado. T de la tabla es 1.672
Procedimiento:
Calculo del promedio, Ẍ

5.9 + 5.1 + 5.2 + 5.2 + 5.4 26.8


Ẍ = ---------------------------------- = ------- = 5.36
5 5
Calculo de la desviación estándar de la muestra:
(5.9 – 5.36) 2 + (5.1 – 5.36)2 + (5.2 – 5.36)2 +(5.2 – 5.36)2+ (5.4 – 5.36)2 0.412
Desviación estándar, s2 = ------------------------------------------------------------------------------------- = --------- = 0.103
5–1 4
Desviación estándar, s = √0.103 = 0.32 s = 0.32
Prueba de Grubbs:
│Xo - Ẍ│ │5.9 – 5.36│
Calculo de T: ------------ = ----------------- = 1.687  1.687 > 1.672
s 0.32 El dato 5.9 se rechaza. Porque es mayor que el
El valor crítico para n = 5 datos es: es = 1.672, Comparando: 1.687 > 1.672 valor critico 1.672
Rpta. El dato 5.9 se rechaza.

También podría gustarte