Está en la página 1de 16

0011 0010 1010 1101 0001 0100 1011

RECHAZO DE DATOS DE
UNA SERIE

Gloria Mara Meja

Cuando se escoge el nivel de


significacin 0,05 ( 5%), tenemos
un 95% de confianza de que hemos
adoptado la decisin correcta y una
probabilidad 0,05 de ser falsa.

0011 0010 1010 1101 0001 0100 1011

Gloria Mara Meja

Cmo determina si un valor es realmente un


valor atpico y cmo decide si debe continuar
o no con el anlisis de datos?
0011 0010 1010 1101 0001 0100 1011
Uno de los problemas en el anlisis de datos es
manejar los valores atpicos dentro de un grupo
de datos.
Un valor atpico es una observacin con un valor
que no parece corresponderse con el resto de los
valores en el grupo de datos.

Por lo general surgen dos preguntas:


1)Es este valor realmente un valor atpico?
2)Puedo eliminar este valor y continuar con el
anlisis de datos?
Gloria Mara Meja

DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011

Con respecto a la pregunta 2, debe saberse que


las pruebas estadsticas se utilizan para
identificar valores atpicos, no para
retirarlos del grupo de datos.
Tcnicamente, una observacin no debe
retirarse a menos que una investigacin
halle una causa probable para justificar esta
accin

Gloria Mara Meja

DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011

Si en la investigacin no se encuentra una causa


probable, qu debe hacerse?
Un enfoque sera realizar un anlisis de datos con el
valor atpico y sin l. Si las conclusiones son
diferentes, entonces se considera que el valor
atpico tiene influencia y esto debera indicarse en
el informe.
Otra opcin es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.

Gloria Mara Meja

RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Dos de las pruebas estadsticas utilizadas


con mayor frecuencia en un grupo de datos
son la prueba de Dixon y la prueba de
Grubbs.
La prueba de Dixon utiliza relaciones de las
diferencias entre datos que parecen atpicos
comparados con los valores del grupo de
datos.

Gloria Mara Meja

RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Estas tcnicas estn diseadas para detectar un


nico valor atpico en un grupo de datos, y por lo
tanto no son adecuadas para la deteccin de
mltiples valores atpicos.
Una tcnica rigurosa y amplia para identificar
eficazmente mltiples valores atpicos es el
procedimiento para muchos valores atpicos con
generalizacin extrema de la desviacin de
Student.

Gloria Mara Meja

DIXON
0011 0010 1010 1101 0001 0100 1011

Por ejemplo, tomemos los datos 5.3, 3.1,


4.9, 3.9, 7.8, 4.7 y 4.3
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8

El tamao de la muestra es 7, y la relacin utilizada es el espacio


entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido
por el espacio entre los valores ms grandes y ms pequeos en
el grupo.
Por lo tanto, el ndice de Dixon es:
(7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532
Gloria Mara Meja

RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Este valor se compara con un valor crtico de una tabla, y el


valor se declara valor atpico si supera ese valor crtico.
Si Dcalculado>Dtabulado se rechaza el dato

El valor tabulado depende del tamao de la muestra, n, y de


un nivel de confianza elegido, que es el riesgo de rechazar
una observacin vlida. La tabla por lo general utiliza
niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El ndice de Dixon 0.532 excede este valor crtico,
indicando que el valor 7.8 es un valor atpico.
Gloria Mara Meja

DIXON
0011 0010 1010 1101 0001 0100 1011

La prueba de Dixon se usa en un nmero


pequeo de observaciones (menor a 26) y
detecta elementos que se encuentren
sesgados o que son extremos.

Gloria Mara Meja

Para aplicar la prueba de Dixon se


requiere de un nmero de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparacin.

GRUBBS
0011 0010 1010 1101 0001 0100 1011

La prueba de Grubbs utiliza una estadstica de


prueba, T, que es la diferencia absoluta entre el
valor atpico, XO, y el promedio de la muestra (X)
dividida por la desviacin estndar de la
muestra, s.
Para el ejemplo anterior, el promedio de la muestra
es = 4.86 y la desviacin estndar de la muestra
es = 1.48. La estadstica calculada de la prueba es:

Gloria Mara Meja

GRUBBS
0011 0010 1010 1101 0001 0100 1011

Para un n = 7 y un riesgo del 5%, el valor


tabulado es 1.938 y el TCalculado = 1.99 excede
este valor crtico, indicando que el valor 7.8 es
un valor atpico.

Gloria Mara Meja

TEST DE GRUBB PARA DATOS


SOSPECHOSOS
0011 0010 1010 1101 0001 0100 1011
Recomendado por las normas ISO
G= Valor Sospechoso X
S
(Con el valor sospechoso incluido)

Si Gcalculada > Gtabulada el valor sospechoso se rechaza

Gloria Mara Meja

TEST Q DE DATOS SOSPECHOSOS

Aceptar o rechazar un resultado anmalo (outlier)


0011
0010 1010 1101
0100 1011
Normalmente
se0001
producen
al cometer errores o fallos en la
metodologa aplicada.

Se ordenan los datos en forma creciente y se calcula Q

Q = desvo = Diferencia entre el dato sospechosos y su vecino ms cercano


recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor

Si Qcalculada > Qtabulada el dato se rechaza

Gloria Mara Meja

Ejemplo:
0011 0010 1010 1101 0001 0100 1011

Al efectuar una serie de rplicas para determinar la


concentracin del in sulfato en una muestra de agua para
riego se obtuvieron los siguientes resultados. Determinar si
la medida 6.0 es un valor rechazable.
Medida Valor
1
5.0
2
5.2
3
5.5
4
5.6
5
6.0

Gloria Mara Meja

1. Se ordenan los datos en orden de valor


decreciente
6.0, 5.6, 5.5, 5.2, 5.0
2. Se calcula Q
Q= (6.0-5.6)/ (6.0-5.0) =0.40

3. Se compara Q calculado con Q tabulado


para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable

CONCLUSIONES
0011 0010 1010 1101 0001 0100 1011

La ASTM E178, Prctica para manejar observaciones de valores


atpicos, contiene muchos procedimientos estadsticos para realizar
pruebas de valores atpicos. En esta norma se proveen otros criterios
para valores atpicos nicos, as como pruebas para valores atpicos
mltiples, y la norma tambin da pautas para la eleccin de la prueba.
Una referencia ms amplia para la prueba de valores atpicos es el
libro Valores atpicos en datos estadsticos, publicado por Wiley. Otra
referencia til y ms prctica es el Volumen 16 de la Sociedad
Estadounidense de Calidad (ASQ) "Referencias bsicas para el control
de calidad, tcnicas estadsticas"
Cmo detectar y manejar valores atpicos", ASQC Quality Press.
En la prctica E178 de ASTM se indican otras referencias.

Gloria Mara Meja

También podría gustarte