Está en la página 1de 16

0011 0010 1010 1101 0001 0100 1011

RECHAZO DE DATOS DE

2
UNA SERIE
1
4
Cuando se escoge el nivel de
0011 0010 1010 1101 0001 0100 1011

significacin 0,05 ( 5%), tenemos


un 95% de confianza de que hemos

1
2
adoptado la decisin correcta y una
probabilidad 0,05 de ser falsa.

4
Cmo determina si un valor es realmente un
valor atpico y cmo decide si debe continuar
o no con el anlisis de datos?
0011 0010 1010 1101 0001 0100 1011
Uno de los problemas en el anlisis de datos es
manejar los valores atpicos dentro de un grupo
de datos.

2
Un valor atpico es una observacin con un valor

1
que no parece corresponderse con el resto de los
valores en el grupo de datos.

Por lo general surgen dos preguntas:

4
1)Es este valor realmente un valor atpico?
2)Puedo eliminar este valor y continuar con el
anlisis de datos?
DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011

Con respecto a la pregunta 2, debe saberse


que las pruebas estadsticas se utilizan para

1
2
identificar valores atpicos, no para
retirarlos del grupo de datos.

4
Tcnicamente, una observacin no debe
retirarse a menos que una investigacin
halle una causa probable para justificar esta
accin
DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011

Si en la investigacin no se encuentra una causa


probable, qu debe hacerse?
Un enfoque sera realizar un anlisis de datos con el

1
2
valor atpico y sin l. Si las conclusiones son
diferentes, entonces se considera que el valor

4
atpico tiene influencia y esto debera indicarse en
el informe.
Otra opcin es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.
RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Dos de las pruebas estadsticas utilizadas


con mayor frecuencia en un grupo de datos

1
2
son la prueba de Dixon y la prueba de
Grubbs.

4
La prueba de Dixon utiliza relaciones de las
diferencias entre datos que parecen atpicos
comparados con los valores del grupo de
datos.
RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Estas tcnicas estn diseadas para detectar un


nico valor atpico en un grupo de datos, y por lo

2
tanto no son adecuadas para la deteccin de
mltiples valores atpicos.
1
Una tcnica rigurosa y amplia para identificar

4
eficazmente mltiples valores atpicos es el
procedimiento para muchos valores atpicos con
generalizacin extrema de la desviacin de
Student.
DIXON
0011 0010 1010 1101 0001 0100 1011

Por ejemplo, tomemos los datos 5.3, 3.1,


4.9, 3.9, 7.8, 4.7 y 4.3

1
2
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8

4
El tamao de la muestra es 7, y la relacin utilizada es el espacio
entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido
por el espacio entre los valores ms grandes y ms pequeos en
el grupo.
Por lo tanto, el ndice de Dixon es:
(7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532
RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011

Este valor se compara con un valor crtico de una tabla, y el


valor se declara valor atpico si supera ese valor crtico.
Si Dcalculado>Dtabulado se rechaza el dato

1
2
El valor tabulado depende del tamao de la muestra, n, y de
un nivel de confianza elegido, que es el riesgo de rechazar

4
una observacin vlida. La tabla por lo general utiliza
niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El ndice de Dixon 0.532 excede este valor crtico,
indicando que el valor 7.8 es un valor atpico.
DIXON
0011 0010 1010 1101 0001 0100 1011

La prueba de Dixon se usa en un nmero


pequeo de observaciones (menor a 26) y

1
2
detecta elementos que se encuentren
sesgados o que son extremos.

4
Para aplicar la prueba de Dixon se
requiere de un nmero de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparacin.
GRUBBS
0011 0010 1010 1101 0001 0100 1011
La prueba de Grubbs utiliza una estadstica de
prueba, T, que es la diferencia absoluta entre el
valor atpico, XO, y el promedio de la muestra

1
2
(X) dividida por la desviacin estndar de la
muestra, s.
Para el ejemplo anterior, el promedio de la

4
muestra es = 4.86 y la desviacin estndar de la
muestra es = 1.48. La estadstica calculada de la
prueba es:
GRUBBS
0011 0010 1010 1101 0001 0100 1011

Para un n = 7 y un riesgo del 5%, el valor


tabulado es 1.938 y el TCalculado = 1.99 excede

1
2
este valor crtico, indicando que el valor 7.8 es
un valor atpico.

Gloria Mara Meja Z


4
TEST DE GRUBB PARA DATOS
SOSPECHOSOS
0011 0010 1010 1101 0001 0100 1011

Recomendado por las normas ISO

1
2
G= Valor Sospechoso X
S

4
(Con el valor sospechoso incluido)

Si Gcalculada > Gtabulada el valor sospechoso se rechaza


TEST Q DE DATOS SOSPECHOSOS
Aceptar o rechazar un resultado anmalo (outlier)
Normalmente
0011 se0001
0010 1010 1101 producen
0100 1011al cometer errores o fallos en la
metodologa aplicada.

1
2
Se ordenan los datos en forma creciente y se calcula Q

Q = desvo = Diferencia entre el dato sospechosos y su vecino ms cercano

4
recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor

Si Qcalculada > Qtabulada el dato se rechaza


Ejemplo:
0011 0010 1010 1101 0001 0100 1011

Al efectuar una serie de rplicas para determinar la


concentracin del in sulfato en una muestra de agua para
riego se obtuvieron los siguientes resultados. Determinar si

1
2
la medida 6.0 es un valor rechazable.
Medida Valor 1. Se ordenan los datos en orden de valor
1 5.0 decreciente

4
2 5.2 6.0, 5.6, 5.5, 5.2, 5.0
3 5.5 2. Se calcula Q
4 5.6 Q= (6.0-5.6)/ (6.0-5.0) =0.40
5 6.0 3. Se compara Q calculado con Q tabulado
para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable
CONCLUSIONES
0011 0010 1010 1101 0001 0100 1011
La ASTM E178, Prctica para manejar observaciones de valores
atpicos, contiene muchos procedimientos estadsticos para realizar
pruebas de valores atpicos. En esta norma se proveen otros criterios
para valores atpicos nicos, as como pruebas para valores atpicos
mltiples, y la norma tambin da pautas para la eleccin de la prueba.

1
2
Una referencia ms amplia para la prueba de valores atpicos es el libro
Valores atpicos en datos estadsticos, publicado por Wiley. Otra
referencia til y ms prctica es el Volumen 16 de la Sociedad
Estadounidense de Calidad (ASQ) "Referencias bsicas para el control

4
de calidad, tcnicas estadsticas"
Cmo detectar y manejar valores atpicos", ASQC Quality Press.
En la prctica E178 de ASTM se indican otras referencias.

También podría gustarte