Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Complemento Modulo 2
Complemento Modulo 2
RECHAZO DE DATOS DE
2
UNA SERIE
1
4
Cuando se escoge el nivel de
0011 0010 1010 1101 0001 0100 1011
1
2
adoptado la decisin correcta y una
probabilidad 0,05 de ser falsa.
4
Cmo determina si un valor es realmente un
valor atpico y cmo decide si debe continuar
o no con el anlisis de datos?
0011 0010 1010 1101 0001 0100 1011
Uno de los problemas en el anlisis de datos es
manejar los valores atpicos dentro de un grupo
de datos.
2
Un valor atpico es una observacin con un valor
1
que no parece corresponderse con el resto de los
valores en el grupo de datos.
4
1)Es este valor realmente un valor atpico?
2)Puedo eliminar este valor y continuar con el
anlisis de datos?
DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011
1
2
identificar valores atpicos, no para
retirarlos del grupo de datos.
4
Tcnicamente, una observacin no debe
retirarse a menos que una investigacin
halle una causa probable para justificar esta
accin
DATOS ATIPICOS
0011 0010 1010 1101 0001 0100 1011
1
2
valor atpico y sin l. Si las conclusiones son
diferentes, entonces se considera que el valor
4
atpico tiene influencia y esto debera indicarse en
el informe.
Otra opcin es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.
RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011
1
2
son la prueba de Dixon y la prueba de
Grubbs.
4
La prueba de Dixon utiliza relaciones de las
diferencias entre datos que parecen atpicos
comparados con los valores del grupo de
datos.
RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011
2
tanto no son adecuadas para la deteccin de
mltiples valores atpicos.
1
Una tcnica rigurosa y amplia para identificar
4
eficazmente mltiples valores atpicos es el
procedimiento para muchos valores atpicos con
generalizacin extrema de la desviacin de
Student.
DIXON
0011 0010 1010 1101 0001 0100 1011
1
2
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8
4
El tamao de la muestra es 7, y la relacin utilizada es el espacio
entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido
por el espacio entre los valores ms grandes y ms pequeos en
el grupo.
Por lo tanto, el ndice de Dixon es:
(7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532
RECHAZO DE DATOS
0011 0010 1010 1101 0001 0100 1011
1
2
El valor tabulado depende del tamao de la muestra, n, y de
un nivel de confianza elegido, que es el riesgo de rechazar
4
una observacin vlida. La tabla por lo general utiliza
niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El ndice de Dixon 0.532 excede este valor crtico,
indicando que el valor 7.8 es un valor atpico.
DIXON
0011 0010 1010 1101 0001 0100 1011
1
2
detecta elementos que se encuentren
sesgados o que son extremos.
4
Para aplicar la prueba de Dixon se
requiere de un nmero de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparacin.
GRUBBS
0011 0010 1010 1101 0001 0100 1011
La prueba de Grubbs utiliza una estadstica de
prueba, T, que es la diferencia absoluta entre el
valor atpico, XO, y el promedio de la muestra
1
2
(X) dividida por la desviacin estndar de la
muestra, s.
Para el ejemplo anterior, el promedio de la
4
muestra es = 4.86 y la desviacin estndar de la
muestra es = 1.48. La estadstica calculada de la
prueba es:
GRUBBS
0011 0010 1010 1101 0001 0100 1011
1
2
este valor crtico, indicando que el valor 7.8 es
un valor atpico.
1
2
G= Valor Sospechoso X
S
4
(Con el valor sospechoso incluido)
1
2
Se ordenan los datos en forma creciente y se calcula Q
4
recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor
1
2
la medida 6.0 es un valor rechazable.
Medida Valor 1. Se ordenan los datos en orden de valor
1 5.0 decreciente
4
2 5.2 6.0, 5.6, 5.5, 5.2, 5.0
3 5.5 2. Se calcula Q
4 5.6 Q= (6.0-5.6)/ (6.0-5.0) =0.40
5 6.0 3. Se compara Q calculado con Q tabulado
para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable
CONCLUSIONES
0011 0010 1010 1101 0001 0100 1011
La ASTM E178, Prctica para manejar observaciones de valores
atpicos, contiene muchos procedimientos estadsticos para realizar
pruebas de valores atpicos. En esta norma se proveen otros criterios
para valores atpicos nicos, as como pruebas para valores atpicos
mltiples, y la norma tambin da pautas para la eleccin de la prueba.
1
2
Una referencia ms amplia para la prueba de valores atpicos es el libro
Valores atpicos en datos estadsticos, publicado por Wiley. Otra
referencia til y ms prctica es el Volumen 16 de la Sociedad
Estadounidense de Calidad (ASQ) "Referencias bsicas para el control
4
de calidad, tcnicas estadsticas"
Cmo detectar y manejar valores atpicos", ASQC Quality Press.
En la prctica E178 de ASTM se indican otras referencias.