Está en la página 1de 21

MANEJO DE DATOS

ANALITICOS
PARAMETROS ESTADISTICOS
Media Suma de todas las medidas dividida por el nmero de
medidas. N

x
i 1
i
x
N

Mediana Me- Representa el valor de la variable de posicin


central en un conjunto de datos ordenados. La mediana es menos
sensible que la media a oscilaciones de los valores de la variable y
no se ve afectada por la dispersin. De hecho, es ms
representativa que la media aritmtica cuando los datos son
bastante heterogneos o asimtricos.
PARAMETROS ESTADISTICOS
Moda Mo-Valor de la medida que se repite mas veces.
Intervalo o rango Diferencia entre el valor mas alto y el mas bajo.
R = (Xn X1)
Desviacin respecto a la media- Es la diferencia numrica entre un valor
experimental y la media
= xi x
La desviacin estndar- S- es una medida de dispersin usada en
estadstica que nos dice cunto tienden a alejarse los valores puntuales
del promedio en una distribucin.
. N

xi x 2

S i 1
N 1
PARAMETROS ESTADISTICOS
Desviacin estndar relativa o Coeficiente de variacin CV - Es una
medida de la dispersin relativa de un conjunto de datos, que se obtiene
dividiendo la desviacin estndar del conjunto entre su media aritmtica.
S
CV Se expresa en % o partes por mil
x
Varianza:La varianza es una medida de qu tan disperso es un conjunto
de datos. Si la varianza es pequea, significa que los valores del
conjunto estn bastante agrupados. Si la varianza es grande, significa
que los nmeros estn ms dispersos
ERRORES CRASOS O ACCIDENTALES

Los errores accidentales pueden definirse como aquellos errores


que conducen a resultados discordantes que difieren
marcadamente de todos los dems datos de una serie de
mediciones repetidas. Se identifican con la presencia de valores
anmalos o discrepantes (outliers).
RECHAZO DE DATOS
En una serie de medidas puede suceder que exista un resultado que
presente una desviacin mucho mayor que las dems, en este punto
uno debe evaluar si este resultado atpico debe ser considerado o no.
Valor atpico - Un valor atpico es una observacin que es
numricamente distante del resto de los datos.
Existen varias reglas para evaluar si estos valores deben tomarse en
cuenta o no en un grupo pequeo de datos:
-En base a las desviaciones
-Prueba de Dixon
-Prueba de Grubbs.
EN BASE A LAS DESVIACIONES
En una serie de 4 o mas valores se debe proceder de la siguiente
manera:
1. Ordenar los datos de menor a mayor
2. Evaluar cual de los extremos es el mas alejado y prescindir de este
valor y calcular la media y la desviacin media con los valores
restantes.
3. Si la desviacin del valor observado con respecto a la media es
mayor que 4 veces la desviacin media, este valor debe ser
rechazado definitivamente, si no es as este valor debe ser
considerado y se debe volver a calcular la media y la desviacin
media.
Ejercicio- Aplicando el mtodo de las desviaciones determinar si se debe
eliminar algn valor en cada serie de datos

Muestra xi Martes Miercoles Viernes


x1 6.6791 6.7845 6.7173
x2 6.6737 6.7811 6.6551
2 x3 6.6607 6.7821 6.7027
x4 6.6901 6.8013 6.6875
x5 6.6852 6.8147 6.7056
x6 6.7845

x1 6.9632 6.9727 6.5331


x2 12.6442 6.9985 6.7067
3 x3 6.9409 7.0318 6.1846
x4 6.9044 5.3626 6.9319
x5 6.9517 6.7419
x6 6.9702
DE PRUEBA DE DIXON SCARTE DE
DATOS
Para esta prueba se debe proceder de la siguiente manera:
1. Ordenar los datos de menor a mayor
2. Evaluar cual de los extremos es el probable dato atpico o
discordante.
a) Calcular el rango o intervalo
b) Encontrar la diferencia entre el resultado sospechosos y su
vecino mas cercano.
3. Dividir la diferencia obtenida en el paso 2b entre el rango y se
obtiene el coeficiente de descarte Q.
4. Consultar la tabla de valores Q crticos. Si el valor calculado es
mayor que el de la tabla el resultado se puede descartar con un
90% o 95 % de confianza.
PRUEBA DE DIXON Q crticos
Numero de Nivel de confianza
rplicas
. n 90% 95%
3 0,8850 0,9441
4 0,6789 0,7651
5 0,5578 0,6423
6 0,4840 0,5624
7 0,4340 0,5077
8 0,3979 0,4673
9 0,3704 0,4363
10 0,3492 0,4122
PRUEBA DE DIXON
Por ejemplo, tomemos los datos:
6.5331, 6.7067, 6.1846, 6.9319, 6.7419
Ordenando los datos: 6.1846, 6.5331, 6.7067, 6.7419, 6.9319
Intervalo = 6.9316-6.1846 = 0.7470
Dif. del valor atpico con su vecino = 6.5331-6.1846=0.3485
Qcalculdo = 0.3485/0.7470 = 0.4665
El ndice de Dixon con un nivel de confianza de 95 % para n=5 es:
0,6423, por lo que el valor analizado no debe ser descartado ya
que 0.4665< 0.6423.
TEST DE GRUBBS
1. Se disponen los datos en orden de menor a mayor.
2. Se decide si el ms pequeo o el ms grande es sospechoso
de ser discordante.
3. Se estima la desviacin estndar "s" de todos los datos.
4. Se selecciona el riesgo que se quiere tomar para un falso
rechazo.
5. Se calcula el valor correspondiente y se compara con el valor
de tablas. Si el valor calculado es mayor que el valor tabulado
se puede rechazar ese dato con el riesgo asumido.
VALORES CRITICOS - GRUBBS

RIESGO

N 0,1 0,075 0,05


3 1,15 1,15 1,15

4 1,42 1,44 1,46

5 1.60 1,64 1,67

6 1,73 1,77 1,82

7 1,83 1,88 1,94

8 1,91 1,96 2,03

9 1,98 2,04 2,11

10 2,03 2.10 2,18


TEST DE GRUBBS
La prueba de Grubbs utiliza una estadstica de prueba, G, que es
la diferencia absoluta entre el valor atpico, XO, y el promedio de la
muestra (X) dividida por la desviacin estndar de la muestra, s.
G= Valor Sospechoso X
S
Para el ejemplo anterior, el promedio de la muestra es = 6.6196 y
la desviacin estndar de la muestra es = 0.2517. La estadstica
calculada de la prueba es:
G= |6.1846-6.6196| /0.2517 = 1.73
TEST DE GRUBBS
Para n = 5 y un riesgo del 5%, el valor tabulado es 1.67 y el
GCalculado = 1.73 este valor excede el valor crtico, indicando que el
valor 6.1846 es un valor atpico por lo que debe ser descartado.

También podría gustarte