Está en la página 1de 101

ESTADSTICA

EN QUMICA ANALTICA

calidadbioquimica.com.ar/error.htm

Gloria Mara Meja

IMPORTANCIA DE LA ESTADSTICA Y
LA QUIMIOMETRA EN LA QUMICA ANALTICA

Durante la realizacin de una anlisis


cuantitativo es muy importante tomar en cuenta
todas las variables que pueden afectar nuestro
resultado, dentro de estos estn los factores
provocados por los instrumentos utilizados y los
errores provocados por quien maneja el
material.

En el reporte de cualquier anlisis qumico,


es importante tomar en cuenta este tipo de
errores , hacer un anlisis de los resultados
y as se podr concluir sobre l.
Gloria Mara Meja

Qu es estadstica?
La estadstica es una coleccin de
mtodos para planificar y realizar
experimentos, obtener datos y luego
analizar, interpretar, y formular una
conclusin basada en esos datos. Es
la ciencia encargada de recopilar,
organizar, analizar e interpretar
informacin numrica o cualitativa, de
manera
que
pueda
llevar
a
conclusiones vlidas.
Gloria Mara Meja

Gloria Mara Meja

La Estadstica se utiliza como tecnologa


al servicio de las ciencias donde la
variabilidad y la incertidumbre forman parte
de su naturaleza.
La Estadstica es la Ciencia de la
a
Sistematizacin, recoleccin, ordenacin y
v
i
t
ip presentacin de los datos referentes a un fenmeno que
r
sc
presenta variabilidad o incertidumbre para su estudio
e
D
metdico, con objeto de

b
o
Pr

d
a
lid deducir
i
ab

las leyes que rigen esos fenmenos,

ia
y poder de esa forma hacer previsiones sobre
c
n
mismos, tomar decisiones u obtener conclusiones.
re
e
f
In
Unidad 1: Estadstica Descriptiva.
Arturo A. Alvarado

los

Gloria Mara Meja

DATOS NO AGRUPADOS
Medidas de
tendencia central

Medidas de
dispersin

Media aritmtica
Mediana
Moda
Percentiles
(posicin)

Rango (amplitud)
Rango
intercuartlico
Varianza
Coef. de variacin

Unidad 1: Estadstica Descriptiva.


Arturo A. Alvarado

Gloria Mara Meja

Gloria Mara Meja

Medidas de tendencia central


Mediana
En una serie de datos ordenados (creciente o
decreciente) es la puntuacin o valor central de
la distribucin estadstica

Datos no agrupados
Si el n de datos es impar: valor central
Si el n de datos es par: media aritmtica de los 2 puntos
centrales

Gloria Mara Meja

Medidas de tendencia central


Mediana
Caractersticas
Menos sensible que la media a la variacin de las
puntuaciones.
Se puede calcular aunque algn intervalo carezca
de lmite.
Ms representativa que la media cuando
puntuaciones muy extremas.

Gloria Mara Meja

Medidas de tendencia central


Moda
Valor de la variable que ms veces se
repite en una serie estadstica (mxima
frecuencia)
Distribuciones: Unimodales o multimodales
Marca de clase (en intervalos)

Caractersticas:

Sencilla de calcular
Se puede calcular si algn intervalo no tiene lmites
Poco representativa

Gloria Mara Meja

Medidas de tendencia central


Media

Suma de todos los valores de una


variable dividida por el nmero
total de valores
Slo en variables cuantitativas
X = xi / N

Gloria Mara Meja

Medidas de tendencia central


Media. Clculo
Datos no agrupados: aplicar frmula
Datos agrupados
En tabla de frecuencia: Suma de todos los valores
multiplicados por sus frecuencias y dividido por el
n total.

X = xi fi / N

Gloria Mara Meja

Medidas de tendencia central


Media
Caractersticas
La media es sensible a la variacin de las
puntuaciones.
No se puede calcular si algn intervalo es de lmite
abierto.
No es recomendable si valores muy extremos

Gloria Mara Meja

Medidas de dispersin
Reflejan la dispersin, oscilacin de
los datos, respecto al fenmeno
estudiado.
Complementan las de tendencia
central para la descripcin de una
distribucin
Gloria Mara Meja

Medidas de dispersin
Amplitud o rango
Diferencia entre el valor ms alto y ms bajo
de la distribucin.
Ofrece poca informacin sobre la agrupacin de
los datos.
Indica el campo de variabilidad.
Suele acompaar a la moda.

Gloria Mara Meja

Medidas de dispersin
Varianza
Junto a la desviacin tpica, la que mejor expresa
la variabilidad del fenmeno
Media de los cuadrados de las diferencias entre
cada valor de la variable y la media aritmtica

S2 = (xi x)2 / N

S2 = xi2 / N x2

Para datos agrupados:

S2 = fi(xi x) 2 / N

S2 = fixi2 / N x2
Gloria Mara Meja

Medidas de dispersin
Desviacin tpica
Es la raz cuadrada de la varianza
S2 =

xi2 / N x2

Para datos agrupados:

S2 =

fixi2 / N x2

Gloria Mara Meja

Medidas de dispersin
Varianza y desviacin tpica
Caractersticas
Ambas toman siempre valores positivos.
Si todos los datos de una distribucin son
iguales entre s, toman el valor 0.
Slo son aplicables a variables cuantitativas
La que ms se suele usar es la desviacin tpica.
Si los datos estn muy dispersos, la desviacin tpica ser
muy grande.

Gloria Mara Meja

Medidas de dispersin
Coeficiente de variacin de Pearson
Para poder comparar la dispersin entre 2
ms variables entre s, o una misma
variable en 2 ms grupos estudiados
Es una medida relativa: Relaciona la
media con la desviacin tpica
CV = S / X . 100

Gloria Mara Meja

calidadbioquimica.com.ar/error.htm

Gloria Mara Meja

Gloria Mara Meja

Gloria Mara Meja

Gloria Mara Meja

Gloria Mara Meja

DISTRIBUCIO DE FRECUENCIAS
En una distribucin de datos estos pueden estar o no
agrupados.

DATOS AGRUPADOS EN INTERVALOS:

DATOS NO AGRUPADOS EN
INTERVALOS:

ni Xi
n

Xi
4
3
2
1
0
Xi
4
3
2
1
0

SUPUESTO DE CONCENTRACION EN
EL PUNTO MEDIO (Xi):

ni
1
3
7
6
3
ni
1
3
7
6
3

mitjana=

Xi*ni
4
9
14
6
0
33
33/5=

Gloria Mara Meja Z

6,6

Xi
18 20
15 17
12 14
9 11
6 8
3 5

ni Xi
n

ni
20
30
60
40
30
20

P. M.
19
16
13
10
7
4
mitjanna=

Xi
18-20
15-17
12-14
9-11
6-8
3-5
PM*ni
380
480
780
400
210
80
2330
2330/200=

ni
20
30
60
40
30
20

11,65

CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?:

1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA


ORDINAL.

2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA


INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25

LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS

3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS


CARECEN DE PUNTO MEDIO.

Gloria Mara Meja

LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO


LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO:
DISTRIBUCION NORMAL).

CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS.

Gloria Mara Meja

La distribucin normal
f(X)

Media
Mediana
Moda

Datos simtricos: coinciden la media, la


mediana y la moda
Gloria Mara Meja

Propiedades de la distribucin
normal:
El rea bajo la curva aproximado del promedio a
ms o menos una desviacin estndar (1) es de
0.68, a ms o menos 2 es de .0 95 y a ms o menos
3 es de 0.99.

Gloria Mara Meja Z

(Las propiedades continuan en la prxima lmina)

Propiedades de la distribucin
normal:
La forma de la campana de Gauss depende de los parmetros
y .
Tiene una nica moda que coincide con su media y su
mediana.
La curva normal es asinttica al eje de X.
Es simtrica con respecto a su media . Segn esto, para este
tipo de variables existe una probabilidad de un 50% de observar
un dato mayor que la media, y un 50% de observar un dato
menor.

Gloria Mara Meja Z

En resumen
Podemos concluir que hay una familia de
distribuciones con una forma comn, diferenciadas por
los valores de su media y su varianza.
La desviacin estndar ( ) determina el grado de
apuntamiento de la curva. Cuanto mayor sea el valor
de , ms se dispersarn los datos en torno a la media
y la curva ser ms plana.
La media indica la posicin de la campana, de modo
que para diferentes valores de la grfica es
desplazada a lo largo del eje horizontal.
De entre todas ellas, la ms utilizada es la
distribucin normal estndar, que corresponde a
una distribucin de media 0 y varianza 1.
Gloria Mara Meja

ERRORES EN LOS ANALISIS


QUIMICOS
Es imposible efectuar anlisis qumicos
totalmente
libres
de
errores
o
incertidumbres.
La fiabilidad de un resultado se analiza de
diferentes maneras
Se analizan patrones de composicin
conocida
Se aplican pruebas estadsticas a los
datos
Gloria Mara Meja

En ciencias e ingeniera, el concepto de error


tiene un significado diferente del uso habitual de
este trmino. Coloquialmente, es usual el
empleo del trmino error como anlogo o
equivalente a equivocacin.
En ciencia e ingeniera, el error, est ms
bien asociado al concepto de INCERTEZA,
INCERTIDUMBRE, en la determinacin del
resultado de una medicin.

Gloria Mara Mej

ERROR: es la medida del sesgo en el resultado de


una medicin.
INCERTIDUMBRE: es el intervalo o rango de los valores
posibles de una medida. Incluye tanto los errores
sistemticos como aleatorios.
La incertidumbre de un resultado es bien diferente de
la precisin, sta da una medida del error aleatorio.

Gloria Mara Meja

Errores
Groseros o accidentales
Son errores que son tan
importantes que no existe alternativa
real que abandonar el experimento y
empezar de nuevo por completo.

Aleatorio
Estos provocan que
los resultados
individuales difieran uno
del otro de manera
que caigan a ambos lados
del valor medio.
Estos errores
afectan la precisin
de un experimento.
Este tipo de errores son
los que comete el operador
del instrumento utilizado.

Sistemticos
Provocan que todos los
resultados
sean errneos en el mismo
sentido, son demasiado
grandes, y se denomina tambin
sesgo de la medida. Este tipo
de error es
responsabilidad
del material empleado
y de su origen y presin
de fabricacin.

Gloria Mara Meja

Gloria Mara Meja

Errores experimentales
Error absoluto.- Nos indica si medimos u obtuvimos
mas o menos que el valor experimental, y en qu cantidad
excedimos del valor real o qu cantidad nos falt; esto
segn el signo de la sustraccin.
EA = valor experimental valor terico

Error relativo.- Es una forma de conocer el porcentaje


de error que obtuvimos en nuestros resultados.
ER = (valor experimental valor terico) x 100
(valor terico)

Gloria Mara Meja

Los errores presentes en un estudio analtico modifican:


Precisin
Es el grado de confianza con que se puede repetir un
experimento y este puede dar los mismo resultados. Es
utilizado como sinnimo de repetitibilidad.
Exactitud
Es el grado de concordancia entre el resultado de un
ensayo y el valor de referencia aceptado.
Gloria Mara Meja

TERMINOS IMPORTANTES
Media, Media aritmtica y promedio (X) son
trminos sinnimos. Es la medida de tendencia
central mas utilizada .Se obtiene dividiendo la
suma de los valores de una serie y dividiendo por
el numero de medidas del conjunto.
Mediana es el resultado alrededor del cual se
reparten los dems por igual. Si la serie es un
numero impar la mediana es el numero de la
mitad. Si la serie es un numero par se toma el
promedio del par central despus de haber
ordenado la serie de menor a mayor.

TERMINOS IMPORTANTES
Ejemplo: calcular la media y la mediana
de 10.06, 10.20, 10.08, 10.10.
Media = X =10.06+10.20+10.08+10.10 = 10.11

Mediana = 10.08 +10.10 = 10.09


2

Gloria Mara Meja

CIFRAS SIGNIFICATIVAS
Es el numero necesario de dgitos
para expresar los resultados de
una medicin congruente con la
precisin de medida.
237 :
2 centenas, 3 decenas y 7
unidades
El numero de cifras significativas incluye
todos los dgitos que se conocen mas el
primer digito incierto.
Gloria Mara Meja

El
numero
de
cifras
significativas en una medicin
es
independiente
de
la
colocacin del punto decimal.

Por
Por ejemplo
ejemplo el
el numero
numero 92.067:
92.067: Este
Este numero
numero
tiene
tiene cinco
cinco cifras
cifras significativas
significativas independiente
independiente
dondese
dondese coloque
coloque el
el punto
punto decimal.
decimal. En
En este
este
caso
caso el
el cero
cero si
si es
es una
una cifra
cifra significativa.
significativa.

En
En el
el numero
numero 727.0
727.0 el
el cero
cero no
no se
se usa
usa para
para
localizar
localizar el
el punto
punto decimal
decimal es
es significativo
significativo
Gloria Mara Meja

Ejemplos:

0.216

Tres Cifras significativas.

90.7

Tres cifras significativas.

800.0

Cuatro cifras significativas.

0.0670

Tres cifras significativas

Gloria Mara Meja

TERMINOS IMPORTANTES
Precisin.
El trmino precisin describe la reproducibilidad de los
resultados y se puede definir como la concordancia que
hay entre los valores numricos de dos o ms
mediciones que se han realizado de idntica manera.
La precisin slo depende
de la distribucin
de los errores aleatorios
y no se relaciona
con el valor verdadero ni
con el valor especificado.
Gloria Mara Meja

PRECISION
Para describir la precisin de un conjunto
de datos repetidos se utilizan tres
trminos muy conocidos:
La desviacin estndar, la varianza y el
coeficiente de variacin.

Gloria Mara Meja

La desviacin estndar (DS/DE) es una


medida de dispersin usada en
estadstica que nos dice cunto tienden a
alejarse los valores puntuales del
promedio en una distribucin.
Asi la varianza es la media de los cuadrados de las
diferencias entre cada valor de la variable y la media
aritmtica de la distribucin. Aunque esta frmula es
correcta, en la prctica interesa realizar inferencias
poblacionales, por lo que en el denominador en vez
de n, se usa n-1
Gloria Mara Meja

TERMINOS IMPORTANTES

METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION

Desviacin estndar S=

Xi-X
n-1

Desviacin respecto a la media


numrica entre un valor experimental y la media

es la diferencia

Varianza: S2
Coeficiente de variacin. C.V = S/Media
*100
Gloria Mara Meja

TERMINOS IMPORTANTES
Desviacin estndar relativa (DER) : se
calcula al dividir la desviacin estndar
entre la media del conjunto de datos.
DER se expresa en partes por mil o en %.
DER * 100% = CV.
Dispersin (W): Es la diferencia entre el
valor mas alto y el valor mas bajo del
conjunto
Gloria Mara Meja

TERMINOS IMPORTANTES
EXACTITUD : El trmino denota el grado
de coincidencia del resultado de una
medicin con el valor verdadero o
aceptado de la misma y se expresa en
funcin del error. La exactitud implica una
comparacin con el valor verdadero o
aceptado como tal.
Cuando no se conoce el valor verdadero
se debe usar un valor aceptado.
Gloria Mara Meja

TERMINOS IMPORTANTES
METODOS PARA MEDIR LA EXACTITUD
Error absoluto: Es la diferencia entre el valor
experimental y el valor real.
Error relativo: Es el error absoluto dividido por la
cantidad medida.
Ejemplo:
Una muestra tiene 20.34% de Fe y un analista
encuentra que es 20.44%.
Error Absoluto = 20.44-20.34 = 0.10%
Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por
mil

Gloria Mara Meja

TERMINOS IMPORTANTES
En trminos generales la exactitud
supone una comparacin con un valor
verdadero o aceptado como tal, la
precisin indica la concordancia entre las
medidas que han sido realizadas de una
misma forma.

Gloria Mara Meja

Esquema grfico para comprender la


relacin entre exactitud y precisin

www.galeon.com/scienceducation/error00.htm

En C existe buena precisin, pero no buena exactitud;


en A buena exactitud y precisin, y en B mala exactitud
y precisin.
Gloria Mara Meja

Diagrama precisin y exactitud

Gloria Mara Meja

EVALUACION DE LOS DATOS ANALITICOS

ESTUDIANTE

RESULTADOS
DE UNA TITULACION

10.08
10.11
10.09
10.10
10.12

9.88
10.14
10.02
9.80
10.21

10.19
9.79
9.69
10.05
9.78

COMENTARIO
Preciso pero
inexacto

Exacto pero
impreciso

Inexacto e
impreciso

Gloria Mara Meja

EVALUACION DE LOS DATOS ANALITICOS

ESTUDIANTE

RESULTADOS
DE UNA TITULACION

10.04
9.98
10.02
9.97
10.04

COMENTARIO

EXACTO Y
PRECISO

Gloria Mara Meja

TIPOS DE ERRORES EN DATOS


EXPERIMENTALES
ERRORES
Bruto

Ocurre de manera
Ocasional . suele ser
Grandes. Dan como
resultado valores
atpicos que difieren
mucho de los dems.

Aleatorios

Sistemticos

- = indeterminados
- = determinados
-Afectan la presicion
- Afectan la exactitud
o la reproducibilidad o sea la proxim al valor
verdadero.
- Los resultados caen - Todos los resultados
a lado y lado de la X

son errneos en el
mismo sentido.

Gloria Mara Meja

ERRORES DETERMINADOS O SISTEMATICOS

FUENTES DE ERRORES
SISTEMTICOS
Errores instrumentales:

Calibraciones deficientes

Errores del mtodo:

Dificiles de identificar

Errores personales:

Descuido, Falta de atencin

Gloria Mara Meja

EFECTO DE LOS ERRORES SISTEMATICOS


EN LOS RESULTADOS ANALITICOS
Los errores sistemticos pueden ser constantes o
proporcionales
En los errores constantes el error absoluto es invariable
con el tamao de la muestra ,mientras el error relativo
cambia al modificar dicho tamao.
Los errores proporcionales aumentan o disminuyen
segn el tamao de la muestra. Con los errores
proporcionales el error absoluto varia con el tamao de
la muestra, en cambio el error relativo permanece
constante.
Gloria Mara Meja

EFECTO DE LOS ERRORES SISTEMATICOS


EN LOS RESULTADOS ANALITICOS
Los errores sistemticos pueden ser constantes o
proporcionales.
En los errores constantes, el error absoluto es
invariable con el tamao de la muestra, mientras
en el error relativo cambia al modificar el tamao
de la muestra.
Los errores proporcionales aumentan o
disminuyen segn el tamao de la muestra; con
estos errores el error absoluto varia con el
tamao de la muestra en cambio el error relativo
permanece constante.
Gloria Mara Meja

EVALUACION DE LOS DATOS


ANALITICOS

Gloria Mara Meja

EVALUACION DE LOS DATOS


ANALITICOS
Los errores ocasionados por el amoniaco
envasado durante mucho tiempo fueron
constantes por que se utilizo el mismo
volumen y el aporte de Si fue el mismo. El
NH3 del envase recin utilizado fueron
muy pequeos y proporcionales al tamao
de muestra.

Gloria Mara Meja

ERRORES ALEATORIOS
Son la principal fuente de incertidumbre en
una determinacin.
Muchas variables no controladas y de no
fcil
identificacin
causan
errores
aleatorios.
El
efecto
acumulativo
de
las
incertidumbres, aunque estas sean muy
pequeas, hace que las mediciones por
duplicado de una serie flucten al azar.
Gloria Mara Meja

FUENTES DE LOS ERRORES


ALEATORIOS
Los errores aleatorios obedecen una curva
normal de error o curva de gauss.

meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm

Gloria Mara Meja

meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm

Gloria Mara Meja

Distribucin normal
Al iniciar el anlisis estadstico de una
serie de datos, y despus de la etapa de
deteccin y correccin de errores, un
primer paso consiste en describir la
distribucin de las variables estudiadas y,
en particular, de los datos numricos.
Un modo es con la curva de distribucin
normal que muestra la frecuencia con que
se repiten los datos.
Gloria Mara Meja

TRATAMIENTO ESTADISTICO DEL ERROR


ALEATORIO
Los mtodos estadsticos permiten categorizar y
caracterizar los datos, y tomar decisiones
objetivas en cuanto a su calidad e
interpretacin.
Hay que diferenciar entre muestra y poblacin o
universo. ( caso del anlisis de Ca en agua. La
poblacin seria un numero de medidas muy
grande cercano al infinito).
Las leyes de la estadstica se dedujeron para
usarlas en poblaciones. Para aplicarlas a
muestras se debe hacer ajustes.
Gloria Mara Meja

TRATAMIENTO ESTADISTICO DEL


ERROR ALEATORIO

Las curvas gaussianas se pueden


representar por medio de una ecuacin
que tiene la media de la poblacin , y la
desviacin estndar de la poblacin .

La media de la poblacin es y la media


de la muestra es X.

Gloria Mara Meja

Gloria Mara Meja

Gloria Mara Meja

EVALUACION DE METODOS
ANALITICOS
Ejemplo 2.

La N de una solucin se calculo con 4


titulaciones por separado y los resultados fueron 0.2041,
0.2049, 0.2039, y 0.2043. Calcular la X, la Mediana, El
rango , La S. la desviacin relativa y el C.V.
X = (0.2041+0.2049+0.2039+0.2043)/4 = 0.2043
Mediana M= (0.2041+0.2043)/2 = 0.2042
Rango R = 0.2049-0.2039 = 0.001
La desviacin relativa= Sumatoria de (Xi-X)/4=0.0003
S= 0.0004
C.V = (0.0004/0.2043)*100 = 0.2%
Gloria Mara Meja

Gloria Mara Meja

PRESENTACION DE LOS DATOS CALCULADOS

Siempre es necesario indicar el nivel de


confianza de los datos.
Es un rango de valores en los que con
una probabilidad determinada est un
valor verdadero poblacional.
Generalmente son del 95% o 99%.
La probabilidad de equivocarnos se llama
nivel de significancia y se simboliza
Gloria Mara Meja

PRUEBA DE SIGNIFICANCIA
Se utiliza para comparar el resultado de
un anlisis realizado por dos mtodos
diferentes. Se trabaja con las X
Se aplica el T de student. Plantea la
hiptesis de que las dos X son iguales. La
prueba T da una respuesta si o no a la
hiptesis nula con cierta exactitud como
del 95 o 99%
Gloria Mara Meja

Prueba de significancia
t = X 1 X2
S

n1n2
n1+n2

Si t calculado es mayor que t de la tabla


entonces los dos mtodos son iguales
Para poder calcular t hay que calcular
primero la s de cada serie de datos

Gloria Mara Meja

Cuando se escoge el nivel de


significacin 0,05 ( 5%),
tenemos un 95% de confianza de
que hemos adoptado la decisin
correcta y una probabilidad 0,05
de ser falsa.

Gloria Mara Meja

Cmo determina si un valor es realmente un


valor atpico y cmo decide si debe continuar
o no con el anlisis de datos?
Uno de los problemas en el anlisis de datos es
manejar los valores atpicos dentro de un grupo
de datos.
Un valor atpico es una observacin con un valor
que no parece corresponderse con el resto de los
valores en el grupo de datos.
Por lo general surgen dos preguntas:
1)Es este valor realmente un valor atpico?
2)Puedo eliminar este valor y continuar con el
anlisis de datos?
Gloria Mara Meja

DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse
que las pruebas estadsticas se utilizan
para identificar valores atpicos, no para
retirarlos del grupo de datos.
Tcnicamente, una observacin no debe
retirarse a menos que una investigacin
halle una causa probable para justificar
esta accin
Gloria Mara Meja

DATOS ATIPICOS
Si en la investigacin no se encuentra una causa
probable, qu debe hacerse?
Un enfoque sera realizar un anlisis de datos con
el valor atpico y sin l. Si las conclusiones son
diferentes, entonces se considera que el valor
atpico tiene influencia y esto debera indicarse
en el informe.
Otra opcin es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.
Gloria Mara Meja

RECHAZO DE DATOS
Dos de las pruebas estadsticas utilizadas
con mayor frecuencia en un grupo de
datos son la prueba de Dixon y la prueba
de Grubbs.
La prueba de Dixon utiliza relaciones de
las diferencias entre datos que parecen
atpicos comparados con los valores del
grupo de datos.
Gloria Mara Meja

RECHAZO DE DATOS
Estas tcnicas estn diseadas para detectar un
nico valor atpico en un grupo de datos, y por lo
tanto no son adecuadas para la deteccin de
mltiples valores atpicos.
Una tcnica rigurosa y amplia para identificar
eficazmente mltiples valores atpicos es el
procedimiento para muchos valores atpicos con
generalizacin extrema de la desviacin de
Student.

Gloria Mara Meja

DIXON
Por ejemplo, tomemos los datos 5.3, 3.1,
4.9, 3.9, 7.8, 4.7 y 4.3
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8
El tamao de la muestra es 7, y la relacin utilizada es el espacio
entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido
por el espacio entre los valores ms grandes y ms pequeos en
el grupo.
Por lo tanto, el ndice de Dixon es:
(7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532
Gloria Mara Meja

RECHAZO DE DATOS
Este valor se compara con un valor crtico de una tabla, y
el valor se declara valor atpico si supera ese valor
crtico.
Si Dcalculado>Dtabulado se rechaza el dato
El valor tabulado depende del tamao de la muestra, n, y
de un nivel de confianza elegido, que es el riesgo de
rechazar una observacin vlida. La tabla por lo general
utiliza niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El ndice de Dixon 0.532 excede este valor crtico,
indicando que el valor 7.8 es un valor atpico.
Gloria Mara Meja

DIXON
La prueba de Dixon se usa en un nmero
pequeo de observaciones (menor a 26) y
detecta elementos que se encuentren
sesgados o que son extremos.
Para aplicar la prueba de Dixon se
requiere de un nmero de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparacin.

Gloria Mara Meja

GRUBBS
La prueba de Grubbs utiliza una estadstica
de prueba, T, que es la diferencia absoluta
entre el valor atpico, XO, y el promedio de la
muestra (X)
dividida por la desviacin
estndar de la muestra, s.
Para el ejemplo anterior, el promedio de la
muestra es = 4.86 y la desviacin estndar
de la muestra es = 1.48. La estadstica
calculada de la prueba es:

Gloria Mara Meja

GRUBBS
Para un n = 7 y un riesgo del 5%, el valor
tabulado es 1.938 y el TCalculado = 1.99
excede este valor crtico, indicando que el
valor 7.8 es un valor atpico.

Gloria Mara Meja Z

TEST DE GRUBB PARA DATOS


SOSPECHOSOS
Recomendado por las normas ISO
G= Valor Sospechoso X
S
(Con el valor sospechoso incluido)
Si Gcalculada > Gtabulada el valor sospechoso se rechaza

Gloria Mara Meja Z

TEST Q DE DATOS SOSPECHOSOS

Aceptar o rechazar un resultado anmalo (outlier)


Normalmente se producen al cometer errores o fallos
en la metodologa aplicada.
Se ordenan los datos en forma creciente y se calcula Q
Q = desvo = Diferencia entre el dato sospechosos y su vecino ms cercano
recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor

Si Qcalculada > Qtabulada el dato se rechaza

Gloria Mara Meja Z

Ejemplo:
Al efectuar una serie de rplicas para determinar la
concentracin del in sulfato en una muestra de agua
para riego se obtuvieron los siguientes resultados.
Determinar si la medida 6.0 es un valor rechazable.
Medida Valor
1
5.0
2
5.2
3
5.5
4
5.6
5
6.0

1. Se ordenan los datos en orden de valor


decreciente
6.0, 5.6, 5.5, 5.2, 5.0
2. Se calcula Q
Q= (6.0-5.6)/ (6.0-5.0) =0.40
3. Se compara Q calculado con Q tabulado
para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable

Gloria Mara Meja Z

DESCARTE DE DATOS
1.

Definir que tan grande es la Diferencia entre el valor


sospechoso y los otros datos.
2. Aplicar Prueba Q.
a) Ordenar los datos
b) Calcular el rango
c) Encontrar la diferencia entre el resultado sospechosos
y su vecino mas cercano
3. Dividir la diferencia obtenida en el paso 2 entre el
Rango. As se obtiene el coeficiente de descartacion
Q.
4. Consultar la tabla de valores Q. Si el valor calculado es
mayor que el de latabla el resultado se puede
descartar con un 90% de confianza de que si se podia.

Gloria Mara Meja Z

Gloria Mara Meja Z

DESCARTE DE DATOS
EJEMPLO
4 Resultados de N de una solucin fueron
0.1014, 0.1012, 0.1019, 0.1016. Se podr
descartar 0.1019?
X sin el 0.1019 = 0.1014
0.1019-0.01014 =0.0005
Q = 0.1019 - 0.1016 =0.43
0.1019 0.1012
0.43 es menor que 0.76. NO SE DESCARTA

Gloria Mara Meja Z

Gloria Mara Meja Z

PRESENTACION DE LOS DATOS


CALCULADOS
Un indicador de la calidad de los datos es
la utilizacin de las cifras significativas.
Cifras significativas: Son todos los dgitos
que se conocen con certeza y el primer
digito incierto. Por ejemplo 30.24 tiene 4
cifras significativas (4, el ultimo digito, es
incierto)

Gloria Mara Meja Z

PRESENTACION DE LOS DATOS


CALCULADOS
El cero puede ser significativo o no segn
su ubicacin en el numero. Un cero
rodeado por otros dgitos siempre es
significativo.
Los ceros al final pueden o no ser
significativos. 2.0 tiene dos cifras
significativas. 2000 tiene una cifra
significativa. 2x103 tiene una.

Gloria Mara Meja Z

PRESENTACION DE LOS DATOS


CALCULADOS
Para las sumas y las restas el resultado debe
tener el mismo numero de decimales que el
numero que tiene menos decimales.
Cuando se suman o restan nmeros con
notacin cientfica se debe expresar el
resultado en la misma potencia de 10.
En la multiplicacin y la divisin se debe
expresar el resultado con las cifras
significativas del numero que tenga menor
cifras significativas.

Gloria Mara Meja Z

PRESENTACION DE LOS DATOS


CALCULADOS
Redondeo de datos:
Se debe aproximar al numero mayor si el ultimo
es mayor de 5 y al menor si el ultimo es menor
de 5.
61.555 se aproxima al numero par mas
cercano . Queda 61.56
De todas maneras el resultado debe expresarse
con la desviacin estndar calculada.

Gloria Mara Meja Z

OBJETIVOS DEL MUESTREO


Estadsticamente
los
objetivos
del
proceso de muestreo son:
1. Obtener el valor medio
2. Obtener una varianza que sea una
estimacin de la varianza poblacional con
limites de confianza validos para la media.

Gloria Mara Meja Z

VALIDACION DE METODOS ANALITICOS


Calidad de resultados

Selectividad Analito en medio de interferencias


Limite de deteccin Promedio de bcos +3(desviacin)
Limite de cuantificacin 5 10 L.D.
Intervalo de trabajo Rango en que el mtodo es exacto y preciso.
Rango lineal
Exactitud. Valor de referencia
Precisin Desviacin y CV

Sensibilidad Pendiente
% Recuperacin. Adicin de cantidades conocidas
GRFICOS DE CONTROL.

Gloria Mara Meja Z

VALIDACION DE METODOS ANALITICOS

Curvas de calibracin
Linealidad
Pendiente
Sensibilidad
Residuales
Coeficiente de correlacin

Gloria Mara Meja Z

VALIDACION DE METODOS
ANALITICOS
Curvas
de
calibracin:
Cuadrados
Modelo de regresin: Y=mx+b

Mnimos

Cuanto mas cercanos estn los datos a la


lnea que se obtiene del anlisis por
mnimos cuadrados, menores son los
residuales

Gloria Mara Meja Z

VALIDACION DE METODOS
ANALITICOS
Variables transformadas.
Transformaciones para linearizar las
funciones.

Gloria Mara Meja Z

También podría gustarte