Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadisticas para Quimica Analitica 2-1
Estadisticas para Quimica Analitica 2-1
EN QUMICA ANALTICA
calidadbioquimica.com.ar/error.htm
IMPORTANCIA DE LA ESTADSTICA Y
LA QUIMIOMETRA EN LA QUMICA ANALTICA
Qu es estadstica?
La estadstica es una coleccin de
mtodos para planificar y realizar
experimentos, obtener datos y luego
analizar, interpretar, y formular una
conclusin basada en esos datos. Es
la ciencia encargada de recopilar,
organizar, analizar e interpretar
informacin numrica o cualitativa, de
manera
que
pueda
llevar
a
conclusiones vlidas.
Gloria Mara Meja
b
o
Pr
d
a
lid deducir
i
ab
ia
y poder de esa forma hacer previsiones sobre
c
n
mismos, tomar decisiones u obtener conclusiones.
re
e
f
In
Unidad 1: Estadstica Descriptiva.
Arturo A. Alvarado
los
DATOS NO AGRUPADOS
Medidas de
tendencia central
Medidas de
dispersin
Media aritmtica
Mediana
Moda
Percentiles
(posicin)
Rango (amplitud)
Rango
intercuartlico
Varianza
Coef. de variacin
Datos no agrupados
Si el n de datos es impar: valor central
Si el n de datos es par: media aritmtica de los 2 puntos
centrales
Caractersticas:
Sencilla de calcular
Se puede calcular si algn intervalo no tiene lmites
Poco representativa
X = xi fi / N
Medidas de dispersin
Reflejan la dispersin, oscilacin de
los datos, respecto al fenmeno
estudiado.
Complementan las de tendencia
central para la descripcin de una
distribucin
Gloria Mara Meja
Medidas de dispersin
Amplitud o rango
Diferencia entre el valor ms alto y ms bajo
de la distribucin.
Ofrece poca informacin sobre la agrupacin de
los datos.
Indica el campo de variabilidad.
Suele acompaar a la moda.
Medidas de dispersin
Varianza
Junto a la desviacin tpica, la que mejor expresa
la variabilidad del fenmeno
Media de los cuadrados de las diferencias entre
cada valor de la variable y la media aritmtica
S2 = (xi x)2 / N
S2 = xi2 / N x2
S2 = fi(xi x) 2 / N
S2 = fixi2 / N x2
Gloria Mara Meja
Medidas de dispersin
Desviacin tpica
Es la raz cuadrada de la varianza
S2 =
xi2 / N x2
S2 =
fixi2 / N x2
Medidas de dispersin
Varianza y desviacin tpica
Caractersticas
Ambas toman siempre valores positivos.
Si todos los datos de una distribucin son
iguales entre s, toman el valor 0.
Slo son aplicables a variables cuantitativas
La que ms se suele usar es la desviacin tpica.
Si los datos estn muy dispersos, la desviacin tpica ser
muy grande.
Medidas de dispersin
Coeficiente de variacin de Pearson
Para poder comparar la dispersin entre 2
ms variables entre s, o una misma
variable en 2 ms grupos estudiados
Es una medida relativa: Relaciona la
media con la desviacin tpica
CV = S / X . 100
calidadbioquimica.com.ar/error.htm
DISTRIBUCIO DE FRECUENCIAS
En una distribucin de datos estos pueden estar o no
agrupados.
DATOS NO AGRUPADOS EN
INTERVALOS:
ni Xi
n
Xi
4
3
2
1
0
Xi
4
3
2
1
0
SUPUESTO DE CONCENTRACION EN
EL PUNTO MEDIO (Xi):
ni
1
3
7
6
3
ni
1
3
7
6
3
mitjana=
Xi*ni
4
9
14
6
0
33
33/5=
6,6
Xi
18 20
15 17
12 14
9 11
6 8
3 5
ni Xi
n
ni
20
30
60
40
30
20
P. M.
19
16
13
10
7
4
mitjanna=
Xi
18-20
15-17
12-14
9-11
6-8
3-5
PM*ni
380
480
780
400
210
80
2330
2330/200=
ni
20
30
60
40
30
20
11,65
La distribucin normal
f(X)
Media
Mediana
Moda
Propiedades de la distribucin
normal:
El rea bajo la curva aproximado del promedio a
ms o menos una desviacin estndar (1) es de
0.68, a ms o menos 2 es de .0 95 y a ms o menos
3 es de 0.99.
Propiedades de la distribucin
normal:
La forma de la campana de Gauss depende de los parmetros
y .
Tiene una nica moda que coincide con su media y su
mediana.
La curva normal es asinttica al eje de X.
Es simtrica con respecto a su media . Segn esto, para este
tipo de variables existe una probabilidad de un 50% de observar
un dato mayor que la media, y un 50% de observar un dato
menor.
En resumen
Podemos concluir que hay una familia de
distribuciones con una forma comn, diferenciadas por
los valores de su media y su varianza.
La desviacin estndar ( ) determina el grado de
apuntamiento de la curva. Cuanto mayor sea el valor
de , ms se dispersarn los datos en torno a la media
y la curva ser ms plana.
La media indica la posicin de la campana, de modo
que para diferentes valores de la grfica es
desplazada a lo largo del eje horizontal.
De entre todas ellas, la ms utilizada es la
distribucin normal estndar, que corresponde a
una distribucin de media 0 y varianza 1.
Gloria Mara Meja
Errores
Groseros o accidentales
Son errores que son tan
importantes que no existe alternativa
real que abandonar el experimento y
empezar de nuevo por completo.
Aleatorio
Estos provocan que
los resultados
individuales difieran uno
del otro de manera
que caigan a ambos lados
del valor medio.
Estos errores
afectan la precisin
de un experimento.
Este tipo de errores son
los que comete el operador
del instrumento utilizado.
Sistemticos
Provocan que todos los
resultados
sean errneos en el mismo
sentido, son demasiado
grandes, y se denomina tambin
sesgo de la medida. Este tipo
de error es
responsabilidad
del material empleado
y de su origen y presin
de fabricacin.
Errores experimentales
Error absoluto.- Nos indica si medimos u obtuvimos
mas o menos que el valor experimental, y en qu cantidad
excedimos del valor real o qu cantidad nos falt; esto
segn el signo de la sustraccin.
EA = valor experimental valor terico
TERMINOS IMPORTANTES
Media, Media aritmtica y promedio (X) son
trminos sinnimos. Es la medida de tendencia
central mas utilizada .Se obtiene dividiendo la
suma de los valores de una serie y dividiendo por
el numero de medidas del conjunto.
Mediana es el resultado alrededor del cual se
reparten los dems por igual. Si la serie es un
numero impar la mediana es el numero de la
mitad. Si la serie es un numero par se toma el
promedio del par central despus de haber
ordenado la serie de menor a mayor.
TERMINOS IMPORTANTES
Ejemplo: calcular la media y la mediana
de 10.06, 10.20, 10.08, 10.10.
Media = X =10.06+10.20+10.08+10.10 = 10.11
CIFRAS SIGNIFICATIVAS
Es el numero necesario de dgitos
para expresar los resultados de
una medicin congruente con la
precisin de medida.
237 :
2 centenas, 3 decenas y 7
unidades
El numero de cifras significativas incluye
todos los dgitos que se conocen mas el
primer digito incierto.
Gloria Mara Meja
El
numero
de
cifras
significativas en una medicin
es
independiente
de
la
colocacin del punto decimal.
Por
Por ejemplo
ejemplo el
el numero
numero 92.067:
92.067: Este
Este numero
numero
tiene
tiene cinco
cinco cifras
cifras significativas
significativas independiente
independiente
dondese
dondese coloque
coloque el
el punto
punto decimal.
decimal. En
En este
este
caso
caso el
el cero
cero si
si es
es una
una cifra
cifra significativa.
significativa.
En
En el
el numero
numero 727.0
727.0 el
el cero
cero no
no se
se usa
usa para
para
localizar
localizar el
el punto
punto decimal
decimal es
es significativo
significativo
Gloria Mara Meja
Ejemplos:
0.216
90.7
800.0
0.0670
TERMINOS IMPORTANTES
Precisin.
El trmino precisin describe la reproducibilidad de los
resultados y se puede definir como la concordancia que
hay entre los valores numricos de dos o ms
mediciones que se han realizado de idntica manera.
La precisin slo depende
de la distribucin
de los errores aleatorios
y no se relaciona
con el valor verdadero ni
con el valor especificado.
Gloria Mara Meja
PRECISION
Para describir la precisin de un conjunto
de datos repetidos se utilizan tres
trminos muy conocidos:
La desviacin estndar, la varianza y el
coeficiente de variacin.
TERMINOS IMPORTANTES
Desviacin estndar S=
Xi-X
n-1
es la diferencia
Varianza: S2
Coeficiente de variacin. C.V = S/Media
*100
Gloria Mara Meja
TERMINOS IMPORTANTES
Desviacin estndar relativa (DER) : se
calcula al dividir la desviacin estndar
entre la media del conjunto de datos.
DER se expresa en partes por mil o en %.
DER * 100% = CV.
Dispersin (W): Es la diferencia entre el
valor mas alto y el valor mas bajo del
conjunto
Gloria Mara Meja
TERMINOS IMPORTANTES
EXACTITUD : El trmino denota el grado
de coincidencia del resultado de una
medicin con el valor verdadero o
aceptado de la misma y se expresa en
funcin del error. La exactitud implica una
comparacin con el valor verdadero o
aceptado como tal.
Cuando no se conoce el valor verdadero
se debe usar un valor aceptado.
Gloria Mara Meja
TERMINOS IMPORTANTES
METODOS PARA MEDIR LA EXACTITUD
Error absoluto: Es la diferencia entre el valor
experimental y el valor real.
Error relativo: Es el error absoluto dividido por la
cantidad medida.
Ejemplo:
Una muestra tiene 20.34% de Fe y un analista
encuentra que es 20.44%.
Error Absoluto = 20.44-20.34 = 0.10%
Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por
mil
TERMINOS IMPORTANTES
En trminos generales la exactitud
supone una comparacin con un valor
verdadero o aceptado como tal, la
precisin indica la concordancia entre las
medidas que han sido realizadas de una
misma forma.
www.galeon.com/scienceducation/error00.htm
ESTUDIANTE
RESULTADOS
DE UNA TITULACION
10.08
10.11
10.09
10.10
10.12
9.88
10.14
10.02
9.80
10.21
10.19
9.79
9.69
10.05
9.78
COMENTARIO
Preciso pero
inexacto
Exacto pero
impreciso
Inexacto e
impreciso
ESTUDIANTE
RESULTADOS
DE UNA TITULACION
10.04
9.98
10.02
9.97
10.04
COMENTARIO
EXACTO Y
PRECISO
Ocurre de manera
Ocasional . suele ser
Grandes. Dan como
resultado valores
atpicos que difieren
mucho de los dems.
Aleatorios
Sistemticos
- = indeterminados
- = determinados
-Afectan la presicion
- Afectan la exactitud
o la reproducibilidad o sea la proxim al valor
verdadero.
- Los resultados caen - Todos los resultados
a lado y lado de la X
son errneos en el
mismo sentido.
FUENTES DE ERRORES
SISTEMTICOS
Errores instrumentales:
Calibraciones deficientes
Dificiles de identificar
Errores personales:
ERRORES ALEATORIOS
Son la principal fuente de incertidumbre en
una determinacin.
Muchas variables no controladas y de no
fcil
identificacin
causan
errores
aleatorios.
El
efecto
acumulativo
de
las
incertidumbres, aunque estas sean muy
pequeas, hace que las mediciones por
duplicado de una serie flucten al azar.
Gloria Mara Meja
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
Distribucin normal
Al iniciar el anlisis estadstico de una
serie de datos, y despus de la etapa de
deteccin y correccin de errores, un
primer paso consiste en describir la
distribucin de las variables estudiadas y,
en particular, de los datos numricos.
Un modo es con la curva de distribucin
normal que muestra la frecuencia con que
se repiten los datos.
Gloria Mara Meja
EVALUACION DE METODOS
ANALITICOS
Ejemplo 2.
PRUEBA DE SIGNIFICANCIA
Se utiliza para comparar el resultado de
un anlisis realizado por dos mtodos
diferentes. Se trabaja con las X
Se aplica el T de student. Plantea la
hiptesis de que las dos X son iguales. La
prueba T da una respuesta si o no a la
hiptesis nula con cierta exactitud como
del 95 o 99%
Gloria Mara Meja
Prueba de significancia
t = X 1 X2
S
n1n2
n1+n2
DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse
que las pruebas estadsticas se utilizan
para identificar valores atpicos, no para
retirarlos del grupo de datos.
Tcnicamente, una observacin no debe
retirarse a menos que una investigacin
halle una causa probable para justificar
esta accin
Gloria Mara Meja
DATOS ATIPICOS
Si en la investigacin no se encuentra una causa
probable, qu debe hacerse?
Un enfoque sera realizar un anlisis de datos con
el valor atpico y sin l. Si las conclusiones son
diferentes, entonces se considera que el valor
atpico tiene influencia y esto debera indicarse
en el informe.
Otra opcin es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.
Gloria Mara Meja
RECHAZO DE DATOS
Dos de las pruebas estadsticas utilizadas
con mayor frecuencia en un grupo de
datos son la prueba de Dixon y la prueba
de Grubbs.
La prueba de Dixon utiliza relaciones de
las diferencias entre datos que parecen
atpicos comparados con los valores del
grupo de datos.
Gloria Mara Meja
RECHAZO DE DATOS
Estas tcnicas estn diseadas para detectar un
nico valor atpico en un grupo de datos, y por lo
tanto no son adecuadas para la deteccin de
mltiples valores atpicos.
Una tcnica rigurosa y amplia para identificar
eficazmente mltiples valores atpicos es el
procedimiento para muchos valores atpicos con
generalizacin extrema de la desviacin de
Student.
DIXON
Por ejemplo, tomemos los datos 5.3, 3.1,
4.9, 3.9, 7.8, 4.7 y 4.3
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8
El tamao de la muestra es 7, y la relacin utilizada es el espacio
entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido
por el espacio entre los valores ms grandes y ms pequeos en
el grupo.
Por lo tanto, el ndice de Dixon es:
(7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532
Gloria Mara Meja
RECHAZO DE DATOS
Este valor se compara con un valor crtico de una tabla, y
el valor se declara valor atpico si supera ese valor
crtico.
Si Dcalculado>Dtabulado se rechaza el dato
El valor tabulado depende del tamao de la muestra, n, y
de un nivel de confianza elegido, que es el riesgo de
rechazar una observacin vlida. La tabla por lo general
utiliza niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El ndice de Dixon 0.532 excede este valor crtico,
indicando que el valor 7.8 es un valor atpico.
Gloria Mara Meja
DIXON
La prueba de Dixon se usa en un nmero
pequeo de observaciones (menor a 26) y
detecta elementos que se encuentren
sesgados o que son extremos.
Para aplicar la prueba de Dixon se
requiere de un nmero de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparacin.
GRUBBS
La prueba de Grubbs utiliza una estadstica
de prueba, T, que es la diferencia absoluta
entre el valor atpico, XO, y el promedio de la
muestra (X)
dividida por la desviacin
estndar de la muestra, s.
Para el ejemplo anterior, el promedio de la
muestra es = 4.86 y la desviacin estndar
de la muestra es = 1.48. La estadstica
calculada de la prueba es:
GRUBBS
Para un n = 7 y un riesgo del 5%, el valor
tabulado es 1.938 y el TCalculado = 1.99
excede este valor crtico, indicando que el
valor 7.8 es un valor atpico.
Ejemplo:
Al efectuar una serie de rplicas para determinar la
concentracin del in sulfato en una muestra de agua
para riego se obtuvieron los siguientes resultados.
Determinar si la medida 6.0 es un valor rechazable.
Medida Valor
1
5.0
2
5.2
3
5.5
4
5.6
5
6.0
DESCARTE DE DATOS
1.
DESCARTE DE DATOS
EJEMPLO
4 Resultados de N de una solucin fueron
0.1014, 0.1012, 0.1019, 0.1016. Se podr
descartar 0.1019?
X sin el 0.1019 = 0.1014
0.1019-0.01014 =0.0005
Q = 0.1019 - 0.1016 =0.43
0.1019 0.1012
0.43 es menor que 0.76. NO SE DESCARTA
Sensibilidad Pendiente
% Recuperacin. Adicin de cantidades conocidas
GRFICOS DE CONTROL.
Curvas de calibracin
Linealidad
Pendiente
Sensibilidad
Residuales
Coeficiente de correlacin
VALIDACION DE METODOS
ANALITICOS
Curvas
de
calibracin:
Cuadrados
Modelo de regresin: Y=mx+b
Mnimos
VALIDACION DE METODOS
ANALITICOS
Variables transformadas.
Transformaciones para linearizar las
funciones.