Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tratamiento Estadístico de Los Datos
Tratamiento Estadístico de Los Datos
los datos
Ciclo académico, de nivel virtual: 2023-I
Asignatura: Química Analítica
Universidad Nacional de Trujillo
Facultad de Ingeniería Química – Departamento de Química
Dr. Noé Costilla Sánchez
Introducción
• Las medidas experimentales siempre tienen una variabilidad
por lo que no se pueden sacar conclusiones con total
certeza. La Estadística nos proporciona herramientas para
aceptar conclusiones que tienen un alta probabilidad de ser
correctas y de rechazarlas cuando no lo sean. Algunas de las
aplicaciones más comunes del tratamiento estadístico son:
• (a) Determinar el intervalo de confianza de la medición,
• (b) Determinar el número de réplicas de la medición a un
cierto nivel de probabilidad,
Introducción
• (c) Estimar la probabilidad de que, (1) un promedio
experimental y un valor real ó (2) dos promedios de datos
son diferentes,
• (d) Determinar a un nivel de probabilidad dado, si la
precisión de 2 conjuntos de mediciones son diferentes,
• (e) El análisis de varianza, para evaluar mas de 2 muestras,
• (f) Decidir si se acepta o conserva un resultado en un
conjunto de mediciones,
• (g) Muestreo, calibración y estandarización.
Introducción
• Algunos conceptos ó términos a recordar o conocer:
• La media ó promedio, x : es la medida de tendencia central, media de
dos o más mediciones.
• La mediana, M: es el resultado medio cuando los datos se describen
en orden creciente o decreciente
• La precisión, indica la reproducibilidad de las medidas o cercanía de
los resultados con otros obtenidos de la misma manera. La precisión
se mide con la desviación estándar, la varianza y el coeficiente de
variación. N
• La desviación estándar para muestras, s:
i 1
( xi x ) 2
s
N 1
Introducción
• Exactitud: se define como la proximidad del valor medido al valor verdadero. Se
mide mediante el error absoluto(EA) o relativo(ER),
• EA = Valor calculado - Valor verdadero ;
• ER = EA x 100/Valor verdadero
• Cifras significativas: de un número son todos los dígitos que se conocen con
certeza más el primer dígito incierto. Como regla general de redondeo según sea
el caso, la cifra en cuestión si es 5 o más transforma al dígito anterior en una
unidad. Ejemplo el número 2.345 debe tener 3 cifras significativas el número se
transforma en 2.35.
• El valor que acompaña a todo número o resultado de una suma, resta,
multiplicación, división, etc. se conoce como desviación estándar absoluta ó
incertidumbre absoluta. Por ejemplo en la escritura del número 4.10(±0.02) indica
que su desviación estándar o incertidumbre absoluta tiene el valor de ±0.02.
Introducción
• La incertidumbre relativa o desviación estándar relativa, es igual a la desviación
estándar absoluta sobre el valor del número,
• I. relativa = I. absoluta/Valor del número
• Sumas y rectas: el resultado tendrá el mismo número de cifras significativas que
el sumando que tiene la mayor incertidumbre absoluta.
• Ejemplo: y = 2.15 (±0.02) - 0.75(±0.03) + 3.4(±0.2)
• El tercer término tiene la mayor incertidumbre relativa por lo tanto el resultado
tendrá 2 cifras significativas. La incertidumbre absoluta del resultado,
• sy = [s12 + s22 + s32 + ….. + sn2 ]0.5
• sy = [0.022 + 0.032 + 0.22]0.5 = 0.2032
• y = 4.80 = 4.8 (±0.2)
Introducción
• Multiplicaciones y divisiones: el resultado tendrá el mismo número
de cifras significativas que de aquel que tiene la mayor incertidumbre
relativa
• Ejemplo: y = 2.15 (±0.02) x 0.75(±0.03)/3.4(±0.2) = 0.4742647
• I. relativas: 2/215 ; 3/75 ; 2/34 ; este último término tiene la
mayor incertidumbre relativa, por lo tanto el resultado tendrá 2 c.f.
• IR = [(s1/Valor1)2 + (s2/Valor2)2 + (s3/Valor3)2 + …. + (sn/Valorn)]0.5
• IR = sy/y = [(2/215)2 + (3/75)2 + (2/34)2]0.5 = 0.07174079
• sy = 0.07174079 x 0.4742647 = 0.034024
• y = 0.47 ((±0.03)
Introducción
• Error absoluto = EA = xi - x verdadero
• Error relativo = ER = EA / x verdadero
• Error sistemático ó determinado, tiene un valor definido y una causa
asignable, que afecta la exactitud del resultado. Estos errores se pueden
corregir. Se consideran tres tipos:
(a) Instrumentales: causado por ejemplo, por la falta de calibración del
instrumento de análisis.
(b) Método: causado por ejemplo por la utilización de un método no
adecuado para la medición de un analito.
(c) Personal: causado por ejemplo por un analista en la lectura errónea de
una medición
Introducción
• La predisposición de un método analítico puede ser identificado
recurriendo a los siguientes pasos:
(a) El empleo de muestras estándar, como los materiales de referencia
certificados (MRC), los cuales contienen uno ó más analitos en
concentraciones conocidas. Estas sustancias la venden instituciones como
la National Institute of Standards and Technology (NIST), con la certificación
de que contienen concentraciones específicas de uno ó más analitos.
(b) Un segundo método: si no se dispone de la sustancia patrón, se
puede utilizar paralelamente un método analítico independiente, el cual
debe ser lo más diferente posible que el método en uso. Se debe conocer
estadísticamente la aceptación del método independiente.
Introducción
(c) Determinaciones de muestra blanco: una muestra blanco es aquella
que contiene los reactivos y disolventes utilizados en la determinación
menos la especie ó analito en estudio. Las determinaciones de blancos
revelan errores debidos a contaminantes e interferentes y recipientes
utilizados en el análisis. Al final se corrigen los resultados con la medición
con analito.
(d) Variación del tamaño de la muestra: la utilización de una mayor o
menor cantidad de muestra. Esto se mide mediante el error.
• Errores aleatorios o indeterminados: son aquellos que no se pueden
eliminar totalmente y con frecuencia son la principal fuente de
incertidumbre en una determinación. Todas las mediciones tienen errores
aleatorios.
Introducción
• Tratamiento estadístico del error aleatorio: el análisis estadístico de los
datos analíticos se basa en la suposición de que los errores aleatorios
siguen una distribución gaussiana como se muestra en la Fig. 1
La curva de Gauss, tiene las siguientes
propiedades:
(a) La forma de la curva de la distribución
depende de sus 2 parámetros: la media
poblacional, μ; y la desviación estándar de la
Población, σ
(b) La media indica la posición de la campana,
la gráfica se desplaza a lo largo del eje x.
(c) A mayor desviación la curva será más plana,
dado que la distribución, en este caso presenta
una mayor variabilidad
(d) La curva es simétrica respecto a la media Fig. 1: Curva normal de error
Introducción
• La cantidad, (xi - μ) en la ecuación de la Fig. 1 es la desviación de los
valores individuales xi con respecto a la media poblacional, μ
• La cantidad z representa la desviación de un resultado con respecto
a la media poblacional relacionada con la desviación estándar. Por lo
general se indica en las Tablas de estadística debido a que es una
cantidad adimensional. La expresión de z = (x - μ)/σ
• Cuando, x - μ = σ ; z = σ. Cuando, x - μ = 2σ ; z = 2σ y asi
respectivamente.
• Se deduce que el área bajo la curva de Gauss, en un 68.3%
corresponde al intervalo de ± 1σ, en un 95.4% corresponde al
intervalo de ± 2σ, y un 99.7% corresponde al intervalo de ± 3σ
Desviación estándar de los resultados calculados
• Desviación estándar de una suma o una resta: aplicando la teoría de
propagación de errores, por ejemplo para lo siguiente,
y(±sy) = a(±sa) + b(±sb) - c(±sc)
• sy, sa, sb y sc, son las desviaciones estándar absolutas de los
componentes de la operación matemática y sy se calcula así,
2 2 2
sy sa sb sc
Total SCT N - 1
¿Qué resultados son diferentes con el, ANOVA?
• Si el ANOVA señala diferencias, es frecuente interesarse por esta
diferencia. Uno de los más sencillos es el método de la diferencia
significativa media (DSM). La expresión es,
•
2 x CME
DSM t
Ng
• Ng, es el número de replicas en cada grupo los cuales deben ser
iguales. El valor de t de Student debe tener (N - I) grados de libertad.
CME, es el cuadrado medio del error.
• Ejemplo: 5 analistas obtuvieron en mmol de calcio por triplicado cuyo
promedio se resume en la Sgte. Tabla. Hay diferencia en los datos de
los analistas. Datos adicionales: CMF = 8.451 y CME = 0.409.
Determine que analista difieren entre si a un nivel de confianza
¿Qué resultados son diferentes con el, ANOVA?
• del 95%.
Analista 1 Analista 2 Analista 3 Analista 4 Analista 5