Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Todas las mediciones, aunque sean cuidadosamente realizadas, conllevan incertidumbre. Esta
incertidumbre se propaga en frmulas calculadas a partir de la medicin, y en las conclusiones
que se extrajeron del anlisis de datos
El error es omnipresente. No podemos evitarlo. Nos trae malas noticias. La nica pregunta es si
las noticias son muy malas o simplemente moderadas. Por lo tanto, es mejor que lo aceptemos
y aprendamos a administrarlo utilizando los mtodos que nos proporcionan las estadsticas.
Aqu hay 10 mediciones repetidas de XRF de un estndar de zinc hecho por el laboratorio de
ensayo en una mina de plomo y zinc: 56.00, 55.74, 56.37, 56.35, 56.05, 56.17, 55.79, 55.95,
55.31, 55.82%. En un mundo perfecto, esperaramos que todos sean iguales: la respuesta
'correcta', igual al verdadero contenido de zinc del estndar. De hecho, todos son diferentes,
aunque no tanto, por qu?
El hecho de que la variacin de la exhibicin de medicin se conoce desde hace siglos. Sin
embargo, se pens que la variacin se deba a pequeos errores o imperfecciones en el
instrumento, y que con un mejor instrumento y ms cuidado era posible reducirlo a cero. El
estadstico ingls Karl Pearson tuvo una gran idea a fines del siglo XIX para darse cuenta de que
la variabilidad de este tipo es inherente a la naturaleza y nunca puede eliminarse por completo.
La repeticin de la medicin siempre mostrar dispersin, por muy bueno que sea el
instrumento o el experimento. Por lo tanto, no hay una respuesta "correcta", solo un conjunto
de estimaciones de la respuesta correcta.
Las palabras precisin y exactitud tienden a ser tratadas como sinnimos en el lenguaje
cotidiano. De hecho, tienen significados bastante diferentes que van al corazn de cmo
pensamos acerca de la incertidumbre.
Sin embargo, en la mayora de los casos, nos interesa el tipo de variabilidad que se observa en
los ensayos de zinc mencionados anteriormente. Las medidas repetidas que estn cerca unas de
la otra son precisas. Aquellos que exhiben mucha variabilidad son imprecisos. La mala precisin
implica una mayor incertidumbre y una menor confianza en el resultado.
Una forma popular de ilustrar estas ideas es a travs de la prctica del tiro al blanco. La Fig. 3.1
muestra cuatro resultados posibles de cinco disparos en un objetivo. El tirador trata de lograr
dos cosas: acercarse lo ms posible al centro (precisin) y agrupar los cinco golpes lo ms cerca
posible (precisin, que los tiradores llaman 'agrupacin'). En este sentido, es lo mismo que
cualquier experimento, que quiere obtener la respuesta correcta y hacerlo de manera repetida.
Las mismas ideas se pueden ilustrar de una manera bastante ms rigurosa en trminos de la
distribucin de los resultados repetidos (figura 3.2). Los resultados exactos y precisos exhiben
una distribucin estrecha centrada en la respuesta correcta. La imprecisin implica una amplia
distribucin, y la inexactitud implica un valor promedio sistemticamente diferente de la
respuesta correcta.
La precisin de una medicin solo puede determinarse realmente repitindola varias veces y
evaluando su variabilidad. Volvamos a nuestra muestra de 10 ensayos de Zn: 56.00, 55.74, 56.37,
56.35, 56.17,55.79, 55.95, 55.31, 55.82%. Nuestra mejor estimacin de la verdad es el promedio
de los 10 valores, que es 55,96% de Zn. Cmo expresamos la incertidumbre en este resultado?
Una forma sera mirar el rango de valores. Podramos decir que estamos razonablemente
seguros de que el valor real se encuentra entre los valores ms bajos y ms altos, entre 55.31 y
56.37, o alrededor de +/- 0.5%. Una mejor manera es expresar la incertidumbre en a partir de la
cual se toman en cuenta las propiedades estadsticas de la muestra. Discutimos este enfoque en
las siguientes secciones.
Es importante informar una incertidumbre con el nmero correcto de cifras significativas. Taylor
(1997) sugiere que las incertidumbres experimentales deben redondearse a una cifra
significativa. Por lo tanto, un ensayo de cobre se mide como 2.05% con una incertidumbre
conocida de 0.055%, la falta de nitidez debera ser citada a +/- 0.06%
Taylor da una regla similar para informar la medicin en s misma. "La ltima cifra significativa
en cualquier respuesta establecida debera ser generalmente del mismo orden de magnitud (en
la misma posicin decimal) que la incertidumbre". Una afirmacin como recuperacin = 75.56%
+/- 2.5% es claramente tonta porque la magnitud de la incertidumbre hace que los ltimos dos
dgitos en la figura de recuperacin sean redundantes. La afirmacin correcta es: recuperacin
= 76 +/- 3%.
Debido a que los clculos y las hojas de clculo dan como resultado muchas figuras significativas
(nos guste o no), estamos tentados de informarlas de esta manera. Es notable lo difcil que es
para nosotros abandonar tales afirmaciones espurias de buena precisin. Sin embargo, esto nos
da a nosotros y a otros y un sentido de confianza completamente equivocado en la fiabilidad de
nuestros resultados, que pueden meterse en problemas.
La distribucin en la figura 3.2 tiene algunas caractersticas obvias: son simtricas en forma de
campana con un pico central. De hecho, son ejemplos de la distribucin normal, llamada as
porque describe muchos fenmenos naturales y de otro tipo, por lo tanto, un comportamiento
"normal". Tambin se conoce como la curva de campana (por razones obvias) y la distribucin
gaussiana despus del alemn Carl Friedrich Gauss, quien fue uno de los primeros en describir
sus propiedades matemticas y usarlo para fines prcticos (anlisis de errores en mediciones
astronmicas). Otro nombre es la curva de error (y su funcin de error asociada) porque describe
la distribucin de errores aleatorios en una medicin, o de hecho cualquier evento
verdaderamente aleatorio.
Estos errores no son errores. La variabilidad es una parte inherente del proceso de medicin. Sin
embargo, al usar el mejor instrumento y la prctica experimental, pueden minimizarse.
Simplemente calculamos sin dolor una desviacin estndar. La frmula que usamos es:
Antes de continuar, tenemos que reconocer que eqn. 3.1 es realmente parcial cuando es
pequeo. Esto se debe a que la media que estamos utilizando es la media de nuestra muestra
de datos, no la poblacin media de la que se extrajo la muestra. Nuestro promedio de muestra
es el nico que tenemos; no conocemos la media de la poblacin y nunca lo haremos. Discutimos
la distincin importante entre poblacin y muestras ms tarde. Por el momento, podemos
afirmar que la media muestral, X, es una estimacin de la media poblacional, que generalmente
recibe la letra griega mu (u), y es una estimacin de la desviacin estndar de la poblacin, sigma
(g). Es muy poco probable que la media muestral sea igual a la media poblacional debido al tipo
de error aleatorio del que hemos estado hablando. Entonces usando x en la ecuacin. 3.1 en
lugar de u garantiza que la suma de cuadrados en la ecuacin 3.1 sea menor que la suma real de
cuadrados, subestimando as la verdadera desviacin estndar. Este es un sesgo.
Afortunadamente, resulta que este sesgo puede eliminarse dividiendo la suma de cuadrados por
n-1 en lugar de n, una cantidad llamada grados de libertad. La frmula para la desviacin
estndar de la muestra se convierte en:
Claramente, esta correccin no importa mucho cuando n = 1000, pero importa mucho cuando
n = 3. Excel y otro software estadstico usan la ecuacin 3.2, por lo que en los clculos no
tenemos que preocuparnos por la distincin. Sin embargo, tiene profundas implicaciones para
nuestra comprensin de la incertidumbre en muestras pequeas, como veremos.
La desviacin estndar es uno de los dos parmetros de la distribucin normal, siendo el otro el
promedio o la media, como lo llamaremos ms adecuadamente a partir de ahora. La frmula
para la media es la esperada: agregue todos los resultados y divida por la cantidad de resultados
Otra estadstica importante que utilizaremos mucho es la varianza muestral que es simplemente
el cuadrado de la desviacin estndar, o la ecuacin 3.2 sin la raz cuadrada.
Usando los nuevos smbolos para la media poblacional (u) y la desviacin estndar (d), la funcin
que describe la distribucin normal es:
Aunque parece bastante feo, contiene solo el valor en el eje x (x), la media y la desviacin
estndar, y pi, por lo que se usa fcilmente para calcular los puntos para una curva normal del
tipo que se muestra en la Fig. 3.3 . De hecho, Excel proporciona una funcin para construir una
distribucin normal para cualquier media y desviacin estndar dadas (Excel Hint 3.2). Por lo
tanto, no debemos preocuparnos por la forma de la ecuacin misma.
El eje y de la figura 3.3 (izquierda) est marcado como "Probabilidad". Podra ser una
proporcin, un porcentaje o incluso una frecuencia, es decir, un recuento directo de valores
(como en la figura 3.2), describe la proporcin o el nmero de valores en el valor
correspondiente de x, o la probabilidad de obtener ese valor de x en la poblacin descrita por
la distribucin.
Como esta es una distribucin normal estndar con media 0 y desviacin estndar 1, el eje x
en realidad est marcado en nmeros de desviacin estndar, a menudo denominado puntaje
z. Entonces el valor '1' significa una desviacin estndar por encima de la media, '-1' significa
una desviacin estndar por debajo de la media, y as sucesivamente. Es inmediatamente
evidente que obtener un valor con una desviacin estndar de 1 de la media es bastante
comn. La mayora (de hecho, cerca del 68%) de los valores son aquellos con 1 desviacin
estndar de la media. Los valores de ms de 2 desviaciones estndar de la media son menos
comunes. Los valores de ms de 3 desviaciones estndar de la media son raros, y esas 4
desviaciones estndar son extremadamente raras. De hecho, la tabla 3.2 nos dice que la
probabilidad de obtener un valor de 3 o ms desviaciones estndar por encima de la media (la
probabilidad acumulada) es exactamente 1-0.99865 (1 probabilidad en 741). La posibilidad de
obtener un valor 4 o ms desviacin estndar por encima de la media es 1 en 31574
Pero no tenemos que confiar en un juicio subjetivo. La figura 3.5 muestra grficos de
probabilidad normal de los datos, dibujados por Minitab.
Dichos grficos tienen ejes Y especialmente construidos y son lineales si los datos son
realmente normales, como es el caso aqu. Adems, existe una prueba estadstica formal,
la prueba de Anderson-Darling, que determina la importancia de cualquier desviacin de la
normalidad. En ambos casos, los valores de P para la prueba A-D, que son mucho ms que
el lmite de decisin de 0.05, nos obligan a aceptar la hiptesis de que los datos son
normales. Una prueba x2 ('Chi-cuadrado') tambin puede usarse para probar la
normalidad (o cualquier otra suposicin de distribucin). Ms sobre P-values, x2-test y
otras hiptesis en el Captulo 4.
Cmo nos ayuda todo esto con el concepto de error? La clave es la Fig. 3.4 (izquierda), la
distribucin de los ensayos estndar de zinc. Tambin podemos trazar la distribucin de
los errores, es decir, las diferencias entre los resultados de los ensayos individuales y la
media global. Esto se muestra en la figura 3.6. Estos son los errores aleatorios
mencionados anteriormente: error revelado al repetir una medicin muchas veces, cuyos
valores individuales no pueden predecirse. La grfica tiene claramente la misma forma que
en la figura 3.4 (izquierda), la distribucin normal ajustada tiene una media de cero y la
misma desviacin estndar que la de los datos sin procesar. Un poco de reflexin mostrar
que esto debe ser as, porque simplemente hemos movido el histograma de los datos a lo
largo del eje x desde la media (55.97%) a cero, por lo que la forma y la desviacin estndar
permanecern sin cambios.
Por lo tanto, los errores aleatorios se distribuyen normalmente, con una desviacin
estndar que indica la variabilidad o precisin de los datos. Recuerde que este es un
conjunto de ensayos que miden el mismo material (un estndar de zinc) a partir del cual
en un mundo perfecto se obtiene el mismo resultado (correcto) en todo momento. El
grado en el que no alcanzamos esa perfeccin se mide por el ancho de la distribucin, o la
desviacin estndar, en este caso 0,319% de Zn.
Muchos de los procedimientos estadsticos discutidos en este libro suponen que los datos
aleatorios se distribuyen normalmente con una media de cero y una desviacin estndar
que describe de forma rigurosa la magnitud (dispersin) del error o la precisin. Debido a
que la distribucin se describe mediante una funcin matemtica (ecuacin 3.5), podemos
calcular la probabilidad exacta si obtener un error mayor o menor que un valor dado es
que conocemos la media y la desviacin estndar. Tales probabilidades a menudo se dan
en forma de tabla en los libros de texto de estadsticas. En la Tabla A1.1 del Apndice 1 se
muestra una tabla que muestra la proporcin de valores que se encuentran por encima de
los valores dados del puntaje z (tambin conocido como desviacin normal estndar).
Debido a que la distribucin es simtrica, es simple calcular la proporcin de valores por
debajo o entre cualquier valor dado de z. Recuerde, z es el nmero de desviacin estndar
de la media, a lo largo del eje x.
La Fig. 3.7 muestra una distribucin normal estndar con los valores mayores a 2
desviaciones estndar (z = 2) sombreadas. La figura de la izquierda muestra que estn por
encima de 2 desviaciones estndar mayores que la media. La figura de la derecha muestra
que tanto esa rea como la correspondiente estn por debajo de 2 desviaciones estndar
menores que la media. Por supuesto, la curva es simtrica, la magnitud de las dos reas es
la misma, 2.3%. Curiosamente, el rea entre los dos lmites debe ser 100 - (2.3 +2.3) o
95.4% del total. Esta es la base de la regla general bien conocida, que aproximadamente el
95% de los valores son +/- 2 desviaciones estndar de la media.
La Tabla 3.3 es una versin en miniatura de la tabla A1.1 que muestra el valor de z que
contiene porcentajes convenientes en el cuerpo principal de la distribucin, con z definido
en un lado (1 cara) o en ambos lados (2 lados). Por ejemplo, el 90% de la distribucin se
encuentra entre los lmites +/- 1,64 desviaciones estndar (z = 1,64) o por debajo de z =
1,28. El 95% de la distribucin est contenida por lmites de z = + / - 1.96 (no exactamente
2 como la regla general, pero no muy lejos). Y, por supuesto, sabemos que el 50% debe
estar por encima y por debajo de la media en s misma.
Es fcil ver una analoga entre el hecho de que el 95% de la distribucin tiene +/- 2
desviaciones estndar de la media, y decir que tenemos un 95% de confianza de que la
media real se encuentra dentro del intervalo: media de la muestra +/- 2 desviaciones
estndar. Haremos mucho uso de estas ideas para definir la confianza en las mediciones y
la toma de decisiones.
Tenga en cuenta que la simetra de la distribucin significa que una pelota de 40 mm o menos
(z = -3.33) tendra la misma baja probabilidad de ocurrir.
Muestreo: cada muestra fsica tomada, ya sea de mineral, lodo, solucin, concentrado o
cualquier otro producto, tiene una variabilidad inherente asociada. Las muestras deben
tomarse de acuerdo con los protocolos de muestreo adecuados (Morrison, 2008). La teora de
Gy y las metodologas asociadas son una gua importante. La Seccin 13.4 discute estos
aspectos con ms detalle.
Instrumentos: la precisin y exactitud del instrumento es una fuente comn de error. Esto
depender del diseo del instrumento, la calibracin, la linealidad, la estabilidad trmica, el
mantenimiento y muchos otros factores (Morrison, 2008).
Ensayo: la lnea de base del error suele ser un ensayo: tamao qumico, mineralgico o de
partculas. La medicin puede hacerse con un instrumento, como un espectrofotmetro de
absorcin atmica o un analizador de fluorencencia de rayos X, o 'manualmente', como por
valoracin, ensayo de fuego o clculo de puntos en el caso de la mineraloga. La repetibilidad
de los mtodos de ensayo debe estar bien caracterizada por el qumico o metalrgico del
ensayo. El error del ensayo ser producto del muestreo, la preparacin de la muestra y el
mtodo de anlisis en s. Ms sobre analizar problemas en Chaper 12.
Contabilidad metalrgica y balance de masa: la contabilidad metalrgica y el balanceo de
masa o material asociado deben llevarse a cabo de acuerdo con protocolos correctos y
rigurosos (Morrison, 2008). Esto incluye el uso de datos redundantes (ms datos que el
mnimo necesario para cerrar el balance) para obtener la mejor estimacin en un sentido de
mnimos cuadrados de todas las cantidades importantes, incluidos ensayos, flujos masivos y
cantidades calculadas, como calificaciones y recuperaciones. Un balance de masa riguroso
requerir la entrada de estimaciones de la desviacin estndar de todas las cantidades de
medicin para asegurar el equilibrio ponderado ptimo. El Captulo 13 discute estos problemas
con ms detalle.
La planta: la planta alberga las mayores variabilidades de todas, generalmente impulsadas por
cambios de alimentacin a lo largo del tiempo, pero tambin por distribuciones de
alimentacin pobres, variaciones de desplazamiento, diferencias de circuitos paralelos,
condiciones ambientales, variaciones de reactivos y muchos otros factores. La Figura 3.8 es un
buen ejemplo de las tendencias, los ciclos y el ruido aleatorio evidente en la recuperacin del
concentrador durante un perodo de 2 meses. La Figura 3.9 muestra un sesgo consistente en la
recuperacin entre dos circuitos de flotacin paralelos durante un mes, la Lnea 2 opera a
aproximadamente un 1.3% ms de recuperacin que la Lnea 1.
Todos estos efectos conspiran para aumentar la variabilidad de los datos de la planta, por lo
que es esencial adoptar los diseos experimentales correctos para poder detectar (mejoras)
que a menudo son pequeas en comparacin con el ruido de fondo. Discutimos ensayo de
planta en el Captulo 8.
Propagacin de errores: los errores en la medicin bsica, como los ensayos y los flujos de
masa, se propagan o se propagan en clculos basados en esas mediciones, generalmente de
maneras bastante poco intuitivas. Por ejemplo, una recuperacin calculada a partir de una
frmula de dos productos tendr una incertidumbre que es alguna funcin de las
incertidumbres en los anlisis de alimentacin, concentrado y de cola en la frmula, que a su
vez son una funcin de los mtodos de muestreo y ensayo utilizados. Es particularmente
importante comprender esta forma de error en cantidades calculadas crticas, como la
recuperacin. La propagacin del error se considera ms completamente en la Seccin 3.7.