Está en la página 1de 10

INCERTIDUMBRE EN LOS DATOS

La naturaleza y consecuencia del error experimental

1.- El enunciado del problema.

Todas las mediciones, aunque sean cuidadosamente realizadas, conllevan incertidumbre. Esta
incertidumbre se propaga en frmulas calculadas a partir de la medicin, y en las conclusiones
que se extrajeron del anlisis de datos

El error es un trmino que a veces se utiliza como sinnimo de incertidumbre en la medicin. La


palabra abarca una multitud de errores porque la incertidumbre estadstica tiene muchas caras:
el error aleatorio que es una parte ineludible de cualquier medicin, error sistemtico o sesgo,
la diferencia entre el valor observado y su valor verdadero (desconocido), o la diferencia entre
observado y el valor predicho por un modelo (tambin llamado residuo).

Aqu usamos el trmino error en el sentido de error experimental, lo que un ingeniero de


electrnica llamara ruido de datos. Si no hubiera error, no habra incertidumbre experimental
(y, de hecho, no hay necesidad de estadsticas).

La palabra error tiene connotaciones negativas en nuestra sociedad. Implica fracaso. En


estadstica, sin embargo, tiene un significado no emocional bastante especfico que, aunque no
es benigno, simplemente reconoce la realidad de la falta de uniformidad en la medicin. De la
observacin universal se desprende que si repetimos una medicin 10 veces generalmente
obtendremos 10 resultados diferentes. Discutimos esta idea en el captulo 1 y es importante
volver a visitarla.

El error es omnipresente. No podemos evitarlo. Nos trae malas noticias. La nica pregunta es si
las noticias son muy malas o simplemente moderadas. Por lo tanto, es mejor que lo aceptemos
y aprendamos a administrarlo utilizando los mtodos que nos proporcionan las estadsticas.

Haramos bien en contemplar el comentario tpicamente belicoso de Churchill, porque


tendemos a perder mucho tiempo en intentos ftiles de evitar la consecuencia del error.
Preferiramos anunciar triunfalmente que el nuevo floculante aumenta nuestra capacidad de
espesamiento, como lo habamos pensado desde el principio, en lugar de reconocer dbilmente,
despus de mucho trabajo y dinero, que no hay pruebas suficientes para extraer esta conclusin
deseable debido a la inevitable incertidumbre en los datos. Lamentablemente, las reglas de los
juegos nos exigen concluir que lo ltimo ms bien que lo anterior en ausencia de evidencia
persuasiva de lo contrario. Es un error lo que se opone a la reivindicacin de nuestros prejuicios
profesionales porque es un error el que introduce incertidumbre y, por lo tanto, riesgo en
nuestra toma de decisiones.

Aqu hay 10 mediciones repetidas de XRF de un estndar de zinc hecho por el laboratorio de
ensayo en una mina de plomo y zinc: 56.00, 55.74, 56.37, 56.35, 56.05, 56.17, 55.79, 55.95,
55.31, 55.82%. En un mundo perfecto, esperaramos que todos sean iguales: la respuesta
'correcta', igual al verdadero contenido de zinc del estndar. De hecho, todos son diferentes,
aunque no tanto, por qu?
El hecho de que la variacin de la exhibicin de medicin se conoce desde hace siglos. Sin
embargo, se pens que la variacin se deba a pequeos errores o imperfecciones en el
instrumento, y que con un mejor instrumento y ms cuidado era posible reducirlo a cero. El
estadstico ingls Karl Pearson tuvo una gran idea a fines del siglo XIX para darse cuenta de que
la variabilidad de este tipo es inherente a la naturaleza y nunca puede eliminarse por completo.
La repeticin de la medicin siempre mostrar dispersin, por muy bueno que sea el
instrumento o el experimento. Por lo tanto, no hay una respuesta "correcta", solo un conjunto
de estimaciones de la respuesta correcta.

Este presente un dilema fundamental. Qu resultado tomamos para nuestro propsito?


Nuestro primer instinto es hacer que el promedio represente el conjunto de datos, y en la
mayora de los casos estaramos en lo cierto. Sin embargo, el problema implica que hay cierta
incertidumbre en esa solucin. Esta incertidumbre tiene profundas consecuencias. Afecta al
experimento que hacemos, a cada medida que hacemos y a cada decisin que tomamos como
resultado, y nos lleva a una cantidad de preguntas. Es el promedio simple el mejor resumen de
los datos? Cul es el mejor nmero de mediciones repetidas para tomar? Cmo debemos
medir e interpretar la variabilidad? Cmo deberamos comparar un valor medio incierto con
otro valor medio incierto? La gestin del error es, en realidad, el negocio del mtodo estadstico.
En este captulo, consideramos las propiedades del error, cmo medirlo y cmo nos dice que lo
importante sobre nuestros datos afecta nuestra toma de decisiones.

2.- Precisin y Exactitud

Las palabras precisin y exactitud tienden a ser tratadas como sinnimos en el lenguaje
cotidiano. De hecho, tienen significados bastante diferentes que van al corazn de cmo
pensamos acerca de la incertidumbre.

Un simple examen de incertidumbre es la figura significativa ms pequea con la que podemos


leer un instrumento. Por ejemplo, una balanza de laboratorio digital podra leer hasta 0.1 g, o
una aguja analgica de ampermetro podra leer hasta 1 A. As que nunca podemos hacer la
medicin mejor que esta incertidumbre. Podramos informar, por ejemplo, que una muestra
pesaba 23.3 g +/- 0.1 g. Esta es una manifestacin de precisin.

Sin embargo, en la mayora de los casos, nos interesa el tipo de variabilidad que se observa en
los ensayos de zinc mencionados anteriormente. Las medidas repetidas que estn cerca unas de
la otra son precisas. Aquellos que exhiben mucha variabilidad son imprecisos. La mala precisin
implica una mayor incertidumbre y una menor confianza en el resultado.

La precisin es una medida de la desviacin de la verdad. La inexactitud implica un sesgo o error


sistemtico, tal vez debido a una mala calibracin del instrumento, un muestreo no
representativo o un error de transcripcin, por ejemplo. Una medicin precisa es aquella que
est aceptablemente libre de sesgo.

Una forma popular de ilustrar estas ideas es a travs de la prctica del tiro al blanco. La Fig. 3.1
muestra cuatro resultados posibles de cinco disparos en un objetivo. El tirador trata de lograr
dos cosas: acercarse lo ms posible al centro (precisin) y agrupar los cinco golpes lo ms cerca
posible (precisin, que los tiradores llaman 'agrupacin'). En este sentido, es lo mismo que
cualquier experimento, que quiere obtener la respuesta correcta y hacerlo de manera repetida.

Las mismas ideas se pueden ilustrar de una manera bastante ms rigurosa en trminos de la
distribucin de los resultados repetidos (figura 3.2). Los resultados exactos y precisos exhiben
una distribucin estrecha centrada en la respuesta correcta. La imprecisin implica una amplia
distribucin, y la inexactitud implica un valor promedio sistemticamente diferente de la
respuesta correcta.

La precisin de una medicin solo puede determinarse realmente repitindola varias veces y
evaluando su variabilidad. Volvamos a nuestra muestra de 10 ensayos de Zn: 56.00, 55.74, 56.37,
56.35, 56.17,55.79, 55.95, 55.31, 55.82%. Nuestra mejor estimacin de la verdad es el promedio
de los 10 valores, que es 55,96% de Zn. Cmo expresamos la incertidumbre en este resultado?
Una forma sera mirar el rango de valores. Podramos decir que estamos razonablemente
seguros de que el valor real se encuentra entre los valores ms bajos y ms altos, entre 55.31 y
56.37, o alrededor de +/- 0.5%. Una mejor manera es expresar la incertidumbre en a partir de la
cual se toman en cuenta las propiedades estadsticas de la muestra. Discutimos este enfoque en
las siguientes secciones.

Es importante informar una incertidumbre con el nmero correcto de cifras significativas. Taylor
(1997) sugiere que las incertidumbres experimentales deben redondearse a una cifra
significativa. Por lo tanto, un ensayo de cobre se mide como 2.05% con una incertidumbre
conocida de 0.055%, la falta de nitidez debera ser citada a +/- 0.06%

Taylor da una regla similar para informar la medicin en s misma. "La ltima cifra significativa
en cualquier respuesta establecida debera ser generalmente del mismo orden de magnitud (en
la misma posicin decimal) que la incertidumbre". Una afirmacin como recuperacin = 75.56%
+/- 2.5% es claramente tonta porque la magnitud de la incertidumbre hace que los ltimos dos
dgitos en la figura de recuperacin sean redundantes. La afirmacin correcta es: recuperacin
= 76 +/- 3%.

Con frecuencia se encuentra un problema similar al determinar la distribucin de tamaos de


una muestra de partculas mediante tamizado. Si se retienen 25 g en un intervalo de tamiz
particular con dos decimales, como se suele hacer.

Debido a que los clculos y las hojas de clculo dan como resultado muchas figuras significativas
(nos guste o no), estamos tentados de informarlas de esta manera. Es notable lo difcil que es
para nosotros abandonar tales afirmaciones espurias de buena precisin. Sin embargo, esto nos
da a nosotros y a otros y un sentido de confianza completamente equivocado en la fiabilidad de
nuestros resultados, que pueden meterse en problemas.

3.- Error y La Distribucin Normal.

La distribucin en la figura 3.2 tiene algunas caractersticas obvias: son simtricas en forma de
campana con un pico central. De hecho, son ejemplos de la distribucin normal, llamada as
porque describe muchos fenmenos naturales y de otro tipo, por lo tanto, un comportamiento
"normal". Tambin se conoce como la curva de campana (por razones obvias) y la distribucin
gaussiana despus del alemn Carl Friedrich Gauss, quien fue uno de los primeros en describir
sus propiedades matemticas y usarlo para fines prcticos (anlisis de errores en mediciones
astronmicas). Otro nombre es la curva de error (y su funcin de error asociada) porque describe
la distribucin de errores aleatorios en una medicin, o de hecho cualquier evento
verdaderamente aleatorio.

Volviendo a nuestra discusin sobre la precisin, podemos expresar un error de precisin


cuantitativamente como la desviacin de algn valor esperado, como un promedio. Volvamos a
nuestros 10 ensayos de zinc. La Tabla 3.1 muestra los valores, su promedio, la diferencia de cada
valor del promedio y el cuadrado de esa diferencia. Las diferencias con respecto al promedio
pueden definirse como 'errores', y tienen tres propiedades clave: se distribuyen normalmente,
tienen un promedio de cero y son aleatorias, es decir, ningn error dado puede predecirse. Los
ingenieros elctricos llaman a este error ruido, y a veces ruido blanco, lo que indica sus
elementos aleatorios. Todas las medidas estn sujetas a esta forma de error aleatorio, y es para
todos los fines prcticos sinnimo de precisin.

Estos errores no son errores. La variabilidad es una parte inherente del proceso de medicin. Sin
embargo, al usar el mejor instrumento y la prctica experimental, pueden minimizarse.

La cuantificacin de la precisin de una medicin o una cantidad calculada es muy importante


en la aplicacin de mtodos estadsticos. Cmo podemos medir la precisin? Tomar el error
promedio no funcionar porque por definicin siempre ser cero. Sin embargo, cuadrar el error
y luego promediar los valores equiparados da un resultado distinto de cero, 0.089 en este caso,
con unidades bastante intiles de Zn (%) 2. Si queremos expresar este valor en las unidades de
la medida original (Zn%) entonces podemos simplemente tomar la raz cuadrada, 0.300% Zn

Simplemente calculamos sin dolor una desviacin estndar. La frmula que usamos es:

Entonces la desviacin estndar es simplemente la raz cuadrada de la desviacin cuadrtica


promedio de cada resultado del promedio general. Si la variabilidad de los datos es grande, la
desviacin estndar ser grande y viceversa. Por lo tanto, cumple nuestros requisitos como
medida de precisin. El trmino en eqn. 3.1 se llama suma de cuadrados y la encontraremos de
diversas formas a lo largo de este libro.

Antes de continuar, tenemos que reconocer que eqn. 3.1 es realmente parcial cuando es
pequeo. Esto se debe a que la media que estamos utilizando es la media de nuestra muestra
de datos, no la poblacin media de la que se extrajo la muestra. Nuestro promedio de muestra
es el nico que tenemos; no conocemos la media de la poblacin y nunca lo haremos. Discutimos
la distincin importante entre poblacin y muestras ms tarde. Por el momento, podemos
afirmar que la media muestral, X, es una estimacin de la media poblacional, que generalmente
recibe la letra griega mu (u), y es una estimacin de la desviacin estndar de la poblacin, sigma
(g). Es muy poco probable que la media muestral sea igual a la media poblacional debido al tipo
de error aleatorio del que hemos estado hablando. Entonces usando x en la ecuacin. 3.1 en
lugar de u garantiza que la suma de cuadrados en la ecuacin 3.1 sea menor que la suma real de
cuadrados, subestimando as la verdadera desviacin estndar. Este es un sesgo.
Afortunadamente, resulta que este sesgo puede eliminarse dividiendo la suma de cuadrados por
n-1 en lugar de n, una cantidad llamada grados de libertad. La frmula para la desviacin
estndar de la muestra se convierte en:

Claramente, esta correccin no importa mucho cuando n = 1000, pero importa mucho cuando
n = 3. Excel y otro software estadstico usan la ecuacin 3.2, por lo que en los clculos no
tenemos que preocuparnos por la distincin. Sin embargo, tiene profundas implicaciones para
nuestra comprensin de la incertidumbre en muestras pequeas, como veremos.

La desviacin estndar es uno de los dos parmetros de la distribucin normal, siendo el otro el
promedio o la media, como lo llamaremos ms adecuadamente a partir de ahora. La frmula
para la media es la esperada: agregue todos los resultados y divida por la cantidad de resultados
Otra estadstica importante que utilizaremos mucho es la varianza muestral que es simplemente
el cuadrado de la desviacin estndar, o la ecuacin 3.2 sin la raz cuadrada.

Usando los nuevos smbolos para la media poblacional (u) y la desviacin estndar (d), la funcin
que describe la distribucin normal es:

Aunque parece bastante feo, contiene solo el valor en el eje x (x), la media y la desviacin
estndar, y pi, por lo que se usa fcilmente para calcular los puntos para una curva normal del
tipo que se muestra en la Fig. 3.3 . De hecho, Excel proporciona una funcin para construir una
distribucin normal para cualquier media y desviacin estndar dadas (Excel Hint 3.2). Por lo
tanto, no debemos preocuparnos por la forma de la ecuacin misma.

El eje y de la figura 3.3 (izquierda) est marcado como "Probabilidad". Podra ser una
proporcin, un porcentaje o incluso una frecuencia, es decir, un recuento directo de valores
(como en la figura 3.2), describe la proporcin o el nmero de valores en el valor
correspondiente de x, o la probabilidad de obtener ese valor de x en la poblacin descrita por
la distribucin.

Como esta es una distribucin normal estndar con media 0 y desviacin estndar 1, el eje x
en realidad est marcado en nmeros de desviacin estndar, a menudo denominado puntaje
z. Entonces el valor '1' significa una desviacin estndar por encima de la media, '-1' significa
una desviacin estndar por debajo de la media, y as sucesivamente. Es inmediatamente
evidente que obtener un valor con una desviacin estndar de 1 de la media es bastante
comn. La mayora (de hecho, cerca del 68%) de los valores son aquellos con 1 desviacin
estndar de la media. Los valores de ms de 2 desviaciones estndar de la media son menos
comunes. Los valores de ms de 3 desviaciones estndar de la media son raros, y esas 4
desviaciones estndar son extremadamente raras. De hecho, la tabla 3.2 nos dice que la
probabilidad de obtener un valor de 3 o ms desviaciones estndar por encima de la media (la
probabilidad acumulada) es exactamente 1-0.99865 (1 probabilidad en 741). La posibilidad de
obtener un valor 4 o ms desviacin estndar por encima de la media es 1 en 31574

Entonces, las caractersticas clave de la distribucin normal son las siguientes.

Es simtrico sobre la media. Por lo tanto, la probabilidad de obtener un valor 2 o ms


desviacin estndar por encima de la media es la misma que la de obtener un valor 2 o
ms desviacin estndar por debajo de la media.
Es asinttico al eje x, es decir, nunca alcanza el eje. Por lo tanto, hay una posibilidad
finita pero que disminuye rpidamente de obtener valores muy altos o muy bajos.
El valor medio tambin es el valor ms probable y el valor medio.
El valor medio tambin es el valor ms probable y el valor medio. La media, la moda y
la mediana de una distribucin normal son iguales.
Los que estn debajo de la curva son 1. Es decir, el rea debajo de la curva contiene
todos los valores posibles de la poblacin descritos por la distribucin.
Las proporciones arriba, abajo o entre ciertos valores se pueden calcular fcilmente.
La distribucin acumulativa (Fig. 3.3 a la derecha) parecer a un ingeniero mineral
como una distribucin de tamao acumulativa (Figura 2.24 - 2.26) o una curva de
separacin (Ej. 6.9). Esto no es un accidente La separacin de partculas a menudo se
piensa, se modela, como un proceso probilstico, y la distribucin normal acumulativa
se ha utilizado para este propsito (p. Ej., Tromp, 1937).

La distribucin normal es importante porque se ha encontrado que describe una amplia


gama de fenmenos naturales y de otro tipo, como la altura de los hombres adultos, la
lluvia en ciertas reas, los puntajes en las pruebas de aptitud, la longitud de mazorcas de
maz y las dimensiones de los componentes fabricados . No todos los datos de
procesamiento de minerales se distribuyen normalmente, pero algunos s lo estn. La Fig.
3.4 muestra la distribucin de los ensayos estndar de 124 Zn (un conjunto ampliado de
los discutidos anteriormente en este captulo) y 162 recuperaciones de la etapa diaria es
un concentrador de zinc (diferente). Las distribuciones normales ajustadas se muestran
superpuestas, con los medios calculados y las desviaciones estndar. Los histogramas
muestran la forma de campana simtrica caracterstica, lo que sugiere que los dos
conjuntos de datos s siguen las distribuciones normales.

Pero no tenemos que confiar en un juicio subjetivo. La figura 3.5 muestra grficos de
probabilidad normal de los datos, dibujados por Minitab.

Dichos grficos tienen ejes Y especialmente construidos y son lineales si los datos son
realmente normales, como es el caso aqu. Adems, existe una prueba estadstica formal,
la prueba de Anderson-Darling, que determina la importancia de cualquier desviacin de la
normalidad. En ambos casos, los valores de P para la prueba A-D, que son mucho ms que
el lmite de decisin de 0.05, nos obligan a aceptar la hiptesis de que los datos son
normales. Una prueba x2 ('Chi-cuadrado') tambin puede usarse para probar la
normalidad (o cualquier otra suposicin de distribucin). Ms sobre P-values, x2-test y
otras hiptesis en el Captulo 4.

Cmo nos ayuda todo esto con el concepto de error? La clave es la Fig. 3.4 (izquierda), la
distribucin de los ensayos estndar de zinc. Tambin podemos trazar la distribucin de
los errores, es decir, las diferencias entre los resultados de los ensayos individuales y la
media global. Esto se muestra en la figura 3.6. Estos son los errores aleatorios
mencionados anteriormente: error revelado al repetir una medicin muchas veces, cuyos
valores individuales no pueden predecirse. La grfica tiene claramente la misma forma que
en la figura 3.4 (izquierda), la distribucin normal ajustada tiene una media de cero y la
misma desviacin estndar que la de los datos sin procesar. Un poco de reflexin mostrar
que esto debe ser as, porque simplemente hemos movido el histograma de los datos a lo
largo del eje x desde la media (55.97%) a cero, por lo que la forma y la desviacin estndar
permanecern sin cambios.
Por lo tanto, los errores aleatorios se distribuyen normalmente, con una desviacin
estndar que indica la variabilidad o precisin de los datos. Recuerde que este es un
conjunto de ensayos que miden el mismo material (un estndar de zinc) a partir del cual
en un mundo perfecto se obtiene el mismo resultado (correcto) en todo momento. El
grado en el que no alcanzamos esa perfeccin se mide por el ancho de la distribucin, o la
desviacin estndar, en este caso 0,319% de Zn.

Muchos de los procedimientos estadsticos discutidos en este libro suponen que los datos
aleatorios se distribuyen normalmente con una media de cero y una desviacin estndar
que describe de forma rigurosa la magnitud (dispersin) del error o la precisin. Debido a
que la distribucin se describe mediante una funcin matemtica (ecuacin 3.5), podemos
calcular la probabilidad exacta si obtener un error mayor o menor que un valor dado es
que conocemos la media y la desviacin estndar. Tales probabilidades a menudo se dan
en forma de tabla en los libros de texto de estadsticas. En la Tabla A1.1 del Apndice 1 se
muestra una tabla que muestra la proporcin de valores que se encuentran por encima de
los valores dados del puntaje z (tambin conocido como desviacin normal estndar).
Debido a que la distribucin es simtrica, es simple calcular la proporcin de valores por
debajo o entre cualquier valor dado de z. Recuerde, z es el nmero de desviacin estndar
de la media, a lo largo del eje x.

La Fig. 3.7 muestra una distribucin normal estndar con los valores mayores a 2
desviaciones estndar (z = 2) sombreadas. La figura de la izquierda muestra que estn por
encima de 2 desviaciones estndar mayores que la media. La figura de la derecha muestra
que tanto esa rea como la correspondiente estn por debajo de 2 desviaciones estndar
menores que la media. Por supuesto, la curva es simtrica, la magnitud de las dos reas es
la misma, 2.3%. Curiosamente, el rea entre los dos lmites debe ser 100 - (2.3 +2.3) o
95.4% del total. Esta es la base de la regla general bien conocida, que aproximadamente el
95% de los valores son +/- 2 desviaciones estndar de la media.

La Tabla 3.3 es una versin en miniatura de la tabla A1.1 que muestra el valor de z que
contiene porcentajes convenientes en el cuerpo principal de la distribucin, con z definido
en un lado (1 cara) o en ambos lados (2 lados). Por ejemplo, el 90% de la distribucin se
encuentra entre los lmites +/- 1,64 desviaciones estndar (z = 1,64) o por debajo de z =
1,28. El 95% de la distribucin est contenida por lmites de z = + / - 1.96 (no exactamente
2 como la regla general, pero no muy lejos). Y, por supuesto, sabemos que el 50% debe
estar por encima y por debajo de la media en s misma.

La Tabla 3.4 muestra los porcentajes de la distribucin normal que se encuentran en el


rango de nmeros enteros de z (nmero de desviacin estndar). Por lo tanto, el 68.3% de
la distribucin se encuentra dentro de +/- 1 desviacin estndar. La Fig. 3.7 (derecha)
muestra el principio para z = 2.
Tabla 3.4 - Porcentaje de la distribucin normal que se encuentra entre los lmites del
nmero entero de z (2 lados)

+/- ( N de desviacin estndar) % de Distribucin


1 68.269
2 95.45
3 99.73
4 99.994

Es fcil ver una analoga entre el hecho de que el 95% de la distribucin tiene +/- 2
desviaciones estndar de la media, y decir que tenemos un 95% de confianza de que la
media real se encuentra dentro del intervalo: media de la muestra +/- 2 desviaciones
estndar. Haremos mucho uso de estas ideas para definir la confianza en las mediciones y
la toma de decisiones.

La distribucin normal generalmente describe procesos cuyos valores resultan de la


adicin de muchos pequeos errores. Cuando los valores resultan de la multiplicacin de
muchos pequeos errores, la distribucin log-normal es un mejor descriptor del proceso.
La distribucin log-normal se aplica a los datos cuyo registro natural se distribuye
normalmente, por lo que los datos se pueden tratar tomando sus registros y luego
aplicando la distribucin normal. Los errores del ensayo a menudo son proporcionales a la
magnitud del ensayo que conduce a un modelo de error log-normal, como se discuti en el
Captulo 12.

Cualquier punto de datos de una poblacin normalmente distribuida se puede mapear en


una distribucin normal estndar usando la transformacin de estandarizacin.

=

Where

Z= desviacin normal estndar, o puntaje z (nmero de desviaciones estndar


de la media)

X= valor de los datos

u= media de los datos

= desviacin estndar de los datos

Esto simplemente hace la pregunta: Cuntas desviaciones estndar tiene mi valor de la


media, y por lo tanto, qu tan probable es que ocurra?

Ejemplo 3.1: se suministraron bolas de molienda forjadas a un concentrador con un dimetro


nominal de 50 mm y una desviacin estndar esperada de 3 mm. Durante una investigacin de
un pobre rendimiento de molienda en el concentrador, se observ que muchas de las bolas que
se agregaban al molino tenan un dimetro de 60 mm. Qu proporcin de bolas de 50 mm se
espera que se extienda 60 mm en circunstancias normales?
Aqu u = 50, x = 60, d = 3 y desde eqn. 3.6 z = 3.33. Una bola de 60 mm en un lote de bolas
nominales de 50 mm es, por lo tanto, 3,3 desviaciones estndar por encima de la media. De la
Fig. 3.3 esto es claramente un evento raro. La funcin excel = NORMDIST (60,50,3, true)
devuelve P = 0,999571. Esta es el rea bajo la curva menor que z = 3.33. La posibilidad de
obtener una bola de 60 mm o ms en un lote de 50 mm es, por lo tanto, 1-0.999571 = 0.000429
o 1 en 2330 aproximadamente 1 por tonelada, algo raro en verdad. Claramente, el lote
abastecido estaba fuera de especificacin.

Tenga en cuenta que la simetra de la distribucin significa que una pelota de 40 mm o menos
(z = -3.33) tendra la misma baja probabilidad de ocurrir.

3.3 De dnde viene el error experimental?


Como se seal al comienzo de este captulo, fue la percepcin de Karl Pearson la que nos
mostr que las incertidumbres de medicin siempre nos acompaarn, y que existe una cierta
lnea base de error que nunca podremos mejorar por buenos que sean nuestros instrumentos
y tcnicas experimentales. Sin embargo, s tenemos control sobre los componentes del error
que surgen de fuentes experimentales particulares. Prestar atencin a estas fuentes, y tener
cuidado de limitar sus errores en la medida de lo posible, puede reducir en gran medida el
error general y as mejorar nuestra capacidad de interpretar los datos y tomar buenas
decisiones. Discutimos algunas de estas fuentes a continuacin.

Muestreo: cada muestra fsica tomada, ya sea de mineral, lodo, solucin, concentrado o
cualquier otro producto, tiene una variabilidad inherente asociada. Las muestras deben
tomarse de acuerdo con los protocolos de muestreo adecuados (Morrison, 2008). La teora de
Gy y las metodologas asociadas son una gua importante. La Seccin 13.4 discute estos
aspectos con ms detalle.

Prctica de laboratorio: las variaciones en el operador, la mquina, los lotes de reactivo, el


mtodo experimental, las condiciones ambientales y muchas otras fuentes contribuirn al
error. Un buen ejemplo es la variacin en la forma en que los tcnicos de laboratorio raspan
manualmente la espuma en una prueba de flotacin por lotes. No es necesariamente que un
tcnico tenga razn y otro est equivocado. Sin embargo, los diferentes estilos contribuirn
con otra fuente de variacin en cualquier prueba en la que ambos estn implicados.

Instrumentos: la precisin y exactitud del instrumento es una fuente comn de error. Esto
depender del diseo del instrumento, la calibracin, la linealidad, la estabilidad trmica, el
mantenimiento y muchos otros factores (Morrison, 2008).

Ensayo: la lnea de base del error suele ser un ensayo: tamao qumico, mineralgico o de
partculas. La medicin puede hacerse con un instrumento, como un espectrofotmetro de
absorcin atmica o un analizador de fluorencencia de rayos X, o 'manualmente', como por
valoracin, ensayo de fuego o clculo de puntos en el caso de la mineraloga. La repetibilidad
de los mtodos de ensayo debe estar bien caracterizada por el qumico o metalrgico del
ensayo. El error del ensayo ser producto del muestreo, la preparacin de la muestra y el
mtodo de anlisis en s. Ms sobre analizar problemas en Chaper 12.
Contabilidad metalrgica y balance de masa: la contabilidad metalrgica y el balanceo de
masa o material asociado deben llevarse a cabo de acuerdo con protocolos correctos y
rigurosos (Morrison, 2008). Esto incluye el uso de datos redundantes (ms datos que el
mnimo necesario para cerrar el balance) para obtener la mejor estimacin en un sentido de
mnimos cuadrados de todas las cantidades importantes, incluidos ensayos, flujos masivos y
cantidades calculadas, como calificaciones y recuperaciones. Un balance de masa riguroso
requerir la entrada de estimaciones de la desviacin estndar de todas las cantidades de
medicin para asegurar el equilibrio ponderado ptimo. El Captulo 13 discute estos problemas
con ms detalle.

La planta: la planta alberga las mayores variabilidades de todas, generalmente impulsadas por
cambios de alimentacin a lo largo del tiempo, pero tambin por distribuciones de
alimentacin pobres, variaciones de desplazamiento, diferencias de circuitos paralelos,
condiciones ambientales, variaciones de reactivos y muchos otros factores. La Figura 3.8 es un
buen ejemplo de las tendencias, los ciclos y el ruido aleatorio evidente en la recuperacin del
concentrador durante un perodo de 2 meses. La Figura 3.9 muestra un sesgo consistente en la
recuperacin entre dos circuitos de flotacin paralelos durante un mes, la Lnea 2 opera a
aproximadamente un 1.3% ms de recuperacin que la Lnea 1.

La figura 3.10 muestra un impacto negativo estadsticamente significativo de las variaciones de


la tasa de alimentacin en la recuperacin (ms sobre el significado del coeficiente de
correlacin, R, en el captulo 5). La figura 3.11 muestra un caso claro de distribucin de
alimentacin sesgada entre dos lneas de proceso paralelas en un concentrador de platino,
lnea A que generalmente tiene un grado de alimentacin ms alto que la lnea B; esto
conducir a un rendimiento metalrgico diferente en las dos lneas.

Todos estos efectos conspiran para aumentar la variabilidad de los datos de la planta, por lo
que es esencial adoptar los diseos experimentales correctos para poder detectar (mejoras)
que a menudo son pequeas en comparacin con el ruido de fondo. Discutimos ensayo de
planta en el Captulo 8.

Propagacin de errores: los errores en la medicin bsica, como los ensayos y los flujos de
masa, se propagan o se propagan en clculos basados en esas mediciones, generalmente de
maneras bastante poco intuitivas. Por ejemplo, una recuperacin calculada a partir de una
frmula de dos productos tendr una incertidumbre que es alguna funcin de las
incertidumbres en los anlisis de alimentacin, concentrado y de cola en la frmula, que a su
vez son una funcin de los mtodos de muestreo y ensayo utilizados. Es particularmente
importante comprender esta forma de error en cantidades calculadas crticas, como la
recuperacin. La propagacin del error se considera ms completamente en la Seccin 3.7.

También podría gustarte