Está en la página 1de 10

Edición Septiembre 15, 2012

Sociedad Minera Calvista Colombia S.A.S.


Revista informativa

Nuestro
Pórtico
El empleo de
histogramas
Por Ricardo Valls
NUESTRO PÓRTICO

El empleo de histogramas
y polígonos de frecuencia
en la interpretación de los
datos geoquímicos
Por: Ricardo Valls M.Sc.,P.Geo.,
E n este artículo se explican las metodologías
para confeccionar histogramas de carácter
no son factores antagónicos, sino que por el
continúo y discontinúo, así como la
contrario se complementan
determinación de los estadígrafos más
armónicamente,lográndose la
importantes como la media, la moda, la
representatividad gráfica de los datos de
mediana, ofreciéndose además la
forma exacta y eficiente.
interpretación geológica de las mismas.
De igual forma se detalla la interpretación de
En este artículo usaremos Excel como el
los polígonos de frecuencias, la
programa base para la construcción de estos
determinación de percentiles, decitiles y
gráficos, brindándose además la
cuartiles y su empleo como criterio para
interpretación geoquímica de los
evaluar la perspectividad de una anomalía.
estadígrafos obtenidos.

Introducción Histogramas y polígonos de


El empleo de los métodos estadísticos para la
frecuencia
elaboración de los datos es en la actualidad
una actividad imprescindible y la existencia
de programas de computación generales o El histograma es una representación gráfica
especializados, hace la misma aún más de la distribución de los datos y, cuando se
frecuente. No creo que sea una tarea fácil realiza correctamente, indica la distribución
encontrar hoy día una compañía sin natural de dichos datos.
computadoras o al menos calculadoras
programables. Esta situación ha provocado La base de un correcto histograma es la
que caigan en desuso los métodos selección de los intervalos de clase. Si sus
estadísticos gráficos (y generalmente datos son de carácter no continúo, como los
manuales) tales como los histogramas, los resultados de los análisis espectrales, no se
polígonos de frecuencia, los papeles debe de usar ningún criterio de agrupación de
logarítmicos y los métodos de correlación clases (bin classes en Inglés), sino usar
gráfico entre otros, por considerarse menos directamente cada valor y su frecuencia.
exactos y más trabajosos. Veamos un ejemplo.

Recordemos, sin embargo, el refrán de que En la tabla 1 se muestran los resultados


“Más vale un gráfico que mil palabras”. Los obtenidos mediante un análisis expectral. La
histogramas y polígonos de frecuencia Fig. 1 muestra un histograma creado de
siguen siendo los métodos ideales para la forma automática por Excel. La Fig. 2
representación gráfica de los datos y su muestra la verdadera distribución natural de
utilidad no se limita a esto, como se mostrará los datos. Es evidente que la Fig. 2, si bien
en este artículo. menos “estética”, brinda mejor información al
geólogo tratando de interpretar estos datos.
La cibernética y las construcciones gráficas

1
NUESTRO PÓRTICO
Valor Frecuencia
4 1
8 9
12 9
Ve a mo s a h o ra có mo d e te rm i n a r l o s
20 13 estadígrafos más importantes en un
32 5 histograma.
40 2

Tabla 1  . Resultados espectrales (semi-cuantitativos)


de un grupo de muestras.

La base de un correcto histograma es la


selección de los intervalos de clase.

La moda, la mediana, la media y


Figura 1 . Distribución matemática de los datos en el
histograma. los percentiles.

La moda se define como el valor más


frecuente en los datos y se representa con el
símbolo MO. En ocasiones, un histograma
puede presentar más de una moda, en cuyo
caso el valor más frecuente se llamaría moda
absoluta y los demás máximos, modas
relativas. Aunque no es frecuente, puede
darse el caso de un histograma con dos
modas absolutas (Fig. 3). La cantidad de
modas, define el carácter modal de la
distribución de una forma completamente
Figura 2 . Distribución natural de los datos en el objetiva.
histograma.
La moda se determina mediante la ecuación
(3).
Si los resultados son continuos generalmente
se utiliza la siguiente ecuación para
determinar los intervalos de clase.

LMO – es el límite inferior de la clase modal.


Ahora bien, teniendo en cuenta el principio
d1 – es el valor absoluto de la diferencia entre
estadístico que recomienda que el número de
la frecuencia de la clase modal y la frecuencia
clases no sea menos de diez ni mayor de
del intervalo de clase anterior.
quince, es más sencillo usar la ecuación (2),
d2 - es el valor de la diferencia entre la
substituyendo N por un número entero entre
frecuencia de la clase modal y la frecuencia
10 y 15.
del intervalo de clase siguiente.
w – es la amplitud de la clase modal.
2
NUESTRO PÓRTICO
La Tabla 2 muestra los datos empleados en sea las modas absolutas serían 7.3 y 29.2 y
el histograma de la Fig. 3. la moda relativa 43.7.
Intervalo Frecuencia La relación entre la posición de las modas y
de los fondos geoquímicos es de gran
0.1 1 utilidad para las interpretaciones
7.3 57 geoquímicas como se mostrará
14.6 7
posteriormente.
El valor de la mediana se determina
21.9 7 mediante la ecuación (4).
29.2 57
36.5 7
43.7 30
Tabla 2. Datos originales para la
determinación del valor de la moda
absoluta y relativa.
Donde,
Lm – es el límite inferior de la mediana de la
Si quisiéramos mostrar el caso de la clase determinada por la posición del
determinación de la moda relativa, ((n+1)/2)-ésimo evento (dato).
substituiríamos la ecuación (3) por los datos n – es el número de observaciones o datos
siguientes: en la muestra.
S – es la suma de las frecuencias de las
clases precedentes a la mediana de la clase.
fm – es la frecuencia de la mediana de la
Si quisiéramos mostrar el caso de la clase.
determinación de la moda relativa, w – es la amplitud del intervalo de clase de la
substituiríamos la ecuación (3) por los datos mediana.
siguientes: Uno de los usos más importantes de la
mediana es en substitución del valor medio
en los casos de conjuntos de datos no
representativos por su pequeño tamaño o en
los casos de funciones desconocidas o no
determinadas. En general, y teniendo en
cuenta que el valor de la mediana no
depende los valores extremos, es un
estadígrafo mucho más confiable que el
valor medio, sobre todo para el tratamiento
de datos de gran variabilidad como el oro. Es
una forma muy eficiente de eliminar el efecto
pepita de los datos.

La media aritmética se define como el


promedio aritmético de todos los valores de
Figura 3 . Histograma mostrando dos modas absolutas la muestra. La media geométrica se define
en rojo (11.2 and 32.8) y una moda relativa en verde a como el antilogaritmo del promedio
los 46.9. Este es un histograma trimodal.
aritmético de los logaritmos de los valores
iniciales de la muestra. Las ecuaciones 5 y 6
muestran la forma de calcular estos valores.
Aclaremos, que de haber sido los datos
anteriores datos de carácter discontinúo
(semi-espectrales), las modas serían
exactamente el valor que se repite más, o

3
NUESTRO PÓRTICO

De estas ecuaciones queda claro que sus Según Kashdan, A.B. et. al. (1979), la
valores no sólo dependen de cada valor mediana, la moda y la media en distribuciones
individual, sino también de los valores de carácter lognormal no coinciden,
extremos, los cuales generalmente tienden a cumpliéndose generalmente la relación de
falsear la imagen de la distribución así como el que la moda absoluta es menor que la
valor de sus estadígrafos. mediana y la mediana es menor que la media
Como se ve, todos estos cálculos son aritmética (MO < Me < Mx).
sencillos y deben de constituir el paso previo a
la interpretación de los histogramas,
conjuntamente con la representación gráfica
del valor del Clark o fondo geoquímico del
elemento analizado.
Los percentiles (Pn) se emplean únicamente
en la interpretación de los polígonos de
frecuencia. En ocasiones se emplea también
el término “cuartil” (Qn) or “decetil” (Dn). Los
límites cuartiles (Q1, Q2, y Q3) dividen la
muestra en cuatro partes. Los decitiles (D1,
D2, etc.), dividen la muestra en diez partes (de
ahí se desprende el nombre de cuartil o
decetil). Los percentiles 25, 50 y 75 coinciden Figura  4. Diferencia entre una distribución normal y
con los cuartiles Q1, Q2, y Q3, de la misma una lognormal, basado en los valores de la moda (rojo),
la mediane (verde) y la media aritmética (azul).
forma que los percentiles 10, 20, 30, etc.,
coinciden con los decitiles D1, D2, D3, etc.
Los percentiles, decitiles y cuartiles se Otra forma más gráfica consiste en mirar la
determinan gráficamente trazando una forma de la curva. En la Fig. 5, se puede
horizontal desde la escala de frecuencia observar una distribución normal en rojo, una
relativa acumulativa de un polígono de lognormal (asimétrica) en verde y dos
frecuencia hasta intersectar la curva del distribuciones no normales por mucho exceso
polígono y del punto de intersección se traza (azul) y poco exceso (amarillo).
una línea vertical hasta el eje de las abcisas.
Esa posición determina el valor del Pn.

Aplicaciones de los histogramas y


los polígonos de frecuencia.

A continuación se explicarán algunas de las


aplicaciones de los histogramas y de los
polígonos de frecuencia en la solución de
varias tareas geoquímicas.
Figura  5. Distintas formas de las curvas definidas por
Determinación de la Ley de Distribución histogramas para diferenciar entre distribuciones
normales y lognormales.

A pesar de que existen varios métodos para


la determinación analítica del tipo de Ley de En resumen, un histograma que responda a
Distribución de los datos )Asimetría y Exceso, una Ley de Distribución Normal ha de ser
Chi cuadrada, etc.), el histograma brinda una unimodal y el rango de sus valores (la
idea muy aproximada al tipo de distribución. distancia entre los valores máximos y
Más aún, en los casos de base de datos mínimos) no debe de ser mayor de dos
pequeñas (n< 20) los histogramas son más órdenes de resultados. Para ejemplificar esta
efectivos que los métodos analíticos para última condición, podemos decir que si la
definir el tipo de Ley de Distribución. mayoría de los valores oscila entre 10 y 50, no

4
NUESTRO PÓRTICO
deben de haber valores menores de 0.1 o deben de haber valores menores de 0.1 o
mayores de 500, pues en dicho caso es muy mayores de 500, pues en dicho caso es muy
posible que la distribución no sea Normal. posible que la distribución no sea Normal.

Determinación de los valores “huracanados” Determinación de los valores “huracanados”

Los histogramas permiten de una forma Los histogramas permiten de una forma
efectiva la detección de valores huracanados, efectiva la detección de valores huracanados,
tanto por el extremo superior, como por el tanto por el extremo superior, como por el
inferior. Esto representa una ventaja sobre los inferior. Esto representa una ventaja sobre los
métodos puramente matemáticos que en métodos puramente matemáticos que en
ocasiones dan valores inexistentes ocasiones dan valores inexistentes
(negativos) en el extremo inferior de la (negativos) en el extremo inferior de la
distribución. distribución.
Otra ventaja de los histogramas es que los Otra ventaja de los histogramas es que los
mismos funcionan independientemente del mismos funcionan independientemente del
tipo de distribución, en tanto que los métodos tipo de distribución, en tanto que los métodos
aritméticos, por ejemplo el mostrado en la aritméticos, por ejemplo el mostrado en la
ecuación (5). ecuación (5).

Donde:

En un histograma se considerará como


huracanado todo valor que se separe por al Figura  6. Los valores 10 y 16 son identificados como huracanados
menores que la media y deben de ser eliminados antes de determinar los
menos dos intervalos de clase de la mayoría demás estadígrafos.
de los datos, tal como se muestra en la Fig. 6
basada en los datos de la Tabla 3. También los polígonos de frecuencias pueden
ser usados para determinar valores
Intervalo Frecuencia huracanados inferiores y superiores,
10 1 eliminando de la muestra todos los valores
16 3
superiores e inferiores a los percentiles que se
escojan. De acuerdo a recomendaciones
21 0 prácticas, se recomienda el uso del P(15) para
27 0 los valores inferiores y el P(85) para los
valores superiores.
32 14
37 10
43 8
48 7
54 6
59 3
64 1

Tabla  3. Análisis de oro en ppm en un muestreo de Figura 7 . De acuerdo a la posición de los P(15) y P(85), todo valor menor
27 y mayor de 54 se considera huracanado y debe de eliminarse de la
suelo. muestra antes de determinar los estadígrafos principales.

5
NUESTRO PÓRTICO

Un ventaja evidente del uso de los polígonos Perspectividad de las anomalías


de frecuencia es el hecho de que siempre se
pueden eliminar los valores huracanados El polígono de frecuencia es un método ideal
superiores e inferiores a la media aritmética. para evaluar la perspectividad de las
anomalías detectadas. En ocasiones la
Caracterizaciones estadísticas de la muestra. presencia de uno o más valores elevados, no
necesariamente huracanados (efecto pepita)
Ya se ha visto que existen métodos nada son suficientes para alterar la importancia de
complejos para la determinación de algunos una anomalía, sobre todo si la misma ha sido
estadígrafos. En este punto trataremos más establecida en base a la media aritmética.
detalladamente acerca de la interpretación Una forma objetiva de evaluar la importancia
geoquímica de las modas. de las anomalías obtenidas, y de obtener un
En mi opinión, la moda es el estadígrafo más criterio para el orden de verificación de las
informativo para el geólogo, principalmente mismas, es determinar que porciento de los
por no ser un valor único promedio de toda la datos supera un valor “X” predeterminado,
muestra como lo es la media aritmética y por basado generalmente en la experiencia del
permitir la caracterización individual de las geólogo. Algo similar a un cut-off empleado
heterogeneidades “naturales” de la muestra en los procesos de estimación de recursos y
analizada. De esto se infiere que la moda es reservas minerales.
además un criterio de la heterogeneidad de la Con el objetivo de distinguir las anomalías
muestra analizada, ya que mientras más más perspectivas, en las poligonales de
heterogénea sea la misma, de mayor grado frecuencias se determinó el valor del tercer
será el carácter modal del histograma. Es por cuartil (Q3) y el valor del fondo local. Se
ello conveniente incluir los resultados de las considerará como perspectivo el caso en que
modas entre las características estadísticas al menos el 25% de los valores analizados
de la muestra estudiada. posean valores mayores al fondo local. O
La relación entre las modas y los fondos dicho de otra forma, serán perspectivos los
geoquímicos de los elementos (o Clarkes) es casos en que el percentil del fondo local P(f)
de gran informatividad. Lla moda absoluta sea menor que el límite del tercer cuartil Q(3).
coincide generalmente con el fondo Mientras mayor sea esa diferencia, o dicho de
geoquímico del elemento analizado y por otra forma, mientras mayor sea la cantidad de
ende caracteriza su estado disperso (no datos que caen entre los límites del P(f) y el
anómalo) en la roca, en tanto que las modas Q(3), mayor será la perspectiva de la
relativas caracterizan las concentraciones anomalía. Veamos un ejemplo.
naturales del elemento. Es por ello que La Tabla 5 muestra los resultados de dos
recomiendo el uso de las modas relativas anomalías “A” y “B”. Si bien sus valores
para determinar los niveles de anomalía medios y la cantidad de datos son idénticos
naturales (no matemáticos) del elemento que (40 y 100 respectivamente), los histogramas
se estudia. y polígonos de frecuencias son disímiles
Por último, la presencia de varias modas (Figs. 8 y 9).
puede indicar la presencia de más de un tipo
de mineralización o de más de una
generación del proceso de mineralización.
Cuando se han separado grupos de datos de
acuerdo a algún criterio específico como tipo
litológico, profundidad de muestreo, etc., la
presencia de varias modas también puede
ser indicativo de un error en el proceso de
estratificación de los datos. Acerca del tema
de la correcta estratificación de los datos
trataremos en una próxima ocasión. Figura 8 . Polígono de frecuencia de la anomalía "A"
mostrando en rojo la posición del Q(3) y en verde la del
P(f).

6
NUESTRO PÓRTICO

estos dos estadígrafos es 4 unidades más


pequeña (23 vs. 27). Esta diferencia nos
permite escoger la Anomalía “B” como la más
perspectiva.
Debido a su efectividad y sencillez, el autor
recomienda el empleo de esta metodología
para orientar y planificar trabajos de
verificación.

Conclusiones

1. El empleo de los histogramas y los


polígonos de frecuencia, aún en aquellas
empresas que cuenten con modernos
métodos analíticos, son muy útiles para la
determinación rápida y sencilla de varios
estadígrafos y sirven como un complemento
a los valores determinados por los software
usados.

2. En la confección de histogramas de
carácter discontinuo (como son los obtenidos
al procesar resultados de muestreos semi-
cuantitativos), se deben de emplear los
Tabla 5. Valores de las anomalías "A" y "B". mismos intervalos del método de análisis
para garantizar que no se formen curvas
polimodales artificiales.

3. Al trabajar con datos de carácter continuo


se debe de garantizar que la cantidad de
intervalos de clase varíe entre diez y quince
intervalos.

4. Los histogramas y polígonos de frecuencia


pueden solucionar diversas tareas, tales
como:
a. Determinación de valores huracanados.
Figura  9. Polígono de frecuencia de la anomalía b.Determinación de las Leyes de
"B" mostrando en rojo la posición del Q(3) y en
verde la del P(f).
Distribución.
c.Determinación de estadígrafos tan
Usaremos la Ecuación (8) para calcular los importantes como las modas.
datos proyectados en el polígono de d. Determinación de la perspectividad de las
frecuencia. anomalías.

Un ejercicio práctico antes de terminar

A pesar de su aparente semejanza numérica, Usando el histograma y polígono de


la diferencia entre el Q(3) y el P(f) de la frecuencias que se muestra en la Fig. 10,
Anomalía “A” es menor en un 3% que el basado en los datos de la Tabla 6, mire a ver
mismo valor para la Anomalía “B” (18 vs. cuánta información es capaz de extraer.
21%). Así mismo, la cantidad de valores
incluidos en el intervalo determinado por
7
NUESTRO PÓRTICO

Intervalo Frecuencia % acumulado Soluciónes al ejercicio práctico


8 1 2%
13 2 6%
18 0 6%
23 0 6%
28 14 34%
33 10 54%
38 5 64%
43 8 80%
48 6 92%
53 3 98%
58 1 100%

Tabla 6 . Datos para el histograma de la Fig. 10.

Figura 10 . Histograma y polígono de frecuencia


del ejemplo práctico.

La solución se muestra luego de la


bibliografía recomendada.

Referencias y bibliografía
recomendada.
Ostle, B. (1977). Estadistica aplicada
tecnicas de la estadistica moderna, cuando e
donde aplicarlas. Ciudad de La Habana,
Editorial Pueblo y Educación. Los histogramas permiten de una forma
Kashdan, A.B. et al. (1979) Modelaje efectiva la detección de valores huracanados,
matemático en la geología y la exploración de tanto por el extremo superior, como por el
yacimientos minerales (original en Ruso). inferior. Esto representa una ventaja sobre los
Moscú, Nedra. métodos puramente matemáticos que en
NC 92-21 (1980). Procedimiento para evaluar ocasiones dan valores inexistentes (negativos)
la anormalidad de las observaciones. Ciudad en el extremo inferior de la distribución.
de La Habana, C.I.N.A.N.
Voitkiievich, G.V et al. (1970). Pequeño
compendio de geoquímica (original en Ruso).
Moscú, Nedra.
8

También podría gustarte