Está en la página 1de 18

I.

ANTECEDENTES GENERALES

I.1. INTRODUCCION
“La minería constituye el principal motor del desarrollo de la economía chilena del
siglo XX, lo que se explica debido a que, en el marco de este sector económico,
particularmente la minería del cobre, se presenta la principal riqueza natural del
país. El cobre ha sido considerado como “la viga maestra” del desarrollo económico
chileno, y también catalogado como “el sueldo de Chile”. Es posible sostener que el
cobre ha desempeñado en el siglo XX un rol fundamental en el nivel de ingreso per
cápita alcanzado por Chile.”

Se conoce como “yacimiento mineral”, a un sector de la corteza terrestre, en el cual


hubo uno o más procesos geológicos, dando origen a elementos anómalos con
interés económico e industrial. La composición del yacimiento puede ser descrito en
base a atributos geológicos como litología, alteración y asociación en el espacio de
los minerales presentes en el depósito.

La determinación de estos atributos se realiza mediante una “estimación de


recursos minerales”. La estimación de recursos presentes en un yacimiento es la
base para cuantificar y modelar un conjunto de variables de interés en un
determinado espacio físico. Este proceso, se lleva a cabo en las fases tempranas
de la ingeniería de un proyecto y es el pilar fundamental debido a que es donde se
almacena la información correspondiente a la distribución de los minerales
presentes en el yacimiento.

Todo el estudio de evaluación de recursos minerales se basa en los datos que se


puedan obtener in situ en el yacimiento. En este contexto cabe mencionar que las
variables que se miden no son sólo las de leyes de elementos minerales, sino que
también se considera, el tipo de roca y sus características metalúrgicas.

Esta tesis, se basa en la aplicación de técnicas de evaluación de recursos minerales


en el contexto multivariable, principalmente por medio del análisis exploratorio de
datos.

Las técnicas estadísticas entre las que se incluyen las estadísticas de resumen,
diagramas de caja, gráficos de dispersión, análisis de correlación, entre otros,
permiten investigar sobre la estructura, tendencias y asociaciones de las variables,
así como conocer los procesos que controlan la variabilidad espacial del área de
interés.

La determinación de la distribución espacial de la calidad del cuerpo mineralizado a


partir de herramientas estadísticas para el análisis de datos constituye el objetivo
primordial de la presente tesis.
I.2. JUSTIFICACION

El objetivo de toda industria es obtener un beneficio económico mediante la


extracción, procesamiento y comercialización de un mineral, este elemento a
comercializarse cebe cumplir una serie de requisitos, entre los cuales se encuentra
que debe poseer una ley determinada y en que se encuentre en grandes
concentraciones.

Para poder llegar a cumplir los objetivos nombrados con anterioridad, las empresas
realizan campañas de prospección y exploración con el fin de poder obtener
muestras terreno y analizarlas mediante técnicas geoestadísticas, aunque si bien
existe una gran cantidad de tecnicas para lograr este análisis tales como media,
mediana, moda, kriggin, método de poligonos entre otros. No son del todo
satisfactorias al momento de realizar un modelo geológico exacto, obteniendo un
modelo menos disperso que la realidad, debido a que estas tecnicas no captan la
variabilidad real de las anomalias.

II. MARCO TEORICO


II.1. Geoestadística

La palabra “geoestadística” fue inventada por Georges Matheron en 1962.

El prefijo “Geo” alude a las ciencias de la tierra, que ha sido históricamente la


disciplina donde la geoestadística se ha desarrollado. Los campos de aplicación
actuales alcanzan los dominios más variados, como la evaluación de recursos
naturales (mineros, forestales, gas, petróleo, etc.), ciencias del suelo y
medioambientales, topografía, oceanografía, geofísica, agricultura y análisis de
imágenes, por nombrar algunos. El término “estadística” se refiere al uso de
herramientas estadísticas y probabilísticas. Con respecto a la estadística clásica, la
geoestadística busca tomar en cuenta las dependencias entre las observaciones
disponibles, considerando qEn ue ellas están ubicadas en el espacio.
Sea {Z (s): s ∈ D} una función aleatoria (proceso aleatorio), donde D es un
subconjunto fijo de R ͩ llamado conjunto de índices, y s varía continuamente en D.
Matheron, padre de la Geoestadística en su forma actual, la definió como “la
aplicación del formalismo de las funciones aleatorias al reconocimiento y estimación
de fenómenos naturales”.
Cressie (1991) considera a la Geoestadística como “una rama de la estadística que
abarca teorías y aplicaciones para procesos aleatorios con índices espaciales
continuos”. Así en ambos casos, el término Geoestadística pierde su significado
etimológico.
(Víctor Álvarez (2004) TESIS GEOESTADISTICA [en línea]
https://www.scribd.com/book/258447223/TESIS-GEOESTADISTICA

El fin último de la Geoestadística es la caracterización del fenómeno, lo que conduce


a varios tipos de aplicaciones. El primero es la predicción (estimación), esto es,
conocida la variable en una serie de puntos, predecir su valor en otros. La
innovación de la Geoestadística es que permite obtener no sólo la predicción sino
también una medida de la incertidumbre asociada a ella.

II.1.1.1. Variable regionalizada

La Geoestadística es la estimación de fenómenos o procesos geológicos en el


espacio, es decir, es una variable medida en el espacio de manera que presente
una estructura de correlación.
Desde el punto de vista matemático una variable regionalizada es una función f(x)
que toma valores en todos los puntos x de coordenadas ((𝑥𝑖 , 𝑦𝑖 , 𝑧𝑖 ) en el espacio
tridimensional, pero estas funciones varían en el espacio por lo que imposibilitan un
estudio directo, haciendo necesario llevar a cabo un análisis de variabilidad de la
información disponible, sugiriendo un estudio profundo de la función variograma.

Una Variable Aleatoria puede tomar valores de acuerdo con cierta distribución de
probabilidad. Un valor medido es una realización de la VA 𝑍(𝑥1 ) definida en el punto
𝑥1 . Al conjunto de todas las mediciones en el área de estudio de la variable
regionalizada 𝑍(𝑥) puede considerarse como una realización del conjunto VA
(𝑍(𝑥), 𝑥 ∈ á𝑟𝑒𝑎 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜), a este conjunto de VA es llamada Función Aleatoria y
se escribe 𝑍(𝑥). Una realización de una función aleatoria 𝑍(𝑥) es una variable
regionalizada 𝑍 ′ .

Figura. Variable regionalizada en un espacio unidimensional.


(Geostadistica, Xavier Emery, 2013)
II.1.1.2. Noción de soporte

La superficie o el volumen sobre el cual se considera la variable regionalizada se


denomina soporte. En general, el soporte de las mediciones es muy pequeño,
mientras que el que interesa en la práctica puede ser más voluminoso (por ejemplo,
las unidades selectivas de explotación en evaluación minera o las unidades de
remediación en contaminación de suelo). Esta noción es esencial debido a la
dependencia que existe entre el soporte y la distribución estadística de los valores,
conocida como efecto de soporte: los soportes voluminosos presentan una menor
cantidad de valores extremos y una mayor cantidad de valores intermedios que los
soportes puntuales.

II.2. Variograma

El variograma es la herramienta geoestadística básica. El variograma


o semivariograma se utiliza para poder determinar el comportamiento
espacial que es producido por una variable la cual debe ser definida
sobre un área determinada.
Permite la cuantificación de los parámetros geológicos y expresa la
correlación espacial entre los valores muestreados.

Una vez obtenido los resultados de un variograma sobre un área


determinada se denomina variograma experimental la cual tiene como
resultados una distancia máxima y sus puntos de influencia sobre los
otros puntos a diferentes distancias.

En términos muy simples podemos definir el variograma como la


media de los cuadrados de las diferencias entre pares de muestras
separados por una distancia h:

Ү = ½ N . ∑ [ (Z(x) – Z(x+h)) ]2

Componentes de un Variograma:

La continuidad espacial queda reflejada en la tasa de crecimiento de


la Varianza (Y) de acuerdo con los aumentos de la distancia de
muestreo (h).
Fig. Variograma y sus componentes
(Geostadistica, Xavier Emery 2013)

A. Modelos de Variogramas

Se define modelos de variogramas a las curvas generadas a partir de


funciones matemáticas. Los modelos variográficos nos permiten
conocer cada una de las distribuciones para todos los puntos en el
espacio o área determinada.

Fig. Tipos de variogramas


(Recursos Minerales, Lopez Jimeno, 1991)

II.2.1.1. Análisis Variografico

Su objetivo es modelar la continuidad espacial de la(s) variable(s) en


estudio, debido a que los valores observados en distintos puntos del espacio
pueden estar correlacionados. De este modo es importante estudiar qué tan
rápido o lento se pierde esta correlación al aumentar la distancia de
separación entre dos puntos.
Para desarrollar este estudio se utiliza una función llamada variograma que
tiene por objetivo medir la variabilidad espacial. La versión simple
corresponde al caso univariable, mientras que la cruzada corresponde a la
multivariable e involucra un par de variables a la vez.

Lo que considera dicha herramienta es principalmente la diferencia entre


pares de datos que se encuentren separados por un vector h.
El variograma en el caso univariable se presenta a continuación:

La variable regionalizada es z(x), mientras que Z(x) es la función aleatoria


asociada, |N(h)| corresponde al número de pares de datos disponibles para
una separación dada por un vector h, siendo las posiciones de estos pares
de datos el intervalo.

Dicha herramienta también puede ser definida para el caso multivariable. De


esta manera se mide la variabilidad que hay entre dos variables de una base
de datos en el espacio.

Donde Ni j (h) es el número de pares de datos que se consideren para


calcular el estimador, los que se encuentran separados entre sí por un vector
h. Notar que h corresponde a un vector con una dirección cualquiera y que
el uso del vector h para las mediciones usadas hace que ambas variables
deban coexistir en los mismos puntos para poder calcular este estimador.
En un variograma experimental se define como meseta al valor en el cual se
estabiliza el variograma, y como alcance a la distancia que se alcanza la
meseta. Formalmente la meseta debe ser igual a la varianza de la variable
(o la covarianza en el caso de un variograma cruzado entre dos
variables). Además, se define como efecto pepita a la discontinuidad en el
origen del variograma. Mientras más alto el efecto pepita, más fratricida a
pequeña escala presenta la variable en estudio.

Fig. Ilustración de variograma experimental


(Estimacion de recursos minerales. U-cursos, 2012)

Un variograma experimental requiere ser modelado debido a que se calcula


solo para ciertas direcciones y distancias. Existen una serie de modelos
elementales que, según la forma que presente el variograma experimental,
principalmente en el origen, permiten modelarlo adecuadamente:

 Efecto pepita: discontinuidad en el origen.


 Modelo esférico y exponencial: lineales en el origen.
 Modelo Gaussiano: parabólico en el origen.
Fig. Modelos de variograma
(Estimacion de recursos minerales. U-cursos, 2012)

II.2. Análisis Exploratorio de datos

“El Análisis Exploratorio de Datos (A.E.D.) es un conjunto de técnicas estadísticas


cuya finalidad es conseguir un entendimiento básico de los datos y de las relaciones
existentes entre las variables analizadas. Para conseguir este objetivo el A.E.D.
proporciona métodos sistemáticos sencillos para organizar y preparar los datos,
detectar fallos en el diseño y recogida de los mismos, tratamiento y evaluación de
datos ausentes (missing), identificación de casos atípicos (outliers) y comprobación
de los supuestos subyacentes en la mayor parte de las técnicas multivariantes
(normalidad, linealidad, homocedasticidad).”

(Salvador Figueras, M y Gargallo, P. (2003): "Análisis Exploratorio de Datos", [en


línea] 5campus.com, Estadística http://www.5campus.com/leccion/aed).

El estudio exploratorio es básicamente el análisis de los datos desde todas sus


perspectivas con el fin de obtener una visión generalizada de estos mediante la
obtención de las medidas de tendencia central y dispersión de los datos, entre otros
parámetros estadísticos; como también mediante la observación del
comportamiento espacial de los datos utilizando histogramas, mapas base, gráficos
cuantil contra cuantil.

La variable aleatoria es un concepto importante dentro de la estadística, ya que


permite describir fenómenos aleatorios, donde existe variabilidad. Los datos de las
variables aleatorias varían en torno a valores característicos que proveen
información valiosa para comprender el fenómeno en estudio.
Fig. Herramientas para el análisis exploratorio, mapa de distribución espacial, histograma y nube de correlación.
(Estimacion de recursos minerales. U-cursos, 2012)

II.2.1. Tipos de Variables

Una variable es una característica que puede variar y cuya variación es capaz de
adoptar diferentes valores, los cuales se pueden medir y observar.
Las variables adquieren valor cuando se relacionan con otras variables, es decir, si
forman parte de una hipótesis o de una teoría. En este caso se las denomina
construcciones hipotéticas.
(https://es.wikipedia.org/wiki/Variable_estad%C3%ADstica#Variables_cualitativas
[en línea] https://es.wikipedia.org/wiki/Variable_estad%C3%ADstica )

A. Variables Cualitativas:

Las variables cualitativas son aquellas variables que toman valores que son
nombres o etiquetas. El color de una pelota (por ejemplo, rojo, verde, azul) o
la raza de un perro serían ejemplos de variables cualitativas.
B. Variables cuantitativas:

Son las que tienen por modalidades cantidades numéricas con las que
podemos hacer operaciones aritméticas. Dentro de este tipo de variables
podemos distinguir dos grupos:

 Discretas: no siempre admiten una modalidad intermedia entre dos de


sus modalidades. Un ejemplo es el número de caras, obtenido en el
lanzamiento repetido de una moneda. Es obvio que cada valor de la
variable es un número natural.

 Continuas: cuando admiten una modalidad intermedia entre dos


cualesquiera de sus modalidades, por ejemplo, el peso X de un niño
al nacer. En este caso los valores de las variables son número reales,
es decir, X ∈ R.

II.2.2. Distribución de Frecuencias

La distribución de frecuencias es la forma en cómo se distribuyen los


datos pertenecientes a una variable, sirve para comparar la aparición de
un elemento Xi en un conjunto de elementos (X1, X2, XN). Mediante
tablas de distribuciones de frecuencia se puede presentar
organizadamente el recuento de datos.

Las frecuencias de cada elemento se pueden expresar tanto absolutas


(número total de apariciones) como relativas (proporción de
apariciones).

Si los datos provienen de una variable cuantitativa o existen muchas


categorías, los datos se suelen agrupar en clases. Cada clase, que tiene
un intervalo o amplitud constante, está representado por su marca de
clase, que es el punto medio de la misma.

 Frecuencia absoluta: Es el número Ni de observaciones que


existen en dicha clase. Dicho de otra forma, es el número de
veces que se repite dicho valor. Se denota mediante Ni.

 Frecuencia absoluta acumulada: Es el número de elementos de


la población cuya modalidad es inferior o equivalente a las de la
clase xi. Se denota por Ni.
 Frecuencia relativa: Es el cociente entre las frecuencias
absolutas de dicha clase y el número total de observaciones o
datos que denotamos por N, es decir:

 Frecuencia relativa acumulada: es el número de elementos de la


población que están en alguna de las clases inferior o igual a la
case xi. Se denota por Fi. Resulta:

II.2.3. Medidas de tendencia central

Las medidas de tendencia central son medidas que tienden a localizar


en qué punto se encuentra la parte central de un conjunto ordenado de
datos de una variable cuantitativa.

A. Media

Definimos media (también llamada promedio o media aritmética) de un


conjunto de datos (X1, X2, XN) al valor característico de una serie de
datos resultado de la suma de todas las observaciones dividido por el
número total de datos.

B. Mediana

La mediana (Me(X)) es el elemento de un conjunto de datos


ordenados (X1, X2, XN) que deja a izquierda y derecha la mitad
de valores.

C. Moda

La moda (Mo(X)) es el valor más repetido del conjunto de datos,


es decir, el valor cuya frecuencia relativa es mayor. En un
conjunto puede haber más de una moda.
II.2.4. Medidas de Posición

Las medidas de posición permiten conocer puntos característicos de


una serie de valores, que no necesariamente tienen que ser centrales.
La intención de estas medidas es dividir el conjunto de observaciones
en grupos con el mismo número de valores.

A. Cuartiles

Los cuartiles son los tres valores que dividen una serie de datos
ordenada en cuatro porciones iguales. El primer cuartil (Q1) deja a la
izquierda el 25% de los datos. El segundo (Q2) deja a izquierda y
derecha el 50% y coincide con la mediana. El tercero (Q3) deja a la
derecha el 25% de valores. Los tres cantiles son:

B. Percentiles

El percentil es una medida de posición no central. Los percentiles Pi


son los 99 puntos que dividen una serie de datos ordenada en 100
partes iguales, es decir, que contienen el mismo número de
elementos cada una. El percentil 50 es la mediana.

Sea (X1, X2, XN) una muestra de N elementos. El percentil Pi es:


II.2.5. Medidas de Dispersión

Las medidas de dispersión o medidas de variabilidad muestran la


incertidumbre de un conjunto de datos, indicando la mayor o menor
concentración de datos respecto a las medidas de centralización.

A. Varianza

Mide la dispersión de los datos de una muestra respecto a la media,


calculando la media de los cuadrados de las distancias de todos los
datos.

Al elevar las diferencias al cuadrado se garantiza que las diferencias


absolutas respecto a la media no se anulan entre sí. Además,
resaltan los valores alejados.

Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥


0). La varianza es cero cuando todos los datos son el mismo.

B. Desviación Estándar

La desviación típica es la medida de dispersión (S) asociada a


la media. Mide el promedio de las desviaciones de los datos respecto
a la media en las mismas unidades de los datos.
II.2.6. Asimetría y Curtosis

A. Asimetría

La asimetría es la medida que indica la simetría de la distribución de


una variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el mismo
número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:

 Asimetría negativa: la cola de la distribución se alarga para


valores inferiores a la media.
 Simétrica: hay el mismo número de elementos a izquierda y
derecha de la media. En este caso, coinciden la media,
la mediana y la moda. La distribución se adapta a la forma de la
campana de Gauss, o distribución normal.
 Asimetría positiva: la cola de la distribución se alarga para valores
superiores a la media.

Fig. Curva de distribución de la asimetría en función a la media.


(www.universoformulas.com)
 Coeficiente de asimetría
El coeficiente de asimetría evalúa la proximidad de los datos a su media x. Cuanto
mayor sea la suma ∑(xi–x)3, mayor será la asimetría. Sea el conjunto X= (x1, x2,…,
xN), entonces la fórmula de la asimetría de Fisher es:

 Si CAF<0: la distribución tiene una asimetría negativa y se alarga a valores


menores que la media.
 Si CAF=0: la distribución es simétrica.
 Si CAF>0: la distribución tiene una asimetría positiva y se alarga a valores
mayores que la media.

Fig. Coeficiente de asimetría de Fisher


(www.universoformulas.com)
B. Curtosis
La curtosis es una medida de forma que mide cuán escarpada
achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a
la media, de manera que a mayor grado de curtosis, más
escarpada (o apuntada) será la forma de la curva.

La curtosis se mide promediando la cuarta potencia de la diferencia


entre cada elemento del conjunto y la media, dividido entre
la desviación típica elevado también a la cuarta potencia. Sea el
conjunto X=(x1, x2,…, xN), entonces el coeficiente de curtosis será:
II.2.7. Histograma

El histograma representa gráficamente las frecuencias de ocurrencia en


función del valor. Consiste en dividir el rango de los valores en intervalos
(generalmente, con el mismo ancho) y visualizar la proporción de datos
que caben dentro de cada intervalo.

Fig. Histograma estándar


(Geostaadistica, Xavier Emery, 2013)

El histograma es una herramienta útil para detectar valores atípicos


(“outliers”). Ahora, cabe destacar que un dato atípico no es
forzosamente falso y nunca debe ser eliminado sin razón (por ejemplo,
un error de trascripción, una falla en el protocolo de medición o un valor
ausente codificado como -99). Podría reflejar el comportamiento
verdadero de la variable regionalizada y eliminarlo impediría prever la
ocurrencia de tales valores en las zonas no muestreadas.

La visualización del histograma de los datos también es un primer medio


de verificar su homogeneidad. Eventualmente, una división del campo
en varias sub-zonas será necesaria.

Así, por ejemplo, un histograma multimodal puede conducir a la


identificación, entre los datos, de varias “poblaciones” susceptibles de
estar geográficamente separadas. A veces, tal separación esta
impuesta por consideraciones físicas, que impiden mezclar todos los
datos: presencia de un obstáculo natural (falla, rio...), partición de una
zona mineralizada según la caracterización mineralógica o el tipo de
roca, etc. En tales casos, un problema que puede plantearse es la
delimitación de las sub-zonas “homogéneas”, pues es poco frecuente
que sus fronteras puedan ser identificadas con exactitud.