Está en la página 1de 6

Ayudantía Nº1: Nociones de probabilidad y estadística y EDA

Geoestadística y Análisis Espacial – MIN235


Profesores: Rodrigo Estay – Marcelo Pérez / Ayudante: Ignacia Contreras
Correo ayudante: ignacia.contreras.14@sansano.usm.cl

Resumen

Geoestadística: ciencia que estudia el comportamiento de datos temporal o espacialmente


correlacionados. Estudia fenómenos regionalizados a partir de observaciones relacionadas
por una función de proximidad. La geoestadística tiene el objetivo de estimar valores
esperados y distribuciones de probabilidad en zonas no muestreadas, donde el método mas
utilizado para ella es Kriging, utilizado en minería para realizar evaluaciones de reservas
mineras.

Variable regionalizada: es una función que presenta dos aspectos complementarios: por una
parte, tiene una cierta “continuidad” espacial (zonas de altos valores / zonas de bajos valores),
pero por otro lado, varía irregularmente y escapa a toda representación simple. En
contraposición con una variable totalmente aleatoria, una variable regionalizada tiene cierta
correlación punto a punto, pero estos cambios son tan complejos que no pueden ser descritos
por una función determinística.

Momentos estadísticos:
Esperanza: es un promedio ponderado, el valor medio de un conjunto de datos.
𝑛

𝐸{𝑍(𝑋)} = 𝑚 = ∑ 𝑤𝑖 · 𝑧𝑖
𝑖=1

Donde 𝑤 es la probabilidad de ocurrencia y 𝑧 la variable.

Varianza: indicador de como varían los datos respecto a la media.

𝑉𝑎𝑟{𝑍} = 𝜎 2 = 𝐸{(𝑍 − 𝑚)2 }

EDA: el análisis exploratorio de datos busca analizar la cantidad, calidad y ubicación de los
datos disponibles, definir las zonas de estudio y anticipar dificultados o problemas que
puedan surgir en las fases posteriores de estimación (detectando valores atípicos por ejemplo)
utilizando métodos visuales y estadísticos para tener una idea de “lo que cuentan”.

Valores atípicos: es importante mencionar que estos valores no necesariamente están malos,
depende de las variables que se están analizando, del coefciente de correlación y de una serie
de antecentes que se deben considerar antes de tomar la decisión de descartarlos.
Ejercicios

1. Indique cuales de los siguientes casos corresponden a una variable regionalizada y


explique por qué.

a) b)

c) d)

2. La planilla Excel “Muestra_Ayudantía” contiene una malla de muestreo de leyes de cobre,


con estos datos:

a. Construya un histograma de 8 clases


b. Calcule el primer y segundo momento de la muestra.
c. ¿Qué se puede interpretar de estos resultados?
3. Para un set de datos de sondaje en una zona mineralizada de cobre que contiene la
información de las coordenadas (Norte, Este y Elevación) junto a su respectiva ley de cobre
en porcentaje, se realizó un estudio exploratorio de datos con los resultados que se muestran
a continuación. Indique a que corresponde cada resultado y que se puede interpretar de ellos.
¿Se podrían mejorar?¿De qué forma?

a)
b)

c)
Además, se tienen los datos de concentraciones de molibdenita presentes en la zona
mineralizada, con los cuales se generan los siguientes gráficos:

d)

e)
Solución

1. Respuestas:

a) No corresponde, ya que el gráfico solo presenta aleatoriedad. Podría ser parte de una
variable regionalizada, es decir una variable regionalizada local.

b) Si corresponde, ya que tiene cierta continuidad y a la vez es muy irregular.

c) No corresponde, ya que no tiene continuidad.

d) No corresponde, ya que es 100% determinística, podemos saber su valor en el futuro.

2. Resultados en Excel.

3. Respuestas:

a) Visualización de los datos. Son vistas de planta de como se ubican las leyes de Cu en el
espacio analizado.

b) Estadística descriptiva, momentos estadísticos. Hay ciertos datos que no aportan mucha
información y que pueden ser descartados como: Rango, Suma, Cuenta. También se puede
descartar o dejar como anexo la estadística de las coordenadas, ya que estas solo son un
dato espacial y están en función de las leyes, que son las variables medidas. También se
deben presentar bien los datos, para las leyes lo mas usado es un decimal.

c) Boxplot o diagrama de cajas. El diagrama de caja permite resumir algunas características


de la distribución, tal como su simetría y su dispersión. Mediante este diagrama también
podemos identificar datos atípicos, que podrían ser los que están por encima del límite
superior esperado (ojo que no necesariamente todos los puntos lo son, tenemos que
considerar todos los antecedentes). También se puede mejorar la presentación.

d) Gráfico de dispersión/Scatterplot. Al realizar este gráfico podemos visualizar si existe


alguna relación entre variables. El gráfico presentado muestra cierta relación con tendencia
lineal de pendiente positiva y también valores que se pueden considerar atípicos. Para
mejorar este análisis se debe hacer la curva de regresión y determinar el coeficiente de
correlación con y sin los datos atípicos. También se puede mejorar la presentación.

e) Q-Q Plot. En este gráfico lo que se compara son las distribuciones (no es lo mismo que
ver la correlación) y en este caso nos indica que la distribución de las leyes de Cu y de Mo
es la misma, ya que los datos se ajustan a la recta diagonal (bisectriz).

OTROS: Para tener un análisis completo faltan la elaboración de un histograma (para ver
la distribución de la ley de cobre) y la elaboración de la curva de distribución de
probabilidad. En este caso las leyes tienen una distribución lognormal, ya que al aplicar log
se obtiene la campana de Gauss.

También podría gustarte