Está en la página 1de 16

UNIVERSIDAD DE ACONCAGUA

ESCUELA DE CIVIL MINA


SELLO INSTITUCIONAL
Asignatura: Análisis estadístico y geoestadístico de datos

Tarea 1: ANALISIS EXPLORATORIO DE DATOS (EDA)


APLICADO A UNA CAMPAÑA DE SONDAJE

Alumnos
Javier Valderrama C. – javier.valderrama@uconcagua.cl
Marcela Ibañez Z. – marcela.ibañez@uaconcagua.cl

Profesor: Luis Alvarez Paredes.

30 / julio / 2023
INDICE

 INTRODUCCION

 MARCO TEORICO

 DESARROLLO

 ESTADÍSTICA DESCRIPTIVA DE LOS DATOS (CU)

 ESTADÍSTICA DESCRIPTIVA DE LOS DATOS COMPOSITADOS A 5 M (CU )

 ANÁLISIS OUTLIER DE LOS COMPOSITOS DE 5 M EN (CU), APLICACION DE CAPPING (CU )

 ANÁLISIS OUTLIER DE LOS COMPOSITOS DE 5 M EN (CU), APLICACION DE CAPPING (S)

 ESTADÍSTICA DESCRIPTIVA DE LOS DATOS COMPOSITADOS A 5M CON CAPPING (CU )

 ESTADÍSTICA DESCRIPTIVA DE LOS DATOS COMPOSITADOS A 5M CON CAPPING (CU ) POR

LITOLOGIA

 CORRELACIÓN ENTRE CU Y S POR LITOLOGIA

 DISTRIBUCIÓN DE PROBABILIDAD DE LOS COMPOSITOS A 5M CON CAPPING POR LITOLOGIA

 DISTRIBUCIÓN DE PROBABILIDAD ACUMULADA DE LOS COMPOSITOS A 5M CON CAPPING POR

LITOLOGIA

 BOX PLOT DE LOS COMPOSITOS A 5M CON CAPPING POR LITOLOGIA

 CONCLUSION
INSTRODUCCION

El análisis exploratorio de datos es un conjunto de técnicas estadisticas cuya finalidad es

conseguir un entendimiento basico de los datos y de las relaciones existentes entre las

variable analizadas.

Para conseguir este objetivo el análisis exploratorio de datos. Proporciona métodos

sistemáticos sencillos para organizar y preparar los datos, detectar fallos en el diseño y

recogias de los mismos , tratamiento y evaluación de datos ausentes, identificación de casos

atípicos .

Para esto sede debe seguir pasos como primeramente preparar los datos para hacerlos

accesibles a cualquier técnica estadística.

Para este trabajo los datos los tendremos depósitos mineralizados son explorados usando

perforación de diamantinas y de aire reverso. El testigo recolectado de cada perforación

provee una “línea” continua de información geológica. Una base de datos permite reunir y

organizar una gran cantidad de información en un archivo específico, lo primero que se hace

al crear una base de datos es preparar una estructura de datos que tenga en cuenta los

requerimientos del programa que se usará en el modelamiento. Para un estudio, se puede

crear una base de datos de sondajes al cual se añade el muestreo de trincheras y de labores

subterráneas; a estos dos últimos se les considerará como taladros diamantinos. La base de

datos estará compuesta de 4tablas :•Collar •Survey •Assay• Geology

El análisis exploratorio de datos definido por John WTukey, es básicamente el tratamiento

estadístico al que se someten las muestra recogidas durante un proceso de investigación en

cualquier campo científico


MARCO TEORICO

ANALISIS EXPLORATORIO DE DATOS: El análisis exploratorio tiene como objetivo


identificar el modelo Teórico más adecuado para representar la población de la cual
proceden los datos muéstrales. Dicho análisis se basa en gráficos y estadísticos que
permiten explorar la distribución identificando características tales como: valores atípicos
u outliers, saltos o discontinuidades, concentraciones de valores, forma de la distribución,
etc.
Por otra parte, este análisis se puede realizar sobre todos los casos conjuntamente o de
forma separada por grupos. En este último caso los gráficos y estadísticos permiten
identificar si los datos proceden de una o varias poblaciones, considerando la variable que
determina los grupos como factor diferenciador de las poblaciones. También permite
comprobar, mediante técnicas gráficas y contrastes no paramétricos, si los datos han sido
extraídos de una población con distribución aproximadamente normal.
ESTADÍSTICAS CLASICAS:
Medidas de tendencia centra
 Mínimo/Máximo Son los valores extremos que toma la variable en la muestra. Son
esenciales para determinar (en conjunto con otras medidas de dispersión y
posición) datos atípicos.

 Media: Es la suma simple de los datos de la variable dividida por el número de


sumandos. Se debe tener consideración que la media es sensible a valores
extremos, hecho que puede hacerla poco robusta.

 Rango Es la resta entre el valor máximo y el mínimo de la variable.

 Moda Es el valor que posee más frecuencia (se repite más veces) de la variable.
En caso que haya más de un valor con la misma frecuencia se habla de
distribuciones multimodales. Si todos los datos tienen la misma frecuencia se dice
que la distribución no tiene moda.
ESTADÍSTICA DESCRIPTIVA DE LOS DATOS (CU)

En la siguiente tabla se puede observar la estadística descriptivas de la leyes de cobre de la


base de datos donde se analizaron 7315 datos .
cu1
Media 0,336 La media de ley de cobre es de 0,33 % la
Error típico 0,003 mediana 0,25%.
Mediana 0,252 El valor que mas se repite 0,090
Moda 0,090
Desviación estándar 0,227 La moda la media y la media son distintos lo
Varianza de la muestra 0,051 que su comportamiento no asimetrico.
Curtosis -0,354 El rango 0,891, un mínimo de 0,009 y un
Coeficiente de asimetría 0,894 máximo de 0,900
Rango 0,891
Mínimo 0,009 La curtosis y coeficiente de asimetría
Máximo 0,900 demuestran que no ahí un comportamiento
Cuenta 7315 normal de los datos.

ESTADÍSTICA DESCRIPTIVA DE LOS DATOS COMPOSITADOS A 5 M (CU )

cu1 (%cu) sin compositar cu 5 m


Media 0,336 Media 0,321
Error típico 0,003 Error típico 0,003
Mediana 0,252 Mediana 0,263
Moda 0,09 Moda 0,090
Desviación estándar 0,227 Desviación estándar 0,203
Varianza de la muestra 0,051 Varianza de la muestra 0,041
Curtosis -0,354 Curtosis -0,091
Coeficiente de asimetría 0,894 Coeficiente de asimetría 0,886
Rango 0,891 Rango 0,891
Mínimo 0,009 Mínimo 0,009
Máximo 0,900 Máximo 0,900
Cuenta 7315 Cuenta 5809

Si revisamos ambas tablas podemos comparar entre los datos totales y los datos de
compositado de cobre de 5 metros, podemos detectar que la media disminuye a 0,32% y
se genera una variación de la media al someter las leyes de cobre a compositacion de 5
metros, la moda y la media mantiene valores muy parecidos, existe una variabilidad
considerable en la desviación estándar y varianza de la muestra ya que al realizar el
proceso de compositacion la viariabilidad disminuyen, la compositacion genera una
perdida de datos de 7315 a 5808.

ANÁLISIS OUTLIER DE LOS COMPOSITOS DE 5 M EN (CU), APLICACION DE CAPPING (CU )

En el siguiente grafico podemos observar que no existen presencia de outlier (datos

lejanos o diferentes) en la muestra de cobre depositada 5 metros.

Para confirmar la usencia de outlier podemos apreciar que en el grafico de caja boxplot
comprimido a 5 m tampoco existe presencia de outlier .

ANÁLISIS OUTLIER DE LOS COMPOSITOS DE 5 M EN (S), APLICACION DE CAPPING (S)


En el grafico superior (histograma compositos 5m S) podemos observar que no existen

presencia de outlier. Lo que para confirmar esta información se genera grafico caja

boxplot composito de 5m S, donde si se aprecian 6 outlier, por sobre los valores 15000

ppm donde se pierde la continuidad y se consideran anormales .

ESTADÍSTICA DESCRIPTIVA DE LOS DATOS COMPOSITADOS A 5M CON CAPPING (CU )

cu (capping) En esta tabla de datos compositado


Media 0,321 incluido capping para Cu se no logra
Error típico 0,003 identificar la existencia de alguna
Mediana 0,263 diferencia ya como se evidencio en
Moda 0,090 los graficos anteriores no existe
Desviación estándar 0,203 preciencia de capping.
Varianza de la muestra 0,041
Curtosis -0,091
Coeficiente de asimetría 0,886
Rango 0,891
Mínimo 0,009
Máximo 0,900
Cuenta 5809
 ESTADÍSTICA DESCRIPTIVA DE LOS DATOS COMPOSITADOS A 5M CON CAPPING (CU ) POR

LITOLOGIA

cu 5m (capping) lito 1 lito1 lito 2 lito 3 lito 4


Media 0,335 0,347 0,337 0,308
Error típico 0,015 0,007 0,005 0,004
Mediana 0,288 0,317 0,297 0,238
Moda 0,180 0,090 0,090 0,090
Desviación estándar 0,201 0,181 0,194 0,210
Varianza de la muestra 0,040 0,033 0,038 0,044
Curtosis -0,108 -0,377 -0,189 0,047
Coeficiente de asimetría 0,817 0,623 0,754 1,009
Rango 0,810 0,810 0,891 0,891
Mínimo 0,090 0,090 0,009 0,009
Máximo 0,900 0,900 0,900 0,900
Cuenta 177 674 1502 3424

En la tabla podemos observar dentro delas 4 litología la que tiene mayor dato es la lito 4
con 3424 , además lito 1 lito 2 lito 3 tiene la media ( ley ) muy similar y la litología 4
presenta ley más baja, la mediana más alta está en la litología 2 0,327, la litología 4
presenta la mayor varianza 0,210.
CORRELACIÓN ENTRE CU Y S POR LITOLOGIA

CORRELACION CU-S LITO 1


7000
6000
5000
4000
S (PPM)

3000
2000
1000
0 f(x) = − 658.033501477714 x + 440.554284441829
0 0.1R² = 0.0238499587066057
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
cu (%)

s (cpping) Linear (s (cpping))


En el cuadro superior denominado correlacion Cu- S lito 1 se puede ver un grafico
dispersión que indica que no se presenta una correlación entre la leyes de cobre y
sulfuros . La interpretación no es precisa ya que El R2= 0,0238 es un valor muy bajos ,
este valor debe estar en un promedio de 0.70 para tener una interpretación correcta.

CORRELACION CU-S LITO2


16000

14000

12000

10000
S (PPM)

8000

6000

4000

2000

0
f(x) = − 123.261448470371 x + 355.402957618846
0 0.1R² = 0.000316078691249166
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
CU (%)

En el cuadro superior denominado correlacion Cu- S lito 2 se puede ver un grafico


dispersión que indica que no se presenta una correlación entre la leyes de cobre y
sulfuros . La interpretación no es precisa ya que El R2= 0,0003 es un valor muy bajo a los
que se exige R2 0,70.

CORRELACION Cu - S LITO 3
16000
14000
12000
10000
S (PPM)

8000
6000
4000
2000 f(x) = 949.228839767706 x + 1871.76960236472
R² = 0.00665077052087726
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Cu (%)
En el cuadro superior denominado correlacion Cu- S lito 3 se puede ver un grafico
dispersión que indica que no se presenta una correlación entre la leyes de cobre y
sulfuros . La interpretación no es precisa ya que El R2= 0,0067 es un valor muy bajo a los
que se exige R2 0,70

CORRELACION CU- S LITO 4


16000

14000

12000

10000
S (PPM)

8000

6000
f(x) = 2617.79109492782 x + 3170.23509669774
4000 R² = 0.0430342907674951

2000

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Cu (%)

En el cuadro superior denominado correlacion Cu- S lito 4 se puede ver un grafico


dispersión que indica que no se presenta una correlación entre la leyes de cobre y
sulfuros . La interpretación no es precisa ya que El R2= 0,0043 es un valor muy bajo a los
que se exige R2 0,70.

 DISTRIBUCIÓN DE PROBABILIDAD ACUMULADA DE LOS COMPOSITOS A 5M CON CAPPING POR

LITOLOGIA / PROBABILIDAD ACUMULADA DE LOS COMPOSITOS A 5M CON CAPPING POR LITOLOGIA


frecuancia cuulada
(%)
Histograma Pareto litología 1

frecuancia cuulada
(%)

Histograma Pareto litología 2


frecuancia cuulada
(%)
Histograma Pareto litología 3

Histograma Pareto litología 4

Se informan que en los histograma Pareto litología N 1, 2, 3, 4 lo que nos informa las
frecuencias parcial con sus respectivas leyes de Cu.
 BOX PLOT DE LOS COMPOSITOS A 5M CON CAPPING POR LITOLOGIA

Composito 5m con capping litologia 1

Composito 5m con capping litologia 2


Composito 5m con capping litologia 3

Composito 5m con capping litologia 4

Se muestras graficos boxplot con los Composito 5 metros con capping litologia 1, 2, 3, 4.
CONCLUSION

La estadística descriptiva tiene como objetivo resumir la evidencia encontrada en una


investigación de manera sencilla y clara para su interpretación. Consta de tablas o
cuadros, figuras o gráficas e imágenes o fotografías. Los cuadros se utilizan para resumir
datos y mostrar cifras puntuales.
En este trabajo desarrollado, se realizado un analisis de datos de una campaña de
sondaje de elemento de Cobre (Cu). Con una muestra de sondaje de cobre con una
tamaño de 5 metros.

Se realiza una estadistica descriptiva, como resultado nos deja calcula parámetros
estadísticos como las medidas de centralización y de dispersión que describen el conjunto
estudiado analizar la distribucion y varibilidad de esta muestra. Consiguiendo datos como
Media, Mediana, Moda, Desviación estándar, Rango, Coeficiente de asimetría y otro datos
relevantes. La media de ley de cobre es de 0,33 % la mediana 0,25%.,el valor que mas
se repite 0,090, la moda la media y la media son distintos lo que su comportamiento no
asimetrico. ell rango 0,891, un mínimo de 0,009 y un máximo de 0,900 la curtosis y
coeficiente de asimetría demuestran que no ahí un comportamiento normal de los datos.

Realizamos una estadística descriptiva de los datos compuestos de 5 m con capping en


cobre. Lo que nos brindó informacion mas exacta de la distibucion y de las caracteristicas
de los datos. podemos detectar que la media disminuye a 0,32% y se genera una
variación de la media al someter las leyes de cobre a compositacion de 5 metros, la moda
y la media mantiene valores muy parecidos, existe una variabilidad considerable en la
desviación estándar y varianza de la muestra ya que al realizar el proceso de
compositacion la variabilidad disminuyen, la compositacion genera una pérdida de datos
de 7315 a 5808. no existen presencia de outlier

Estos analisis nos permite comparar y las caracteristicas de los datos según los diferentes
tipos de litologia presente en las muestras asi comprender mejor el sector donde se esta
realizando el sondaje, en las 4 litología la que tiene mayor dato es la lito 4 con 3424 ,
además lito 1 lito 2 lito 3 tiene la media ( ley ) muy similar y la litología 4 presenta ley más
baja, la mediana más alta está en la litología 2 0,327, la litología 4 presenta la mayor
varianza 0,210.

Se cumple el objetivo de explorar, investigar y aprender de un sondaje de cobre de 5


metros.

También podría gustarte