Documentos de Académico
Documentos de Profesional
Documentos de Cultura
www.sampling-ok.com
1
Distribución promedio de tiempo en las tareas
asociadas a aplicaciones geomatemáticas
• Validación de la Data
• Tratamiento de valores bajos
no significativos
• Identificaión y tratamiento
25% de altos erráticos
35%
• Compatibilización de datas
distintas
10%
Área bajo
Distribución normal 99.7 %
95.0 % la curva
68.0 %
de los errores:
Si no existe sesgo, en general los errores siguen una
distribución normal como la mostrada en el gráfico
P [-2 +2
2
Es como plantearse un intervalo de
El concepto de confianza de : 99.99966 %
Lo cual significa que se aspira a tener un
six sigma porcentaje de 99.99966 libre de defectos;
o sólo 3.4 DPMO.
VARIAS DENOMINACIONES:
Six sigma
6
6 sigma
6s
DPMO: Defectos por millón de oportunidades
Más allá de los dígitos, six sigma es una filosofía de negocios enfocada en la MEJORA
CONTINUA, optimizando procesos a partir de las necesidades de los clientes.
Exactitud y Precisión
Exactitud Precisión
sin Precisión sin Exactitud
Exactitud Ninguno
y Precisión
3
Muestra ideal:
“Equiprobable y de varianza pequeña”
Sesgado
Varianza grande Insesgado
Varianza pequeña
Media Media
Insesgado
Varianza grande
Sesgado
Varianza pequeña
Media Media
Caracterización estadística
4
Caracterización estadística
Se entiende por CARACTERIZACION ESTADÍSTICA (CE), la
determinación e interpretación de los principales parámetros y tipos de
distribución de un determinado conjunto de datos o “data”.
Básicamente de cada “data” se calcula: media, valor máximo, valor
mínimo, mediana, moda, varianza, desviación estándar, sesgo y
kurtosis.
Estos datos se pueden entregar en forma de cuadros o gráficamente por
medio del denominado “box plot”
También se plotea el respectivo histograma y curva de acumulación de
frecuencias.
La interpretación de toda esta información constituye la CE
Cualquier aplicación geomatemática o geoestadística debe estar siempre
precedida de una CE.
9
10
Mediana Moda
Media
Estadísticos
principales
Mediana
Media
Estadístico Valor
Moda.- El intervalo de clase con la mayor Media 1.966
frecuencia Mediana 1.94
Mediana.- La mitad de toda la distribución de frecuencias Moda 1.92
Desviación 0.192
estándar
Desviación
Varianza Varianza 0.03698
estándar
Kurtosis -0.45
Sesgo.- Mide el grado de asimetría de una
x - moda Sesgo 0.28
distribución. Cola más larga a la derecha: sesgo
s Rango 0.86
positivo; al revés negativo.
Mínimo 1.57
Kurtosis.- Es el grado de “espigamiento” de una distribución.
Leptocúrtica si es muy apuntada; Planocúrtica si es muy aplanada; y Máximo 2.43
Mesocúrtica si se trata de una situación intermedia. n 124
10
5
Quartiles
Q1 Q2 Q3
11
2.6
Swelling clays
2.4
2.2 Mediana
2.0
Primer
1.8
Quartil
1.6
Valor mínimo
12
6
Presentación sumaria de la
Caracterización Estadística
Summary for Cu_ppm
A nderson-D arling N ormality Test
A -S quared 41.60
P -V alue < 0.005
M ean 44.132
S tD ev 46.065
V ariance 2122.025
S kew ness 4.6149
Kurtosis 42.6063
N 724
M inimum 3.000
1st Q uartile 15.200
M edian 31.450
3rd Q uartile 57.625
0 100 200 300 400 500 600
M aximum 632.000
95% C onfidence Interv al for M ean
40.771 47.493
95% C onfidence Interv al for M edian
29.070 34.000
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter vals
43.809 48.569
Mean
Median
30 35 40 45 50
13
Verificación de la “normalidad”
p> Distribuc. normal
de la distribución
Summary for Cu gpl
A nderson-D arling N ormality Test
A -S quared 0.29
P -V alue 0.600
M ean 39.059
S tD ev 1.003
V ariance 1.005
S kew ness 0.152379
Kurtosis -0.253495
N 180
M inimum 36.600
1st Q uartile 38.300
M edian 39.100
3rd Q uartile 39.700
37 38 39 40 41 42
M aximum 41.900
95% C onfidence Interv al for M ean
38.911 39.206
95% C onfidence Interv al for M edian
38.800 39.200
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter vals
0.909 1.118
Mean
Median
14
7
Buen ajuste a recta
Test de normalidad p > Distribuc. normal
60
50
40
30
20
10
5
0.1
36 37 38 39 40 41 42 43
Cu gpl
15
Distribuciones Lognormales y el
Efecto Proporcional
8
Típica distribución LOG-NORMAL del Au
en un yacimiento epitermal de HS
Valores bajos no
significativos Moda
Mediana
Altos erráticos
Media
Au ppb 17
Tomado de Canchaya (2004)
Mean 2473.2
log-normalidad StDev
Variance
3225.6
10404234.4
Skewness 2.68188
Kurtosis 8.95936
0 3000 6000 9000 12000 15000 18000
Obviamente se rechaza la hipótesis N 169
99.9
99
95 Los logs de los valores de Cu
90
80 trazados en un gráfico de
70
Percent
60
50
40
Loc 7.115 acumulación ploteado en un
30 Scale 1.219
20 N 169
gráfico probabilístico se ajustan a
10
5 AD 1.159 una recta.
P-Value <0.005
1
0.1
10 100 1000 10000 100000 18
Cu ppm
9
Comprobación gráfica del
Efecto Proporcional
1500
1250
Ley media del oro (ppb)
1000
750
500
250
0
0 250 500 750 1000 1250 1500 1750 2000 2250 2500
Desviación estándar
19
Tomado de Canchaya (2004)
Ejemplo de distribuciones
log-normales con Efecto
Proporcional: Caso del Cu
6000
5000
Desv. estándar
4000
3000
2000
1000
0
0 1000 2000 3000 4000 5000 6000
20
Media
10
Ejemplo de distribuciones
log-normales con Efecto
Proporcional: Caso del Mo
250
Desv. estándar
200
150
100
50
0
0 50 100 150 200 250 300
21
Media
Referencias bibliográficas
11
LA EXCELENCIA DEL MUESTREO
www.sampling-ok.com
Identificación y Tratamiento de
Valores Altos Erráticos
Definición de
valores altos
erráticos
La ocurrencia aislada de
valores altos merece atención y
un tratamiento especial.
12
Summary for Cu_ppm
A nderson-D arling N ormality Test
A -S quared 41.60
P -V alue < 0.005
M ean 44.132
de valores altos N
M inimum
1st Q uartile
724
3.000
15.200
M edian 31.450
30 arling N ormality
A nderson-D 35 Test 40 45 50
A -S quared 27.43
P -V alue < 0.005
Eliminando los altos erráticos: M ean 41.560
> 200 ppm Cu S tD ev 34.626
V ariance 1198.994
S kew ness 1.45774
Kurtosis 2.12815
N 718
M inimum 3.000
1st Q uartile 15.175
M edian 31.200
Median
9 9.03
8
7.18
7 6.94
6
5.52
5.23
5.17
5
Data
4 4.15
4
3 3.12
2.94
2.9
0 0.12
26
13
Monitoreo de la data para definir Estadísticos de kao:
x = 2.88
verdaderos altos ERRATICOS s = 1.18
27
Comparación de nubes de 9
8
correlación con y sin altos 7
erráticos r = 0.54
6
5
kao
0
0 1 2 3 4 5
prf
Scatterplot of kao vs prf
8
7
r = 0.61
6
5
prf = - 0.022 + 0.506 kao
kao
1
0 1 2 3 4 28
prf
14
Nube de correlación prf vs mmt
3.50
3.00
Efecto de altos erráticos
2.50
2.00
en el coeficiente de
prf
1.50
y = 0.069x + 1.204
regresión lineal
1.00 r² = 0.182
0.50 r = 0.427
0.00
0.00 5.00 10.00 15.00 20.00
mmt
2.00
1.50
prf
1.00
y = -0.646x + 2.687
r² = 0.769
0.50 r = 0.877
0.00
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50
mmt
2.50
0.00
0.00 5.00 10.00 15.00 20.00
mmt
1.60
1.40
1.20
1.00
prf
0.80
0.60 y = -0.017x + 1.199
0.40 r² = 0.006
r = 0.077
0.20
0.00
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50
mmt
15
Tratamiento de valores altos erráticos
CORTES ESTADÍSTICOS.-
Utilizando gráficos probabilísticos de frecuencia acumulada, donde los altos
erráticos se
discriminan fácilmente, para luego ser reducidos a un valor determinado.
Usando “Control charts” (ver diapositivas siguientes)
31
Minimum 1.0700
1st Quartile 2.2550
Median 2.6500
Típico alto errático 95% Confidence Intervals
3rd Quartile 3.2450
Mean
Maximum 9.0300
Median
9
1 x s x + s x+2s x+3s
1 2.876 1.18 4.055 5.235 6.414
8
1
7
6.414 ALTERNATIVAS MAS USADAS:
Individual Value
6 1 1
1 1
5
1 1
5.235 Eliminar el alto errático
UCL=4.730
4 4.055 Reemplazarlo por la media más 1s, o
_ 2s o 3s
3 X=2.876
2
Reducción por la regla del tercio
menos tercio.
1 LCL=1.021
0
1 15 29 43 57 71 85 99 113 127 141
32
Observation
16
Ejemplo de corrección log-normal o de Sichel
33
2.34 2.727
34
17
Ejemplo de corrección log-normal o de Sichel
35
Referencias bibliográficas
David M. (1977) Geostatistical Ore Reserve Estimation.- Elsevier New York; 364 p.
Sichel H. S. (1952) New methods in the statistical evaluation of mine sampling data.-
Trans. I. M. M., London; 61: 261-288.
Sichel H. S. (1966) The estimation of means and associated confidence limits for smalls
samples from lognormal populations.- Symposium on Mathematical Statistics and
Computer Applications I Ore Valuation: 106-122; South Afr. Inst. Min. Metall.;
Johannesburg. Citado por Rendu (1981).
36
18
LA EXCELENCIA DEL MUESTREO
www.sampling-ok.com
37
La correlación entre dos variables es el tipo de asociación que existe entre ambas;
la misma que es cuantificada por el denominado Coeficiente de Correlación “r”:
Cov( x, y ) Donde: n
r • Cov es la covarianza: Cov( x, y ) (1 / n) ( xi x)( yi y )
Sx * Sy
i 1
19
39
Ejemplos de nubes de r [ 1, 1]
correlación
x
x
r = 0.94 r = 0.54
y
y
x x
r = - 0.94
r = 0.09
y y
1250
Ley media del oro (ppb)
1000
750
500
250
0
0 250 500 750 1000 1250 1500 1750 2000 2250 2500
Desviación estándar
40
20
Ejemplo de nubes de correlación
entre filosilicatos
7
prf = -0.022 + 0.506 kao
6
5
r = 0.61
kao
1
0 1 2 3 4
prf
41
Residuales en la
regresión lineal
Y
y=b+mx
residual 6
residual 1
X
42
21
43
Análisis de “residuales”
Residual Plots for prf
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99.9
99 1
90
Residual
Percent
0
50
10 -1
1
0.1 -2
-2 -1 0 1 1 2 3 4
Residual Fitted Value
Residual
0
40
-1
20
0 -2
-1.5 -1.0 -0.5 0.0 0.5 1.0 1 1 0 2 0 30 40 5 0 6 0 7 0 80 90 10 0 11 0 1 2 0 1 30 1 40
Residual
Observation Order
44
22
Correlación entre las 8.0
7.0
y = -3.090x + 8.802
r² = 0.464
6.0 r = -0.681
variables 5.0
mmt
4.0
mineralógicas 3.0
2.0
1.0
0.0
3.0 y = -0.190x + 2.217 0.0 1.0 2.0 3.0
r² = 0.382
2.5 kao
r = -0.62
2.0
kao
1.5
1.0
0.5
y = 1.116x + 1.149
0.0 8.0 r² = 0.639
0.0 2.0 4.0 6.0 r = 0.799
6.0
CLOs
mmt 4.0
2.0
0.0
0.0 2.0 4.0 6.0
CLOs
8.0
Variables 6.0
Acido kg/t
CLOs
4.0
y = -2.523x + 8.327
2.0 r² = 0.330
r = -0.574
0.0
0.0 1.0 2.0 3.0
kao
23
100.0
Variables 80.0
% Rec
60.0
mineralógicas vs. 40.0 y = -6.300x + 87.32
Recuperación 20.0 r² = 0.23
r = -0.48
0.0
0.0 2.0 4.0 6.0 8.0
100.0 mmt
80.0
% Rec
60.0
40.0 y = 14.18x + 42.05
r² = 0.056
20.0
r = 0.24 y = -8.649x + 82.52
0.0 100.0
r² = 0.222
0.0 1.0 2.0 3.0 80.0 r = 0.47
% Rec
kao 60.0
40.0
20.0
0.0
0.0 2.0 4.0 6.0
CLOs
48
Matriz de correlación
CLOs
kao -0.62
mmt 0.80 -0.68
CuT 0.14 0.07 0.00
CuSCN 0.29 0.03 0.60 0.60
CuSAc 0.09 -0.57 0.04 0.60 0.05
CuR 0.25 0.03 0.11 0.37 0.52 0.18
ConsAc 0.94 0.57 0.83 0.15 0.29 -0.10 0.31
Recup 0.47 0.24 -0.48 0.20 -0.22 0.55 -0.24 0.16
CLOs kao mmt CuT CuSCN ConsAc CuR ConsAc Recup
48
24
M. Sc. Samuel Canchaya Moya
Tel. 2579636 Cel. 988021992
canmoysa@gmail.com
49
25