Está en la página 1de 94

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE INGENIERA

ESCUELA PROFESIONAL DE INGENIERA DE


MINAS
curso:
GEOESTADISTICA
Docente: ing. WILDER CHUQUIRUNA
CHAVEZ

BENEL RIBERA BRAYAN AUGUSTO


HERRERA INFANTE ROBERTO
LOPEZ AREVALO LELER GILMER
MENDOZA SANCHEZ JUAN CARLOS

Cajamarca marzo
CAPTULO III:
ANLISIS DE DATOS Y
VARIOGRAFA
INTRODUCCIN

En la siguiente presentacin se desarrollar el captulo III, correspondiente a: Anlisis de


datos y variografa.

Para ello explicaremos el:


Anlisis de datos mediante histogramas.
Modelado de Histogramas, distribucin normal, distribucin lognormal, distribucin exponencial.
Mtodo de la transformada inversa.
Mtodo de Montecarlo.
-Variografa
Interpretacin y aplicaciones
Modelado de variogramas
objetivos
Definir las reglas bsicas a seguir para la construccin e interpretacin de los
Histogramas, resaltando las situaciones en que pueden, o deben ser utilizados.

Se aprender el comportamiento del modelado de histogramas: lognormal,


normal, etc.

Conocer los mtodos de la transformada inversa y Montecarlo para


simulaciones y distrubuciones.

Estudiar a travs de la variografia las condiciones de un yacimiento minero y


esto se tomar como ejemplo datos reales de una mina.
HISTOGRAMA

Es un resumen grfico de los valores producidos


por las variaciones de una determinada
caracterstica, representando la frecuencia con
que se presentan distintas categoras dentro de
dicho conjunto.
El histograma representa grficamente las
frecuencias de ocurrencia en funcin del valor.
Consiste en dividir el rango de los valores en
intervalos (generalmente, con el mismo ancho) y
visualizar la proporcin de datos que caben dentro
de cada intervalo.
La visualizacin del histograma de los datos tambin es un primer
medio de verificar su homogeneidad. Eventualmente, una divisin
del campo en varias sub-zonas ser necesaria.
As, por ejemplo, un histograma multimodal puede conducir a la
identificacin, entre los datos, de varias poblaciones
susceptibles de estar geogrficamente separadas.
Elaboracin
Construccin

Paso 1: Preparacin de los datos


Como en todas las herramientas de anlisis de datos, el primer paso consiste en recoger estos de forma
correcta o asegurarse de la adecuacin de los existentes.
Los datos deben ser:
Objetivos: Basados en hechos, no en opiniones.
Exactos: Debemos asegurarnos que la variabilidad en el proceso de recogida de datos (variabilidad de
la medida) no desvirta la variabilidad del proceso en estudio.
Completos: Se debe registrar toda la informacin relevante asociada a cada toma de datos (mquina,
hora del da, empleado, etc) en previsin de los diferentes anlisis que pueden ser necesarios.
Representativos: Deben reflejar todos los diferentes hechos y circunstancias que se producen en la
realidad.
Paso 2: Determinar los valores extremos de los datos y en el recorrido
Identificar en la tabla de datos originales el valor mximo, el valor mnimo y el recorrido (R =
Vmax - Vmin).
Ejemplo: Datos sobre la cantidad exacta de caf contenido en paquetes de 250 gramos. (120
unidades medidas)

Recorrido total = mximo mnimo = 258 grs-243grs. = 15 grs.


Paso 3: Definir las "clases" que contendr el Histograma
Clases: Son los intervalos en que se divide la caracterstica sobre la que se han tomado los
datos. El nmero de clases es igual al de barras del Histograma.
a) Definir el nmero de clases que debe tener el Histograma segn la tabla siguiente:
Numero recomendado de clases en un histograma
b) Obtener la amplitud del intervalo de cada clase.
Todas las clases tendrn el mismo intervalo.
No habr solapamiento entre distintas clases.
La amplitud aproximada del intervalo se halla dividiendo el recorrido por el nmero de clases.
Esta amplitud se redondea posteriormente a un nmero o cifra decimal conveniente para el manejo
de las clases y la graduacin del eje horizontal del Histograma (1, 2, 5, 10, etc).
En el ejemplo de los paquetes de caf hay 120 datos, necesitamos entonces aproximadamente 8
clases para el histograma.
Amplitud aproximada de cada clase 15gr./8=1.875 grs.
Amplitud elegida como conveniente en este caso: 2 grs.
Paso 4: Construir las clases anotando los lmites de cada una de ellas
Los lmites de la primera clase incluirn el valor mnimo de los datos.
Para evitar que algunos datos coincidan con los lmites de los intervalos, definir stos de forma
que tengan una cifra ms detrs de la coma.
Si, por ejemplo, los datos tienen dos cifras detrs de la coma (3,55; 3,83; 3,64; 3,73; 3,78,
etc), se definirn las clases hasta la tercera cifra detrs de la coma (3,545-3,555; 3,555-3,565,
etc).

Ejemplo: Como el valor menor en nuestros datos es 243 grs.,


empezaremos el primer intervalo en 242.5 grs. y construiremos
ocho clases con 2 grs. de amplitud
Paso 5: Dibujar el Histograma
Dibujar las barras verticales correspondientes a cada clase. Su base est situada en el eje
horizontal y su altura corresponder a la frecuencia de la clase representada.
Paso 6: Rotular el Grfico
Cuando proceda, poner el ttulo, las condiciones en que se han recogido los datos, los lmites de
tolerancia nominales, etc. Estas notas ayudan a los dems a interpretar el grfico y sirven de
recordatorio de la fuente de los datos.
Ejemplo: Resultados de las mediciones del contenido de caf (120 paquetes medidos)
DESAGRUPAMIENTO

Para calcular el histograma y las estadsticas


elementales, es frecuente considerar una variable de
ponderacin o desagrupamiento, de modo de corregir
los efectos provocados por las irregularidades de la malla
de muestreo. La idea es asignar a los datos
espacialmente agrupados, en parte redundantes, un
ponderador ms pequeo que a los datos aislados, los
cuales son representativos de una porcin ms extensa
del campo.

Ubicacin de datos (cruces) y ponderacin por el mtodo de las celdas. Cada celda tiene

una ponderacin total de 1/16, la cual se reparte entre los datos pertenecientes a esta

celda.
DESAGRUPAMIENTO

Para determinar la variable de ponderacin, se


puede utilizar el llamado mtodo de las celdas.
Esta tcnica consiste en dividir la zona de estudio
en celdas rectangulares idnticas y en atribuir a
cada dato un ponderador inversamente
proporcional al nmero de datos presentes en la
celda a la cual pertenece.

Ubicacin de datos (cruces) y ponderacin por el mtodo de las celdas. Cada celda tiene

una ponderacin total de 1/16, la cual se reparte entre los datos pertenecientes a esta

celda.
DISTRIBUCIONES DE
PROBABILIDAD
DISTRIBUCIONES CONTINUAS

Distribucin normal
Una variable aleatoria continua, X, sigue una distribucin normal de media y desviacin tpica , y
se designa por N(, ), si se cumplen las siguientes condiciones:

1. La variable puede tomar cualquier valor: (-, +)

2. La funcin de densidad, es la expresin en trminos de ecuacin matemtica de la curva de


Gauss:

2
1 x
1
2

f ( x) e
2
DISTRIBUCIN LOGNORMAL

En el campo industrial, la ley lognormal, puede recibir justificaciones teoricas como las
caractersticas de un material (resistencia, dureza, etc.) que puede resultar de la combinacin
multiplicativa de factores elementales. Tambin en el campo econmico la ley lognormal se
encuentra con frecuencia (distribucin de salarios, ventas, etc.).
Distribucin ji Cuadrada

K=1 K=5 K=50


Distribucin exponencial: Exp()

Se utiliza con frecuencia para modelizar la duracin (vida de personas o animales o


Componentes fsicos ,duracin de huelgas ,recesiones econmicas, llamadas telefnicas ,o el
tamao de yacimientos, etc.)

=1/
=1/

f ( x ) e x
0, x 0
Distribucin t de student
DISTRIBUCIN GAMMA.
Este tipo de distribucin es utilizada, por ejemplo, en el clculo de probabilidades
relativas a la duracin de partes elctricas, las cuales, pocas veces tienen vidas
muy cortas, muchas tienen vidas cercanas al promedio, y muy pocas vidas
bastante largas. Otro ejemplo es el de una pieza metlica cuando es sometida a
cierta fuerza de compresin, hasta romperse, por lo tanto el tiempo que
transcurre antes que la pieza se rompa, puede asociarse a una Distribucin
Gamma.
Distribuciones discretas
Distribucin Binomial

Parmetros de la Distribucin Binomial


DISTRIBUCIN DE POISSON.

La distribucin de Poisson representa la probabilidad de que un evento aislado ocurra un nmero


especfico de veces en un intervalo de tiempo o espacio dado. La ocurrencia de eventos slo se ver
afectada por la casualidad o por el azar; por lo tanto, la posicin de un evento no servir para predecir la
localizacin de cualquier otro evento especfico. Adems, los datos acerca de un intervalo de tiempo o
espacio tampoco facilitan la prediccin del nmero de eventos que se presentarn en otro evento
3.3 Simulaciones de distribuciones:
Teorema del lmite central. Mtodo de
la transformada inversa. Mtodo de

Capitulo Montecarlo

III
3.3 SIMULACIONES DE DISTRIBUCIONES

Son ordenadores que pueden utilizarse para simular probabilidades y variables


aleatorias numricamente. Este tipo de simulaciones tienen muchas aplicaciones
SIMULACIONES DE DISTRIBUCIONES

Aproximar cantidades que resultan difciles de


calcular matemticamente.
Simular grficamente sistemas fsicos o biolgicos
complejos.
Muestrear aleatoriamente grandes conjuntos de
datos en busca de errores o informaciones
especficas, etc.
Implementar algoritmos complejos para procesar
imgenes, reconocer sonidos y escritura manual, etc.
Simular soluciones mediante inteligencia artificial.
Encriptar datos o generar clases.
Resolver enigmas o descifrar cdigos mediante
pruebas secuenciales de soluciones aleatorias.
3.3 SIMULACIONES DE DISTRIBUCIONES
Hoyen da, prcticamente todos los lenguajes de programacin disponen de un generador de
nmeros pseudoaleatorios que permiten generar una secuencia , , de nmeros aleatorios
aproximadamente independientes y que siguen, tambin aproximadamente, la distribucin
Uniforme

A. Simulacin de distribucin continua B. Simulacin de distribucin discreta


3.3.1 TEOREMA DEL LMITE CENTRAL

Elteorema del lmite central indica que, en condiciones muy generales, si es la suma de
n variables aleatorias independientes, entonces la funcin de distribucin de se
aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana).

El teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e
independientes es lo suficientemente grande.
Sedefine como la de n variables aleatorias, independientes, idnticamente distribuidas y
con una medida y varianza finitas ()

es n.

varianza n. Pr( ) indica probabilidad y lim se


refiere a lmite matemtico.
Ejemplo

En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada


clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura. Cul es la
probabilidad de tener que salir a la pizarra ms de 15 veces?
solucin
Se a aplicar el Teorema Central del Lmite
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9

m = 0,10
= 0,10 * 0,90 = 0,09

Por tanto, la suma de las 100 variables se distribuye segn una normal
cuya media y varianza son:
Media: n * m = 100 * 0,10 = 10
Varianza: n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor
equivalente de la variable normal tipificada:

Luego:

P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475

Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo


del curso es tan slo del 4,75%.
3.3.2 MTODO DE LA TRANSFORMADA INVERSA

Transformada inversa

Es un mtodo para la generacin de nmeros


aleatorios de cualquier distribucin de
probabilidad se conoce la inversa de su funcin de
distribucin
3.3.2 MTODO DE LA TRANSFORMADA INVERSA

Si deseamos generar los valores de la variables


aleatorias a partir de cierta estadstica de poblacin
cuya funcin de densidad este dada por F(x), y vamos
a utilizar el mtodo de la transformada inversa,
debemos en primer lugar obtener la funcin de la
distribucin acumulada F(x), de la distribucin que se
Puesto que F(x) est definida en el intervalo (0;1) , se puede
va a simular
generar un
.
numero aleatorios de distribuidos
uniformemente r y tratar de determinar el valor de la
variable aleatoria para la cual su distribucin acumulada es
igual a r, es decir, el valor simulado de la variable aleatoria
que sigue una distribucin de probabilidad F(x)
r = F(x).
3.3.2 MTODO DE LA TRANSFORMADA INVERSA

Sigue por lo tanto, que para cualquier valor particular de r, que


generamos, por ejemplo , siempre es posible encontrar el valor de x,
en este caso , que corresponde a debido a la funcin inversa de F, si
es conocida. Esto es:

Donde (x) es la transformacin inversa de r sobre el intervalo unitario


en el dominio de x.

Ntese que (r) siempre ser definida desde 0 < r < 1 y que el rango
de F es .
3.3.2 MTODO DE LA TRANSFORMADA INVERSA
Aqu la funcin de distribucin de
Donde esta igualdad cumple con probabilidad es
los siguientes puntos
Se asume los que X solamente
puede tomar los siguientes
valores

Por lo tanto el algoritmo


general sera como sigue:
Aplicacin del mtodo de la transformada inversa.
Hallar el generador de variaciones aleatorias cuya funcin de densidad de probabilidad es :

solucin
Sea RND un nmero aleatorio uniforme en (0,1) dado, entonces:

Al integrar se tiene:
Por lo que el generador, hallado por el mtodo
de la transformacin inversa es:

Es decir,
3.3.3 MTODO DE MONTE CARLO
Las simulaciones de Monte Carlo es una
tcnica que combina conceptos estadsticos
(muestreo aleatorio) con la capacidad que
tiene los ordenadores para generar nmeros
pseudoalatorios y automatizar clculos

El mtodo se llamo as en referencia a casino


de Monte Carlo (principado de Monaco) por
ser la capital de juego de azar al ser la
ruleta un generador simple de nmeros
aleatorios. El nombre y el desarrollo
sistemtico de los mtodos de Monte Carlo
datan aproximadamente de 1944 y se
3.3.3 MTODO DE MONTE CARLO

El anlisis de riesgo se puede


realizar cualitativa y
cuantitativamente. El anlisis de
riesgo cualitativo generalmente
incluye la evaluacin instintiva o
por corazonada y se caracteriza
por afirmaciones como eso parece
muy arriesgado o probablemente
buenos resultados.
El anlisis de riesgo cuantitativo
trata de asignar valores numricos
a los riesgos, utilizando datos
empricos o cuantificado
3.3.3 MTODO DE MONTE CARLO
Ejemplo:
En la imagen inferior se muestra un anlisis histrico de 200 das sobre el nmero
de consultas diarias realizadas a un sistema de informacin empresarial (EIS)
residente en un servidor central. La tabla incluye el nmero de consultas diarias
(0 a 5) junto con las frecuencias absolutas (nmero de das que se producen 0,
1,5 consultas), las frecuencias relativas (10/200 = 0,05,
...), y las frecuencias relativas acumuladas.

Solucin
Denotando por X a la variable aleatoria que representa el nmero diario de
consultas al EIS, sabemos que:
Cuando se conozca la distribucin de probabilidad asociada a una variable
aleatoria discreta, ser posible usar la columna de frecuencias relativas
acumuladas para obtener los llamados intervalos de nmeros aleatorios
asociados a cada suceso. En este caso, los intervalos obtenidos son:

0,00 , 0,05) para el suceso 0

[0,05 , 0,15) para el suceso 1

[0,15 , 0,35) para el suceso 2

[0,35 , 0,65) para el suceso 3

[0,65 , 0,85) para el suceso 4


El grfico siguiente nos muestra cada
[0,85 , 1,00) para el suceso 5
una de las probabilidades sobre el
nmero de consultas
Asignamos pues la funcin
ALEATORIO a una casilla (la
G1 en el caso de la imagen):

Seleccionando la celda y arrastrando con el


ratn desde el borde inferior derecho de la
misma podemos obtener un listado completo de
nmeros pseudo-aleatorios:

Finalmente, usando la
funcin PROMEDIO ser
posible calcular la media
de los valores de la
columna H
En este caso, hemos obtenido un valor
estimado que corresponde exactamente con
el valor real anteriormente calculado va la
definicin terica de la media. Sin embargo,
debido a la componente aleatoria intrnseca
al modelo, normalmente obtendremos
valores cercanos al valor real, siendo
dichos valores diferentes unos de otros
(cada simulacin proporcionar sus propios
resultados).
INTERPRETACION Y
APLIICACIONES DE
VARIOGRAMAS
EL VARIOGRAMA
El variograma es la herramienta geoestadstica bsica. Permite
analizar el comportamiento espacial de los parmetros
geolgicos y expresa la correlacin espacial entre los valores
muestreados.
Sean x y (x + h) dos puntos en el espacio:
*La definicin terica de la funcin variograma (h) es la esperanza
matemtica siguiente:

*Sin embargo, en la prctica siempre se utiliza el algoritmo


siguiente:
* Esta ecuacin es la que hay que adaptar en cada situacin
prctica (mallas regulares e irregulares en el espacio de n
dimensiones, n = 1, 2, 3). Las propiedades de (h), que se
deducen fcilmente de la definicin son:

* La ltima relacin proviene del hecho que si dos leyes z1 y


z2 estn a la distancia h, entonces (z1 -z2)2 = (z2 - z1)2
Clculo del variograma para una lnea muestreada regularmente

Sean N datos z1, z2, . . . , zN y sea b la equidistancia entre ellos:


a) Sea h = b: Segn el algoritmo de clculo se tiene:

b) Sea h = 2b:

c) Sea h = 3b:
Sea en general h = kb (k = 0, 1, 2, . . . , N-1):

Luego estos valores (b), (2b), (3b), (4b). se lleva a un


grfico .
COMPONENTES DE UN VARIOGRAMA
1.- EFECTO PEPITA (Co)
Por lo general, el variograma no tiende a cero, el efecto pepita es
una discontinuidad de salto en el origen conocido tambin como
efecto nugget, representa la discontinuidad en el semivariograma
para distancias que sean menores que la menor distancia dada
entre los puntos muestrales. Esta discontinuidad se puede dar
tambin debido a errores en la medicin o a una pobre precisin
analtica.
2.- SILL (C)
El sill conocido tambin como La Meseta es el valor mximo que
alcanza el semivariograma cuando la variable es estacionaria.
Tericamente, la meseta coincide con el valor de la varianza y por
tanto un buen estimador de la misma ser la varianza experimental
de los datos.
3.- RANGO (a)
Conocido tambin como Alcance, el Rango es la distancia a la cual
el variograma se estabiliza y las muestras se relacionan
espacialmente.
APLICACIN DEL VARIOGRAMA

Las aplicaciones de los variogramas en el campo minero-


geolgico es de suma importancia por ejemplo para analizar
la variabilidad de un yacimiento minero, para estimacin de
recursos mineros, determinacin de leyes medias para ver la
heterogeneidad de un yacimiento entre otras cosas.
En el siguiente ejemplo construiremos un variograma para su
posterior anlisis.
* La siguiente figura muestra un sondaje en el depsito de cobre de
Puentes de Garca Rodrguez (Espaa). Se trata de un sondaje
vertical con N = 12 muestras. La distancia es irregular cuyos datos
estn mostrados en el cuadro.
Luego se determina el rango de las
muestras:
MODELADO DE VARIOGRAMAS.

Variograma
experimental

Variograma terico
AJUSTE DE UN VARIOGRAMA A UN MODELO
TERICO.
El objetivo de ajustar un modelo terico es
disponer de una ecuacin, la cual se utilizar en
los clculos posteriores.
Despus del anlisis variogrfico disponemos de
una interpretacin de los Variogramas
experimentales, de sus caractersticas
(anisotropas, alcances, mesetas, efectos de
pepita)
El variograma terico

Corresponde a
una ecuacin
que se ajusta al
variograma
experimental:
MODELO ESFERICO.

Este modelo tiene


un comportamiento
lineal en el origen y
alcanza la meseta a
una distancia igual
al rango a.
MODELO EXPONENCIAL.

Donde c es la meseta
o varianza y a es
prcticamente el
rango, esto es, la
distancia en la que el
valor del variograma
alcanza el 95 % del
valor de la meseta. El
modelo es asinttico
y tiene un
comportamiento
MODELO GAUSIANO.
MODELO SENO CARDINAL.
Ilustracin

442 440344224309339934713460 38
33753378373355338733763376335 3240
336833573365353340332292390 2382
10
Clculo del Semivariograma

(100) 38 37 37 35 ... 37 36
2 2 2

(200) 38 35 35 30 ... 39 36
2 2 2

El semivariograma experimental se calcula


mediante la suma de los cuadrados de las
diferencias entre observaciones que se encuentran
a una distancia h (en el ejemplo 100, 200, 300, etc)

Ejercicio: calcular el valor del variograma emprico a


distancia 100
CONCLUSIONES:

La distribucin de las leyes en un yacimiento minero pueden tener forma normal o lognormal.
La Simulaciones de distribuciones consiste en simular variables aleatorias que siguen ciertas distribuciones probabilsticos el cual nos ayudan a modelar
matemticamente y dar respuestas aproximadas para un problema.

El modelo terico es el que proporciona una mejor estimacin y


precisin de datos.