Está en la página 1de 51

Geoestadística

Introducción
¿Qué es la estadística?
• Es una ciencia matemática que tiene el objetivo de la recolección,
análisis, interpretación o explicación y la presentación de los datos.
• La estadística, en general, es la ciencia que trata de la recopilación,
organización presentación, análisis e interpretación de datos numéricos
con e fin de realizar una toma de decisión más efectiva.
• La estadística es la ciencia que se ocupa de recoger, clasificar,
representar y resumir los datos de muestras, y de hacer inferencias
(extraer conclusiones) acerca de las poblaciones de las que éstas
proceden.
Se utiliza en una variedad de disciplinas del saber humano como: las
ciencias naturales, ciencias sociales, el gobierno y los negocios.
¿Qué es la estadística?
Etimología:
El término «estadística», en última instancia, deriva la palabra del neolatín
statisticum collegium (consejo de estado) y la palabra italiana statista
(‘hombre de estado’ o político).
La palabra alemana statistik, introducida primeramente por Godofredo
Achenwall (1749), originalmente designaba el análisis de datos acerca del
estado, significando la ‘ciencia del estado’ (llamado posteriormente
«aritmética política» en idioma inglés).
A principios del siglo XIX, adquirió el significado de colección y
clasificación de datos.
¿Qué significa?
Singular:
Se refiere a una ciencia con las definiciones ya enunciadas.

Plural:
Se refiere a ciertos datos o información numérica.
¿Por qué es importante la estadística?
• La estadística es parte del enfoque cuantitativo de los conocimientos
En el pasado, la geología era más cualitativa, pero ahora se está
convirtiendo cada vez más cuantitativo. Las estadísticas pueden ser
utilizadas para cuantificar los datos, lamentablemente, muchas
veces las estadísticas son ignoradas o tergiversadas.
• En los "viejos tiempos" geólogos usarían más capacidad de
observación. "Esto se ve como en la descripción de los granitos"
• Hoy en día los geólogos tienen un montón de números que hay hacer
frente
• Se requieren métodos de análisis estadístico de datos para recuperar la
información desde el conjunto de números de un ordenador
¿Qué problemas resuelve la estadística?
Análisis de muestras. Se elige una muestra de una población para hacer
inferencias respecto a esa población a partir de lo observado en la muestra
(sondeos de opinión, control de calidad, etc).
Descripción de datos. Procedimientos para resumir la información contenida en
un conjunto (amplio) de datos.
Contraste de hipótesis. Metodología estadística para diseñar experimentos que
garanticen que las conclusiones que se extraigan sean validas. Sirve para
comparar las predicciones resultantes de las hipótesis con los datos
observados (medicina eficaz, diferencias entre poblaciones, etc).
Medición de relaciones entre variables estadísticas (contenido de gas hidrogeno
neutro en galaxias y la tasa de formación de estrellas, etc)
Predicción. Prever la evolución de una variable estudiando su historia y/o
relación con otras variables.
Una hipertrofia de los sentidos
• En los últimos años nuevos métodos de observación, cada vez más
sofisticados generan una enorme cantidad de datos, en muchas
disciplinas, los mismos necesitan ser analizados
• La obtención de información, así como la elección de la fuente de
observación adecuada y la recuperación de información; son los
principales retos en la era de la información

Gran progreso en adquisición de datos por ende mas datos a analizar


Una irresistible avalancha de datos
• La colección Earth Observing System Data and
Information System (EOSDIS) recopila y archiva los datos
de más de 30 satélites de observación de la tierra.
• Es el Mayor sistema de datos científicos en el mundo
• Por ejemplo: la Biblioteca del Congreso en Washington
DC, que es la más grande en el mundo, contiene 29
millones de libros y otros materiales impresos, 2,7
millones de grabaciones, 12 millones de fotografías, 4,8
millones de mapas y 57 millones de manuscritos.
• Los datos científicos de EOSDIS podrían llenar la Biblioteca
del Congreso 300 veces.
Típica matriz de datos geológica
Algunos gráficos geológicos
• Gráficos de dos variables
Algunos gráficos geológicos
• Gráficos de tres variables
Algunos gráficos geológicos
Diagramas Spiders
En el uso de gráficos geológicos
• El uso de estos gráficos es una herramienta útil para obtener una
primera comprensión acerca de la información contenida en los
datos
• Sin embargo, se puede realizar las siguientes preguntas:
• ¿Qué hacer con todo esto?
• ¿Hay algún análisis crítico de estas curvas y campos?
• Necesitamos una mejor respuesta que por «Tanto debe ser
diferente"
• Tenemos que emplear métodos científicos más rigurosos a los
problemas geológicos
• evaluación de la hipótesis
Por tanto es necesario recurrir a la estadística
Un gran poder conlleva una gran responsabilidad
Dr Michael Mann of the Department of
Geosciences, University of
Massachusetts fue el autor principal de
un artículo que anuló toda la historia del
clima en un solo golpe científico
Mann M.E. et al, "Northern
Hemisphere Temperatures During the
Past Millennium: Inferences,
Uncertainties, and Limitations", AGU
GRL, v.3.1, 1999
La verdad incomoda de Gore

Muestra la más influyente y más controvertida de los tiempos modernos


Aquí se muestra en su forma original y representa un aumento espectacular de la
temperatura en los tiempos modernos
El grafico palo de hockey
¿Por qué es tan importante este gráfico?
Es debido a dos características!
• Muestra un fuerte cambio de temperatura desde el comienzo de la era
industrial, lo que podría ser conectado a las emisiones de CO2, y ...
• Muestra un comportamiento de la temperatura bastante plana para los
900 años antes a la era industrial
• Hace hincapié en el carácter antropogénico del cambio climático
El grafico palo de hockey
Si adicionamos al grafico la desviación
estándar (raíz cuadrada de la varianza)
•Todavía vemos un fuerte aumento de
la temperatura desde 1900, pero ...
•En el pasado la temperatura es mas
ruidosa y ya no es más una amenaza
La naturaleza antropogénica parece
todavía presente pero ya no es tan obvia

Versión modificada añadiendo la incertidumbre


El aumento aparece menos dramático y menos significativo
El grafico palo de hockey
Si adicionamos al grafico otros estudios -
•Todavía se observa el aumento de la
temperatura, pero las diferencias entre
los estudios hacen que su amplitud sea
cuestionable
•La tendencia de la temperatura en el
pasado no se ve más lineal
¿El cambio climático antropogénico?

Muchas personas acusan al hombre de falsificación y de


mostrar diferentes modelos
De repente todo se ve muy confuso
El grafico palo de hockey
Vamos a comparar las dos gráficos más
contradictorios
Por supuesto, cada una de las partes va
culpar al otro por falsificación de datos
¿Cuál es la verdad?
Los gráficos pueden ser muy engañoso

En esta batalla de gráficos se comparan las dos gráficas de temperatura más


extremas
En este caso, el gráfico inferior se llama la "verdad" y el gráfico de Mann se llama
"forjado"
¿Cuál es la verdad?
¿Como mentir con estadísticas?
Cómo mentir con estadísticas es un popular libro de
Darrell Huff, escrito en 1954, que es una
introducción a las estadísticas para el lector general.
Es una guía de cómo hacer un mal uso y distorsionar
los resultados de las estadísticas para satisfacer sus
intereses
Los métodos que aquí se presentan, por supuesto,
no se enseñan en el curso
El geólogo inductivo vs el geólogo deductivo
Razonamiento inductivo:
Un fenómeno natural es el producto del que
nosotros podemos constatar los resultados y es
observando atentamente el terreno que nos
permite inferir el proceso.

Razonamiento deductivo:
Intenta ensamblar un proceso dentro de un
modelo, es un método lógico que lleva desde
lo universal hasta lo particular.
El geólogo informático o el informático geólogo
• Nace la disciplina denominada Geología
Informática, con la ambición de transformar
la geología en una ciencia puramente
analítica
• Hoy en día todo geólogo, especializado en
una o varias ramas de la geología trabaja con
una computadora
El computador una herramienta de análisis y experimentación
Percepción asistida por computadora:
La información puede contribuir al mundo que
nos rodea, tal como percibe el cerebro
humano. Utiliza métodos cuantitativos como la
matemática y estadística, es una técnica
complementaria a la geología tradicional.
Concepción asistida por computadora:
Soporte en la experimentación permanente de
visualizar los resultados generales en
ecuaciones simples. Visualización de datos
brutos (conocidos) de manera mas fiel a un
fenómeno físico, mediante la simulación
(modelos numéricos).
Inductivo vs Deductivo
Porque privilegiar un acercamiento cuantitativo
Necesidades fundamentales:
Síntesis: Responde a las exigencias de la memorización y del tratamiento de la
información distinguiendo la información esencial de la información de relleno.
Porque privilegiar un acercamiento cuantitativo
Necesidades fundamentales:
Objetividad: Es una característica inherente de los métodos informáticos. Nuestra
percepción humana es fuertemente no-lineal por ende esta influenciada por las
mensuras extremas.
Porque privilegiar un acercamiento cuantitativo
Necesidades fundamentales:
Comparación: Es esencial al progreso científico que permite la comparación
resultado de diferentes laboratorios. Esto supone la adopción de convenciones y
métodos de mensuras rigurosamente idénticas.
Porque privilegiar un acercamiento cuantitativo
Necesidades fundamentales:
Correlación: Esto se refiere a la
relación de diferentes experimentos
(medidas) realizadas en el seno de
un mismo laboratorio
Como se dividen las estadísticas
Estadística Descriptiva (deductiva):
Parte de la estadística que se ocupa de recoger, clasificar, representar y
resumir los datos de las muestras.
Estadística Inferencial (inductiva):
Parte de la estadística que se ocupa de llegar a conclusiones (inferencias) de
las poblaciones a partir de los datos de las muestras extraídas de ellas.
Como se dividen las estadísticas
Estadística Estadística
Descriptiva Inferencial

Muestra Muestra

• Medidas de tendencia
• Estimación
central
• Test de hipótesis
• Medidas de dispersión

Población
Como se dividen las estadísticas
Descriptiva Inferencial
Objetivo Describe los datos que La descripción de los datos que se
se tienen porque tiene importa como indicador del
importan en si mismos comportamiento de un conjunto mas
amplio
Caracterización del Sobre un conjunto Solo para conjuntos representativos de
conjunto de datos cualquiera un universo especifico
representativo o no de
un conjunto mas amplio
Alcance de las Acotada para este Concluye para el universo a partir de
conclusiones conjunto de datos las observaciones que se tiene
Terminología estadística
Campo:
Es la extensión espacial (o espacio temporal)
en el seno de la cual las mensuras serán
efectuadas.
La dimensión del campo:
• puede imponerse ella misma (un
meteorito, una lava volcánica),
• definido por restricciones practicas (el
devónico del norte de La Paz)
• o políticos (los limites de una concesión)
Terminología estadística
Universo: Es la fuente de todas las mensuras
posibles. La noción de universo esta definida
por la naturaleza de la medida a efectuar y no
cubre necesariamente toda la información
accesible dentro del campo.
Ejemplo: En una yacimiento de oro , el
universo será el conjunto de todos los análisis
de oro posibles sobre la concesión.
Terminología estadística
Soporte:
Es la extensión espacial (o espacio
temporal) sobre la cual se efectuara
efectivamente la mensura. El soporte es
necesariamente mas pequeño que el
campo.
La dimensión del soporte:
• puede imponerse ella misma (un fósil,
un grano de arena)
• o ser definido por criterios técnicos (los
diámetros de un testigo)
Terminología estadística
Muestra: Es la mensura efectuada sobre el
soporte.
Ejemplo: El análisis de oro efectuado sobre un
volumen determinado.
Nota: En geología el termino muestra se
identifica generalmente con la acción de tomar
un material (soporte) que la mensura
propiamente dicha.
En estadística la palabra muestra es
generalmente utilizada para designar un
conjunto de medidas, que preferiblemente
puede llamarse como un conjunto de mensuras.
Terminología estadística
Población: Es el conjunto de todas las
muestras posibles dentro un universo.
La población es dependiente de la medida
efectuada y depende sobre todo de la
definición adoptada por el soporte.
Es decir, muchas poblaciones diferentes
pueden ser obtenidas a partir de un
mismo universo.

¿Qué información hay que medir?


¿ Sobre que soporte hay que mensurar esta
información?
¿ Donde hay que muestrear?
Definiendo la población geológica
Población hipotética:
Incorpora a todas las entidades geológicas que alguna vez existieron
Población existente
Es toda la porción restante de una entidad geológica
Población disponible
Es el sub set de una población geológica existente la cual puede ser muestreada
Elección de las variables en geología
La historia de la investigación científica nos
enseña que el conocimiento completo del
universo no es indispensable a la explicación de
los fenómenos naturales
Existen variables (cantidad de información) que
son mas significativos dentro de ciertos
fenómenos que otros
La física y química, ciencias en las que se
fundamenta la geología, tienen un conjunto de
leyes que nos permite prevenir las variables
implicadas dentro del proceso que nosotros
queremos estudiar.
Ejemplo: relación entre la concentración del
tungsteno en la corteza terrestre y los
terremotos
Toda investigación tiene un objetivo
Ejemplo: la comprensión de los mecanismos que
actúan en la caída de la arena
Nuestra intuición permite definir que ciertas
variables son mas importantes que otras o que
el fenómeno es resultado de varias variables
(multivariable)

• Todas las variables no tienen el mismo rol de


importancia dentro la explicación de un
fenómeno.
• Existe una fuerte redundancia entre las
variables, es decir que la misma información
se encuentra presente en variables diferentes
Tipos de variables en estadística
Variable

Cualitativas Cuantitativas

Nominal Ordinal Discreta Continua


Los valores no Los valores si Toma en Toma en
poseen una poseen una cuenta solo a cuenta solo a
relación de relación de números números
orden entre si. orden entre si. enteros. reales.
Ejemplo: Sexo, Ejemplo: Ejemplo: Ejemplo: peso
raza Estudios, numero de en kilogramos
estatura alumnos del de los alumnos
curso del curso
Como escoger las variables analizar en geología
Hubaux (1970):
Universo Discreto: Conjunto de
componentes entre los cuales no existe
transición
Ejemplo: los átomos y su combinación
sobre la forma de moléculas y minerales
(Calcita y pirita)
Universo continuo: Conjunto de
componentes entre los cuales si existe
transición
Ejemplo: Gran mayoría de los objetos
geológicos (soluciones solidas, rocas, etc.)

Serie de cristalización de Norman Bowen (1928)


Como escoger las variables analizar en geología
Gran intento de llevar un universo
continuo a una clasificación discreta.
Practica: la posibilidad de ser utilizada
sobre el terreno
Uso: conserva una terminología
reconocida internacionalmente
Técnica: la disponibilidad universal de
medios para analizar los elementos
mayores.
Genética: se diferencian rocas de la misma
composición (Qz/Alb/Plg) según su origen.

1974
Como escoger las variables analizar en geología
A partir de solo criterios estadísticos:
Independencia: Los objetos geológicos no podrán, probablemente, por la medida de
un solo parámetro
Significación (relevance): La información útil dentro del estudio de un problema
limitado, todo parámetro fuera de este es excluido
Sensibilidad: Toda medida de un parámetro esta ligada a un error que puede ser
reducido mejorando la técnica de análisis pero jamás será anulado
Robustez: La mensura de un parámetro no debe ser afectada de manera des
mensurada por pequeñas perturbaciones del objeto
Aditiva: Fundamenta en estadística, se traduce por el efecto que la media aritmética
de una serie de medidas debe conservar la misma significación geológica de las
medidas originales.
Es esencial que clasificaciones diferentes sean definidas en función de objetivos que
sean diferentes.
Un método sistemático para analizar la información
La clasificación estadística intenta privilegiar un corte sistemático de la información
en un numero limitado de variables estadísticamente independientes.
Va al encuentro mas intuitivo utilizando variables que poseen una significación
geológica precisa y por tanto facilitan la interpretación de los resultados.
Idea de Griddiths: Todo sedimento es un agregado formado de componentes
elementaríos. Cada uno de estos componentes posee propiedades que determinan
el comportamiento de todo el sedimento.
T = f(mi,si,shi,oi,pi)
Mi : La naturaleza de cada componente
Si : el tamaño de cada componente (granulometría)
Shi: la forma de cada componente (morfología)
Oi: la orientación de cada componente (estructura)
Pi: la posición relativa de cada componente (estructura)
La adquisición de los datos geológicos en la practica
a) Interacción de los rayos electromagnéticos con la materia: Observando
fenómenos de emisión, absorción, reflexión, refracción, transmisión,
interferencia, difracción, difusión, polarización, efecto Doppler.
b) Interacción entre dos materias: Ensayos mecánicos de compresión, tracción,
cizallamiento, etc
c) Interacción del campo gravitacional con la metería: Medias de la densidad,
porosidad, compactación anomalías geofísicas, etc.

La elección de uno u otro método depende fundamentalmente propuesto


Privilegiar la independencia de medidas significa concretamente evitar las técnicas que
son redundantes
Ver la significación física es elegir las técnicas que se acercan mas al problema y
favorecen a la interpretación de los datos
La naturaleza de los datos geológicos
Espesor Litología
Litología Color Sulfuros
(cm) (Código)
10 Lava 6 Verde 0
0,5 Pseutraquita 2 Gris 0
34,5 Arena 1 Verde 0
38 Limonita 4 Verde 0
0,5 Pseutraquita 2 Negro 0
5 Arena 1 Verde 0
4 Arena/Limo 3 Verde 0
2 Pseutraquita 2 Gris 0
8 Arena 1 Verde 1
9 Arena/Limo 3 Verde 0
95 Arena/Limo 3 Verde 0
1 Pseutraquita 2 Gris 0
64 Grava 5 Verde 1
10 Limonita 4 Verde 0
La naturaleza de los datos geológicos
Datos Binarios (dicotómicos): Es el mas
simple que existe, y exprime dos estados
posibles de observación (datos booleanos)
La naturaleza de los datos geológicos
Datos Nominales (multi estados): Se tratan de observaciones por los cuales muchos
estados, generalmente mutualmente exclusivos, son posibles. La condición es que los
estados posibles de una variable sean limitados
La naturaleza de los datos geológicos
Datos Ordinales (de rango): Son el resultado de tentativas de
clasificación según escalas generalmente empíricas. No existe,
necesariamente una diferencia precisa entre dos valores de
rango sucesivos.
No existe diferencia cuantitativa entre dos rangos sucesivos
diferentes
Con relación a los datos nominales podemos testear
igualdades de tipo >,>> o <, <<, en dos observaciones.
La naturaleza de los datos geológicos
Datos Relativos : contrariamente al sistema
ordinal, con estos datos se puede determina
diferencia cuantitativa entre dos valores. Las
cantidades tienen una significación, pero el valor
de referencia (0) esta fijado arbitrariamente y no
significa una cantidad nula.
-Temperatura en grados Celsius
- Un para metro de posición dentro un espacio
geométrico
- El intervalo de un análisis con referencia a un
análisis de referencia
Pueden ser negativos o positivos, pueden ser
aditivos o sustractivos, pero raramente, múltiplos
o dividendos.
La naturaleza de los datos geológicos
Datos absolutos: En este caso el 0 de
referencia esta claramente definido, y por
consecuencia, los valores son directamente
significativos y representan una cantidad.
• Proporción en peso de un oxido (19%
SiO2)
• Proporciona en volumen de un mineral
(43% de Feldespato K)
Todos los operadores aritméticos están
permitidos, todos los cálculos estadísticos
están autorizados, pero este tipo de datos
no pueden ser negativos.
La naturaleza de los datos geológicos
Datos de orientación: Son datos vectoriales y
presentan propiedades mixtas.
• No se puede hablar de una orientación media de
granos dentro una roca.
• Tampoco no tiene ningún sentido de decir la
orientación N90°E es superior a la orientación
N45°E.
• Los valores de pendiente pueden ser comparados
con > y <
Fractales
En sedimentología los sedimentos sueltos y los
conglomerados aparecen como ejemplos simples de la
noción de universo geológico . En realidad, de ver escalas
discretas que se imponen ellas mismas, en la naturaleza
nos confrontamos generalmente a una continuidad de
escalas que hace que el análisis sea mas complicado.
Obsesión de los matemáticos y físicos de tratar de
encontrar parámetros que eliminen el problema de escala

También podría gustarte