Documentos de Académico
Documentos de Profesional
Documentos de Cultura
07exploracion de Datos PDF
07exploracion de Datos PDF
¾Origen de la “Geoestadística”
¾Geoestadística: definición y objeto
¾Datos geográficos y análisis estadístico
¾Conceptos básicos de Estadística
¾Técnicas básicas de Estadística
para el Análisis
á Exploratorio de Datos
Imagen de la NASA
Origen de la “Geoestadística”
Geoestadística (i)
La Geoestadística tiene su origen en la búsqueda,
exploración y evaluación de yacimientos minerales útiles.
Geoestadística (ii)
Geoestadística (antecedentes)
Sichel (1947),
(1947) 1949) observó la naturaleza asimétrica de
la distribución del contenido de oro en las minas
surafricanas,
f , la equiparó
q p a una distribución de
probabilidad lognormal y desarrolló las fórmulas básicas
para esta distribución.
Las técnicas
L é i más
á elementales
l l son ded Estadística
E dí i
descriptiva (Análisis Exploratorio de Datos, EDA).
¾M t
¾Muestreo y análisis
áli i Exploratorio
E l t i d de datos
d t
¾Conceptos de Inferencia Estadística paramétrica:
Una variable: Estimador, propiedades,
intervalos de confianza y tests de hipótesis.
Dos ó más variables: modelos lineales
(regresión, Análisis de la varianza)
Tipos de muestras
Métodos de muestreo
Métodos de muestreo
¾ Muestreo sistemático:
Se selecciona al azar un punto de partida y un intervalo muestral.
muestral
Así si el punto de partida fuera el 11 y el intervalo el 6 se elegirían
el 11, 16, 21, 16 hasta recorrer toda la población.
Métodos de muestreo
Por ejemplo: división que se puede realizar con base en la topografía, los
horizontes del suelo,
suelo la mancha del contaminante
contaminante, los cambios de color en
el suelo, el crecimiento irregular de las plantas, etc.
Estadística básica
Métodos de muestreo
-recomendable
recomendable para áreas mayores de diez hectáreas y cuando el
terreno no es homogéneo (Mason 1992, Valencia y Hernández
2002).
Estadística básica
Métodos de muestreo
Variables cuantitativas
Estadística Descriptiva
Cálculos
Cál l estadísticos
dí i o estadística
dí i descriptiva.
d i i
Permiten determinar si la distribución de los datos es
normal lognormal,
normal, lognormal o si no se ajustan a una distribución
estadística conocida. Implica tener conocimiento de:
Distribuciones de frecuencias
1 n
xn = n ∑
i =1
xi
Estadística básica
V l
Valores resumen: Medidas
M did ded posición
i ió
0 1 2 3 4 5 6 7 8 9 10
Escala graduada de la variable en estudio
Estadística básica
σ 2
n −1 =
1 n
∑
n − 1 i=1
=1
(xi −x n )
2
Valores resumen
Valores resumen
ε = σ 2n − 1
n
Describe
D ib lla simetría
i t í d de lla di
distribución
t ib ió relativa
l ti a lla
distribución normal.
α3 = ∑(xi − Xn ) σ3
1 n 3
n i=1
Estadística básica
α3 = 0 α3 < 0 α3 > 0
Asimetría
A i t í negativa
ti = mayor concentración
t ió de
d valores
l a la
l
izquierda de la media.
Asimetría positiva = mayor concentración de valores a la derecha
de la media.
Estadística básica
n i=1
Eje de
simetría
α 4 > 3 α 4 = 3 α 4 < 3
Estadística básica
Gráficos estadísticos
Gráfico de dispersión
Diámetro
20
(scatterplot X
X-Y)
Y) 15
10
5
0
0 2 4 6 8
Copa 1
Exploración
p de datos
Gráficos estadísticos
•Histogramas
equency
8
6
4
fre
2
0
0 2 4 6 8
Copa 1
•Gráficos de cuantiles:
Quantile Plot
1
Percentiles for Copa 1
0,8
proportion
n
1,0% = 1,2 0,6
5,0% = 1,4 0,4
10,0% = 1,6
25,0% = 2,4 0,2
50 0% = 3,2
50,0% 3 2 0
75,0% = 4,3 0 2 4 6 8
90,0% = 5,1 Copa 1
Exploración
p de datos
Gráficos estadísticos
age
80
2º cuartil 50%
2
Box-and-Whisker Plot
Media (mediana)
Anómalo
(outlier)
0 2 4 6 8
mín Copa 1
Máx.
1er cuartil 25%
3er cuartil 75%
Exploración
p de datos
Gráficos estadísticos
Box-and-Whisker Plot
1
on
2
Locatio
15 25 35 45 55
Silt
T
Transformaciones
f i
X λ −1
λ ≠ 0
T(X ) = Y = λ
ln X λ =0
• λ=2, Y=X2
• λ
λ=1/2
1/2, Y=X
Y X1/2
• Se busca que la variable transformada se
parezca a una distribución normal
Y ≡ X (λ ) ~ N (µ ,σ 2 )
Ejemplo: X ~ Exp(3)
• Rango: [0, 10] pasos de 0.05.
• j fue λ = 3.05
La mejor
Exponencial( 3 ) Tran. Box-Cox con SD min. QQPlot norm.
QQPlot normalizado. Desv. Tipica = 0.364 (lambda = 3.05 , Desv. Tip. = 0.221 )
1.5
1.5
1.0
1.0
X
Y
0.5
0.5
0.0
0.0
-2 -1 0 1 2 -2 -1 0 1 2
Quantiles of Standard Normal Quantiles of Standard Normal
1.0
0.7
30
3
0
log(SD)
0.5
20
10
0.3
0
X Lambda
Ejemplo: X ~ Beta(5, 2.5)
1.0
0.8
0.8
0.6
0.6
X
Y
0.4
0.4
0.2
2
0.2
2
0.0
0.0
-2 -1 0 1 2 -2 -1 0 1 2
Quantiles
Qua t es oof Sta
Standard
da d Normal
o a Quantiles
Qua t es oof Sta
Standard
da d Normal
o a
10^7
25
0^5
20
10
2
10^3
15
log(SD)
10
10^1
5
10^-2
0
1.0
0
0.8
0.8
0.6
0.6
X
Y
0.4
0.4
0.2
0.2
0.0
0.0
-2 -1 0 1 2 -2 -1 0 1 2
10^7 10^10
log(SD)
8
10^4
6
4
10^1
1
2
10^-2
0
X Lambda
REFERENCIAS - ENLACES WEB
http://descargas.cervantesvirtual.com/servlet/SirveObras/4686017510402683
9600080/006458_8.pdf
_ p
Cap.7: Sistemas de Información Geográfica: Pasado, presente y futuro (tesis
doctoral)
www.geogra.uah.es/~joaquin/curso-quito/SIG-OdelT.pdf
h / j i / it /SIG Od lT df
http://ares.unimet.edu.ve/postgrado/mpi002/Estadistica%20Descriptiva/256,1,
Estadística Descriptiva
ttp://www.elagrimensor.net/elearning/lecturas/sig-capitulo%206.pdf
Interpolación
p a partir
p de mapas
p e isolíneas ((aplicaciones
p estadísticas a datos
geográficos, diseños de muestreo.,…en región de Murcia)
http://www.ine.gob.mx/ueajei/publicaciones/libros/459/cap3.html
D ñ d
Diseños de muestreo para suelos.
l Ejemplo
E l de
d sistemático
á en contaminación
ó de
d
suelos.
www.monografías
www monografías .com.
com Elementos de Geoestadística.
Geoestadística CUADOR GIL,
GIL J.Q.
JQ
Universidad de Pinar del Río (Cuba).