Está en la página 1de 35

GENERACIÓN DE VALORES

ANÓMALOS EN IBM SPSS


Periodo Académico 2021-I
Profesor: Dr. Ing. Alfredo Marín Suarez
Alumno:
Huaira Rondo, Luis Alberto 20171142I
Geoestadística

Tabla de contenido
1. MARCO TEÓRICO: ................................................................................................................... 3
1.1. TRANSFORMACIÓN GAUSSIANA ................................................................................ 3
1.2. SPSS: ................................................................................................................................... 6
2. PROCEDIMIENTO: ................................................................................................................... 7
2.1. Con 3000 datos:................................................................................................................... 7
2.2. Con 3400 datos:................................................................................................................. 18
3. RESULTADOS: ........................................................................................................................ 30
3.1. Para el primer caso (3000 datos): ...................................................................................... 30
3.2. Para el segundo caso (3400 datos): ................................................................................... 32
4. CONCLUSIONES: ................................................................................................................... 34
5. REFERENCIAS: ....................................................................................................................... 35

3 de mayo de 2021 2
Geoestadística

1. MARCO TEÓRICO:
1.1. TRANSFORMACIÓN GAUSSIANA
Es poco frecuente que la variable estudiada pueda ser considerada como Gaussiana: a menudo, la
distribución univariable (histograma de los valores medidos) es asimétrico y no es compatible con
un modelo Gaussiano. Una transformación – llamada DQDPRUIRVLV – es necesaria para
convertirla en una distribución Gaussiana. Gráficamente, la transformación consiste en deformar el
histograma de los datos en un histograma Gaussiano estándar, es decir, de media 0 y varianza 1
(Figura 1).

Figura 1. Construcción gráfica de la anamorfosis Gaussiana


A continuación, denotaremos como
✓ 𝑍 = {𝑍(𝑥) , 𝑥 𝜖 𝐷} la función aleatoria que representa a la variable original
✓ 𝑌 = {𝑌(𝑥) , 𝑥 𝜖 𝐷} la función aleatoria que representa a la variable transformada
✓ 𝐹(𝑍) la función de distribución (histograma acumulado) de =
✓ 𝐺(𝑌) la función de distribución de 𝑌 (Gaussiana de media 0 y varianza 1).

En los histogramas acumulados, la transformación consiste en asociar a cada valor ] de la variable


original el valor Gaussiano \ que tiene la misma frecuencia acumulada, es decir, se plantea que
𝐹(𝑍) = 𝐺(𝑌) (Figura 2).

3 de mayo de 2021 3
Geoestadística

Figura 2. Construcción de la anamorfosis con ayuda de las funciones de distribución F (variable


original) y G (variable Gaussiana)
Se denomina función de anamorfosis Gaussiana a la función que relaciona los valores
Gaussianos con los valores originales (Figura 3). Conforme a lo anterior, esta función se
escribe como: ∅ = 𝐹 −1 𝑜 𝐺 y se puede plantear:
∀𝑥 ∈ 𝐷, 𝑍(𝑥) = ∅[𝑌(𝑥) ]

Figura 3. Función de anamorfosis. En este ejemplo (variable Z conuna distribución lognormal), se


trata de una función exponencial

3 de mayo de 2021 4
Geoestadística

Relación entre los parámetros aritméticos y logarítmicos:


𝛽2 2
𝜇𝑥 = 𝑒 𝛼+ 2 𝜎𝑥 2 = 𝜇𝑥 2 [𝑒 𝛽 − 1]
𝛽2 𝜎 2
𝛼 = ln 𝜇𝑥 − 2
𝛽 2 = ln (1 + 𝜇𝑥 2 )
𝑥

3 de mayo de 2021 5
Geoestadística

1.2. SPSS:
Esta aplicación explica cómo utilizar un programa informático para llevar a cabo el tratamiento y
análisis de información estadística. Se dirige a un conjunto muy amplio de lectores, tanto aquellos
que se inicien en el aprendizaje de la Estadística como para los que ya tienen unos conocimientos
previos sobre la materia y quieren aplicarlos con la ayuda de un programa ampliamente difundido
en la actualidad como es el programa SPSS, versión 11.

Se presupone que el usuario que utiliza esta aplicación quiere introducirse en los conocimientos
básicos de la Estadística mediante la utilización de un programa informático para el tratamiento de
datos, concretamente el programa SPSS, versión 11. Para el seguimiento del libro no se requiere
ningún conocimiento previo del funcionamiento de este programa. Este material ha sido concebido
como un instrumento aplicado al aprendizaje de la Estadística, ya que permite ver cómo se aplican
los conocimientos y se obtienen los resultados con las herramientas informáticas disponibles.

En cada uno de los apartados se consideran dos partes que permiten, en primer lugar, familiarizarse
con el entorno del programa SPSS, y seguidamente se procede a explicar las técnicas de análisis de
datos: se incluyen una explicación teórica con definiciones, expresiones y fórmulas que permite
introducir o recordar al lector la teoría estadística que se está utilizando.

Al finalizar el trabajo de este material, el usuario habrá adquirido los conocimientos necesarios para
utilizar el programa SPSS en los siguientes aspectos:

- Introducción y lectura de los datos.


- Análisis de estadística descriptiva básica univariante.
- Tablas de frecuencias bivariantes.
- Contraste de hipótesis paramétricas y no paramétricas.
- Especificación, estimación y evaluación de un modelo de regresión lineal simple.
- Identificación de modelos de series temporales y realización de predicciones.

Este material tiene un enfoque eminentemente práctico dado que para cada uno de los procesos
incluidos se presentan: instrucciones de los pasos a seguir, imágenes de las pantallas que se van
obteniendo y ejemplos resueltos incluyendo los resultados obtenidos por el programa, así como
todas las fases intermedias que nos llevan a ellos, y las conclusiones que pueden extraerse de los
mismos.

3 de mayo de 2021 6
Geoestadística

2. PROCEDIMIENTO:
2.1. Con 3000 datos:
Como primer paso procederemos a abrir el programa IBM SPSS

Lo siguiente será abrir la carpeta ARU1 lo cual ya lo tenemos descargado.

1.- Seleccionamos
la carpeta

2.- Le damos abrir

3 de mayo de 2021 7
Geoestadística

Nos saldrá una ventana (ASISTENTE PARA LA IMPORTACIÓN DE TEXTO)

1.- Le damos
siguiente

Como paso numero 2

1.- Debemos seleccionar


ANCHO FIJO

2.- Le damos
siguiente

3 de mayo de 2021 8
Geoestadística

Como tercer paso

1.- Le damos
siguiente

Como cuarto paso

1.- Le damos
siguiente

3 de mayo de 2021 9
Geoestadística

Como quinto paso

1.- A nuestro nombre de


variable ponemos
“Variable1”

2.- Le damos
siguiente

Como sexto paso

1.- Le damos
finalizar

3 de mayo de 2021 10
Geoestadística

Nos saldrá la siguiente tabla con valores enteros

Nosotros queremos que nuestros valores tengan 3 decimales, por lo tanto nos vamos a VISTA DE
VARIABLES.

1.- ponemos numero 3 a


DECIMALES

3 de mayo de 2021 11
Geoestadística

Finalmente nos saldrán nuestros valores con 3 decimales.

Ahora vamos a GRÁFICOS → CUADROS DE DIÁLOGOS ANTIGUOS → HISTOGRAMA

1.- Seleccionamos
nuestros datos

2.- Seleccionamos
HISTOGRAMA

3 de mayo de 2021 12
Geoestadística

Seleccionamos nuestra “Variable1” para trasladarlo a la sección variable y finalmente le damos


ACEPTAR.

2.- Lo llevamos a la
sección variable

1.- Seleccionamos
“variable1”

2.- Le damos
ACEPTAR

Nos saldrá el siguiente histograma la cual tiene lo siguiente:


MEDIA=1.162
DESVIACIÓN ESTÁNDAR TÍPICA=1.652
NÚMERO DE DATOS=3000

3 de mayo de 2021 13
Geoestadística

Ahora transformaremos todos nuestros datos convirtiéndolos en logaritmo neperiano.

2.- Le damos CALCULAR


VARIABLE

1.- Seleccionamos
nuestros datos

Nos saldrá la siguiente ventana

1.- Ponemos como nombre


destino LNAU

2.- Seleccionamos función


ARITMÉTICA
4.- Llevamos nuestro
“variable1” a la expresión
numérica.

3.- Seleccionamos la
función LN

5.- Le damos
ACEPTAR

3 de mayo de 2021 14
Geoestadística

Nos saldrá la siguiente tabla con valores de dos decimales.

Como el modo anterior también lo llevaremos a 3 decimales

1.- ponemos numero 3 a


DECIMALES

3 de mayo de 2021 15
Geoestadística

De esta manera nos saldrá nuestros valores de “LNAU” con tres decimales.

Ahora vamos a GRÁFICOS → CUADROS DE DIÁLOGOS ANTIGUOS → HISTOGRAMA

1.- Seleccionamos
nuestros datos

2.- Seleccionamos
HISTOGRAMA

3 de mayo de 2021 16
Geoestadística

Seleccionamos nuestra “Variable1” para trasladarlo a la sección variable y finalmente le damos


ACEPTAR.

2.- Lo llevamos a la
sección variable

1.- Seleccionamos
“LNAU”

3.- Le damos
ACEPTAR

Nos saldrá el siguiente histograma la cual tiene lo siguiente:


MEDIA=-0.526
DESVIACIÓN ESTÁNDAR TÍPICA=1.204
NÚMERO DE DATOS=3000
Observamos que no hay anomalías ya que se observa una campana de GAUSS perfecta.

3 de mayo de 2021 17
Geoestadística

2.2. Con 3400 datos:


Ahora vamos a agregar datos aleatorios para que nos salga un histograma con anomalías.
Como primer paso debemos agregar datos mayores a lo que nos dieron en la DATA dada.
Para llevar a cabo esto debemos buscar el máximo valor, esto lo lograremos con la ayuda el Excel,
importando los valores dados a Excel.

1.- Observamos que


nuestro máximo
valor es 24.7935

Por lo tanto, agregaremos 400 valores que estén comprendidos entre 25 y 30.
Esto lo lograremos con la función =ALEATORIO.ENTRE(25*1000;30*1000)/1000
Los datos los tenemos en la siguiente imagen.

3 de mayo de 2021 18
Geoestadística

Estos datos los pegamos en el Excel con los 3000 datos. Luego lo exportaremos a un block de notas
la cual tendrá nombre ARU1.1.txt
Ahora abriremos este nueva DATA en el IBM SPSS
Lo siguiente será abrir la carpeta ARU1.1 lo cual ya lo tenemos descargado.

1.- Seleccionamos
la carpeta

2.- Le damos abrir

Nos saldrá una ventana (ASISTENTE PARA LA IMPORTACIÓN DE TEXTO)

1.- Le damos
siguiente

3 de mayo de 2021 19
Geoestadística

Como paso numero 2

1.- Debemos seleccionar


ANCHO FIJO

2.- Le damos
siguiente

Como tercer paso

1.- Le damos
siguiente

3 de mayo de 2021 20
Geoestadística

Como cuarto paso

1.- Le damos
siguiente

Como quinto paso

1.- A nuestro nombre de


variable ponemos
“Variable2”

2.- Le damos
siguiente

3 de mayo de 2021 21
Geoestadística

Como sexto paso

1.- Le damos
finalizar

Nos saldrá la siguiente tabla con valores enteros

3 de mayo de 2021 22
Geoestadística

Nosotros queremos que nuestros valores tengan 3 decimales, por lo tanto, nos vamos a VISTA DE
VARIABLES.

1.- ponemos numero 3 a


DECIMALES

Finalmente nos saldrán nuestros valores con 3 decimales.

3 de mayo de 2021 23
Geoestadística

Ahora vamos a GRÁFICOS → CUADROS DE DIÁLOGOS ANTIGUOS → HISTOGRAMA

1.- Seleccionamos
nuestros datos

2.- Seleccionamos
HISTOGRAMA

Seleccionamos nuestra “Variable2” para trasladarlo a la sección variable y finalmente le damos


ACEPTAR.

2.- Lo llevamos a la
sección variable

1.- Seleccionamos
“variable2”

2.- Le damos
ACEPTAR

3 de mayo de 2021 24
Geoestadística

Nos saldrá el siguiente histograma la cual tiene lo siguiente:


MEDIA=4.258
DESVIACIÓN ESTÁNDAR TÍPICA=8.636
NÚMERO DE DATOS=3400

Ahora transformaremos todos nuestros datos convirtiéndolos en logaritmo neperiano.

2.- Le damos CALCULAR


VARIABLE

1.- Seleccionamos
nuestros datos

3 de mayo de 2021 25
Geoestadística

Nos saldrá la siguiente ventana

1.- Ponemos como nombre


destino LNAU2

2.- Seleccionamos función


ARITMÉTICA
4.- Llevamos nuestro
“variable1” a la expresión
numérica.

3.- Seleccionamos la
función LN

5.- Le damos
ACEPTAR

Nos saldrá la siguiente tabla con valores de dos decimales.

3 de mayo de 2021 26
Geoestadística

Como el modo anterior también lo llevaremos a 3 decimales

1.- ponemos numero 3 a


DECIMALES

De esta manera nos saldrá nuestros valores de “LNAU” con tres decimales.

3 de mayo de 2021 27
Geoestadística

Ahora vamos a GRÁFICOS → CUADROS DE DIÁLOGOS ANTIGUOS → HISTOGRAMA

1.- Seleccionamos
nuestros datos

2.- Seleccionamos
HISTOGRAMA

Seleccionamos nuestra “Variable1” para trasladarlo a la sección variable y finalmente le damos


ACEPTAR.

2.- Lo llevamos a la
sección variable

1.- Seleccionamos
“LNAU2”

3.- Le damos
ACEPTAR

3 de mayo de 2021 28
Geoestadística

Nos saldrá el siguiente histograma la cual tiene lo siguiente:


MEDIA=-0.402
DESVIACIÓN ESTÁNDAR TÍPICA=1.365
NÚMERO DE DATOS=3400
Observamos que no hay anomalías ya que se observa una campana de GAUSS perfecta.

3 de mayo de 2021 29
Geoestadística

3. RESULTADOS:
3.1. Para el primer caso (3000 datos):
Para el primer caso con los 3000 datos podemos comprobar que no tiene anomalía.

Figura1. Esta grafica nos comprueba que no tiene anomalías.

De la misma forma lo hacemos con la transformada.

Figura 2. Esta grafica nos comprueba que no tiene anomalías.

3 de mayo de 2021 30
Geoestadística

Además, vamos a calcular sus valores de alfa y beta:


Teniendo como datos los siguientes:
𝜇𝑥 = 1.162
𝜎𝑥 = 1.652
Haremos el cálculo de:
𝛽2 𝜎 2
𝛼 = ln 𝜇𝑥 − 2
y 𝛽 2 = ln (1 + 𝜇𝑥 2 )
𝑥

Para el cálculo de beta:


𝜎𝑥 2
𝛽 2 = ln (1 + )
𝜇𝑥 2
Entonces:
1.6522
𝛽 2 = ln (1 + )
1.1622

𝛽 = 1.051
Para el cálculo de alfa:

𝛽2
𝛼 = ln 𝜇𝑥 −
2
Entonces:
1.0512
𝛼 = ln 1.162 −
2
𝛼 = −0.4022

Por lo tanto, nuestros valores son :


𝛼 = −0.4022
𝛽 = 1.051
Los comparamos con nuestros datos teóricos las cuales son:
𝛼 = −0.53
𝛽 = 1.204
Hallamos su porcentaje de error:

(−0.53 − (−0.4022))
%𝑒𝑟𝑟𝑟𝑜 𝑝𝑎𝑟𝑎 𝑎𝑙𝑓𝑎: 𝑥100% = 23.960%
−0.53
(1.204 − 1.051)
%𝑒𝑟𝑟𝑟𝑜 𝑝𝑎𝑟𝑎 𝑏𝑒𝑡𝑎: 𝑥100% = 12.659%
1.304

3 de mayo de 2021 31
Geoestadística

3.2. Para el segundo caso (3400 datos):


Para el segundo caso con los 3400 datos comprobaremos que SI tiene anomalía.

Figura2. Esta grafica nos comprueba que si tiene anomalías.


De la misma forma lo hacemos con la transformada.

Figura 4. Esta grafica nos comprueba que si tiene anomalías.

3 de mayo de 2021 32
Geoestadística

Además, vamos a calcular sus valores de alfa y beta:


Teniendo como datos los siguientes:
𝜇𝑥 = 4.258
𝜎𝑥 = 8.636
Haremos el cálculo de:
𝛽2 𝜎 2
𝛼 = ln 𝜇𝑥 − 2
y 𝛽 2 = ln (1 + 𝜇𝑥 2 )
𝑥

Para el cálculo de beta:


𝜎𝑥 2
𝛽 2 = ln (1 + )
𝜇𝑥 2
Entonces:
8.6362
𝛽 2 = ln (1 + )
4.2582

𝛽 = 1.2774
Para el cálculo de alfa:

𝛽2
𝛼 = ln 𝜇𝑥 −
2
Entonces:
1.27742
𝛼 = ln 4.258 −
2
𝛼 = 0.6334

Por lo tanto, nuestros valores son :


𝛼 = 0.6334
𝛽 = 1.2774
Los comparamos con nuestros datos teóricos las cuales son:
𝛼 = −0.07
𝛽 = 1.676
Hallamos su porcentaje de error:

(0.6334 − (−0.07))
%𝑒𝑟𝑟𝑟𝑜 𝑝𝑎𝑟𝑎 𝑎𝑙𝑓𝑎: 𝑥100% = 111.0514%
0.6334
(1.2774 − 1.676)
%𝑒𝑟𝑟𝑟𝑜 𝑝𝑎𝑟𝑎 𝑏𝑒𝑡𝑎: 𝑥100% = 31.204%
1.2774

3 de mayo de 2021 33
Geoestadística

4. CONCLUSIONES:

✓ Los datos dados en la primera data no presentan anomalías.

✓ Agregando datos aleatorios fuera del rango dado nos genera anomalías.

✓ Analizando los valores en el SPSS se puede comprobar que si son o no son graficas con
anomalías.

✓ Calculando los valores del alfa y beta en forma de cálculos no nos sale exacto a los teóricos.

✓ Todas las variables de las tierras (leyes, potencias, etc.) tiene una distribución Lognormal.

✓ Observamos que hay una cierta variación al hacer el calculo de alfa y beta tanto en SPSS
como en forma calculada con su fórmula.

3 de mayo de 2021 34
Geoestadística

5. REFERENCIAS:

✓ Marín, A. (2014). Apuntes de Curso de Postgrado de Geoestadística Aplicada en Maestría


de Geología de UNSA. Arequipa.

✓ Marín, A. (1978). Tesis de doctor ingeniero mención Geoestadística: Methodologie de


L'Estimation et Simulation Multivariable des Grands Gisements Tridimensionnels. París:
Ecole National Superieure des Mines de Paris.

✓ Marín Suárez A. (1986) - Modelo Geoestadístico de Filones de Almadén. Ed. Minas de


Almadén S.A., Almadén (España).

3 de mayo de 2021 35

También podría gustarte