Está en la página 1de 16

TRABAJO DE

ESTADISTICA
Eva Romero Chaves

Asignatura: Estadística y Base de Datos


En primer lugar describir las variables que vamos a analizar en este trabajo que son
“precipitaciones totales anuales” y “temperaturas medias anuales”, son las dos variables
cuantitativas continuas, pero en relación al nivel de medición las precipitaciones son de
proporciones mientras que las temperaturas son de intervalo, pues se trata al cero como un
valor intermedio no como un cero absoluto. En mi caso, mi elección de las estaciones ha sido
Sevilla “aeropuerto” (código 5783) y la otra Granada/base aérea (código 5514)

Primero vamos a analizar las precipitaciones de cada base meteorológica y compararemos


entre ellas, para ello utilizaremos la opción Analizarestadísticos descriptivosdescriptivos
en cada uno de los archivos correspondientes a cada estación meteorológica.
Estadísticos descriptivos
Estadísticos descriptivos
Precipitaciones
Precipitaciones
totales anuales N válido (según
totales anuales N válido (según
Granada lista)
Sevilla lista)
N Estadístico 30 30
N Estadístico 30 30
Rango Estadístico 447,80
Rango Estadístico 633,60
Mínimo Estadístico 213,90
Mínimo Estadístico 307,00
Má ximo Estadístico 661,70
Má ximo Estadístico 940,60
Media Estadístico 360,5533
Media Estadístico 536,0333
Desv. típ. Estadístico 109,59530
Desv. típ. Estadístico 177,43681
Varianza Estadístico 12011,130
Varianza Estadístico 31483,823
Asimetría Estadístico ,932
Asimetría Estadístico ,746
Error típico ,427
Error típico ,427
Curtosis Estadístico ,750
Curtosis Estadístico -,280
Error típico ,833
Error típico ,833

Con respecto a N nos indica el tamaño de la muestra que vamos a analizar, y tanto en el caso
de Granada como en el de Sevilla disponemos de 30 individuos, por lo tanto el número de
observaciones también será de 30.
En el caso de Sevilla presenta un mínimo de precipitaciones totales anuales de 307 mm
correspondiendo con el año 1981 mientras que en Granada existe un mínimo de 213,90 mm
en el año 1993, siendo inferior que el mínimo sevillano.
El máximo en Sevilla referido a las precipitaciones totales anuales es de 940,60 mm en el año
1989, mucho más elevado que las de Granada de 661,70 mm en el año 1996.
Con respecto a la media nos indica, la suma de valores que toma la variable entre el número
de observaciones, y es la medida de tendencia central más común. En el caso de Sevilla su
media es de 536,0333 mm, mientras que en Granada la media presenta un valor de 360,5533
mm.
El rango es una medida de dispersión absoluta que expresa la diferencia entre los valores
extremos que toma la variable (valores máximos y mínimos), el rango no muestra bien el grado
de dispersión de los datos porque son datos heterogéneos y el rango es una medida no
robusta que se ve afectada por los valores extremos, existentes en las tablas anteriores. En el
caso de Sevilla el rango toma el valor de 633,60 mm, y en el caso de Granada el valor de
447,80 mm.
La varianza es la media de las desviaciones elevado al cuadrado con respecto a la media, en
estos casos la varianza toma unos valores en Sevilla de 31483,823 y en Granada 12011,130.

2
La desviación típica es la diferencia entre cada valor de la variable y una medida de tendencia
central, que normalmente es la media. En estos casos toma unos valores de 177,43681 mm en
Sevilla y de 109,59530 mm en Granada de desviación respecto a la media.

En segundo lugar analizaremos las temperaturas medias anuales de cada estación mediante la
opción Analizarestadísticos descriptivosdescriptivos

Estadísticos descriptivos Estadísticos descriptivos

Temperaturas Temperaturas
medias anuales N válido (según medias anuales N válido (según
Sevilla lista) Granada lista)

N Estadístico 30 30 N Estadístico 31 31

Rango Estadístico 3,06 Rango Estadístico 3,16

Mínimo Estadístico 17,23 Mínimo Estadístico 13,90

Má ximo Estadístico 20,29 Má ximo Estadístico 17,06

Media Estadístico 18,5683 Media Estadístico 15,1876

Desv. típ. Estadístico ,76704 Desv. típ. Estadístico ,75604

Varianza Estadístico ,588 Varianza Estadístico ,572

Asimetría Estadístico ,425 Asimetría Estadístico ,384

Error típico ,427 Error típico ,421

Curtosis Estadístico -,499 Curtosis Estadístico -,104

Error típico ,833 Error típico ,821

Con respecto a N nos indica de nuevo el tamaño de la muestra igual al número de


observaciones, que en el caso de Sevilla N=30 mientras que Granada dispone de una
observación más, N=31.
El máximo en las temperaturas medias anuales en Sevilla es de 20,29 ºC, es decir el año en el
que la media de las temperaturas mensuales de cada año es mayor, siendo este año 1995;
mientras que en Granada es menor, siendo 17,06 ºC en el año de 1987.
El mínimo de temperatura media anual en Sevilla, siendo esta la temperatura más baja entre el
resultado de la media de la media mensual en cada año, de 17,23 ºC en el año 1972; y en
Granada esta temperatura media mínima anual es de 13,90 ºC en el año 1972 también.
Con respecto a la media, como hemos indicado en el caso de las precipitaciones, nos indica la
suma de valores que toma la variable entre el número de observaciones, y es la medida de
tendencia central más común. En el caso de Sevilla muestra una media de 18,5683 ºC,
mientras que en el caso de Granada la media es de 15, 1876 ºC.
Con respecto al rango en el caso de las temperaturas, muestra mejor el grado de dispersión de
los valores que toma la variable porque estos valores son datos más homogéneos. En el caso
de Sevilla el rango es de 3,06 ºC, y en el caso de Granada es de 3,16 ºC.
La varianza es la media de las desviaciones elevado al cuadrado con respecto a la media, en
estos casos la varianza toma unos valores en Sevilla de 0,588 y en Granada 0,572.
La desviación típica en Sevilla con respecto a las temperaturas es de 0,76704 ºC y en Granada
0,75604 ºC con respecto a la media.

3
Ahora vamos a calcular los cuartiles que queramos, los percentiles, la mediana y la moda,
mediante la opción Analizar Estadísticos descriptivos  Frecuencias para cada una de las
variables y de las estaciones anteriores. Comenzaremos con las precipitaciones.
Estadísticos
Precipitaciones totales anuales Sevilla

N Válidos 30

Perdidos 0
Mediana 507,2500
a
Moda 307,00
Percentiles 10 327,0200

20 372,3800

25 401,3750

30 413,5300

40 448,1600

50 507,2500

60 546,0200

70 607,0400

75 638,0000

80 704,1000

90 811,6900

a. Existen varias modas. Se mostrará el


menor de los valores.

El primer cuartil coincide con el percentil 25, quiere decir que el 25% de los valores se
encuentran por debajo de 401,3750 mm y el 75% de los valores se encuentran en por encima
de este valor. El segundo cuartil coincide con el percentil 50 y con la mediana, quiere decir que
el 50% de los valores se encuentran por debajo de 507,25 mm y el 50% restante tiene valores
por encima de 507,25 mm. El tercer cuartil coincide con el percentil 75, significa que el 75% de
los valores se encuentran por debajo de 638 mm y el 25%de esos valores están por debajo de
638 mm.
El percentil 10 indica que el 10% de los valores son inferiores a 327,02 mm, mientras que el
90% de los valores se encuentran por encima. Y el percentil 90 indica que el 90% de los valores
se encuentran por debajo de 811,69 mm y el 10% restante está por encima
La curva del histograma es una curva asimétrica, presenta asimetría a la izquierda donde los
valores se concentran en los tres primeros intervalos, entre 300 y 600 mm, su asimetría es de
0,746. Y con respecto al apuntamiento, es una curva leptocúrtica donde los valores se
encuentran apuntados.
La mediana nos expresa el valor de la variable que ocupa la posición central, es decir,
suponiendo que la distribución esta ordenada de mayor a menor, el valor de la variable que
deja a su izquierda y a su derecha la misma frecuencia de observaciones. En este caso la
mediana es de 507,25 mm. Cuanto más cerca estén la media de la mediana más representativa
es la media, en este caso la media es bastante representativa comparándola con la mediana.
La moda, siendo el valor que más se repite de la variable, en este caso, según nos indica la
curva, se encuentra en el intervalo de 500-600 mm, la moda sería de 550 mm.

4
Estadísticos
Precipitaciones totales anuales Granada

N Válidos 30

Perdidos 1
Mediana 353,1000
Moda 213,90 a
Percentiles 10 233,4100

20 246,9000

25 277,4250

30 288,7300

40 319,8200

50 353,1000

60 382,8000

70 388,1800

75 399,1750

80 435,6200

90 511,4100

a. Existen varias modas. Se mostrará el


menor de los valores.

La mediana es de 353,1 mm, se acerca aún más a la media que en el caso anterior por lo que la
media de las precipitaciones totales anuales de Granada es muy representativa de la realidad,
comparándola con la mediana.
Nos indica esta tabla que existe un valor perdido en los datos, pues en el último de los años
hace referencia a las temperaturas medias pero no existen datos de las precipitaciones.
La curva del histograma es asimétrica la izquierda, por lo que los valores de la variable se
acumulan en los intervalos de la izquierda. Es una curva mesocúrtica, presenta menor
apuntamiento que la del histograma anterior. La moda se observa más claramente en este
gráfico, concretamente la moda es la marca de clase del intervalo entre los valores 350-400
mm, es decir la moda es 375 mm.
El percentil 10 nos indica que el 10% de los valores de la variable se encuentran por debajo de
233,41 mm, mientras que el 90% se encuentra por encima. El percentil 90 indica que el 90% de
los valores se encuentran por debajo de 511,41 mm, y el 10% restante está por debajo.
Los cuartiles dividen la distribución en cuatro partes, el primer cuartil nos dice que el 25% de
los datos están por debajo de 277,425 mm, y el 75% está por encima de este valor. El 50% de
los valores se encuentran por debajo de 353,1 mm y el otro 50% por encima, según el segundo
cuartil. El tercer cuartil indica que el 75% de los datos están por debajo de 399,175 mm, y el
25% restante está por encima de este valor.

5
Continuaremos analizando las temperaturas medias de
las dos estaciones.

Estadísticos
Temperaturas medias anuales Granada

N Válidos 31

Perdidos 0
Mediana 15,1025
Moda 13,90 a
Percentiles 10 14,2094

20 14,5196

25 14,5708

30 14,7396

40 14,8376

50 15,1025

60 15,5552

70 15,6283

75 15,7604

80 15,7696

90 16,1153

a. Existen varias modas. Se mostrará el


menor de los valores.

La mediana y la media son muy cercanas, así podemos ver que la media es representativa
comparándola con la mediana. La mediana es de 15,1025 ºC, lo que indica que la mitad de los
valores se encuentran por debajo de estos grados y la otra mitad por encima.
El percentil 10 indica que el 10% de los valores se encuentran por debajo de 14,2094 ºC,
mientras que el 90% de los valores están por encima. El percentil 90 indica como el 90% de los
valores están por debajo de 16,1153 ºC, mientras que el 10% es superior.
El primer cuartil explica que el 25% de los valores están por debajo de 14,5708 ºC mientras que
el 75% está por encima. El segundo cuartil indica lo mismo que la mediana. Y el te rcer cuartil
dice que el 25% de los valores están por encima de 15,7696 ºC y el 75% de los valores está por
debajo de estos grados.
La curva del histograma es bastante simétrica, con una asimetría de 0,384, acercándose más al
cero, y a la simetría perfecta, esto indica que la media, la mediana y la moda se encuentran
cercanas. Presenta un apuntamiento o curtosis de -0,104, sus valores se encuentran muy
apuntados, presenta una curva leptocúrtica.

6
Estadísticos
Temperaturas medias anuales Sevilla

N Válidos 30

Perdidos 0
Mediana 18,5021
Moda 17,23 a
Percentiles 10 17,7740

20 17,9128

25 17,9641

30 18,0573

40 18,1733

50 18,5021

60 18,6715

70 18,9138

75 19,3056

80 19,4099

90 19,5745

a. Existen varias modas. Se mostrará el


menor de los valores.

La mediana y la media se encuentran muy aproximadas, lo que garantiza la representatividad


de la media. La mediana es de 18,5021 ºC, lo que indica que el 50%delos valores de la variable
se encuentran por debajo de esta temperatura y el otro 50% de los valores se encue ntran por
encima.
El primer cuartil indica que el 25% de los valores se encuentran por debajo de 17,9641 ºC, y el
75% restante se encuentra por encima. El segundo cuartil expresa lo mismo que la mediana. El
tercer cuartil indica que el 75% de los valores están por debajo de 19,3056 ºC y el 25% por
encima.
El percentil 10 quiere decir que el 10% de los valores de la variable se encuentran por debajo
de 17,7740 ºC y el 90% por encima de este. Y el percentil 90 no indica que el 10% de los
valores están por encima de 19,5745 ºC y el 90% de los valores está por debajo de esta
temperatura.
La curva presenta una asimetría de 0,425, asimetría positiva, con un apuntamiento o curtosis
de -0,499, valores apuntados plasmando así una curva leptocúrtica.

7
Podemos utilizar también la opción AnalizarEstadísticos descriptivos Explorar.
Está pensada para un primer examen de nuestros datos, que pueda mostrarnos la existencia
de casos atípicos, discontinuidades en los datos o alguna otra peculiaridad. Este procedimiento
te señala los cinco casos extremos por arriba y por abajo, lo que permite identificarlos para un
examen más detallado, es muy interesante cuando el número de observaciones es mayor a 12.

Primero analizaremos las precipitaciones.


Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Precipitaciones totales 30 100,0% 0 ,0% 30 100,0%


anuales Sevilla

Valores extremos

Número del
caso Valor

Precipitaciones totales Ma yores 1 19 940,60


anuales Sevilla 2 26 896,80

3 17 812,10

4 6 808,00

5 2 765,30

Menores 1 11 307,00

2 23 316,80

3 24 326,90

4 4 328,10

5 3 354,70

8
En el gráfico de caja y bigotes podemos observar a simple vista la asimetría y la poca dispersión
de los datos, observamos que el valor más grande y más pequeño no llega a ser atípico, la caja
contiene el 50% de los casos centrales. Podemos ver también el valor del percentil 75 o el
tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites superior e inferior de
la caja.

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Precipitaciones totales 30 96,8% 1 3,2% 31 100,0%


anuales Granada

Valores extremos

Número del
caso Valor

Precipitaciones totales Ma yores 1 26 661,70


anuales Granada 2 27 582,30

3 9 512,00

4 2 506,10

5 6 500,60

Menores 1 23 213,90

2 25 226,70

3 24 232,50

4 4 241,60

5 28 244,80

9
En este gráfico de caja y bigotes observamos la asimetría, podemos ver también el valor del
percentil 75 o el tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites
superior e inferior de la caja. Destaca la presencia de un caso atípico alejado más de 1,5
longitudes de la caja, del percentil 75, siendo este valor el número 27 que es 582,30 mm.
Observamos también un caso extremo alejado más de 3 longitudes de la caja, del tercer
cuartil, el valor 26 que es 661,7 mm.

Ahora analizaremos las temperaturas


Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Temperaturas medias 31 100,0% 0 ,0% 31 100,0%


anuales Granada

Valores extremos

Número del
caso Valor

Temperaturas medias Ma yores 1 17 17,06


anuales Granada 2 25 16,57

3 19 16,14

4 27 16,03

5 24 15,96

Menores 1 2 13,90

2 1 13,92

3 6 14,17

4 18 14,36

5 4 14,46

10
En el gráfico de caja y bigotes podemos observar a simple vista la asimetría y la poca dispersión
de los datos, observamos que el valor más grande y más pequeño no llega a ser atípico, la caja
contiene el 50% de los casos centrales. Podemos ver también el valor del percentil 75 o el
tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites superior e inferior de
la caja.

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Temperaturas medias 30 100,0% 0 ,0% 30 100,0%


anuales Sevilla

Valores extremos

Número del
caso Valor

Temperaturas medias Ma yores 1 25 20,29


anuales Sevilla 2 27 19,91

3 19 19,58

4 24 19,56

5 30 19,50

Menores 1 2 17,23

2 1 17,36

3 3 17,77

4 14 17,78

5 6 17,84

11
En el gráfico de caja y bigotes podemos observar a simple vista la asimetría y la poca dispersión
de los datos, observamos que el valor más grande y más pequeño no llega a ser atípico, la caja
contiene el 50% de los casos centrales. Podemos ver también el valor del percentil 75 o el
tercer cuartil y el valor del primer cuartil o el percentil 25, en los límites superior e inferior de
la caja.

COEFICIENTE DE CORRELACION DE PEARSON


Mide el grado o fuerza de asociación entre dos variables. Este coeficiente de correlación solo
se utiliza para datos cuantitativos, mide la magnitud de la relación lineal entre dos variables
cuantitativas. Con respecto a la metodología, para crear el diagrama de dispersión utilizamos la
opción GráficosGenerador de gráficos; para el cálculo del coeficiente de correlación de
Pearson utilizamos Analizar Correlaciones Bivariadas; y para el cálculo del análisis de
regresión Analizar Regresión Lineales.

En este diagrama observamos como la nube de puntos está totalmente dispersa, es una
relación casi nula.

12
Correlaciones

Precipitaciones Temperaturas
totales anuales medias anuales
Sevilla(mm) Sevilla(ºC)

Precipitaciones totales Correlación de Pearson 1 ,089


anuales Sevilla(mm) Sig. (bilateral) ,641

Suma de cuadrados y 913030,867 350,387


productos cruzados

Covarianza 31483,823 12,082

N 30 30
Temperaturas medias Correlación de Pearson ,089 1
anuales Sevilla(ºC) Sig. (bilateral) ,641

Suma de cuadrados y 350,387 17,062


productos cruzados

Covarianza 12,082 ,588

N 30 30

La covarianza es positiva lo que indica que cuando una variable crece o decrece la otra actúa
de la misma manera, tienen una relación directa, o la tendrían si no fuera el coeficiente y la
relación de las variables insignificante. El coeficiente de correlación de Pesaron es de 0,089,
podemos utilizar la escala Guilford para interpretarla, y según esta menos de 0,20 muestra una
correlación ligera, una relación casi insignificante entre las variables, una relación
prácticamente nula de las variables.

Resumen del modelo

Modelo R cuadrado Error típ. de la


R R cuadrado corregida estimación
a
di
1 ,089 ,008 -,028 ,77754

me

nsi

on

a. Variables predictoras: (Constante), Precipitaciones totales anuales


Sevilla(mm)

R cuadrado es la bondad del ajuste, el ajuste no es perfecto, tiene un valor de 0,008, los
valores observados se encuentran alejados de los valores estimados. El 0,8% es explicado por
la recta. Con respecto al Error típ. de la estimación daría cero si fuera perfecto, como no lo es su valor
es de 0,77754.

13
Coeficientes a

Modelo Coeficientes
Coeficientes no estandarizados tipificados

B Error típ. Beta t Sig.

1 (Constante) 18,363 ,459 40,032 ,000

Precipitaciones totales ,000 ,001 ,089 ,472 ,641


anuales Sevilla(mm)

a. Variable dependiente: Temperaturas medias anuales Sevilla(ºC)

Los coeficientes de regresión aparecen en la columna B. La ecuación sería: Y=18,363+0X

14
Una nube de puntos muy dispersa, la relación es dispersa y negativa, variables muy poco
relacionadas, casi nula la relación también.

Correlaciones

Precipitaciones Temperaturas
totales anuales medias anuales
Granada(mm) Granada(ºC)

Precipitaciones totales Correlación de Pearson 1 -,111


anuales Granada(mm) Sig. (bilateral) ,560

Suma de cuadrados y 348322,775 -270,681


productos cruzados

Covarianza 12011,130 -9,334

N 30 30
Temperaturas medias Correlación de Pearson -,111 1
anuales Granada(ºC) Sig. (bilateral) ,560

Suma de cuadrados y -270,681 17,148


productos cruzados

Covarianza -9,334 ,572

N 30 31

También tiene una covarianza positiva y directa. El coeficiente de correlación de Pearson es


negativo, -0,111, por lo tanto la relación también lo es y casi nula la relación, pues está el valor
muy cercano al cero.

Resumen del modelo

Modelo R cuadrado Error típ. de la


R R cuadrado corregida estimación
a
di
1 ,111 ,012 -,023 ,77776

me

nsi

on

a. Variables predictoras: (Constante), Precipitaciones totales anuales


Granada(mm)

R cuadrado es la bondad del ajuste, el ajuste no es perfecto, tiene un valor de 0,012, los
valores observados se encuentran alejados de los valores estimados. El 1,2% es explicado por
la recta. Con respecto al Error típ. de la estimación daría cero si fuera perfecto, como no lo es su valor
es de 0,77776.

15
a
Coeficientes

Modelo Coeficientes
Coeficientes no estandarizados tipificados

B Error típ. Beta t Sig.

1 (Constante) 15,468 ,496 31,191 ,000

Precipitaciones totales -,001 ,001 -,111 -,590 ,560


anuales Granada(mm)

a. Variable dependiente: Temperaturas medias anuales Granada(ºC)

Los coeficientes de regresión aparecen en la columna B. La ecuación sería: Y=15,468+ (-0,001)X

16