Está en la página 1de 13

ECONOMETRÍA 09 PRACTICA 1: REPASO DE SPSS

1. ¿Cuántas variables hay en el fichero? ¿Y cuántas observaciones? ¿Qué representa cada


observación? Distingue entre variables cualitativas y cuantitativas.

El fichero contiene 26 variables (columnas) y 109 observaciones (filas). Cada observación


es un país. Todos los datos que están en una misma fila corresponden al mismo país.
Ejemplos de variables cualitativas: el nombre del país, el clima, la región económica.
Ejemplos de variables cuantitativas: la población, el PIB, tasa de natalidad.

2. Crea una nueva variable que contenga la población de los países en habitantes. Crea
una nueva variable que contenga el logaritmo neperiano del PIB per cápita de los
países. Observa en el fichero la aparición de las variables que has creado.

La creación de estas variables se realiza con Transformar Calcular.


La variable Población venía en miles de habitantes. Para pasar a habitantes bastará realizar
un cambio de escala: multiplicar por 1000 (con la calculadora que aparece en la ventana)
Para la variable PIB per capita utilizamos la función logaritmo neperiano (en el cuadro de
funciones que aparece en la ventana)

Una vez realizados estos procesos conviene verificar que han aparecido las dos nuevas
variables (columnas) en el archivo de datos.

3. Obtén una nueva variable que clasifique a los países en cuatro categorías según su
Población.
Valor Etiqueta
1 Menos de 5 millones de habitantes
2 Entre 5 y 10 millones de habitantes
3 Entre 10 y 30 millones de habitantes
4 Más de 30 millones de habitantes
Observa en el fichero la aparición de la variable que has creado.

Realizaremos una recodificación. Se trata de crear, a partir de una variable cuantitativa


como es la Población (en miles de habitantes), otra variable con solo 4 valores, de tipo
ordinal, que únicamente distinga cuatro grupos de países según su población (1 los más
pequeños, 2 intermedios, 3 grandes y 4 muy grandes)

Lo realizamos con Transformar Recodificar en distintas variables. Hemos de dar un nombre


a la nueva variable y entrar en Valores antiguos y nuevos, teniendo en cuenta que la
variable venía en miles:
Del menor hasta 5000 le asignamos el valor 1
De 5000 a 10000 le asignamos valor 2
De 10000 a 30000 le asignamos valor 3
De 30000 hasta el mayor le asignamos valor 4
Perdidos por el usuario o sistema le asignamos perdidos por el sistema (de modo que si
hubiera países de los que no se tiene el dato de población, se conserven igual)

Comprobamos que ha aparecido una nueva variable (columna) en el fichero con los valores
1, 2, 3 y 4.

4. Realiza un estudio descriptivo de la variable producto interior bruto (PIB) per cápita
para los países del fichero. Para ello, obtén el histograma y los principales estadísticos.

¿Qué forma tiene el histograma? ¿Qué conclusiones sacas del mismo?


¿Qué país tiene mayor PIB per cápita y qué valor toma?
¿Cuál es el menor y su valor?
¿Qué valor toma el PIB medio?
¿Y el PIB mediano?
¿Crees que el PIB medio es representativo? ¿Por qué?

Utilizamos Analizar Estadísticos descriptivos Frecuencias entrando en Estadísticos y en


Gráficos para solicitar la respuesta a las cuestiones planteadas. Obtenemos lo siguiente:

Estadísticos

Producto interior bruto per-capita


N Válidos 109
Perdidos 0
Media 5859,98
Mediana 2995,00
Moda 1500
Desv. típ. 6479,836
Varianza 4E+007
Asimetría 1,146
Error típ. de asimetría ,231
Mínimo 122
Máximo 23474
Histograma

50

40
Frecuencia

30

20

10

Media =5859,98
Desviación típica
0
=6479,836
0 5000 10000 15000 20000 25000 N =109
Producto interior bruto per-capita

El histograma es muy elocuente. La mayor parte de países poseen niveles bajos de PIB per
capita. La forma del histograma es marcadamente asimétrica hacia la derecha. Parece
observarse la existencia de distintas distribuciones separadas. Una para el grupo de países
más pobres, otra para los ricos, y por otra parte los dos países de mayor PIB per capita.

Observando la tabla, el menor valor de PIB es 122$ y el mayor 23474$. Para saber a qué
países corresponden ordenaremos el archivo: Datos Ordenar casos ordenar por la variable
PIB ascendente (de menor a mayor). Vemos en el archivo que el primer país es Etiopía
(122$) y el último EEUU (23474$)

Llama la atención la diferencia considerable entre el PIB medio (media aritmética de los
109 países), 5859,98$, y el PIB mediano (PIB central: 50% de países tienen un valor menor
y 50% valor mayor), 2995$, en consonancia con la asimetría antes mencionada. Todavía
menor es el PIB modal (más frecuente) que se sitúa entorno a 1500$, de acuerdo con la
gran proporción de países con nivel bajo de PIB.

La dispersión de la variable PIB es muy grande, existen grandes diferencias entre países. La
desviación típica es 6479,836$ superior a la media, lo que da un coeficiente de variación
(cociente entre desviación típica y media) superior a la unidad. La media es, en
consecuencia, poco representativa.
5. Obtén un diagrama de cajas de la variable PIB para cada categoría de países considerada
en el apartado 3.
¿En qué categoría se observa una distribución del PIB diferente del resto?
¿En qué consisten esas diferencias? Ayúdate de los estadísticos descriptivos obtenidos para
ese grupo.

Analizar Estadísticos descriptivos Explorar (dependiente: PIB, factor: la variable creada por
recodificación en el apartado 3)
Descriptivos

pobrec Estadístico Error típ.

Producto interior bruto per-capita 1 Media 6381,63 1037,946

Intervalo de confianza para la Límite inferior 4248,10

media al 95%
Límite superior 8515,16

Media recortada al 5% 6091,38

Mediana 5487,00

Varianza 2,909E7

Desv. típ. 5393,327

Mínimo 351

Máximo 17755

Rango 17404

Amplitud intercuartil 5844

Asimetría ,844 ,448

Curtosis -,371 ,872

2 Media 6129,04 1526,049

Intervalo de confianza para la Límite inferior 2972,17

media al 95%
Límite superior 9285,91

Media recortada al 5% 5591,38

Mediana 1813,00

Varianza 5,589E7

Desv. típ. 7476,082

Mínimo 208

Máximo 22384

Rango 22176

Amplitud intercuartil 13635

Asimetría 1,019 ,472

Curtosis -,623 ,918

3 Media 5092,41 1088,196

Intervalo de confianza para la Límite inferior 2863,35

media al 95%
Límite superior 7321,48
La caja que se distingue más del resto es la correspondiente al grupo 2 (países entre 5 y 10
millones de habitantes). Los límites inferior y superior de las cajas son los cuartiles Q1 y
Q3 (valores del PIB que separan el 25% inferior y el 25% superior, respectivamente, del
resto). La caja 2 es más larga que las demás ya que su amplitud intercuartílica, 13635$, es
muy superior al resto: la dispersión del PIB en el 50% central de países de ese grupo es
mayor que en el resto de grupos. La mediana (línea horizontal en la caja) está muy
desplazada hacia abajo, lo que indica mucha distancia entre la mediana y el tercer cuartil y
muy poca distancia entre la mediana y el primer cuartil, hay gran asimetría en este grupo.
En los grupos 1, 3 y 4, a diferencia del grupo 2, hay países extremos que no siguen la tónica
general de su grupo: el 50% central está más compacto (caja más corta) con unos pocos
países excepcionales (con un PIB mucho mayor)
En todos los grupos hay países con valores de PIB altos y bajos: las medias no difieren
mucho en los cuatro grupos.

6. Obtén una nueva variable que clasifique los países en cuatro categorías según su
PIB per cápita.
Valor Etiqueta
1 Menos de 1000 dólares per cápita
2 Entre 1000 y 3000 dólares per cápita
3 Entre 3000 y 8000 dólares per cápita
4 Más de 8000 dólares per cápita
Se realiza igual que el apartado 3. Cuando se van a realizar varias recodificaciones en la
misma sesión, en la segunda y sucesivas veces se debe utilizar la opción Restablecer

7. Obtén la tabla de contingencia entre la variable obtenida en el punto 3 y la variable


obtenida en el punto 6.
Examinando la tabla y comparando las frecuencias observadas y esperadas ¿dirías que
existe asociación entre la población y el PIB de los países? ¿Por qué?
¿Cuál es el resultado del test de independencia?
Analizar Estadísticos descriptivos Tabla de contingencia (por ejemplo: en filas la variable
que indica el grupo de población y en columnas la variable que indica grupo de PIB)

Tabla de contingencia pobrec * pibrec

pibrec

1 2 3 4 Total

pobrec 1 Recuento 4 5 12 6 27

Frecuencia esperada 6,9 6,9 6,7 6,4 27,0

2 Recuento 8 6 3 7 24

Frecuencia esperada 6,2 6,2 5,9 5,7 24,0

3 Recuento 6 12 5 6 29

Frecuencia esperada 7,4 7,4 7,2 6,9 29,0

4 Recuento 10 5 7 7 29

Frecuencia esperada 7,4 7,4 7,2 6,9 29,0

Total Recuento 28 28 27 26 109

Frecuencia esperada 28,0 28,0 27,0 26,0 109,0

Pruebas de chi-cuadrado

Sig. asintótica

Valor gl (bilateral)

Chi-cuadrado de Pearson 13,857a 9 ,128

Razón de verosimilitudes 13,279 9 ,150

Asociación lineal por lineal 1,307 1 ,253

N de casos válidos 109

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada

es 5,72.
Pretendemos saber si existe relación entre la población y el PIB, utilizando las variables
recodificadas. Observando la tabla de contingencia, no parece haber diferencias muy
acusadas entre las frecuencias observadas y las esperadas, lo que parece indicar que no
existe relación. Para asegurarnos, realizamos el test de independencia
Ho: la población y el PIB son independientes
El estadístico del test es 13´857 con un p-valor 0´128>0´05 por tanto NO SE RECHAZA la
hipótesis. No se detecta asociación entre estas dos variables.
Habrá países grandes ricos, grandes pobres, pequeños ricos, pequeños pobres.

8. Según lo visto en el punto anterior, crees que existirá dependencia lineal entre las
variables cuantitativas población y PIB per cápita.
Obtén el diagrama de puntos y el coeficiente de correlación lineal entre ambas
variables y coméntalos.

De acuerdo con lo anterior no parece que exista tal dependencia. Ahora utilizamos las
variables originales sin recodificar (cuantitativas) Para ver el diagrama de puntos: Gráficos
Cuadros de dialogo antiguos Dispersión/Puntos Simple (una variable en cada eje)

25000
Estados Unidos
Suiza
Producto interior bruto per-capita

Canadá Japón
20000
Austria
Francia

Italia
Suecia
15000 Gran Bretaña
Nueva Zelanda

10000 Portugal

Taiwan Rusia

5000 Polonia
Turquía
Iraq Tailandia
India China
0 Vietnam
Uganda

0 250000 500000 750000 1000000 1250000

Población en miles

No se observa tendencia lineal creciente ni decreciente. No hay dependencia lineal.


En cuanto al coeficiente de correlación: Analizar Correlaciones bivariadas (introducir las
dos variables)

Correlaciones

Producto
Población interior bruto
en miles per-capita
Población en miles Correlación de Pearson 1 -,087
Sig. (bilateral) ,370
N 109 109
Producto interior Correlación de Pearson -,087 1
bruto per-capita Sig. (bilateral) ,370
N 109 109

El coeficiente es -0,087 muy próximo a cero: ausencia de dependencia lineal entre las
variables.
Este análisis realizado con las variables cuantitativas Población y PIB indica lo mismo que
el del punto anterior (realizado con cualitativas): ausencia de relación entre las dos
variables.

9. Obtén el diagrama de puntos y el coeficiente de correlación lineal entre tasa de


mortalidad infantil y esperanza de vida femenina y coméntalos.
Correlaciones

Mortalidad infantil

Esperanza de vida (muertes por 1000

femenina nacimientos vivos)

Esperanza de vida femenina Correlación de Pearson 1 -,962**

Sig. (bilateral) ,000

N 109 109

Mortalidad infantil (muertes por 1000 Correlación de Pearson -,962** 1

nacimientos vivos)
Sig. (bilateral) ,000

N 109 109

**. La correlación es significativa al nivel 0,01 (bilateral).

A diferencia del punto 8, ahora las variables consideradas muestran una fuerte relación
lineal de tipo decreciente. A mayor mortalidad infantil, menor esperanza de vida femenina.

10. Efectúa un análisis de regresión simple por MCO tomando como variable
dependiente la esperanza de vida femenina y como explicativa la mortalidad infantil.
Escribe la recta de la ecuación obtenida:
¿La esperanza de vida femenina está bien explicada por el comportamiento de la mortalidad
infantil?
Para un país cuya mortalidad infantil fuera de 10 muertes por 1000 nacidos vivos, ¿cuál
será la esperanza de vida femenina prevista para ese país?

Con Analizar Regresión Lineales Variable dependiente Esperanza de Vida femenina,


variable independiente Mortalidad infantil

Resumen del modelo

Error típ. de la

Modelo R R cuadrado R cuadrado corregida estimación

1 ,962a ,926 ,925 2,898

a. Variables predictoras: (Constante), Mortalidad infantil (muertes por 1000 nacimientos vivos)
Coeficientesa

Coeficientes

Coeficientes no estandarizados tipificados

Modelo B Error típ. Beta t Sig.

1 (Constante) 81,457 ,416 195,777 ,000

Mortalidad infantil (muertes por -,267 ,007 -,962 -36,466 ,000

1000 nacimientos vivos)

a. Variable dependiente: Esperanza de vida femenina

La recta: Y* (esperanza de vida femenina) = 81´457 – 0´267 X (mortalidad infantil). Al


fallecer un niño más (por cada mil nacidos), la esperanza de vida femenina disminuye
en 0´267 años (según la recta estimada)
R2 = 0´926 la esperanza de vida está muy bien explicada (casi 93%) por la mortalidad
infantil.

Para X=10 (10 fallecidos por cada mil nacidos) , se estima que Y= 78´79 años (esperanza
de vida femenina)

11. Si deseamos tomar una decisión acerca de si el PIB medio de todos los países del
mundo es igual a 7000 dólares, ¿qué contraste plantearías?

Utilizamos ahora la muestra para realizar un contraste cuya hipótesis es que el PIB medio
mundial es 7000$
Analizar Comparar medias Prueba T para una muestra (introducimos la variable PIB y el
valor de prueba 7000)

Prueba para una muestra

Valor de prueba = 7000


95% Intervalo de
confianza para la
Diferencia diferencia
t gl Sig. (bilateral) de medias Inferior Superior
Producto interior
-1,837 108 ,069 -1140,018 -2370,27 90,23
bruto per-capita

Como el p-valor 0,069 es superior a 0,05, nada se opone al valor 7000 de la hipótesis. No se
rechaza.
12. Si deseamos tomar una decisión acerca de si el PIB medio es igual en los países de
menos de 5 millones de habitantes al PIB medio de los países de más de 30 millones
de habitantes, ¿qué contraste platearías? Resuélvelo con SPSS.

Volvemos a analizar las variables población y PIB. Ahora, mediante un contraste de


igualdad de medias.
Realizaremos un contraste cuya hipótesis es igualdad de medias (PIB medios iguales en los
países de menor y mayor población). Analizar Comparar medias prueba T para muestras
independientes. Introducimos la variable PIB y como variable de agrupación la obtenida en
el apartado 3 por recodificación. Los grupos a comparar son el 1 y el 4.

Prueba de muestras independientes

Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error típ. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferencia Inferior Superior
Producto interior Se han asumido
2,954 ,091 ,267 54 ,790 462,423 1730,634 -3007,290 3932,136
bruto per-capita varianzas iguales
No se han asumido
,270 51,332 ,788 462,423 1711,994 -2974,009 3898,855
varianzas iguales

El p-valor 0,79 mayor que 0,05 nos indica que nada se opone a considerar iguales ambas
medias. No se rechaza la hipótesis. Hemos leído la línea de “se han asumido varianzas
iguales” ya que la prueba de Levene da un p-valor 0,091 mayor que 0,05.

Este resultado está en consonancia con un comentario anterior (punto 5) en el que no


apreciábamos grandes diferencias en los PIB medios según tamaño de población.

13. Si deseamos tomar una decisión acerca de si el PIB medio es igual en las cuatro
categorías consideradas en el punto 3, ¿qué contraste plantearías?

En este caso la hipótesis es la igualdad de medias (PIB medios iguales) en las cuatro
categorías de países según población. Se realiza un ANOVA (análisis de varianza)
Analizar Comparar medias ANOVA de un factor (introducimos la variable PIB y el factor
variable recodificada creada en el apartado 3)

ANOVA

Producto interior bruto per-capita


Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 26271960,9 3 8757320,3 ,204 ,893
Intra-grupos 4,51E+009 105 42937729
Total 4,53E+009 108
El p-valor 0,893 (mayor que 0,05) nos indica que nada se opone a considerar las medias
iguales. No se rechaza la hipótesis.

De nuevo el resultado es el esperado ya que no se apreciaban diferencias en las medias de


los países de la muestra según tamaño.

También podría gustarte