Está en la página 1de 12

ANÁLISIS ESTADÍSTICO MULTIVARIANTE Grupo 1

ANÁLISIS FACTORIAL

Introducción
En esta práctica vamos a hacer un análisis factorial utilizando SPSS. Para ello, hemos sacado los datos
de la base de datos del banco mundial hasta 2019. Dentro de estos datos, hemos escogido 7 variables,
las cuales vamos a analizar detalladamente utilizando el análisis factorial mencionado anteriormente.
El análisis factorial es una técnica estadística de reducción de datos usada para explicar las
correlaciones entre las variables observadas en términos de un número menor de variables no
observadas llamadas factores. Las variables observadas se modelan como combinaciones lineales de
factores más expresiones de error.
El objetivo principal de esta práctica es hallar la comunalidad entre las variables. Cuanto mayor sea
esta comunalidad, mejor. En este análisis nos interesan las covarianzas (porque lo importante es la
parte común). El modelo factorial es: X= Λ*f + e, donde “x”, “f” y “e” son vectores y Λes la matriz
de carga asociada a los factores comunes.

Análisis
Tras un análisis de componentes principales, hacemos el análisis factorial.

Hemos realizado los estadísticos descriptivos principales de las variables a analizar. Como se puede
observar, destaca la variable “Exportaciones de bienes y servicios (% anual de crecimiento)” con una
media de 11.5376 y una desviación típica de 104.76805. Esta desviación típica tan grande indica que
tiene una dispersión mayor al resto de las variables.
Matriz de correlaciones

GDP Imports of General Exports of Households Adjusted net Inflation,


growth goods and government goods and and NPISHs national consumer prices
(annual services final services Final income (annual %)
%) (annual % consumption (annual % consumption (annual %
growth) expenditure growth) expenditure growth)
(annual % (annual %
growth) growth)

GDP growth 1 0.495 0.385 0.503 0.555 0.745 -0.292


(annual %)

Imports of goods 1 0.301 0.222 0.446 0.372 -0.391


and services
(annual %
growth)

General 1 -0.004 0.209 0.416 -0.162


government final
consumption
expenditure
(annual %
growth)

Exports of goods 1 0.051 0.608 -0.043


and services
(annual %
growth)

Households and 1 0.416 -0.482


NPISHs Final
consumption
expenditure
(annual %
growth)

Adjusted net 1 -0.168


national income
(annual %
growth)

Inflation, 1
consumer prices
(annual %)

Esta tabla muestra las correlaciones entre las variables representadas en una matriz de correlaciones
simétrica. La diagonal principal está compuesta por 1 ya que es la correlación de una variable consigo
misma y esto hace una correlación perfecta e igual a 1. Hemos destacado en azul aquellas covarianzas
que son mayores a 0.25 en valor absoluto. Las que más destacan son la covarianza del crecimiento del
PIB con el ingreso nacional neto ajustado (con una covarianza de 0.745) y la covarianza entre
exportaciones de bienes y servicios con el ingreso nacional neto ajustado (siendo esta de 0.608), esto
significa que son las variables con una mayor comunalidad, es decir, que se explican mejor
mutuamente.
Le hemos pedido a SPSS que nos saque la prueba de Kaiser-Meyer-Olkin. Esta prueba indica la
proporción de varianza en las variables que pueden ser causadas por factores subyacentes. Cuanto
mayor sea la prueba de KMO y Bartlett, más aceptable es. Empiezan a ser aceptables a partir del 0.6.
Como se puede observar, la prueba de nuestras variables es de aproximadamente 0.7, con lo que es
aceptable.

Esta tabla muestra las comunalidades de las variables. Cuanto mayor sea la comunalidad, mejor
explicada estará la variable con lo cual mejor será su interpretación. La variable con mayor
comunalidad es el ingreso nacional neto ajustado, seguida por la variable exportaciones de bienes y
servicios.
Siguiendo los datos de esta tabla que muestra la varianza total explicada de las variables, escogemos
el número de factores con los que nos quedamos para interpretar las variables. Hemos escogido 3
factores porque la varianza total acumulada es de casi el 80% y los landas superiores o muy cercanos
a 1.

La matriz factorial muestra la relación que hay entre los factores y las variables, como es difícil la
interpretación a través de esta matriz, realizamos la rotación factorial. Existen dos tipos de rotación
factorial: ortogonal y oblicua. La rotación factorial pretende seleccionar la solución más sencilla e
interpretable. La rotación factorial se basa en girar los ejes de coordenadas hasta lograr que se
aproxime al máximo a las variables en que están saturadas.
Este método de rotación es el ortogonal, también llamado como “varimax con normalización Kaiser”.
Esta rotación consiste en rotar los factores con un ángulo concreto de 90º entre ellos. El primer factor
explica las variables “Crecimiento del PIB”, “Exportaciones de bienes y servicios” y “Ingreso
nacional neto ajustado”, ya que el valor supera el 0.5. El segundo factor explica las variables
“Importación de bienes y servicios” , “Gasto en Consumo final de los hogares e instituciones sin
ánimo de lucro” e “Inflación”. Por último, el tercer factor explica la variable de “Gasto en consumo
final de las administraciones públicas”.
Al factor 1, le vamos a denominar “Crecimiento neto del país”, al segundo factor “Gasto en
consumo” y al tercer factor “Gasto en consumo final de las administraciones públicas”.
Este método de rotación es el oblicuo, “oblimin con normalización Kaiser”, esta rotación consiste en
rotar los factores con un ángulo distinto a 90º entre ellos. La matriz de patrón muestra la contribución
neta de cada variable en cada factor (las saturaciones de las variables en los factores de la solución
rotada).

La matriz de estructura muestra las correlaciones de las variables con los factores de la matriz rotada.
A mayor sea la correlación entre las variables y los factores, mayor es la dificultad en la interpretación
de estas.

A la vista de estas dos tablas, hemos decidido quedarnos con la rotación ortogonal ya que las
correlaciones entre los factores y las variables son menores.
Este gráfico relaciona el factor 1 (Crecimiento neto del país) con el factor 2 (gasto en consumo).
Como podemos observar la mayoría de países se encuentran dentro de la nube de puntos (valores
similares entre ellos), mientras que destacan Timor-Leste, Etiopía y Zimbabue, siendo estos valores
atípicos que podrían distorsionar el gráfico. Es por ello, por lo que hemos decidido eliminar estos
valores atípicos y realizar el gráfico de nuevo.
Este gráfico relaciona el factor 1 (Crecimiento neto del país) con el factor 3 (Gasto en consumo final
de las administraciones públicas). En este gráfico también se pueden observar valores atípicos que
distorsión levemente la gráfica. Estos son: Irak, Etiopía, República del Congo, Sudán, Zimbabue y
Ruanda. También quitaremos estos atípicos.
Este gráfico explica el factor 2 (gasto en consumo) con el factor 3 (Gasto en consumo final de las
administraciones públicas). Al igual que en los dos gráficos anteriores, vamos a proceder a eliminar
los atípicos (Irak, Etiopía, Timor-Leste, Sudan Republica del Congo)para una mejor interpretación de
la gráfica.
En este gráfico donde relacionamos el factor 1 (Crecimiento neto del país) con el factor 2 (gasto en
consumo) hemos excluido los datos previamente detectados como atípicos (Timor-Leste, Etiopía y
Zimbabue). De nuevo, las variables pertenecientes al continente África y Asia son las que se
encuentran más desplazadas hacia los extremos del gráfico. Este resultado muestra la clara
descompensación de crecimiento y consumo en los países más subdesarrollados.
Este gráfico relaciona el factor 1 (Crecimiento neto del país) con el factor 3 (Gasto en consumo final
de las administraciones públicas) y los diferentes valores excluidos son Irak, Etiopía, República del
Congo, Sudán, Zimbabue y Ruanda. Otra vez los países de África y Asia destacan en el gráfico junto
con alguna minoría de países de Europa y América como Armenia y Haití.
Por último, en este gráfico que relaciona el factor 2 (gasto en consumo) con el factor 3 (Gasto en
consumo final de las administraciones públicas) y excluye Irak, Etiopía, Timor-Leste, Sudan y
Republica del Congo sigue el mismo patrón de comportamiento de los anteriores. Siendo países como
Irán los que presentan un mayor valor entre ambas variables.

También podría gustarte