Está en la página 1de 15

Análisis de componentes principales

Para este análisis se utilizó la base de datos sobre la Participación de Empresas de Manufactura y Minería de la cual se
utilizaron las variables: totalmuj totalhom proartve totgadop totremun suesaobm consint suesaobh totinsum
perremun
Paso 2.-
Resumen de las variables escogidas donde se observan las estadísticas como media desviación estándar máximos y
mínimos para las 1234 observaciones

Analisis.- Hemos elegido varaibles cuantitativas las cuales son necesarias para las condiciones del analisis de
compornentes principales, vamos a revisar si estan correlacionadas o no
Paso 2.1 Matriz de correlaciones

Analisis.-Para el primer filtro se construyo la matriz de correlaciones, se comprovo que varaibles tienen
multicolinealidad es decir que tienen fuerte correlacion entre ellas, con más de unas variables, estas contendrán la
mayor información para el análisis de componentes principales. Procedemos a crear el vector .
Paso 3.- Creamos el vector
global xlist totalmuj totalhom proartve totgadop totremun suesaobm consint suesaobh totinsum perremun
Paso 4.- Analizamos el vector
Analisis.- Obtenemos las varaibles con mayores correlacionadas para lo cual ,afirmamos que variables son las que
contienen mayor información,procedemos con el analisis de collin.
Paso 5.- Analisis de Collin

Análisis. - Las variables que tengan su VIF mayor a 10 tienen multicolinealidad es decir que su covarianza es entre 3 a
más variables. Existen variables que tienen multicolinealidad por lo cual comprobamos que están aptas para el análisis
de componentes principales, procedemos hacer el análisis de factor test
Paso 6.- Prueba para factorizar la matriz Varianzas y Covarianzas o Correlaciones indica si se debe o no aplica
ACP
Análisis. - La determinant of the correlation matrix =0.00, por lo tanto es 0 es decir no están Inter correlacionas, por lo
cual , acepto h0 y rechazo h1, a una significancia del 5%.Ademas la KMO=0.752, lo que nos dice que es adecuado
aplicar el análisis de componentes principales.
Paso 7.-Estimación análisis de componentes principales
pca $xlist
Análisis. - Los componentes 1 y 2 capturan el 0,8664 de la información de las variables originales. Por lo que es
considerado alto porcentaje para poder analizar.
Paso 8.- Análisis gráfico
screeplot ,yline(1)

Análisis. -El gráfico indica el número de componentes y los valores propios. La línea indica los puntos superiores a la
línea de los componentes que se van a utilizar en el estudio. Para este análisis los componentes 1 y 2.
Paso 9.- Análisis de selección correcta de cp, seleccionar valores que superen el uno
Análisis. - Fueron selectas las componentes principales cuyo valor propio es mayor a la unidad, porque estas
concentran mayor información de las variables originales
Paso 10.-Crear nuevo vector, con los 2 componentes principales
global ncomp 2
pca $xlist, comp($ncomp)
Análisis. - Stata crea un vector con los dos componentes principales y brinda la descripción de cada uno de sus valores
propios
Paso 11.-Descartar los componentes que capturan menos del 30%
pca $xlist, comp($ncomp) blanks (0.30)
Análisis. – Se descartan las variables que tienen menos del 30%, pues no aportan con mayor información a la
componente. En este caso del componente 1 las variables. -totalmuj, suesaobm, totinsum. Del componente 2 las
variables. totalhom, totremun, suesaobm, suesaobh, totinsum, perremun.

Paso 12.-Grafico diagrama de sedimentación de las cargas y puntuación de las componentes principales.

Análisis. – La posición de cada punto en el gráfico representa el tamaño de partícula correspondiente, mientras que la
altura del punto indica la cantidad de partículas de ese tamaño en la muestra. En general, se puede utilizar este
comando para explorar visualmente la distribución de tamaños de partículas en una muestra de suelo, sedimento o
material particulado. Por tanto, las variables con sobre la línea son. - totalmuj, totinsum, suesaobm, perremun,
totalhom. Presentan las variables con mas varianza en los componentes 1 y 2.

Paso 13.-Grafico de cargas y puntuación


scoreplot,yline(0)xline(0)

Análisis. - Se utiliza comúnmente para visualizar la relación entre las variables. Los puntos en la gráfica representan
las observaciones en los datos y la posición de cada punto en el eje horizontal y vertical. Si un punto se encuentra en la
parte superior de la línea horizontal su valor es mayor a 0 y debajo de la línea, su valor es menor a 0. Si un punto se
encuentra a la derecha de la línea vertical en 0, su valor en la variable x es mayor a 0, y si se encuentra a la izquierda
de la línea, su valor es menor a 0.
Al analizar la gráfica en su conjunto, se puede ver la distribución de las observaciones en relación con los dos
componentes, la dirección y la fuerza de la relación entre ellas son superiores a cero, vertical y horizontalmente.
Existen variables fuera de esta zona que tienen poca relación a sus componentes.

Paso 14.-Rotacion ortogonal


biplot $xlist
Análisis. -. Se busca identificar patrones de asociación entre las variables y las observaciones. Las variables (totinsum,
proartve, consint, totgadop) se representan como vectores que se originan en el origen del sistema de coordenadas. La
dirección y longitud de los vectores indican la contribución de cada variable al primer componente principal, mientras
que la posición de las observaciones indica su relación con las variables. Por ejemplo, si dos variables tienen vectores
que apuntan en direcciones similares, esto indica una relación positiva entre las variables, por lo tanto, en el grafico no
se da este ejemplo es decir no hay relación positiva. Si dos observaciones están próximas en el biplot, esto indica que
comparten características similares, en nuestro grafico se logra ver que si tienen características similares.
rotate, varimax
Análisis. - Después de calcular los componentes principales, estos suelen estar correlacionados entre sí, lo que
dificulta la interpretación de los resultados. La rotación obtiene nuevos componentes principales que sean más fáciles
de interpretar y que expliquen una mayor cantidad de la varianza total. Simplificar la estructura de los componentes y
aumentar la claridad de la interpretación. Los componentes principales se transforman para que las variables que
contribuyen más a un componente estén más estrechamente relacionadas con ese componente y menos relacionadas
con otros componentes, esto da nuevos componentes principales que son más fácilmente interpretables y que explican
una mayor cantidad de la varianza total. En este caso la rotación realizo que el componente y capturar el 0,44 y el
componente dos 0,42 es decir han sido simplificados. Pero en relación a la componente de la matriz de lo rotación
tanto el componente 1 y componente 2 tienen mayor correlación que antes.
rotate,varimax blanks(0.3)
Análisis. -La opción "blanks(0.3)" se utiliza para establecer un umbral para los valores de carga factorial que se
consideran importantes. En particular, los valores de carga factorial que son menores que el valor de umbral
especificado se consideran "blancos" y se eliminan de la rotación. En este caso, se especifica un valor de 0.3, lo que
significa que las cargas factoriales que son menores que 0.3 se consideran blancas y se eliminan de la rotación. Por lo
cual en el compoente 1 se eliminan. - totalmuj, totalhom, suesaobm, totinsum, perremun. Y para el componente 2 se
eliminan. - proartve, totgadop, totremun, consint, suesaobm.

Grafico 15.-Rotación oblicua


rotate,promax
rotate,promax blanks(0.30)
*Paso 16.-Crear componentes principales
estat loadings

predict pcl pc2, score


pwcorr pc1 pc2,sig

También podría gustarte