Está en la página 1de 12

UNIVERSIDAD DE EL SALVADOR

FACULTAD MULTIDICIPLINARIA DE OCCIDENTE


DEPARTAMENTO DE MATEMÁTICAS
LICENCIATURA EN ESTADÍSTICA

SEMINARIO 1
LIC. JAIME ISAAC PEÑA

TEMA:
ANÁLISIS DE COMPONENTES PRINCIPALES

ALUMNO CARNET
OMAR ALBERTO ASENCIO RAMOS AR17058

SAN TA ANA, 19 DE MARZO DE 2021


Análisis de componentes principales en SPSS
Omar Alberto Asencio Ramos

19/3/2021
Contenido
1. Resumen.............................................................................................................................................4
2. Introducción........................................................................................................................................4
3. Análisis de componentes principales.............................................................................................5
3.1. Descripción de la base de datos...............................................................................................5
3.2. Objetivo......................................................................................................................................5
3.3. Desarrollo en SPSS...................................................................................................................6
3.3.1. Matriz de correlaciones....................................................................................................6
3.3.2 Estimación de los componentes principales..............................................................................6
3.3.3. ¿Es posible un análisis de ACP?................................................................................................6
3.3.4. KMO y prueba de Bartlett................................................................................................6
3.4. Matrices anti-imagen.....................................................................................................................7
3.5. Gráfico se sedimentación...............................................................................................................8
3.6. Varianza total explicada.................................................................................................................9
3.7. Matriz de componentes..................................................................................................................9
3.8. Comunalidades.............................................................................................................................10
3.9. Matriz de componenten...............................................................................................................10
3.10. Gráfico en el espacio de los factores...............................................................................................11
1. Resumen
Se presenta un análisis de una base de datos correspondiente a datos medidas sobre
100 madres y sus hijos recién nacidos en parto normal, sobre la cual se pretende reducir
la dimención de ésta, pero explicando mas del 80% de la variabilidad total. Esto
mediante la utilización de las técnicas vistas en clase y aplicando por supuesto la
estadística.

2. Introducción
Se tiene como objetivo realizar un análisis de una base de datos sobre medidas de 100
madres y sus hijos recién nacidos en parto normal, utilizando SPSS.
El procedimiento consistirá en un análisis inicial de la información, una selección de las
variables en estudio, seguido de una toma de decisiones con respecto a la elección del
número de componentes. Todas las decisiones seran justificadas.
3. Análisis de componentes principales

3.1. Descripción de la base de datos


La base de datos presenta 9 variables, cuyas observaciones corresponden a medidas
sobre 100 madres y sus hijos recién nacidos en parto normal, dichas observaciones
éstan disponibles en la base de datos princip.txt.

Las variables son:

 Peso de la madre (PESOM).


 Talla de la madre (TALLAM)
 Semanas de gestión (SEM)
 Presión arterial sistólica de la madre (PASM)
 Presión arterial distólica de la madre (PADM)
 Peso del recién nacido (PESOR)
 Talla del recién nacido (TALLAR)
 Perímetro torácico del recién nacido (PTR)
 Perímetro craneal del recién nacido (PCR)

3.2. Objetivo
Reducir la dimensión mediante la obtención de unas pocas variables sintéticas,
combinación de las originales, que puedan ser usadas en sustitución de éstas, con la
mínima pérdida de información, y que tengan sentido biológico
3.3. Desarrollo en SPSS
3.3.1. Matriz de correlaciones.

Se evidencia que el determinante tiene un valor de 6.359 E−05 , mismo que muy pequeño,
lo cual indica el grado de intercorrelación entre las variables es muy alto, que por los
fundamentos teóricos condición incial que se tiene que cumplir el análisis de
componentes principales.

3.3.2 Estimación de los componentes principales.


3.3.3. ¿Es posible un análisis de ACP?
Existen varios contrastes que pueden realizarse para llevar a cabo si el análisis de
componentes principales pueda realizarse, de igual manera si éste será significativo.
Para responder la interrogante, recurrimos a dos test, el primero es el test de esfericidad
de Bartlett y el segundo el KMO (Kaiser, Meyer, Olkin)
3.3.4. KMO y prueba de Bartlett

Test de Bartlett
H 0=Las variables no estáncorrelaciondas enla población
H 1=Las variables están correlaciondas en la población

como el p-valor o valor de significancia es igual a 0, aceptamos la hipótesis nula. Lo


cual significa que podremos usar el análisis de componentes principales.

3.4. Matrices anti-imagen

En la figura: 5, matrices anti-imagen, cuya formación esta hecha por los coeficientes de
correlación parcial entre cada par de variables cambiada de signo.
¿Importancia de la matriz anti-imagen ?
Los coeficientes presentes en matriz anti-imagen deben ser bajos para que las variables
compartan factores comunes.

¿Cuántos Componentes Principales?


Existen reglas para saber el número de componentes principales más adecuado a
conservar, observando el gráfico de los CP, el criterio de Kaiser y observar el
porcentaje de varianza explicada.

Gráfico de los CP

Para comenzar a responder la interrogante, se ha creado un gráfico, ver figura: 5, el cual


nos deja en evidencia que con tres componentes nos bastaría para explicar las 10
variables, ya que el grafo comienza a cambiar de forma a partir del componente 4, esto
de manera apriori. Es decir que de 10 variables experimentaremos una reducción de
dimensionalidad de más de 70 % con respecto a la dimensión inicial.

3.5. Gráfico se sedimentación


Criterio de Kaiser

Indica que hay que conservar los componentes principales cuyos valores propios son
mayores o iguales que la unidad. Se ve que solamente los tres primeros cumplen.

3.6. Varianza total explicada

La recomendación dada por profesionales (Nuestro docente en este caso), es que


explicar al menos un 80% de la variabilidad de los datos, será nuestra meta, nótese en
este caso figura: 6, que la componente 1 (PC1) explica el 45.831% de la variación, la
componente 2 (PC2) por su parte explica el 22.212% y por su parte la componente 3
(PC3) explica el 19.169% de la variación, si tomamos las tres como lo habíamos
anunciado antes, estaríamos explicando el 87.212% de la variación total, esto se
evidencia en la fila de la cumulative proportion (Proporción acumulada).

3.7. Matriz de componentes


La matriz de componentes nos permite asociar las variables a cada uno de los factores,
esto para poder saber que variablidad esta representado el factor.

En éste caso la variable peso de la madre, esta cargando más sobre el componente dos,
la talla de la madre carga sobre el componente tres, por suparte la semanas de gestación
tiene su mayor peso en el componente uno.

3.8. Comunalidades

Las comunalidades nos éstan reflejando la parte de variabilidad de cada variable


explicada por los factores. Vemos en éste caso que PESOM es explicada casi en su
totalidad, mientras que la variable PCR, es la menos explicada.

3.9. Matriz de componenten

La interpretación más relevante de la matriz de coeficientes de puntuación de


componente, radica en la más facil asociación de las variables alos componente.
3.10 Gráfico en el espacio de los factores.

Identificar y poder asociar las observaciones a los componentes principales se vuelve


más complicado el gráfico tridimencional, por ello seguidamente los haremos el gráfico
bidimencional.

Vemos el gráfico de los componentes 1 y componente dos.


Se muestra ahora el gráfico del componente 2 y componente 3.

Finalmente evidenciamos el gráfico del componente 2 y componente 3.

También podría gustarte