Tarea 3 - Seminario

UNIVERSIDAD DE EL SALVADOR
FACULTAD MULTIDICIPLINARIA DE OCCIDENTE

DEPARTAMENTO DE MATEMÁTICAS
LICENCIATURA EN ESTADÍSTICA
SEMINARIO 1
LIC. JAIME ISAAC PEÑA
TEMA:
ANÁLISIS DE COMPONENTES PRINCIPALES
ALUMNO CARNET
OMAR ALBERTO ASENCIO RAMOS AR17058
SAN TA ANA, 19 DE MARZO DE 2021

Análisis de componentes principales en SPSS
Omar Alberto Asencio Ramos
19/3/2021
Contenido
1. Resumen.............................................................................................................................................4
2. Introducción........................................................................................................................................4
3. Análisis de componentes principales.............................................................................................5
3.1. Descripción de la base de datos...............................................................................................5
3.2. Objetivo......................................................................................................................................5
3.3. Desarrollo en SPSS...................................................................................................................6
3.3.1. Matriz de correlaciones....................................................................................................6
3.3.2 Estimación de los componentes principales..............................................................................6
3.3.3. ¿Es posible un análisis de ACP?................................................................................................6
3.3.4. KMO y prueba de Bartlett................................................................................................6
3.4. Matrices anti-imagen.....................................................................................................................7
3.5. Gráfico se sedimentación...............................................................................................................8
3.6. Varianza total explicada.................................................................................................................9
3.7. Matriz de componentes..................................................................................................................9
3.8. Comunalidades.............................................................................................................................10
3.9. Matriz de componenten...............................................................................................................10
3.10. Gráfico en el espacio de los factores...............................................................................................11
1. Resumen
Se presenta un análisis de una base de datos correspondiente a datos medidas sobre
100 madres y sus hijos recién nacidos en parto normal, sobre la cual se pretende reducir
la dimención de ésta, pero explicando mas del 80% de la variabilidad total. Esto
mediante la utilización de las técnicas vistas en clase y aplicando por supuesto la
estadística.
2. Introducción
Se tiene como objetivo realizar un análisis de una base de datos sobre medidas de 100
madres y sus hijos recién nacidos en parto normal, utilizando SPSS.
El procedimiento consistirá en un análisis inicial de la información, una selección de las
variables en estudio, seguido de una toma de decisiones con respecto a la elección del
número de componentes. Todas las decisiones seran justificadas.
3. Análisis de componentes principales
3.1. Descripción de la base de datos

La base de datos presenta 9 variables, cuyas observaciones corresponden a medidas
sobre 100 madres y sus hijos recién nacidos en parto normal, dichas observaciones
éstan disponibles en la base de datos princip.txt.
Las variables son:
 Peso de la madre (PESOM).

 Talla de la madre (TALLAM)
 Semanas de gestión (SEM)
 Presión arterial sistólica de la madre (PASM)
 Presión arterial distólica de la madre (PADM)
 Peso del recién nacido (PESOR)
 Talla del recién nacido (TALLAR)
 Perímetro torácico del recién nacido (PTR)
 Perímetro craneal del recién nacido (PCR)
3.2. Objetivo
Reducir la dimensión mediante la obtención de unas pocas variables sintéticas,
combinación de las originales, que puedan ser usadas en sustitución de éstas, con la
mínima pérdida de información, y que tengan sentido biológico
3.3. Desarrollo en SPSS
3.3.1. Matriz de correlaciones.
Se evidencia que el determinante tiene un valor de 6.359 E−05 , mismo que muy pequeño,
lo cual indica el grado de intercorrelación entre las variables es muy alto, que por los
fundamentos teóricos condición incial que se tiene que cumplir el análisis de
componentes principales.
3.3.2 Estimación de los componentes principales.

3.3.3. ¿Es posible un análisis de ACP?
Existen varios contrastes que pueden realizarse para llevar a cabo si el análisis de
componentes principales pueda realizarse, de igual manera si éste será significativo.
Para responder la interrogante, recurrimos a dos test, el primero es el test de esfericidad
de Bartlett y el segundo el KMO (Kaiser, Meyer, Olkin)
3.3.4. KMO y prueba de Bartlett
Test de Bartlett
H 0=Las variables no estáncorrelaciondas enla población
H 1=Las variables están correlaciondas en la población
como el p-valor o valor de significancia es igual a 0, aceptamos la hipótesis nula. Lo

cual significa que podremos usar el análisis de componentes principales.
3.4. Matrices anti-imagen
En la figura: 5, matrices anti-imagen, cuya formación esta hecha por los coeficientes de
correlación parcial entre cada par de variables cambiada de signo.
¿Importancia de la matriz anti-imagen ?
Los coeficientes presentes en matriz anti-imagen deben ser bajos para que las variables
compartan factores comunes.
¿Cuántos Componentes Principales?

Existen reglas para saber el número de componentes principales más adecuado a
conservar, observando el gráfico de los CP, el criterio de Kaiser y observar el
porcentaje de varianza explicada.
Gráfico de los CP
Para comenzar a responder la interrogante, se ha creado un gráfico, ver figura: 5, el cual

nos deja en evidencia que con tres componentes nos bastaría para explicar las 10
variables, ya que el grafo comienza a cambiar de forma a partir del componente 4, esto
de manera apriori. Es decir que de 10 variables experimentaremos una reducción de
dimensionalidad de más de 70 % con respecto a la dimensión inicial.
3.5. Gráfico se sedimentación

Criterio de Kaiser
Indica que hay que conservar los componentes principales cuyos valores propios son
mayores o iguales que la unidad. Se ve que solamente los tres primeros cumplen.
3.6. Varianza total explicada
La recomendación dada por profesionales (Nuestro docente en este caso), es que

explicar al menos un 80% de la variabilidad de los datos, será nuestra meta, nótese en
este caso figura: 6, que la componente 1 (PC1) explica el 45.831% de la variación, la
componente 2 (PC2) por su parte explica el 22.212% y por su parte la componente 3
(PC3) explica el 19.169% de la variación, si tomamos las tres como lo habíamos
anunciado antes, estaríamos explicando el 87.212% de la variación total, esto se
evidencia en la fila de la cumulative proportion (Proporción acumulada).
3.7. Matriz de componentes

La matriz de componentes nos permite asociar las variables a cada uno de los factores,
esto para poder saber que variablidad esta representado el factor.
En éste caso la variable peso de la madre, esta cargando más sobre el componente dos,
la talla de la madre carga sobre el componente tres, por suparte la semanas de gestación
tiene su mayor peso en el componente uno.
3.8. Comunalidades
Las comunalidades nos éstan reflejando la parte de variabilidad de cada variable

explicada por los factores. Vemos en éste caso que PESOM es explicada casi en su
totalidad, mientras que la variable PCR, es la menos explicada.
3.9. Matriz de componenten
La interpretación más relevante de la matriz de coeficientes de puntuación de

componente, radica en la más facil asociación de las variables alos componente.
3.10 Gráfico en el espacio de los factores.
Identificar y poder asociar las observaciones a los componentes principales se vuelve

más complicado el gráfico tridimencional, por ello seguidamente los haremos el gráfico
bidimencional.
Vemos el gráfico de los componentes 1 y componente dos.

Se muestra ahora el gráfico del componente 2 y componente 3.
Finalmente evidenciamos el gráfico del componente 2 y componente 3.

Tarea 3 - Seminario

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea 3 - Seminario

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE EL SALVADOR

FACULTAD MULTIDICIPLINARIA DE OCCIDENTE

SAN TA ANA, 19 DE MARZO DE 2021

3.1. Descripción de la base de datos

Las variables son:

 Peso de la madre (PESOM).

3.3.2 Estimación de los componentes principales.

como el p-valor o valor de significancia es igual a 0, aceptamos la hipótesis nula. Lo

3.4. Matrices anti-imagen

¿Cuántos Componentes Principales?

Para comenzar a responder la interrogante, se ha creado un gráfico, ver figura: 5, el cual

3.5. Gráfico se sedimentación

3.6. Varianza total explicada

La recomendación dada por profesionales (Nuestro docente en este caso), es que

3.7. Matriz de componentes

Las comunalidades nos éstan reflejando la parte de variabilidad de cada variable

3.9. Matriz de componenten

La interpretación más relevante de la matriz de coeficientes de puntuación de

Identificar y poder asociar las observaciones a los componentes principales se vuelve

Vemos el gráfico de los componentes 1 y componente dos.

Finalmente evidenciamos el gráfico del componente 2 y componente 3.

También podría gustarte