Está en la página 1de 41

UNIVERSIDAD AUTNOMA TOMS FRAS

FACULTAD DE CIENCIAS PURAS


CARRERA DE ESTADSTICA


Anlisis de los factores que ms influyen en un buen desempeo de la
defensa de un proyecto, por parte del estudiante de la carrera de
estadstica de la Universidad Autnoma Toms Fras, mediante el
anlisis de componentes principales (ACP) y anlisis de
correspondencias mltiples (CORMU).


Por: Nelson Pinto Cabrera.


POTOS BOLIVIA



INTRODUCCIN
En el anlisis multivariado se utilizan diferentes enfoques tales como la
simplificacin de la estructura de datos, el cual es una manera simplificada de
representar el universo de estudio, mediante la transformacin (combinacin lineal o
no lineal) de un conjunto de variables interdependientes en otro conjunto
independiente o en un conjunto de menor dimensin. Las tcnicas multivariantes
plantean grandes demandas al analista en cuanto a la comprensin, interpretacin y
articulacin de resultados basados en relaciones cuya complejidad puede llegar a ser
muy grande. El conocimiento de algunas interrelaciones importantes o evidentes
puede ayudar en la especificacin y refinamiento del modelo multivariante a utilizar,
as como proporcionar una perspectiva razonable para la interpretacin de los
resultados.
Este tipo de anlisis permite ubicar las observaciones dentro de grupos o bien
concluir que los individuos estn dispersos aleatoriamente en el multi espacio.
Entre los mtodos de anlisis multivariado para detectar la interdependencia entre
variables y tambin entre individuos se incluyen el anlisis de factores, el anlisis por
conglomerados o clster, el anlisis de correlacin cannica, el anlisis por
componentes principales, el anlisis de ordenamiento multidimensional, y algunos
mtodos no paramtricos. Los mtodos para detectar dependencia comprenden el
anlisis de regresin multivariado, el anlisis de correspondencia mltiple y el
anlisis discriminante.
El mtodo de anlisis de componentes principales (ACP), es uno de los ms
difundidos, permitiendo la estructuracin de un conjunto de datos multivariados
obtenidos de una poblacin. Este mtodo se aplica ante todo con variables
cuantitativas, y es el que usaremos en el presente trabajo.
Pero no solo se realizar un anlisis cuantitativo, pues en las investigaciones, no
faltan las variables cualitativas, para lo cual se utilizar el anlisis de
Correspondencias Mltiples (CORMU).
DESARROLLO
Situacin Problemtica
Los estudiantes de la carrera de estadstica, suelen realizar proyectos en
determinadas materias, con el objetivo de aplicar los conocimientos que adquiere.
Para defender estos proyectos en una exposicin o disertacin, los estudiantes
presentan algunas caractersticas:
Psicolgicamente, pocos o ningn estudiante se autosugestiona antes de
empezar la exposicin para no ser traicionados por los nervios.
No todos realizan un informe adecuado, muchas veces porque investigan a
destiempo, por distintos factores.
Pocos estudiantes se preparan con la mayor profundidad posible sobre el
tema seleccionado.
Algunos estudiantes, no investigan en distintas fuentes como internet, libros,
revistas, etc., todo lo referente a su tema, muchas veces llegndose a
conformar con los apuntes que poseen.
Algunos estudiantes solo consultan a compaeros sobre algunas dudas
durante su PEA, e investigacin de su proyecto, cuando lo ideal debera ser el
explotar los conocimientos de los docentes.
No todos cuentan con los recursos econmicos suficientes o herramientas
como la computadora para realizar trabajos de mayor envergadura.
Problema cientfico
Cules son los factores que ms influyen en un buen desempeo durante la
defensa de un proyecto, por parte del estudiante de la carrera de Estadstica de la
Universidad Autnoma Toms Fras?
Objetivo General
Aplicar el anlisis de componentes principales (ACP) y anlisis de correspondencias
mltiples (CORMU), para comprender los factores que ms influyen en un buen
desempeo de la defensa de un proyecto, por parte del estudiante de la carrera de
estadstica de la Universidad Autnoma Toms Fras.


Objetivos Especficos
Detectar la existencia de multicolinealidad.
Remediar la multicolinealidad, si existe.
Aplicar el ACP
Aplicar el CORMU
Hiptesis
La Aplicacin del anlisis de componentes principales (ACP) y anlisis de
correspondencias mltiples (CORMU), permiten comprender los factores que ms
influyen en un buen desempeo de la defensa de un proyecto, por parte del
estudiante de la carrera de estadstica de la Universidad Autnoma Toms Fras.
MUESTREO
Muestra piloto
Para realizar el pilotaje, se tom en cuenta el 10% de una poblacin de 75
estudiantes, todos pertenecientes a la carrera de Estadstica de la U.A.T.F.


Los datos recabados sobre la edad de estos 7 individuos son:
21 20 25 18 19 21 28
Tamao de la muestra
Para obtener el tamao de la muestra, se utiliza la siguiente frmula mgica


Para calcular de la media aritmtica y la varianza muestral con informacin de la
muestra piloto, nos apoyamos en Excel.
N Edad =


1 21 0,5
2 20 2,9
3 25 10,8
4 18 13,8
5 19 7,4
6 21 0,5
7 28 39,5
Total 152 75,4
Promedio = 21,7143




Calculo del nivel de confianza con el 95%



Entonces el nivel de significancia es:


Luego:


Buscando en la tabla de la distribucin normal se obtuvo un valor de

1.96
Calculo de la precisin


()



Tamao provisional de la muestra

()

()
()


Comprobamos si se cumple la siguiente condicin

)
( )

Se evidencia que 75 es menor a 1638,38, entonces no cumple con la desigualdad
dada; entonces el siguiente paso es:



Este es el tamao de la muestra que cumple todas las condiciones anteriores. En
consecuencia se debe seleccionar una muestra de 27 estudiantes de la carrera de
estadstica de la U.A.T.F. para realizar el estudio sobre anlisis de componentes
principales y sobre el anlisis de correspondencias mltiples.
Seleccin de la muestra
La seleccin de la muestra se realiz aleatoriamente, aplicando el Muestreo Aleatorio
Simple (MAS) de la siguiente forma: se realiz la introduccin de todos los nombres
anotando solo los respectivos nmeros de la siguiente lista, en una urna.



Lista de estudiantes de la Carrera de Estadstica
N NOMBRE N NOMBRE N NOMBRE
1 Aida Estela 26 Jos Luis 51 Nelly T.
2 Almagro 27 Juan 52 Norma Tatiana
3 lvaro 28 Juan Carlos 53 Pascuala
4 Beatriz 29 Juan Jos 54 Prima Nancy
5 Bertha 30 Juana 55 Ren Oscar
6 Bonnie Massiel 31 Judith V. 56 Richard
7 Carlos Alberto 32 Judith Vernica 57 Rosa Mara
8 Carlos Ariel 33 Karen Andrea 58 Roxana
9 Carmen 34 Lidia 59 Ruperta
10 Cintia Nadir 35 Luis Gastn 60 Sabino
11 Cristina Darinca 36 Luisa Marcelina 61 Sandra
12 Edgar Farid 37 Mabel 62 Santiago
13 Efran 38 Magali 63 Sergio
14 FirileyLizeth 39 Mara Elena 64 Shirley
15 Gabriel Antonio 40 Mara Ibeth 65 Sonia
16 Guiller 41 Mara Tmpora 66 Stella Marrys
17 Hermes 42 Maribel 67 Sven
18 Ivone Roxana 43 Miguel ngel 68 Vernica Severina
19 Jael Jessica 44 Mirian Rossio 69 Vernica Sonia
20 Jaqueline 45 Misael 70 Vctor Hugo
21 Javier Oscar 46 Mnica 71 Virginia Tania
22 JhomaraDayan 47 Nancy 72 Weimar Javier
23 Jhonny 48 Nelson M. 73 Ximena M.
24 Jhulier Ren 49 Nelson 74 Ximena
25 Jimena 50 Nelly 75 Zulma
FUENTE: Carrera de Estadstica.
Seguidamente, se realiza la extraccin de la urna, sin reposicin. Esta extraccin es
probabilstica ya que todos los estudiantes tienen la misma probabilidad de ser
seleccionados como parte de la muestra. La seleccin muestral es la siguiente:



Lista de estudiantes seleccionados para la muestra.
N NOMBRE N NOMBRE
1 Jhomara 15 Juan
2 Lidia 16 Gabriel
3 Lizeth 17 Juan Carlos
4 Maribel 18 Judith
5 Rosa 19 Bertha
6 Efrain 20 Misael
7 Karen 21 Carlos
8 Victor 22 Ivonne
9 Norma 23 Richard
10 Stella 24 Sergio
11 Ximena 25 Cinthia
12 Pascuala 26 Nelson
13 Rossio 27 Juan Jose
14 Santiago
Definicin de variables
En la boleta de encuesta (Ver Anexo 1), se realz 11 preguntas, 6 de la cuales son
variables cualitativas, y las restantes 5 son cuantitativas, estas ests definidas de la
siguiente manera:
Variables Cualitativas
N
Variables Cualitativas
Abreviatura
1
Desempeo del estudiante en su disertacin.
Desemp
2
Sexo de la persona encuestada.
Sexo
3
A la persona encuestada, le gusta exponer.
Gus_exp
4
El estudiante suele ponerse nervioso.
Nervio
5
Factor de excelencia en las disertaciones del estudiante.
Fact_exc
6 Consulta en caso de dudas. Duda
Variables Cuantitativas
N
Variables Cuantitativas
Abreviatura
1
Gasto en material para exposicin.
Gas
2
Edad de la persona encuestada.
Edad
3
Numero de disertaciones que el estudiante realiza al ao.
Disert
4
Numero de libros consultados para exponer.
N_Lib
5
Ingreso universitario.
Ing
Los datos son los siguientes

Pregunta 1 2 3 4 5 6 7 8 9 10 11
Nombre Edad Sexo Gus_exp Nervio Disert Desemp Fact_exc N_lib Duda Gas Ing
Jhomara 24 Femenino SI A veces 3 Buena Confianza 2 Docente 20 80
Lidia 21 Femenino SI A veces 1 Mala Experiencia 2 Ambos 20 80
Lizeth 25 Femenino NO Siempre 3 Buena Confianza 2 Ambos 30 100
Maribel 24 Femenino SI A veces 1 Regular Confianza 2 Nadie 10 80
Rosa 21 Femenino NO Siempre 3 Regular Confianza 1 Ambos 10 80
Efrain 26 Masculino SI A veces 6 Regular Confianza 1 Ambos 40 80
Karen 20 Femenino NO Siempre 3 Regular Preparacion 5 Ambos 30 40
Victor 25 Masculino SI A veces 5 Regular Preparacion 2 Estudiante 20 40
Norma 19 Femenino SI A veces 1 Buena Confianza 5 Docente 10 20
Stella 25 Femenino NO Siempre 1 Mala Experiencia 2 Docente 30 200
Ximena 31 Femenino SI A veces 4 Regular Preparacion 4 Ambos 55 80
Pascuala 21 Femenino SI A veces 1 Buena Confianza 4 Ambos 40 100
Rossio 29 Femenino SI A veces 3 Buena Preparacion 7 Ambos 30 80
Santiago 18 Masculino NO Siempre 1 Regular Confianza 1 Estudiante 30 80
Juan 28 Masculino SI A veces 3 Regular Experiencia 6 Docente 40 300
Gabriel 19 Masculino SI A veces 2 Buena Preparacion 1 Ambos 0 100
Juan Carlos 19 Masculino SI A veces 2 Regular Preparacion 1 Ambos 0 100
Judith 30 Femenino SI Siempre 2 Regular Confianza 6 Nadie 50 100
Bertha 25 Femenino SI Siempre 1 Regular Confianza 3 Ambos 20 100
Misael 22 Masculino SI A veces 2 Regular Preparacion 2 Docente 10 100
Carlos 24 Masculino SI A veces 1 Regular Confianza 10 Nadie 20 100
Ivonne 27 Femenino SI Siempre 3 Buena Experiencia 5 Docente 30 100
Richard 26 Masculino NO A veces 5 Regular Confianza 2 Estudiante 20 30
Sergio 23 Masculino SI A veces 3 Buena Preparacion 5 Ambos 40 300
Cinthia 22 Femenino NO Siempre 1 Mala Preparacion 0 Docente 0 20
Nelson 25 Masculino SI Siempre 4 Regular Experiencia 2 Docente 20 100
Juan Jose 23 Masculino SI A veces 2 Buena Experiencia 6 Docente 30 150




CAPTULO 1
MTODOS DE ANLISIS MULTIVARIADO
El anlisis multivariable es un conjunto de tcnicas estadsticas que analizan
simultneamente ms de dos variables en una muestra de observaciones, esta
tcnica estudia, interpreta y elabora el material estadstico sobre la base de un
conjunto de n >1 variables, las cuales pueden ser de tipo cuantitativo, cualitativo o
una combinacin de ambas.

Una de las aplicaciones principales del anlisis multivariable dentro del campo de las
ciencias sociales y econmicas, consiste en resumir y sintetizar grandes conjuntos
de datos y variables en funcin de ciertos objetivos para obtener informacin vlida
que logre una mejor comprensin del fenmeno objeto de estudio, de ah su
importancia en la determinacin de un indicador que englobe de la manera ms
conveniente y acertada desde el punto de vista estadstico varios indicadores
econmicos y financieros en el referido indicador nico.
Los orgenes del anlisis multivariable se encuentran en las primeras
generalizaciones de la correlacin y regresin, en donde se establecieron las
primeras ideas del anlisis de componentes principales (Pearson; 1901 y Spearman;
1904).Pero el establecimiento definitivo de la mayora del anlisis multivariable se
ubica en los aos treinta con los estudios de Hotelling (1931, 1933); Willes
(1932,1935); Fisher (1935, 1936); Mahalanobis (1936) y Bartlett (1939).
En cuanto al desarrollo y maduracin de los fundamentos del anlisis multivariable,
este se debe a los pioneros de la estadstica moderna que fueron los ingleses
(Galton, Pearson, Fisher Snecodor).Posteriormente, el centro de gravedad se
desplaz hacia los Estados Unidos (Hotelling, Wilks, Bartlett),aunque sin dejar de
considerar las aportaciones que se dieron con el nacimiento de otras escuelas tan
importantes como la escuela india (Mahalanobis, Roy, Krishnaah);la escuela
francesa surgida en los aos sesenta (Benzecri, Lebart, Morineau, Fenelon)y la
escuela sueca surgida en los aos setenta (Jreskog y Srborn).
OBJETIVOS DEL ANLISIS MULTIVARIADO
Proporcionar mtodos adecuados, cuya finalidad es el estudio simultneo de datos
multivariantes que el anlisis estadstico unidimensional y bidimensional es incapaz
de conseguir.
Ayudar al analista a investigar o tomar decisiones ptimas en el contexto en el que
se encuentre; teniendo en cuenta la informacin disponible por el conjunto de datos
analizado.
CLASIFICACION DE LOS MTODOS MULTIVARIADOS
Se pueden clasificar en tres grandes grupos:
Mtodos de dependencia
Supone que las variables analizadas estn divididas en dos grupos: las variables no
mtricas y las variables mtricas. El objetivo de los mtodos de dependencia
consiste en determinar si el conjunto de variables mtricas afecta al conjunto de
variables no mtricas y de qu forma.
Mtodos de interdependencia
Estos mtodos no distinguen entre variables no mtricas y mtricas, su objetivo
consiste en identificar que variables estn relacionadas, como lo estn y por qu.
Adems estos mtodos sirven para reducir datos y simplificar las relaciones
complejas, de tal manera que permitan conocer ms a fondo las relaciones y las
estructuras de las variables.
Mtodos estructurales
Supone que las variables estn divididas en dos grupos: el de las variables
dependientes y el de las independientes. El objetivo de estos mtodos es analizar, no
solo como las variables independientes afectan a las variables dependientes, sino
tambin como estn relacionadas las variables de los dos grupos.
El siguiente esquema, muestra la clasificacin de los mtodos multivariados.

Antes de realizar una breve explicacin de cada uno de los mtodos, es necesario
saber la definicin de datos mtricos y no mtricos.
ESCALAS DE MEDIDA
El anlisis de los datos implica la separacin, identificacin y medida de la variacin
en un conjunto de variables, tanto entre ellas mismas como entre una variable
dependiente y una o ms variables dependientes. El trmino clave aqu es la
medida, dado que el investigador no puede separar o identificar una variacin a
menos que esta sea mesurable.
La medida es importante para representar con precisin el concepto de nuestro
inters y es crucial en la seleccin del mtodo de anlisis multivariado apropiado.
Existen dos tipos bsicos de datos: no mtricos (cualitativos) y mtricos
(cuantitativos).
Los datos no mtricos (cualitativos) son atributos, caractersticas o propiedades
categricas que identifican o describen a un sujeto. Describen diferencias en tipo o
clase, indicando la presencia o ausencia de una caracterstica o propiedad. Muchas
propiedades son discretas porque tienen una caracterstica peculiar que excluye
todas las dems caractersticas. Por ejemplo, si uno es hombre, no puede ser mujer,
no hay cantidad de gnero, solo la condicin de ser hombre o mujer.
Por el contrario, las medidas de datos mtricos (cuantitativos) estn constituidas de
tal forma que los sujetos pueden ser identificados por diferencias entre grado o
cantidad. Las variables medidas mtricamente reflejan cantidades relativas o grado.
Las medidas mtricamente son las ms apropiadas para casos que involucran
cantidad o magnitud, tales como el nivel de satisfaccin o la demanda de trabajo.
Seguidamente, se puede comprender con mayor facilidad la explicacin de los
mtodos de anlisis multivariado.
MTODOS DE DEPENDENCIA.
Se clasifican en dos grupos segn el tipo de variable dependiente mtrica y no
mtrica.
Variables mtricas.
Si las variables son mtricas, entonces se puede mencionar algunas tcnicas o
mtodos importantes.
Anlisis de regresin.
Esta tcnica es adecuada si las variables dependientes son mtricas las mismas que
dependen de una o varias variables independientes mtricas, pudiendo emplear una
o dos variables no mtricas como variables independientes cuya codificacin debe
ser con 0 y 1 (ausencia y presencia).
Anlisis de supervivencia.
Este anlisis es parecido al anlisis de regresin con la diferencia de que la variable
independiente es el tiempo de supervivencia de un individuo, plantas, objetos, etc.
MANOVA (Anlisis multivariado de varianza y covarianza).
Se emplea cuando la muestra total est dividida en varios grupos basados en una o
varias variables independientes no mtricas y varias variables dependientes
mtricas, el propsito principal de esta tcnica o mtodo es averiguar si hay
diferencias significativas entre dichos grupos, en cuanto a las variables dependientes
se refiere.
Anlisis de correlacin cannica.
El propsito fundamental de esta tcnica es relacionar simultneamente varias
variables mtricas dependientes e independientes, calculando combinaciones
lineales de cada conjunto de variables que maximicen la correlacin existente entre
los dos conjuntos de variables.
Variables no mtricas.
Si las variables son no mtricas, entonces se puede mencionar algunas tcnicas o
mtodos importantes.
Anlisis discriminante.
Esta tcnica proporciona reglas de clasificacin ptimas de nuevas observaciones de
las que se desconoce su grupo de procedencia, basndose en una informacin
proporcionada, que en ella toman las variables independientes.
Regresin logstica.
Son modelos de regresin donde la variable dependiente necesariamente es no
mtrica y las variables independientes pueden ser mtricas y no mtricas.
Anlisis conjunto.
Es una tcnica que analiza el efecto de variables independientes no mtricas sobre
variables mtricas o no mtricas. La diferencia con el anlisis de la varianza radica
en dos hechos:
Las variables dependientes pueden ser no mtricas y los valores de las variables
independientes no mtricas son fijadas por el analista. En otras disciplinas se conoce
con el nombre de Diseo de Experimentos.
MTODOS DE INTERDEPENDENCIA.
Se clasifican en dos grupos segn el tipo de variables mtricas y no mtricas.
Variables mtricas.
Si las variables son mtricas se tienen las siguientes tcnicas.
Anlisis factorial y anlisis de componentes principales (ACP).
Se emplea para analizar interrelaciones entre un nmero elevado de variables
mtricas explicando dichas relaciones (reducir la dimensionalidad del nmero de
variables), se puede utilizar para su anlisis la matriz de varianza covarianza o la
matriz de correlacin.
Escalas multidimensionales.
Su objetivo es transformar juicios de semejanza o preferencia en distancias
representadas en un espacio multidimensional. Como consecuencia se construye un
mapa en el que se dibujan las posiciones de los objetos comparados de forma que
aquellos similares estn cercanos unos de otros y si son distintos estn alejados.
Anlisis Clster.
El objetivo principal de este mtodo es clasificar una muestra de entidades
(individuos o variables) en un nmero pequeo de grupos, de manera que las
observaciones pertenecientes a un grupo sean muy similares entre si y muy distintos
del resto de los otros grupos.
Variables no mtricas.
Si las variables son no mtricas se tienen las siguientes tcnicas.
Anlisis de Correspondencias Mltiples (CORMU).
Este mtodo o tcnica requiere necesariamente para su anlisis variables no
mtricas presentando simultneamente filas y columnas de las tablas de
contingencia asignndole contribuciones a las variables no mtricas.
Modelos log lineales.
Se aplica a tablas de contingencia multidimensional y modelizan relaciones de
dependencia multidimensional de las variables observadas que buscan explicar las
frecuencias observadas.
Escala multidimensional
El objetivo es transformar los juicios del consumidor de similitud o preferencias
(Preferencia por tiendas o marcas por ejemplo) en distancias representadas en un
espacio multidimensional. Si los objetos A y B se juzgan por el consumidor como
similares, comparados con cualquier otro par de objetos, la tcnica posiciona los
objetos A y B de manera que la distancia entre ellos en un espacio multidimensional
es ms pequea que la distancia entre cualquier otro par de objetos. Al final se
muestra un mapa perceptual con la posicin relativa de los objetos.
Anlisis de conglomerados (Clusters)
Es una tcnica analtica para desarrollar subgrupos significativos de individuos u
objetos. Especficamente, el objetivo es clasificar una muestra de entidades
(individuos u objetos) en un nmero ms pequeo de grupos ms pequeos con
base en las similitudes entre entidades. A diferencia del anlisis discriminante, los
grupos no estn definidos, ms bien se usa para identificarlos.
Normalmente se realiza en tres pasos. El primero es la medicin de alguna forma de
similitud o asociacin entre las entidades para identificar cuantos grupos realmente
existen en la muestra. El segundo paso es el proceso en s de conglomerados,
donde las entidades se particionan en grupos (conglomerados o clsters). El paso
final es perfilar las personas o variables para determinar su composicin. Muchas
veces esto ltimo se realiza con el anlisis discriminante.


MTODOS ESTRUCTURALES.
Analizan las relaciones existentes entre un grupo de variables representadas por
sistemas de ecuaciones simultneas en las que se suponen que algunas de ellas
(denominadas constructos) se miden con error a partir de otras variables observables
denominadas indicadores.
Los modelos utilizados, constan por lo tanto, de dos partes:
Un modelo estructural que especifica las relaciones de dependencia existentes entre
los constructos latentes y un modelo de medida que especifica como los indicadores
se relacionan con sus correspondientes constructos.
En el presente trabajo, se trabajar con anlisis de componentes principales para el
anlisis de las variables cuantitativas y el CORMU para las variables cualitativas.
ANLISIS DE COMPONENTES PRINCIPALES (ACP)

El ACP tiene como finalidad transformar un conjunto de variables, a las que se las
denomina variables originales interrelacionadas, en un nuevo conjunto de variables
que son combinacin lineal de las originales, denominadas componentes principales.
Estas nuevas variables tienen la caracterstica de estar incorrelacionadas entre s.
El anlisis de componentes principales, es una tcnica estadstica multivariada que
permite reducir la dimensin original de un conjunto de variables a un conjunto
menor de variables. Para lograr una mayor interpretacin de la informacin, lo que
se pretende es, entre otras cosas, reducir el nmero de variables a utilizar
manteniendo el mximo de la informacin sin redundancias, reduciendo as las
dimencionalidad del espacio original de manera que estas nuevas variables
simtricas expliquen la mxima variabilidad total de las variables originales y
prediciendo la menor cantidad de informacin posible. Estas m nuevas variables se
determinan mediante combinaciones lineales de las variables originales y son
conocidas como componentes principales y poseen algunas caractersticas
estadsticas tales como independencia y no correlacin.

En el ACP, se persigue explicar la mayor parte de la variabilidad total con el menor
nmero de componentes, en donde cada componente como se dijo anteriormente
est expresada en funcin de las variables observadas y es muy adecuado para
resumir y reducir datos.
Pertenece a los mtodos de interdependencia, las variables empleadas en este
mtodo son mtricas, pudiendo aceptar variables no mtricas siempre y cuando la
codificacin sea con 0 y 1 (ausencia y presencia).
El anlisis de componentes principales ACP fue introducido por Pearson en 1901 y
retomado por Hotelling en 1933, quien fue el primero en formular el ACP como se ha
difundido hasta nuestros das.
Los componentes principales tiene como objetivo principal el de generar nuevas
variables que sean expresadas como combinaciones lineales de las variables
originales, estas combinaciones lineales son conocidas como componentes
principales. Es posible sintetizar la mayor parte de la informacin contenida en los
datos originales en un nmero reducido de combinaciones, talque la prdida de
informacin sea tan pequea como sea posible (varianza pequea) y estudiar
solamente aquellas cuya varianza sea grande, de esta forma se reduce la
dimencionalidad del problema que se est estudiando como paso previo del futuro
anlisis, adems de eliminar en lo posible algunas variables originales si ellas
aportan poca o ninguna informacin.
En esencia el ACP compromete la extraccin de los valores y vectores
caractersticos de la matriz de correlacin o de la matriz de varianzas y covarianzas
de las variables originales, los vectores ortogonales son usados para construir a
componentes principales y los valores caractersticos son las varianzas de las
componentes principales, estos resultados definen las componentes como funciones
lineales de las variables. Con coeficientes as elegidos las funciones son
automticamente independientes y ortogonales unos a otros.

GENERACION DE COMPONENTES PRINCIPALES
Consideremos una matriz como un conjunto de datos que constituye una muestra
aleatoria multivariada, si cada individuo ha sido extrado aleatoriamente de una
poblacin de individuos y en l se han medido u observado una serie de
caractersticas.
Por otra parte sea

la observacin de la - sima variable en el -simo individuo,

el vector fila que contiene las observaciones de todas las variables en el - simo
individuo y

el vector columna que contiene todas las observaciones de la - sima


variable. Se define una matriz de datos multivariados de dimensiones nxpcomo:









A partir de esta matriz que contiene toda la informacin estadstica es posible
encontrar nuevas variables que sean combinaciones lineales de las variables
originales. Ms detalladamente, consideremos la transformacin de las en un
nuevo conjunto de variables, que no estn correlacionadas dos a dos y que la
primera tenga la mxima varianza posible, la segunda la mxima varianza posible de
entre las que no estn correlacionadas con la primera y as sucesivamente.
Consideremos una combinacin lineal de las esto es

, tal que

.
Como nuestro inters es la matriz de varianza covarianza(), que puede ser
tambin una matriz de correlacin (). La varianza de esta combinacin lineal es:




Variables
1 . . . . . .
1




I
n
d
i
v
i
d
u
o
s

i: Nmero de individuos
j: Nmero de variables
cuantitativas
Xij: Observaciones en la j-sima
variable en el i-simo individuo

(

) (

) (


Nuestro objetivo es elegir un vector

que maximice la varianza de

y que cumpla
que


El problema consiste ahora en maximizar

sujeto a

. Definamos

)
Donde

es un multiplicador de LaGrange. As pues


Haciendo

, se obtiene

(1-1)
Por lo tanto

es el vector caracterstico de asociado al valor caracterstico

.
De


Se ve que

, pero como

.
Por lo tanto


Luego hemos de tomar

como el mayor valor caracterstico de , en ausencia de


colinealidad perfecta, la matriz ser semidefinida positiva y por lo tanto posee
valores caractersticos. La primera componente principal de es, entonces

.
Elegimos ahora otra combinacin lineal

. Debemos elegir el vector

que
maximice

sujeto a las restricciones

la causa de
la segunda condicin es que

ha de estar incorrelacionado con

. Las covarianzas
entre ambas variables viene dada por:
(

) (

) (

(1-
2)

Esta expresin ser cero siempre y cuando


Definamos

) (

)
Donde

y son multiplicadores de LaGrange

(1-3)

(1-4)
Pre multiplicando (1-2) por

obtenemos

(1-5)
Pero por (1-4)

, adems

por lo tanto

, pero como


Llegamos a que


Reemplazando en (1-5) tenemos

, pero como

, entonces

)
Entonces

, por lo que
Y tenemos


Por lo que, obviamente,

debe ser el segundo valor propio en magnitud de y


ser el vector caracterstico asociado a


Podemos proceder de esta forma a obtener los valores caractersticos de la matriz
e integrar los vectores resultantes en la matriz ortogonal


Los componentes principales de vienen dados, por la matriz de orden x

Adems () (

) (1-6)
Que prueba que los componentes principales estn, desde luego incorrelacionadas
dos a dos y que sus varianzas vienen dadas por:
(


Si el rango de fuese habrian ( ) valores caractersticos nulos y la
variacin de las se podra expresar completamente en funcin de variables
independientes. Incluso si fuese de rango completo, algunos de los pueden estar
tan prximos a cero como para que un reducido nmero de componentes principales
expliquen gran parte de la varianza de las .
La variacin total de las viene dada por
()


Por lo tanto


Representan las proporciones respectivas con que cada variacin total de las , y
dado que las componentes son ortogonales, la suma de esas contribuciones es igual
a la unidad
Uso de la matriz de correlacin
Cuando se analiza de forma conjunta variables cuantitativas, el objetivo que se
pretende es por lo general, determinar la existencia o no de algn tipo de variacin
conjunta o covariacin entre ellas. La covarianza tiene el inconveniente de que su
valor depende de las unidades de medida de las variables, de manera que cuando
una de ellas varia en su escala de medida esto origina un cambio en el valor de la
covarianza.
Segn Anderson (1964) el uso de la matriz de varianza covarianza, para el conjunto
de componentes principales es recomendado normalmente si las unidades estn en
la misma escala, de no ser as, los componentes principales en base a la matriz de
covarianza no contribuyen una buena sntesis de las variables en estudio, porque el
primer componente resume casi toda la variabilidad. Esto significa que la
combinacin lineal de las variables originales representada por el primer componente
principal sintetiza casi la totalidad de la variacin del conjunto de datos, por lo tanto
las interpretaciones estaran sesgadas.
Para superar este inconveniente Kart Pearson quien propuso un ndice
estandarizado, independiente de la escala de medida de las variables, denominado
coeficiente de correlacin.
El uso de la matriz de correlacin , equivale a suponer y aceptar el criterio de que
todas las variables independientes de su escala de medicin, tienen la misma
importancia.
La matriz de correlacin es calculada usando el coeficiente producto momento de
Pearson.


La cual adems de ser simtrica, los valores de la diagonal principal son iguales a 1.
El uso de la matriz de correlacin implica una ponderacin de las variables originales
proporcionndole a cada una la misma importancia.
Criterio de seleccin del nmero de componentes
Recordemos que nuestro objetivo es conseguir una reduccin de la dimensin del
conjunto de datos, pero Cmo seleccionar el nmero de componentes que permita
dar cuenta suficiente de la variabilidad y que a la vez suponga una reduccin en el
nmero de variables? Existen algunas reglas informales para ayudar a elegir el
nmero de componentes principales cuando se est aplicando el ACP a las
cuales expondremos a continuacin.
1.- Cuando se trabaja con el criterio ms empleado para seleccionar el nmero de
componentes es incluir solo aquellos componentes cuyos valores caractersticos
sean superiores al promedio.
2.- Diagrama de codo. Se representa mediante un grfico denominado en ingls
Screetplot que se traduce por diagrama de codo, que consiste en situar en un
plano cada valor caracterstico contra el nmero de componentes. Es decir, se sitan
las parejas (

) (

) (

) . Luego se selecciona como nmero de


componentes el valor de correspondiente a un codo en la curva. Este valor es
considerado como el punto en el cual los valores caractersticos grandes de


cambian y tienden a nivelarse los valores caractersticos pequeos prximos a cero
como para que pueda ignorarse.
3.- Proporcin de variabilidad explicada. Puesto que la varianza del componente
simo es

y que la variabilidad total es la suma de los valores caractersticos esto


es:
(

) (

) (

) (


La proporcin de la variabilidad total explicada por los primeros componentes es:

()

Se suele por lo tanto considerar que nos quedamos con los componentes que
explican ms del 90% 95% de la variabilidad total con solo dos o tres componentes
principales cuando se trata de datos del tipo de laboratorio. Por otra parte, para datos
del tipo personas es posible que se requieran cinco o seis componentes para
explicar ms de 75% a 80% de la variacin total. Por desgracia, entre ms
componentes principales se requiera. Menos til se vuelve cada una de ellas.
Si se utiliza la matriz de correlacin , se incluirn los componentes cuyos valores
caractersticos sean mayores a 1, este criterio es debido a Jolliffe (1972) y Kaiser
(1979).
La razn para comparar los valores caractersticos con 1 es que, cuando se est
realizando el anlisis sobre datos estandarizados, es decir, la matriz de correlacin,
la varianza de cada variable estandarizada es igual a 1.
Anlisis de los resultados

El anlisis de componentes principales aplicado a los datos mtricos del presente
trabajo, se desarrollan a partir de una matriz de correlacin con 5 variables mtricas
y 27 observaciones. Las variables empleadas se presentan en el siguiente cuadro:

N
Variables Cuantitativas
Abreviatura
1
Gasto en material para exposicin.
Gas
2
Edad de la persona encuestada.
Edad
3
Numero de disertaciones que el estudiante realiza al ao.
Disert
4
Numero de libros consultados para exponer.
N_Lib
5
Ingreso universitario.
Ing

Ya teniendo las variables, trabajamos con SPAD Versin 3.5.
Los resultados ms relevantes son:
Valores propios o caractersticos del ACP. En nuestro trabajo, se puede observar
que los dos primeros ejes factoriales conservan un 69.87 por ciento de la inercia.
VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..5.0000
SOMME DES VALEURS PROPRES .... 5.0000
HISTOGRAMME DES 5 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------+
| NUMERO | VALEUR | POURCENT.| POURCENT.| |
|
| | PROPRE | | CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------+
| 1 | 2.2164 | 44.33 | 44.33 | **************************************************************** |
| 2 | 1.2770 | 25.54 |69.87 | ***********************************************
|
| 3 | 0.7517 | 15.03 | 84.90 | ****************************
|
| 4 | 0.4179 | 8.36 | 93.26 | ****************
|
| 5 | 0.3370 | 6.74 | 100.00 | *************
|
+--------+------------+----------+----------+----------------------------------------------------------------+
RECHERCHE DE PALIERS ENTRE (DIFFERENCES SECONDES)



Coordenadas de las variables en el espacio factorial o eigenvectores.Que nos
permite interpretar el ACP y sus ejes.
COORDONNEES DES VARIABLES SUR LES AXES 1 A 5
VARIABLES ACTIVES
----------------------------+------------------------------------+-------------------------------+-------------------------------
VARIABLES | COORDONNEES | CORRELATIONS VARIABLE-FACTEUR | ANCIENS AXES UNITAIRES
----------------------------+------------------------------------+-------------------------------+-------------------------------
IDEN - LIBELLE COURT | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5
----------------------------+------------------------------------+-------------------------------+-------------------------------
Edad - Edad de la persona e | 0.77 -0.39 0.21 0.37 0.27 | 0.77 -0.39 0.21 0.37 0.27 | 0.52 -0.34 0.25 0.58 0.47
Dise - Numero de disertacio | 0.36 -0.86 -0.16 -0.08 -0.33 | 0.36 -0.86 -0.16 -0.08 -0.33 | 0.24 -0.76 -0.18 -0.13 -0.56
Libr - Numero de libros con | 0.66 0.44 0.53 0.01 -0.31 | 0.66 0.44 0.53 0.01 -0.31 | 0.44 0.39 0.61 0.01 -0.53
Gast - Gasto en material pa | 0.85 0.06 -0.10 -0.47 0.21 | 0.85 0.06 -0.10 -0.47 0.21 | 0.57 0.06 -0.12 -0.72 0.37
Ingr - Ingreso universitari | 0.59 0.44 -0.63 0.23 -0.12 | 0.59 0.44 -0.63 0.23 -0.12 | 0.39 0.39 -0.72 0.35 -0.21
----------------------------+------------------------------------+-------------------------------+-------------------------------

Coordenadas de los individuos en el espacio factorial. Podemos observar que
estudiantes estn bien representados en los ejes, a partir de las contribuciones y los
cosenos cuadrados.

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS
AXES 1 A 5
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| INDIVIDUS | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES |
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFICATEUR P.REL DISTO | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| Jhomara 3.70 0.61 | -0.38 -0.66 -0.13 0.04 0.10 | 0.2 1.3 0.1 0.0 0.1 | 0.24 0.71 0.03 0.00 0.02 |
| Lidia 3.70 2.26 | -1.18 0.73 -0.09 -0.29 0.49 | 2.3 1.5 0.0 0.7 2.7 | 0.62 0.23 0.00 0.04 0.11 |
| Lizeth 3.70 0.87 | 0.33 -0.60 -0.37 -0.24 0.46 | 0.2 1.0 0.7 0.5 2.3 | 0.12 0.42 0.15 0.07 0.24 |
| Maribel 3.70 2.55 | -1.17 0.38 0.22 0.78 0.62 | 2.3 0.4 0.2 5.4 4.3 | 0.53 0.06 0.02 0.24 0.15 |
| Rosa 3.70 2.90 | -1.47 -0.57 -0.52 0.08 -0.37 | 3.6 0.9 1.3 0.1 1.5 | 0.75 0.11 0.09 0.00 0.05 |
| Efrain 3.70 9.55 | 1.12 -2.57 -0.82 -1.01 -0.04 | 2.1 19.2 3.3 9.0 0.0 | 0.13 0.69 0.07 0.11 0.00 |
| Karen 3.70 3.05 | -0.22 0.05 0.71 -1.40 -0.73 | 0.1 0.0 2.5 17.4 5.9 | 0.02 0.00 0.16 0.64 0.18 |
| Victor 3.70 4.59 | -0.12 -2.08 0.12 -0.18 -0.45 | 0.0 12.6 0.1 0.3 2.2 | 0.00 0.94 0.00 0.01 0.04 |
| Norma 3.70 6.14 | -1.71 1.04 1.29 -0.38 -0.57 | 4.9 3.1 8.2 1.3 3.5 | 0.48 0.17 0.27 0.02 0.05 |
| Stella 3.70 4.03 | 0.57 1.07 -1.19 0.48 0.95 | 0.5 3.3 7.0 2.0 10.0 | 0.08 0.28 0.35 0.06 0.23 |
| Ximena 3.70 5.92 | 1.32 -1.56 0.75 1.04 0.26 | 2.9 7.1 2.8 9.6 0.7 | 0.30 0.41 0.10 0.18 0.01 |
| Pascuala 3.70 3.59 | 0.19 1.27 0.04 -1.29 0.54 | 0.1 4.7 0.0 14.7 3.2 | 0.01 0.45 0.00 0.46 0.08 |
| Rossio 3.70 5.44 | 1.77 -0.28 1.45 0.36 -0.07 | 5.2 0.2 10.4 1.1 0.1 | 0.57 0.01 0.39 0.02 0.00 |
| Santiago 3.70 5.39 | -1.39 0.91 -0.66 -1.36 0.59 | 3.2 2.4 2.2 16.4 3.8 | 0.36 0.15 0.08 0.34 0.06 |
| Juan 3.70 13.58 | 3.16 0.98 -1.35 0.80 -0.38 | 16.7 2.8 9.0 5.6 1.6 | 0.74 0.07 0.13 0.05 0.01 |
| Gabriel 3.70 6.23 | -2.27 0.25 -0.66 0.49 -0.59 | 8.6 0.2 2.1 2.1 3.8 | 0.83 0.01 0.07 0.04 0.06 |
| Juan Carlos 3.70 6.23 | -2.27 0.25 -0.66 0.49 -0.59 | 8.6 0.2 2.1 2.1 3.8 | 0.83 0.01 0.07 0.04 0.06 |
| Judith 3.70 9.15 | 2.55 0.19 0.99 -0.39 1.21 | 10.9 0.1 4.8 1.3 16.0 | 0.71 0.00 0.11 0.02 0.16 |
| Bertha 3.70 1.32 | -0.27 0.61 0.25 0.50 0.75 | 0.1 1.1 0.3 2.3 6.2 | 0.05 0.28 0.05 0.19 0.43 |
| Misael 3.70 1.71 | -1.18 0.16 -0.27 0.45 -0.12 | 2.3 0.1 0.4 1.8 0.2 | 0.81 0.01 0.04 0.12 0.01 |
| Carlos 3.70 9.51 | 0.91 1.88 2.01 0.36 -0.99 | 1.4 10.3 19.9 1.1 10.7 | 0.09 0.37 0.42 0.01 0.10 |
| Ivonne 3.70 1.87 | 1.20 -0.30 0.57 0.11 0.05 | 2.4 0.3 1.6 0.1 0.0 | 0.77 0.05 0.17 0.01 0.00 |
| Richard 3.70 5.19 | -0.03 -2.24 0.30 -0.07 -0.28 | 0.0 14.6 0.4 0.0 0.8 | 0.00 0.97 0.02 0.00 0.01 |
| Sergio 3.70 11.26 | 2.21 1.32 -1.98 -0.06 -0.84 | 8.2 5.1 19.3 0.0 7.8 | 0.43 0.16 0.35 0.00 0.06 |
| Cinthia 3.70 8.05 | -2.64 -0.15 0.29 0.67 0.71 | 11.7 0.1 0.4 4.0 5.5 | 0.87 0.00 0.01 0.06 0.06 |
| Nelson 3.70 1.68 | 0.06 -1.19 -0.40 0.23 -0.23 | 0.0 4.1 0.8 0.5 0.6 | 0.00 0.84 0.10 0.03 0.03 |
| Juan Jose 3.70 2.34 | 0.91 1.11 0.13 -0.21 -0.48 | 1.4 3.6 0.1 0.4 2.6 | 0.35 0.52 0.01 0.02 0.10 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+





GRAFICAS
Grfico de las proyecciones de las variables sobre los ejes factoriales.

Interpretacin.
Se puede evidenciar que los estudiantes que tienen mayor ingreso universitario,
suelen consultar un mayor nmero de libros, preparndose para su exposicin y al
mismo tiempo gastan ms en materiales como cds, papelografos, fotocopias, etc.
Por otro lado, los estudiantes que tienen una edad ms elevada, dentro del rango de
estudio, suelen tener un mayor nmero de disertaciones o exposiciones durante el
ao.




Grfico de las proyecciones de los individuos (estudiantes) sobre los ejes
factoriales.

Grafico de las proyecciones de las variables e individuos utilizando los ejes unitarios.



Anlisis de Correspondencias Mltiples (CORMU)
Como mencionamos anteriormente las tcnicas de anlisis de componentes
principales son tcnicas multivariadas que tienen por objeto reducir las dimensiones
de una tabla de datos formada por variables cualitativas. Si las variables son
cuantitativas estaramos hablando de anlisis de correspondencias.
Cuando se estudia conjuntamente el comportamiento de dos variables cualitativas
estamos hablando del anlisis de correspondencias simple, pero este anlisis puede
ser generalizado para el caso de que se disponen de un nmero mayor de variables;
en cuyo caso estamos ante el anlisis de correspondencias mltiple.
El objetivo del anlisis de correspondencias es establecer relaciones entre variables
no mtricas enriqueciendo la informacin que ofrecen las tablas de contingencia, que
slo comprueban si existe relacin entre las variables (test Ji-Cuadrada) y la
intensidad de dicha relacin (test V de Cramer). El anlisis de correspondencia
revela adems en qu grado contribuyen con esa relacin detectando los distintos
valores de las variables, informacin que se presenta de forma grfica.
Podramos sintetizar diciendo que el anlisis de correspondencia bscale estudio de
la asociacin entre las categoras de mltiples variables no mtricas mediante un
mapa perceptual que permita observar la asociacin de forma grfica.
Est tcnica permite describir grandes tablas con variables cuantitativas, como por
ejemplo la codificacin de encuestas de satisfaccin de los clientes. Las filas de
estas tablas suelen ser individuos u observaciones y las columnas son las
modalidades de las variables nominales (modalidades de respuestas para cada una
de las preguntas de la encuesta). El anlisis de correspondencia mltiple puede
considerarse como un anlisis de correspondencia simple aplicando una tabla
disyuntiva completa, en lugar de una tabla de contingencia.
Se tiene un archivo con Q preguntas (q = 1, 2,Q) hechas a n individuos, es decir, n
fila. Cada pregunta presenta Pq modalidades de respuesta bajo forma disyuntiva
completa:


El archivo de datos codificados (respuestas codificadas en forma binaria) se presenta
en una matriz Z formada por la yuxtaposicin de Q submatrices



Cada Zq es de orden n x pq, la i ma fila contiene (Pq 1) ceros y slo un 1, en la
columna correspondiente a la modalidad de la pregunta q,
La matriz de datos Z tiene p columnas, a las cuales corresponden p puntos de Rn.
Esto es:



Siendo


Donde:
Q preguntas
Pq Modalidades para cada pregunta q
N individuos
El rango es: Z<[ P (Q 1) ]


En Rp, para calcular los factores de A.C. se debe maximizar la expresin:

La matriz de datos es:

La mtrica es: M = nQD-1
El criterio de ponderacin queda:


Sustituyendo la expresin anterior queda:




Los factores se obtienen as:


Las proyecciones de los puntos filas sobre los nuevos ejes es:






Propiedades del anlisis factorial de Correspondencias Mltiples
1. Las q subnubes de puntos correspondientes a las Pq modalidades de una pregunta q, tienen el
mismo centro de gravedad (1/n), que coincide con el centro de gravedad de la nube de puntos total.
Por lo tanto todos los factores estn centrados.
a) Las coordenadas del subconjunto de puntos relativos a las preguntas q son las colunas de :
ZqDq-1
b) Las ms relativas de los Pq puntos del subconjuntoq son los elementos diagonales de: (1/n)Dq
c) Por lo tanto las coordenadas del centro de gravedad son:


Jq: Subconjunto de los p valores con ndices correspondientes a q
2. La inercia total de la nube de puntos es:


Dnde:
Q: Es el nmero de preguntas
P: Nmero total de modalidades para las q preguntas


3. El cuadrado de la distancia de un punto modalidad j al centro de gravedad G, en Rn es:

Dnde:



4. Contribucin de la inercia total.
Contribucin de la modalidad j a la inercia total:



La proporcin de inercia debida a una modalidad o categora de respuesta j, est en funcin inversa al
nmero de efectivos en tal modalidad. Esta proporcin aumenta cuando el nmero de efectivos
disminuye. El mximo valor se obtiene cuando una modalidad tiene afecto cero.

Deben evitarse modalidades con baja tasa de respuesta.
II. contribucin de la pregunta q a la inercia total.
La proporcin de inercia debido a una pregunta es una funcin creciente del nmero de modalidades
de esa pregunta. Cuando una pregunta tiene dos categoras entonces Cq toma su mnimo valor: (1/Q)
Se cumple que:









Anlisis de los resultados

El anlisis de correspondencias mltiples, aplicado a los datos mtricos del presente
trabajo, se desarrollan a partir de una matriz de correlacin con 5 variables mtricas
y 27 observaciones. Las variables empleadas se presentan en el siguiente cuadro:
N
Variables Cualitativas
Abreviatura
1
Desempeo del estudiante en su disertacin.
Desemp
2
Sexo de la persona encuestada.
Sexo
3
A la persona encuestada, le gusta exponer.
Gus_exp
4
El estudiante suele ponerse nervioso.
Nervio
5
Factor de excelencia en las disertaciones del estudiante.
Fact_exc
6 Consulta en caso de dudas. Duda

Ya teniendo las variables, trabajamos con SPAD Versin 3.5.
Los resultados ms relevantes son:
Diagrama de barras de las variables categricas.
TRI-A-PLAT DES QUESTIONS ACTIVES
----------------------------+-----------------+----------------------------------------------------------------------------------
MODALITES | AVANT APUREMENT | APRES APUREMENT
IDENT LIBELLE | EFF. POIDS | EFF. POIDS HISTOGRAMME DES POIDS RELATIFS
----------------------------+-----------------+----------------------------------------------------------------------------------
2 . Sexo de la persona encuestada
Masc - Masculino | 12 12.00 | 12 12.00 ***************************
Feme - Femenino | 15 15.00 | 15 15.00 **********************************
----------------------------+-----------------+----------------------------------------------------------------------------------
3 . A la persona encuestada, le gusta exponer
SI - Si le gusta exponer | 20 20.00 | 20 20.00 *********************************************
NO - No le gusta exponer | 7 7.00 | 7 7.00 ****************
----------------------------+-----------------+----------------------------------------------------------------------------------
4 . El estudiante suele ponerse nervioso
Siem - Siempre | 10 10.00 | 10 10.00 ***********************
Avec - A veces | 17 17.00 | 17 17.00 **************************************
Nunc - Nunca | 0 0.00 |
----------------------------+-----------------+----------------------------------------------------------------------------------
6 . El desempeo del estudiante en su disertacion
1Des - Excelente | 0 0.00 |
2Des - Buena | 9 9.00 | 9 9.00 *********************
3Des - Regular | 15 15.00 | 15 15.00 **********************************
4Des - Malo | 3 3.00 | 3 3.00 *******
5Des - Pesimo | 0 0.00 |
----------------------------+-----------------+----------------------------------------------------------------------------------
7 . Factor de excelencia en las disertaciones del estudiante
Exp - Experiencia | 6 6.00 | 6 6.00 **************
Prep - preparacion | 9 9.00 | 9 9.00 *********************
Conf - Confianza | 12 12.00 | 12 12.00 ***************************
----------------------------+-----------------+----------------------------------------------------------------------------------
9 . Consulta en caso de dudas
1Dud - Estudiante | 3 3.00 | 3 3.00 *******
2Dud - Docente | 9 9.00 | 9 9.00 *********************
3Dud - Ambos | 12 12.00 | 12 12.00 ***************************
4Dud - Nadie | 3 3.00 | 3 3.00 *******
----------------------------+-----------------+----------------------------------------------------------------------------------



Podemos observar las frecuencias de cada una de las categoras.
Valores propios asociados al anlisis factorial.
VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..1.6667
SOMME DES VALEURS PROPRES .... 1.6667
HISTOGRAMME DES 10 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO | VALEUR | POURCENT.| POURCENT.| |
| | PROPRE | | CUMULE | |
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| 1 | 0.3600 | 21.60 | 21.60 | ******************************************************************************** |
| 2 | 0.3160 | 18.96 | 40.56 | *********************************************************************** |
| 3 | 0.2567 | 15.40 | 55.96 | ********************************************************** |
| 4 | 0.2340 | 14.04 | 70.00 | ***************************************************** |
| 5 | 0.1595 | 9.57 | 79.57 | ************************************ |
| 6 | 0.1114 | 6.68 | 86.26 | ************************* |
| 7 | 0.0907 | 5.44 | 91.70 | ********************* |
| 8 | 0.0567 | 3.40 | 95.10 | ************* |
| 9 | 0.0539 | 3.23 | 98.33 | ************ |
| 10 | 0.0278 | 1.67 | 100.00 | ******* |
+--------+------------+----------+----------+----------------------------------------------------------------------------------+

Ac se puedeobservarporejemplo, que se requiereconservar 6 ejesparaconservarpor
lo menosun 86% de la inercia.
Ya que este resultado es habitual en el CORMU, porque la variabilidad inicial suele
ser elevada, no hay de qu preocuparse.
Coordenadas, contribuciones y cosenos cuadrados de las variables
categricas.
COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES MODALITES ACTIVES
AXES 1 A 5
+------------------------------------------+-------------------------------+--------------------------+-------------------------+
| MODALITES | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES |
|------------------------------------------+-------------------------------+--------------------------+-------------------------|
| IDEN - LIBELLE P.REL DISTO | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5 |
+------------------------------------------+-------------------------------+--------------------------+-------------------------+
| 2 . Sexo de la persona encuestada |
| Masc - Masculino 7.41 1.25 | 0.65 0.05 -0.78 0.05 -0.03 | 8.6 0.1 17.7 0.1 0.0 | 0.34 0.00 0.49 0.00 0.00 |
| Feme - Femenino 9.26 0.80 | -0.52 -0.04 0.63 -0.04 0.03 | 6.9 0.0 14.1 0.1 0.0 | 0.34 0.00 0.49 0.00 0.00 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 15.5 0.1 31.8 0.2 0.1 +-------------------------+
| 3 . A la persona encuestada, le gusta exponer |
| SI - Si le gusta exponer 12.35 0.35 | 0.33 0.37 0.11 0.19 0.09 | 3.8 5.4 0.5 1.9 0.7 | 0.32 0.39 0.03 0.11 0.02 |
| NO - No le gusta exponer 4.32 2.86 | -0.95 -1.06 -0.30 -0.55 -0.26 | 10.9 15.3 1.6 5.6 1.9 | 0.32 0.39 0.03 0.11 0.02 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 14.8 20.6 2.1 7.5 2.5 +-------------------------+
| 4 . El estudiante suele ponerse nervioso |
| Siem - Siempre 6.17 1.70 | -0.92 -0.60 0.05 0.03 -0.05 | 14.5 6.9 0.1 0.0 0.1 | 0.50 0.21 0.00 0.00 0.00 |
| Avec - A veces 10.49 0.59 | 0.54 0.35 -0.03 -0.02 0.03 | 8.5 4.1 0.0 0.0 0.1 | 0.50 0.21 0.00 0.00 0.00 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 23.0 11.0 0.1 0.0 0.2 +-------------------------+
| 6 . El desempeo del estudiante en su disertacion |
| 2Des - Buena 5.56 2.00 | 0.06 0.78 0.51 -0.25 -0.92 | 0.1 10.7 5.6 1.5 29.5 | 0.00 0.30 0.13 0.03 0.42 |
| 3Des - Regular 9.26 0.80 | 0.37 -0.53 -0.22 0.19 0.32 | 3.4 8.3 1.7 1.4 6.0 | 0.17 0.36 0.06 0.04 0.13 |
| 4Des - Malo 1.85 8.00 | -2.01 0.33 -0.45 -0.20 1.15 | 20.8 0.6 1.4 0.3 15.3 | 0.51 0.01 0.02 0.01 0.17 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 24.3 19.7 8.7 3.2 50.8 +-------------------------+
| 7 . Factor de excelencia en las disertaciones del estudiante |
| Exp - Experiencia 3.70 3.50 | -0.90 0.91 -0.76 0.73 0.04 | 8.3 9.7 8.4 8.5 0.0 | 0.23 0.24 0.17 0.15 0.00 |
| Prep - preparacion 5.56 2.00 | 0.36 0.26 -0.18 -0.99 0.60 | 2.0 1.2 0.7 23.3 12.3 | 0.06 0.03 0.02 0.49 0.18 |
| Conf - Confianza 7.41 1.25 | 0.18 -0.65 0.51 0.38 -0.47 | 0.7 10.0 7.6 4.5 10.1 | 0.03 0.34 0.21 0.11 0.17 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 10.9 20.9 16.6 36.4 22.5 +-------------------------+
| 9 . Consulta en caso de dudas |
| 1Dud - Estudiante 1.85 8.00 | 0.67 -1.54 -1.64 -0.35 -0.84 | 2.3 13.9 19.4 1.0 8.1 | 0.06 0.30 0.34 0.02 0.09 |
| 2Dud - Docente 5.56 2.00 | -0.64 0.72 -0.50 0.52 -0.28 | 6.2 9.1 5.5 6.4 2.7 | 0.20 0.26 0.13 0.13 0.04 |
| 3Dud - Ambos 7.41 1.25 | 0.14 0.07 0.53 -0.76 0.17 | 0.4 0.1 8.1 18.4 1.3 | 0.01 0.00 0.22 0.47 0.02 |
| 4Dud - Nadie 1.85 8.00 | 0.69 -0.88 1.03 1.85 1.01 | 2.5 4.6 7.6 27.0 11.8 | 0.06 0.10 0.13 0.43 0.13 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 11.4 27.6 40.6 52.8 23.9 +-------------------------+


Coordenadas y valores-test de las variables categricas.
COORDONNEES ET VALEURS-TEST DES MODALITES
AXES 1 A 5
+---------------------------------------------+-------------------------------+------------------------------------+----------+
| MODALITES | VALEURS-TEST | COORDONNEES | |
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LIBELLE EFF. P.ABS | 1 2 3 4 5 | 1 2 3 4 5 | DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
| 2 . Sexo de la persona encuestada |
| Masc - Masculino 12 12.00 | 3.0 0.2 -3.6 0.2 -0.1 | 0.65 0.05 -0.78 0.05 -0.03 | 1.25 |
| Feme - Femenino 15 15.00 | -3.0 -0.2 3.6 -0.2 0.1 | -0.52 -0.04 0.63 -0.04 0.03 | 0.80 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
| 3 . A la persona encuestada, le gusta exponer |
| SI - Si le gusta exponer 20 20.00 | 2.9 3.2 0.9 1.7 0.8 | 0.33 0.37 0.11 0.19 0.09 | 0.35 |
| NO - No le gusta exponer 7 7.00 | -2.9 -3.2 -0.9 -1.7 -0.8 | -0.95 -1.06 -0.30 -0.55 -0.26 | 2.86 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
| 4 . El estudiante suele ponerse nervioso |
| Siem - Siempre 10 10.00 | -3.6 -2.3 0.2 0.1 -0.2 | -0.92 -0.60 0.05 0.03 -0.05 | 1.70 |
| Avec - A veces 17 17.00 | 3.6 2.3 -0.2 -0.1 0.2 | 0.54 0.35 -0.03 -0.02 0.03 | 0.59 |
| Nunc - Nunca 0 0.00 | 0.0 0.0 0.0 0.0 0.0 | 0.00 0.00 0.00 0.00 0.00 | 0.00 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
| 6 . El desempeo del estudiante en su disertacion |
| 1Des - Excelente 0 0.00 | 0.0 0.0 0.0 0.0 0.0 | 0.00 0.00 0.00 0.00 0.00 | 0.00 |
| 2Des - Buena 9 9.00 | 0.2 2.8 1.8 -0.9 -3.3 | 0.06 0.78 0.51 -0.25 -0.92 | 2.00 |
| 3Des - Regular 15 15.00 | 2.1 -3.0 -1.2 1.1 1.8 | 0.37 -0.53 -0.22 0.19 0.32 | 0.80 |
| 4Des - Malo 3 3.00 | -3.6 0.6 -0.8 -0.4 2.1 | -2.01 0.33 -0.45 -0.20 1.15 | 8.00 |
| 5Des - Pesimo 0 0.00 | 0.0 0.0 0.0 0.0 0.0 | 0.00 0.00 0.00 0.00 0.00 | 0.00 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
| 7 . Factor de excelencia en las disertaciones del estudiante |
| Exp - Experiencia 6 6.00 | -2.4 2.5 -2.1 2.0 0.1 | -0.90 0.91 -0.76 0.73 0.04 | 3.50 |
| Prep - preparacion 9 9.00 | 1.3 0.9 -0.6 -3.6 2.1 | 0.36 0.26 -0.18 -0.99 0.60 | 2.00 |
| Conf - Confianza 12 12.00 | 0.8 -3.0 2.3 1.7 -2.1 | 0.18 -0.65 0.51 0.38 -0.47 | 1.25 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
| 9 . Consulta en caso de dudas |
| 1Dud - Estudiante 3 3.00 | 1.2 -2.8 -3.0 -0.6 -1.5 | 0.67 -1.54 -1.64 -0.35 -0.84 | 8.00 |
| 2Dud - Docente 9 9.00 | -2.3 2.6 -1.8 1.9 -1.0 | -0.64 0.72 -0.50 0.52 -0.28 | 2.00 |
| 3Dud - Ambos 12 12.00 | 0.6 0.3 2.4 -3.5 0.8 | 0.14 0.07 0.53 -0.76 0.17 | 1.25 |
| 4Dud - Nadie 3 3.00 | 1.2 -1.6 1.9 3.3 1.8 | 0.69 -0.88 1.03 1.85 1.01 | 8.00 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+

Coordenadas de los individuos en el espacio factorial.
COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS
AXES 1 A 5
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| INDIVIDUS | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES |
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFICATEUR P.REL DISTO | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| Jhomara 3.70 1.16 | -0.01 0.45 0.40 0.27 -0.63 | 0.0 2.4 2.3 1.1 9.3 | 0.00 0.18 0.14 0.06 0.34 |
| Lidia 3.70 2.41 | -0.67 0.59 0.01 -0.03 0.63 | 4.6 4.1 0.0 0.0 9.1 | 0.19 0.14 0.00 0.00 0.16 |
| Lizeth 3.70 1.64 | -0.56 -0.44 0.63 -0.41 -0.63 | 3.2 2.3 5.8 2.7 9.2 | 0.19 0.12 0.25 0.10 0.24 |
| Maribel 3.70 1.96 | 0.44 -0.41 0.67 0.88 0.42 | 2.0 2.0 6.4 12.2 4.2 | 0.10 0.09 0.23 0.39 0.09 |
| Rosa 3.70 1.44 | -0.48 -0.83 0.40 -0.26 -0.11 | 2.3 8.1 2.3 1.1 0.3 | 0.16 0.48 0.11 0.05 0.01 |
| Efrain 3.70 0.91 | 0.61 -0.10 0.04 0.01 0.05 | 3.9 0.1 0.0 0.0 0.1 | 0.41 0.01 0.00 0.00 0.00 |
| Karen 3.70 1.57 | -0.43 -0.56 0.17 -0.73 0.33 | 1.9 3.7 0.4 8.5 2.5 | 0.12 0.20 0.02 0.34 0.07 |
| Victor 3.70 2.16 | 0.81 -0.31 -0.90 -0.32 0.07 | 6.8 1.1 11.7 1.6 0.1 | 0.30 0.04 0.37 0.05 0.00 |
| Norma 3.70 1.16 | -0.01 0.45 0.40 0.27 -0.63 | 0.0 2.4 2.3 1.1 9.3 | 0.00 0.18 0.14 0.06 0.34 |
| Stella 3.70 3.14 | -1.65 0.08 -0.44 0.17 0.26 | 28.0 0.1 2.8 0.4 1.6 | 0.87 0.00 0.06 0.01 0.02 |
| Ximena 3.70 0.96 | 0.34 0.14 0.28 -0.49 0.51 | 1.2 0.2 1.1 3.8 6.1 | 0.12 0.02 0.08 0.25 0.27 |
| Pascuala 3.70 1.04 | 0.20 0.26 0.74 -0.17 -0.45 | 0.4 0.8 7.9 0.5 4.6 | 0.04 0.06 0.53 0.03 0.19 |
| Rossio 3.70 1.16 | 0.25 0.53 0.51 -0.64 0.00 | 0.7 3.3 3.8 6.6 0.0 | 0.06 0.24 0.23 0.36 0.00 |
| Santiago 3.70 2.64 | 0.00 -1.28 -0.78 -0.09 -0.55 | 0.0 19.3 8.8 0.1 7.1 | 0.00 0.62 0.23 0.00 0.12 |
| Juan 3.70 1.41 | 0.10 0.55 -0.72 0.57 0.07 | 0.1 3.6 7.5 5.2 0.1 | 0.01 0.22 0.37 0.23 0.00 |
| Gabriel 3.70 1.24 | 0.58 0.56 0.05 -0.61 -0.03 | 3.4 3.6 0.0 5.9 0.0 | 0.27 0.25 0.00 0.30 0.00 |
| Juan Carlos 3.70 1.04 | 0.66 0.17 -0.19 -0.46 0.49 | 4.5 0.3 0.5 3.4 5.6 | 0.42 0.03 0.03 0.20 0.23 |
| Judith 3.70 2.15 | 0.04 -0.69 0.69 0.89 0.39 | 0.0 5.6 7.0 12.6 3.5 | 0.00 0.22 0.22 0.37 0.07 |
| Bertha 3.70 1.03 | -0.12 -0.41 0.53 -0.01 0.04 | 0.1 2.0 4.1 0.0 0.0 | 0.01 0.16 0.27 0.00 0.00 |
| Misael 3.70 1.16 | 0.45 0.36 -0.53 -0.02 0.30 | 2.1 1.5 4.0 0.0 2.2 | 0.17 0.11 0.24 0.00 0.08 |
| Carlos 3.70 2.04 | 0.77-0.39 0.20 0.91 0.40 | 6.1 1.7 0.6 13.1 3.7 | 0.29 0.07 0.02 0.41 0.08 |
| Ivonne 3.70 1.72 | -0.72 0.64 0.01 0.41 -0.46 | 5.3 4.7 0.0 2.6 4.8 | 0.30 0.23 0.00 0.10 0.12 |
| Richard 3.70 2.46 | 0.40 -1.00 -0.81 -0.10 -0.52 | 1.7 11.8 9.5 0.2 6.3 | 0.07 0.41 0.27 0.00 0.11 |
| Sergio 3.70 1.24 | 0.58 0.56 0.05 -0.61 -0.03 | 3.4 3.6 0.0 5.9 0.0 | 0.27 0.25 0.00 0.30 0.00 |
| Cinthia 3.70 2.89 | -1.30 -0.11 -0.25 -0.43 0.49 | 17.4 0.1 0.9 2.9 5.6 | 0.58 0.00 0.02 0.06 0.08 |
| Nelson 3.70 1.60 | -0.31 0.27 -0.69 0.59 0.04 | 1.0 0.9 6.9 5.5 0.0 | 0.06 0.05 0.30 0.22 0.00 |
| Juan Jose 3.70 1.61 | 0.01 0.94 -0.48 0.42 -0.45 | 0.0 10.4 3.3 2.8 4.6 | 0.00 0.55 0.14 0.11 0.12 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+

Podemos observar que estudiantes estn bien representados en los ejes, a partir de
las contribuciones y los cosenos cuadrados.
Grfica de las proyecciones de las variables e individuos.

Los estudiantes Juan Jos, Juan, Rossio, Norma, suelen realizar buenas
exposiciones.
Las estudiantes Stella y Cinthia, tienden a realizar malas exposiciones.
Las estudiantes Ivonne y Lidia, sueen consultar a docentes cuando tienen dudas,
pero les falta ms experiencia para realizar mejores exposiciones.
A las estudiantes Karen, Lizeth y Rosa, no les gusta mucho exponer, y siempre se
colocan nerviosas en su defensa.
Los estudiantes Nelson, Bertha, Norma y Pascuala, tienden a realizar un desempeo
psimo en sus exposiciones.
A los estudiantes Sergio, Rossio, Pascuala, Ximena y Juan Carlos les gusta exponer,
colocndose nervosos en las misma solo en algunas ocasiones, por lo que para
tener un mejor desempeo en las disertaciones necesitan algo ms de preparacin.
Los estudiantes Victor, Carlos, Efrain, Maribel, Judith, Richard y Santiago suelen
tener exposiciones con desempeo regular, esto puede estar explicado porque les
falta confianza en si mismo, y no suelen consultar a nadie cuando tienen alguna
duda, limitndose a estudiar independientemente.
CONCLUSION:
Del anlisis realizado con el SPAD, se puede concluir.
El anlisis de componentes principales (ACP) logro concluir que los
estudiantes que tienen mayor ingreso universitario, suelen consultar un mayor
nmero de libros, preparndose para su exposicin y al mismo tiempo gastan
ms en materiales como cds, papelografos, fotocopias, etc.
Los estudiantes que tienen una edad ms elevada, dentro del rango de
estudio, suelen tener un mayor nmero de disertaciones o exposiciones
durante el ao.
El anlisis de correspondencias mltiples (CORMU) detecta la mayora de los
estudiantes que tienen un desempeo regular o psimo, generalmente resulta
por la falta de preparacin y confianza en s mismo, por lo que llegan a
colocarse nerviosos a la hora de exponer o defender su proyecto.












BIBLIOGRAFIA

ALCAIDE INCHAUSTI, A. (1976) Estadstica aplicada a las Ciencias Sociales.

ALVAREZ CRUZ, O. (2009), Importancia del clima laboral en las empresas de servicio

BATISTA, J.M. (1984) Componentes Principales y Anlisis Factorial (exploratorio y
confirmatorio). En J.J. Snchez Carrin (Edit.) Introduccin a las tcnicas de Anlisis
Multivariable aplicadas a las Ciencias Sociales. Madrid: CIS
BECUE BERTAUT, M. (2004). Manual de introduccin a los mtodos factoriales y
clasificacin con SPAD.
BISQUERRA ALZINA, R. (1980) Introduccin conceptual al Anlisis Multivariable. Un
enfoque informtico con los paquetes SPSS-X, BMDP, LISREL y SPAD (Vol I y Vol II).
Barcelona: PPU.
CALVO, Flix Estadstica aplicada. Bilbao: Ediciones Deusto
CUADRAS, C.M. (1994) Mtodos de Anlisis Multivariable Barcelona: PPU
GARCA FERRANDO M. (1985) Socioestadstica. Madrid: Alianza Universidad
SOTO, M. (2012). Estadstica aplicada. Impresiones Gratec. Potos. Bolivia.

También podría gustarte