Está en la página 1de 10

UNIVERSIDAD AUTNOMA DE QUERETARO

Pruebas psicomtricas
Anlisis de factores
Ramn Correa Ramrez 19/03/2012

Se realiza un anlisis exploratorio de un conjunto de datos de test psicomtricos. Posteriormente se realiza un anlisis factorial (factor analysis)

Dado que el conjunto est dividido en tres pruebas haremos un anlisis separado para cada prueba (adems as disminuimos el nmero de variables). Nuestros tres subconjuntos son llamados: Test1 Gordon Angellini

Test1

Test1 consiste en 6 variables las cuales son llamadas: VERBAL NUMEROS ESPACIAL F.VERBAL RACIOCINIO C.I

En donde se tiene que: Variable Media Mediana Desv. estndar VERBAL 23.7575 23 6.552816 ESPACIAL 11.9393 11 8.764058 RACIOCINIO 13.1818 14 5.410953 NUMEROS 15.1212 13 5.655515 F.VERBAL 43.5454 42 11.85087 C.I 154.3030 156.25 46.02546

Una primera observacin es que el sesgo de la media a la mediana es muy ligero, por lo que parece que las variables se comportan de manera simtrica. Aunque las siguientes grficas de caja revelan la presencia de atpicos en las variables VERBAL y NUMEROS

Donde los colores en los datos corresponden a aquellos dados por el diagnstico.

En las grficas de pares claramente se aprecia que la variable ESPACIAL tiene una relacin casi nula con las dems variables, y las variables altamente relacionadas son (RACIOCINIO, C.I) y (F.VERBAL, C.I). En la grfica de estrellas no se puede ver realmente mucho, las estrellas rojas son pequeas en varias dimensiones, tambin las amarillas, mientras que las verdes tienen altos valores en todas las variables. Lo siguiente es realizar un anlisis de factores, pero para esto es necesario retirar una variable pues la matriz de correlaciones resulta ser singular, lo que es seal de que una variable es una combinacin lineal de las dems. Se decide retirar a variable C.I. Se decide utilizar un anlisis con 2 factores basado en la mxima verosimilitud y una rotacin con el criterio de varianza mxima. Resulta, entonces, esta matriz residual VERBAL 0.3322292727 0.0007517150 0.0002265901 -0.0006190598 0.0013720162 ESPACIAL 0.0007517150 0.9198837 -0.00003490708 0.0024636726 -0.0024081632 RACIOCINIO 0.0002265901 -0.00003490708 0.1744584 0.0020271431 -0.0002651666 NUMEROS -0.0006190598 0.0024636726 0.0020271431 0.7538309759 -0.0020549788 F.VERBAL 0.0013720162 -0.0024081632 -0.0002651666 -0.0020549788 0.4460309699

VERBAL ESPACIAL RACIOCINIO NUMEROS F.VERBAL

Donde se aprecia que los elementos fuera de la diagonal son bastante cercanos a cero, lo cual es bueno. Tambin se tiene esta comunalidad: VERBAL 0.68696187 ESPACIAL 0.07038343 RACIOCINIO 0.83784099 NUMEROS 0.24459833 F.VERBAL 0.54832258

Que indica que la varianza de RACIOCINIO ha sido recuperada de manera satisfactoria por los factores
VERBAL ESPACIAL RACIOCINIO NUMEROS F.VERBAL ML1 ML2 h2 u2 0.72 0.41 0.69 0.31 0.01 0.27 0.07 0.93 0.91 -0.05 0.84 0.16 0.49 -0.03 0.24 0.76 0.72 0.18 0.55 0.45 ML1 ML2 SS loadings 2.11 0.27 Proportion Var 0.42 0.05 Cumulative Var 0.42 0.48

El primer factor depende fuertemente de RACIOCINIO, VERBAL y F.VERBAL por lo que nombrarlo como Factor de habilidad lingstica parece apropiado. El segundo factor es ms difcil de pensar pues ninguna variable es fuertemente recuperada ah. Adems, entre ambos factores slo se explica el 0.48 de la varianza total, por lo que parece ser que un anlisis de factores no es apropiado en esta situacin.

Gordon
A S O

Gordon consiste en 9 variables las cuales son llamadas:

R AE P

E C V

En donde se tiene que: Variable O P V A R E S AE C Media 68.23529 75.29412 73.20588 50.97059 69.67647 58.85294 58.35294 55.73529 61.02941 Mediana 67 54.5 65 77 84.5 80 50 77.5 56 Desv. Stdr. 27.31307 20.43694 21.08105 22.32879 29.09512 23.77691 24.83385 27.14753 23.80538 En este conjunto se observan mayores sesgos, aunque tal vez engaoso pues la desviacin estndar es bastante alta. Con las grficas de caja de observa mejor el comportamiento de las variables. Adems, en los histogramas se entiende que estas variables son ms bien irregulares.

Donde los colores en los datos corresponden a aquellos dados por el diagnstico

Casi todas las correlaciones oscilan entre 0.10 y 0.6 as que no se puede decir mucho de la relacin entre las variables, no obstante parece ser que las variables (A,R), (E,S) y (C,V) no tienen relacin, pues sus covarianzas son del orden de 0.02. Los colores siguen siendo intrigantes pues no hay una razn clara por la que los datos 6, 29 y 30 tienen colores distintos. Procediendo con el anlisis de factores, otra vez se usa un anlisis basado en la mxima verosimilitud y una rotacin con el criterio de varianza mxima, pero ahora se usan 3 factores. (Por razones de espacio no se pone la matriz residual, pero igualmente resulta que fuera de la diagonal, en general, es cercana a cero) AE C O P V A R E S 0.9950149 0.6167595 0.7405447 0.9950092 0.9950543 0.3893693 0.3735424 0.1328143 0.3219591
ML3 ML1 ML2 h2 u2 A -0.01 0.97 0.21 1.00 0.0050 R 0.79 -0.01 -0.01 0.62 0.3832 E 0.82 0.26 0.00 0.74 0.2595 S -0.11 0.33 0.94 1.00 0.0050 AE 0.54 0.70 0.47 1.00 0.0049 C 0.55 -0.09 -0.27 0.39 0.6106 O 0.58 0.15 0.13 0.37 0.6265 P 0.31 0.16 0.10 0.13 0.8672 V 0.25 0.39 0.33 0.32 0.6780 ML3 ML1 ML2 SS loadings 2.39 1.82 1.35 Proportion Var 0.27 0.20 0.15 Cumulative Var 0.27 0.47 0.62

Con tres factores hemos recuperado un 0.62 de la varianza total, lo que es algo ms aceptable

Aqu la comunalidad par A, S, AE y E es muy alta El primer factor consta principalmente de A y AE, el segundo factor S y algo de AE, y el tercer factor R y E con contribucin mediana de AE, O y C.

Angellini
NUM DEST

Angellini consiste en 6 variables las cuales son llamadas: MEC PRACT CIENT CALIF

En donde se tiene que: Variable Media Mediana Desv. estndar NUM 15.41176 15 2.48776 MEC 15.14706 15.5 2.583542 CIENT 13.58824 14 2.536015 DEST 15.94118 16 2.436356 PRACT 15.5 15 2.477168 CALIF 8.529412 9 1.375881

Con esa informacin parece ser que las variables estn muy bien comportadas: sin sesgo y con poca desviacin respecto de la media. Ahora bien, las grficas de cajas cambian un poco esta visin evidenciando la presencia de algunos datos atpicos en la variable CIENT, ese datos es (31 ~ 6), y en la variable CALIF, ese dato es (31 ~ 5) as como un comportamiento ms sesgado para la variable DEST.

Donde los colores en los datos corresponden a aquellos dados por el diagnstico.

Claramente se aprecia que el dato 31 es un atpico. De nuevo no parece haber algo que nos diga de donde provienen los colores determinado en el diagnstico. Se decide utilizar un anlisis con 2 factores basado en la mxima verosimilitud y una rotacin con el criterio de varianza mxima. Esta es la matriz residual del anlisis de factores: NUM MEC CIENT DEST PRACT CALIF NUM 0.8818453103 0.0008127665 -0.0002434214 -0.0788864749 -0.0433556807 0.0351502331 MEC 0.0008127665 0.1905664880 -0.0001132991 0.0127241872 -0.0379830214 0.0044220071 CIENT -0.0002434214 -0.0001132991 4.998829e-03 0.0004872706 -0.0002740496 1.601656e-05 DEST -0.0788864749 0.0127241872 0.0004872706 0.4016145162 0.0641475638 -0.0260997893 PRACT -0.0433556807 -0.0379830214 -0.0002740496 0.0641475638 0.6180841131 0.0167811645 CALIF 0.0351502331 0.0044220071 1.601656e-05 -0.0260997893 0.0167811645 0.1432833 NUM 0.1181547
NUM MEC CIENT DEST PRACT CALIF ML2 0.14 0.84 0.29 0.65 0.60 0.73 ML1 0.31 0.33 0.95 0.42 0.15 0.56 h2 0.12 0.81 1.00 0.60 0.38 0.86

MEC 0.8094335
u2 0.882 0.191 0.005 0.402 0.618 0.143

CIENT 0.9950012

DEST 0.593855

PRACT 0.3819159

CALIF 0.8567167

ML2 ML1 SS loadings 2.13 1.63 Proportion Var 0.35 0.27 Cumulative Var 0.35 0.63

Con los dos factores se acumula un 0.63 de la varianza total, lo que es aceptable. Nuestro primer factor est ampliamente dominado por la variable CIENT, con una menor aportacin de CALIF y DEST. Podemos llamarlo Factor de aptitud a investigacin Mientras que el segundo factor depende ms de las variables MEC, CALIF y DEST as que podemos llamarlo Factor de habilidad de aplicacin

También podría gustarte