Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3.
3.2.
3.2.1.
3.2.2.
3.2.3.
3.2.4.
3.2.5.
3.3.
3.3.1.
Presentacin .......................................................................................................................61
3.3.2.
3.3.3.
Conclusiones ......................................................................................................................64
3.4.
3.4.1.
3.4.2.
3.4.3.
TABLAS Y GRAFICOS
Tabla 3-1: Rendimiento acadmico de estudiantes ......................................................................................54
Tabla 3-2: Tabla disyuntiva completa del ejemplo ......................................................................................55
Tabla 3-3: Tabla de Burt (B) ........................................................................................................................56
Tabla 3-4: Histograma de valores propios ...................................................................................................58
Tabla 3-5: Coordenadas, contribuciones y cosenos cuadrados ....................................................................59
Tabla 3-6: Coordenadas, contribuciones y cosenos cuadrados para algunos individuos .............................59
Grfico 3-1: Primer plano factorial del ejemplo ..........................................................................................59
Tabla 3-7: Coordenadas y valores test de las modalidades ilustrativas........................................................61
Tabla 3-8: Correlaciones entre las variables continuas y los factores..........................................................61
Tabla 3-9: Variables activas del ACM perfil sociodemogrfico de investigadores ....................................62
Grfico 3-2: Valores propios del ACM perfil sociodemogrfico................................................................63
Grfico 3-3: Primer plano factorial del ACM perfil sociodemogrfico ......................................................63
Tabla 3-10: Coordenadas y valores test de las modalidades ilustrativas perfil sociodemogrfico .............64
Tabla 3-11: Correlaciones entre las variables continuas ilustrativas y los factores ....................................64
Grfico 3-4: Primer plano factorial del ACM del perfil sociodemogrfico con variables activas e
ilustrativas ....................................................................................................................................................65
Tabla 3-12: Distribucion de frecuencias de las variables activas................................................................67
Tabla 3-14: Valores propios........................................................................................................................68
Pardo C.E. y Cabarcas G.
ii
53
3.1.
Dominio de aplicacin
3.2.
Se parte de una tabla de individuos x variables categricas. La tabla puede ser numrica pero los nmeros
estn indicando la modalidad de la variable que asume el individuo de la fila. Sin embargo los nmeros
de la tabla no tienen significado aritmtico, es decir no tiene ningn sentido sumarlos u obtener alguna
estadstica descriptiva. Una tabla as se suele denominar de cdigo condensado y aqu se denota con la
letra R, de tamao (n,s), donde n representa al nmero de individuos y s el nmero de variables. Para
mostrar los elementos del mtodo utilizaremos la Tabla 3-1 (primer recuadro), donde puede leerse por
ejemplo que el estudiante A03 logr B en ingls, sociales y dibujo; y C en ciencias y matemticas. A
partir de la tabla R se pueden construir dos tablas con significado numrico: la tabla disyuntiva completa
(TDC) y la tabla de Burt.
3.2.1.
Una variable categrica asigna a cada individuo de una poblacin una modalidad y divide a la poblacin
en tantos subconjuntos como modalidades tenga. Por ejemplo el logro alcanzado por un estudiante en
ingls puede ser:
1 Bueno (B), 2 Aceptable (C) o 3 - Deficiente (D)
Los estudiantes de este curso se dividen entonces en 3 grupos segn su rendimiento en ingls. La
codificacin disyuntiva completa se hace recurriendo a una variable indicadora por cada modalidad, es
decir una variable que toma el valor de 1 si el individuo asume la modalidad y cero si no. Por ejemplo
para la nota de ingls se tiene:
InglsBueno:
0 No, 1 S
InglsAceptable: 0 No, 1 Si
InglsDeficiente:
0 No, 1 S
La variable indica a su vez la pertenencia o no a cada uno de los grupos. El nombre, disyuntiva completa,
de esta codificacin se debe a que se exige a cada individuo pertenecer a una y solo una de las
Pardo C.E. y Cabarcas G.
54
modalidades, entonces aparece siempre uno en un solo lugar bajo las modalidades pertenecientes a una
sola variable. La Tabla 3-2 es la tabla disyuntiva completa derivada de la tabla R que representa a los 40
estudiantes de un curso descritos por sus logros alcanzados en cada una de las materias. (Tabla 3-1, primer
recuadro).
Tabla 3-1: Rendimiento acadmico de estudiantes
IDE
A01
A02
A03
A04
A05
A06
A07
A08
A09
A10
A11
A12
A13
A14
A15
A16
A17
A18
A19
A20
A21
A22
A23
A24
A25
A26
A27
A28
A29
A30
A31
A32
A33
A34
A35
A36
A37
A38
A39
A40
INGL
1
2
2
2
1
1
2
1
2
1
2
1
1
2
1
1
2
2
3
1
2
2
2
2
2
1
2
2
1
2
2
2
2
2
2
2
2
2
1
3
MATE
2
2
3
3
1
2
2
2
2
2
3
2
2
2
3
1
3
2
3
3
2
2
2
3
3
2
2
2
2
2
3
3
2
3
2
3
3
3
2
2
EstuTare
3.
3.
3.
3.
2.
3.
2.
3.
2.
4.
2.
2.
4.
3.
2.
3.
3.
3.
3.
3.
3.
3.
3.
3.
4.
2.
2.
4.
3.
3.
3.
3.
2.
2.
3.
3.
2.
4.
2.
2.
AVerbal
86.
34.
51.
15.
73.
70.
57.
76.
60.
47.
78.
51.
25.
57.
25.
70.
57.
44.
41.
13.
25.
18.
86.
6.
38.
76.
31.
25.
1.
38.
49.
73.
1.
36.
47.
1.
45.
55.
76.
31.
La tabla disyuntiva completa denotada por Z es de tamao (n,p), donde p es el nmero total de
modalidades. Las suma de cada una de sus filas es igual a s, el nmero de variables y la suma de cada
columna es el nmero de individuos que asume la modalidad respectiva. En el ejemplo la TDC es de
tamao 40 x 12. Son s = 4 variables, cada una con 3 modalidades. La suma de las filas es igual a 4, el
55
nmero de variables. El nmero de individuos que asume cada una de las modalidades aparece en parte
inferior de la Tabla 3-2.
Sometiendo la tabla disyuntiva completa a un anlisis de correspondencias simples se logran los objetivos
que se persiguen en una descripcin multivariada de una tabla de individuos x variables categricas.
Tabla 3-2: Tabla disyuntiva completa del ejemplo
IDE
A01
A02
A03
A04
A05
A06
A07
A08
A09
A10
A11
A12
A13
A14
A15
A16
A17
A18
A19
A20
A21
A22
A23
A24
A25
A26
A27
A28
A29
A30
A31
A32
A33
A34
A35
A36
A37
A38
A39
A40
Suma
INGL
1 0 0.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
1 0 0.
0 1 0.
1 0 0.
0 1 0.
1 0 0.
0 1 0.
1 0 0.
1 0 0.
0 1 0.
1 0 0.
1 0 0.
0 1 0.
0 1 0.
0 0 1.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
0 0 1.
13 25 2
MATE
0 1 0.
0 1 0.
0 0 1.
0 0 1.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
1 0 0.
0 0 1.
0 1 0.
0 0 1.
0 0 1.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
0 0 1.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
0 0 1.
0 1 0.
0 0 1.
0 1 0.
0 0 1.
0 0 1.
0 0 1.
0 1 0.
0 1 0.
2 23 15
CIEN
0 1 0.
1 0 0.
0 0 1.
0 1 0.
1 0 0.
0 0 1.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
1 0 0.
1 0 0.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
0 0 1.
1 0 0.
1 0 0.
0 1 0.
1 0 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 0 1.
0 1 0.
0 0 1.
0 0 1.
0 1 0.
0 0 1.
10 21 9
SOCI
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 0 1.
0 0 1.
0 1 0.
0 0 1.
0 1 0.
0 0 1.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
1 0 0.
0 0 1.
0 0 1.
1 0 0.
0 0 1.
0 1 0.
0 1 0.
0 0 1.
0 0 1.
1 0 0.
0 1 0.
7 22 11
DIBU
0 1 0.
0 1 0.
0 1 0.
0 1 0.
0 0 1.
1 0 0.
0 1 0.
1 0 0.
0 1 0.
1 0 0.
0 1 0.
1 0 0.
1 0 0.
0 1 0.
1 0 0.
1 0 0.
0 1 0.
0 1 0.
0 0 1.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
0 1 0.
0 1 0.
1 0 0.
0 1 0.
0 1 0.
1 0 0.
1 0 0.
1 0 0.
0 0 1.
14 23 3
El anlisis de correspondencias de la tabla de Burt, que es una tabla que yuxtapone todas las tablas de
contingencia de las variables cruzadas de dos en dos, produce planos equivalentes para las modalidades.
Para el ejemplo, la tabla de Burt (B) (Tabla 3-3), tiene tamao 12 x 12. La tabla B es simtrica y por lo
tanto es suficiente mostrar la parte triangular inferior. Est conformada por 16 subtablas. Las cuatro
subtablas diagonales son a su vez diagonales y contienen las frecuencias marginales de cada una de las
Pardo C.E. y Cabarcas G.
56
variables. Las 6 subtablas de la parte inferior son las tablas de contingencia entre parejas de variables y las
6 subtablas de la parte superior (no se muestran), son las transpuestas de las anteriores. En la Tabla 3-3 se
puede leer, por ejemplo, 13 estudiantes lograron B en ingls, 25 lograron C y 2 no alcanzaron el logro en
ingls (D). De los 25 estudiantes que lograron B en ingls 13 alcanzaron B en matemticas y 12 lograron
C.
Tabla 3-3: Tabla de Burt (B)
| ingB ingC ingD | matA matB matC | cieB cieC cieD | dibB dibC dibD |
-----+----------------+----------------+----------------+----------------+
ingB |
13
0
0 |
ingC |
0
25
0 |
ingD |
0
0
2 |
-----+----------------+----------------+
matA |
2
0
0 |
2
0
0 |
matB |
9
13
1 |
0
23
0 |
matC |
2
12
1 |
0
0
15 |
-----+----------------+----------------+----------------+
cieB |
5
5
0 |
2
7
1 |
10
0
0 |
cieC |
6
14
1 |
0
11
10 |
0
21
0 |
cieD |
2
6
1 |
0
5
4 |
0
0
9 |
-----+----------------+----------------+----------------+----------------+
dibB |
10
4
0 |
1
7
6 |
4
7
3 |
14
0
0 |
dibC |
2
21
0 |
0
15
8 |
5
13
5 |
0
23
0 |
dibD |
1
0
2 |
1
1
1 |
1
1
1 |
0
0
3 |
-----+----------------+----------------+----------------+----------------+
| ingB ingC ingD | matA matB matC | cieB cieC cieD | dibB dibC dibD |
3.2.2.
z ij
ns
La sumas de las filas de F son todas iguales a 1/n , que ser el peso de cada individuo en la nube de
perfiles fila.
La suma de una columna j de la tabla F es:
f. j =
z j
ns
nj
ns
notacin explicita mejor el significado de la suma de las columnas de Z: nmero de individuos que
asumen la modalidad j.
Nube de perfiles fila
Los perfiles fila que representan a los individuos del anlisis son histogramas cuyas barras solo pueden
tomar dos valores: cero, cuando el individuo no asume la modalidad o 1/s, el inverso del nmero de
variables, cuando la asume. Todos los individuos tienen asociado el mismo peso: 1/n.
La distancia ji-cuadrado entre dos perfiles individuos se transforma en:
57
1 p n
d (i, l ) = (z ij z lj )
s j =1 n j
2
Como los elementos de zij son 1 o 0, dos individuos estn prximos si asumen ms o menos las mismas
modalidades. Cuando un individuo asume una modalidad de frecuencia baja aparece ms alejado de los
dems.
Nube de modalidades
El perfil j de una modalidad se obtiene dividiendo cada elemento de la tabla Z de la columna j por el total
de la columna, nj. Entonces el perfil de una modalidad toma valores 0 o 1/nj, o sea que en el histograma
aparece cero o una barra de altura 1/nj . Los histogramas de dos modalidades se pueden diferenciar tanto
en la posicin de las barras como en su altura. Son ms altas las barras del perfil de las modalidades que
son asumidas por pocos individuos. El peso de cada modalidad en el anlisis es proporcional a su
frecuencia nj .
La distancia entre dos modalidades j y k es igual al porcentaje de individuos que poseen j pero no k ms el
porcentaje de individuos que poseen k pero no j. Es decir que esta distancia crece con el nmero de
individuos que poseen una y solo una de las modalidades j o k y decrece con la frecuencia de cada una de
estas modalidades (Escofier y Pags, 1992, pg.58).
En Lebart et al. (1995) aparecen demostrados los siguiente hechos y sus consecuencias prcticas:
-
El nmero de ejes que soporta la nube de modalidades o de individuos es p-s, nmero de variables
menos nmero de modalidades. En el ejemplo 12 modalidades menos 4 variables = 8 ejes (ver
Tabla 3-4).
La parte de la inercia debida a una modalidad de una variable es ms grande si la modalidad tiene
frecuencia ms baja. Se deben evitar las modalidades de muy baja frecuencia.
La parte de la inercia debida a una variable (suma de la inercia de sus modalidades) es funcin
creciente del nmero de modalidades de la variable. Se debe equilibrar el nmero de las
modalidades de las variables.
p
1 , es decir que solo depende del nmero de modalidades
s
y del nmero de variables y no de los datos de la tabla. La inercia total no tiene significado
estadstico. En el ejemplo I = 12/4 1 = 2 (ver Tabla 3-4).
-
3.2.3.
La subnube de modalidades asociada a una variable tiene el mismo centro de gravedad general.
58
i =
1 1
s
j p ( i )
Un individuo se ubica en el promedio aritmtico de las coordenadas de las modalidades que asume,
alejado por el inverso de la raz del valor propio. Por ejemplo el individuo A05, asume las modalidades
1, 1, 1, 3 (Tabla 3-1), es decir inglesBueno, matemaExcelente, cienciasBueno, dibujoDeficiente, que tienen
coordenadas sobre el primer eje: -0.94, -2.90, -0.77 y -2.26 (Tabla 3-5). El primer valor propio es: 0.5179
(Tabla 3-4), la coordenada del estudiante A05 es:
1/0.5179 x 1/4 (-0.94-2.90-0.77-2.26) = 1.39 x (-1.72) = -2.39 (valor en la Tabla 3-6).
Coordenada de una modalidad j el eje
j =
1
n j
iI ( j )
Una modalidad se ubica en el promedio de las coordenadas de los individuos que la asumen, dilatada por
el inverso del valor propio. Por ejemplo la modalidad inglesDeficiente es asumida por los individuos A19
y A40 (Tabla 3-2) que tienen coordenadas 1.13 y -1.35 (Tabla 3-6).. La coordenada de inglsDeficiente
sobre el eje 1 es entonces:
1/0.5179 x (-1.13-1.35) = 1.39 x (-1.24) = -1.72 (el valor de la Tabla 3-5 es -1.73).
Estas relaciones adems de permitir la representacin simultnea de los individuos y de las modalidades
son bsicas para la lectura de los planos factoriales. En el plano factorial del Grfico 3-1 se puede ver las
posiciones de los individuos A19, A40 responsables de la posicin de ingD. A05 aparece como centro de
gravedad (corrido) de: matA, dibD, ingB y cieB.
Tabla 3-4: Histograma de valores propios
HISTOGRAMME DES 8 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
|
1
|
0.5179
|
25.90 |
25.90 | ******************************************************************************** |
|
2
|
0.4512
|
22.56 |
48.45 | **********************************************************************
|
|
3
|
0.3140
|
15.70 |
64.15 | *************************************************
|
|
4
|
0.2576
|
12.88 |
77.03 | ****************************************
|
|
5
|
0.2383
|
11.92 |
88.95 | *************************************
|
|
6
|
0.1391
|
6.95 |
95.90 | **********************
|
|
7
|
0.0599
|
3.00 |
98.90 | **********
|
|
8
|
0.0220
|
1.10 | 100.00 | ****
|
| TOTAL |
2.0000
|
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
59
3.2.4.
60
En ACM la inercia de la tabla representada no tiene significado estadstico, esta depende del nmero de
modalidades y del nmero de variables. Por la manera como se desarrolla el mtodo (ACS de la tabla Z),
el porcentaje de inercia no es un criterio para saber cuntos ejes retener en un ACM. La explicacin de
este ltimo hecho se ve muy bien cuando se compara un ACM de dos variables con el ACS de la tabla de
contingencia que las cruza. En el ejemplo del captulo 2 (mtodos x razones), la informacin de la
pequea tabla queda totalmente representada en el primer plano factorial. Si se hiciera ACM de la tabla
de las 4402 mujeres para las dos variables se tendra una representacin en 7 modalidades 2 variables =
5 ejes. El primer plano factorial del ACM tiene la misma forma que el del ACS y produce los mismos
resultados en trminos de las correspondencias entre las modalidades de las dos variables. De modo que
los ejes adicionales del ACM se pueden considerar parsitos. En Lebart et al. (1995) aparecen las
relaciones para dos variables entre los anlisis de correspondencias de la tabla de contingencia K, la tabla
disyuntiva completa Z y la tabla de Burt B.
La gua para decidir cuntos ejes analizar en al ACM es la forma del histograma de los valores propios
(por ejemplo el de la Tabla 3-4). Interesan los primeros ejes que se destaquen sobre los dems. En el
ejemplo hay un salto importante entre el segundo y tercer eje, lo que hace pensar que los dos primeros ejes
es suficiente. De todas maneras se puede leer el tercer eje a ver si se obtienen otros resultados adicionales
a los visualizados en el primer plano.
Sobre los planos factoriales se tienen tres claves para la lectura:
-
Los individuos que aparecen cerca se parecen porque asumen mas o menos las mismas
modalidades. Cada uno es el cuasibibaricentro de las modalidades que asume y las caractersticas
se derivan de las modalidades que se proyectan cerca.
Las modalidades de variables diferentes se parecen porque son asumidas mas o menos por los
mismos individuos. Cada modalidad se sita en el cuasibibaricentro de los individuos que la
asumen.
Dos modalidades de una misma variable no pueden ser asumidas por los mismos individuos y si
caen cerca se debe al parecido de los individuos por modalidades de otras variables.
Las contribuciones y cosenos cuadrados tienen la misma interpretacin que en correspondencias simples.
Se agrega la contribucin de una variable como suma de las contribuciones de sus modalidades.
Una lectura del primer plano factorial de ejemplo (Grfico 3-1) puede ser: el primer eje resume bien el
rendimiento, el lado negativo indica buen rendimiento y el lado positivo rendimiento apenas aceptable. El
segundo destaca el rendimiento deficiente en ingls y dibujo (arriba) y un poco en ciencias. El ncleo del
plano est mostrando los estudiantes buenos y los aceptables y con respecto a ellos hay 1 estudiante (A16)
que se destaca por alcanzar excelente en matemticas, otro que alcanza excelente en matemticas pero es
deficiente en dibujo (A05) y otros que tiene notas deficientes en dibujo e ingls (A19 y A40). En la parte
inferior izquierda del plano se ubican los mejores estudiantes, en la parte inferior izquierda cerca al centro
los estudiantes buenos y en la parte derecha los aceptables. En la parte superior izquierda se ubican
estudiantes deficientes en ingls y dibujo. Estos resultados se presentan como ilustracin pues en una
tabla tan pequea los casos raros influyen mucho en el anlisis.
3.2.5.
Elementos ilustrativos
Al igual que en correspondencias simples se pueden proyectar elementos ilustrativos: individuos, variables
nominales (sus modalidades) y variables continuas. Los individuos y modalidades se proyectan utilizando
las frmulas cuasibibaricntricas. Las variables continuas calculando la correlacin entre la variable y el
eje.
61
En el ejemplo se incluy una variable nominal ilustrativa (el tiempo dedicado en la casa a estudiar y hacer
tareas) y una variable continua (el puntaje de una prueba sicolgica de aptitud verbal), que se presentan en
las dos ltimas columnas de la Tabla 3-1. Las modalidades ilustrativas se interpretan una a una con
respecto al tema activo, para ello se grafican en los planos y se presenta el valor test como un ndice de su
significado en los ejes. La construccin del valor test se puede leer en Lebart et al. (1995) y se interpreta
de forma sencilla aceptando que vale la pena leer una modalidad ilustrativa sobre un eje si su valor es
superior de 2 o inferior a 2. En la Tabla 3-7 se presentan los valores test para las modalidades de la
variable tiempo dedicado a estudiar y hacer tareas, cuyos valores muestran que no se alcanza a detectar
influencia de este hecho sobre el rendimiento. La modalidades tambin aparecen proyectadas en el
Grfico 3-1, muy cerca del centro.
Tabla 3-7: Coordenadas y valores test de las modalidades ilustrativas
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
MODALITES
|
VALEURS-TEST
|
COORDONNEES
|
|
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LIBELLE
EFF.
P.ABS |
1
2
3
4
5
|
1
2
3
4
5
| DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
6 . EstuTare
|
| est1 - estudia menos de 1h
13
13.00 | -1.1
0.4 -0.1
0.2 -0.4 | -0.25
0.10 -0.03
0.05 -0.10 |
2.08 |
| est2 - estudia 1-2 h
22
22.00 |
1.3
0.3
0.1 -0.9 -0.7 |
0.18
0.04
0.01 -0.14 -0.10 |
0.82 |
| es>2 - estudia mas de 2h
5
5.00 | -0.4 -1.0
0.1
1.1
1.7 | -0.17 -0.41
0.05
0.46
0.71 |
7.00 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
La variable aptitud verbal aparece con correlaciones pequeas con los dos primeros ejes (-0.17 y 0.11)
(ver Tabla 3-8). Esto indica alguna asociacin entre aptitud verbal y rendimiento acadmico.
Tabla 3-8: Correlaciones entre las variables continuas y los factores
+-----------------------------------+------------------------------------+------------------------------------+
|
VARIABLES
|
CARACTERISTIQUES
|
CORRELATIONS
|
|-----------------------------------+------------------------------------+------------------------------------|
| NUM . (IDEN)
LIBELLE COURT
| EFF.
P.ABS
MOYENNE
EC.TYPE |
1
2
3
4
5
|
+-----------------------------------+------------------------------------+------------------------------------+
|
1 . (AVer) AptitudVerbal
|
40
40.00
44.70
24.13 | -0.17 -0.11
0.12
0.05
0.07 |
+-----------------------------------+------------------------------------+------------------------------------+
3.3.
3.3.1.
Con base en la Convocatoria de grupos y centros de investigacin realizada por Colciencias en 1998, se
realiz un estudio sobre recursos humanos dedicados a la investigacin (Charum et al., 2000). Para los
propsitos de conocer los recursos humanos en el campo de la ciencia y la tecnologa en Colombia, se
considera como Investigador a quien posee un ttulo profesional, est vinculado a una unidad de
investigacin (grupo o centro), ha participado all en proyectos finalizados o en desarrollo durante el
perodo de observacin y ha sido autor o coautor en la produccin de resultados de investigacin. Se
incluy, adems, como investigador a quien poseyendo el ttulo de doctor, hace parte de una unidad de
investigacin durante el perodo. A partir de esta definicin se tienen 2148 investigadores activos.
Uno de los anlisis realizados fue el de correspondencias mltiples para conocer el perfil
sociodemogrfico de los investigadores a partir de la informacin disponible. En la tabla analizada las
filas son los 2148 investigadores y las columnas activas son las variables: gnero, edad en clases, ingls
(si habla o no ingls), otro idioma (si habla o no otro idioma), rea de trabajo.
3.3.2.
62
En la Tabla 3-9 se presentan las distribuciones de frecuencia de las variables activas. Las modalidad
arquitectura y bellas artes (del rea de trabajo) se coloc como ilustrativa por su baja frecuencia. Para 66
investigadores no se tiene informacin de la edad y se agrupan en una modalidad denominada respuesta
faltante, la cual tambin se toma como ilustrativa.
Tabla 3-9: Variables activas del ACM perfil sociodemogrfico de investigadores
----------------------------+-----------------+-------------------------------------------------MODALIDADES
|
|
IDENT
ETIQUETA
| FREC.
PESOS | HISTOGRAMME DES PESOS RELATIVOS
----------------------------+-----------------+-------------------------------------------------2 . Genero
Feme - Femenino
| 678
678.00 |*******************
Masc - Masculino
| 1470
1470.00 |******************************************
----------------------------+-----------------+-------------------------------------------------3 . IdEscolaridad
Preg - Pregrado
| 438
438.00 |*************
Espe - Especializacin
| 212
212.00 |******
Maes - Maestra
| 829
829.00 |************************
Doct - Doctorado
| 669
669.00 |*******************
----------------------------+-----------------+-------------------------------------------------7 . Ingles
IngS - Si Ingles
| 1099
1099.00 |*******************************
IngN - No Ingles
| 1049
1049.00 |******************************
----------------------------+-----------------+-------------------------------------------------8 . Otro
OtrS - Si Otro
| 491
491.00 |**************
OtrN - No Otro
| 1657
1657.00 |***********************************************
----------------------------+-----------------+-------------------------------------------------27 . AreaTrabajo_ISI_0
ArBe - Arquitectura y Bella |
7
7.00 | === MOD. IL.===
CBas - Ciencias Bsicas
| 451
451.00 |*************
CSoc - Ciencias Sociales y | 500
500.00 |**************
CVid - Ciencias de la Vida | 858
858.00 |************************
CInT - Ingeniera y Tecnolo | 332
332.00 |**********
----------------------------+-----------------+-------------------------------------------------29 . Edad Classes
E>35 - Edad <35
| 403
403.00 |************
E<45 - Edad 35-44
| 776
776.00 |**********************
E<55 - Edad 45-54
| 642
642.00 |******************
E>54 - Edad >54
| 261
261.00 |********
29_ - Respuesta faltante
|
66
66.00 | === MOD. ILL.===
----------------------------+-----------------+--------------------------------------------------
El Grfico 3-2 muestra los valores propios con su histograma, donde se observa que es suficiente leer los
dos primeros ejes (primer plano factorial) para tener una sntesis apropiada del perfil. El primer plano
factorial se presenta en el Grfico 3-3, el tamao de los puntos es proporcional al peso (frecuencia) de la
modalidad, las lneas estn uniendo las modalidades de las variables ordinales edad en clases y
escolaridad. Se observa una asociacin entre edad y escolaridad. En el ACM cada modalidad est
representada por el promedio de las coordenadas de los individuos que la asumen, aunque corrido
(dilatado por el inverso del valor propio), entonces los grupos de modalidades sugieren grupos de
individuos que las asumen en una frecuencia mayor que el promedio (centro de la representacin). Del
mismo modo dos modalidades de diferentes variables cercanas indican una relacin en el sentido de que
son ms o menos los mismos individuos los que las asumen. En la parte superior izquierda del mapa
aparece un grupo relacionado con los investigadores de menor edad y que slo tienen ttulo de pregrado o,
en otras palabras, hay una asociacin entre tener menos de 35 aos y poseer solo ttulo de pregrado. En la
parte derecha del plano se observan relaciones entre hablar otro idioma, ser mayor de 54 aos, tener
doctorado, hablar ingls y trabajar en ciencias bsicas. La modalidad Ciencias sociales y humanas aparece
relacionada con edades entre 35 y 54 aos, con maestra y especializacin. No hablar ingls ni otro
idioma aparece relacionado con ciencias de la vida y gnero femenino.
Pardo C.E. y Cabarcas G.
63
Se proyectaron varias variables nominales como ilustrativas las cuales aparecen en la Tabla 3-10, junto
con los ndices para interpretacin. En el Grfico 3-4 se muestra solamente la variable regin, la variable
programa de ciencia y tecnologa aparece muy cercana a las modalidades del rea de trabajo y no pareci
interesante proyectarlas en el grfico. La regin centro oriente tiene buena dedicacin a la investigacin en
ingeniera y tecnologa (valor test 6.2 con el eje 2), la investigacin en ciencias sociales se hace sobretodo
en las regiones centro (valores test 2.9 y -7.2) y atlntica (valor 3.5 en el eje 2). Los centros de
investigacin universitarios hacen ms investigacin en ciencias sociales y humanas y los grupos
universitarios en ciencias bsicas e ingeniera y tecnologa. Los grupos de investigacin pblicos se
dedican ms a ciencias de la vida Hay un grupo que habla tres o ms idiomas asociado a mayor edad,
mayor formacin y a ciencias bsicas (Tabla 3-10).
Grfico 3-3: Primer plano factorial del ACM perfil sociodemogrfico
Tambin se proyectaron como ilustrativas las variables continuas artculos y libros de autor, que tambin
aparecen en el Grfico 3-4, donde se interpretan con relacin a los ejes factoriales. En la Tabla 3-11
Pardo C.E. y Cabarcas G.
64
aparecen las correlaciones de estas variables con los factores, junto con su media y desviacin estndar.
El nmero de artculos tiene una correlacin de 0.16 con el primer eje, indicando que los individuos que
asumen sobretodo las modalidades que estn a la derecha del primer eje tienen mayor produccin de
artculos, es decir mayores, con doctorado, de ciencias bsicas que habla ingls u otro idioma. El nmero
de libros de autor tiene una correlacin con el segundo eje de 0.15 mostrando que los investigadores que
asumen modalidades de la parte inferior del segundo eje (y hacia la derecha, por ejemplo rea de ciencias
sociales y humanas), producen en proporcin mayor al promedio libros de autor.
Tabla 3-10: Coordenadas y valores test de las modalidades ilustrativas perfil sociodemogrfico
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
MODALITES
|
VALEURS-TEST
|
COORDONNEES
|
|
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LIBELLE
EFF.
P.ABS |
1
2
3
4
5
|
1
2
3
4
5
| DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
5 . Programa
|
| Bio - Biotecnologa
45
45.00 | -2.3 -1.2
4.8 -0.6 -1.8 | -0.34 -0.17
0.71 -0.09 -0.26 |
46.19 |
| Sal - Ciencia y Tec Salud
447
447.00 | -8.0 -3.0 15.2
1.0 -12.1 | -0.34 -0.13
0.64
0.04 -0.51 |
3.75 |
| Mar - Ciencia y Tec Mar
18
18.00 |
0.6
1.5
1.5 -0.2 -3.3 |
0.13
0.35
0.34 -0.04 -0.77 |
116.98 |
| Agr - Ciencia y Tec Agr
209
209.00 | -8.7 -0.1
3.0 -4.7 -3.8 | -0.57 -0.01
0.20 -0.31 -0.25 |
9.16 |
| Bas - Ciencias Bsicas
468
468.00 |
8.2
8.7
9.9 -3.9
4.7 |
0.34
0.36
0.41 -0.16
0.19 |
3.54 |
| Soc - Ciencias Sociales y 439
439.00 |
5.1 -19.1 -14.7 17.6
5.7 |
0.22 -0.81 -0.63
0.75
0.24 |
3.84 |
| Amb - Ciencias del Medio A 153
153.00 |
0.3
1.4 -0.2 -5.4
2.0 |
0.02
0.11 -0.02 -0.42
0.15 |
12.88 |
| Des - Desarrollo Tecnologi
77
77.00 |
1.6
5.9 -4.7 -3.9
1.8 |
0.18
0.66 -0.52 -0.44
0.20 |
26.58 |
| Eti - Electrnica, Telecom 102
102.00 | -0.6
8.1 -8.9 -4.8
1.1 | -0.06
0.78 -0.86 -0.46
0.10 |
19.82 |
| Cie - Estudios Cientficos
47
47.00 |
0.5 -5.8 -1.9
3.2
2.3 |
0.08 -0.84 -0.28
0.46
0.33 |
44.18 |
| Ene - Investigac en Energ
143
143.00 |
1.2 12.8 -11.8 -7.0
3.8 |
0.10
1.04 -0.96 -0.56
0.30 |
13.85 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
6 . Regin
|
| Amaz - Amazonia
9
9.00 |
0.5 -0.4
0.2 -0.3 -1.9 |
0.15 -0.15
0.07 -0.11 -0.65 |
234.96 |
| Cent - Centro
842
842.00 |
2.9 -7.2
0.0
7.9
1.3 |
0.08 -0.19
0.00
0.21
0.04 |
1.52 |
| COri - Centro Oriente
170
170.00 |
1.3
6.2 -5.0 -3.8
0.9 |
0.10
0.46 -0.37 -0.28
0.07 |
11.49 |
| CAtl - Costa Atlntica
120
120.00 | -1.5 -3.5 -4.0 -0.8
0.5 | -0.13 -0.31 -0.35 -0.07
0.05 |
16.70 |
| Noro - Noroccidente
709
709.00 | -3.8
3.3
3.4 -2.8 -0.5 | -0.12
0.10
0.10 -0.09 -0.01 |
2.00 |
| Orin - Orinoquia
1
1.00 | -1.6 -0.1
1.2
0.4 -0.7 | -1.63 -0.14
1.17
0.41 -0.73 | 2122.67 |
| Suro - Suroccidente
297
297.00 |
1.0
3.6
1.8 -3.8 -1.9 |
0.05
0.20
0.10 -0.21 -0.10 |
6.15 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
16 . TipoInstInv
|
| TCUn - Centro o Inst Univer 539
539.00 |
3.7 -7.7 -5.7
6.7
2.4 |
0.14 -0.29 -0.21
0.25
0.09 |
2.94 |
| TGUn - Grupo Universitario 1071
1071.00 |
5.4
8.2 -0.3 -6.9
5.6 |
0.12
0.18 -0.01 -0.15
0.12 |
0.98 |
| TCIP - Centro o Inst Public
50
50.00 |
1.8
1.2 -1.3 -0.1 -1.2 |
0.25
0.17 -0.18 -0.02 -0.17 |
41.47 |
| TCDP - Centro Des Tecno Pub
0
0.00 |
0.0
0.0
0.0
0.0
0.0 |
0.00
0.00
0.00
0.00
0.00 |
0.00 |
| TGIP - Grupo Inv Publico
83
83.00 | -6.2 -1.8
4.6
2.2 -2.7 | -0.67 -0.20
0.49
0.24 -0.29 |
24.59 |
| TCIM - Centro o Inst P o M
287
287.00 | -8.1
0.7
6.1 -1.2 -6.2 | -0.44
0.04
0.34 -0.07 -0.34 |
6.40 |
| TCDM - Centro Des Tec P o M
0
0.00 |
0.0
0.0
0.0
0.0
0.0 |
0.00
0.00
0.00
0.00
0.00 |
0.00 |
| TCIS - Centro o Inst ESAL
89
89.00 | -2.5 -4.2 -1.9
3.2 -4.9 | -0.26 -0.43 -0.20
0.33 -0.51 |
22.86 |
| TCDS - Centro Des Tec ESAL
0
0.00 |
0.0
0.0
0.0
0.0
0.0 |
0.00
0.00
0.00
0.00
0.00 |
0.00 |
| TUII - Unidad Inv Internal
6
6.00 |
1.3
0.8 -0.9 -1.2
1.0 |
0.52
0.31 -0.35 -0.49
0.39 |
352.94 |
| TGEN - Grupo Inv Enti NoInv
23
23.00 | -2.1
0.9
2.6 -0.8 -0.6 | -0.44
0.20
0.54 -0.16 -0.13 |
91.33 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
30 . NoIdiomasEx Classes
|
| Idi1 - 1 Idioma
878
878.00 |
8.7
4.0
8.6 -4.8 -4.4 |
0.23
0.10
0.22 -0.12 -0.11 |
1.42 |
| Idi3 - 2 Idiomas
291
291.00 | 23.9
5.9
3.8 10.8
0.8 |
1.30
0.32
0.21
0.59
0.04 |
6.30 |
| Idi3 - 3 o mas idiomas
73
73.00 | 12.2
1.8
0.7
6.1 -1.6 |
1.41
0.21
0.08
0.70 -0.18 |
28.09 |
| 30_ - Ninguno
906
906.00 | -29.8 -8.4 -11.5 -5.0
4.5 | -0.75 -0.21 -0.29 -0.13
0.11 |
1.34 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
Tabla 3-11: Correlaciones entre las variables continuas ilustrativas y los factores
+-----------------------------------+------------------------------------+------------------------------------+
|
VARIABLES
|
CARACTERISTIQUES
|
CORRELATIONS
|
|-----------------------------------+------------------------------------+------------------------------------|
| NUM . (IDEN)
LIBELLE COURT
| EFF.
P.ABS
MOYENNE
EC.TYPE |
1
2
3
4
5
|
+-----------------------------------+------------------------------------+------------------------------------+
| 19 . (Arti) Articulo
| 2148 2148.00
2.90
5.10 |
0.16 -0.01
0.15 -0.04 -0.02 |
| 20 . (Libr) LibroAutor
| 2148 2148.00
0.28
0.82 |
0.05 -0.15 -0.09
0.04
0.03 |
+-----------------------------------+------------------------------------+------------------------------------+
3.3.3.
Conclusiones
Los investigadores de la tabla analizada tienen mayor nivel de escolaridad a mayor edad. El grupo de
mayor edad y escolaridad trabaja sobretodo en ciencias bsicas y es el que ms dominio de idiomas
extranjeros posee. El grupo mayor de investigadores tiene formacin de maestra y especializacin con
dedicacin a las ciencias de la vida y a las ciencias sociales y humanas. Los investigadores dedicados a la
65
ingeniera y tecnologa son tanto jvenes como mayores con escolaridades, tanto de pregrado como de
posgrado.
Las regiones del pas estn asociadas a la tipologa de los investigadores, sobre todo por el rea de trabajo.
La investigacin que se hace en la regin centro-oriente es sobretodo en ingeniera y tecnologa, la de
regin centro y atlntica tiene un buen componente en ciencias humanas y sociales.
Segn tipos de institucin, los centros universitarios hacen ms investigacin en ciencias humanas y
sociales, los grupos universitarios en ciencias bsicas y los grupos de entidades pblicas en ciencias de la
vida.
Los artculos cientficos se producen ms en ciencias bsicas y los libros de autor en ciencias sociales y
humanas.
Grfico 3-4: Primer plano factorial del ACM del perfil sociodemogrfico con variables activas e ilustrativas
3.4.
3.4.1.
La informacin original del Test de Personalidad, como se vio en el ejercicio de ACP, est dada por
variables numricas, especficamente en una escala de 0 a 100 o de 1 a 10. Ahora todas las variables han
sido categorizadas. Cada una fue dividida en cinco partes de igual frecuencia aproximadamente y se
denominaron con nombres de modalidades de carcter ordinal, es decir, cada una de las modalidades est
numerada de 1 a 5, donde el 1 corresponde a los puntajes mas bajos de la escala original y 5 a los ms
altos. En la Tabla 3-12 se muestra la distribucin de frecuencias de las variables nominales activas.
3.4.2.
66
El objetivo general es el mismo planteado en el ejercicio de ACP: estudiar el Test PPG-IPG y de manera
complementaria indagar por el comportamiento de cinco items del Test 16PF, en el contexto del primero.
De una manera mas especifica, ahora se est interesado en saber:
Que tipo de relacin existe entre las modalidades de las variables del test PPG-IPG, es decir, de
las que has sido escogidas como Activas.
De que manera se agrupan las modalidades de este test y como definen los ejes factoriales .
Que relacin se puede evidenciar entre las modalidades de las variables del Test PPG-IPG y las
modalidades de las cinco variables del test 16PF .
3.4.3.
Parejas de modalidades activas de una misma variable que se encuentren bastante distanciadas
entre si
7. Puede resaltar en el grfico en el cual se muestra la proyeccin de los individuos sobre el primer plano
factorial los grupos de individuos caracterizados por determinados subconjuntos de modalidades?
8. Por ser muchas las modalidades ilustrativas para no confundir el plano de proyeccin, se han
graficado separadas de las modalidades activas. Usted puede superponer aproximadamente los dos
planos para establecer las posibles relaciones existentes entre estos dos conjuntos. Como ayuda se
incluye el Tabla 3-15 que contiene las coordenadas y Valores Test tanto para las modalidades activas
como paras ilustrativas. En particular, cules son las modalidades de cada una de las variables
ilustrativas que parecen ser atradas por subconjuntos de modalidades activas?
Pardo C.E. y Cabarcas G.
67
9. Exprese en una forma coherente y breve las conclusiones generales que se pueden extraer de los
anlisis anteriores.
Tabla 3-12: Distribucion de frecuencias de las variables activas
----------------------------+-----------------+-------------------------------------------------MODALITES
| AVANT APUREMENT |
APRES APUREMENT
IDENT
LIBELLE
| EFF.
POIDS | EFF.
POIDS
HISTOGRAMME DES POIDS
RELATIFS
----------------------------+-----------------+-------------------------------------------------1 . Asendencia
ASE1 - ASE1
| 219
219.00 | 219
219.00 ************
ASE2 - ASE2
| 221
221.00 | 221
221.00 ************
ASE3 - ASE3
| 255
255.00 | 255
255.00 **************
ASE4 - ASE4
| 210
210.00 | 210
210.00 ************
ASE5 - ASE5
| 204
204.00 | 204
204.00 ************
----------------------------+-----------------+-------------------------------------------------2 . Responsabilidad
RES1 - RES1
| 231
231.00 | 231
231.00 *************
RES2 - RES2
| 211
211.00 | 211
211.00 ************
RES3 - RES3
| 261
261.00 | 261
261.00 ***************
RES4 - RES4
| 181
181.00 | 181
181.00 **********
RES5 - RES5
| 225
225.00 | 225
225.00 *************
----------------------------+-----------------+-------------------------------------------------3 . Estabilidad
EST1 - EST1
| 214
214.00 | 214
214.00 ************
EST2 - EST2
| 226
226.00 | 226
226.00 *************
EST3 - EST3
| 237
237.00 | 237
237.00 *************
EST4 - EST4
| 209
209.00 | 209
209.00 ************
EST5 - EST5
| 223
223.00 | 223
223.00 *************
----------------------------+-----------------+-------------------------------------------------4 . Sociabilidad
SOC1 - SOC1
| 218
218.00 | 218
218.00 ************
SOC2 - SOC2
| 244
244.00 | 244
244.00 **************
SOC3 - SOC3
| 226
226.00 | 226
226.00 *************
SOC4 - SOC4
| 211
211.00 | 211
211.00 ************
SOC5 - SOC5
| 210
210.00 | 210
210.00 ************
----------------------------+-----------------+-------------------------------------------------6 . Cautela
CAU1 - CAU1
| 232
232.00 | 232
232.00 *************
CAU2 - CAU2
| 207
207.00 | 207
207.00 ************
CAU3 - CAU3
| 235
235.00 | 235
235.00 *************
CAU4 - CAU4
| 233
233.00 | 233
233.00 *************
CAU5 - CAU5
| 202
202.00 | 202
202.00 ***********
----------------------------+-----------------+-------------------------------------------------7 . Originalidad
ORI1 - ORI1
| 235
235.00 | 235
235.00 *************
ORI2 - ORI2
| 202
202.00 | 202
202.00 ***********
ORI3 - ORI3
| 220
220.00 | 220
220.00 ************
ORI4 - ORI4
| 234
234.00 | 234
234.00 *************
ORI5 - ORI5
| 218
218.00 | 218
218.00 ************
----------------------------+-----------------+-------------------------------------------------8 . Comprension
COM1 - COM1
| 238
238.00 | 238
238.00 *************
COM2 - COM2
| 213
213.00 | 213
213.00 ************
COM3 - COM3
| 216
216.00 | 216
216.00 ************
COM4 - COM4
| 217
217.00 | 217
217.00 ************
COM5 - COM5
| 225
225.00 | 225
225.00 *************
----------------------------+-----------------+-------------------------------------------------9 . Vitalidad
VIT1 - VIT1
| 228
228.00 | 228
228.00 *************
VIT2 - VIT2
| 218
218.00 | 218
218.00 ************
VIT3 - VIT3
| 223
223.00 | 223
223.00 *************
VIT4 - VIT4
| 220
220.00 | 220
220.00 ************
VIT5 - VIT5
| 220
220.00 | 220
220.00 ************
----------------------------+-----------------+--------------------------------------------------
68
Tabla 3-13: Valores propios
69
70
Grfico 3-6: Proyeccin de las modalidades ilustrativas sobre el primer plano factorial
71
Grfico 3-7: Proyeccin de las modalidades activas sobre el primer plano factorial