Está en la página 1de 37

Análisis de correspondencias

Procedimiento para el AC
1. Se estandariza la tabla de frecuencias
relativas dividiendo por (la raiz cuadrada
de) los totales de fila y columna. Esta
estandarización se hace para que dos filas
(columnas) tengan la misma estructura sin
efectos de escala. Sea Z la nueva matriz.
• Interpretación: una variable binomial tiene media
np y desviación típica (npq)1/2. Si p es pequeño se
aproxima por (np)1/2.
• Cada celda tiene una desviación estandar distinta
que podemos estimar por el producto de sus
frecuencias relativas por filas (fri)1/2 y columnas
(frj)1/2. Estandarizando su desviación típida las
hacemos comparables.
2. Se calculan valores y vectores propios de las
matrices Z’Z y ZZ’ donde Z es la matriz de
frecuencias relativas estandarizada.

3. Se toman los dos vectores propios ligados a los


dos mayores valores propios (excluyendo el uno)
de la matriz Z’Z (o del matriz ZZ’) y se proyectan
las filas (columnas) sobre ellos.
Puntos de columna y de fila
Simétrica Normalización
.6
2
.4
3 1 4
.2

.0
1
-.2

-.4
Dimensión 2

-.6
3
2 val
-.8

-1.0 prof
-1.0 -.5 0.0 .5 1.0 1.5

Dimensión 1
Idea del método AC
Dada una matriz F de frecuencias relativas
representar conjuntamente en un mismo gráfico
las filas y las columnas con la mínima pérdida de
información
Procedimiento:
Comencemos con las filas ¿Cómo representarlas?
• Primer Problema: Si no estandarizamos por el
total, dos filas con la misma estructura pueden
parecer muy distintas
Necesidad de estandarizar
• Llamemos Df a la matriz diagonal que tiene
las frecuencias relativas de las filas en la
diagonal principal
• Igualmente Dc será la matriz diagonal de las
frecuencias de las columnas
Podemos estandarizar las filas dividiendo cada una
por su frecuencia relativa, obteniendo la matriz

Segundo Problema: Con datos cualitativos la distancia


razonable entre dos filas es la ji cuadrado, no la distancia
euclídea

También podría gustarte