Está en la página 1de 21

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS


ESCUELA PROFESIONAL DE ESTADISTICA

Análisis de correspondencias
múltiple

Estudiante:

Heredia Paredes Fiorella Nathalí


Análisis de correspondencias múltiple
El propósito del análisis de correspondencia múltiple,
también conocido como análisis de homogeneidad, es
encontrar calificaciones que son óptimas en el sentido de
que las categorías están separados unos de otros tanto
como sea posible. Esto implica que los objetos de la misma
categoría se representan cerca unos de otros y los objetos
en diferentes categorías se representan lo más alejados
posible. El término homogeneidad también se refiere al
hecho de que el análisis será más exitosa cuando las
variables son homogéneos; es decir, cuando se dividan los
objetos en grupos con las mismas o similares categorías.
Análisis de correspondencias múltiple

Ejemplo: Características del Hardware


Para explorar cómo funciona el análisis de correspondencia múltiple,
que va a utilizar los datos de Hartigan (Hartigan, 1975), que se puede
encontrar en screws.sav. Ver los archivos muestrales para obtener más
información. Este conjunto de datos contiene información sobre las
características de tornillos, pernos, clavos y tacos. La siguiente tabla
muestra las variables, junto con sus etiquetas de variable y las
etiquetas de valor asignadas a las categorías de cada variable en el
conjunto de datos de hardware Hartigan.
Análisis de correspondencias múltiple
Análisis de correspondencias múltiple

Hartigan conjunto de datos de hardware


Nombre de la Etiqueta de variable Valores
variable
rosca Rosca Con rosca, sin rosca
cabeza Forma de la cabeza lisa, copa, cono, redonda,
cilíndrica
marcabe Marca en la cabeza Ninguna, estrella, hendidura
forcach Forma de la cacha afilado, plano
longitud Longitud en pulg.med ½, 1, 1 ½, 2, 2 ½
plata Plata Si_plata, No_plata
artículo Artículo Tachuela, clavo1, clavo2, clavo3,
clavo4, clavo5, clavo6, clavo7,
clavo8, tornillo1, tornillo2, tornillo3,
tornillo4, tornillo5, perno1, perno2,
perno3, perno4, perno5, perno6,
tachuela1, tachuela2, clavo b,
tornillo b.
Para obtener un análisis de correspondencias múltiple, elija en los menús:
Analizar> Reducción Dimensión> escalamiento óptimo ...
Asegúrese de que todas las variables
son nominales múltiples y Un
conjunto se seleccionan, y haga clic
en Definir.

Seleccione todas las


variables como variables de
análisis, a excepción de var.
Objeto.

Seleccionar objeto como


variable de etiquetado.

► Haga clic en Objeto en el


grupo Gráficos.
Casi la totalidad de la varianza en los datos se explica por la solución,
el 62,1% en la primera dimensión y el 36,8% en el segundo.

Las dos dimensiones en conjunto proporcionan una interpretación en


términos de distancias. Si una variable discrimina bien, los objetos
estarán cerca de las categorías a las que pertenecen. Lo ideal sería
que los objetos de la misma categoría estarán cerca uno del otro (es
decir, deben tener puntuaciones similares), y las categorías de las
diferentes variables se trabajará en estrecha si pertenecen a los
mismos objetos (es decir, dos objetos que tienen puntajes similares
para una variable también debe anotar cerca unos de otros para las
otras variables en la solución).
Después de examinar el resumen del modelo, usted debe buscar en las
puntuaciones de los objetos. Puede especificar una o más variables para
etiquetar el gráfico de puntuaciones del objeto. Cada variable de etiquetado
genera un gráfico diferente etiquetado con los valores de esa variable. Vamos
a echar un vistazo a la trama de puntuaciones de los objetos etiquetados por
el objeto variable. Esto es sólo una variable de caso-identificación y no se
utilizó en ningún cálculo.

La distancia de un objeto al origen refleja la variación del patrón de respuesta


"media". Este patrón de respuesta promedio corresponde a la categoría más
frecuente para cada variable. Los objetos con muchas características que
corresponden a las categorías más frecuentes se encuentran cerca del origen.
En contraste, los objetos con características únicas están situados lejos del
origen.
El examen de la parcela, se ve que la
primera dimensión (el eje horizontal)
discrimina los tornillos y pernos (que
tienen roscas) de los clavos y tachuelas
(que no tienen las discusiones). Esto se
ve fácilmente en la trama desde
tornillos y pernos están en un extremo
del eje horizontal y tachuelas y clavos
están en el otro. En menor medida, la
primera dimensión también separa los
pernos (que tienen fondos planos) de
todos los demás (que tiene fondos
afilados).

La segunda dimensión (el eje vertical) parece separar TORNILLO1 CLAVO6


y de todos los demás objetos. ¿Qué TORNILLO1 y CLAVO6 tienen en
común son sus valores en la variable longitud-que son los objetos más
largos de los datos. Por otra parte, TORNILLO1 encuentra mucho más lejos
del origen que los otros objetos, lo que sugiere que, tomada en su conjunto,
muchas de las características de este objeto no son compartidas por los
otros objetos.
“El gráfico de puntuaciones del objeto es especialmente útil para detectar
valores atípicos. TORNILLO1 podría considerarse un caso atípico”.
Antes de examinar el resto de los
gráficos de las puntuaciones de
objeto, vamos a ver si las medidas
de discriminación de acuerdo con
lo que hemos dicho hasta ahora.
Para cada variable, una medida de
discriminación, que puede ser
considerado como un componente
de carga cuadrado, se calcula para
cada dimensión. Esta medida es
también la varianza de la variable
cuantificada en esa dimensión.
Tiene un valor máximo de 1, lo que
se logra si las puntuaciones de los
objetos caen en grupos
mutuamente excluyentes y todas
las puntuaciones de los objetos
dentro de una categoría son
idénticos. (Nota: Esta medida
puede tener un valor superior a 1 si
hay datos faltantes.)
Como se ha señalado en el gráfico de puntuaciones del objeto, la medidas de
discriminación gráfico muestra que la primera dimensión se relaciona con las
variables de rosca y Forma del suelo. Estas variables tienen grandes medidas de
discriminación sobre las primeras medidas de dimensión pequeña y la
discriminación en la segunda dimensión. Por lo tanto, para estas dos variables,
las categorías se extienden lejos a lo largo de sólo la primera dimensión.

Longitud en medio pulgadas tiene un valor grande en la segunda dimensión,


pero un valor pequeño en la primera dimensión. Como resultado, la longitud es
más cercano a la segunda dimensión, de acuerdo con la observación de la
parcela puntuaciones de los objetos que la segunda dimensión parece separar
los objetos más largos del resto. Muesca de la cabeza y Forma de la cabeza
tienen valores relativamente grandes en ambas dimensiones, lo que indica la
discriminación en la primera y segunda dimensiones. The Brass variables, que se
encuentra muy cerca del origen, no discrimina en absoluto en las dos primeras
dimensiones. Esto tiene sentido, ya que todos los objetos pueden estar hechos
de latón o no de latón.
Longitud en pulgadas cuenta con
cinco categorías, tres de las cuales
se agrupan cerca de la parte
superior de la parcela. Las dos
categorías restantes se
encuentran en la mitad inferior de
la parcela, con la categoría de 2_1 /
2_in muy lejos del grupo. La gran
longitud a lo largo de la
discriminación dimensión 2 es un
resultado de esta una categoría de
ser muy diferente de las otras
categorías de longitud. Del mismo
modo, para la forma de la cabeza,
la categoría STAR es muy lejos de
las otras categorías y produce un
alto grado de discriminación a lo
largo de la segunda dimensión.
Estos patrones no se pueden
ilustrar en un gráfico de medidas
de discriminación.
La propagación de las cuantificaciones de las categorías para una
variable refleja la varianza y por lo tanto indica lo bien que se
discrimina que variable en cada dimensión. Centrándose en la
dimensión 1, las categorías de rosca están muy separados. Sin
embargo, a lo largo de la dimensión 2, las categorías de esta
variable son muy cercanos. Por lo tanto, la rosca discrimina mejor
en la dimensión 1 que en la dimensión 2. En contraste, las
categorías para Forma de la cabeza se extienden lejos a lo largo de
ambas dimensiones, lo que sugiere que esta variable discrimina
bien en ambas dimensiones.
El gráfico etiquetado con Rosca
muestra que la primera
dimensión separa Yes_Thread y
No_Thread perfectamente.
Todos los objetos con rosca
tienen puntuaciones de los
objetos negativos, mientras que
todos los objetos sin
subprocesos tienen
puntuaciones positivas. Aunque
las dos categorías no forman
grupos compactos, la perfecta
diferenciación entre las
categorías se considera en
general un buen resultado.
El gráfico etiquetado con Forma de la
cabeza muestra que esta variable
discrimina en ambas dimensiones. El
grupo de objetos planos juntos en la
esquina inferior derecha de la trama,
mientras que la COPA objetos se
agrupan en la parte superior derecha.
CONO todos los objetos se
encuentran en la parte superior
izquierda. Sin embargo, estos objetos
se dispersan más que los otros grupos
y, por tanto, no son tan homogénea.
Por último, los objetos cilindro no
pueden separarse de los objetos
redondos, los cuales se encuentran en
la esquina inferior izquierda de la
parcela.
El gráfico etiquetado con latón muestra
que esta variable tiene categorías que no
se pueden separar muy bien en la
primera o segunda dimensiones. Las
puntuaciones de los objetos se
encuentran ampliamente distribuidos en
todo el espacio. Los objetos de metal no
pueden ser diferenciados de los objetos
nonbrass.
El gráfico etiquetado con Longitud
en pulgadas muestra que esta
variable no discrimina en la primera
dimensión. Sus categorías no
muestran agrupación cuando se
proyectan sobre una línea
horizontal. Sin embargo, Longitud
en pulgadas no discrimina en la
segunda dimensión. Los objetos
más cortos corresponden a las
puntuaciones positivas, y los
objetos más largos corresponden a
grandes puntuaciones negativas.