Análisis de correspondencias múltiple El propósito del análisis de correspondencia múltiple, también conocido como análisis de homogeneidad, es encontrar calificaciones que son óptimas en el sentido de que las categorías están separados unos de otros tanto como sea posible. Esto implica que los objetos de la misma categoría se representan cerca unos de otros y los objetos en diferentes categorías se representan lo más alejados posible. El término homogeneidad también se refiere al hecho de que el análisis será más exitosa cuando las variables son homogéneos; es decir, cuando se dividan los objetos en grupos con las mismas o similares categorías. Análisis de correspondencias múltiple
Ejemplo: Características del Hardware
Para explorar cómo funciona el análisis de correspondencia múltiple, que va a utilizar los datos de Hartigan (Hartigan, 1975), que se puede encontrar en screws.sav. Ver los archivos muestrales para obtener más información. Este conjunto de datos contiene información sobre las características de tornillos, pernos, clavos y tacos. La siguiente tabla muestra las variables, junto con sus etiquetas de variable y las etiquetas de valor asignadas a las categorías de cada variable en el conjunto de datos de hardware Hartigan. Análisis de correspondencias múltiple Análisis de correspondencias múltiple
Hartigan conjunto de datos de hardware
Nombre de la Etiqueta de variable Valores variable rosca Rosca Con rosca, sin rosca cabeza Forma de la cabeza lisa, copa, cono, redonda, cilíndrica marcabe Marca en la cabeza Ninguna, estrella, hendidura forcach Forma de la cacha afilado, plano longitud Longitud en pulg.med ½, 1, 1 ½, 2, 2 ½ plata Plata Si_plata, No_plata artículo Artículo Tachuela, clavo1, clavo2, clavo3, clavo4, clavo5, clavo6, clavo7, clavo8, tornillo1, tornillo2, tornillo3, tornillo4, tornillo5, perno1, perno2, perno3, perno4, perno5, perno6, tachuela1, tachuela2, clavo b, tornillo b. Para obtener un análisis de correspondencias múltiple, elija en los menús: Analizar> Reducción Dimensión> escalamiento óptimo ... Asegúrese de que todas las variables son nominales múltiples y Un conjunto se seleccionan, y haga clic en Definir.
Seleccione todas las
variables como variables de análisis, a excepción de var. Objeto.
Seleccionar objeto como
variable de etiquetado.
► Haga clic en Objeto en el
grupo Gráficos. Casi la totalidad de la varianza en los datos se explica por la solución, el 62,1% en la primera dimensión y el 36,8% en el segundo.
Las dos dimensiones en conjunto proporcionan una interpretación en
términos de distancias. Si una variable discrimina bien, los objetos estarán cerca de las categorías a las que pertenecen. Lo ideal sería que los objetos de la misma categoría estarán cerca uno del otro (es decir, deben tener puntuaciones similares), y las categorías de las diferentes variables se trabajará en estrecha si pertenecen a los mismos objetos (es decir, dos objetos que tienen puntajes similares para una variable también debe anotar cerca unos de otros para las otras variables en la solución). Después de examinar el resumen del modelo, usted debe buscar en las puntuaciones de los objetos. Puede especificar una o más variables para etiquetar el gráfico de puntuaciones del objeto. Cada variable de etiquetado genera un gráfico diferente etiquetado con los valores de esa variable. Vamos a echar un vistazo a la trama de puntuaciones de los objetos etiquetados por el objeto variable. Esto es sólo una variable de caso-identificación y no se utilizó en ningún cálculo.
La distancia de un objeto al origen refleja la variación del patrón de respuesta
"media". Este patrón de respuesta promedio corresponde a la categoría más frecuente para cada variable. Los objetos con muchas características que corresponden a las categorías más frecuentes se encuentran cerca del origen. En contraste, los objetos con características únicas están situados lejos del origen. El examen de la parcela, se ve que la primera dimensión (el eje horizontal) discrimina los tornillos y pernos (que tienen roscas) de los clavos y tachuelas (que no tienen las discusiones). Esto se ve fácilmente en la trama desde tornillos y pernos están en un extremo del eje horizontal y tachuelas y clavos están en el otro. En menor medida, la primera dimensión también separa los pernos (que tienen fondos planos) de todos los demás (que tiene fondos afilados).
La segunda dimensión (el eje vertical) parece separar TORNILLO1 CLAVO6
y de todos los demás objetos. ¿Qué TORNILLO1 y CLAVO6 tienen en común son sus valores en la variable longitud-que son los objetos más largos de los datos. Por otra parte, TORNILLO1 encuentra mucho más lejos del origen que los otros objetos, lo que sugiere que, tomada en su conjunto, muchas de las características de este objeto no son compartidas por los otros objetos. “El gráfico de puntuaciones del objeto es especialmente útil para detectar valores atípicos. TORNILLO1 podría considerarse un caso atípico”. Antes de examinar el resto de los gráficos de las puntuaciones de objeto, vamos a ver si las medidas de discriminación de acuerdo con lo que hemos dicho hasta ahora. Para cada variable, una medida de discriminación, que puede ser considerado como un componente de carga cuadrado, se calcula para cada dimensión. Esta medida es también la varianza de la variable cuantificada en esa dimensión. Tiene un valor máximo de 1, lo que se logra si las puntuaciones de los objetos caen en grupos mutuamente excluyentes y todas las puntuaciones de los objetos dentro de una categoría son idénticos. (Nota: Esta medida puede tener un valor superior a 1 si hay datos faltantes.) Como se ha señalado en el gráfico de puntuaciones del objeto, la medidas de discriminación gráfico muestra que la primera dimensión se relaciona con las variables de rosca y Forma del suelo. Estas variables tienen grandes medidas de discriminación sobre las primeras medidas de dimensión pequeña y la discriminación en la segunda dimensión. Por lo tanto, para estas dos variables, las categorías se extienden lejos a lo largo de sólo la primera dimensión.
Longitud en medio pulgadas tiene un valor grande en la segunda dimensión,
pero un valor pequeño en la primera dimensión. Como resultado, la longitud es más cercano a la segunda dimensión, de acuerdo con la observación de la parcela puntuaciones de los objetos que la segunda dimensión parece separar los objetos más largos del resto. Muesca de la cabeza y Forma de la cabeza tienen valores relativamente grandes en ambas dimensiones, lo que indica la discriminación en la primera y segunda dimensiones. The Brass variables, que se encuentra muy cerca del origen, no discrimina en absoluto en las dos primeras dimensiones. Esto tiene sentido, ya que todos los objetos pueden estar hechos de latón o no de latón. Longitud en pulgadas cuenta con cinco categorías, tres de las cuales se agrupan cerca de la parte superior de la parcela. Las dos categorías restantes se encuentran en la mitad inferior de la parcela, con la categoría de 2_1 / 2_in muy lejos del grupo. La gran longitud a lo largo de la discriminación dimensión 2 es un resultado de esta una categoría de ser muy diferente de las otras categorías de longitud. Del mismo modo, para la forma de la cabeza, la categoría STAR es muy lejos de las otras categorías y produce un alto grado de discriminación a lo largo de la segunda dimensión. Estos patrones no se pueden ilustrar en un gráfico de medidas de discriminación. La propagación de las cuantificaciones de las categorías para una variable refleja la varianza y por lo tanto indica lo bien que se discrimina que variable en cada dimensión. Centrándose en la dimensión 1, las categorías de rosca están muy separados. Sin embargo, a lo largo de la dimensión 2, las categorías de esta variable son muy cercanos. Por lo tanto, la rosca discrimina mejor en la dimensión 1 que en la dimensión 2. En contraste, las categorías para Forma de la cabeza se extienden lejos a lo largo de ambas dimensiones, lo que sugiere que esta variable discrimina bien en ambas dimensiones. El gráfico etiquetado con Rosca muestra que la primera dimensión separa Yes_Thread y No_Thread perfectamente. Todos los objetos con rosca tienen puntuaciones de los objetos negativos, mientras que todos los objetos sin subprocesos tienen puntuaciones positivas. Aunque las dos categorías no forman grupos compactos, la perfecta diferenciación entre las categorías se considera en general un buen resultado. El gráfico etiquetado con Forma de la cabeza muestra que esta variable discrimina en ambas dimensiones. El grupo de objetos planos juntos en la esquina inferior derecha de la trama, mientras que la COPA objetos se agrupan en la parte superior derecha. CONO todos los objetos se encuentran en la parte superior izquierda. Sin embargo, estos objetos se dispersan más que los otros grupos y, por tanto, no son tan homogénea. Por último, los objetos cilindro no pueden separarse de los objetos redondos, los cuales se encuentran en la esquina inferior izquierda de la parcela. El gráfico etiquetado con latón muestra que esta variable tiene categorías que no se pueden separar muy bien en la primera o segunda dimensiones. Las puntuaciones de los objetos se encuentran ampliamente distribuidos en todo el espacio. Los objetos de metal no pueden ser diferenciados de los objetos nonbrass. El gráfico etiquetado con Longitud en pulgadas muestra que esta variable no discrimina en la primera dimensión. Sus categorías no muestran agrupación cuando se proyectan sobre una línea horizontal. Sin embargo, Longitud en pulgadas no discrimina en la segunda dimensión. Los objetos más cortos corresponden a las puntuaciones positivas, y los objetos más largos corresponden a grandes puntuaciones negativas.
Resumen de Diseño Estadístico Para Investigadores en Ciencias Sociales y del Comportamiento. Capítulo 2: Variables Estadísticas: RESÚMENES UNIVERSITARIOS