Está en la página 1de 23

¿QUÉ ES EL ANÁLISIS CLUSTER?

• TÉCNICA EXPLORATORIA DE INTERDEPENDENCIA [ENTRE LAS OBSERVACIONES] MEDIANTE LA


CUAL SE BUSCA AGRUPARLAS DE ACUERDO CON SU NIVEL DE PARECIDO O DIFERENCIA.
• CON EFA Y PCF SE ANALIZABA LA INTERDEPENDENCIA DE LAS VARIABLES
• LOS GRUPOS DE OBJETOS SE DENOMINAN CONGLOMERADOS

• LOS CONGLOMERADOS A SU INTERIOR TIENDEN A SER HOMOGÉNEOS EN COMPARACIÓN CON LAS


OBSERVACIONES DE OTROS CONGLOMERADOS.
• LAS VARIABLES QUE DETERMINAN LA SEPARACIÓN EN CLUSTERS CONFORMAN SU VALOR
TEÓRICO. NO HAY ESTIMACIÓN ESPECÍFICA PARA EL VALOR TEÓRICO.
• ES DESCRIPTIVO, ATEÓRICO Y NO INFERENCIAL.
¿QUÉ SE OBTIENE DEL ANÁLISIS
CLUSTER?
• CONGLOMERADOS DE OBSERVACIONES, CON CARACTERÍSTICAS
PREDOMINANTES PARA CADA CONGLOMERADO.
• NO HAY SOLUCIONES ÚNICAS.
• ES NECESARIO ITERAR EL MODELO VARIAS VECES PARA ENTENDER CÓMO SE
ESTÁN AGRUPANDO LAS OBSERVACIONES Y SI UNA VARIABLE ES MEJOR QUE
OTRA PARA AGRUPAR DE ACUERDO CON LOS OBJETIVOS DE LA INVESTIGACIÓN.
• LA VALIDEZ DEL MODELO DEPENDE DEL MARCO CONCEPTUAL QUE ORIENTA LA
INVESTIGACIÓN.
OBJETIVOS DEL ANÁLISIS CLUSTER

• CLASIFICACIÓN DE LAS OBSERVACIONES


• TAXONOMÍA: DEFINICIÓN DE LA ESTRUCTURA DE LOS DATOS
• TIPOLOGÍAS: IDENTIFICACIÓN DE LOS GRUPOS DE DATOS.
EJEMPLO PRÁCTICO
• UNA BASE DE 30 PROVEEDORES QUIENES RESPONDIERON A CINCO DIFERENTES PREGUNTAS
MEDIDAS CON UNA ESCALA DE LIKERT

• P16 EL CÓDIGO DE ÉTICA DE __________ DELIMITA LA MANERA COMO SE LLEVAN A CABO LOS
NEGOCIOS DEL PROVEEDOR CON __________.
• P24 EN LAS NEGOCIACIONES SOBRE PRECIOS, __________ ES JUSTA.
• P33 TENEMOS REUNIONES PERIÓDICAS CON __________, LO QUE CONTRIBUYE A MANTENER
UNA BUENA RELACIÓN DE NEGOCIOS CON ELLOS.
• P35 LOS CONTRATOS CON __________ SON CLAROS Y PRECISOS. CADA PARTE SABE QUÉ
ESPERAR DE LA CONTRAPARTE Y QUÉ SE ESPERA DE ELLOS MISMOS.
• P38 EN LAS NEGOCIACIONES __________ ABUSA DE SU POSICIÓN DOMINANTE.
TIPOS DE PREGUNTAS QUE SE PUEDEN
RESOLVER
• ¿COMO SE CARACTERIZA UN CONJUNTO DE CONSUMIDORES DE UN
PRODUCTO ESPECÍFICO?
• ¿CUÁL ES LA TIPOLOGÍA DE LOS USUARIOS DE UN SERVICIO DE URGENCIAS
EN UN HOSPITAL?
• ¿CÓMO SE CARACTERIZAN LAS EMPRESAS QUE DESARROLLAN INNOVACIÓN
SISTEMÁTICA?
•…
POSIBLES PREGUNTAS:

• ¿EXISTE UNA ESTRUCTURA DE RELACIONES CON PROVEEDORES CON


DIFERENCIAS CON RELACIÓN AL COMPORTAMIENTO ÉTICO?
• ¿CÓMO CLASIFICAR LOS PROVEEDORES DE ACUERDO CON SU PERCEPCIÓN
ÉTICA DE LA EMPRESA?
•…

Ejemplo
Práctico
ANÁLISIS PREVIOS

• IMPLICACIONES DE LA DIVERSIDAD DE ESCALA DE LAS VARIABLES


• ESTANDARIZACIÓN POR VARIABLES
• TIPIFICACIÓN ENTRE SUJETOS O TIPIFICACIÓN CENTRADA POR FILAS. EFECTIVA
PARA ELIMINAR EFECTOS DE RESPUESTA Y RECOMENDADA PARA EFECTOS DE
ACTITUD.

• IMPLICACIONES DE LOS VALORES ATÍPICOS


• CONGLOMERADOS UNITARIOS
ANÁLISIS PREVIOS

• REPRESENTATIVIDAD DE LA MUESTRA
• IMPACTO DE LA MULTICOLINEALIDAD
• EXCESO DE PESO DE VARIABLES CORRELACIONADOS
• SE DEBEN ELIMINAR VARIABLES REDUNDANTES QUE NO AGREGAN VALOR
ALGUNO.
• ¿SE DEBEN ESTANDARIZAR LAS VARIABLES?
• ¿SE DEBEN ESTANDARIZAR LOS INDIVIDUOS?
• ¿EXISTEN SUFICIENTES OBSERVACIONES?
• ¿CUÁLES VARIABLES PARECERÍAN SER REDUNDANTES?

Ejemplo
Práctico
GRADO DE AFINIDAD ENTRE LOS
DATOS
• DISTANCIA EUCLÍDEA

• DISTANCIA ABSOLUTA

• DISTANCIA DE MAHALANOBIS
• S ES LA MATRIZ DE COVARIANZA DE LAS P VARIABLES.
CONFORMACIÓN DE LOS
CONGLOMERADOS
• MÉTODO JERÁRQUICO
• MÉTODO DE AGLOMERACIÓN
• CADA DATO INICIALMENTE SE CONSIDERA UN CONGLOMERADO INDEPENDIENTE. SE
UNEN LOS DOS CONGLOMERADOS MÁS PRÓXIMO EN UN ÚNICO CONGLOMERADO. EN
ESTE SIGUIENTE NIVEL SE UNEN NUEVAMENTE LOS DOS CONGLOMERADOS MÁS
PRÓXIMOS Y ASÍ SUCESIVAMENTE.
• LA MEJOR ESTRUCTURA CONSISTIRÁ EN AQUELLA QUE TENGA GRANDES DIFERENCIAS
ENTRE CONGLOMERADOS EN COMPARACIÓN CON LAS DIFERENCIAS AL INTERIOR DEL
CONGLOMERADO
CONFORMACIÓN DE LOS
CONGLOMERADOS
• MÉTODO JERÁRQUICO
• TIPOS DE MÉTODOS DE AGLOMERACIÓN
• ENCADENAMIENTO SIMPLE – DISTANCIA MÍNIMA
• ENCADENAMIENTO COMPLETO – DISTANCIA MÁXIMA
• ENCADENAMIENTO MEDIO – DISTANCIA MEDIA ENTRE LAS OBSERVACIONES DEL
CONGLOMERADO
• MÉTODO DE WARD – MINIMA SUMA DE CUADRADOS EN DOS CONGLOMERADOS
• MÉTODO DE CENTROIDE – DISTANCIA ENTRE CENTROIDES

cluster linkage [varlist] [if] [in] [, cluster_options]


help cluster_linkage
VER DO-FILE PARA STATA
• CLUSTER SINGLELINKAGE P16 P24 P38,
• CLUSTER DENDROGRAM _CLUS_1
• CLUSTER AVERAGELINKAGE P16 P24 P38,
• CLUSTER DENDROGRAM _CLUS_2
• CLUSTER COMPLETELINKAGE P16 P24 P33 P35 P38
• CLUSTER DENDROGRAM _CLUS_2

Ejemplo
Práctico
CONFORMACIÓN DE LOS
CONGLOMERADOS

• MÉTODO JERÁRQUICO
• MÉTODO DIVISIVO
• UN GRAN CONGLOMERADO CON TODAS LAS OBSERVACIONES
• LAS OBSERVACIONES MÁS DIFERENTES SE DIVIDEN Y CONSTITUYEN
CONGLOMERADOS MÁS PEQUEÑOS
• Y ASÍ SUCESIVAMENTE HASTA QUE CADA OBSERVACIÓN SE VUELVE UN
CONGLOMERADO.
Ejemplos Dendrograma
Dendrogram for _clus_2 cluster analysis
8

Dendrogram for _clus_3 cluster analysis

15
6
L2 dissimilarity measure

L2 dissimilarity measure
10
4

5 0
1 21 45 52 59 6 40 2 12 14 16 17 19 20 26 29 37 42 43 47 48 54 56 58 3 4 5 9 10 25 32 35 36 49 53 55 7 13 15 34 39 44 46 50 8 23 31 11 22 24 41 51 57 27 28 30 33 38 18
2 0

18 6 40 8 23 31 27 28 30 33 38 1 21 45 7 13 15 34 39 44 46 50 3 4 5 9 10 25 32 35 36 49 53 55 11 22 24 41 51 57 2 12 14 16 17 19 20 26 29 37 42 43 47 48 54 56 58 52 59
EJEMPLOS DENDROGRAMA
Dendrogram for _clus_2 cluster analysis
8

A 7 1 21 45 7
B 2 2 12 14 16 17 19 20 26 29 37 42 43 47 8 54 2 5
C 3 3 4 5 9 10 25 32 35 36 49 53 55 3 4 1
6
L2 dissimilarity measure

D 96 9 2 7 6
E 4 7 13 15 34 39 44 46 50 4 3 2 1 5 SINGLELINKAGE
F 5 8 23 31 5 2 3 2 4 1
G 1 11 22 24 41 51 57 1 6 1 2 8 3 4 ABCDEFG 1
H 17 18 17 10 15 14 8 13 12 16 IJ 2 1
I 0 27 28 30 33 38 0 7 2 3 9 4 5 1 17 H 7 6 5
4

J 6 52 59 6 1 4 3 3 2 1 5 11 6
K 10 40 10 3 8 7 1 6 5 9 7 10 4
2 0

18 6 40 8 23 31 27 28 30 33 38 1 21 45 7 13 15 34 39 44 46 50 3 4 5 9 10 25 32 35 36 49 53 55 11 22 24 41 51 57 2 12 14 16 17 19 20 26 29 37 42 43 47 48 54 56 58 52 59
EJEMPLO DENDROGRAMA
Dendrogram for _clus_3 cluster analysis
15
L2 dissimilarity measure
5 0 10

1 21 45 52 59 6 40 2 12 14 16 17 19 20 26 29 37 42 43 47 48 54 56 58 3 4 5 9 10 25 32 35 36 49 53 55 7 13 15 34 39 44 46 50 8 23 31 11 22 24 41 51 57 27 28 30 33 38 18
CONFORMACIÓN DE LOS
CONGLOMERADOS
• K-MEDIAS
• CUANDO EL NÚMERO DE CONGLOMERADOS ESTÁ DETERMINADO POR
ANTICIPADO.
• SE SELECCIONA UNA SEMILLA DE CONGLOMERADO Y LAS OBSERVACIONES
DENTRO DE UNA DISTANCIA ESPECIFICADA SE INCLUYEN EN EL CONGLOMERADO.
• Y ASÍ SUCESIVAMENTE PARA OTROS CONGLOMERADOS

cluster kmeans [varlist] [if] [in] , k(#) [ options ]


CONFORMACIÓN DE LOS
CONGLOMERADOS
• K-MEDIAS
• ¿CÓMO ASIGNAR LAS SEMILLAS PARA CONGLOMERADOS?
• SECUENCIALMENTE SE SELECCIONA UNA Y DESPUÉS DE QUE LAS OBSERVACIONES A
UNA DISTANCIA MENOR A LA ESPECIFICADA HAN SIDO ASIGNADAS, SE SELECCIONA
OTRA SEMILLA.
• PARALELAMENTE SE SELECCIONAN VARIAS SEMILLAS Y SE ASIGNAN LOS OBJETOS
QUE ESTÉN DENTRO DE LA DISTANCIA ESPECIFICADA.
• CON OPTIMIZACIÓN SE FACILITA LA REUBICACIÓN DE LOS OBJETOS A PARTIR DE LOS
OTROS Y DEPENDIENDO DE SU CERCANÍA A UNO U OTRO CONGLOMERADO
VER DO-FILE PARA STATA
• CLUSTER KMEANS P33_REUNIONES_PERIODICAS
P35_CONTRATOS_CLAROS P38_ABUSO_POSIC_DOMINANTE, K(6)
• CLUSTER KMEANS P33_REUNIONES_PERIODICAS
P35_CONTRATOS_CLAROS P38_ABUSO_POSIC_DOMINANTE, K(6)
GENERATE(GRUPO)
• CLUSTER KMEANS P33_REUNIONES_PERIODICAS
P35_CONTRATOS_CLAROS P38_ABUSO_POSIC_DOMINANTE, K(6)
NAME(SEGUNDO) MEASURE(L1)

Ejemplo
Práctico
INTERPRETACIÓN DE LOS
CONGLOMERADOS

• EL CENTROIDE DEL GRUPO PUEDE TOMARSE COMO REPRESENTATIVO


• ¿QUÉ PROPORCIÓN DE LAS MEDIDAS DE LAS VARIABLES ESTÁ EN EL
CONGLOMERADO?
• ¿ES ESTA PROPORCIÓN DISTINTIVA?
• ¿ES TEÓRICAMENTE CONSISTENTE LA AGRUPACIÓN?
CÓMO VALORAR EL CONGLOMERADO

• VALIDACIÓN CON MUESTRAS DISTINTAS


• ¿TODAS LAS VARIABLES INCLUIDAS APORTAN A LA ESTRUCTURA DE LOS
DATOS?
• ¿ES TEÓRICAMENTE CONSISTENTE LA AGRUPACIÓN?

También podría gustarte