Está en la página 1de 22

PRESENTACIN

DE LOS
MTODOS DE C LASIFICACIN

Eduardo CRIVISQUI
ADVERTENCIA

SLO EL CONOCIMIENTO DE LAS PROPIEDADES LGICAS DE


LOS MTODOS ESTADSTICOS PERMITE EVITAR EL EMPLEO
A CIEGAS DE LOS MISMOS.
Esto es vlido para todos los mtodos estadsticos, pero es
particularmente importante tomar en cuenta esa advertencia
en el caso de los mtodos de clasificacin...

El empleo a ciegas de un mtodo estadstico se desarrolla


en cuatro fases:
PRIMERA FASE : se emplea una tabla construida de cualquier
manera.
SEGUNDA FASE : a esa tabla se le aplica cualquier mtodo
estadstico.
TERCERA FASE : obtiene as un resultado [si la computadora
funciona... la aplicacin de un algoritmo de clculo
a una tabla de nmeros.... da siempre un
resultado!!!]
CUARTA FASE : por ltimo, el analista....
se queda perplejo... emite dudas sobre la utilidad del
anlisis de los datos.
o bien,
pasa por encima de todo y con gran audacia (poca
seriedad y poco profesionalismo) redacta un comentario
absurdo sobre resultados sin sentido.
PRESENTACIN DE LOS MTODOS
DE CLASIFICACIN

NDICE

I. PRIMERA PARTE
Introduccin a los mtodos
de clasificacin
1. Qu significa clasificar un conjunto
de unidades de observacin?
2. Clases, clases empricas y
clasificabilidad de un conjunto de
unidades de observacin
2.1. Las clases de individuos
semejantes
2.2. Clasificabilidad de los elementos
de una tabla observada
II. SEGUNDA PARTE
Presentacin de algunos mtodos
de clasificacin y de particin de un
conjunto de objetos
Clasificacin de los objetos en lnea de una
tabla T(n, p), con p variables cuantitativas

1. Etapas de aplicacin de un mtodo


de clasificacin
2. Semejanza entre individuos de
una tabla T(n, p)
2.1. ndices de similaridad
2.2. ndices de disimilaridad
2.3. Distancias
2.4. Distancia ultramtrica
2.5. Seleccin de una distancia
entre los objetos a clasificar
3. Algunos mtodos de clasificacin
jerrquica ascendente
3.1. Introduccin
a) Objetivo
b) Resumen grfico

c) Componente analgica del resultado de


una clasificacin jerrquica ascendente
d) Ejemplo : resultados de una clasificacin
jerrquica ascendente
e) Definiciones : a partir del ejemplo
precedente

f) Verificacin : el ndice utilizado en el


ejemplo anterior satisface las
propiedades de una distancia
ultramtrica
g) Equivalencia entre ultramtricas
y jerarquas indiciadas

h) Qu significa clasificar un grupo de


objetos ...?
i) Cmo transformar la distancia
empleada en una distancia ultramtrica?
j) La transformacin se hace utilizando
los algoritmos de agregacin de clases
de objetos
3.2. El mtodo del vecino ms cercano
3.3. El mtodo del vecino ms cercano :
un ejemplo numrico
a) Tabla de datos y representacin grfica
en R2

b) Primera agregacin
c) Segunda agregacin

d) Tercera agregacin
e) Cuarta agregacin

f) Quinta agregacin

g) Resultados de la clasificacin

3.4..El mtodo de los centroides o de la


distancia media
3.5..El mtodo de los centroides o de
la distancia media : un ejemplo
numrico
3.6..Comparacin de los resultados de
esas dos estrategias de agregacin
aplicadas al mismo ejemplo numrico
3.7..Mtodos de agregacin basados en la
varianza
a) Principio de funcionamiento
del mtodo de agregacin

b) Notacin
c) Desarrollo del algoritmo de agregacin

d) Ventajas de los mtodos de agregacin


basados en la varianza
e) Desventajas de esos mtodos
de agregacin

3.8. El mtodo de Ward


a) Principio de funcionamiento del
mtodo de Ward
b) El mtodo de Ward : un ejemplo
numrico

3.9. Cmo seleccionar una particin


a partir de una jerarqua?
a) Seleccin de una buena particin

b) Ejemplo de seleccin de corte


de un dendrograma
4. Algunos procedimientos de particin
4.1. Funcionamiento de los procedimientos
de agregacin en torno a centros
mviles
4.2. Decrecimiento de la varianza
intraclases en cada iteracin del
procedimiento de agregacin en
torno a centros mviles
4.3. Algunas variantes de los
procedimientos de particin por
agregacin en torno a centros
mviles
a) Mtodo de K-means
b) Mtodo de las nubes dinmicas
c) Mtodo Isodata

d) Mtodo de los individuos tpicos

4.4. Ventajas e inconvenientes de los


procedimientos de agregacin en torno
a centros mviles
5. Estrategia de anlisis de tablas T(n, p)
de grandes dimensiones
5.1. Por qu se debe combinar el ACP con
las tcnicas de clasificacin...?
a) El anlisis factorial es necesario

b) El anlisis factorial es insuficiente


1. Dificultades de interpretacin ;
reduccin excesiva de dimensio-
nes ; deformaciones
2. Carencia de robustez

3. Representaciones grficas
intrincadas

5.2. Cmo combinar el ACP con las


tcnicas de clasificacin...?
6. Ejemplo de aplicacin complementaria
del ACP y de los mtodos de
clasificacin
6.1. Presentacin del problema
6.2. Tabla de Datos
6.3. Estrategia de anlisis de datos,
combinando el ACP y los mtodos
de clasificacin
6.3.1. 1 Etapa : Anlisis de Componentes
Principales de T(22, 3)

a) Resultados
* Estadsticas de las variables continuas

* Matriz de correlaciones
* Descomposicin ortogonal
de la inercia

* Coordenadas, contribuciones y
cosenos cuadrados de los individuos
* Coordenadas de las variables activas

* Primer Plano Principal : Nube de puntos


individuos

* Primer Plano Principal : variables


activas
b) Conclusiones de la 1era Etapa

6.3.2. 2 Etapa : Clasificacin Jerrquica


Ascendente de los animales
a partir de la tabla de
factores F(22, 2)

a) Resultados
* Descripcin de los nodos de
la jerarqua
* Dendrograma

b) Conclusiones
6.3.3. 3 Etapa : Aplicacin del mtodo de
agregacin en torno a
centros mviles. Creacin
de la particin P4 a partir de
la tabla de factores F(22, 2)

a) Resultados
* Corte del rbol en 4 clases

* Consolidacin de la particin en torno


a los 4 Centros de Clases

* Descomposicin de la inercia
* Coordenadas y valores-test de los
Centros de Clases

* Parangones de las 4 clases


* Puntos de contribucin mxima en las
4 clases
b) Conclusiones

6.3.4. 4 Etapa : Caracterizacin de la


particin P4 de los n
individuos de la tabla T(22, 3)
* Resultados y conclusiones

* Caracterizacin de las clases por


las variables continuas
6.3.5. 5 Etapa : Ubicacin de las clases de
las particiones en el primer
plano factorial
a) Resultados

* Primer Plano Principal : variables y


centros de clases de la particin P4

* Primer Plano Principal : puntos-animales


agrupados segn las clases de la particin
P4. Se indican los parangones de cada
clase

b) Conclusiones

7. Mtodos mixtos de clasificacin


7.1. Introduccin
7.2. Funcionamiento de las clasificaciones
mixtas
III. TERCERA PARTE
Presentacin de algunos mtodos de
clasificacin y de particin de un
conjunto de objetos
Clasificacin de los objetos en lnea de una
tabla T(n, p), con p variables cualitativas

1. Disimilaridades y distancias entre los


objetos a clasificar en una tabla
T(n,p)
1.1. T(n, 2) es una Tabla de Cdigos
Condensados
1.2. T(n, p) es una Tabla de Cdigos
Condensados
ndices de similaridad ms usuales

2. Mtodo de agregacin basado en el


crecimiento mnimo de la inercia en las
clases de las particiones encajadas
2.1. Clasificacin jerrquica de las
lneas de una Tabla TC (J,K)
a) Matriz de distancia entre perfiles-lnea

b) Desarrollo del algoritmo de agregacin


2.2. Ventajas del mtodo de agregacin
2.3. Desventajas del mtodo de agregacin
3. Ejemplo numrico de clasificacin
de las lneas de una TC(J,K)
a) Primera agregacin
b) Segunda agregacin

c) Tercera agregacin
d) Cuarta agregacin

e) Quinta agregacin
f) Sexta agregacin

g) Sptima agregacin

4. Estrategia de anlisis de tablas TC(J,K)


de grandes dimensiones
4.1. Por qu se debe combinar el AFCS
con las tcnicas de clasificacin...?
a) El anlisis factorial es necesario
b) El anlisis factorial es insuficiente...

1. Dificultades de interpretacin ;
reduccin excesiva de
dimensiones ; deformaciones

2. Carencia de robustez
3. Representaciones grficas
intrincadas
4.2. Cmo combinar el AFCS con las
tcnicas de clasificacin...?

5. Ejemplo de aplicacin complementaria


del AFC y de los mtodos de
clasificacin
a) Presentacin del problema

b) Tabla de datos

5.1. Primera etapa : Anlisis Factorial de


Correspondencias Simples de la tabla
TC(J, K)
* Coordenadas, Contribuciones y
Cosenos Cuadrados de los puntos-
perfiles colores

* Primer Plano Principal : Nube de puntos-


perfiles colores
* Coordenadas, Contribuciones y
Cosenos Cuadrados de los puntos-
perfiles adjetivos
* Primer Plano Principal : Nube de puntos-
perfiles adjetivos

* Conclusiones del anlisis factorial


5.2. Segunda etapa : Construccin de una
tipologa de los adjetivos segn sus
asociaciones con los colores
a) Clasificacin Jerrquica de
los perfiles-adjetivos

* Descripcin de los nodos


* Dendrograma

b) Particin de los perfiles-adjetivos


* Descripcin elemental de las clases
* Consolidacin de la particin en torno
a 10 Centros de Clases
* Descomposicin de la inercia
calculada sobre 10 ejes
* Coordenadas de los Centros de
Clases

* Elementos parangones de las 10


clases

* Elementos ms contributivos a la
inercia de cada clase
c) Caracterizacin de las clases de
perfiles-adjetivos
* Caracterizacin de las clases de
adjetivos con los colores

* Caracterizacin de las 10 clases


* Conclusiones de la particin
5.3. Tercera etapa : Conclusiones sobre la
asociacin entre los adjetivos y los
colores
* Primer Plano Principal : Centros de
clases (particin en 10 clases) y
elementos parangones

6. Estrategia de anlisis de tablas lgicas


TL(n, K) de grandes dimensiones
6.1. Por qu se debe combinar el AFCM
con las tcnicas de clasificacin...?
a) El anlisis factorial es necesario

b) El anlisis factorial es insuficiente...

1. Dificultades de interpretacin ;
reduccin excesiva de
dimensiones ; deformaciones
2. Carencia de robustez

3. Representaciones grficas
intrincadas

6.2. Cmo combinar el AFCM con las


tcnicas de clasificacin...?
7. Ejemplo de aplicacin complementaria
del AFCM y de los mtodos de
clasificacin
7.1. Presentacin del problema
7.2. Base de datos
7.3. Estrategia de anlisis de los datos
7.3.1. 1 Etapa : Construccin de una
tipologa sociodescriptiva
a) Anlisis Factorial de Correspondencias
Mltiples de la tabla TCC(2163, 7)
* Tabla de datos
* Distribucin de frecuencias de las
variables activas
* Tabla de Burt (perfiles en lnea)
* Descomposicin de la inercia
* Primer Plano Principal :
Caractersticas sociodescriptivas |
Nube de puntos-individuos
* Representacin de la nube de puntos-
individuos en 3 dimensiones
* Primer Plano Principal :
Caractersticas sociodescriptivas |
Nube de puntos-perfiles modalidades
activas
* Coordenadas, Contribuciones y
Cosenos Cuadrados de las
modalidades activas
* Coordenadas y Valores-test de las
modalidades
* Comentarios sobre el AFCM de las
caractersticas sociodescriptivas
b) Clasificacin Jerrquica de los
individuos
* Descripcin de los nodos de la
jerarqua

* Dendrograma
c) Particin de los individuos

* Descripcin elemental
* Coordenadas y Valores-test de las 5
clases
* Consolidacin de la particin en torno
a 5 Centros de Clases

* Descomposicin de la inercia
calculada sobre 4 ejes

* Individuos parangones de las clases


* Individuos de mxima contribucin a
la inercia en cada clase

d) Caracterizacin de la particin de los


individuos
* Caracterizacin de las clases por las
variables
* Caracterizacin de las clases por las
modalidades
e) Visualizacin de las clases

* Primer Plano Principal : Nube de


puntos individuos y Centros de Clases
de la particin en cinco clases
f) Retorno a los datos brutos : cruce de la
particin en cinco clases con las
variables activas e ilustrativas
g) Conservacin de la tipologa construida

7.3.2. 2 Etapa : Construccin de una


tipologa de la experiencia de
participacin

a) Anlisis Factorial de Correspondencias


Mltiples de la tabla TCC(2163, 28)
* Tabla de datos

* Distribucin de frecuencias de las


variables activas

* Tabla de Burt (perfiles en lnea)


* Descomposicin de la inercia

* Primer Plano Principal : Nube de pun-


tos-individuos
* Representacin de la nube de puntos-
individuos en 3 dimensiones

* Coordenadas, Contribuciones y
Cosenos Cuadrados de las
modalidades activas
* Primer Plano Principal : Nube de
puntos-perfiles modalidades activas

* Coordenadas y Valores-test de las


modalidades

* Primer Plano Principal : Nube de


puntos-perfiles modalidades activas e
ilustrativas

* Comentarios sobre el AFCM de las


caractersticas de experiencias de
participacin
b) Clasificacin Jerrquica de los
individuos
* Descripcin de los nodos de la
jerarqua

* Dendrograma
c) Particin de los individuos

* Descripcin elemental
* Coordenadas y Valores-test de las 7
clases
* Consolidacin de la particin en torno
a 7 Centros de Clases
* Descomposicin de la inercia
calculada sobre 5 ejes

* Individuos parangones de las clases


d) Caracterizacin de la particin de los
individuos

* Caracterizacin de las clases por las


variables

* Caracterizacin de las clases por las


modalidades
e) Visualizacin de las clases

* Primer Plano Principal : Nube de


puntos individuos y Centros de Clases
de la particin en siete clases

* Primer Plano Principal : Nube de


puntos modalidades activas y Centros
de Clases de la particin en siete
clases

f) Retorno a los datos brutos : cruce de la


particin en siete clases con las
variables activas e ilustrativas

7.3.2. 3 Etapa : Anlisis de la relacin entre


las dos tipologas
construdas

También podría gustarte