Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tutorial Software
Tutorial Software
Servei dEstadstica
Universitat Autnoma de Barcelona
Edificio D (Servei dInformtica)
08193 Bellaterra (Barcelona)
Tel. +34 93 581 13 47
Fax +34 93 581 20 94
s.estadistica@uab.es
www.uab.es/s-estadistica/
Asesor estadstico
Servei dEstadstica UAB
ndice
1 Prlogo................................................................................................ 3
4 Caracterizacin de variables............................................................. 27
4.1 Caracterizacin de una variable cualitativa ........................................................... 27
4.2 Caracterizacin de una variable continua.............................................................. 32
7 Casos propuestos.............................................................................. 63
7.1 Estudio de la relacin calidad-precio para 35 marcas de whisky (ACP)............... 63
7.2 Opinin de los estudiantes estadounidenses sobre la guerra del Vietnam (ACS) . 65
7.3 Anlisis cualitativo de razas de perros (ACM)...................................................... 66
8 Bibliografa ....................................................................................... 68
1 Prlogo
Desde hace una treintena de aos, los mtodos de anlisis multivariante de datos han
probado su eficacia en el estudio de grandes masas de informacin compleja. Se trata de
mtodos llamados multidimensionales, por oposicin a los mtodos de estadstica
descriptiva que tratan nicamente una o dos variables.
Actualmente, los mtodos factoriales se enmarcan en las tcnicas de Data Mining (o minera
de datos). stos permiten confrontar numerosas informaciones, lo cul es ms rico que
anlisis separados. Las representaciones simplificadas de grandes tablas de datos se han
manifestado como un instrumento de sntesis notable, debido a su capacidad para reducir la
dimensionalidad. Permiten extraer las tendencias ms destacadas, jerarquizarlas y eliminar
los efectos marginales o puntuales que perturban la percepcin global de los hechos
recogidos en los datos. El desarrollo de algoritmos de clasificacin resulta ser en muchas
ocasiones un complemento ideal a los mtodos factoriales y permiten describir tipologas
de individuos segn las variables en estudio.
Estos mtodos nacidos en la universidad se han aplicado a todo tipo de dominios
cientficos como la ecologa, la lingstica, la psicometra, el anlisis de mercados, la
arqueologa, ... Tambin han experimentado un gran xito en ramas de la banca y seguros
donde deben analizarse grandes ficheros de datos.
SPAD (Systme Portable pour lAnalyse de Donnes), permite implementar una estrategia de
anlisis adecuada al tratamiento exploratorio multivariante de grandes tablas de datos. Su
concepcin es original y adaptada para un proceso natural de aprendizaje a partir de los
datos (data learning).
Este sencillo manual pretende ser una herramienta para aquellas personas con
conocimientos de estadstica multivariante que quieran iniciarse al tratamiento de los datos
con SPAD. El manual est divido en diversos apartados. En los primeros, se centra el
inters en el manejo de bases de datos, para pasar luego a la prctica de los anlisis
factoriales y la obtencin de grficos. Es por tanto aconsejable realizar una lectura lineal. Se
ha utilizado la versin 4.5 de SPAD.
Podemos seleccionar
Enquete.sba.
el
archivo
BASE
deseado.
Seleccionaremos
el
archivo
Esta opcin nos abre una nueva ventana (EDIBASE), con la que podemos editar el
archivo.
Esta ventana se organiza en cuatro subventanas, accesibles por men va Fentre o bien
con los iconos de la barra de herramientas:
Ventana Entte (
). Datos generales sobre la base de datos. Nombre, nmero de
individuos y variables, ...
Ventana Variables (
). Etiquetas y tipo de las variables de la base.
Ventana Modalits(
). Etiquetas de las modalidades de las variables de tipo
nominal.
Ventana Valeurs (
). Valores de las variables para cada uno de los individuos.
La ventana que aparece por defecto es la ventana Valeurs, en forma de matriz, y se
puede editar directamente. Destacamos que las dos primeras columnas corresponden a los
identificadores de individuos y a sus etiquetas (Libelles). Las opciones del men
Edition permiten aadir / suprimir individuos, entre otras. Los valores faltantes
(missings) se indican con una ausencia de valor.
Ejemplo 2. Crearemos una base con 10 individuos con los datos siguientes:
Id
1
2
3
4
5
6
7
8
Etiqueta
Juan
Silvia
Jos
Pedro
Ana
David
Cristina
Marta
Sexo
Hombre
Mujer
Hombre
Hombre
Mujer
Hombre
Mujer
Mujer
Salario anual
18.000
15.000
25.000
17.000
19.000
30.000
22.000
10.000
9
10
Vanesa
Carlos
Mujer
Hombre
13.000
21.000
Primeramente debemos definir las variables y su tipo. Por defecto ya viene definido un
identificador de individuo y su etiqueta. Debemos por tanto aadir tres nuevas variables:
una nominal (N), otra continua (C) y otra textual (T). Debemos tambin definir su rango y
las etiquetas de las modalidades de la variable nominal.
Para introducir los valores, debemos cliquear sobre el icono Valeurs. Observaremos que
la matriz de valores est vaca. Debemos ejecutar la opcin Ajuter N fois del men
Edition, y indicar que queremos aadir 10 individuos.
Ya podemos introducir los datos. El editor de bases de SPAD permite realizar las
operaciones Copiar / Cortar / Pegar usuales en Windows. As pues, puede interaccionar
con otras aplicaciones que contengan datos, como WORD, EXCEL, SPSS,...
Una vez los hayamos introducido debemos guardar la base, utilizando la opcin
Enregistrer del men Fichier y debemos indicarle el nombre y el directorio donde
se guardar el fichero de datos. Supongamos que guardamos el fichero con el nombre
Prueba.sba.
10
Supongamos que disponemos de un archivo ASCII (.txt o .dat) que contiene los datos del
ejemplo 2, donde los valores de las variables estn separados por un espacio tabulador. Le
indicaremos a SPAD dnde se encuentra este archivo. Si tuvisemos nuestros datos en un
archivo EXCEL, bastara con guardarlo en formato texto para poder luego realizar la
importacin desde SPAD. Aconsejamos que siempre se trabaje con archivos de texto
separados por tabuladores.
11
Cliqueamos sobre el botn Suivant y nos aparece una nueva ventana donde debemos
indicar de qu tipo son las variables
Anlisis factoriales con SPAD
12
Para crear el archivo SPAD debemos cliquear sobre el botn Executer y indicar el
nombre del nuevo archivo. Slo nos quedar comprobar que la importacin se ha realizado
correctamente, abriendo el nuevo archivo con EDIBASE, y indicar las etiquetas de las
modalidades de la variable nominal sexo.
Se abrir una pantalla donde tendremos que especificar el tipo de cada una de las variables.
Anlisis factoriales con SPAD
13
14
Por defecto, al abrir SPAD ya nos aparecer una filire vaca, con el siguiente aspecto:
El primer paso que se debe realizar es indicar con qu archivo BASE se desea trabajar. Para
ello se puede ejecutar la opcin Slectionner Base del men Filire o bien
15
hacer un doble clic sobre el icono BASE. Nos aparecer una nueva pantalla donde
debemos indicar el directorio del archivo de datos.
Ejemplo 3. Retomemos los datos del archivo Enquete.sba. Abriremos una nueva
filire y seleccionaremos este archivo. La filire debera tener el siguiente aspecto:
16
Esta accin nos insertar un nuevo icono vaco, donde deberemos indicar el mtodo que
deseemos ejecutar.
17
Para parametrizar el mtodo basta con realizar un doble clic sobre el icono Stats. Se nos
abrir una ventana de parametrizacin donde debemos indicarle las variables continuas y
categricas que queremos analizar.
En la subventana Tris--plat (diagramas de barras), indicaremos que conjunto de variables
categricas queremos realizar el diagrama. Podemos seleccionar las variables una por una o
bien todas a la vez. Supongamos que elegimos las tres variables tal como sigue:
18
19
Opcionalmente SPAD permite discretizar las variables continuas. Para ello deberamos
cambiar la opcin Pour histogrammes por la opcin Pour discretisation
en Slection des variables.
En las otras subventanas podramos definir con que subgrupo de individuos desearamos
realizara los anlisis (Individus), establecer una variable de ponderacin
(Pondration), o segmentar el archivo de datos segn variables categricas (Tris
dits par modalits). En nuestro ejemplo, los parmetros por defecto sern
suficientes. Por tanto, cliqueraremos sobre el botn OK. De esta forma, la filire ya estar
parametrizada y, por tanto, lista para ejecutar.
20
Antes de ejecutar la filire debemos guardarla sobre un archivo .fil. Para ello,
debemos seleccionar la opcin Sauvegarder Filire del men Filire.
Opcionalmente, podemos dar a la filire una etiqueta larga.
21
Podemos realizar un doble click sobre cada uno de los iconos. Los smbolos de los iconos
nos indicarn el tipo de los resultados:
Icono Excel. Crea una hoja de EXCEL con los datos del anlisis. Resulta muy
til en muchas ocasiones, por ejemplo, cuando deseamos hacer grficos en formato
EXCEL.
22
Tanto los iconos de resultado como las parametrizaciones de los mtodos no se pierden y
son de immediato editables. Cabe destacar que SPAD utiliza muchos ficheros intermedios,
muchos de los cules van ligados a la filire. Es recomendable crear un directorio propio
para cada anlisis o bien para cada archivo BASE. No es recomendable copiar la filire a
otro directorio, pues dara problemas en la localizacin de ficheros.
23
24
25
Otros mdulos
Segmentacin. Mtodos para ajustar rboles de regresin y clasificacin.
Decisin Modelos. Mtodos para ajustar modelos de regresin lineales, loglineales, lineales generales,...
Tablas mltiples. Mtodos para construir tablas mltiples y realizar anlisis
factoriales mltiples.
Amado. Mtodos que interaccionan con el software AMADO.
26
4 Caracterizacin de variables
SPAD ofrece un mtodo original y poco conocido para caracterizar una variable respuesta
a partir de un conjunto de variables explicativas. Este mtodo se diferencia cuando la
variable respuesta es categrica o bien continua. En cualquier caso se aplica un algoritmo
que realiza comparaciones mltiples entre medias y / o proporciones para hallar las
variables explicativas relacionadas. Este mtodo permite, por ejemplo que sepamos que
caractersticas diferencian a los clientes buenos de los clientes malos, tomando como
explicativas la edad, el nivel de estudios, los aos en la entidad bancaria,... En el caso que la
variable sea continua, nos permitira hallar las diferencias entre individuos con valores altos
y valores bajos de la variable respuesta. Es un mtodo que se enmarca claramente entre las
tcnicas ms recientes de Minera de datos (Data Mining). Pueden darse los dos casos
siguientes:
SPAD ordena las caractersticas influyentes por el p-valor asociado a la prueba estadstica y
adems incorpora un nuevo elemento, el valor-test. Este estadstico se distribuye segn una
normal estandarizada, por lo que cuando sea superior a 2 o bien inferior a 2 se considerar
que una caracterstica es influyente, con un nivel de significacin asociado de 0,05.
27
28
29
30
31
Por ejemplo, observamos que el salario medio de los encuestados es de 4.408,55 ff,
mientras que para los hombres, esta media aumenta hasta los 6533,19 ff.
32
33
34
|
6.93 0.000 |
52.54
17.87 |non
|Exercez-vous en ce moment une activit professionnelle
|
111.00 |
|
6.71 0.000 |
50.69
18.97 |*Reponse manquante* |Avez-vous t au chmage ces douze derniers mois ?
|
142.00 |
|
6.71 0.000 |
50.69
18.97 |*Reponse manquante* |Avez-vous des conflits travail - vie personnelle
|
142.00 |
|
6.29 0.000 |
67.00
10.94 |veuf(ve)
|Statut matrimonial
|
19.00 |
|
5.92 0.000 |
55.93
15.66 |aucun diplme
|Niveau d'tudes de l'enqut(e)
|
54.00 |
|
5.30 0.000 |
48.16
17.37 |tous les jours
|Regardez-vous la tlvision ?
|
176.00 |
|
5.09 0.000 |
49.33
15.64 |propritaire
|Statut d'occupation du logement
|
133.00 |
|
4.12 0.000 |
46.10
16.75 |oui
|La famille est le seul endroit o l'on se sent bien
|
230.00 |
|
4.12 0.000 |
55.86
14.59 |ne sait pas
|Estimez-vous que la socit a besoin de se transformer
|
29.00 |
|
3.93 0.000 |
51.83
16.03 |cep seul
|Niveau d'tudes de l'enqut(e)
|
54.00 |
|
3.85 0.000 |
49.23
16.55 |semblables
|Opinion sur les conditions de vie venir
|
95.00 |
|
3.76 0.000 |
58.06
16.40 |2001 5000
|Taille d'agglomration (nombre d'habitants)
|
18.00 |
|
3.58 0.000 |
58.73
16.01 | la femme seule
|Les travaux du mnage,les soins des enfants incombent ...
|
15.00 |
|
3.25 0.001 |
52.50
15.30 |peu
|Etes-vous satisfait de votre tat de sant
|
34.00 |
|
2.96 0.002 |
48.07
18.19 |beaucoup
|Etes-vous inquiet du risque d'une agression dans la rue
|
92.00 |
|
2.94 0.002 |
45.26
15.31 |oui
|Avez-vous eu des enfants
|
243.00 |
|
2.94 0.002 |
47.21
18.70 |non
|Vous imposez-vous rgulirement des restrictions
|
122.00 |
|
2.77 0.003 |
46.80
15.92 |trs
|Etes-vous satisfait de votre logement proprement dit
|
132.00 |
|
2.68 0.004 |
44.86
17.10 |non
|Disposez-vous d'un magntoscope
|
264.00 |
|
2.44 0.007 |
46.17
16.77 |oui
|Avez-vous souffert rcemment de mal au dos
|
149.00 |
|
2.41 0.008 |
54.62
18.75 |ne sait pas
|Opinion sur les conditions de vie venir
|
13.00 |
| -2.34 0.010 |
40.82
16.20 |assez mal
|Opinion sur le fonctionnement de la justice en 1986
|
113.00 |
| -2.35 0.009 |
42.24
16.42 |homme et femme
|Les travaux du mnage,les soins des enfants incombent ...
|
214.00 |
| -2.38 0.009 |
37.65
15.23 |peu
|Etes-vous satisfait de votre cadre de vie quotidien
|
37.00 |
| -2.44 0.007 |
41.59
16.11 |non
|Avez-vous souffert rcemment de mal au dos
|
166.00 |
| -2.45 0.007 |
28.57
8.24 |ne sait pas
|Les dpenses de logement sont pour vous une charge ...
|
7.00 |
| -2.68 0.004 |
38.06
12.09 |oui
|Disposez-vous d'un magntoscope
|
51.00 |
| -2.72 0.003 |
38.90
14.33 |plus de 200000
|Taille d'agglomration (nombre d'habitants)
|
68.00 |
| -2.73 0.003 |
41.07
16.56 |assez
|Etes-vous satisfait de votre logement proprement dit
|
150.00 |
| -2.76 0.003 |
40.21
15.57 |souhaitable
|La diffusion de l'informatique est une chose ...
|
109.00 |
| -2.81 0.003 |
41.02
15.07 |pas du tout d'accord|Les gens comme moi se sentent souvent seuls
|
151.00 |
| -2.87 0.002 |
39.64
14.45 |un peu
|Etes-vous inquiet du risque d'une agression dans la rue
|
94.00 |
| -2.91 0.002 |
34.04
11.79 |chmeur
|Situation actuelle de la personne interroge
|
23.00 |
| -2.94 0.002 |
37.02
13.43 |bac ou bs
|Niveau d'tudes de l'enqut(e)
|
45.00 |
| -2.94 0.002 |
41.57
14.67 |oui
|Vous imposez-vous rgulirement des restrictions
|
193.00 |
| -3.05 0.001 |
31.44
8.97 |concubinage
|Statut matrimonial
|
16.00 |
| -3.07 0.001 |
37.57
12.85 |cep et cap
|Niveau d'tudes de l'enqut(e)
|
56.00 |
| -3.11 0.001 |
38.21
12.92 |non
|Estimez-vous que la socit a besoin de se transformer
|
68.00 |
| -3.12 0.001 |
38.25
19.46 |non
|Avez-vous eu des enfants
|
69.00 |
| -3.25 0.001 |
39.72
14.89 |dissout si accord
|Opinion sur le mariage
|
114.00 |
| -3.38 0.000 |
35.79
12.63 |tudes sup. g.coles|Niveau d'tudes de l'enqut(e)
|
43.00 |
| -3.54 0.000 |
38.78
12.00 |non
|Avez-vous des conflits travail - vie personnelle
|
97.00 |
| -3.65 0.000 |
29.47
7.62 |oui
|Avez-vous t au chmage ces douze derniers mois ?
|
17.00 |
| -3.79 0.000 |
39.56
16.93 |locataire
|Statut d'occupation du logement
|
131.00 |
| -3.98 0.000 |
37.14
10.89 |oui
|Avez-vous des conflits travail - vie personnelle
|
76.00 |
| -4.06 0.000 |
37.03
12.92 |assez souvent
|Regardez-vous la tlvision ?
|
76.00 |
| -4.26 0.000 |
36.92
12.98 |trs
|Etes-vous satisfait de votre tat de sant
|
80.00 |
| -4.28 0.000 |
28.76
5.80 |amliorer beaucoup |Opinion sur les conditions de vie venir
|
21.00 |
| -4.41 0.000 |
36.86
13.97 |non
|La famille est le seul endroit o l'on se sent bien
|
83.00 |
| -4.59 0.000 |
35.64
12.57 |amliorer un peu
|Opinion sur les conditions de vie venir
|
69.00 |
| -4.63 0.000 |
32.71
17.21 |clibataire
|Statut matrimonial
|
42.00 |
| -4.80 0.000 |
21.17
2.48 |tudiant
|Situation actuelle de la personne interroge
|
12.00 |
| -5.03 0.000 |
39.00
11.52 |non
|Avez-vous t au chmage ces douze derniers mois ?
|
156.00 |
| -5.83 0.000 |
37.77
11.24 |oui, plein temps
|Exercez-vous en ce moment une activit professionnelle
|
143.00 |
| -6.57 0.000 |
38.15
11.34 |actif
|Situation actuelle de la personne interroge
|
172.00 |
+--------------+-------------------+--------------------+------------------------------------------------------------+-----------+
|
|
43.76
16.58 | ENSEMBLE
|
315.00 |
+--------------+-------------------+--------------------+------------------------------------------------------------+-----------+
Podemos observar relaciones obvias, como por ejemplo que las personas jubiladas
(retraits) presentan una media de edad superior, y otras ms interesantes como que las
personas que cada da ven la televisin presentan una media de edad superior a la global.
Por el otro lado observamos que la edad est relacionada positivamente con el nmero de
hijos y la importancia atorgada a la religin y est relacionada inversamente con el nmero
de personas con el que se convive, el monto de prestaciones familiares recibido, la
importancia atorgada al trabajo y la importancia atorgada al tiempo libre.
35
Belgium
Denmark
France
Germany
Greece
Ireland
Italy
Neth
Portugal
Spain
U.K.
Austria
Finland
Norway
Sweden
Switz
35.3
76.1
28.6
46.0
26.0
63.7
27.8
50.4
25.1
37.6
44.1
51.6
67.2
77.2
78.6
61.1
20.5
11.8
27.5
27.9
28.2
5.4
24.0
27.8
21.7
15.4
19.3
18.0
13.5
15.8
14.3
16.8
TV
27.5
9.6
24.8
15.8
35.3
19.6
43.02
9.0
37.1
31.3
30.5
17.7
12.9
2.5
2.2
6.7
1.4
0.4
0.8
1.2
0.0
0.0
0.0
0.3
0.0
0.8
0.5
0.4
0.1
1.2
0.6
0.9
14.2
1.3
11.7
3.9
4.8
5.1
3.6
10.4
9.5
4.7
3.4
4.4
2.3
2.2
4.3
12.7
36
Para pareametrizar el mtodo debemos realizar un doble clic sobre el icono. Nos aparecer
una nueva ventana donde debemos indicarle las variables continuas activas.
37
38
En el primer icono,
, encontraremos los resultados del anlisis factorial. Los
resultados ms relevantes son:
Valores propios del ACP. En nuestro ejemplo observamos que los dos primeros ejes
factoriales conservan un 70,69% de la inercia.
VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
6.0000
SOMME DES VALEURS PROPRES ....
6.0000
HISTOGRAMME DES 6 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
|
1
|
2.7120
|
45.20 |
45.20 | ******************************************************************************** |
|
2
|
1.5297
|
25.49 |
70.69 | **********************************************
|
|
3
|
0.7817
|
13.03 |
83.72 | ************************
|
|
4
|
0.5795
|
9.66 |
93.38 | ******************
|
|
5
|
0.3965
|
6.61 |
99.99 | ************
|
|
6
|
0.0006
|
0.01 | 100.00 | *
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
39
En el segundo icono,
, podemos editar los grficos factoriales. Realizando un doble
clic nos aparece una pantalla donde se editarn los grficos. En primer lugar, debemos
ejecutar la opcin Nouveau del men Graphique.
Se nos abrir una nueva pantalla donde indicaremos el tipo de grfico a realizar.
Bsicamente hay tres grficos factoriales interesantes:
40
Para editar las etiquetas basta con realizar un doble clic sobre las flechas. SPAD permite
arrastar las etiquetas.
Grfico de las proyecciones de los individuos (pases) sobre los ejes factioriales
41
Para editar todas las etiquetas de una sola vez, podemos seleccionar la opcin De tous les
points en el men Selection y luego la opcin crire les libelles en
Habillage. Para deseleccionar los puntos, basta con ejecutar la opcin Dslection
totale en Slection.
42
A veces puede resultar interesante ponderar los puntos a partir de la contribucin de cada
pas en el espacio factorial creado. Para ello debemos ejecutar la opcin Styles pour
les categories en Preferences, que nos permite realizar esta opcin y muchas
otras, como el color de los smbolos, tamao de las etiquetas, smbolos, ...
43
Los pases cercanos son pases que presentan distribuciones parecidas en el reparto de los
gastos publicitarios. Observamos que podes pueden diferenciar claramente los pases
latinos de los pases anglosajones.
Grfico de las proyecciones de las variables y individuos utilizando los ejes unitarios
44
Muy a menudo se suelen interpretar estos grficos diferenciando en los cuatro cuadrantes.
Los pases ms alejados del origen de coordenadas son los pases que presentan un perfil
ms alejado del perfil medio. En este grfico podramos concluir lo siguiente:
Portugal , Grecia, Italia y Espaa tienden a dedicar ms recursos publicitarios en televisin y radio y muy
poco en el cine. Francia y Blgica dedican ms recursos en revistas y outdoor. Por el otro lado, pases
nrdicos como Suiza, Noruega, Suecia, Dinamarca, Finlandia y Irlanda destinan ms recursos a los
diarios. Suiza, Holanda y Alemania en concreto dedican ms recursos al cine.
45
Realizamos un doble clic sobre el icono del mtodo y debemos indicar qu variables
definen las columnas y las filas de la tabla de contingencia. Para ello, debemos cliquear en el
botn Construction du tableau de la subventana Comandes.
46
Tabla de contingencia. Definida por las dos variables categricas. Podemos observar las
frecuencias absolutas y las frecuencias relativas por fila y por columna. Tambin se realiza
un contraste de independencia de ji-cuadrado, en el que observamos que se rechaza la
hiptesis de independencia.
Valores propios del anlisis factorial. Observamos que con los dos primeros ejes
conservamos un 83% de la inercia.
VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
0.2013
SOMME DES VALEURS PROPRES ....
0.2013
HISTOGRAMME DES 5 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
|
1
|
0.1112
|
55.27 |
55.27 | ******************************************************************************** |
|
2
|
0.0571
|
28.36 |
83.63 | ******************************************
|
|
3
|
0.0193
|
9.59 |
93.22 | **************
|
|
4
|
0.0114
|
5.66 |
98.88 | *********
|
|
5
|
0.0022
|
1.12 | 100.00 | **
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
47
Proyecciones de los puntos fila y columna sobre el espacio factorial. Se puede entrar
ms en detalle sobre el anlisis factorial. Las contribuciones indican cuando una categora
est bien representada sobre un eje factorial.
48
49
Realizaremos un doble clic sobre el icono CORMU. Debemos indicar las variables
nominales que deseamos analizar. Podemos dejar el resto de parmetros con sus valores
por defecto.
50
Estos iconos son los mismos que para el caso de correspondencias simples. Destacaremos
los siguientes resultados:
51
AGE2 - de 23
40 ans
| 150
150.00 | 150
150.00 ********************
AGE3 - de 40
50 ans
| 122
122.00 | 122
122.00 ****************
AGE4 - plus de
50 ans
| 108
108.00 | 108
108.00 **************
----------------------------+-----------------+----------------------------------------------------------------------------------3 . Situation familiale
CELB - clibataire
| 170
170.00 | 170
170.00 **********************
MARI - mari
| 221
221.00 | 221
221.00 *****************************
DIVO - divorc
|
61
61.00 |
61
61.00 ********
VEUF - veuf
|
16
16.00 |
16
16.00 ***
----------------------------+-----------------+----------------------------------------------------------------------------------4 . Anciennet
ANC1 - anc. 1 an ou moins | 199
199.00 | 199
199.00 **************************
ANC2 - anc. de 1 4 ans
|
47
47.00 |
47
47.00 *******
ANC3 - anc. de 4 6 ans
|
69
69.00 |
69
69.00 *********
ANC4 - anc. de 6 12 ans |
66
66.00 |
66
66.00 *********
ANC5 - anc. plus
12 ans
|
87
87.00 |
87
87.00 ************
----------------------------+-----------------+----------------------------------------------------------------------------------5 . Domiciliation du salaire
Soui - domicile salaire
| 316
316.00 | 316
316.00 *****************************************
Snon - non dimicile salaire | 152
152.00 | 152
152.00 ********************
----------------------------+-----------------+----------------------------------------------------------------------------------6 . Domiciliation de l'pargne
EPA0 - pas d'pargne
| 370
370.00 | 372
372.00 ************************************************
EPA1 - moins de 10KF pargn |
58
58.00 |
60
60.00 ********
EPA2 - de 10 100KF pargn |
32
32.00 |
36
36.00 *****
EPA3 - plus de 100KF pargn |
8
8.00 | === VENTILEE ===
----------------------------+-----------------+----------------------------------------------------------------------------------7 . Profession
CADR - cadre
|
77
77.00 |
77
77.00 **********
EMPL - employ
| 237
237.00 | 237
237.00 *******************************
AUTR - autre
| 154
154.00 | 154
154.00 ********************
----------------------------+-----------------+----------------------------------------------------------------------------------8 . Moyenne en cours
ENC1 - moins de 2KF encours |
98
98.00 |
98
98.00 *************
ENC2 - de 2 5 KF encours | 308
308.00 | 308
308.00 ****************************************
ENC3 - plus de 5 KF encours |
62
62.00 |
62
62.00 ********
----------------------------+-----------------+----------------------------------------------------------------------------------9 . Moyenne des mouvements
MOU1 - moins 10 KF mouvt
| 154
154.00 | 154
154.00 ********************
MOU2 - de 10 30KF mouvt
|
71
71.00 |
71
71.00 **********
MOU3 - de 30 50KF mouvt
| 129
129.00 | 129
129.00 *****************
MOU4 - plus de 50KF mouvt
| 114
114.00 | 114
114.00 ***************
----------------------------+-----------------+----------------------------------------------------------------------------------10 . Cumul des dbits
DEB1 - moins de 40 dbits | 171
171.00 | 171
171.00 **********************
DEB2 - de 40 100 dbits | 161
161.00 | 161
161.00 *********************
DEB3 - plus de 100 dbits | 136
136.00 | 136
136.00 ******************
----------------------------+-----------------+----------------------------------------------------------------------------------11 . Autorisation de dcouvert
Doui - dcouvert autoris | 202
202.00 | 202
202.00 **************************
Dnon - dcouvert interdit | 266
266.00 | 266
266.00 ***********************************
----------------------------+-----------------+----------------------------------------------------------------------------------12 . Interdiction de chquier
Coui - chquier
autoris | 415
415.00 | 415
415.00 ******************************************************
Cnon - chquier
interdit |
53
53.00 |
53
53.00 *******
----------------------------+-----------------+-----------------------------------------------------------------------------------
VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0833
SOMME DES VALEURS PROPRES ....
2.0833
HISTOGRAMME DES 25 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
|
1
|
0.2540
|
12.19 |
12.19 | ******************************************************************************** |
|
2
|
0.1694
|
8.13 |
20.33 | ******************************************************
|
|
3
|
0.1417
|
6.80 |
27.13 | *********************************************
|
|
4
|
0.1292
|
6.20 |
33.33 | *****************************************
|
|
5
|
0.1086
|
5.21 |
38.54 | ***********************************
|
|
6
|
0.1045
|
5.02 |
43.56 | *********************************
|
|
7
|
0.0980
|
4.71 |
48.26 | *******************************
|
|
8
|
0.0946
|
4.54 |
52.81 | ******************************
|
|
9
|
0.0902
|
4.33 |
57.14 | *****************************
|
|
10
|
0.0830
|
3.98 |
61.12 | ***************************
|
|
11
|
0.0798
|
3.83 |
64.95 | **************************
|
|
12
|
0.0791
|
3.80 |
68.75 | *************************
|
|
13
|
0.0732
|
3.51 |
72.26 | ************************
|
|
14
|
0.0685
|
3.29 |
75.55 | **********************
|
|
15
|
0.0660
|
3.17 |
78.71 | *********************
|
|
16
|
0.0619
|
2.97 |
81.69 | ********************
|
|
17
|
0.0612
|
2.94 |
84.62 | ********************
|
|
18
|
0.0557
|
2.67 |
87.30 | ******************
|
|
19
|
0.0524
|
2.51 |
89.81 | *****************
|
|
20
|
0.0506
|
2.43 |
92.24 | ****************
|
|
21
|
0.0470
|
2.26 |
94.50 | ***************
|
|
22
|
0.0400
|
1.92 |
96.42 | *************
|
|
23
|
0.0342
|
1.64 |
98.06 | ***********
|
|
24
|
0.0273
|
1.31 |
99.36 | *********
|
|
25
|
0.0132
|
0.64 | 100.00 | *****
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
52
| AGE4 - plus de
50 ans
1.92
3.33 | 0.66 -0.29 0.97 0.11 -0.65
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
3 . Situation familiale
| CELB - clibataire
3.03
1.75 | -0.51 0.27 -0.60 0.02 -0.39
| MARI - mari
3.94
1.12 | 0.41 -0.09 0.24 0.07 0.36
| DIVO - divorc
1.09
6.67 | 0.00 -0.15 0.25 -0.31 0.26
| VEUF - veuf
0.28 28.25 | -0.24 -1.06 2.02 -0.03 -1.83
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
4 . Anciennet
| ANC1 - anc. 1 an ou moins
3.54
1.35 | -0.48 0.24 0.13 -0.55 0.14
| ANC2 - anc. de 1 4 ans
0.84
8.96 | -0.38 -0.42 -0.27 0.27 0.34
| ANC3 - anc. de 4 6 ans
1.23
5.78 | -0.08 0.03 -0.38 0.63 -0.01
| ANC4 - anc. de 6 12 ans
1.18
6.09 | 0.52 -0.04 -0.90 0.43 -0.87
| ANC5 - anc. plus
12 ans
1.55
4.38 | 0.98 -0.31 0.83 0.28 0.17
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
5 . Domiciliation du salaire
| Soui - domicile salaire
5.63
0.48 | 0.36 0.13 -0.05 0.20 0.05
| Snon - non dimicile salaire 2.71
2.08 | -0.75 -0.26 0.11 -0.42 -0.09
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
6 . Domiciliation de l'pargne
| EPA0 - pas d'pargne
6.62
0.26 | -0.24 0.16 0.23 0.16 -0.06
| EPA1 - moins de 10KF pargn 1.07
6.80 | 0.46 -0.47 -0.47 -0.19 0.50
| EPA2 - de 10 100KF pargn 0.64 12.00 | 1.74 -0.86 -1.59 -1.39 -0.25
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
7 . Profession
| CADR - cadre
1.37
5.08 | 0.87 -0.58 0.76 -0.42 -0.77
| EMPL - employ
4.22
0.97 | 0.03 0.05 -0.29 0.51 0.08
| AUTR - autre
2.74
2.04 | -0.48 0.22 0.06 -0.58 0.26
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
8 . Moyenne en cours
| ENC1 - moins de 2KF encours 1.75
3.78 | -0.68 -1.32 0.20 0.21 0.07
| ENC2 - de 2 5 KF encours 5.48
0.52 | -0.08 0.56 0.19 0.16 -0.03
| ENC3 - plus de 5 KF encours 1.10
6.55 | 1.46 -0.70 -1.28 -1.11 0.06
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
9 . Moyenne des mouvements
| MOU1 - moins 10 KF mouvt
2.74
2.04 | -0.76 0.15 0.09 -0.53 0.17
| MOU2 - de 10 30KF mouvt
1.26
5.59 | -0.35 0.27 -0.35 0.43 -0.77
| MOU3 - de 30 50KF mouvt
2.30
2.63 | 0.34 0.08 -0.07 0.60 0.60
| MOU4 - plus de 50KF mouvt
2.03
3.11 | 0.86 -0.46 0.18 -0.24 -0.43
+------------------------------------------+--------- CONTRIBUTION CUMULEE
| 10 . Cumul des dbits
| DEB1 - moins de 40 dbits
3.04
1.74 | 0.21 0.74 0.17 -0.27 -0.14
| DEB2 - de 40 100 dbits
2.87
1.91 | 0.09 0.22 -0.15 0.26 0.07
| DEB3 - plus de 100 dbits
2.42
2.44 | -0.37 -1.19 -0.04 0.04 0.10
+------------------------------------------+--------- CONTRIBUTION CUMULEE
| 11 . Autorisation de dcouvert
| Doui - dcouvert autoris
3.60
1.32 | -0.31 -0.46 -0.17 0.37 0.06
| Dnon - dcouvert interdit
4.74
0.76 | 0.23 0.35 0.13 -0.28 -0.05
+------------------------------------------+--------- CONTRIBUTION CUMULEE
| 12 . Interdiction de chquier
| Coui - chquier
autoris
7.39
0.13 | 0.13 0.07 0.02 -0.08 0.04
| Cnon - chquier
interdit
0.94
7.83 | -1.02 -0.53 -0.15 0.61 -0.33
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
=
3.3
8.0
0.9 12.8
3.1 22.1
|
|
|
|
=
3.0
2.6
0.0
0.1
5.7
1.3 7.6
0.2 1.7
0.1 0.5
1.9 8.2
3.6 17.9
| 3.3
| 0.5
| 0.0
| 1.3
| 5.9
= 10.9
1.2 0.4
0.9 0.4
0.0 1.2
0.0 6.7
0.9 7.5
3.0 16.3
|
|
=
0.5
1.1
1.6
2.9
6.0
8.8
0.1
0.2
0.3
| 1.5
| 0.9
| 7.6
= 10.0
1.0 2.5
1.4 1.7
2.8 11.5
5.2 15.6
|
|
|
=
2.7
0.1
0.7
3.5
4.1
0.0
2.5
6.6
5.5
2.5
0.1
8.1
0.3
0.5
0.1
2.5
3.5
0.1
1.1
0.1
0.5
1.8
|
|
|
=
0.5 9.8
0.1 0.8
1.3 20.2
1.9 30.8
0.6
0.4
0.0
1.1
|
|
=
1.3
1.0
2.3
4.5
3.4
7.8
0.8
0.6
1.4
|
|
=
0.5
3.9
4.4
0.2
1.5
1.7
0.0
0.1
0.2
53
2.3
7.8
1.4
6.5
|
|
=
0.5
3.9
4.4
0.2
1.5
1.7
0.0
0.1
0.2
0.3
2.7
3.0
0.2 +--------------------------+
|
0.1 | 0.13 0.04 0.00 0.05 0.01 |
1.0 | 0.13 0.04 0.00 0.05 0.01 |
1.1 +--------------------------+
54
6 Mtodos de clasificacin
La clasificacin en SPAD se realiza a partir de las coordenadas de los ejes factoriales. Se
suele utilizar el subconjunto de los primeros k ejes factoriales tales que proyecten en
conjunto un mnimo del 80% de la inercial original. Este procedimiento se realiza aplicando
sobre los datos dos algoritmos: algoritmo de clasificacin jerrquica, con el objetivo de
escoger en cuantos grupos deben clasificarse los individuos y el algoritmo de centros
mviles, con el objetivo de mejorar la clasificacin.
Ejemplo 8
Retomaremos la filire del ejemplo 7 para realizar una clasificacin de los clientes del banco
segn sean sus caractersticas.
De la ventana
RECIP/SEMIS.
Mthodes
Classification
arrastaremos
el
mtodo
55
Dejaremos el resto de parmetros con sus valores por defecto. Ejecutamos la filire i
obtenemos:
56
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
867
874
875
879
886
884
796
873
882
842
839
869
890
881
876
825
880
888
870
823
904
908
868
858
902
889
911
913
910
903
893
918
885
850
906
912
915
921
925
924
914
927
916
930
933
919
739
863
838
851
829
843
819
834
862
832
892
836
732
856
861
887
872
786
798
900
805
895
864
859
896
891
905
883
901
907
899
877
917
894
922
897
923
920
909
928
926
898
929
931
932
934
16
18
19
19
13
14
26
31
13
16
32
11
22
20
22
14
24
16
12
39
29
26
36
27
48
28
40
43
40
36
35
51
64
23
88
67
51
86
106
194
99
99
234
198
432
468
16.00
18.00
19.00
19.00
13.00
14.00
26.00
31.00
13.00
16.00
32.00
11.00
22.00
20.00
22.00
14.00
24.00
16.00
12.00
39.00
29.00
26.00
36.00
27.00
48.00
28.00
40.00
43.00
40.00
36.00
35.00
51.00
64.00
23.00
88.00
67.00
51.00
86.00
106.00
194.00
99.00
99.00
234.00
198.00
432.00
468.00
0.00467
0.00473
0.00477
0.00477
0.00483
0.00485
0.00498
0.00508
0.00514
0.00540
0.00587
0.00596
0.00606
0.00627
0.00651
0.00671
0.00693
0.00710
0.00768
0.00807
0.00841
0.00854
0.00860
0.00924
0.00944
0.00969
0.01108
0.01204
0.01259
0.01294
0.01422
0.01514
0.01516
0.01683
0.01932
0.02059
0.02408
0.03601
0.04002
0.04372
0.04393
0.05132
0.05836
0.07475
0.11267
0.13731
***
***
***
***
***
***
***
***
***
****
****
****
****
****
****
****
*****
*****
*****
*****
*****
*****
******
******
******
******
*******
********
********
********
*********
*********
*********
**********
************
************
***************
*********************
************************
**************************
**************************
******************************
***********************************
********************************************
******************************************************************
*********************************************************************************
57
8%
808
857
786
867
739
10%
732
796
819
866
804
874
11%
863
850
886
829
876
42%
861
805
869
11%
836
877
879
851
7%
842
832
882
3%
862
870
798
884
9%
843
825
818
800
880
50%
872
19%
885
858
859
883
868
864
14%
873
834
823
8%
839
875
838
10
58
Una vez hemos decidido que deseamos clasificar los clientes en tres grupos, arrastramos el
mtodo PARTI-DECLA.
Tambin indicaremos que deseamos que nos indique en que grupo se ha situado cada uno
de los individuos.
59
Dejaremos el resto de parmetros con sus valores por defecto. Ejecutamos la filire i
obtendremos, en el icono Listage:
DECOMPOSITION DE L'INERTIE
CALCULEE SUR 10 AXES.
+----------------+-----------------+-------------+-------------------+-----------------+
|
|
INERTIES
| EFFECTIFS |
POIDS
|
DISTANCES
|
| INERTIES
| AVANT
APRES | AVANT APRES |
AVANT
APRES | AVANT
APRES |
+----------------+-----------------+-------------+-------------------+-----------------+
|
|
|
|
|
|
| INTER-CLASSES | 0.2500
0.3012 |
|
|
|
|
|
|
|
|
|
| INTRA-CLASSE
|
|
|
|
|
|
|
|
|
|
|
| CLASSE 1 / 3 | 0.4575
0.3760 | 234
201 |
234.00
201.00 | 0.0945
0.1528 |
| CLASSE 2 / 3 | 0.5054
0.4429 | 198
203 |
198.00
203.00 | 0.1796
0.2278 |
| CLASSE 3 / 3 | 0.0605
0.1532 |
36
64 |
36.00
64.00 | 1.6477
1.0005 |
|
|
|
|
|
|
| TOTALE
| 1.2734
1.2734 |
|
|
|
+----------------+-----------------+-------------+-------------------+-----------------+
QUOTIENT (INERTIE INTER / INERTIE TOTALE) : AVANT ... 0.1963
APRES ... 0.2366
COORDONNEES ET VALEURS-TEST APRES CONSOLIDATION
COMPOSITION
CLASSE 1 /
0005 0011
0158 0170
0321 0327
0466 0472
0630 0636
0746 0752
0879 0899
1014 1033
1241 1247
1372 1379
1531 1537
DE: Coupure
3
0030 0036
0176 0182
0339 0345
0484 0490
0642 0648
0764 0770
0910 0916
1039 1045
1259 1271
1385 1391
1561 1568
'a' de l'arbre en
0042
0188
0351
0502
0654
0776
0923
1069
1277
1397
1575
0048
0200
0376
0520
0673
0782
0929
1076
1283
1403
1581
0060
0224
0388
0526
0679
0788
0935
1088
1289
1427
1617
3 classes
0066
0236
0394
0532
0685
0800
0947
1112
1308
1440
1623
0072
0249
0400
0568
0691
0813
0959
1130
1322
1446
1629
0084
0255
0412
0574
0697
0819
0965
1144
1328
1452
1655
0096
0261
0418
0580
0703
0825
0971
1198
1334
1458
1661
0102
0267
0424
0599
0710
0831
0977
1204
1340
1476
1667
0115
0279
0430
0605
0722
0843
0983
1223
1346
1488
1673
0128
0297
0448
0611
0728
0867
0990
1229
1353
1500
1679
0134
0309
0454
0623
0740
0873
1002
1235
1365
1512
1697
60
1703 1709
1850 1880
0794 0813
CLASSE 2 /
0018 0054
0562 0586
1063 1094
1494 1506
1733 1739
1922 0005
0109 0115
0200 0212
0315 0321
0406 0412
0514 0520
0630 0636
0746 0758
0867 0873
CLASSE 3 /
0024 0090
0363 0369
0849 0855
1314 1359
0532 0648
1715
0084
0855
3
0078
0617
1106
1518
1745
0011
0121
0218
0327
0418
0526
0642
0764
0879
3
0121
0406
0885
1415
0685
1721
0102
0899
1757
0230
0923
1763
0243
0929
1769
0249
1788
0424
1794
0496
1800
0544
1806
0556
1813
0599
1820
0703
1826
0740
1838
0782
0109
0666
1137
1525
1751
0018
0128
0224
0333
0430
0538
0654
0770
0885
0140
0758
1150
1543
1775
0024
0134
0236
0339
0436
0550
0660
0776
0891
0152
0806
1156
1549
1856
0030
0140
0255
0345
0442
0562
0666
0788
0905
0164
0861
1180
1555
1862
0036
0146
0261
0351
0448
0568
0673
0800
0910
0291
0891
1186
1593
1868
0042
0152
0267
0357
0454
0574
0679
0806
0916
0315
0905
1211
1599
1874
0048
0158
0273
0363
0460
0580
0691
0819
0382
0953
1217
1605
1886
0054
0164
0279
0369
0466
0586
0697
0825
0478
0996
1265
1611
1892
0060
0170
0285
0376
0472
0592
0710
0831
0538
1020
1295
1635
1898
0066
0176
0291
0382
0484
0605
0716
0837
0544
1027
1409
1649
1904
0078
0182
0297
0388
0490
0611
0722
0843
0550
1051
1421
1685
1910
0090
0188
0303
0394
0502
0617
0728
0849
0556
1057
1464
1691
1916
0096
0194
0309
0400
0507
0623
0734
0861
0146
0436
0941
1434
0752
0194
0442
1008
1470
0207
0460
1082
1482
0212
0496
1100
1587
0218
0507
1118
1643
0230
0514
1124
1727
0243
0592
1162
1782
0273
0660
1168
1832
0285
0716
1174
1844
0303
0734
1192
0072
0333
0794
1253
0207
0357
0837
1301
0478
DESCRIPTION DE PARTITION(S)
DESCRIPTION DE LA Coupure 'a' de l'arbre en 3 classes
CARACTERISATION DES CLASSES PAR LES MODALITES
CARACTERISATION PAR LES MODALITES DES CLASSES OU MODALITES
DE Coupure 'a' de l'arbre en 3 classes
CLASSE 1 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------42.95 CLASSE 1 / 3
aa1a
201
12.70 0.000
70.89
83.58 50.64 bon client
Type de client
BON
237
10.18 0.000
59.09
90.55 65.81 de 2 5 KF encours Moyenne en cours
ENC2
308
10.05 0.000
58.23
91.54 67.52 domicile salaire
Domiciliation du salaire
Soui
316
5.80 0.000
71.26
30.85 18.59 anc. plus
12 ans
Anciennet
ANC5
87
5.62 0.000
49.46
91.04 79.06 pas d'pargne
Domiciliation de l'pargne
EPA0
370
5.45 0.000
63.57
40.80 27.56 de 30 50KF mouvt
Moyenne des mouvements
MOU3
129
4.76 0.000
46.75
96.52 88.68 chquier
autoris Interdiction de chquier
Coui
415
4.27 0.000
56.14
47.76 36.54 moins de 40 dbits Cumul des dbits
DEB1
171
4.23 0.000
53.39
58.71 47.22 mari
Situation familiale
MARI
221
3.88 0.000
51.90
61.19 50.64 employ
Profession
EMPL
237
3.78 0.000
59.26
31.84 23.08 plus de
50 ans
Age du client
AGE4
108
2.44 0.007
57.58
18.91 14.10 anc. de 6 12 ans Anciennet
ANC4
66
-2.44 0.007
35.29
29.85 36.32 clibataire
Situation familiale
CELB
170
-3.99 0.000
23.86
10.45 18.80 moins de
23 ans
Age du client
AGE1
88
-4.76 0.000
13.21
3.48 11.32 chquier
interdit Interdiction de chquier
Cnon
53
-4.97 0.000
26.62
20.40 32.91 autre
Profession
AUTR
154
-5.37 0.000
19.39
9.45 20.94 moins de 2KF encours Moyenne en cours
ENC1
98
-5.68 0.000
0.00
0.00
6.84 de 10 100KF pargn Domiciliation de l'pargne
EPA2
32
-6.50 0.000
25.63
25.37 42.52 anc. 1 an ou moins Anciennet
ANC1
199
-7.22 0.000
17.65
11.94 29.06 plus de 100 dbits Cumul des dbits
DEB3
136
-7.72 0.000
18.18
13.93 32.91 moins 10 KF mouvt
Moyenne des mouvements
MOU1
154
-8.40 0.000
0.00
0.00 13.25 plus de 5 KF encours Moyenne en cours
ENC3
62
-10.05 0.000
11.18
8.46 32.48 non dimicile salaire Domiciliation du salaire
Snon
152
-12.70 0.000
14.29
16.42 49.36 mauvais
client
Type de client
MAUV
231
---------------------------------------------------------------------------------------------------------------------------------CLASSE 2 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------43.38 CLASSE 2 / 3
aa2a
203
16.92 0.000
80.52
91.63 49.36 mauvais
client
Type de client
MAUV
231
11.72 0.000
81.58
61.08 32.48 non dimicile salaire Domiciliation du salaire
Snon
152
10.63 0.000
77.92
59.11 32.91 moins 10 KF mouvt
Moyenne des mouvements
MOU1
154
8.80 0.000
66.83
65.52 42.52 anc. 1 an ou moins Anciennet
ANC1
199
7.88 0.000
78.57
37.93 20.94 moins de 2KF encours Moyenne en cours
ENC1
98
6.80 0.000
86.79
22.66 11.32 chquier
interdit Interdiction de chquier
Cnon
53
6.71 0.000
65.58
49.75 32.91 autre
Profession
AUTR
154
6.48 0.000
66.91
44.83 29.06 plus de 100 dbits Cumul des dbits
DEB3
136
6.22 0.000
50.54
92.12 79.06 pas d'pargne
Domiciliation de l'pargne
EPA0
370
5.09 0.000
68.18
29.56 18.80 moins de
23 ans
Age du client
AGE1
88
3.83 0.000
55.29
46.31 36.32 clibataire
Situation familiale
CELB
170
3.18 0.001
51.98
51.72 43.16 dcouvert autoris Autorisation de dcouvert
Doui
202
2.34 0.010
75.00
5.91
3.42 veuf
Situation familiale
VEUF
16
-2.43 0.008
35.40
28.08 34.40 de 40 100 dbits Cumul des dbits
DEB2
161
-2.49 0.006
27.59
7.88 12.39 moins de 10KF pargn Domiciliation de l'pargne
EPA1
58
-3.18 0.001
36.84
48.28 56.84 dcouvert interdit Autorisation de dcouvert
Dnon
266
-3.42 0.000
35.44
41.38 50.64 employ
Profession
EMPL
237
-3.64 0.000
32.16
27.09 36.54 moins de 40 dbits Cumul des dbits
DEB1
171
-3.84 0.000
23.38
8.87 16.45 cadre
Profession
CADR
77
-4.37 0.000
25.00
13.30 23.08 plus de
50 ans
Age du client
AGE4
108
-4.80 0.000
16.67
5.42 14.10 anc. de 6 12 ans Anciennet
ANC4
66
-5.14 0.000
30.77
33.50 47.22 mari
Situation familiale
MARI
221
-5.72 0.000
0.00
0.00
6.84 de 10 100KF pargn Domiciliation de l'pargne
EPA2
32
-5.88 0.000
21.71
13.79 27.56 de 30 50KF mouvt
Moyenne des mouvements
MOU3
129
-6.05 0.000
19.30
10.84 24.36 plus de 50KF mouvt
Moyenne des mouvements
MOU4
114
-6.80 0.000
37.83
77.34 88.68 chquier
autoris Interdiction de chquier
Coui
415
-7.84 0.000
8.05
3.45 18.59 anc. plus
12 ans
Anciennet
ANC5
87
-7.96 0.000
1.61
0.49 13.25 plus de 5 KF encours Moyenne en cours
ENC3
62
-11.71 0.000
25.00
38.92 67.52 domicile salaire
Domiciliation du salaire
Soui
316
-16.92 0.000
7.17
8.37 50.64 bon client
Type de client
BON
237
---------------------------------------------------------------------------------------------------------------------------------CLASSE 3 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------13.68 CLASSE 3 / 3
aa3a
64
17.84 0.000
98.39
95.31 13.25 plus de 5 KF encours Moyenne en cours
ENC3
62
11.72 0.000 100.00
50.00
6.84 de 10 100KF pargn Domiciliation de l'pargne
EPA2
32
5.58 0.000
41.38
37.50 12.39 moins de 10KF pargn Domiciliation de l'pargne
EPA1
58
5.54 0.000
30.70
54.69 24.36 plus de 50KF mouvt
Moyenne des mouvements
MOU4
114
5.30 0.000
21.94
81.25 50.64 bon client
Type de client
BON
237
3.69 0.000
28.57
34.38 16.45 cadre
Profession
CADR
77
3.50 0.000
15.42 100.00 88.68 chquier
autoris Interdiction de chquier
Coui
415
2.78 0.003
16.77
82.81 67.52 domicile salaire
Domiciliation du salaire
Soui
316
61
2.72 0.003
25.76
26.56 14.10 anc. de 6 12 ans Anciennet
ANC4
66
-2.53 0.006
7.79
18.75 32.91 autre
Profession
AUTR
154
-2.78 0.003
7.24
17.19 32.48 non dimicile salaire Domiciliation du salaire
Snon
152
-3.27 0.001
7.54
23.44 42.52 anc. 1 an ou moins Anciennet
ANC1
199
-3.50 0.000
0.00
0.00 11.32 chquier
interdit Interdiction de chquier
Cnon
53
-4.13 0.000
2.04
3.13 20.94 moins de 2KF encours Moyenne en cours
ENC1
98
-4.53 0.000
3.90
9.38 32.91 moins 10 KF mouvt
Moyenne des mouvements
MOU1
154
-5.30 0.000
5.19
18.75 49.36 mauvais
client
Type de client
MAUV
231
-11.85 0.000
0.32
1.56 65.81 de 2 5 KF encours Moyenne en cours
ENC2
308
-15.44 0.000
0.00
0.00 79.06 pas d'pargne
Domiciliation de l'pargne
EPA0
370
----------------------------------------------------------------------------------------------------------------------------------
62
7 Casos propuestos
7.1 Estudio de la relacin calidad-precio para 35 marcas de
whisky (ACP)
Objetivo:
Analizar la relacin calidad-precio para marcas de whisky.
Datos:
Precio Proporcin de malta Categora Vejez Apreciacin
10,67
9,15
9,91
11,28
10,67
11,13
10,67
8,39
11,74
14,18
12,50
11,13
9,45
13,26
11,89
11,13
13,26
12,20
12,96
13,26
12,20
12,65
13,72
16,77
13,26
17,23
14,64
12,50
19,36
24,39
13,72
13,11
15,25
15,25
14,48
20
20
20
25
25
30
30
30
30
30
30
33
33
33
35
40
40
40
40
40
40
40
40
40
40
45
45
45
100
100
100
100
100
100
100
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
5,0
5,0
7,5
12,0
12,0
5,0
8,0
5,0
5,5
12,0
12,0
6,5
8,0
12,0
10,0
10,5
8,5
8,5
9,5
8,5
9,5
9,5
12,5
12,0
5,5
12,0
12,0
12,0
8,5
12,0
12,0
12,0
10,0
11,0
12,0
3
2
2
2
3
0
0
2
0
0
2
1
3
3
2
4
2
2
2
4
2
1
2
3
2
4
3
3
4
3
4
2
3
3
0
63
64
Estrategia A: Los EEUU deberan provocar la derrota del poder Norte Vietnamita con
bombardeos intensivos de sus industrias, puertos y aeropuertos y con una invasin
terrestre.
Estrategia B. Los EEUU deberan proseguir con su poltica actual en Vietnam.
Estrategia C. Los EEUU deberan reducir sus actividades militares, para el bombardeo
del Vietnam del Norte e intensificar sus esfuerzos para la abertura de negociaciones.
Estrategia D. Los EEUU deberan retirar inmediatamente sus fuerzas militares del
Vietnam.
El sondeo se repiti durantes cinco aos consecutivos, con un total de 3.147 estudiantes.
Datos:
Sexo
Estrategia Ao 1 Ao 2 Ao 3 Ao 4 Ao 5 Total
Hombre
A
B
C
D
175
116
131
17
160
126
135
21
132
120
154
29
145
95
185
44
118
176
345
141
730
633
950
252
Mujer
A
B
C
D
13
19
40
5
5
9
33
3
22
29
110
6
12
21
58
10
19
27
128
13
71
105
369
37
65
1
3
2
1
3
1
1
2
3
2
3
3
3
1
3
3
2
3
3
1
2
3
3
3
3
1
3
1
2
2
1
3
1
1
1
2
2
2
3
2
1
2
2
2
2
3
1
2
2
2
2
3
1
3
1
3
2
1
1
2
1
1
3
2
3
3
3
2
3
2
2
3
1
1
2
2
3
3
1
1
1
1
2
2
2
3
3
1
2
2
2
3
1
1
2
1
1
2
3
1
1
3
2
3
2
2
2
2
1
2
2
2
1
2
2
2
2
2
1
1
1
2
1
1
2
2
1
2
2
1
1
1
1
2
1
2
2
2
1
2
1
1
2
1
1
2
2
2
2
1
2
1
2
2
1
1
1
1
1
2
1
1
2
3
1
1
3
1
1
1
1
1
3
3
2
1
2
2
2
3
3
1
2
2
2
2
3
1
3
66
Valor 1
Valor 2
Valor 3
Tamao
Peso
Velocidad
Inteligencia
Afeccin
Agresividad
Funcin
pequeo
pequeo
leve
leve
leve
leve
compaa
mediano
mediano
mediano
mediano
grande
Grande
caza
grande
grande
grande
grande
utilidad
67
8 Bibliografa
Aluja T, Morineau A. (1999) Aprender de los datos: el anlisis de componentes principales. Una
aproximacin desde el Data Mining. Ediciones Universitarias de Barcelona. Barcelona.
Bcue M., Lebart L., Salem A. (2002) Anlisis estadstico de datos textuales. Editorial Milenio.
Lleida.
Bnzecri J. P. (1973) LAnalyse de dones. Tomo 1: La taxinomie. Tomo 2: LAnalyse de
Correspondances (2 edicin 1976). Dunod. Pars.
Cuadras C.M. (1991) Mtodos de anlisis multivariante. 2 edicin. Promociones y
Publicaciones Universitarias. Barcelona.
Crivisqui E., Fine J. (1994) Introduccin al anlisis de los datos multidimensionales. PRESTA -94.
Escofier B., Pags J. (1990) Anlisis factoriales Simples y Mltiples. Servicio Editorial
Universidad del Pas Basco. Bilbao.
Lebart L., Morineau A., Piron M. (1984) Multivariate Descriptive Statistical Analysis. John
Wiley. Nueva York.
Morineau A. (1984) Note sur la caractrisation statistique dune classe et les valeurs-test. Technique
du CESIA, 2, pgs. 20-27. Pars.
68