Está en la página 1de 68

rsal

Servei dEstadstica
Universitat Autnoma de Barcelona
Edificio D (Servei dInformtica)
08193 Bellaterra (Barcelona)
Tel. +34 93 581 13 47
Fax +34 93 581 20 94
s.estadistica@uab.es
www.uab.es/s-estadistica/

Manual de introduccin a los


mtodos factoriales y
clasificacin con SPAD
Mnica Bcue Bertaut
Profesora titular
Departamento Estadstica e Investigacin Operativa
Universidad Politcnica de Catalunya

Joan Valls i Marsal

Asesor estadstico
Servei dEstadstica UAB

La vida es el arte de obtener conclusiones a partir de evidencias insuficientes


(S. Butler)

ndice
1 Prlogo................................................................................................ 3

2 Manejo de bases de datos con SPAD ................................................. 4


2.1 El archivo BASE de SPAD ..................................................................................... 4
2.2 Creacin de un archivo BASE................................................................................. 9
2.3 Importacin de archivos de texto........................................................................... 11
2.4 Importacin de archivos de SAS ........................................................................... 13
2.5 Exportacin de ficheros BASE.............................................................................. 14

3 Construccin de anlisis estadsticos con SPAD: la filire ....... 15


3.1 Creacin de una filire........................................................................................... 15
3.2 Abrir una filire existente............................................................................... 23
3.3 Construcciones complejas de filires .................................................................... 23
3.4 Los mtodos........................................................................................................... 24

4 Caracterizacin de variables............................................................. 27
4.1 Caracterizacin de una variable cualitativa ........................................................... 27
4.2 Caracterizacin de una variable continua.............................................................. 32

5 Anlisis factoriales simples............................................................... 36


5.1 Anlisis de componentes principales..................................................................... 36
5.2 Anlisis de correspondencias simples ................................................................... 46
5.3 Anlisis de correspondencias mltiples................................................................. 50

6 Mtodos de clasificacin .................................................................. 55

7 Casos propuestos.............................................................................. 63
7.1 Estudio de la relacin calidad-precio para 35 marcas de whisky (ACP)............... 63
7.2 Opinin de los estudiantes estadounidenses sobre la guerra del Vietnam (ACS) . 65
7.3 Anlisis cualitativo de razas de perros (ACM)...................................................... 66

8 Bibliografa ....................................................................................... 68

Anlisis factoriales con SPAD

1 Prlogo
Desde hace una treintena de aos, los mtodos de anlisis multivariante de datos han
probado su eficacia en el estudio de grandes masas de informacin compleja. Se trata de
mtodos llamados multidimensionales, por oposicin a los mtodos de estadstica
descriptiva que tratan nicamente una o dos variables.
Actualmente, los mtodos factoriales se enmarcan en las tcnicas de Data Mining (o minera
de datos). stos permiten confrontar numerosas informaciones, lo cul es ms rico que
anlisis separados. Las representaciones simplificadas de grandes tablas de datos se han
manifestado como un instrumento de sntesis notable, debido a su capacidad para reducir la
dimensionalidad. Permiten extraer las tendencias ms destacadas, jerarquizarlas y eliminar
los efectos marginales o puntuales que perturban la percepcin global de los hechos
recogidos en los datos. El desarrollo de algoritmos de clasificacin resulta ser en muchas
ocasiones un complemento ideal a los mtodos factoriales y permiten describir tipologas
de individuos segn las variables en estudio.
Estos mtodos nacidos en la universidad se han aplicado a todo tipo de dominios
cientficos como la ecologa, la lingstica, la psicometra, el anlisis de mercados, la
arqueologa, ... Tambin han experimentado un gran xito en ramas de la banca y seguros
donde deben analizarse grandes ficheros de datos.
SPAD (Systme Portable pour lAnalyse de Donnes), permite implementar una estrategia de
anlisis adecuada al tratamiento exploratorio multivariante de grandes tablas de datos. Su
concepcin es original y adaptada para un proceso natural de aprendizaje a partir de los
datos (data learning).
Este sencillo manual pretende ser una herramienta para aquellas personas con
conocimientos de estadstica multivariante que quieran iniciarse al tratamiento de los datos
con SPAD. El manual est divido en diversos apartados. En los primeros, se centra el
inters en el manejo de bases de datos, para pasar luego a la prctica de los anlisis
factoriales y la obtencin de grficos. Es por tanto aconsejable realizar una lectura lineal. Se
ha utilizado la versin 4.5 de SPAD.

Anlisis factoriales con SPAD

2 Manejo de bases de datos con SPAD


SPAD posee diferentes herramientas para el manejo de datos. En general, trabaja con un
tipo de ficheros de formato definido, para los que se dispone de un editor. Igualmente
ofrece opciones para importar / exportar bases con otros formatos: ficheros de textos,
ficheros de tablas de SAS, ficheros SPSS y OBDC. Todas estas herramientas se encuentran
en las opciones del men Base de la ventana principal de SPAD.

2.1 El archivo BASE de SPAD


El archivo BASE, con extensin .sba, es el archivo predefinido de trabajo de SPAD donde
se almacenan los datos y los meta datos. SPAD incorpora un editor de este tipo de
ficheros, llamado EDIBASE. Todos los anlisis de datos requerirn un fichero BASE.
SPAD ofrece la posibilidad de abrir / crear / modificar este tipo de archivos.
Ejemplo 1. SPAD dispone de un conjunto de archivos BASE que se instalan en el fichero
por defecto ...\Archivos de programa\Cisia\Spad\Bases. Para abrirlos, debemos
seleccionar el comando Editer Base del men Base.
Anlisis factoriales con SPAD

Podemos seleccionar
Enquete.sba.

el

Anlisis factoriales con SPAD

archivo

BASE

deseado.

Seleccionaremos

el

archivo

Esta opcin nos abre una nueva ventana (EDIBASE), con la que podemos editar el
archivo.

Esta ventana se organiza en cuatro subventanas, accesibles por men va Fentre o bien
con los iconos de la barra de herramientas:

Ventana Entte (
). Datos generales sobre la base de datos. Nombre, nmero de
individuos y variables, ...
Ventana Variables (
). Etiquetas y tipo de las variables de la base.
Ventana Modalits(
). Etiquetas de las modalidades de las variables de tipo
nominal.
Ventana Valeurs (
). Valores de las variables para cada uno de los individuos.
La ventana que aparece por defecto es la ventana Valeurs, en forma de matriz, y se
puede editar directamente. Destacamos que las dos primeras columnas corresponden a los
identificadores de individuos y a sus etiquetas (Libelles). Las opciones del men
Edition permiten aadir / suprimir individuos, entre otras. Los valores faltantes
(missings) se indican con una ausencia de valor.

Anlisis factoriales con SPAD

La ventana Variables contiene cinco columnas:

Ident. Se registra el identificador corto, limitado a cuatro caracteres.


Libel. Contiene la etiqueta de la variable.
Type. Tipo de la variable. C si se trata de variables numricas continuas, N si se trata
de variables numricas nominales o cualitativas y T si se trata de variable textuales
(provenientes, por ejemplo, de respuestas abiertas).
Min, Max. Indica el rango de variacin de las variables. En el caso de variables
nominales, SPAD impone la restriccin que las categoras tomen los valores 1, 2, ..., N
para variables con N categoras. En el caso de variables textuales, presenta unos valores
nulos.

Si seleccionamos la variable Statut matrimonial y cliqueamos sobre el icono


Modalits aparecer la pantalla con las etiquetas para cada categora de la variables.
Esta ventana es tambin editable y se nos presentan dos columnas correspondientes a las
etiquetas cortas (4 letras) y largas. El hecho de disponer de dos tamaos de etiquetas es til
para un uso posterior en la parte grfica del programa.

Anlisis factoriales con SPAD

En el comando Enregistrer sous del men Fichier podemos guardar el fichero


con otro nombre y tambin exportarlo a formato SPSS.

Anlisis factoriales con SPAD

2.2 Creacin de un archivo BASE


Para crear un nuevo archivo BASE debemos seleccionar la opcin Nouvelle Base del
men Base. Esta accin nos abrir una nueva base vaca.

Ejemplo 2. Crearemos una base con 10 individuos con los datos siguientes:
Id
1
2
3
4
5
6
7
8

Etiqueta
Juan
Silvia
Jos
Pedro
Ana
David
Cristina
Marta

Sexo
Hombre
Mujer
Hombre
Hombre
Mujer
Hombre
Mujer
Mujer

Salario anual
18.000
15.000
25.000
17.000
19.000
30.000
22.000
10.000

9
10

Vanesa
Carlos

Mujer
Hombre

13.000
21.000

Qu es lo que ms le gust del viaje?


La gente, el ambiente de la ciudad
La cocina tradicional
La cultura, el ambiente cultural
Las noches y el ocio.
Las comodidades del transporte pblico.
La gente. Son muy agradables.
Cultura, comida, museos,...
Disfrutar de la ciudad, con todos sus
equipamientos culturales y tursticos
Ir al teatro.
El buen ambiente.

Primeramente debemos definir las variables y su tipo. Por defecto ya viene definido un
identificador de individuo y su etiqueta. Debemos por tanto aadir tres nuevas variables:
una nominal (N), otra continua (C) y otra textual (T). Debemos tambin definir su rango y
las etiquetas de las modalidades de la variable nominal.

Anlisis factoriales con SPAD

Para introducir los valores, debemos cliquear sobre el icono Valeurs. Observaremos que
la matriz de valores est vaca. Debemos ejecutar la opcin Ajuter N fois del men
Edition, y indicar que queremos aadir 10 individuos.

Ya podemos introducir los datos. El editor de bases de SPAD permite realizar las
operaciones Copiar / Cortar / Pegar usuales en Windows. As pues, puede interaccionar
con otras aplicaciones que contengan datos, como WORD, EXCEL, SPSS,...

Una vez los hayamos introducido debemos guardar la base, utilizando la opcin
Enregistrer del men Fichier y debemos indicarle el nombre y el directorio donde
se guardar el fichero de datos. Supongamos que guardamos el fichero con el nombre
Prueba.sba.

Anlisis factoriales con SPAD

10

2.3 Importacin de archivos de texto


Para importar archivos ASCII que contengan datos a SPAD debemos seleccionar la opcin
Importation fichier Ascii dentro de Importer del men Base.

Supongamos que disponemos de un archivo ASCII (.txt o .dat) que contiene los datos del
ejemplo 2, donde los valores de las variables estn separados por un espacio tabulador. Le
indicaremos a SPAD dnde se encuentra este archivo. Si tuvisemos nuestros datos en un
archivo EXCEL, bastara con guardarlo en formato texto para poder luego realizar la
importacin desde SPAD. Aconsejamos que siempre se trabaje con archivos de texto
separados por tabuladores.

Anlisis factoriales con SPAD

11

A continuacin, se nos presenta una pantalla donde debemos indicar de qu tipo es el


archivo de texto. En nuestro caso, debemos indicarle que es de formato delimitado,
separado por tabuladores. En el caso que se encontrasen las etiquetas de las variables en la
primera lnea, deberamos indicarlo. En nuestro fichero no es necesario. Si el fichero de
texto fuera de formato fijo deberamos indicarle entre qu columnas se encuentran las
variables. Existen otras opciones y detalles, como por ejemplo que un individuo pueda
representar ms de una lnea. Para importar el archivo prueba.txt debemos
parametrizar la pantalla como se muestra a continuacin.

Cliqueamos sobre el botn Suivant y nos aparece una nueva ventana donde debemos
indicar de qu tipo son las variables
Anlisis factoriales con SPAD

12

Para crear el archivo SPAD debemos cliquear sobre el botn Executer y indicar el
nombre del nuevo archivo. Slo nos quedar comprobar que la importacin se ha realizado
correctamente, abriendo el nuevo archivo con EDIBASE, y indicar las etiquetas de las
modalidades de la variable nominal sexo.

2.4 Importacin de archivos de SAS


SPAD tiene una utilidad que permite importar datos procedentes de una tabla predefinida
en formato de SAS, con extensin .xpt.
El procedimiento es similar a de la importacin a partir de un archivo ASCII. Debemos
elegir la opcin Importation SAS de Importer en el men Base.

Se abrir una pantalla donde tendremos que especificar el tipo de cada una de las variables.
Anlisis factoriales con SPAD

13

2.5 Exportacin de ficheros BASE


SAS permite exportar ficheros BASE (.sba) a diferentes formatos de archivo:

Formato SPSS. Debemos editar el archivo BASE y, mediante la opcin


Enregistrer sous, sealar que deseamos guardar el fichero en formato SPSS (.sav).
Formato SAS. Debemos escoger la opcin Exportation SAS de Exporter en
el men Base e indicar a SPAD qu archivo se desea exportar a formato tabla de SAS
(.xpt).
Formato texto. Debemos escoger la opcin Exportation texte de Exporter
en el men Base.

Anlisis factoriales con SPAD

14

3 Construccin de anlisis estadsticos con SPAD: la


filire
La filire es el objeto bsico para realizar anlisis con SPAD. En ella, se indican el
archivo BASE que se utiliza y se parametrizan los anlisis. Toda la informacin y resultados
se puede guardar en una filire, mediante un archivo con extensin .fil.
En una filire se definen en un primer momento, de forma encadenada y secuencial,
los anlisis que se realizarn sobre los datos y en un segundo momento se ejecuta la
filire, produciendo los resultados. Tanto las parametrizaciones como los resultados se
presentan como iconos.

3.1 Creacin de una filire


Para crear una nueva filire debemos ejecutar la opcin Nouvelle filire del
men Filire.

Por defecto, al abrir SPAD ya nos aparecer una filire vaca, con el siguiente aspecto:

El primer paso que se debe realizar es indicar con qu archivo BASE se desea trabajar. Para
ello se puede ejecutar la opcin Slectionner Base del men Filire o bien

Anlisis factoriales con SPAD

15

hacer un doble clic sobre el icono BASE. Nos aparecer una nueva pantalla donde
debemos indicar el directorio del archivo de datos.

Ejemplo 3. Retomemos los datos del archivo Enquete.sba. Abriremos una nueva
filire y seleccionaremos este archivo. La filire debera tener el siguiente aspecto:

Una vez tenemos la filire referida a un archivo de datos, ya podemos empezar a


encadenar anlisis, mediante los mtodos (mthodes). Todos los mtodos disponibles los
encontramos en la ventana Mthodes, agrupados segn su tipo.

Anlisis factoriales con SPAD

16

Destacaremos los siguientes grupos de mtodos:

Description statistique. Realizan anlisis estadsticos descriptivos.


Analyses factorielles. Mtodos para realizar anlisis factoriales: anlisis de
componentes principales, correspondencias simples y mltiples, ...
Classification. Mtodos para ejecutar algoritmos de clasificacin.
Para introducir un nuevo mtodo a la filire basta con seleccionar la opcin Insrer
Mthode del men Mthode o bien cliquear con el botn de la derecha en el icono
BASE, y seleccionar la misma opcin en el submen que aparece.

Esta accin nos insertar un nuevo icono vaco, donde deberemos indicar el mtodo que
deseemos ejecutar.

Para indicar el mtodo debemos arrastrar el icono desde la ventana Mthodes.


Supongamos que queremos realizar histogramas y diagramas de barras de las variables de la
base. El mtodo adecuado es Stats. Procedemos arrastrar el icono hasta el icono vaco.

Anlisis factoriales con SPAD

17

Esta accin definir un mtodo dentro de la filire con este aspecto:

Para parametrizar el mtodo basta con realizar un doble clic sobre el icono Stats. Se nos
abrir una ventana de parametrizacin donde debemos indicarle las variables continuas y
categricas que queremos analizar.
En la subventana Tris--plat (diagramas de barras), indicaremos que conjunto de variables
categricas queremos realizar el diagrama. Podemos seleccionar las variables una por una o
bien todas a la vez. Supongamos que elegimos las tres variables tal como sigue:

Anlisis factoriales con SPAD

18

Realizamos lo mismo con las variables continuas, en la subventana HistogrammesDicrtisation.

Anlisis factoriales con SPAD

19

Opcionalmente SPAD permite discretizar las variables continuas. Para ello deberamos
cambiar la opcin Pour histogrammes por la opcin Pour discretisation
en Slection des variables.
En las otras subventanas podramos definir con que subgrupo de individuos desearamos
realizara los anlisis (Individus), establecer una variable de ponderacin
(Pondration), o segmentar el archivo de datos segn variables categricas (Tris
dits par modalits). En nuestro ejemplo, los parmetros por defecto sern
suficientes. Por tanto, cliqueraremos sobre el botn OK. De esta forma, la filire ya estar
parametrizada y, por tanto, lista para ejecutar.

Anlisis factoriales con SPAD

20

Antes de ejecutar la filire debemos guardarla sobre un archivo .fil. Para ello,
debemos seleccionar la opcin Sauvegarder Filire del men Filire.
Opcionalmente, podemos dar a la filire una etiqueta larga.

Una vez guardada, ya podemos ejecutar la filire, seleccionando la opcin Excuter


filire del men Filire.

Anlisis factoriales con SPAD

21

Despus de la ejecucin nos aparecern los iconos de resultados, a la derecha de los


mtodos. Nuestra filire tendr el aspecto siguiente:

Podemos realizar un doble click sobre cada uno de los iconos. Los smbolos de los iconos
nos indicarn el tipo de los resultados:

Icono Listage. Proporciona los resultados estadsticos en forma de listado,


en formato texto, mediante un navegador de resultados.

Icono Graphiques. Nos proporciona una interficie interactiva para la


edicin de grficos. Permite realizar una gama amplia de grficos: dispersin, diagramas
de barras, boxplots, realizar rotaciones, inserir una lnea de regresin, ...

Icono Excel. Crea una hoja de EXCEL con los datos del anlisis. Resulta muy
til en muchas ocasiones, por ejemplo, cuando deseamos hacer grficos en formato
EXCEL.

Anlisis factoriales con SPAD

22

3.2 Abrir una filire existente


Para abrir una filire existente basta con ejecutar la opcin Ouvrir filire del
men Filire e indicar dnde se encuentra el archivo .fil.

Tanto los iconos de resultado como las parametrizaciones de los mtodos no se pierden y
son de immediato editables. Cabe destacar que SPAD utiliza muchos ficheros intermedios,
muchos de los cules van ligados a la filire. Es recomendable crear un directorio propio
para cada anlisis o bien para cada archivo BASE. No es recomendable copiar la filire a
otro directorio, pues dara problemas en la localizacin de ficheros.

3.3 Construcciones complejas de filires


En el apartado 3.1 hemos creado una filire sencilla, con un nico mtodo. En la prctica,
las filires son mucho ms complejas, pudindose encadenar un nmero ilimitado de
mtodos.
Cabe destacar que el modo de encadenar los anlisis no es indiferente. Hay anlisis que se
alimentan de anlisis anteriores. Esto provoca que ciertos encadenamientos sean imposibles
de ejecutar. El caso de los anlisis factoriales es un ejemplo. Primero debe realizarse el
anlisis factorial para luego aplicar la clasificacin sobre los ejes factoriales creados.
Un mismo mtodo puede ser encadenado tantas veces consecutivas como se desee. En el
caso de disponer de bases de datos complejos, es aconsejable realizar diversas filires,
separando los anlisis.
SPAD dispone de una opcin para crear filires predefinidas, es decir, encaradas a
realizar un anlisis clsico. Para crear una nueva filire predefinida debe ejecutarse la
opcin Filire prdfinie del men Filire.

Anlisis factoriales con SPAD

23

Nos aparecer una pantalla donde debemos seleccionar el anlisis deseado.

Si escogemos la filire seleccionada en la figura anterior realizaramos un anlisis


idntico al del ejemplo 3.
Observamos que hay muchas opciones para escoger la filire predefinida. Ms
adelante entraremos en detalle.

3.4 Los mtodos


Como hemos visto, para definir un anlisis necesitamos encadenar un conjunto de mtodos
dentro de una filire. SPAD tiene definidos muchos mtodos agrupados segn el tipo
de anlisis de realizan, constituyendo mdulos. Destacamos los mtodos siguientes:

Mdulo estadstica descriptiva


STATS. Tablas de frecuencias y grficos descriptivos (histogramas, diagramas de
barra, diagramas de dispersin, boxplots, ...)
DEMOD. Caracterizacin de una variable cualitativa. Realiza comparaciones
mltiples entre medias y proporciones con el resto de variables para observar las
relaciones ms evidentes.
DESCO. Caracterizacin de una variable continua. Realiza comparaciones
mltiples entre proporciones y calcula correlaciones para observar las relaciones ms
evidentes.

Anlisis factoriales con SPAD

24

TABLE. Construccin de tablas cruzadas con los estadsticos usuales, recuentos,


medias, desviaciones, ...
BIVAR. Analiza pares de variables continuas, su correlacin y las posibles
relaciones del espacio bidimensional creado con el resto de variables.
MSMOD. Caracterizacin de una variable nominal siguiendo un criterio de
recubrimiento.
XLSTAT. Creacin de un archivo en formato EXCEL que contiene los datos de
la base SPAD y carga del paquete de macros estadsticas XLSTAT, que realiza diversos
anlisis estadsticos, siempre con macros.

Mdulo de anlisis factoriales


COPRI. Anlisis de componentes principales.
CORBI. Anlisis de correspondencias simples (o binarias).
CORMU. Anlisis de correspondencias mltiples.
COREM. Anlisis de correspondencias mltiples con la opcin de escoger las
modalidades activas en el anlisis.
CORCO. Analiza de correspondencias mltiples condicionales.
TABLE+COPRI. Anlisis de componentes principales partiendo de una tabla
resumida, por ejemplo, de una tabla de medias.
TABLE+CORBI. Anlisis de correspondencias mltiples partiendo de una tabla
de contingencia resumida.
DEFAC. Descripcin de los ejes factoriales.
TYTRA1. Anlisis de correspondencias mltiples con una variable tiempo.

Mdulo de mtodos de clasificacin

RECIP-SEMIS. Particin de los individuos en clases. rbol de agregacin.


PARTI-DECLA. Particin de los individuos en clases. Algoritmo de k-medias.
CLASS-MINER. Caracterizacin de las clases de individuos.
MSCLA. Caracterizacin de las clases de individuos

Anlisis factoriales con SPAD

25

TYTRA2. Particin de los individuos (partiendo de TYTRA1).

Mdulo de anlisis estadstico de datos textuales

MOTS. Creacin del glosario de palabras.


SEGME. Creacin del glosario de segmentos repetidos.
VOSPEC. Formas lxicas caractersticas segn grupos de individuos.
TALEX. Creacin de tablas de contingencia lxicas.
lxica.

CORBIT. Anlisis de correspondencias simples en un tabla de contingencia

TEXNU. Creacin de un archivo BASE conteniendo las palabras y la frecuencia


para cada uno de los individuos.
CORDA. Concordancias de formas lxicas.

Mdulo de exportacin de datos


ESCAL. Creacin de un archivo BASE conteniendo ejes factoriales y/o
particiones de individuos.
EXDON. Creacin de un fichero de texto conteniendo los datos originales.
EXGUS. Creacin de un fichero de texto conteniendo las coordenadas
factoriales.

Otros mdulos
Segmentacin. Mtodos para ajustar rboles de regresin y clasificacin.
Decisin Modelos. Mtodos para ajustar modelos de regresin lineales, loglineales, lineales generales,...
Tablas mltiples. Mtodos para construir tablas mltiples y realizar anlisis
factoriales mltiples.
Amado. Mtodos que interaccionan con el software AMADO.

Anlisis factoriales con SPAD

26

4 Caracterizacin de variables
SPAD ofrece un mtodo original y poco conocido para caracterizar una variable respuesta
a partir de un conjunto de variables explicativas. Este mtodo se diferencia cuando la
variable respuesta es categrica o bien continua. En cualquier caso se aplica un algoritmo
que realiza comparaciones mltiples entre medias y / o proporciones para hallar las
variables explicativas relacionadas. Este mtodo permite, por ejemplo que sepamos que
caractersticas diferencian a los clientes buenos de los clientes malos, tomando como
explicativas la edad, el nivel de estudios, los aos en la entidad bancaria,... En el caso que la
variable sea continua, nos permitira hallar las diferencias entre individuos con valores altos
y valores bajos de la variable respuesta. Es un mtodo que se enmarca claramente entre las
tcnicas ms recientes de Minera de datos (Data Mining). Pueden darse los dos casos
siguientes:

Caracterizacin de una categora de una variable categrica respuesta a partir de las


categoras (A, B, C, ...) de una variable explicativa. La categora de la variable respuesta
define implcitamente un subgrupo de individuos del conjunto global de individuos. El
algoritmo realiza pruebas estadsticas para comparar las proporciones de individuos que
presentan las categoras A, B, C, ... dentro del subgrupo respecto las proporciones en la
muestra global. En el caso que se desee caracterizar el subgrupo de individuos a partir de
una variable explicativa continua se realiza un test de comparacin de medias entre la
media del subgrupo respecto la media global.

Caracterizacin de una variable continua respuesta a partir de las categoras (A, B,


C...) de una variable explicativa. Se procede a realizar pruebas de comparaciones mltiples
entre las medias dentro de los individuos que forman las categoras con la media global de
la variable continua respuesta. En el caso que se desee caracterizar la variable continua a
partir de variables continuas explicativas se procede a calcular las correlaciones bivariadas.

SPAD ordena las caractersticas influyentes por el p-valor asociado a la prueba estadstica y
adems incorpora un nuevo elemento, el valor-test. Este estadstico se distribuye segn una
normal estandarizada, por lo que cuando sea superior a 2 o bien inferior a 2 se considerar
que una caracterstica es influyente, con un nivel de significacin asociado de 0,05.

4.1 Caracterizacin de una variable cualitativa


Ejemplo 4. En el archivo de datos Enquete.sba, se desea observar qu caractersticas
diferencian a hombres y mujeres, a partir del resto de variables presentes en la base de
datos. En primer lugar, debemos crear una nueva filire, indicar el archivo BASE y
encadenar el mtodo DEMOD.

Anlisis factoriales con SPAD

27

Realizando un doble clic sobre el icono DEMOD parametrizaremos el mtodo. Debemos


indicar como variable nominal para caracterizar la variable Sexo, tal como sigue:

El resto de variables deben ser consideradas como variables nominales caracterizantes o


bien continuas caracterizantes. Para ello podemos utilizar los botones

Anlisis factoriales con SPAD

28

Anlisis factoriales con SPAD

29

En la subventana Paramtres, podemos indicar algunos detalles sobre la


caracterizacin, como por ejemplo, de que modo van a listarse las variables caractersticas,
cuntas van a listarse y con qu criterio. Si ejecutamos la filire, nos aparecer un
icono de resultado tipo listado:

En l encontraremos los resultados siguientes:

Caracterizacin del sexo segn las variables categricas

CARACTERISATION PAR LES MODALITES DES CLASSES OU MODALITES


DE Sexe de l'enqut(e)
masculin
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------43.81 masculin
Sex1
138
20.45 0.000 100.00 100.00 43.81 masculin
Sexe de l'enqut(e)
Sex1
138
5.71 0.000
61.54
63.77 45.40 oui, plein temps
Exercez-vous en ce moment une activit professionnelle
Trv1
143
4.40 0.000
55.23
68.84 54.60 actif
Situation actuelle de la personne interroge
Sit1
172
4.37 0.000
56.41
63.77 49.52 non
Avez-vous t au chmage ces douze derniers mois ?
Chm2
156
3.69 0.000
59.79
42.03 30.79 non
Avez-vous des conflits travail - vie personnelle
Cnf2
97
3.66 0.000
48.30
92.75 84.13 non
Avez-vous souffert rcemment d'un tat dpressif
Dpr2
265
3.51 0.000
53.75
62.32 50.79 non
Avez-vous souffert rcemment de nervosit
Nrf2
160
3.25 0.001
64.29
26.09 17.78 cep et cap
Niveau d'tudes de l'enqut(e)
Dip3
56
3.06 0.001
50.50
73.19 63.49 non
Avez-vous souffert rcemment de maux de tte
Tet2
200
2.70 0.003
57.89
31.88 24.13 assez souvent
Regardez-vous la tlvision ?
Tl2
76
2.58 0.005
51.66
56.52 47.94 pas du tout d'accord Les gens comme moi se sentent souvent seuls
Seu4
151
-2.42 0.008
34.23
27.54 35.24 non
Exercez-vous en ce moment une activit professionnelle
Trv3
111
-2.77 0.003
0.00
0.00
3.17 pas du tout
Etes-vous satisfait de votre tat de sant
Snt4
10
-3.06 0.001
32.17
26.81 36.51 oui
Avez-vous souffert rcemment de maux de tte
Tet1
115
-3.35 0.000
15.63
3.62 10.16 n'a jamais travaill Exercez-vous en ce moment une activit professionnelle
Trv4
32
-3.51 0.000
33.55
37.68 49.21 oui
Avez-vous souffert rcemment de nervosit
Nrf1
155
-3.66 0.000
20.00
7.25 15.87 oui
Avez-vous souffert rcemment d'un tat dpressif
Dpr1
50
-4.24 0.000
0.00
0.00
6.03 veuf(ve)
Statut matrimonial
Mat5
19
-4.30 0.000
30.28
31.16 45.08 *Reponse manquante* Avez-vous des conflits travail - vie personnelle
19_
142
-4.30 0.000
30.28
31.16 45.08 *Reponse manquante* Avez-vous t au chmage ces douze derniers mois ?
20_
142
-7.87 0.000
0.00
0.00 16.51 mnagre s.prof.
Situation actuelle de la personne interroge
Sit3
52
-20.45 0.000
0.00
0.00 56.19 fminin
Sexe de l'enqut(e)
Sex2
177
---------------------------------------------------------------------------------------------------------------------------------fminin
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------56.19 fminin
Sex2
177
20.45 0.000 100.00 100.00 56.19 fminin
Sexe de l'enqut(e)
Sex2
177
7.87 0.000 100.00
29.38 16.51 mnagre s.prof.
Situation actuelle de la personne interroge
Sit3
52
4.30 0.000
69.72
55.93 45.08 *Reponse manquante* Avez-vous des conflits travail - vie personnelle
19_
142
4.30 0.000
69.72
55.93 45.08 *Reponse manquante* Avez-vous t au chmage ces douze derniers mois ?
20_
142
4.24 0.000 100.00
10.73
6.03 veuf(ve)
Statut matrimonial
Mat5
19
3.66 0.000
80.00
22.60 15.87 oui
Avez-vous souffert rcemment d'un tat dpressif
Dpr1
50
3.51 0.000
66.45
58.19 49.21 oui
Avez-vous souffert rcemment de nervosit
Nrf1
155
3.35 0.000
84.38
15.25 10.16 n'a jamais travaill Exercez-vous en ce moment une activit professionnelle
Trv4
32
3.06 0.001
67.83
44.07 36.51 oui
Avez-vous souffert rcemment de maux de tte
Tet1
115
2.77 0.003 100.00
5.65
3.17 pas du tout
Etes-vous satisfait de votre tat de sant
Snt4
10
2.42 0.008
65.77
41.24 35.24 non
Exercez-vous en ce moment une activit professionnelle
Trv3
111
-2.58 0.005
48.34
41.24 47.94 pas du tout d'accord Les gens comme moi se sentent souvent seuls
Seu4
151
-2.70 0.003
42.11
18.08 24.13 assez souvent
Regardez-vous la tlvision ?
Tl2
76
-3.06 0.001
49.50
55.93 63.49 non
Avez-vous souffert rcemment de maux de tte
Tet2
200
-3.25 0.001
35.71
11.30 17.78 cep et cap
Niveau d'tudes de l'enqut(e)
Dip3
56
-3.51 0.000
46.25
41.81 50.79 non
Avez-vous souffert rcemment de nervosit
Nrf2
160
-3.66 0.000
51.70
77.40 84.13 non
Avez-vous souffert rcemment d'un tat dpressif
Dpr2
265
-3.69 0.000
40.21
22.03 30.79 non
Avez-vous des conflits travail - vie personnelle
Cnf2
97
-4.37 0.000
43.59
38.42 49.52 non
Avez-vous t au chmage ces douze derniers mois ?
Chm2
156
-4.40 0.000
44.77
43.50 54.60 actif
Situation actuelle de la personne interroge
Sit1
172
-5.71 0.000
38.46
31.07 45.40 oui, plein temps
Exercez-vous en ce moment une activit professionnelle
Trv1
143
-20.45 0.000
0.00
0.00 43.81 masculin
Sexe de l'enqut(e)
Sex1
138
----------------------------------------------------------------------------------------------------------------------------------

Anlisis factoriales con SPAD

30

Caracterizacin del sexo segn las variables continuas

CARACTERISATION PAR LES CONTINUES DES CLASSES OU MODALITES


DE Sexe de l'enqut(e)
masculin
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| V.TEST | PROBA |
MOYENNES
|
ECARTS TYPES
|
VARIABLES CARACTERISTIQUES
|
|
|
| CLASSE GENERALE | CLASSE GENERAL | NUM.LIBELLE
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
masculin
( POIDS =
138.00
EFFECTIF = 138 )
Sex1 |
|
|
|
6.69 | 0.000 | 6533.19 4408.55 | 5486.12 4575.34 | 51.Salaire mens. de l'enqut
Salr |
|
|
|
|
|
|
| -2.33 | 0.010 |
6.49
6.65 |
1.32
1.06 | 41.Famille, enfants : importance accorde
Fami |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
fminin
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| V.TEST | PROBA |
MOYENNES
|
ECARTS TYPES
|
VARIABLES CARACTERISTIQUES
|
|
|
| CLASSE GENERALE | CLASSE GENERAL | NUM.LIBELLE
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
fminin
( POIDS =
177.00
EFFECTIF = 177 )
Sex2 |
|
|
|
2.33 | 0.010 |
6.77
6.65 |
0.78
1.06 | 41.Famille, enfants : importance accorde
Fami |
|
|
|
|
|
|
| -6.69 | 0.000 | 2751.33 4408.55 | 2742.02 4575.34 | 51.Salaire mens. de l'enqut
Salr |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+

Mediante los resultados obtenidos, podramos concluir lo siguiente:


Los hombres presentan mayor frecuencia de situacin laboral en activo, trabajando a tiempo completo, y su
frecuencia de haber estado en el paro, sufrido una depresin, conflictos de trabajo o nerviosismo es menor que
el de las mujeres, que presentan mayor desempleo y mayores niveles de depresin, conflictos, ... Se observa
tambin que los hombres presentan un salario superior al de las mujeres y por otro lado, las mujeres atorgan
mayor importancia a la familia y nios.
Obviamente, se podran entrar ms en detalle sobre los porcentajes implicados en cada
caso, pero muchas veces podemos conformaremos con hallar los perfiles generales.
Las columnas presentadas en las tablas representan:

MODALITES CARACTERISTIQUES Caracterstica que resulta ser significativa.


DES VARIABLES Variable nominal asociada a la caracterstica.
GLOBAL Porcentaje de individuos en la muestra que presentan la caracterstica
MOD/CLA Porcentaje de individuos de la submuestra definida por el sexo (hombres o
mujeres) que presentan la caracterstica.
CLA/MOD Porcentaje de individuos de la submuestra definida por la caracterstica
explicativa que estn presentes en la submuestra definida por el sexo.
PROBA P-valor asociado a la prueba estadstica.
V.TEST Valor test asociado a la prueba estadstica.
Por ejemplo, observamos que en general un 45,40% de los individuos encuestados trabajan
a tiempo completo. En el caso de los hombres este porcentaje aumenta al 63,77 %, y
observamos que el 61,54% de las personas que trabajan a tiempo completo son hombres.
En el caso de las tablas para variables continuas caractersticas, las columnas representan:

VARIABLES CARACTERISTIQUES Variable continua que resulta ser significativa.


MOYENNES Media general (para todos los encuestados) y media definida por el sexo
(en los hombres o mujeres)
ECARTS TYPES Desviacin tpica general (para todos los encuestados) y desviacin
tpica definida por el sexo (en los hombres o mujeres).
PROBA P-valor asociado a la prueba estadstica.
V.TEST Valor test asociado a la prueba estadstica.

Anlisis factoriales con SPAD

31

Por ejemplo, observamos que el salario medio de los encuestados es de 4.408,55 ff,
mientras que para los hombres, esta media aumenta hasta los 6533,19 ff.

4.2 Caracterizacin de una variable continua


En el caso de querer caracterizar una variable continua deberamos utilizar el mtodo
DESCO, que presenta unos resultados similares al mtodo DEMOD.
Retomemos el ejemplo 4. Supongamos que queremos caracterizar la variable continua
edad. Debemos pues inserir un nuevo mtodo en la filire tal como sigue:

En la parametrizacin del mtodo debemos realizar las acciones siguientes:

Anlisis factoriales con SPAD

32

Anlisis factoriales con SPAD

33

Si ejecutamos la filire nos aparecer un icono de resultados tipo listado.

En l se nos presentarn los siguientes resultados:

Caracterizacin de la variable edad a partir de modalidades de variables categricas:

DESCRIPTION DE VARIABLES CONTINUES


DESCRIPTION DE : Age de l'enqut(e)
CARACTERISATION PAR LES MODALITES
DE LA VARIABLE : Age de l'enqut(e)
SUR 315.0 INDIVIDUS ACTIFS
MOYENNE
=
43.756
ECART-TYPE =
16.581
+--------------+-------------------+--------------------+------------------------------------------------------------+-----------+
| V.TEST PROB.| MOYENNE
E-TYPE | MODALITES
|LIBELLE DE LA VARIABLE
|
POIDS |
+--------------+-------------------+--------------------+------------------------------------------------------------+-----------+
| 12.01 0.000 |
68.46
6.73 |retrait
|Situation actuelle de la personne interroge
|
54.00 |

Anlisis factoriales con SPAD

34

|
6.93 0.000 |
52.54
17.87 |non
|Exercez-vous en ce moment une activit professionnelle
|
111.00 |
|
6.71 0.000 |
50.69
18.97 |*Reponse manquante* |Avez-vous t au chmage ces douze derniers mois ?
|
142.00 |
|
6.71 0.000 |
50.69
18.97 |*Reponse manquante* |Avez-vous des conflits travail - vie personnelle
|
142.00 |
|
6.29 0.000 |
67.00
10.94 |veuf(ve)
|Statut matrimonial
|
19.00 |
|
5.92 0.000 |
55.93
15.66 |aucun diplme
|Niveau d'tudes de l'enqut(e)
|
54.00 |
|
5.30 0.000 |
48.16
17.37 |tous les jours
|Regardez-vous la tlvision ?
|
176.00 |
|
5.09 0.000 |
49.33
15.64 |propritaire
|Statut d'occupation du logement
|
133.00 |
|
4.12 0.000 |
46.10
16.75 |oui
|La famille est le seul endroit o l'on se sent bien
|
230.00 |
|
4.12 0.000 |
55.86
14.59 |ne sait pas
|Estimez-vous que la socit a besoin de se transformer
|
29.00 |
|
3.93 0.000 |
51.83
16.03 |cep seul
|Niveau d'tudes de l'enqut(e)
|
54.00 |
|
3.85 0.000 |
49.23
16.55 |semblables
|Opinion sur les conditions de vie venir
|
95.00 |
|
3.76 0.000 |
58.06
16.40 |2001 5000
|Taille d'agglomration (nombre d'habitants)
|
18.00 |
|
3.58 0.000 |
58.73
16.01 | la femme seule
|Les travaux du mnage,les soins des enfants incombent ...
|
15.00 |
|
3.25 0.001 |
52.50
15.30 |peu
|Etes-vous satisfait de votre tat de sant
|
34.00 |
|
2.96 0.002 |
48.07
18.19 |beaucoup
|Etes-vous inquiet du risque d'une agression dans la rue
|
92.00 |
|
2.94 0.002 |
45.26
15.31 |oui
|Avez-vous eu des enfants
|
243.00 |
|
2.94 0.002 |
47.21
18.70 |non
|Vous imposez-vous rgulirement des restrictions
|
122.00 |
|
2.77 0.003 |
46.80
15.92 |trs
|Etes-vous satisfait de votre logement proprement dit
|
132.00 |
|
2.68 0.004 |
44.86
17.10 |non
|Disposez-vous d'un magntoscope
|
264.00 |
|
2.44 0.007 |
46.17
16.77 |oui
|Avez-vous souffert rcemment de mal au dos
|
149.00 |
|
2.41 0.008 |
54.62
18.75 |ne sait pas
|Opinion sur les conditions de vie venir
|
13.00 |
| -2.34 0.010 |
40.82
16.20 |assez mal
|Opinion sur le fonctionnement de la justice en 1986
|
113.00 |
| -2.35 0.009 |
42.24
16.42 |homme et femme
|Les travaux du mnage,les soins des enfants incombent ...
|
214.00 |
| -2.38 0.009 |
37.65
15.23 |peu
|Etes-vous satisfait de votre cadre de vie quotidien
|
37.00 |
| -2.44 0.007 |
41.59
16.11 |non
|Avez-vous souffert rcemment de mal au dos
|
166.00 |
| -2.45 0.007 |
28.57
8.24 |ne sait pas
|Les dpenses de logement sont pour vous une charge ...
|
7.00 |
| -2.68 0.004 |
38.06
12.09 |oui
|Disposez-vous d'un magntoscope
|
51.00 |
| -2.72 0.003 |
38.90
14.33 |plus de 200000
|Taille d'agglomration (nombre d'habitants)
|
68.00 |
| -2.73 0.003 |
41.07
16.56 |assez
|Etes-vous satisfait de votre logement proprement dit
|
150.00 |
| -2.76 0.003 |
40.21
15.57 |souhaitable
|La diffusion de l'informatique est une chose ...
|
109.00 |
| -2.81 0.003 |
41.02
15.07 |pas du tout d'accord|Les gens comme moi se sentent souvent seuls
|
151.00 |
| -2.87 0.002 |
39.64
14.45 |un peu
|Etes-vous inquiet du risque d'une agression dans la rue
|
94.00 |
| -2.91 0.002 |
34.04
11.79 |chmeur
|Situation actuelle de la personne interroge
|
23.00 |
| -2.94 0.002 |
37.02
13.43 |bac ou bs
|Niveau d'tudes de l'enqut(e)
|
45.00 |
| -2.94 0.002 |
41.57
14.67 |oui
|Vous imposez-vous rgulirement des restrictions
|
193.00 |
| -3.05 0.001 |
31.44
8.97 |concubinage
|Statut matrimonial
|
16.00 |
| -3.07 0.001 |
37.57
12.85 |cep et cap
|Niveau d'tudes de l'enqut(e)
|
56.00 |
| -3.11 0.001 |
38.21
12.92 |non
|Estimez-vous que la socit a besoin de se transformer
|
68.00 |
| -3.12 0.001 |
38.25
19.46 |non
|Avez-vous eu des enfants
|
69.00 |
| -3.25 0.001 |
39.72
14.89 |dissout si accord
|Opinion sur le mariage
|
114.00 |
| -3.38 0.000 |
35.79
12.63 |tudes sup. g.coles|Niveau d'tudes de l'enqut(e)
|
43.00 |
| -3.54 0.000 |
38.78
12.00 |non
|Avez-vous des conflits travail - vie personnelle
|
97.00 |
| -3.65 0.000 |
29.47
7.62 |oui
|Avez-vous t au chmage ces douze derniers mois ?
|
17.00 |
| -3.79 0.000 |
39.56
16.93 |locataire
|Statut d'occupation du logement
|
131.00 |
| -3.98 0.000 |
37.14
10.89 |oui
|Avez-vous des conflits travail - vie personnelle
|
76.00 |
| -4.06 0.000 |
37.03
12.92 |assez souvent
|Regardez-vous la tlvision ?
|
76.00 |
| -4.26 0.000 |
36.92
12.98 |trs
|Etes-vous satisfait de votre tat de sant
|
80.00 |
| -4.28 0.000 |
28.76
5.80 |amliorer beaucoup |Opinion sur les conditions de vie venir
|
21.00 |
| -4.41 0.000 |
36.86
13.97 |non
|La famille est le seul endroit o l'on se sent bien
|
83.00 |
| -4.59 0.000 |
35.64
12.57 |amliorer un peu
|Opinion sur les conditions de vie venir
|
69.00 |
| -4.63 0.000 |
32.71
17.21 |clibataire
|Statut matrimonial
|
42.00 |
| -4.80 0.000 |
21.17
2.48 |tudiant
|Situation actuelle de la personne interroge
|
12.00 |
| -5.03 0.000 |
39.00
11.52 |non
|Avez-vous t au chmage ces douze derniers mois ?
|
156.00 |
| -5.83 0.000 |
37.77
11.24 |oui, plein temps
|Exercez-vous en ce moment une activit professionnelle
|
143.00 |
| -6.57 0.000 |
38.15
11.34 |actif
|Situation actuelle de la personne interroge
|
172.00 |
+--------------+-------------------+--------------------+------------------------------------------------------------+-----------+
|
|
43.76
16.58 | ENSEMBLE
|
315.00 |
+--------------+-------------------+--------------------+------------------------------------------------------------+-----------+

Correlaciones con el resto de variables continuas

CORRELATION AVEC LES VARIABLES CONTINUES


DE LA VARIABLE : Age de l'enqut(e)
+--------+--------+--------+--------------------------------------------------------------------+------------+
| V.TEST | PROBA. | CORR. | NUM . LIBELLE DE LA VARIABLE
|
POIDS |
+--------+--------+--------+--------------------------------------------------------------------+------------+
| 99.90 | 0.000 | 1.000 |
4 . Age de l'enqut(e)
|
315.000 |
|
5.38 | 0.000 | 0.295 | 28 . Nombre d'enfants eus
|
315.000 |
|
4.92 | 0.000 | 0.271 | 46 . Religion : importance accorde
|
315.000 |
| -3.12 | 0.001 | -0.175 | 43 . Temps libre, dtente : importance accorde
|
315.000 |
| -4.26 | 0.000 | -0.237 | 42 . Travail, profession : importance accorde
|
315.000 |
| -5.99 | 0.000 | -0.343 | 50 . Prestat familiales : montant mensuel moyen
|
283.000 |
| -7.46 | 0.000 | -0.399 | 26 . Nb person. dans logmt
|
315.000 |
+--------+--------+--------+--------------------------------------------------------------------+------------+

Podemos observar relaciones obvias, como por ejemplo que las personas jubiladas
(retraits) presentan una media de edad superior, y otras ms interesantes como que las
personas que cada da ven la televisin presentan una media de edad superior a la global.
Por el otro lado observamos que la edad est relacionada positivamente con el nmero de
hijos y la importancia atorgada a la religin y est relacionada inversamente con el nmero
de personas con el que se convive, el monto de prestaciones familiares recibido, la
importancia atorgada al trabajo y la importancia atorgada al tiempo libre.

Anlisis factoriales con SPAD

35

5 Anlisis factoriales simples


En este apartado presentamos los mtodos multivariantes simples de reduccin de datos
que pueden realizarse con SPAD: anlisis de componentes principales (ACP), anlisis de
correspondencias simples (ACS) y anlisis de correspondencias mltiples (ACM). Cabe
destacar que en su origen SPAD se desarroll para ejecutar estos anlisis. Por otro lado,
SPAD presenta una forma original de ejecutar estos mtodos, combinndolos con los
mtodos de clasificacin. El entorno grfico con el que se realizan los grficos factoriales es
otro logro de SPAD.

5.1 Anlisis de componentes principales


El anlisis de componentes principales se utiliza cuando la matriz de datos est compuesta
por un conjunto de variables continuas (activas). Igualmente puede ser de nuestro inters
utilizar variables ilustrativas (continuas o categricas) que no participen en la creacin de
los ejes pero que estemos interesados en proyectarlas en el espacio factorial creado.
Ejemplo 5. En la tabla siguiente se muestra la reparticin, en porcentajes, de los gastos
publicitarios en los diferentes medios de comunicacin en 16 pases de Europa, en el ao
1990. Los datos se han extrado de Press Landscape update & Eur. Direct Marketing NTC,
1991.
Newspapers Magazines
BEL
DK
FR
AL
GR
IR
IT
NE
POR
ESP
UK
AUT
FIN
NOR
SUE
SUI

Belgium
Denmark
France
Germany
Greece
Ireland
Italy
Neth
Portugal
Spain
U.K.
Austria
Finland
Norway
Sweden
Switz

35.3
76.1
28.6
46.0
26.0
63.7
27.8
50.4
25.1
37.6
44.1
51.6
67.2
77.2
78.6
61.1

20.5
11.8
27.5
27.9
28.2
5.4
24.0
27.8
21.7
15.4
19.3
18.0
13.5
15.8
14.3
16.8

TV
27.5
9.6
24.8
15.8
35.3
19.6
43.02
9.0
37.1
31.3
30.5
17.7
12.9
2.5
2.2
6.7

Radio Cinema Outdoor/Transport


1.2
0.8
6.6
5.1
5.7
6.2
1.4
2.2
6.7
10.3
2.2
8.0
4.0
1.0
0.0
1.7

1.4
0.4
0.8
1.2
0.0
0.0
0.0
0.3
0.0
0.8
0.5
0.4
0.1
1.2
0.6
0.9

14.2
1.3
11.7
3.9
4.8
5.1
3.6
10.4
9.5
4.7
3.4
4.4
2.3
2.2
4.3
12.7

Los datos se encuentran en el archivo caspub.sba. Para realizar un anlisis de


componentes principales debemos crear una filire, indicar el archivo de datos y
encadenar el mtodo COPRI.

Anlisis factoriales con SPAD

36

Para pareametrizar el mtodo debemos realizar un doble clic sobre el icono. Nos aparecer
una nueva ventana donde debemos indicarle las variables continuas activas.

En la subventana Paramtres podemos especificar algunas opciones de anlisis. Podramos


realizar un anlisis norme o non norme para que el espacio factorial sea ortonormal o
bien ortogonal, respectivamente. En la mayora de casos se utiliza la primera opcin para
igualar las escalas en que estn medidas las variables. Tambin podemos indicar cuantos
ejes factoriales se desean conservar (como mximo tantos como variables continuas
activas), y cuantos queremos editar en los resultados de salida. Las opciones por defecto
son en la mayora de casos suficientes.

Anlisis factoriales con SPAD

37

Una vez parametrizado, la filire deber tener el aspecto siguiente:

La ejecutamos y obtenemos tres iconos de resultados.

Anlisis factoriales con SPAD

38

En el primer icono,
, encontraremos los resultados del anlisis factorial. Los
resultados ms relevantes son:

Valores propios del ACP. En nuestro ejemplo observamos que los dos primeros ejes
factoriales conservan un 70,69% de la inercia.

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
6.0000
SOMME DES VALEURS PROPRES ....
6.0000
HISTOGRAMME DES 6 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
|
1
|
2.7120
|
45.20 |
45.20 | ******************************************************************************** |
|
2
|
1.5297
|
25.49 |
70.69 | **********************************************
|
|
3
|
0.7817
|
13.03 |
83.72 | ************************
|
|
4
|
0.5795
|
9.66 |
93.38 | ******************
|
|
5
|
0.3965
|
6.61 |
99.99 | ************
|
|
6
|
0.0006
|
0.01 | 100.00 | *
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+

Coordenadas de las variables en el espacio factorial. Nos puede ayudar a interpretar el


ACP y sus ejes.

COORDONNEES DES VARIABLES SUR LES AXES 1 A 5


VARIABLES ACTIVES
----------------------------+------------------------------------+-------------------------------+------------------------------VARIABLES
|
COORDONNEES
| CORRELATIONS VARIABLE-FACTEUR |
ANCIENS AXES UNITAIRES
----------------------------+------------------------------------+-------------------------------+------------------------------IDEN - LIBELLE COURT
|
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5
----------------------------+------------------------------------+-------------------------------+------------------------------C2
- Diarios
|
0.99 -0.05
0.03 -0.01
0.10 | 0.99 -0.05 0.03 -0.01 0.10 | 0.60 -0.04 0.04 -0.02 0.16
C3
- Revistas
| -0.69
0.42 -0.34
0.32
0.36 | -0.69 0.42 -0.34 0.32 0.36 | -0.42 0.34 -0.39 0.42 0.57
C4
- Televisin
| -0.87 -0.28 -0.12
0.02 -0.38 | -0.87 -0.28 -0.12 0.02 -0.38 | -0.53 -0.23 -0.14 0.02 -0.61
C5
- Radio
| -0.53 -0.40
0.71
0.10
0.21 | -0.53 -0.40 0.71 0.10 0.21 | -0.32 -0.32 0.80 0.14 0.34
C6
- Cine
|
0.20
0.79
0.34
0.39 -0.26 | 0.20 0.79 0.34 0.39 -0.26 | 0.12 0.64 0.39 0.51 -0.41
C7
- OUTDOOR/TRANSPORT
| -0.40
0.70
0.17 -0.56
0.05 | -0.40 0.70 0.17 -0.56 0.05 | -0.24 0.57 0.19 -0.74 0.08
----------------------------+------------------------------------+-------------------------------+-------------------------------

Coordenadas de los individuos en el espacio factorial. Podemos observar qu pases


estn bien representados en los ejes, a partir de las contribuciones y los cosenos
cuadrados.

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS


AXES 1 A 5
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
|
INDIVIDUS
|
COORDONNEES
|
CONTRIBUTIONS
|
COSINUS CARRES
|
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| Blgica
6.25
9.53 | -0.83 2.62 0.20 -0.55 -1.29 | 1.6 27.9 0.3 3.3 26.0 | 0.07 0.72 0.00 0.03 0.17 |
| Dinamarca
6.25
6.81 | 2.40 -0.79 -0.59 0.08 -0.25 | 13.3 2.5 2.8 0.1 1.0 | 0.85 0.09 0.05 0.00 0.01 |
| Francia
6.25
6.19 | -1.99 1.26 0.63 -0.05 0.50 | 9.1 6.4 3.1 0.0 3.9 | 0.64 0.26 0.06 0.00 0.04 |
| Alemania
6.25
4.55 | -0.32 1.02 0.29 1.77 0.44 | 0.2 4.2 0.7 33.8 3.0 | 0.02 0.23 0.02 0.69 0.04 |
| Grecia
6.25
6.92 | -2.26 -0.90 -0.80 0.36 0.50 | 11.7 3.3 5.1 1.4 3.9 | 0.74 0.12 0.09 0.02 0.04 |
| Irlanda
6.25
7.30 | 1.19 -1.83 1.00 -1.22 -0.21 | 3.3 13.8 7.9 15.9 0.7 | 0.19 0.46 0.14 0.20 0.01 |
| Italia
6.25
7.91 | -1.72 -0.96 -1.86 0.13 -0.76 | 6.8 3.8 27.5 0.2 9.0 | 0.37 0.12 0.44 0.00 0.07 |
| Holanda
6.25
4.32 | -0.20 1.11 -0.85 -0.60 1.40 | 0.1 5.0 5.8 3.9 30.9 | 0.01 0.29 0.17 0.08 0.45 |
| Portugal
6.25
6.74 | -2.34 -0.71 0.07 -0.88 0.04 | 12.6 2.0 0.0 8.4 0.0 | 0.81 0.07 0.00 0.12 0.00 |
| Espaa
6.25
6.66 | -1.15 -0.91 1.95 0.64 -0.52 | 3.1 3.4 30.5 4.4 4.3 | 0.20 0.13 0.57 0.06 0.04 |
| Reino Unido
6.25
1.61 | -0.28 -0.43 -0.77 0.42 -0.77 | 0.2 0.7 4.7 1.9 9.3 | 0.05 0.11 0.37 0.11 0.37 |
| Austria
6.25
2.25 | -0.12 -0.91 1.00 0.27 0.57 | 0.0 3.4 8.0 0.8 5.2 | 0.01 0.37 0.44 0.03 0.15 |
| Finlandia
6.25
3.89 | 1.37 -1.37 -0.09 -0.17 0.32 | 4.3 7.7 0.1 0.3 1.6 | 0.48 0.48 0.00 0.01 0.03 |
| Noruega
6.25
8.59 | 2.61 0.77 0.03 1.06 -0.21 | 15.7 2.4 0.0 12.1 0.7 | 0.79 0.07 0.00 0.13 0.01 |
| Suecia
6.25
7.12 | 2.59 0.27 -0.55 -0.15 0.15 | 15.5 0.3 2.4 0.2 0.3 | 0.94 0.01 0.04 0.00 0.00 |
| Suiza
6.25
5.60 | 1.04 1.78 0.34 -1.11 0.09 | 2.5 12.9 0.9 13.3 0.1 | 0.19 0.57 0.02 0.22 0.00 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+

Anlisis factoriales con SPAD

39

En el segundo icono,
, podemos editar los grficos factoriales. Realizando un doble
clic nos aparece una pantalla donde se editarn los grficos. En primer lugar, debemos
ejecutar la opcin Nouveau del men Graphique.

Se nos abrir una nueva pantalla donde indicaremos el tipo de grfico a realizar.
Bsicamente hay tres grficos factoriales interesantes:

Grfico de las proyecciones de las variables sobre los ejes factoriales

Nos aparecer un grfico con el siguiente aspecto:

Anlisis factoriales con SPAD

40

Para editar las etiquetas basta con realizar un doble clic sobre las flechas. SPAD permite
arrastar las etiquetas.

Las flechas deben interpretarse como direcciones de crecimiento de las variables en el


espacio factorial. Observamos pues que los pases que utilizan mucha publicidad en
televisin tambin utilizan la radio y muy poco el cine. Por el otro lado los pasos que
utilizan revistas como medio, suelen tambin utilizar ms recurson en publicidad outdoor.

Grfico de las proyecciones de los individuos (pases) sobre los ejes factioriales

Anlisis factoriales con SPAD

41

Nos aparecer un grfico con el aspecto siguiente:

Para editar todas las etiquetas de una sola vez, podemos seleccionar la opcin De tous les
points en el men Selection y luego la opcin crire les libelles en
Habillage. Para deseleccionar los puntos, basta con ejecutar la opcin Dslection
totale en Slection.

Anlisis factoriales con SPAD

42

A veces puede resultar interesante ponderar los puntos a partir de la contribucin de cada
pas en el espacio factorial creado. Para ello debemos ejecutar la opcin Styles pour
les categories en Preferences, que nos permite realizar esta opcin y muchas
otras, como el color de los smbolos, tamao de las etiquetas, smbolos, ...

Anlisis factoriales con SPAD

43

Los pases cercanos son pases que presentan distribuciones parecidas en el reparto de los
gastos publicitarios. Observamos que podes pueden diferenciar claramente los pases
latinos de los pases anglosajones.

Grfico de las proyecciones de las variables y individuos utilizando los ejes unitarios

Si editamos las etiquetas y asignamos un peso a los pases proporcional a sus


contribuciones, obtendremos el grfico siguiente:

Anlisis factoriales con SPAD

44

Muy a menudo se suelen interpretar estos grficos diferenciando en los cuatro cuadrantes.
Los pases ms alejados del origen de coordenadas son los pases que presentan un perfil
ms alejado del perfil medio. En este grfico podramos concluir lo siguiente:
Portugal , Grecia, Italia y Espaa tienden a dedicar ms recursos publicitarios en televisin y radio y muy
poco en el cine. Francia y Blgica dedican ms recursos en revistas y outdoor. Por el otro lado, pases
nrdicos como Suiza, Noruega, Suecia, Dinamarca, Finlandia y Irlanda destinan ms recursos a los
diarios. Suiza, Holanda y Alemania en concreto dedican ms recursos al cine.

Anlisis factoriales con SPAD

45

5.2 Anlisis de correspondencias simples


El anlisis de correspondencias simples se utiliza cuando queremos analizar dos variables
categricas, que definen una tabla de contingencia. El inters recae en analizar las
asociaciones entre las categoras de ambas variables, y su proyeccin en un biplot.
Ejemplo 6. Del archivo de datos enquete.sba deseamos analizar conjuntamente dos
variables categricas, el nivel de estudios y la opinin acerca de las condiciones de vida en
un futuro. En anlisis de correspondencias simples se realiza sobre las frecuencias creadas
en la tabla de contingencia. En nuestro caso, debemos crear esta tabla de contingencia, por
lo que escogeremos el mtodo TABLE+CORBI. La filire debe tener el aspecto siguiente:

Realizamos un doble clic sobre el icono del mtodo y debemos indicar qu variables
definen las columnas y las filas de la tabla de contingencia. Para ello, debemos cliquear en el
botn Construction du tableau de la subventana Comandes.

Anlisis factoriales con SPAD

46

En la subventana Paramtres de lanalyse podemos indicar algunas opciones sobre el


anlisis factorial. En la mayora de casos, los parmetros por defecto son suficientes. Si
ejecutamos la filire, nos crea los siguientes iconos de salida:

Del el icono de listado, destacaremos los siguientes resultados:

Tabla de contingencia. Definida por las dos variables categricas. Podemos observar las
frecuencias absolutas y las frecuencias relativas por fila y por columna. Tambin se realiza
un contraste de independencia de ji-cuadrado, en el que observamos que se rechaza la
hiptesis de independencia.

EDITION DES COMMANDES


COMMANDE 1
TABLEAU
1
EN LIGNE
: 32 . Opinion sur les conditions de vie venir
EN COLONNE :
7 . Niveau d'tudes de l'enqut(e)
EDITION DES TABLEAUX
TABLEAU
1 EN LIGNE
: Opinion sur les conditions de vie venir
POIDS TOTAL :
315.
EN COLONNE : Niveau d'tudes de l'enqut(e)
EFF. |
|
|
|
|
|
|
|
|
|
%COL | Dip1 | Dip2 | Dip3 | Dip4 | Dip5 | Dip6 | Dip7 | Dip8 | Dip9 | TOT.
%LIG |
|
|
|
|
|
|
|
|
|
-----+--------+--------+--------+--------+--------+--------+--------+--------+--------+-------|
0 |
1 |
5 |
1 |
0 |
2 |
3 |
9 |
0 |
21
Ftr1 |
0.00 |
1.85 |
8.93 |
3.57 |
0.00 | 11.76 |
6.67 | 20.93 |
0.00 |
6.67
|
0.00 |
4.76 | 23.81 |
4.76 |
0.00 |
9.52 | 14.29 | 42.86 |
0.00 | 100.00
-----+--------+--------+--------+--------+--------+--------+--------+--------+--------+-------|
7 |
11 |
12 |
7 |
2 |
4 |
14 |
10 |
2 |
69
Ftr2 | 12.96 | 20.37 | 21.43 | 25.00 | 22.22 | 23.53 | 31.11 | 23.26 | 22.22 | 21.90
| 10.14 | 15.94 | 17.39 | 10.14 |
2.90 |
5.80 | 20.29 | 14.49 |
2.90 | 100.00
-----+--------+--------+--------+--------+--------+--------+--------+--------+--------+-------|
16 |
17 |
14 |
8 |
4 |
6 |
16 |
10 |
4 |
95
Ftr3 | 29.63 | 31.48 | 25.00 | 28.57 | 44.44 | 35.29 | 35.56 | 23.26 | 44.44 | 30.16
| 16.84 | 17.89 | 14.74 |
8.42 |
4.21 |
6.32 | 16.84 | 10.53 |
4.21 | 100.00
-----+--------+--------+--------+--------+--------+--------+--------+--------+--------+-------|
19 |
13 |
17 |
10 |
1 |
3 |
9 |
14 |
2 |
88
Ftr4 | 35.19 | 24.07 | 30.36 | 35.71 | 11.11 | 17.65 | 20.00 | 32.56 | 22.22 | 27.94
| 21.59 | 14.77 | 19.32 | 11.36 |
1.14 |
3.41 | 10.23 | 15.91 |
2.27 | 100.00
-----+--------+--------+--------+--------+--------+--------+--------+--------+--------+-------|
6 |
11 |
5 |
1 |
2 |
0 |
3 |
0 |
1 |
29
Ftr5 | 11.11 | 20.37 |
8.93 |
3.57 | 22.22 |
0.00 |
6.67 |
0.00 | 11.11 |
9.21
| 20.69 | 37.93 | 17.24 |
3.45 |
6.90 |
0.00 | 10.34 |
0.00 |
3.45 | 100.00
-----+--------+--------+--------+--------+--------+--------+--------+--------+--------+-------|
6 |
1 |
3 |
1 |
0 |
2 |
0 |
0 |
0 |
13
Ftr6 | 11.11 |
1.85 |
5.36 |
3.57 |
0.00 | 11.76 |
0.00 |
0.00 |
0.00 |
4.13
| 46.15 |
7.69 | 23.08 |
7.69 |
0.00 | 15.38 |
0.00 |
0.00 |
0.00 | 100.00
-----+--------+--------+--------+--------+--------+--------+--------+--------+--------+-------|
54 |
54 |
56 |
28 |
9 |
17 |
45 |
43 |
9 |
315
TOT. | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00 | 100.00
| 17.14 | 17.14 | 17.78 |
8.89 |
2.86 |
5.40 | 14.29 | 13.65 |
2.86 | 100.00
--------------------------------------------------------------------------------------------------------------------------------------KHI2 = 63.41 / 40 DEGRES DE LIBERTE / 34 EFFECTIFS THEORIQUES INFERIEURS A 5
PROBA ( KHI2 > 63.41 ) = 0.011 / V.TEST =
2.30
---------------------------------------------------------------------------------------------------------------------------------------

Valores propios del anlisis factorial. Observamos que con los dos primeros ejes
conservamos un 83% de la inercia.

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
0.2013
SOMME DES VALEURS PROPRES ....
0.2013
HISTOGRAMME DES 5 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
|
1
|
0.1112
|
55.27 |
55.27 | ******************************************************************************** |
|
2
|
0.0571
|
28.36 |
83.63 | ******************************************
|
|
3
|
0.0193
|
9.59 |
93.22 | **************
|
|
4
|
0.0114
|
5.66 |
98.88 | *********
|
|
5
|
0.0022
|
1.12 | 100.00 | **
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+

Anlisis factoriales con SPAD

47

Proyecciones de los puntos fila y columna sobre el espacio factorial. Se puede entrar
ms en detalle sobre el anlisis factorial. Las contribuciones indican cuando una categora
est bien representada sobre un eje factorial.

COORDONNEES, CONTRIBUTIONS DES FREQUENCES SUR LES AXES 1 A 5


FREQUENCES ACTIVES
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
|
FREQUENCES
|
COORDONNEES
|
CONTRIBUTIONS
|
COSINUS CARRES
|
|------------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDEN - LIBELLE COURT
P.REL DISTO |
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5 |
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
| Dip1 17.14
0.24 | 0.33 0.36 0.02 -0.02 0.03 | 17.1 39.5 0.2 0.6 7.5 | 0.45 0.54 0.00 0.00 0.00 |
| Dip2 17.14
0.19 | 0.34 -0.23 0.13 0.05 -0.02 | 17.7 16.4 15.7 3.6 2.1 | 0.60 0.29 0.09 0.01 0.00 |
| Dip3 17.78
0.02 | -0.07 0.09 0.08 0.03 -0.05 | 0.8 2.4 5.5 1.5 23.2 | 0.23 0.34 0.27 0.04 0.13 |
| Dip4 8.89
0.08 | -0.05 0.08 -0.07 -0.25 -0.02 | 0.2 1.1 2.5 48.0 1.9 | 0.03 0.09 0.07 0.81 0.01 |
| Dip5 2.86
0.46 | 0.45 -0.47 -0.07 0.17 0.09 | 5.1 11.1 0.8 6.9 9.5 | 0.43 0.48 0.01 0.06 0.02 |
| Dip6 5.40
0.32 | -0.22 0.30 -0.33 0.27 -0.01 | 2.3 8.5 30.9 33.8 0.3 | 0.15 0.28 0.35 0.22 0.00 |
| Dip7 14.29
0.12 | -0.11 -0.26 -0.19 -0.05 -0.03 | 1.5 17.4 26.0 2.7 5.6 | 0.10 0.58 0.29 0.02 0.01 |
| Dip8 13.65
0.46 | -0.66 -0.02 0.14 0.01 0.05 | 54.0 0.1 13.9 0.3 14.1 | 0.95 0.00 0.04 0.00 0.01 |
| Dip9 2.86
0.19 | 0.22 -0.27 -0.17 -0.10 0.17 | 1.3 3.6 4.5 2.6 35.9 | 0.26 0.38 0.16 0.05 0.15 |
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS
AXES 1 A 5
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
|
INDIVIDUS
|
COORDONNEES
|
CONTRIBUTIONS
|
COSINUS CARRES
|
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| Ftr1 : amliorer beaucou 6.67
1.01 | -0.97 -0.01 0.16 0.22 0.01 | 56.4 0.0 9.3 27.1 0.6 | 0.93 0.00 0.03 0.05 0.00 |
| Ftr2 : amliorer un peu 21.90
0.06 | -0.12 -0.15 -0.11 -0.04 -0.07 | 2.9 9.2 14.0 2.6 49.3 | 0.25 0.42 0.22 0.02 0.09 |
| Ftr3 : semblables
30.16
0.03 | 0.09 -0.08 -0.12 0.02 0.06 | 2.0 3.5 22.4 1.3 40.7 | 0.24 0.20 0.45 0.02 0.09 |
| Ftr4 : dtriorer un peu 27.94
0.06 | -0.03 0.16 0.12 -0.12 0.01 | 0.3 13.1 20.6 36.9 1.1 | 0.02 0.47 0.25 0.26 0.00 |
| Ftr5 : dtriorer beauco 9.21
0.55 | 0.63 -0.27 0.24 0.13 -0.03 | 33.1 11.8 28.6 14.6 2.6 | 0.72 0.13 0.11 0.03 0.00 |
| Ftr6 : ne sait pas
4.13
1.08 | 0.38 0.93 -0.15 0.22 -0.06 | 5.3 62.4 5.1 17.4 5.6 | 0.13 0.80 0.02 0.04 0.00 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+

En el segundo icono podemos realizar el grfico de correspondencias, de la forma


siguiente:

Despus de editar las etiquetas tendremos el grfico siguiente:

Anlisis factoriales con SPAD

48

En l, podemos observar, que se observa que a mayor formacin en estudios ms optimista


es la opinin sobre el avenir.

Anlisis factoriales con SPAD

49

5.3 Anlisis de correspondencias mltiples


El anlisis de correspondencias mltiples se utiliza cuando queremos analizar un conjunto
de variables categricas. Se crea una tabla individuos variables dummies (binarias), donde
cada una de las variables categricas define un conjunto de variables dummies (binarias)
para cada una de sus modalidades, excepto la redundante.
Ejemplo 7. El archivo de datos credit.sba contiene informacin referente a 480 clientes de
una entidad bancaria. Se dispone de las siguientes variables categricas:
Tipo de cliente (bueno/malo)
Edad del cliente (-23, 23-40, 40-50, +50, aos)
Situacin familiar (soltero, casado, divorciado, viudo)
Antigedad (-1, 1-4, 4-6, 6-12, +12, aos)
Domiciliacin del salario (domiciliacin, no domiciliacin)
Domiciliacin de los ahorros (no ahorros, -10KF, 10-100 KF, +100KF)
Profesin (empresario, trabajador, otra)
Media actual (-2KF, 2-5 KF, +5KF)
Media movimientos (-10KF, 10-30 KF, 30-50 KF, +50 KF)
Acumulacin de dbito (-40, 40-100, +100)
Descubierto (autorizado, prohibido)
Cheques (autorizado, prohibido)
Mediante un anlisis de correspondencias mltiples se estudiarn de forma conjunta las
asociaciones entre las variables de forma conjunta.
Primeramente debemos crear una nueva filire, indicar el archivo de datos e inserir el
mtodo CORMU.

Realizaremos un doble clic sobre el icono CORMU. Debemos indicar las variables
nominales que deseamos analizar. Podemos dejar el resto de parmetros con sus valores
por defecto.

Anlisis factoriales con SPAD

50

Guardando y ejecutando la filire obtendremos los iconos de salida siguientes:

Estos iconos son los mismos que para el caso de correspondencias simples. Destacaremos
los siguientes resultados:

Diagramas de barras de las variables categricas. Podemos observar las frecuencias de


cada una de las categoras. SPAD elimina por defecto aquellas categoras con una
frecuencia observada baja.

TRI-A-PLAT DES QUESTIONS ACTIVES


----------------------------+-----------------+----------------------------------------------------------------------------------MODALITES
| AVANT APUREMENT |
APRES APUREMENT
IDENT
LIBELLE
| EFF.
POIDS | EFF.
POIDS
HISTOGRAMME DES POIDS RELATIFS
----------------------------+-----------------+----------------------------------------------------------------------------------1 . Type de client
BON - bon client
| 237
237.00 | 237
237.00 *******************************
MAUV - mauvais
client
| 231
231.00 | 231
231.00 ******************************
----------------------------+-----------------+----------------------------------------------------------------------------------2 . Age du client
AGE1 - moins de
23 ans
|
88
88.00 |
88
88.00 ************

Anlisis factoriales con SPAD

51

AGE2 - de 23
40 ans
| 150
150.00 | 150
150.00 ********************
AGE3 - de 40
50 ans
| 122
122.00 | 122
122.00 ****************
AGE4 - plus de
50 ans
| 108
108.00 | 108
108.00 **************
----------------------------+-----------------+----------------------------------------------------------------------------------3 . Situation familiale
CELB - clibataire
| 170
170.00 | 170
170.00 **********************
MARI - mari
| 221
221.00 | 221
221.00 *****************************
DIVO - divorc
|
61
61.00 |
61
61.00 ********
VEUF - veuf
|
16
16.00 |
16
16.00 ***
----------------------------+-----------------+----------------------------------------------------------------------------------4 . Anciennet
ANC1 - anc. 1 an ou moins | 199
199.00 | 199
199.00 **************************
ANC2 - anc. de 1 4 ans
|
47
47.00 |
47
47.00 *******
ANC3 - anc. de 4 6 ans
|
69
69.00 |
69
69.00 *********
ANC4 - anc. de 6 12 ans |
66
66.00 |
66
66.00 *********
ANC5 - anc. plus
12 ans
|
87
87.00 |
87
87.00 ************
----------------------------+-----------------+----------------------------------------------------------------------------------5 . Domiciliation du salaire
Soui - domicile salaire
| 316
316.00 | 316
316.00 *****************************************
Snon - non dimicile salaire | 152
152.00 | 152
152.00 ********************
----------------------------+-----------------+----------------------------------------------------------------------------------6 . Domiciliation de l'pargne
EPA0 - pas d'pargne
| 370
370.00 | 372
372.00 ************************************************
EPA1 - moins de 10KF pargn |
58
58.00 |
60
60.00 ********
EPA2 - de 10 100KF pargn |
32
32.00 |
36
36.00 *****
EPA3 - plus de 100KF pargn |
8
8.00 | === VENTILEE ===
----------------------------+-----------------+----------------------------------------------------------------------------------7 . Profession
CADR - cadre
|
77
77.00 |
77
77.00 **********
EMPL - employ
| 237
237.00 | 237
237.00 *******************************
AUTR - autre
| 154
154.00 | 154
154.00 ********************
----------------------------+-----------------+----------------------------------------------------------------------------------8 . Moyenne en cours
ENC1 - moins de 2KF encours |
98
98.00 |
98
98.00 *************
ENC2 - de 2 5 KF encours | 308
308.00 | 308
308.00 ****************************************
ENC3 - plus de 5 KF encours |
62
62.00 |
62
62.00 ********
----------------------------+-----------------+----------------------------------------------------------------------------------9 . Moyenne des mouvements
MOU1 - moins 10 KF mouvt
| 154
154.00 | 154
154.00 ********************
MOU2 - de 10 30KF mouvt
|
71
71.00 |
71
71.00 **********
MOU3 - de 30 50KF mouvt
| 129
129.00 | 129
129.00 *****************
MOU4 - plus de 50KF mouvt
| 114
114.00 | 114
114.00 ***************
----------------------------+-----------------+----------------------------------------------------------------------------------10 . Cumul des dbits
DEB1 - moins de 40 dbits | 171
171.00 | 171
171.00 **********************
DEB2 - de 40 100 dbits | 161
161.00 | 161
161.00 *********************
DEB3 - plus de 100 dbits | 136
136.00 | 136
136.00 ******************
----------------------------+-----------------+----------------------------------------------------------------------------------11 . Autorisation de dcouvert
Doui - dcouvert autoris | 202
202.00 | 202
202.00 **************************
Dnon - dcouvert interdit | 266
266.00 | 266
266.00 ***********************************
----------------------------+-----------------+----------------------------------------------------------------------------------12 . Interdiction de chquier
Coui - chquier
autoris | 415
415.00 | 415
415.00 ******************************************************
Cnon - chquier
interdit |
53
53.00 |
53
53.00 *******
----------------------------+-----------------+-----------------------------------------------------------------------------------

Valores propios asociados al anlisis factorial. Observamos que, por ejemplo, se


necesitan conservar 16 ejes para conservar el 80% de la inercia. Este resultado es habitual
en el anlisis de correspondencias mltiples, ya que la variabilidad inicial suele ser elevada.

VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
2.0833
SOMME DES VALEURS PROPRES ....
2.0833
HISTOGRAMME DES 25 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
|
PROPRE
|
| CUMULE |
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+
|
1
|
0.2540
|
12.19 |
12.19 | ******************************************************************************** |
|
2
|
0.1694
|
8.13 |
20.33 | ******************************************************
|
|
3
|
0.1417
|
6.80 |
27.13 | *********************************************
|
|
4
|
0.1292
|
6.20 |
33.33 | *****************************************
|
|
5
|
0.1086
|
5.21 |
38.54 | ***********************************
|
|
6
|
0.1045
|
5.02 |
43.56 | *********************************
|
|
7
|
0.0980
|
4.71 |
48.26 | *******************************
|
|
8
|
0.0946
|
4.54 |
52.81 | ******************************
|
|
9
|
0.0902
|
4.33 |
57.14 | *****************************
|
|
10
|
0.0830
|
3.98 |
61.12 | ***************************
|
|
11
|
0.0798
|
3.83 |
64.95 | **************************
|
|
12
|
0.0791
|
3.80 |
68.75 | *************************
|
|
13
|
0.0732
|
3.51 |
72.26 | ************************
|
|
14
|
0.0685
|
3.29 |
75.55 | **********************
|
|
15
|
0.0660
|
3.17 |
78.71 | *********************
|
|
16
|
0.0619
|
2.97 |
81.69 | ********************
|
|
17
|
0.0612
|
2.94 |
84.62 | ********************
|
|
18
|
0.0557
|
2.67 |
87.30 | ******************
|
|
19
|
0.0524
|
2.51 |
89.81 | *****************
|
|
20
|
0.0506
|
2.43 |
92.24 | ****************
|
|
21
|
0.0470
|
2.26 |
94.50 | ***************
|
|
22
|
0.0400
|
1.92 |
96.42 | *************
|
|
23
|
0.0342
|
1.64 |
98.06 | ***********
|
|
24
|
0.0273
|
1.31 |
99.36 | *********
|
|
25
|
0.0132
|
0.64 | 100.00 | *****
|
+--------+------------+----------+----------+----------------------------------------------------------------------------------+

Coordenadas, contribuciones y cosenos cuadrados de las variables categricas.

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES MODALITES ACTIVES


AXES 1 A 5
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
|
MODALITES
|
COORDONNEES
|
CONTRIBUTIONS
|
COSINUS CARRES
|
|------------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDEN - LIBELLE
P.REL DISTO |
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5 |
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
|
1 . Type de client
|
| BON - bon client
4.22
0.97 | 0.67 0.31 -0.09 0.16 -0.01 | 7.4 2.4 0.3 0.8 0.0 | 0.46 0.10 0.01 0.02 0.00 |
| MAUV - mauvais
client
4.11
1.03 | -0.68 -0.32 0.09 -0.16 0.01 | 7.6 2.5 0.3 0.8 0.0 | 0.46 0.10 0.01 0.02 0.00 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 15.0 4.8 0.5 1.6 0.0 +--------------------------+
|
2 . Age du client
|
| AGE1 - moins de
23 ans
1.57
4.32 | -0.81 0.48 -0.52 -0.52 -0.63 | 4.0 2.1 2.9 3.3 5.8 | 0.15 0.05 0.06 0.06 0.09 |
| AGE2 - de 23
40 ans
2.67
2.12 | -0.17 -0.07 -0.55 0.42 -0.06 | 0.3 0.1 5.8 3.6 0.1 | 0.01 0.00 0.14 0.08 0.00 |
| AGE3 - de 40
50 ans
2.17
2.84 | 0.20 -0.01 0.19 -0.23 1.10 | 0.4 0.0 0.6 0.9 24.4 | 0.01 0.00 0.01 0.02 0.43 |

Anlisis factoriales con SPAD

52

| AGE4 - plus de
50 ans
1.92
3.33 | 0.66 -0.29 0.97 0.11 -0.65
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
3 . Situation familiale
| CELB - clibataire
3.03
1.75 | -0.51 0.27 -0.60 0.02 -0.39
| MARI - mari
3.94
1.12 | 0.41 -0.09 0.24 0.07 0.36
| DIVO - divorc
1.09
6.67 | 0.00 -0.15 0.25 -0.31 0.26
| VEUF - veuf
0.28 28.25 | -0.24 -1.06 2.02 -0.03 -1.83
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
4 . Anciennet
| ANC1 - anc. 1 an ou moins
3.54
1.35 | -0.48 0.24 0.13 -0.55 0.14
| ANC2 - anc. de 1 4 ans
0.84
8.96 | -0.38 -0.42 -0.27 0.27 0.34
| ANC3 - anc. de 4 6 ans
1.23
5.78 | -0.08 0.03 -0.38 0.63 -0.01
| ANC4 - anc. de 6 12 ans
1.18
6.09 | 0.52 -0.04 -0.90 0.43 -0.87
| ANC5 - anc. plus
12 ans
1.55
4.38 | 0.98 -0.31 0.83 0.28 0.17
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
5 . Domiciliation du salaire
| Soui - domicile salaire
5.63
0.48 | 0.36 0.13 -0.05 0.20 0.05
| Snon - non dimicile salaire 2.71
2.08 | -0.75 -0.26 0.11 -0.42 -0.09
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
6 . Domiciliation de l'pargne
| EPA0 - pas d'pargne
6.62
0.26 | -0.24 0.16 0.23 0.16 -0.06
| EPA1 - moins de 10KF pargn 1.07
6.80 | 0.46 -0.47 -0.47 -0.19 0.50
| EPA2 - de 10 100KF pargn 0.64 12.00 | 1.74 -0.86 -1.59 -1.39 -0.25
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
7 . Profession
| CADR - cadre
1.37
5.08 | 0.87 -0.58 0.76 -0.42 -0.77
| EMPL - employ
4.22
0.97 | 0.03 0.05 -0.29 0.51 0.08
| AUTR - autre
2.74
2.04 | -0.48 0.22 0.06 -0.58 0.26
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
8 . Moyenne en cours
| ENC1 - moins de 2KF encours 1.75
3.78 | -0.68 -1.32 0.20 0.21 0.07
| ENC2 - de 2 5 KF encours 5.48
0.52 | -0.08 0.56 0.19 0.16 -0.03
| ENC3 - plus de 5 KF encours 1.10
6.55 | 1.46 -0.70 -1.28 -1.11 0.06
+------------------------------------------+--------- CONTRIBUTION CUMULEE
|
9 . Moyenne des mouvements
| MOU1 - moins 10 KF mouvt
2.74
2.04 | -0.76 0.15 0.09 -0.53 0.17
| MOU2 - de 10 30KF mouvt
1.26
5.59 | -0.35 0.27 -0.35 0.43 -0.77
| MOU3 - de 30 50KF mouvt
2.30
2.63 | 0.34 0.08 -0.07 0.60 0.60
| MOU4 - plus de 50KF mouvt
2.03
3.11 | 0.86 -0.46 0.18 -0.24 -0.43
+------------------------------------------+--------- CONTRIBUTION CUMULEE
| 10 . Cumul des dbits
| DEB1 - moins de 40 dbits
3.04
1.74 | 0.21 0.74 0.17 -0.27 -0.14
| DEB2 - de 40 100 dbits
2.87
1.91 | 0.09 0.22 -0.15 0.26 0.07
| DEB3 - plus de 100 dbits
2.42
2.44 | -0.37 -1.19 -0.04 0.04 0.10
+------------------------------------------+--------- CONTRIBUTION CUMULEE
| 11 . Autorisation de dcouvert
| Doui - dcouvert autoris
3.60
1.32 | -0.31 -0.46 -0.17 0.37 0.06
| Dnon - dcouvert interdit
4.74
0.76 | 0.23 0.35 0.13 -0.28 -0.05
+------------------------------------------+--------- CONTRIBUTION CUMULEE
| 12 . Interdiction de chquier
| Coui - chquier
autoris
7.39
0.13 | 0.13 0.07 0.02 -0.08 0.04
| Cnon - chquier
interdit
0.94
7.83 | -1.02 -0.53 -0.15 0.61 -0.33
+------------------------------------------+--------- CONTRIBUTION CUMULEE

|
=

3.3
8.0

0.9 12.8
3.1 22.1

|
|
|
|
=

3.0
2.6
0.0
0.1
5.7

1.3 7.6
0.2 1.7
0.1 0.5
1.9 8.2
3.6 17.9

| 3.3
| 0.5
| 0.0
| 1.3
| 5.9
= 10.9

1.2 0.4
0.9 0.4
0.0 1.2
0.0 6.7
0.9 7.5
3.0 16.3

|
|
=

0.5
1.1
1.6

2.9
6.0
8.8

0.1
0.2
0.3

| 1.5
| 0.9
| 7.6
= 10.0

1.0 2.5
1.4 1.7
2.8 11.5
5.2 15.6

|
|
|
=

2.7
0.1
0.7
3.5

4.1
0.0
2.5
6.6

5.5
2.5
0.1
8.1

| 3.2 17.9 0.5


| 0.1 10.2 1.5
| 9.3 3.2 12.8
= 12.6 31.3 14.8
| 6.2
| 0.6
| 1.0
| 6.0
= 13.8

0.3
0.5
0.1
2.5
3.5

0.1
1.1
0.1
0.5
1.8

|
|
|
=

0.5 9.8
0.1 0.8
1.3 20.2
1.9 30.8

0.6
0.4
0.0
1.1

|
|
=

1.3
1.0
2.3

4.5
3.4
7.8

0.8
0.6
1.4

|
|
=

0.5
3.9
4.4

0.2
1.5
1.7

0.0
0.1
0.2

0.2 7.4 | 0.13 0.02 0.28 0.00 0.13 |


8.1 37.7 +--------------------------+
|
0.0 4.3 | 0.15 0.04 0.20 0.00 0.09 |
0.2 4.8 | 0.15 0.01 0.05 0.00 0.12 |
0.8 0.7 | 0.00 0.00 0.01 0.01 0.01 |
0.0 8.8 | 0.00 0.04 0.14 0.00 0.12 |
1.0 18.5 +--------------------------+
|
8.3 0.6 | 0.17 0.04 0.01 0.22 0.01 |
0.5 0.9 | 0.02 0.02 0.01 0.01 0.01 |
3.8 0.0 | 0.00 0.00 0.02 0.07 0.00 |
1.7 8.2 | 0.04 0.00 0.13 0.03 0.12 |
1.0 0.4 | 0.22 0.02 0.16 0.02 0.01 |
15.3 10.1 +--------------------------+
|
1.8 0.1 | 0.27 0.03 0.01 0.08 0.00 |
3.7 0.2 | 0.27 0.03 0.01 0.08 0.00 |
5.4 0.3 +--------------------------+
|
1.4 0.2 | 0.23 0.10 0.20 0.11 0.01 |
0.3 2.4 | 0.03 0.03 0.03 0.01 0.04 |
9.5 0.4 | 0.25 0.06 0.21 0.16 0.01 |
11.2 3.0 +--------------------------+
|
1.9 7.4 | 0.15 0.07 0.11 0.04 0.12 |
8.6 0.3 | 0.00 0.00 0.08 0.27 0.01 |
7.1 1.7 | 0.11 0.02 0.00 0.16 0.03 |
17.6 9.4 +--------------------------+
|
0.6 0.1 | 0.12 0.46 0.01 0.01 0.00 |
1.0 0.1 | 0.01 0.61 0.07 0.05 0.00 |
10.5 0.0 | 0.33 0.08 0.25 0.19 0.00 |
12.1 0.2 +--------------------------+
|
5.9 0.7 | 0.28 0.01 0.00 0.14 0.01 |
1.8 6.8 | 0.02 0.01 0.02 0.03 0.10 |
6.4 7.6 | 0.04 0.00 0.00 0.14 0.14 |
0.9 3.4 | 0.24 0.07 0.01 0.02 0.06 |
15.0 18.6 +--------------------------+
|
1.7 0.6 | 0.03 0.31 0.02 0.04 0.01 |
1.5 0.1 | 0.00 0.03 0.01 0.03 0.00 |
0.0 0.2 | 0.06 0.58 0.00 0.00 0.00 |
3.2 0.9 +--------------------------+
|
3.7 0.1 | 0.07 0.16 0.02 0.10 0.00 |
2.8 0.1 | 0.07 0.16 0.02 0.10 0.00 |
6.5 0.2 +--------------------------+
|
0.3 0.1 | 0.13 0.04 0.00 0.05 0.01 |
2.7 1.0 | 0.13 0.04 0.00 0.05 0.01 |
3.0 1.1 +--------------------------+

Coordenadas y valores-test de las variables categricas

COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES MODALITES ACTIVES


AXES 1 A 5
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
|
MODALITES
|
COORDONNEES
|
CONTRIBUTIONS
|
COSINUS CARRES
|
|------------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDEN - LIBELLE
P.REL DISTO |
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5 |
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
|
1 . Type de client
|
| BON - bon client
4.22
0.97 | 0.67 0.31 -0.09 0.16 -0.01 | 7.4 2.4 0.3 0.8 0.0 | 0.46 0.10 0.01 0.02 0.00 |
| MAUV - mauvais
client
4.11
1.03 | -0.68 -0.32 0.09 -0.16 0.01 | 7.6 2.5 0.3 0.8 0.0 | 0.46 0.10 0.01 0.02 0.00 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 15.0 4.8 0.5 1.6 0.0 +--------------------------+
|
2 . Age du client
|
| AGE1 - moins de
23 ans
1.57
4.32 | -0.81 0.48 -0.52 -0.52 -0.63 | 4.0 2.1 2.9 3.3 5.8 | 0.15 0.05 0.06 0.06 0.09 |
| AGE2 - de 23
40 ans
2.67
2.12 | -0.17 -0.07 -0.55 0.42 -0.06 | 0.3 0.1 5.8 3.6 0.1 | 0.01 0.00 0.14 0.08 0.00 |
| AGE3 - de 40
50 ans
2.17
2.84 | 0.20 -0.01 0.19 -0.23 1.10 | 0.4 0.0 0.6 0.9 24.4 | 0.01 0.00 0.01 0.02 0.43 |
| AGE4 - plus de
50 ans
1.92
3.33 | 0.66 -0.29 0.97 0.11 -0.65 | 3.3 0.9 12.8 0.2 7.4 | 0.13 0.02 0.28 0.00 0.13 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 8.0 3.1 22.1 8.1 37.7 +--------------------------+
|
3 . Situation familiale
|
| CELB - clibataire
3.03
1.75 | -0.51 0.27 -0.60 0.02 -0.39 | 3.0 1.3 7.6 0.0 4.3 | 0.15 0.04 0.20 0.00 0.09 |
| MARI - mari
3.94
1.12 | 0.41 -0.09 0.24 0.07 0.36 | 2.6 0.2 1.7 0.2 4.8 | 0.15 0.01 0.05 0.00 0.12 |
| DIVO - divorc
1.09
6.67 | 0.00 -0.15 0.25 -0.31 0.26 | 0.0 0.1 0.5 0.8 0.7 | 0.00 0.00 0.01 0.01 0.01 |
| VEUF - veuf
0.28 28.25 | -0.24 -1.06 2.02 -0.03 -1.83 | 0.1 1.9 8.2 0.0 8.8 | 0.00 0.04 0.14 0.00 0.12 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 5.7 3.6 17.9 1.0 18.5 +--------------------------+
|
4 . Anciennet
|
| ANC1 - anc. 1 an ou moins
3.54
1.35 | -0.48 0.24 0.13 -0.55 0.14 | 3.3 1.2 0.4 8.3 0.6 | 0.17 0.04 0.01 0.22 0.01 |
| ANC2 - anc. de 1 4 ans
0.84
8.96 | -0.38 -0.42 -0.27 0.27 0.34 | 0.5 0.9 0.4 0.5 0.9 | 0.02 0.02 0.01 0.01 0.01 |
| ANC3 - anc. de 4 6 ans
1.23
5.78 | -0.08 0.03 -0.38 0.63 -0.01 | 0.0 0.0 1.2 3.8 0.0 | 0.00 0.00 0.02 0.07 0.00 |
| ANC4 - anc. de 6 12 ans
1.18
6.09 | 0.52 -0.04 -0.90 0.43 -0.87 | 1.3 0.0 6.7 1.7 8.2 | 0.04 0.00 0.13 0.03 0.12 |
| ANC5 - anc. plus
12 ans
1.55
4.38 | 0.98 -0.31 0.83 0.28 0.17 | 5.9 0.9 7.5 1.0 0.4 | 0.22 0.02 0.16 0.02 0.01 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 10.9 3.0 16.3 15.3 10.1 +--------------------------+
|
5 . Domiciliation du salaire
|
| Soui - domicile salaire
5.63
0.48 | 0.36 0.13 -0.05 0.20 0.05 | 2.9 0.5 0.1 1.8 0.1 | 0.27 0.03 0.01 0.08 0.00 |
| Snon - non dimicile salaire 2.71
2.08 | -0.75 -0.26 0.11 -0.42 -0.09 | 6.0 1.1 0.2 3.7 0.2 | 0.27 0.03 0.01 0.08 0.00 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 8.8 1.6 0.3 5.4 0.3 +--------------------------+
|
6 . Domiciliation de l'pargne
|
| EPA0 - pas d'pargne
6.62
0.26 | -0.24 0.16 0.23 0.16 -0.06 | 1.5 1.0 2.5 1.4 0.2 | 0.23 0.10 0.20 0.11 0.01 |
| EPA1 - moins de 10KF pargn 1.07
6.80 | 0.46 -0.47 -0.47 -0.19 0.50 | 0.9 1.4 1.7 0.3 2.4 | 0.03 0.03 0.03 0.01 0.04 |
| EPA2 - de 10 100KF pargn 0.64 12.00 | 1.74 -0.86 -1.59 -1.39 -0.25 | 7.6 2.8 11.5 9.5 0.4 | 0.25 0.06 0.21 0.16 0.01 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 10.0 5.2 15.6 11.2 3.0 +--------------------------+
|
7 . Profession
|
| CADR - cadre
1.37
5.08 | 0.87 -0.58 0.76 -0.42 -0.77 | 4.1 2.7 5.5 1.9 7.4 | 0.15 0.07 0.11 0.04 0.12 |
| EMPL - employ
4.22
0.97 | 0.03 0.05 -0.29 0.51 0.08 | 0.0 0.1 2.5 8.6 0.3 | 0.00 0.00 0.08 0.27 0.01 |
| AUTR - autre
2.74
2.04 | -0.48 0.22 0.06 -0.58 0.26 | 2.5 0.7 0.1 7.1 1.7 | 0.11 0.02 0.00 0.16 0.03 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 6.6 3.5 8.1 17.6 9.4 +--------------------------+
|
8 . Moyenne en cours
|
| ENC1 - moins de 2KF encours 1.75
3.78 | -0.68 -1.32 0.20 0.21 0.07 | 3.2 17.9 0.5 0.6 0.1 | 0.12 0.46 0.01 0.01 0.00 |
| ENC2 - de 2 5 KF encours 5.48
0.52 | -0.08 0.56 0.19 0.16 -0.03 | 0.1 10.2 1.5 1.0 0.1 | 0.01 0.61 0.07 0.05 0.00 |
| ENC3 - plus de 5 KF encours 1.10
6.55 | 1.46 -0.70 -1.28 -1.11 0.06 | 9.3 3.2 12.8 10.5 0.0 | 0.33 0.08 0.25 0.19 0.00 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 12.6 31.3 14.8 12.1 0.2 +--------------------------+
|
9 . Moyenne des mouvements
|
| MOU1 - moins 10 KF mouvt
2.74
2.04 | -0.76 0.15 0.09 -0.53 0.17 | 6.2 0.3 0.1 5.9 0.7 | 0.28 0.01 0.00 0.14 0.01 |
| MOU2 - de 10 30KF mouvt
1.26
5.59 | -0.35 0.27 -0.35 0.43 -0.77 | 0.6 0.5 1.1 1.8 6.8 | 0.02 0.01 0.02 0.03 0.10 |
| MOU3 - de 30 50KF mouvt
2.30
2.63 | 0.34 0.08 -0.07 0.60 0.60 | 1.0 0.1 0.1 6.4 7.6 | 0.04 0.00 0.00 0.14 0.14 |
| MOU4 - plus de 50KF mouvt
2.03
3.11 | 0.86 -0.46 0.18 -0.24 -0.43 | 6.0 2.5 0.5 0.9 3.4 | 0.24 0.07 0.01 0.02 0.06 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 13.8 3.5 1.8 15.0 18.6 +--------------------------+
| 10 . Cumul des dbits
|
| DEB1 - moins de 40 dbits
3.04
1.74 | 0.21 0.74 0.17 -0.27 -0.14 | 0.5 9.8 0.6 1.7 0.6 | 0.03 0.31 0.02 0.04 0.01 |
| DEB2 - de 40 100 dbits
2.87
1.91 | 0.09 0.22 -0.15 0.26 0.07 | 0.1 0.8 0.4 1.5 0.1 | 0.00 0.03 0.01 0.03 0.00 |
| DEB3 - plus de 100 dbits
2.42
2.44 | -0.37 -1.19 -0.04 0.04 0.10 | 1.3 20.2 0.0 0.0 0.2 | 0.06 0.58 0.00 0.00 0.00 |
+------------------------------------------+--------- CONTRIBUTION CUMULEE = 1.9 30.8 1.1 3.2 0.9 +--------------------------+
| 11 . Autorisation de dcouvert
|
| Doui - dcouvert autoris
3.60
1.32 | -0.31 -0.46 -0.17 0.37 0.06 | 1.3 4.5 0.8 3.7 0.1 | 0.07 0.16 0.02 0.10 0.00 |
| Dnon - dcouvert interdit
4.74
0.76 | 0.23 0.35 0.13 -0.28 -0.05 | 1.0 3.4 0.6 2.8 0.1 | 0.07 0.16 0.02 0.10 0.00 |

Anlisis factoriales con SPAD

53

+------------------------------------------+--------- CONTRIBUTION CUMULEE


| 12 . Interdiction de chquier
| Coui - chquier
autoris
7.39
0.13 | 0.13 0.07 0.02 -0.08 0.04
| Cnon - chquier
interdit
0.94
7.83 | -1.02 -0.53 -0.15 0.61 -0.33
+------------------------------------------+--------- CONTRIBUTION CUMULEE

2.3

7.8

1.4

6.5

|
|
=

0.5
3.9
4.4

0.2
1.5
1.7

0.0
0.1
0.2

0.3
2.7
3.0

0.2 +--------------------------+
|
0.1 | 0.13 0.04 0.00 0.05 0.01 |
1.0 | 0.13 0.04 0.00 0.05 0.01 |
1.1 +--------------------------+

Grficos factoriales. En este ejemplo no resulta muy apropiado realizar un grfico


factorial, debido a la poca inercia conservada.

La mayora de anlisis de correspondencias mltiples suelen acompaarse de una


clasificacin de los individuos (vase apartado 6).

Anlisis factoriales con SPAD

54

6 Mtodos de clasificacin
La clasificacin en SPAD se realiza a partir de las coordenadas de los ejes factoriales. Se
suele utilizar el subconjunto de los primeros k ejes factoriales tales que proyecten en
conjunto un mnimo del 80% de la inercial original. Este procedimiento se realiza aplicando
sobre los datos dos algoritmos: algoritmo de clasificacin jerrquica, con el objetivo de
escoger en cuantos grupos deben clasificarse los individuos y el algoritmo de centros
mviles, con el objetivo de mejorar la clasificacin.
Ejemplo 8
Retomaremos la filire del ejemplo 7 para realizar una clasificacin de los clientes del banco
segn sean sus caractersticas.
De la ventana
RECIP/SEMIS.

Mthodes

Classification

arrastaremos

el

mtodo

En la parametrizacin del mtodo indicaremos que deseamos clasificar los individuos a


partir de los primero 16 ejes factoriales.

Anlisis factoriales con SPAD

55

Dejaremos el resto de parmetros con sus valores por defecto. Ejecutamos la filire i
obtenemos:

En el icono Listage, obtendremos un histograma de los indices de nivel:


CLASSIFICATION HIERARCHIQUE (VOISINS RECIPROQUES)
SUR LES
10 PREMIERS AXES FACTORIELS
DESCRIPTION DES
50 NOEUDS D'INDICES LES PLUS ELEVES
NUM. AINE BENJ
EFF.
POIDS
INDICE
HISTOGRAMME DES INDICES DE NIVEAU
886
849
855
8
8.00
0.00415
***
887
818
800
10
10.00
0.00418
***
888
808
857
12
12.00
0.00424
***
889
866
804
10
10.00
0.00441
***

Anlisis factoriales con SPAD

56

890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935

867
874
875
879
886
884
796
873
882
842
839
869
890
881
876
825
880
888
870
823
904
908
868
858
902
889
911
913
910
903
893
918
885
850
906
912
915
921
925
924
914
927
916
930
933
919

739
863
838
851
829
843
819
834
862
832
892
836
732
856
861
887
872
786
798
900
805
895
864
859
896
891
905
883
901
907
899
877
917
894
922
897
923
920
909
928
926
898
929
931
932
934

16
18
19
19
13
14
26
31
13
16
32
11
22
20
22
14
24
16
12
39
29
26
36
27
48
28
40
43
40
36
35
51
64
23
88
67
51
86
106
194
99
99
234
198
432
468

16.00
18.00
19.00
19.00
13.00
14.00
26.00
31.00
13.00
16.00
32.00
11.00
22.00
20.00
22.00
14.00
24.00
16.00
12.00
39.00
29.00
26.00
36.00
27.00
48.00
28.00
40.00
43.00
40.00
36.00
35.00
51.00
64.00
23.00
88.00
67.00
51.00
86.00
106.00
194.00
99.00
99.00
234.00
198.00
432.00
468.00

0.00467
0.00473
0.00477
0.00477
0.00483
0.00485
0.00498
0.00508
0.00514
0.00540
0.00587
0.00596
0.00606
0.00627
0.00651
0.00671
0.00693
0.00710
0.00768
0.00807
0.00841
0.00854
0.00860
0.00924
0.00944
0.00969
0.01108
0.01204
0.01259
0.01294
0.01422
0.01514
0.01516
0.01683
0.01932
0.02059
0.02408
0.03601
0.04002
0.04372
0.04393
0.05132
0.05836
0.07475
0.11267
0.13731

***
***
***
***
***
***
***
***
***
****
****
****
****
****
****
****
*****
*****
*****
*****
*****
*****
******
******
******
******
*******
********
********
********
*********
*********
*********
**********
************
************
***************
*********************
************************
**************************
**************************
******************************
***********************************
********************************************
******************************************************************
*********************************************************************************

Parece sensato realizar una particin de los individuos en 3 o bien en 10 grupos. En el


icono grfico podemos visualizar y editar el dendograma.

Anlisis factoriales con SPAD

57

Classification hierarchique directe


881
856
8%

8%

808
857
786
867
739

10%

732
796
819
866
804
874

11%

863
850
886
829
876

42%

861
805
869
11%

836
877
879
851

7%

842
832
882

3%

862
870
798
884

9%

843
825
818
800
880

50%

872
19%

885
858
859
883
868
864

14%

873
834
823

8%

839
875
838

Anlisis factoriales con SPAD

10

58

Una vez hemos decidido que deseamos clasificar los clientes en tres grupos, arrastramos el
mtodo PARTI-DECLA.

En la parametrizacin indicaremos el nmero de clases elegido:

Tambin indicaremos que deseamos que nos indique en que grupo se ha situado cada uno
de los individuos.

Anlisis factoriales con SPAD

59

Dejaremos el resto de parmetros con sus valores por defecto. Ejecutamos la filire i
obtendremos, en el icono Listage:

Descomposicin de la inercia en los grupos. Nmero de individuos classificados a cada


grupo antes y despus de aplicar el algoritmo de centros mviles.

DECOMPOSITION DE L'INERTIE
CALCULEE SUR 10 AXES.
+----------------+-----------------+-------------+-------------------+-----------------+
|
|
INERTIES
| EFFECTIFS |
POIDS
|
DISTANCES
|
| INERTIES
| AVANT
APRES | AVANT APRES |
AVANT
APRES | AVANT
APRES |
+----------------+-----------------+-------------+-------------------+-----------------+
|
|
|
|
|
|
| INTER-CLASSES | 0.2500
0.3012 |
|
|
|
|
|
|
|
|
|
| INTRA-CLASSE
|
|
|
|
|
|
|
|
|
|
|
| CLASSE 1 / 3 | 0.4575
0.3760 | 234
201 |
234.00
201.00 | 0.0945
0.1528 |
| CLASSE 2 / 3 | 0.5054
0.4429 | 198
203 |
198.00
203.00 | 0.1796
0.2278 |
| CLASSE 3 / 3 | 0.0605
0.1532 |
36
64 |
36.00
64.00 | 1.6477
1.0005 |
|
|
|
|
|
|
| TOTALE
| 1.2734
1.2734 |
|
|
|
+----------------+-----------------+-------------+-------------------+-----------------+
QUOTIENT (INERTIE INTER / INERTIE TOTALE) : AVANT ... 0.1963
APRES ... 0.2366
COORDONNEES ET VALEURS-TEST APRES CONSOLIDATION

Individuos que integran cada una de las clases

COMPOSITION
CLASSE 1 /
0005 0011
0158 0170
0321 0327
0466 0472
0630 0636
0746 0752
0879 0899
1014 1033
1241 1247
1372 1379
1531 1537

DE: Coupure
3
0030 0036
0176 0182
0339 0345
0484 0490
0642 0648
0764 0770
0910 0916
1039 1045
1259 1271
1385 1391
1561 1568

'a' de l'arbre en
0042
0188
0351
0502
0654
0776
0923
1069
1277
1397
1575

0048
0200
0376
0520
0673
0782
0929
1076
1283
1403
1581

0060
0224
0388
0526
0679
0788
0935
1088
1289
1427
1617

Anlisis factoriales con SPAD

3 classes
0066
0236
0394
0532
0685
0800
0947
1112
1308
1440
1623

0072
0249
0400
0568
0691
0813
0959
1130
1322
1446
1629

0084
0255
0412
0574
0697
0819
0965
1144
1328
1452
1655

0096
0261
0418
0580
0703
0825
0971
1198
1334
1458
1661

0102
0267
0424
0599
0710
0831
0977
1204
1340
1476
1667

0115
0279
0430
0605
0722
0843
0983
1223
1346
1488
1673

0128
0297
0448
0611
0728
0867
0990
1229
1353
1500
1679

0134
0309
0454
0623
0740
0873
1002
1235
1365
1512
1697

60

1703 1709
1850 1880
0794 0813
CLASSE 2 /
0018 0054
0562 0586
1063 1094
1494 1506
1733 1739
1922 0005
0109 0115
0200 0212
0315 0321
0406 0412
0514 0520
0630 0636
0746 0758
0867 0873
CLASSE 3 /
0024 0090
0363 0369
0849 0855
1314 1359
0532 0648

1715
0084
0855
3
0078
0617
1106
1518
1745
0011
0121
0218
0327
0418
0526
0642
0764
0879
3
0121
0406
0885
1415
0685

1721
0102
0899

1757
0230
0923

1763
0243
0929

1769
0249

1788
0424

1794
0496

1800
0544

1806
0556

1813
0599

1820
0703

1826
0740

1838
0782

0109
0666
1137
1525
1751
0018
0128
0224
0333
0430
0538
0654
0770
0885

0140
0758
1150
1543
1775
0024
0134
0236
0339
0436
0550
0660
0776
0891

0152
0806
1156
1549
1856
0030
0140
0255
0345
0442
0562
0666
0788
0905

0164
0861
1180
1555
1862
0036
0146
0261
0351
0448
0568
0673
0800
0910

0291
0891
1186
1593
1868
0042
0152
0267
0357
0454
0574
0679
0806
0916

0315
0905
1211
1599
1874
0048
0158
0273
0363
0460
0580
0691
0819

0382
0953
1217
1605
1886
0054
0164
0279
0369
0466
0586
0697
0825

0478
0996
1265
1611
1892
0060
0170
0285
0376
0472
0592
0710
0831

0538
1020
1295
1635
1898
0066
0176
0291
0382
0484
0605
0716
0837

0544
1027
1409
1649
1904
0078
0182
0297
0388
0490
0611
0722
0843

0550
1051
1421
1685
1910
0090
0188
0303
0394
0502
0617
0728
0849

0556
1057
1464
1691
1916
0096
0194
0309
0400
0507
0623
0734
0861

0146
0436
0941
1434
0752

0194
0442
1008
1470

0207
0460
1082
1482

0212
0496
1100
1587

0218
0507
1118
1643

0230
0514
1124
1727

0243
0592
1162
1782

0273
0660
1168
1832

0285
0716
1174
1844

0303
0734
1192
0072

0333
0794
1253
0207

0357
0837
1301
0478

Caracterizacin de las clases.

DESCRIPTION DE PARTITION(S)
DESCRIPTION DE LA Coupure 'a' de l'arbre en 3 classes
CARACTERISATION DES CLASSES PAR LES MODALITES
CARACTERISATION PAR LES MODALITES DES CLASSES OU MODALITES
DE Coupure 'a' de l'arbre en 3 classes
CLASSE 1 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------42.95 CLASSE 1 / 3
aa1a
201
12.70 0.000
70.89
83.58 50.64 bon client
Type de client
BON
237
10.18 0.000
59.09
90.55 65.81 de 2 5 KF encours Moyenne en cours
ENC2
308
10.05 0.000
58.23
91.54 67.52 domicile salaire
Domiciliation du salaire
Soui
316
5.80 0.000
71.26
30.85 18.59 anc. plus
12 ans
Anciennet
ANC5
87
5.62 0.000
49.46
91.04 79.06 pas d'pargne
Domiciliation de l'pargne
EPA0
370
5.45 0.000
63.57
40.80 27.56 de 30 50KF mouvt
Moyenne des mouvements
MOU3
129
4.76 0.000
46.75
96.52 88.68 chquier
autoris Interdiction de chquier
Coui
415
4.27 0.000
56.14
47.76 36.54 moins de 40 dbits Cumul des dbits
DEB1
171
4.23 0.000
53.39
58.71 47.22 mari
Situation familiale
MARI
221
3.88 0.000
51.90
61.19 50.64 employ
Profession
EMPL
237
3.78 0.000
59.26
31.84 23.08 plus de
50 ans
Age du client
AGE4
108
2.44 0.007
57.58
18.91 14.10 anc. de 6 12 ans Anciennet
ANC4
66
-2.44 0.007
35.29
29.85 36.32 clibataire
Situation familiale
CELB
170
-3.99 0.000
23.86
10.45 18.80 moins de
23 ans
Age du client
AGE1
88
-4.76 0.000
13.21
3.48 11.32 chquier
interdit Interdiction de chquier
Cnon
53
-4.97 0.000
26.62
20.40 32.91 autre
Profession
AUTR
154
-5.37 0.000
19.39
9.45 20.94 moins de 2KF encours Moyenne en cours
ENC1
98
-5.68 0.000
0.00
0.00
6.84 de 10 100KF pargn Domiciliation de l'pargne
EPA2
32
-6.50 0.000
25.63
25.37 42.52 anc. 1 an ou moins Anciennet
ANC1
199
-7.22 0.000
17.65
11.94 29.06 plus de 100 dbits Cumul des dbits
DEB3
136
-7.72 0.000
18.18
13.93 32.91 moins 10 KF mouvt
Moyenne des mouvements
MOU1
154
-8.40 0.000
0.00
0.00 13.25 plus de 5 KF encours Moyenne en cours
ENC3
62
-10.05 0.000
11.18
8.46 32.48 non dimicile salaire Domiciliation du salaire
Snon
152
-12.70 0.000
14.29
16.42 49.36 mauvais
client
Type de client
MAUV
231
---------------------------------------------------------------------------------------------------------------------------------CLASSE 2 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------43.38 CLASSE 2 / 3
aa2a
203
16.92 0.000
80.52
91.63 49.36 mauvais
client
Type de client
MAUV
231
11.72 0.000
81.58
61.08 32.48 non dimicile salaire Domiciliation du salaire
Snon
152
10.63 0.000
77.92
59.11 32.91 moins 10 KF mouvt
Moyenne des mouvements
MOU1
154
8.80 0.000
66.83
65.52 42.52 anc. 1 an ou moins Anciennet
ANC1
199
7.88 0.000
78.57
37.93 20.94 moins de 2KF encours Moyenne en cours
ENC1
98
6.80 0.000
86.79
22.66 11.32 chquier
interdit Interdiction de chquier
Cnon
53
6.71 0.000
65.58
49.75 32.91 autre
Profession
AUTR
154
6.48 0.000
66.91
44.83 29.06 plus de 100 dbits Cumul des dbits
DEB3
136
6.22 0.000
50.54
92.12 79.06 pas d'pargne
Domiciliation de l'pargne
EPA0
370
5.09 0.000
68.18
29.56 18.80 moins de
23 ans
Age du client
AGE1
88
3.83 0.000
55.29
46.31 36.32 clibataire
Situation familiale
CELB
170
3.18 0.001
51.98
51.72 43.16 dcouvert autoris Autorisation de dcouvert
Doui
202
2.34 0.010
75.00
5.91
3.42 veuf
Situation familiale
VEUF
16
-2.43 0.008
35.40
28.08 34.40 de 40 100 dbits Cumul des dbits
DEB2
161
-2.49 0.006
27.59
7.88 12.39 moins de 10KF pargn Domiciliation de l'pargne
EPA1
58
-3.18 0.001
36.84
48.28 56.84 dcouvert interdit Autorisation de dcouvert
Dnon
266
-3.42 0.000
35.44
41.38 50.64 employ
Profession
EMPL
237
-3.64 0.000
32.16
27.09 36.54 moins de 40 dbits Cumul des dbits
DEB1
171
-3.84 0.000
23.38
8.87 16.45 cadre
Profession
CADR
77
-4.37 0.000
25.00
13.30 23.08 plus de
50 ans
Age du client
AGE4
108
-4.80 0.000
16.67
5.42 14.10 anc. de 6 12 ans Anciennet
ANC4
66
-5.14 0.000
30.77
33.50 47.22 mari
Situation familiale
MARI
221
-5.72 0.000
0.00
0.00
6.84 de 10 100KF pargn Domiciliation de l'pargne
EPA2
32
-5.88 0.000
21.71
13.79 27.56 de 30 50KF mouvt
Moyenne des mouvements
MOU3
129
-6.05 0.000
19.30
10.84 24.36 plus de 50KF mouvt
Moyenne des mouvements
MOU4
114
-6.80 0.000
37.83
77.34 88.68 chquier
autoris Interdiction de chquier
Coui
415
-7.84 0.000
8.05
3.45 18.59 anc. plus
12 ans
Anciennet
ANC5
87
-7.96 0.000
1.61
0.49 13.25 plus de 5 KF encours Moyenne en cours
ENC3
62
-11.71 0.000
25.00
38.92 67.52 domicile salaire
Domiciliation du salaire
Soui
316
-16.92 0.000
7.17
8.37 50.64 bon client
Type de client
BON
237
---------------------------------------------------------------------------------------------------------------------------------CLASSE 3 / 3
---------------------------------------------------------------------------------------------------------------------------------V.TEST PROBA ---- POURCENTAGES ---- MODALITES
IDEN POIDS
CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES
DES VARIABLES
---------------------------------------------------------------------------------------------------------------------------------13.68 CLASSE 3 / 3
aa3a
64
17.84 0.000
98.39
95.31 13.25 plus de 5 KF encours Moyenne en cours
ENC3
62
11.72 0.000 100.00
50.00
6.84 de 10 100KF pargn Domiciliation de l'pargne
EPA2
32
5.58 0.000
41.38
37.50 12.39 moins de 10KF pargn Domiciliation de l'pargne
EPA1
58
5.54 0.000
30.70
54.69 24.36 plus de 50KF mouvt
Moyenne des mouvements
MOU4
114
5.30 0.000
21.94
81.25 50.64 bon client
Type de client
BON
237
3.69 0.000
28.57
34.38 16.45 cadre
Profession
CADR
77
3.50 0.000
15.42 100.00 88.68 chquier
autoris Interdiction de chquier
Coui
415
2.78 0.003
16.77
82.81 67.52 domicile salaire
Domiciliation du salaire
Soui
316

Anlisis factoriales con SPAD

61

2.72 0.003
25.76
26.56 14.10 anc. de 6 12 ans Anciennet
ANC4
66
-2.53 0.006
7.79
18.75 32.91 autre
Profession
AUTR
154
-2.78 0.003
7.24
17.19 32.48 non dimicile salaire Domiciliation du salaire
Snon
152
-3.27 0.001
7.54
23.44 42.52 anc. 1 an ou moins Anciennet
ANC1
199
-3.50 0.000
0.00
0.00 11.32 chquier
interdit Interdiction de chquier
Cnon
53
-4.13 0.000
2.04
3.13 20.94 moins de 2KF encours Moyenne en cours
ENC1
98
-4.53 0.000
3.90
9.38 32.91 moins 10 KF mouvt
Moyenne des mouvements
MOU1
154
-5.30 0.000
5.19
18.75 49.36 mauvais
client
Type de client
MAUV
231
-11.85 0.000
0.32
1.56 65.81 de 2 5 KF encours Moyenne en cours
ENC2
308
-15.44 0.000
0.00
0.00 79.06 pas d'pargne
Domiciliation de l'pargne
EPA0
370
----------------------------------------------------------------------------------------------------------------------------------

Anlisis factoriales con SPAD

62

7 Casos propuestos
7.1 Estudio de la relacin calidad-precio para 35 marcas de
whisky (ACP)
Objetivo:
Analizar la relacin calidad-precio para marcas de whisky.
Datos:
Precio Proporcin de malta Categora Vejez Apreciacin
10,67
9,15
9,91
11,28
10,67
11,13
10,67
8,39
11,74
14,18
12,50
11,13
9,45
13,26
11,89
11,13
13,26
12,20
12,96
13,26
12,20
12,65
13,72
16,77
13,26
17,23
14,64
12,50
19,36
24,39
13,72
13,11
15,25
15,25
14,48

Anlisis factoriales con SPAD

20
20
20
25
25
30
30
30
30
30
30
33
33
33
35
40
40
40
40
40
40
40
40
40
40
45
45
45
100
100
100
100
100
100
100

1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3

5,0
5,0
7,5
12,0
12,0
5,0
8,0
5,0
5,5
12,0
12,0
6,5
8,0
12,0
10,0
10,5
8,5
8,5
9,5
8,5
9,5
9,5
12,5
12,0
5,5
12,0
12,0
12,0
8,5
12,0
12,0
12,0
10,0
11,0
12,0

3
2
2
2
3
0
0
2
0
0
2
1
3
3
2
4
2
2
2
4
2
1
2
3
2
4
3
3
4
3
4
2
3
3
0

63

Las columnas representan:

El precio del litro de whisky en euros.


La proporcin de malta en porcentaje
La categora (1 lujo, 2 estndar, 3 puro malta)
La vejez en aos
La apreciacin que puede considerarse como una nota de 0 a 4 atribuida por un jurado
(0 mala, 1 mediocre, 2 buena, 4 muy buena)

Anlisis factoriales con SPAD

64

7.2 Opinin de los estudiantes estadounidenses sobre la


guerra del Vietnam (ACS)
Objetivo:
En mayo de 1967, los responsables del peridico de los estudiantes de la Universidad de
Chapel Hill (Carolina del Norte) desean conocer la opinin de los estudiantes sobre la
guerra del Vietnam. Proponen a cada estudiante que designe la estrategia que sostiene,
eligiendo entre las cuatro estrategias propuestas a continuacin:

Estrategia A: Los EEUU deberan provocar la derrota del poder Norte Vietnamita con
bombardeos intensivos de sus industrias, puertos y aeropuertos y con una invasin
terrestre.
Estrategia B. Los EEUU deberan proseguir con su poltica actual en Vietnam.
Estrategia C. Los EEUU deberan reducir sus actividades militares, para el bombardeo
del Vietnam del Norte e intensificar sus esfuerzos para la abertura de negociaciones.
Estrategia D. Los EEUU deberan retirar inmediatamente sus fuerzas militares del
Vietnam.
El sondeo se repiti durantes cinco aos consecutivos, con un total de 3.147 estudiantes.
Datos:
Sexo

Estrategia Ao 1 Ao 2 Ao 3 Ao 4 Ao 5 Total

Hombre

A
B
C
D

175
116
131
17

160
126
135
21

132
120
154
29

145
95
185
44

118
176
345
141

730
633
950
252

Mujer

A
B
C
D

13
19
40
5

5
9
33
3

22
29
110
6

12
21
58
10

19
27
128
13

71
105
369
37

Anlisis factoriales con SPAD

65

7.3 Anlisis cualitativo de razas de perros (ACM)


Objetivo:
Seleccionar las razas de perros ms en acuerdo con la funcin que se le pide (compaa,
casa o utilidad), a partir de calidades fsicas y psquicas de las razas. Realizar una
clasificacin de las razas segn sus cualidades.
Datos:
Raza Tamao Peso Velocidad Inteligencia Afeccin Agresividad Funcin
Bass
Beau
Boxe
Buld
Bulm
Cani
Chih
Cock
Coll
Dalm
Dobe
Dogo
Foxh
Foxt
Galg
Gasc
Labr
Masa
Mast
Peki
Podb
Podf
Poin
Sett
Stbe
Teck
Tern

1
3
2
1
3
1
1
2
3
2
3
3
3
1
3
3
2
3
3
1
2
3
3
3
3
1
3

1
2
2
1
3
1
1
1
2
2
2
3
2
1
2
2
2
2
3
1
2
2
2
2
3
1
3

Anlisis factoriales con SPAD

1
3
2
1
1
2
1
1
3
2
3
3
3
2
3
2
2
3
1
1
2
2
3
3
1
1
1

1
2
2
2
3
3
1
2
2
2
3
1
1
2
1
1
2
3
1
1
3
2
3
2
2
2
2

1
2
2
2
1
2
2
2
2
2
1
1
1
2
1
1
2
2
1
2
2
1
1
1
1
2
1

2
2
2
1
2
1
1
2
1
1
2
2
2
2
1
2
1
2
2
1
1
1
1
1
2
1
1

2
3
1
1
3
1
1
1
1
1
3
3
2
1
2
2
2
3
3
1
2
2
2
2
3
1
3

66

Los valores de las variables responden a las siguientes etiquetas:


Variable

Valor 1

Valor 2

Valor 3

Tamao
Peso
Velocidad
Inteligencia
Afeccin
Agresividad
Funcin

pequeo
pequeo
leve
leve
leve
leve
compaa

mediano
mediano
mediano
mediano
grande
Grande
caza

grande
grande
grande
grande

Anlisis factoriales con SPAD

utilidad

67

8 Bibliografa
Aluja T, Morineau A. (1999) Aprender de los datos: el anlisis de componentes principales. Una
aproximacin desde el Data Mining. Ediciones Universitarias de Barcelona. Barcelona.
Bcue M., Lebart L., Salem A. (2002) Anlisis estadstico de datos textuales. Editorial Milenio.
Lleida.
Bnzecri J. P. (1973) LAnalyse de dones. Tomo 1: La taxinomie. Tomo 2: LAnalyse de
Correspondances (2 edicin 1976). Dunod. Pars.
Cuadras C.M. (1991) Mtodos de anlisis multivariante. 2 edicin. Promociones y
Publicaciones Universitarias. Barcelona.
Crivisqui E., Fine J. (1994) Introduccin al anlisis de los datos multidimensionales. PRESTA -94.
Escofier B., Pags J. (1990) Anlisis factoriales Simples y Mltiples. Servicio Editorial
Universidad del Pas Basco. Bilbao.
Lebart L., Morineau A., Piron M. (1984) Multivariate Descriptive Statistical Analysis. John
Wiley. Nueva York.
Morineau A. (1984) Note sur la caractrisation statistique dune classe et les valeurs-test. Technique
du CESIA, 2, pgs. 20-27. Pars.

Anlisis factoriales con SPAD

68

También podría gustarte